Реализация RAG в MEMOZA. Возможности, практика, горизонты применения.

Доклад для XIV международной
научно-практической конференции
геологии, прогнозов, поисков и оценки месторождений алмазов, благородных и цветных металлов,
посвящённой 90-летию ЦНИГРИ (1935–2025)
Выступление на XIV международной научно-практической конференции геологии, прогнозов, поисков и оценки месторождений алмазов, благородных и цветных металлов, посвящённой 90-летию ЦНИГРИ (1935–2025)

Наша компания ООО «Серч Сентрик» представила инновационную платформу Memoza с интеграцией технологии RAG (Retrieval Augmented Generation), направленную на трансформацию работы с неструктурированными геолого-геофизическими данными.

Проблема: Специалисты отрасли ежедневно сталкиваются с огромными массивами неструктурированных данных — от отчетов и лицензий до каротажных исследований и сейсмики. Ручной поиск, анализ и интерпретация таких данных занимают месяцы, снижая скорость принятия критически важных решений.

Решение: Архитектура Memoza RAG объединяет мощь больших языковых моделей (LLM) с гибридным поиском — ключевыми словами, векторными embedding и структурированными запросами. Система автоматически извлекает релевантные фрагменты документов, обогащает контекст запроса и генерирует точные ответы.

Преимущества:
- Сокращение времени поиска информации на 70% за счет интеграции Elasticsearch и векторного поиска.
- Повышение качества интерпретации за счет дополнения LLM доменными знаниями (лицензии, геологические модели, метаданные).
- Автоматизация обработки документов: от OCR и парсинга таблиц до генерации структурированных отчетов.
- Поддержка как локальных моделей (Llama, Mixtral), так и облачных API (Replicate, Together AI).

Результат: Внедрение Memoza RAG позволяет компаниям:
- Оперативно анализировать историю бурения, каротаж и сейсмику.
- Формировать ответы на сложные запросы (например, о месторождениях вроде Соболиной площади) за минуты вместо недель.
- Минимизировать ошибки, вызванные ручной обработкой и неполными данными.

Платформа уже успешно применяется для работы с данными Equinor, государственных реестров и крупных нефтегазовых проектов, демонстрируя потенциал AI-решений для отрасли.

Докладчики:
Василий Борисов и Эльдар Мадьяров