В мире происходит взрывной рост генеративных моделей искусственного интеллекта. GPT-модели способны генерировать текст на естественном языке, поддерживать диалог, отвечать на вопросы или почти мгновенно выполнять обобщение огромных объемов структурированной и неструктурированной информации.

Данная особенность позволяет использовать их для повышения эффективности взаимодействия специалиста с системой управления данными и поиска нужной информации. В ходе диалога с системой можно сформулировать первоначальный запрос, а затем уточнить его, попросить выполнить анализ выбранного объема данных и выполнить их обобщение в форме отчета или выгрузить в заданном формате.

В Банках Данных «ЛУКОЙЛ Инжиниринг» под управлением ПК Whereoil (ПАК «КБСД», Банк Данных Зарубежных Активов) создан и постоянно обновляется полнотекстовый индекс всех сейсмических отчетов по регионам деятельности ПАО «ЛУКОЙЛ», а также полной совокупности данных по зарубежным активам ПАО «ЛУКОЙЛ». Сценарий общения с участием ИИ может выглядеть следующим образом:
Пользователь формулирует запрос на естественном языке.
По запросу ИИ создает последовательность вызовов к ПК Whereoil, который в свою очередь осуществляет поиск и выборку информации, удовлетворяющей запросу
Результаты поиска возвращаются
в ИИ, после чего последний составляет ответ с учетом запроса на естественном языке. ИИ может также отформатировать ответ определенным образом, например, построить таблицы или преобразовать текст в HTML.
Диалог может быть продолжен
с целью уточнения результата или получения дополнительной информации в контексте текущей сессии
Результатом взаимодействия с ИИ, использующим в качестве базы знаний полнотекстовый индекс документов и баз данных, могут быть как ответы на конкретные вопросы: "Укажи количество скважин, в кернах которых присутствие минерала Х превышает значение Y", так и обобщение информации, например отчет об относительной геологической изученности интересующего участка.

Для работы ИИ будет использована большая языковая модель (LLM), распространяемая на основании открытой лицензии (open source).

После апробации и подтверждения работоспособности ИИ модуля, окно чата может быть встроено в корпоративный портал «ЛУКОЙЛ Инжиниринг» для повышения эффективности использования и увеличения возврата на инвестиции в Банки Данных. При этом в процессе общения с ИИ сохранятся все ограничения на доступ к корпоративным данным, основанные на ролевой модели - т.е ответы ИИ будут базироваться исключительно на основе информации, доступной пользователю в рамках его должностных полномочий.

Примерный состав работ по созданию
подобного функционала
1
Выделение вычислительной
инфраструктуры
2
Загрузка ПО, языковой модели и дообучение ее на реальных данных в Банках Данных
3
Интеграция чат-бота ИИ с Банками Данных (MEMOZA) для преобразования запросов на естественном языке в обращения к индексу и обратного преобразования, результатов поиска в ответ или документ для пользователя.
Результатом взаимодействия с ИИ, использующим в качестве базы знаний полнотекстовый индекс документов и баз данных, могут быть как ответы на конкретные вопросы: "Укажи количество скважин, в кернах которых присутствие минерала Х превышает значение Y", так и обобщение информации, например отчет об относительной геологической изученности интересующего участка.

Для работы ИИ будет использована большая языковая модель (LLM), распространяемая на основании открытой лицензии (open source).

После апробации и подтверждения работоспособности ИИ модуля, окно чата может быть встроено в корпоративный портал «ЛУКОЙЛ Инжиниринг» для повышения эффективности использования и увеличения возврата на инвестиции в Банки Данных. При этом в процессе общения с ИИ сохранятся все ограничения на доступ к корпоративным данным, основанные на ролевой модели - т.е ответы ИИ будут базироваться исключительно на основе информации, доступной пользователю в рамках его должностных полномочий.

Предпосылки
Возможности и цели проекта
Архитектура
RS, Data, Content Service, View, QC Server, Tools: Filesystem,
DBMS, Spatial, RFGI, Collect, GEO