Sberspace – мультиагентный AI-эксперт по производственному процессу

Заказчик:
ПАО Сбербанк
Руководитель проекта со стороны заказчика
Год завершения проекта
2025
Сроки выполнения проекта
июль, 2024 — октябрь, 2025
Масштаб проекта
34000 человеко-часов
Цели

Цель проекта

Предоставить 4000 командам инструмент, с помощью которого они в привычной рабочей среде смогут получать ответы на вопросы по базе знаний, содержащей около 50 000 технических документов, описывающих процессы, требования и стандарты разработки цифровых продуктов.

 

Проблемы

1. Экспоненциальный рост информации

  • Объем данных, необходимых инженерам, ежегодно увеличивается на 30—40%

  • 60% команд ежемесячно пересматривают свои базы знаний для соответствия новым требованиям

2. Постоянная необходимость обучения

  • Ежегодное освоение 4-5 новых фреймворков

  • До 25% рабочего времени тратится только на обучение

  • 44% специалистов признают нехватку времени для развития новых навыков

 

Решение

Мы создаем AI-эксперта, который:

  • Компенсирует недостаток экспертизы в команде;

  • Работает для расширения знаний сотрудников;

  • Обеспечивает поддержку там, где возникает проблема;

  • Умеет отвечать по структурированным данным (метрикам, требованиям, задачам).

За год аудитория проекта выроста в 2 раза, а количество запросов в 6 раз.

MAU: 10,5 тысяч

Запросов за месяц: 36 000

 

Экономия времени на 1 запрос рассчитывается как разница между временем необходимым при использовании обычного поиска в cравнении с ответами AI-ассиcтента: от 10 до 15 минут (для расчета взяты 12,5 минут основываясь на мета-исследовании Stack Overflow Developer Survey по разработчикам в крупнейших IT-компаниях и их использовании экспертных систем с AI: https://survey.stackoverflow.co/2023/)

Уникальность проекта

Sberspace представляет собой современное решение, использующее передовые подходы к конструированию экспертных систем на основе технологии Retrieval Augmented Generation, который может быть встроен в интерфейс других систем.

Инновационность и современные технологии лежать в основе AI-ассистента:

1. Предобработка данных с использованием обученной модели-классификатора.

2. Система создания фрагментов (chunks), поддерживающая разные стратегии чанкирования для разных типов документов (semantic chunking, markdown chunking).

3. Использование векторных баз данных с поддержкой графовых представлений.

4. Многопотоковое извлечение данных через гибридный поиск (BM25+Embeddigs) и Question-Based RAG.

5. Поддержка различных механик улучшения точности ранжирования (на основе кросс-энкодера и LLM-модели).

6. Инструктивная генерация и использование инструментов с помощью Chain-of-Thoughts и Structured Output.

7. Интеграция с другими системами через технологию MFE (Micro-Frontend).

Использованное ПО

Техники работы с LLM:

Reasoning & Action

Chain of Thought

Structured Output

Text 2 SQL + Object Graph

Schema Guided Reasoning

Dynamic Few-shot

Contextual Chunking

Question-based RAG

 

Модели:

планирование: GigaChat2 Reasoning

генерация: GigaChat2

эмбединги: multilingual-e5

реранкинг: BGE-M3

классификация: набор дообученных моделей на основании BERT

Сложность реализации

Сложность проекта определяется спецификой и объемом обрабатываемой информации.

 

Для ответов агента по документации используются свыше 15 000 документов из 14 различных подразделений, организованные в более чем несколько сотен доменов знаний.  

 

Для ответов агента по артефактам производственного процесса используются индексы, насчитывающие более пяти миллионов объектов: задачи, команды, сотрудники, значения метрик.

 

Разнородность данных и разнообразие атрибутивного состава артефактов требует использования сложных пайплайнов подготовки и обработки данных, решений по хранению и обновлению информации.

Описание проекта

Sberspace — одно из самых технологически сложных решений среди систем на основе LLM в Сбере.

Ключевые возможности:

  • Возможность работы агента как с неструктурированными документами (инструкциями) с помощью RAG, так и с структурированными данными (объекты и артефакты производственного процесса: сотрудники, задачи, команды, релизы, метрики и т.д.) с помощью Text2SQL.

  • Возможность использования визуальной модальности — способность строить эмбеддинги на основе изображений (при индексации, либо в запросе пользователя) и оперировать этими данными для генерации ответов.

  • Возможность рассуждать, планировать действия и динамически корректировать план, реализованная на основе фреймворка ReAct, цепочек рассуждения Chain of Thought и Structured Output.

  • Возможность встраивания интерфейса системы на любую поверхность с помощью технологии микрофронтов и SDK разработчика для быстрой интеграции с агентом через API.

  • Возможность настройки агента для работы с любым списком источников, адаптировать решение под специфику и документацию любого подразделения.

 

География проекта

Россия

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.