Платформа умного поиска
- Заказчик:
- BIOCAD
- Руководитель проекта со стороны заказчика
- Год завершения проекта
- 2025
- Сроки выполнения проекта
- сентябрь, 2024 — сентябрь, 2025
- Масштаб проекта
- 4000 человеко-часов
- Цели
Цель проекта — создать и внедрить интеллектуальную поисковую систему, которая позволит сотрудникам быстро находить актуальную и релевантную информацию в обширных корпоративных базах знаний и документах, а внешним пользователям получать нужную информацию на информационных порталах компании.
-
Существенное повышение доступности информации и знаний ни уровне компании
-
Доля активных пользователей всех модулей за месяц (MAU в среднем 90-85% от штата компании)
-
За год реализованы основные интеграции:
-
Интеграция с Confluence
-
Интеграция с ECM (Enterprise Content Management)
-
Интеграция с корпоративным порталом
-
Встраивание в бизнес процесс закупки материально-технических ресурсов (поиск аналогов в наличии на складах)
-
Встраивание в бизнес расследования отклонений системы менеджмента качества
-
Уникальность проекта
-
Поддержка множества типов данных: система умеет работать не только с текстовыми документами, но и с отсканированными файлами, видео, изображениями, таблицами, схемами . Это значительно расширяет возможности поиска и делает доступной информацию из источников, недоступных для обычных поисковых систем.
-
Реализация изолированных рабочих пространств и тематических баз знаний, что позволяет выстраивать удобную совместную работу и аккумулировать экспертные знания различных подразделений. Это помогает ускорить кросс командные проекты.
-
Интеграция в бизнес-процессы: проект предусматривает возможность легкого встраивания в действующие бизнес-процессы компании без необходимости радикальных изменений инфраструктуры.
-
Возможность использовать ролевую модель доступа, уже реализованную в исходных системах. «Имеешь доступ к документам? — можешь искать по ним!»
- Использованное ПО
Помимо собственной разработки в проекте использованы open source‑решения:
-
ParadeDB, MinIO, MongoDB
-
marker-pdf
-
GLM-4.5V, Qwen3-Next-80B
-
Qwen3-Reranker-4B / Qwen3-Embedding-0.6B / BM25 / FAISS
-
Airflow
-
- Сложность реализации
В целом, проект требует глубокой экспертизы в области искусственного интеллекта, обработки естественного языка, архитектуры распределённых систем и безопасности данных. Основная сложность заключается в реализации:
Обработка гетерогенных источников данных
Безопасность и разделение доступов
Интеграция локальных LLM и VLM в пайплайн
- Описание проекта
Платформа умного поиска на базе технологии RAG . Система находит и анализирует документы, извлекает релевантную информацию, и формирует точные ответы на вопросы пользователей.
-
Платформа поддерживает совместную работу и изолированные рабочие пространства
-
Интегрирована с основными источниками данных компании
-
Может быть встроена в бизнес процессы.
-
Реализована единая поисковая строка на корпоративном портале
-
- География проекта
Российская Федерация
- Дополнительные презентации:
- @Betaliferu_bot для пациентского портала.pngединое окно поиска на корпоративном портале.pngconsultator.png