Автоматическое извлечение типовых единичных обязательств из договорных документов

Заказчик:
ПАО "Газпром нефть"
Руководитель проекта со стороны заказчика
Поставщик
ПАО "Газпром нефть"
Год завершения проекта
2024
Сроки выполнения проекта
март, 2023 — сентябрь, 2024
Масштаб проекта
4741 человеко-час
Цели

Автоматизировать извлечение контрактных обязательств из договорных документов в целях: повышения эффективности работы сотрудников, снижения числа искажений, связанных с человеческим фактором, а также для минимизации количества неверных управленческих решений и как следствие риска задержек реализации проектов.

По мнению американской исследовательской и консалтинговой компании, специализирующаяся на рынках информационных технологий Gartner - применение технологий искусственного интеллекта в управлении проектами одно из самых перспективных направлений.

Результаты
  1. Сокращение трудозатрат: Автоматизация обработки документов и извлечения обязательств существенно снизила время, затрачиваемое сотрудниками на эти процессы, освободив ресурсы для более важных задач.

  2. Повышение полноты и точности выявления обязательств: Внедрение системы обеспечило высокую точность и полноту извлечения обязательств, что минимизировало риск ошибок и недостающей информации в документации.

  3. Ускорение процесса выявления обязательств: Система позволяет формировать реестр обязательств не более чем за 5 минут, что значительно ускоряет обработку данных.

  4. Минимизация риска несвоевременного или неверного управленческого решения: Высокая точность и быстрота извлечения обязательств помогают избежать ошибок при принятии управленческих решений, что снизило вероятность финансовых и правовых рисков.

  5. Снижение риска сдвигов проекта из-за потери важных обязательств: Автоматизированный подход к выявлению и хранению обязательств минимизировал вероятность упущения

Уникальность проекта

Сервис представляет собой индивидуальное решение для автоматизации извлечения обязательств из договорных документов. При разработке применялись предобученные модели ruBERTa, дополнительно дообученные на базе 2000 разноформатных договоров заказчика.

Сервис эффективно обрабатывает различные договорные форматы и формирует структурированный реестр обязательств по договору, минимизируя риски ошибок и ускоряя процессы.

Проект решает задачи импортозамещения
Да
Использованное ПО

Конфиденциальная информация

Сложность реализации
  1. Интеграция: Необходимость интеграции системы с существующими программными и аппаратными решениями вызвала сложности, требующие значительных усилий в области разработки и тестирования.

  2. Обработка различных форматов документов: Поддержка множества форматов договорных документов потребовала разработки и настройки алгоритмов для их корректной обработки и извлечения данных, что увеличило сложность проекта.

  3. Обеспечение высокой точности извлечения данных: Разработка алгоритмов для обеспечения высокой точности и полноты извлечения обязательств потребовала значительных ресурсов, включая машинное обучение и обработку естественного языка.

  4. Управление производительностью под нагрузкой: Обеспечение стабильной работы системы при увеличенной нагрузке потребовало тщательного проектирования архитектуры и тестирования производительности.

  5. Безопасность и хранение данных: Реализация эффективных мер безопасности для защиты конфиденциальной информации потребовало времени и ресурсов

Описание проекта

Проект направлен на разработку системы, предназначенной для быстрой и эффективной обработки большого объема договорных документов, загружаемых в различных форматах.

Внедрение сервиса обеспечивает значительное повышение эффективности работы с договорными документами, снижая время на их обработку и улучшая качество извлечения информации. 

Ключевые характеристики системы:

  1. Высокая производительность: Система обеспечивает процесс выявления обязательств в рамках одной сессии за время не более 5 минут.

  2. Структурированный вывод данных: Система формирует структурированный перечень обязательств на основе извлеченной информации, что позволит пользователям быстро ориентироваться в результатах обработки.

  3. Удобный интерфейс: Система имеет интуитивно понятный интерфейс для пользователей, что облегчит взаимодействие с системой и повышает ее доступность.

География проекта

Санкт-Петербург, Москва, Оренбург, Мегион, Тюмень, Ханты-Мансийск, Ноябрьск

Дополнительные презентации:
ИИ сервис для автоматического извлечения обязательств (проект года).pdf
Коментарии: 2

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Анатолий Ткаченко
    Рейтинг: 52
    Газпром нефть снабжение
    Руководитель проектов
    12.11.2024 09:53

    Расскажите, пожалуйста, какие модели использовали? стандартные библиотеки использовали?

    • Анна Магаз Анатолий
      Рейтинг: 25
      ПАО Газпром нефть
      Руководитель направления
      18.11.2024 10:21

      Добрый день! В проекте использовались предобученные модели RuBERT-Large и RoBERTa для обработки текста, а также библиотека Tesseract для распознавания символов. Для реализации нейросетевой части применялись Torch и Transformers.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.