Разработка подсистем интеллектуальной обработки информации и роботизации пользовательской активности для закупок

Заказчик
АО «ТВЭЛ»
Руководитель проекта со стороны заказчика
ИТ-поставщик
АО «Промышленные инновации» - генеральный подрядчик. ООО «Преферентум» – вендор, субподрядчик. ООО «АйТи. Бизнес решения» - вендор платформы "ROBIN".
Сроки выполнения проекта
Октябрь, 2018 - Ноябрь, 2019
Масштаб проекта
20000 человеко-часов
250 автоматизированных рабочих мест
Цели

  1. Снижение трудозатрат и времени выполнения типовых операций в рамках процессов закупок МТО
  2. Повышение качества экспертизы документов, снижение количества претензий.

Уникальность проекта

В проекте были использованы самые передовые решения (отечественные разработки) по технологиям искусственного интеллекта (AI), машинного обучения (ML), роботизации пользовательской деятельности (RPA), которое обеспечили решение таких задач как:

 - создание инструмента эффективной обработки больших объёмов неструктурированных данных;

 - использование накопленного массива документов и правил в качестве интеллектуальной базы знаний;

 - автоматизация процесса анализа и обработки информации при проведении закупочных процедур;

 - автоматизация процессов обмена электронными документами и результатами их анализа между системами;

 - роботизация формализованных рутинных операций.

Уникальность проекта заключается именно в сочетании этих решений в рамках одной системы – роботизация пользовательских операций совместно с извлечением из неструктурированных текстов необходимых сущностей (данных ТКП), а так же проверки документов (ТЗ на закупку МТО) по заданным правилам.
Использованное ПО

Платформа «Robin» для роботизации пользовательской активности.
Платформа «Preferentum» для интеллектуального анализа неформализованных данных;
Платформа «Abby» для распознавания графических документов;
IIS
Tomcat 9
Java 9
.Net  Core 2.1.4 и выше
RabbitMQ 3.7.4 и выше
СУБД Postgres Pro
Standard v.10.4.1

Сложность реализации

Для определения перечня правил проверки документов проводилось обследование, задачей которого являлся сбор информации о работе экспертов закупщиков, каким образом они проверяют закупочные документы и какие текстовые сущности им требуется выделить из документов с ценовой информацией.

Изначально заказчик предполагал, что будет огромное количество таких правил, но в результате обследования в реализацию пошло не более 200 шт. Дело в том, что не все правила возможно формализовать, т.к. проверка осуществлялась на интуитивном уровне.

С каждым этапом проекта двигались итерационно, наращивалась функциональность и проводились корректировки уже выполненного функционала.
Описание проекта

В процессе материально-технического обеспечения Топливной компании «ТВЭЛ» участвуют более 250 человек. Около 90 тысяч позиций детализированной потребности, которые ежегодно группируются в 5 тысяч лотов, по которым осуществляются тендерные закупки.

На момент старта проекта проверка технических заданий и процесс формирования начальной цены договора для закупки осуществлялся вручную.

Система интеллектуальной обработки информации, распознавания и роботизации пользовательской активности, разработанная в рамках проекта, обеспечила:

  1. Автоматизацию проверки Технического задания на закупку МТО.
  2. Автоматизированный поиск ценовой информации в открытых источниках сети интернет и БДЦ (База данных цен ГК «Росатом»).
  3. Рассылку адресных запросов ТКП средствами робота.
  4. Получение адресных ТКП. Распознавание графического документа в текст. Автоматическое извлечение данных из ТКП. Проверка полученных данных на предмет соответствия с заданными в действующей учетной системе (SAP ERP ТК).
  5. Автоматическое формирование ценового анализа на основе ранее полученных данных.
  6. Интеграцию системы интеллектуальной обработки информации, распознавания и роботизации пользовательской активности с действующей учетной системой.

Внедрение системы привело к следующим результатам:

  • сокращение трудозатрат профильных экспертов при проверке Технического задания:
  • сокращение сроков протекания процесса МТО;
  • упрощение процесса сбора источников цен и формирования на их основе ценового анализа и расчета НМЦД;
  • сокращение трудозатрат по процессу формирования начальной максимальной цены договора.

География проекта

В организационные рамки проекта вошла головная организация АО «ТВЭЛ» (г. Москва), а также одно из крупнейших предприятий дивизиона АО «УЭХК» (г. Новоуральск).

В данный момент проводится тиражирование текущего функционала на остальные крупные предприятия Топливной компании, расположенные в различных субъектах Российской Федерации.

Дополнительные презентации:
Ссылки на ролики о проекте.pdf
Коментарии: 4
  • Ольга Мельник
    Рейтинг: 200
    Независимый эксперт
    07.11.2019 22:11

    Очень необычная функциональность закрыта! На сколько сократились сроки? Как все шло организационно, потому что можно предположить бооольшие сложности. И интересно, какой процент документов удается обработать автоматически?

  • Антон Холло
    Рейтинг: 17
    ООО Преферентум
    Ведущий консультант
    12.11.2019 12:17

    Здравствуйте Ольга!
    Отвечаю от имени исполнителей на Ваши вопросы:

    @ На сколько сократились сроки (как понимаем, сроки выполнения операций)?
    Представьте разницу в скорости выполнения операций вручную и автоматически на некоторых функциях системы:
    1. Выборка атрибутов (показателей) технико-коммерческого предложения (ТКП) и ввод их в сводную таблицу. К атрибутам ТКП относится несколько десятков показателей – наименование и реквизиты продавца, стоимость и характеристики товара, условия поставки и пр. Вручную это требует пройтись по всему тексту ТКП и выписать необходимые атрибуты в таблицу. Времени на это требуется от 10 до 30 минут на одно ТКП. Система это делает в течение 1 минуты, после чего пользователю остаются проверить (верифицировать) атрибуты внесенные в таблицу автоматически, на что уйдет максимум 5 минут. То есть можно с уверенностью сказать, что данная функция увеличивает скорость обработки одного ТКП не менее чем в 2 раза.
    2. Для проверки ТЗ, необходимо не просто его прочитать но и выписать в качестве комментариев замечания к его оформлению (соответствие структуры типовой форме, наличие повторов, правильность указанных ссылок, ошибки в указании диапазонов и единиц измерения в характеристиках продукции, правильность описания товара, орфография и многое другое – всего более сотни правил). На полноценную проверку документа по этим правилам и написания комментариев с замечаниями, у человека уйдет от 2 часов до рабочего дня. Система выдает проверенный документ в Word с замечаниями в комментариях за 2-5 минут. Сотруднику остается только проверить эти замечания. В данном случае скорость обработки документа увеличивается на порядок.
    3. Поиск информации по лотам из web-источников и корпоративной БД, с переносом ее в сводную форму. Роботизация этого процесса не только ускоряет саму операцию в разы, но и позволяет запустить процесс по перечню лотов и не отвлекаться на него до его полного исполнения.

    @ Как все шло организационно, потому что можно предположить бооольшие сложности?
    По поводу организационных сложностей внедрения – основные из них указаны в описании, это аналитика при формализации правил проверки документов. Таких распространенных сложностей, как неприятие системы пользователями не было, потому что она реально помогает им выполнять процессы быстрее и качественнее.

    @ Какой процент документов удается обработать автоматически?
    Автоматическую обработку проходят 100% документов. Вопрос только в качестве их обработки, которое зависит от качества оригинала документа и соответственно распознавания его содержимого (текста) средствами OCR.

  • Ольга Мельник
    Рейтинг: 200
    Независимый эксперт
    13.12.2019 12:14

    Спасибо большое. Ну а средствами OCR сколько распознается? То есть вопрос то в том, какую часть документов можно реально обрабатывать автоматически полностью?

  • Антон Холло
    Рейтинг: 17
    ООО Преферентум
    Ведущий консультант
    19.12.2019 12:12

    Средствами OCR распознается не менее 80% документа, даже плохого качества. Это означает, что большая часть атрибутов автоматически определится, единственная задача оператора останется поправить часть символов в тексте, распознанных неверно (если документ совсем плохой для распознавания). Это в любом случае быстрее, чем набивать атрибуты вручную.

Год
Предметная область
Отрасль
Управление