Цифровая платформа поиска патентной информации и средств индивидуализации
- Заказчик:
- ФБУ Федеральный институт промышленной собственности Федеральной службы по интеллектуальной собственности
- Руководитель проекта со стороны заказчика
- Поставщик
- ПАО «Ростелеком»
- Год завершения проекта
- 2022
- Сроки выполнения проекта
- Октябрь, 2019 - Июнь, 2022
- Масштаб проекта
- 10000 автоматизированных рабочих мест
- Цели
Роспатентом создана новая цифровая платформа поиска патентной и непатентной информации, на которой будут размещены различные сервисы, для взаимодействия с заявителями, бизнесом, международными организациями и патентными ведомствами.
Главная цель проекта – предоставление доступа неограниченному количеству пользователей к патентной информации и Государственному патентному фонду в онлайн режиме.
Цифровая платформа патентного поиска предназначена для содействия оказанию услуг широкому кругу пользователей в информационном обеспечении решения задач создания и использования объектов интеллектуальной собственности в условиях постоянного роста объемов патентной информации и информации о средствах индивидуализации в российском и мировом фондах патентной информации.
Создание Платформы поможет бизнес-сообществу, изобретателям и инвесторам в определении трендов приоритетного научно-технологического развития, трансфера технологий и коммерциализации разработок на российском и зарубежном рынках.
Общими принципами создания и функционирования Платформы являются: ее открытость, возможность сторонним разработчикам реализовывать дополнительные сервисы на базе Платформы через созданные API и SDK, применение искусственного интеллекта, использование технологий работы с Большими данными, безопасность, мультиязычность, простота использования.
Главные принципы создания Платформы: стремление к максимальному охвату и доступность информации для всех категорий пользователей.
Уникальность проекта
- Поиск в мировой базе патентной информации, более 100 млн структурированных и неструктурированных документов со скоростью поиска менее 1 сек по нескольким десяткам атрибутов и полным текстам документов
- Технологии искусственного интеллекта для поиска наиболее «похожих» документов, обученные на данных ранее проведенных информационных поисков экспертами.
- Платформенное решение, включая возможность размещения новых сервисов, в том числе API и SDK для разработчиков и бизнеса
- Специализированные виды поиска: генетический и химический. 3D отображения объектов интеллектуальной собственности
- Интеграция с внешними источниками знаний: зарубежные патентные ведомства, базы по химии, медицине, не патентной литературы, внутренним системам.
- Преимущественное использование российского ПО или СПО, многоязычность, кроссбраузерность и кроссплатформенность.
- Проект решает задачи импортозамещения
- Да
- Использованное ПО
- PostgreSQL
- MongoDB
- Elasticsearch
- Apache NiFi
- Docker-контейнеры (Docker, Docker Swarm, Kubernetes)
- Django, ReactJS, Flask
- Jupyter Notebook
- Prometheus
- PROMT
- Apache Hadoop 2.0
- Сложность реализации
- Реализация большой и сложной полнотекстовой системы без программного обеспечения западных вендоров, только на российском ПО и СПО.
- Обеспечение качества поиска и скорости поиска на больших объемах данных ( около 100 Тб данных), как по тексту так и по большому количеству атрибутов
- Налаживание взаимодействия системы с другими смежными системами ФИПС и Роспатента, а так же с внешними специализированными системами, которые разрабатываются одновременно с Платформой
- Использование методов ИИ применительно к патентной специфики
- Взаимодействие с внешними источниками данных в условиях ограничений и санкций.
- Описание проекта
Платформа представляет собой информационную систему, функционирующую на основе программных, технических средств и информационной инфраструктуры, обеспечивающих сбор, обработку, хранение, предоставление, размещение и использование информации об объектах мирового фонда патентной документации.
В системе реализован следующий функционал:
• пополнение системы актуальной патентной документацией;
• размещение патентной документации в структуре хранилища данных в объеме более 100 млн полнотекстовых документов;
• обработка данных с использованием технологий больших данных, механизмов и методов искусственного интеллекта;
• комплекс искусственных нейронных сетей и их машинного обучения для повышения качества и эффективности поисковых возможностей Платформы;
• предоставление программного интерфейса API и SDK Платформы;
• поиск на основе классификационных индексов;
• поиск документов по запросу на естественном языке;
• многоязычный поиска на основных европейских и азиатских языках;
• атрибутивный поиск документов;
• управление поисковыми сессиями;
• управление результатами поиска;
• многоаспектный анализ результатов поиска;
• поиск по средствам индивидуализации
• специализированный поиск: поиск генетических последовательностей (генетический поиск);
• поиск по химическим соединениям и фрагментарным химическим кодам (химический поиск);
• поиск по непатентной литературе.
- География проекта
Российская Федерация, все русскоязычные пользователи. Планируемое масштабирование системы на использования в странах БРИКС и ОИС (организация исламского сотрудничества)
- Дополнительные презентации:
- Презентация для проекта.pdf