Цифровая платформа поиска патентной информации и средств индивидуализации

Заказчик
ФБУ Федеральный институт промышленной собственности Федеральной службы по интеллектуальной собственности
Руководитель проекта со стороны заказчика
ИТ-поставщик
ПАО «Ростелеком»
Год завершения проекта
2022
Сроки выполнения проекта
Октябрь, 2019 - Июнь, 2022
Масштаб проекта
10000 автоматизированных рабочих мест
Цели

Роспатентом создана новая цифровая платформа поиска патентной и непатентной информации, на которой будут размещены различные сервисы, для взаимодействия с заявителями, бизнесом, международными организациями и патентными ведомствами.

Главная цель проекта – предоставление доступа неограниченному количеству пользователей к патентной информации и Государственному патентному фонду в онлайн режиме.

Цифровая платформа патентного поиска предназначена для содействия оказанию услуг широкому кругу пользователей в информационном обеспечении решения задач создания и использования объектов интеллектуальной собственности в условиях постоянного роста объемов патентной информации и информации о средствах индивидуализации в российском и мировом фондах патентной информации.

Создание Платформы поможет бизнес-сообществу, изобретателям и инвесторам в определении трендов приоритетного научно-технологического развития, трансфера технологий и коммерциализации разработок на российском и зарубежном рынках.

Общими принципами создания и функционирования Платформы являются: ее открытость, возможность сторонним разработчикам реализовывать дополнительные сервисы на базе Платформы через созданные API и SDK, применение искусственного интеллекта, использование технологий работы с Большими данными, безопасность, мультиязычность, простота использования.

Главные принципы создания Платформы: стремление к максимальному охвату и доступность информации для всех категорий пользователей.

Уникальность проекта

  1. Поиск в мировой базе патентной информации, более 100 млн структурированных и неструктурированных документов со скоростью поиска менее 1 сек по нескольким десяткам атрибутов и полным текстам документов
  2. Технологии искусственного интеллекта для поиска наиболее «похожих» документов, обученные на данных ранее проведенных информационных поисков экспертами.
  3. Платформенное решение, включая возможность размещения новых сервисов, в том числе API и SDK для разработчиков и бизнеса
  4. Специализированные виды поиска: генетический и химический. 3D отображения объектов интеллектуальной собственности
  5. Интеграция с внешними источниками знаний: зарубежные патентные ведомства, базы по химии, медицине, не патентной литературы, внутренним системам.
  6. Преимущественное использование российского ПО или СПО, многоязычность, кроссбраузерность и кроссплатформенность.
Проект решает задачи импортозамещения
Да
Использованное ПО

  • PostgreSQL
  • MongoDB
  • Elasticsearch
  • Apache NiFi
  • Docker-контейнеры (Docker, Docker Swarm, Kubernetes)
  • Django, ReactJS, Flask
  • Jupyter Notebook
  • Prometheus
  • PROMT
  • Apache Hadoop 2.0

Сложность реализации

  • Реализация большой и сложной полнотекстовой системы без программного обеспечения западных вендоров, только на российском ПО и СПО.
  • Обеспечение качества поиска и скорости поиска на больших объемах данных ( около 100 Тб данных), как по тексту так и по большому количеству атрибутов
  • Налаживание взаимодействия системы с другими смежными системами ФИПС и Роспатента, а так же с внешними специализированными системами, которые разрабатываются одновременно с Платформой
  • Использование методов ИИ применительно к патентной специфики
  • Взаимодействие с внешними источниками данных в условиях ограничений и санкций.
Описание проекта

Платформа представляет собой информационную систему, функционирующую на основе программных, технических средств и информационной инфраструктуры, обеспечивающих сбор, обработку, хранение, предоставление, размещение и использование информации об объектах мирового фонда патентной документации.

В системе реализован следующий функционал:

• пополнение системы актуальной патентной документацией;

• размещение патентной документации в структуре хранилища данных в объеме более 100 млн полнотекстовых документов;

• обработка данных с использованием технологий больших данных, механизмов и методов искусственного интеллекта;

• комплекс искусственных нейронных сетей и их машинного обучения для повышения качества и эффективности поисковых возможностей Платформы;

• предоставление программного интерфейса API и SDK Платформы;

• поиск на основе классификационных индексов;

• поиск документов по запросу на естественном языке;

• многоязычный поиска на основных европейских и азиатских языках;

• атрибутивный поиск документов;

• управление поисковыми сессиями;

• управление результатами поиска;

• многоаспектный анализ результатов поиска;

• поиск по средствам индивидуализации

• специализированный поиск: поиск генетических последовательностей (генетический поиск);

• поиск по химическим соединениям и фрагментарным химическим кодам (химический поиск);

• поиск по непатентной литературе.

География проекта

Российская Федерация, все русскоязычные пользователи. Планируемое масштабирование системы на использования в странах БРИКС и ОИС (организация исламского сотрудничества)

Дополнительные презентации:
Презентация для проекта.pdf
Коментарии: 1

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Максим Часовиков
    Рейтинг: 4767
    РАНХиГС
    Директор Проектов проектного офиса ректора
    05.01.2023 19:17

    Добрый день, вы пишите, что
    Поиск в мировой базе патентной информации, более 100 млн структурированных и неструктурированных документов со скоростью поиска менее 1 сек по нескольким десяткам атрибутов и полным текстам документов
    Технологии искусственного интеллекта для поиска наиболее «похожих» документов, обученные на данных ранее проведенных информационных поисков экспертами.

    этот объем - это открытые, общедоступные данные патентов?

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.