Создание платформы автоматической классификации образов "ВЗОР"

Заказчик:
ФГУП ГлавНИВЦ Управления делами Президента РФ
Руководитель проекта со стороны заказчика
Поставщик
ФГУП "ГлавНИВЦ" Управления делами Президента Российской Федерации
Год завершения проекта
2018
Сроки выполнения проекта
Февраль, 2016 — Февраль, 2018
Масштаб проекта
10000 человеко-часов
20 автоматизированных рабочих мест
Цели
В рамках проекта было необходимо создать автоматизированную информационную систему, которая бы могла на входящих изображениях выявлять / классифицировать образы:
 объектов реального мира (на основе классификатора IMAGENET более 1000 объектов реального мира);
 марки и модели автомобилей (более 1500 моделей автомобилей);
 марки и модели самолетов (более 600 моделей самолетов);
 порнографический контент (детектирование бикини, эротики и
полового акта на изображении);
 запрещенная символика (свастика, джихад, ИГИЛ и др.)
В качестве основы были использован подход - нейронных сетей. В дальнейшем автоматическая классификация образов может быть использована в сферах безопасности, маркетинговых исследований, оперативного принятия управленческих решений.

Уникальность проекта

Использование нейронных сетей для анализа данных и классификации образов объектов реального мира в настоящий момент является MainStream-направлением. В этом отношении наше решение не является уникальным. Уникальность решения основывается на использовании наших специально подобранных обучающих картинок, которые были дополнены свободно распространяемыми наборами.
Использованное ПО
При реализации проекта использовались следующие технологические решения:
1. Node.js версии 8.9.1.
2. Ffmpeg – для обработки видео-потоков в различных форматах, в том числе для:
 захвата потоков с видеокамер в формате RTSP;
 конвертация видеопотока из формата RTSP в формат RTMP;
 преобразование видеопотока в формате RTMP в последовательность кадров JPEG.
3. Медиасервер - Nginx-RTMP
4. MongoDB и ClickHouse в качестве БД
5. Сверточные нейронные сети (фреймворки):  Darknet, Caffe
Описание проекта
Решение позволяет автоматически детектировать множество объектов на видеопотоке с их последующей классификацией. Среди основных объектов, поддающихся классификации:  предметов, могущие быть использованы в качестве эпизодического оружия (бутылки, пистолеты, ружья, автоматы, топоры, биты, мобильные телефоны и др.);  определять скопления людей/машин, длину очереди задержки;  автоматически детектировать сцены (ДТП, драка, бег и др.);  автоматически вести трэкинг объектов между камерами. • Система позволяет расширять перечень объектов сегментации. Областью использования системы могут быть: сферы безопасности, маркетинговые исследования, оперативного принятия управленческих решений в рамках ситуационных центров. Источником видеоданных могут быть стационарно установленные видеокамеры или видеопоток, полученный с БПЛА
География проекта
Москва
Коментарии: 12

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Анна Коробова
    Рейтинг: 10
    Префектура Зеленоградского АО г.Москвы
    Заместитель Начальника управления экономики и перспективного развития
    05.12.2018 19:28

    Интересный и перспективный проект компьютерного зрения для систем безопасности в аэропортах, местах массового скопления людей (площадки праздников, стадионы и др). Возможно подход к подбору обучающих картинок и платформа будет востребована в развитии сквозной технологии Национальной Технологической Инициативы "Сенсорика", дополненной реальности (AR) и рынка Нейронет. Рекомендуется представить проект в рамках НТИ Нейронет http://www.nti2035.ru/markets/neuronet
    А уже где-то опробирова эта платформа на реальных объектах и какова точность распознавания достигнута?

    • Максим Часовиков Анна
      Рейтинг: 4767
      РАНХиГС
      Директор Проектов проектного офиса ректора
      10.12.2018 19:56

      Спасибо за интерес, платформа обучена на реальных объектах, точность определении лиц на выборке из 10 000 людей составляет не хуже 99%.
      Для других объектов - не хуже..

  • 20.12.2018 15:50

    Спасибо за ответ и оценку. Теперь можно ссылаться на решение и заказчика в споре со скептиками :)
    Но, наверное, не всё так просто. Качество распознавания напрямую зависит от качества "картинки". В этом плане есть ли какие-либо ограничения у технологии?

    • Максим Часовиков
      Рейтинг: 4767
      РАНХиГС
      Директор Проектов проектного офиса ректора
      20.12.2018 16:39

      Спасибо за интерес к проекту.
      Смотрите, качество распознавания существенно зависит от качества обучающей выборки. Тогда:
      1. как только будет обнаружено большое количество ошибок - можно построить дополнительную обучающую выборку и дообучить.
      2. считайте нейронную сеть старательным "человеком", который не разбирается в семантике объекта. Если вы такому "человеку" сможете рассказать как "раскидать по сортовым корзинам помидоры", то и нейронная сеть это будет делать скорее всего не хуже.

      По этому сложно говорить о формальных требованиях к "картинке". В этом смысле более правильно говорить - что если старательный вахтер на выборке из 10000 незнакомых людей будет ошибаться А раз, то и нейронная сеть в этих же условиях будет ошибаться примерно столько же. (а с учетом "человеческого фактора вахтера" - в существенно меньшем количестве случаев)

  • 20.12.2018 18:33

    По-видимому, мне стоит конкретизировать вопрос. Какого качества фотографии или картинки в видеопотоке достаточно, чтобы система, обученная на более высоких разрешениях, выдала бы корректный ответ? Или систему изначально обучают в режиме "подслеповатого вахтёра" на картинках, где величина пиксела соизмерима с величиной объекта?

    • Максим Часовиков
      Рейтинг: 4767
      РАНХиГС
      Директор Проектов проектного офиса ректора
      20.12.2018 19:46

      А какого качества фотографии стоит давать "глупому, но трудолюбивому вахтеру", что бы он выдавал корректный ответ?... В этом смысле нейронная сеть ни чем не отличается от такого вахтера..
      Ну.. безусловно, если будет качество картинки "один пиксель = один значимый объект", то такого не достаточно... Скорее "паспортное качество" является разумным минимумом. Что касается обучающей выборки - то она "достаточно хорошо классифицировать типичные представители обучающих рабочих изображений"... В этом смысле, если выборка обучена на европейцах, то она будет не очень хорошо распознавать китайцем и наоборот. Собственно, как и трудолюбивый, но глупый вахтер, который всю жизнь работал в средней полосе России, но вдруг перешел на работу куда-нибудь сильно восточнее и южнее..
      Ответа в духе "сколько вешать в граммах" я не знаю, и уверен что такого правильного ответа нет.
      Нам известен пример, когда человек на достаточно хорошей фотографии распознавался не правильно, но справедливости ради и человек бы в ЭТОМ случае тоже бы напутал.. Они реально очень похожи.. И врятли повышая качество фотографии мы добьемся визуального отличия.. Вернее - так, для таких примеров (очень редких) - необходимо столь хорошее разрешение снимка, что высшие гармоники пространственного разложения Фурье этих образов отличались бы больше, чем их изменение на характерных участках.
      Конечно правильно, но практической пользы от такого требования сильно меньше - чем сказать - добавьте в обучающую выборку такие фотографии на которых вы визуально сможете хорошо отличить этих людей и далее пытайтесь их идентифицировать по аналогичным фотографиям...

  • Александр Балабанов
    Рейтинг: 858
    MT global
    Директор по развитию бизнеса
    23.12.2018 19:48

    Максим приветствую! Положительно голосую за проекты в области ИИ, и в частности за проекты в области распознавания образов - видео, фото, картинка...
    Вопросы:
    1. Достигли результатов
     объектов реального мира (на основе классификатора IMAGENET более 1000 объектов реального мира);
     марки и модели автомобилей (более 1500 моделей автомобилей);
     марки и модели самолетов (более 600 моделей самолетов);
     порнографический контент (детектирование бикини, эротики и
    полового акта на изображении);
     запрещенная символика (свастика, джихад, ИГИЛ и др.)
    2. Весь проект был выполнен самостоятельно - без привлечения внешних экспертов / компаний?
    3. Система разработана - практическое применение уже имеется?

    • Максим Часовиков Александр
      Рейтинг: 4767
      РАНХиГС
      Директор Проектов проектного офиса ректора
      24.12.2018 00:21

      спасибо за интерес
      0. Ну нельзя сказать что мы все делали с нуля.. Мы использовали свободнораспространяемые возможности.
      2. с учетом "0" - без эксклюзивной помощи со стороны
      3. практические результаты есть. Но мы не позиционируем систему как готовую "коробку". В том плане, что нельзя например - взять "черный ящик" от нас, на вход поставить поток людей, на выходе - калитка открыта перед нужными, и не_открыта перед ненужными... На входе видеопоток - на выходе, например, текстовый файл_номер кадре {перечень найденных объектов на кадре; вероятность того, что определили правильно}

  • Роман Кузнецов
    Рейтинг: 931
    ГК Интертехэлектро
    CDTO
    28.12.2018 15:49

    Добрый день, Максим!
    99% качества распознавания – отличный результат, поздравляю!
    Проект, результатом которого может быть существенное повышение безопасности. Судя по описанию именно на эту сферу в первую очередь ориентирована ваша система.
    Сейчас анонсируется оплата проезда в общественном транспорте автоматическим распознаванием пассажира. Имеет ли ваша команда отношению к этому проекту? В настоящее время различные госструктуры обращаются к распознаванию изображений и успешно. Не буду перечислять проекты. Организовано ли каким-то образом сообщество специалистов по ИИ на федеральном уровне? Опытом обмениваетесь?
    Почему в географии проекта указана только Москва? Вы описали свою систему как универсальную, готовую для дообучения под конкретный кейс. Много ли инсталляций системы? Если все они в Москве, то планируются ли региональные проекты?

    • Максим Часовиков Роман
      Рейтинг: 4767
      РАНХиГС
      Директор Проектов проектного офиса ректора
      28.12.2018 16:04

      С наступающим Новым годом!
      "Проект, результатом которого может быть существенное повышение безопасности. Судя по описанию именно на эту сферу в первую очередь ориентирована ваша система."
      Да, мы не стремимся к "коробочному решению", и больше ориентированы на узкие сегменты. В этом смысле промышленная безопасность и идентификация возможных нарушений в использовании СИЗ нам интересны.
      "Сейчас анонсируется оплата проезда в общественном транспорте автоматическим распознаванием пассажира. Имеет ли ваша команда отношению к этому проекту? "
      Нет
      "Организовано ли каким-то образом сообщество специалистов по ИИ на федеральном уровне? Опытом обмениваетесь? "
      Специализированного сообщества нет, на выставках общаемся ;).
      "Почему в географии проекта указана только Москва? Вы описали свою систему как универсальную, готовую для дообучения под конкретный кейс. Много ли инсталляций системы? Если все они в Москве, то планируются ли региональные проекты?"
      Регионы нам интересны, количество инсталляций не велико, собственно проект по наработке наших компетенций в этой области завершился недавно. Мы сейчас рассматриваем варианты, которые мы можем делать хорошо и которые интересны рынку.

  • Роман Кузнецов
    Рейтинг: 931
    ГК Интертехэлектро
    CDTO
    28.12.2018 16:47

    И Вас с наступающим Новым годом!
    Успехов в реализации проектов!
    Не знаю насколько в вашей организации сильны лоббистские возможности на федеральном уровне. В РФ и раньше в СССР сильны традиции в прикладной математике. Многие алгоритмы и подходы в машинном обучении основаны на фундаментальных результатах наших ученых. Есть кому готовить квалифицированных специалистов по ИИ. Если государство добавит с текущему спросу от технологичного бизнеса запрос на подобные проекты, то высоки шансы развить в РФ высококонкурентную на мировом уровне отрасль.

  • Максим Часовиков
    Рейтинг: 4767
    РАНХиГС
    Директор Проектов проектного офиса ректора
    28.12.2018 17:06

    Спасибо за пожелания.

    На разных площадках, в том числе на Форуме "Открытые технологии" обсуждения проводились и позиции ряда участников дискуссии, особенно со стороны академической науки, близки к Вашим.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.