Андрей Филимонов, HARMAN: «ИИ – это не инструмент, а скорее парадигма извлечения знаний из данных»
Бум технологий ИИ и машинного обучения еще впереди, - уверен руководитель по развитию новых направлений, HARMAN X, Future Intelligence Lab, HARMAN NN Андрей Филимонов. Но уже сейчас многие компании создают новые продукты и сервисы на основе ИИ.
Подразделение всемирно известной компании HARMAN в Нижнем Новгороде (HARMAN NN) – не исключение. Среди реализованных кейсов, к примеру, - масштабируемая платформа на базе искусственного интеллекта eNOVA, предназначенная для создания и персонализации голосовых помощников, или AI ассистент для продавцов-консультантов с самообучающейся базой данных, содержащей информацию обо всех товарах магазина и запросах покупателей. В разработке также NEUROSENSE - система мониторинга состояния водителя, которая оценивает объединенное восприятие мозговой активности водителя с эмоциями и мимикой, а также ряд других решений.
В интервью с Андреем Филимоновым поговорили о том, как происходит разработка новых продуктов на основе ИИ и что можно ожидать от этой технологии в будущем.
Какова специфика использования искусственного интеллекта для разработки новых продуктов?
Есть несколько аспектов использования ИИ в компании. Самый, пожалуй, главный - это то, что все больше и больше компонентов, основанных на ИИ, становятся продуктами компании. В этом смысле формулировка «использование ИИ для разработки новых продуктов» не совсем корректна. В данном случае ИИ и есть продукт.
Примеров такого рода продуктов множество, начиная от уже классических, вроде распознавания изображений, но примененных к конкретным приложениям, например, к продвинутым системам помощи водителю, до полуфантастических, например, использования методов машинного обучения и нейрофизиологии для анализа внутреннего состояния человека. Наряду с таким использованием ИИ есть и его компоненты, являющиеся частью внутренней экосистемы продуктов Harman. Например, наушники нового поколения JBL Quantum используют компоненты ИИ для построения индивидуальной пользовательской карты глубокого аудио-погружения в играх и при просмотре фильмов.
Многие из упомянутых компонентов разработаны специалистами по ИИ в тесном сотрудничестве с профильными предметными специалистами, например, в области обработки аудио. Это делает их уникальными наследниками лучшего из двух «миров» и позволяет решать поставленные задачи гораздо эффективнее, чем это можно было бы сделать классическими методами, без применения ИИ и машинного обучения.
Как происходит процесс выбора направления, где компания будет внедрять ИИ – аудиосистемы, автомобили и т.д.?
Выбор происходит очень по-разному. Иногда он data-driven, то есть кто-то в компании понимает, что накопилось «озеро данных», которые можно использовать для эффективного извлечения знаний и построения новых продуктов. Часто данные копятся для определенных целей (иногда просто для целей учета и каталогизации), но затем находят применение при решении абсолютно неожиданных задач. Иногда направление диктуется рынком: если не следовать актуальным запросам, то можно безнадежно отстать. Но самый интересный сегмент – это решения, которые сами формируют рынки, становятся отраслевыми стандартами и управляют желаниями заказчиков и потребителей. Такие направления сложно увидеть – для этого нужно обладать определенной «чуйкой» в какой-то предметной области. Однако если угадать, то усилия в этих направлениях многократно окупятся и в смысле полученного удовлетворения от факта вклада в прогресс, и в смысле выполнения бизнес-целей.
Хорошим примером является наш комплекс аналитики ментального и физиологического состояния водителей. В момент, когда мы начинали заниматься такого рода исследованиями, в лучшем случае реакцией наших потенциальных заказчиков и партнеров было недоумение, часто на нас смотрели как на людей, которые занимаются непонятно чем. Два года спустя мы видим огромный интерес со стороны ведущих автопроизводителей.
Так происходит сбор данных для комплекса аналитики ментального и физического состояния водителей.
Интерес к этому комплексу обуславливают сразу несколько факторов:
— повсеместное увлечение людей здоровым образом жизни и распространение сопутствующих гаджетов. Теперь отвечать на вопрос «а зачем следить за своим состоянием» не нужно, социальное принятие этого факта произошло. Теперь недоумение вызывает как раз отсутствие такого рода технологий в автомобилях, ведь в них некоторые из нас проводят по несколько часов в день и не в самых удобных условиях.
— желание автопроизводителей выделиться на рынке и предоставить своим клиентам сервис за пределами вообразимого. Например, новой концепцией Mercedes S Klasse по заявлениям главы Daimler является подход «водитель после поездки на S Klasse должен чувствовать себя лучше, чем до».
С какими самыми распространенными сложностями встречаетесь в процессе разработки продуктов с использованием ИИ?
Сложностей обычно много. Если пытаться избавиться от частностей и начать обобщать, то в сухом остатке, как правило, будет «классика жанра»: недостаток данных, часто плохая формализуемость задач, недостаточная развитость доступных инструментов, из-за которой приходится изобретать свои, серьезный разрыв между «академическим» ИИ и промышленным ИИ.
Если продолжать повествование о ментальной аналитике, упомянутой в предыдущем пункте, то можно хорошо проиллюстрировать, почему данные являются краеугольным камнем машинного обучения. В данном случае, даже если забыть о других аспектах сбора и обработки данных и сосредоточиться только на одном – их репрезентативности и вариативности, то масштабы проблемы поражают. Все мы разные, только видимых групп различий между водителями несколько: принадлежность к разным этническим и возрастным группам, пол, видимые признаки (цвет глаз и зрачков, наличие усов и бород, различные прически). А тех, которые сразу не видны, а иногда и неизвестны, и становятся известными только после проведения исследования, еще больше. А есть еще условия и факторы, относящиеся к окружению, а не к самим водителям: как, когда и где происходит вождение, ведь цель – создать продукт, который будет работать в реальных условиях применения. Именно поэтому количество данных, которые мы собираем, для того, чтобы можно было создавать алгоритмы диагностики внутреннего состояния водителя, исчисляются тысячами тестируемых и петабайтами потоков данных. Сбор, передача, хранение и обработка таких объемов – это отдельная сложная дисциплина, именно поэтому конкретно в данном проекте ею занимается чуть ли не половина всех инженерных сил команды.
Какие рекомендации Вы могли бы дать ИТ-руководителям, которые планируют использовать этот инструмент в своей компании?
Какие-то общие рекомендации дать сложно: ИИ – это не инструмент, это скорее парадигма извлечения знаний из данных. Она крайне многогранна. Каждое применение этой парадигмы будет порождать свои сложности и приводить к своим достижениям. Опять же, если не скатываться к частностям, то я бы порекомендовал помнить две вещи.
Во-первых, любая система на основе ИИ или, точнее, машинного обучения настолько же хороша, насколько хороши данные, при помощи которых она создавалась. «Грязные» данные или недостаток их понимания и интерпретации неминуемо приведут к ухудшению результата или вообще невозможности его достижения.
Во-вторых, машинное обучение – это не магия. Это математический аппарат со своими достоинствами и недостатками. Это важно помнить и руководителям, которые, к сожалению, думают о машинном обучении именно как об универсальном и 100% эффективном инструменте решения задач, и тем, кто его применяет. Инженеры по машинному обучению все чаще относятся к нему не как к математическому аппарату, а как к набору кубиков, из которого можно сложить тот или иной пазл, полагаясь не на понимание, а на опыт, часто нерелевантный, других инженеров.
Мое личное кредо такое – все, что может быть сделано без машинного обучения, должно быть сделано без него. Это утверждение зиждется на анализе достоинств и недостатков технологии как таковой, а также способов ее применения.
Каков Ваш прогноз по использованию технологии на ближайшие 20 лет?
Я уверен, что мы еще не пережили бум технологий ИИ и машинного обучения. Это видно и по скорости технического развития отрасли, и по рынку специалистов в этой области, и по экономическому эффекту, который она оказывает. Не уверен, что при современных темпах развития техники и социума вообще уместно делать прогнозы на 20 лет, в любом случае, я не чувствую, что обладаю таким видением, которое бы позволило мне давать хоть какие-то прогнозы в перспективе на десятилетия, но ближайшие несколько лет отрасль ИИ/машинного обучения будет развиваться ускоряющимися темпами, в этом у меня нет никаких сомнений.
Справка:
HARMAN X FUTURE INTELLIGENCE LABS - обособленное подразделение HARMAN, сфокусированное на инновациях во всех направлениях деятельности. Цель HARMAN X Future Intelligence Labs – изобретение алгоритмов на стыке информационных технологий, искусственного интеллекта и наук о мозге, которые войдут в группу решений следующего поколения для рынка потребительской и автомобильной электроники HARMAN и партнеров компании и сделают умных помощников еще более умными и чувствительными к людским привычкам и слабостям.
Беседовала Наталья Горова