Искусственный интеллект — демистификация самого модного слова

18 января 2018

Все мы сегодня знаем, что ИИ вскоре полностью изменит нашу жизнь. А что на самом деле сегодня происходит в сфере ИИ? Попытался разобраться в этом, опираясь на статью Марка Торра про искусственный интеллект и машинное обучение (перевод привожу) и собственный кейс из сферы ритейла. Марк — бывший вице-президент SAS Institute, находится в списке ТОП-100 самых влиятельных людей в области Big Data, с двадцатилетним опытом работы в области Глубокой Аналитики. Ныне он возглавляет Microsoft в части продвижения Azure Advanced Analytics и IoT в регионе EMEA и, по счастью, является моим единомышленником и другом.

Демистификация самого модного слова

Практически всюду, где бы вы сегодня не находились, кто-то говорит об искусственном интеллекте (ИИ). Похоже, что ИИ стал самым «умным словечком» со времен Больших Данных (Big Data). Прогрессивные организации активно ищут способы применения ИИ. Они хотят использовать его для продвижения своего бизнеса и создания нового опыта для тех, с кем они взаимодействуют внутри и снаружи.

Увы, присутствует большая путаница в отношении того, что же означает ИИ. Ситуация ухудшается ещё и тогда, когда люди смешивают это с такими терминами, как машинное обучение (ML) и глубокое обучение (DL). Если вы спросите нескольких разных людей о том, что же такое ИИ или машинное обучение, вы получите несколько разных ответов. Это давняя проблема описания слона, зависящего от того, с какой стороны вы прикасаетесь к нему, если у вас при этом завязаны глаза.

ИИ — это не новая тема. Люди исследуют ИИ с 1940-х годов. Машинное обучение (Machine Learning), которое развилось, как одна из областей ИИ, существует с 1980 года, а глубокое обучение (Deep Learning), которое является одной из областей ML, быстро завоевывает популярность в последние 10 лет.

Что такое ИИ?

Мечтой ИИ является создание общего ИИ (General AI). Суть очень простая: создать машину, которая будет так же умна, как человек.

Это означает, что машина способна общаться, учиться и решать проблемы настолько широко, насколько могут это делать люди. Именно эта цель и заставляет людей бояться будущего с Терминаторами, где SkyNet берет на себя управление нашим миром.

Я, впрочем, как и Марк Торра, считаю, что истина заключается в том, что мы на сегодня настолько далеки от создания общего ИИ, насколько аппарат изобретателя Тимофеева, показанный в фильме «Иван Васильевич меняет профессию», далек от практического применения в реальной жизни для перемещения людей во времени.

Почему? Всё просто: мы, люди, просто не способны такое сделать. Во всяком случае, пока. Сегодня все идеи, обсуждаемые в сообществе профессионалов в области ИИ крутятся вокруг того, что мы называем «Ограниченный ИИ» (Narrow AI). Это означает, что у нас есть технологии, позволяющие компьютерам делать конкретные вещи так же или лучше, чем люди. Большая часть недавних успехов Ограниченного ИИ сводится к усовершенствованиям машинного обучения, а именно Deep Learning. И в этой области делаются очень достойные вещи мирового масштаба.

Растущая сила Ограниченного ИИ

Развитие машинного обучения было обусловлено появлением больших вычислительных мощностей и новых, более современных и эффективных алгоритмов. Эти два фактора позволили быстрей решать более сложные математические задачи, что раньше сделать было невозможно и именно это останавливало прогресс в этой области.

Также появились такие драйверы прогресса, как интернет, автоматизация и оцифровка. Наконец, появился большой объем данных, который был необходим, как воздух, для качественного обучения машин. Данные — это опыт для машины и помните, что без опыта алгоритм не может учиться ничему, он бесполезен! За последние два года на Земном шаре появилось данных больше, чем за всю историю человечества. И это количество растет от года к году. А, значит, будет расти и набор задач, которые может выполнять Ограниченный ИИ, будут все новые и новые прорывы – и это просто прекрасно!

Российский кейс из сферы ритейла

Приведу свой собственный пример из жизни, где явно видно, насколько важны данные. Мы пытались решить задачу для одного ритейлера: автоматическое сопоставление промо-акций с сайта Edadeal.ru с промо-акциями, которые ведет заказчик у себя в ERP-системе (заказчику нужно было вовремя реагировать на промо-активности конкурентов). Перепробовали все доступные методы машинного обучения — не работает. Задача на текущий момент не решаема. Причина: слишком мало данных на сайте Едадил… И ни один ИИ ее решить не в состоянии. Для того, чтобы ИИ понял, что «Сок Добрый в ассортименте» и «Сок Добр, ябл 1000 мл» — это одно и то же, нужно было человеку сесть и руками вбить это правило. А теперь представьте себе десятки тысяч товаров... В итоге, если человек не сядет и не научит машину всем сопоставлениями, то качество работы алгоритма составит около 10% совпадений – задача в заданных ограничениях не имеет решения — слишком мало данных.

С другой стороны, нам удалось построить рабочую модель прогнозирования спроса для того же ритейла, где данных много.

Много как внутренних данных клиента, так и внешних. И здесь есть неограниченный путь улучшения моделей за счет обогащения всё новыми и новыми данными: конкурентное окружение, гео-локация, погода, расписание матчей (если магазин у стадиона) и прочее, и прочее. Суть: есть чем обогащать данные – все хорошо, нет данных – все плохо. Но сейчас, повторюсь, столько данных производится вокруг в мире, и количество их увеличивается и увеличивается с каждым годом (а это новые и новые опыты), что эта огромная область дает очень мощные толчки для принципиально новых подходов к решению оптимизационных бизнес-задач.

Ограниченный ИИ везде

Вероятно, каждый, кто пользуется интернетом, использует некоторую форму Ограниченного ИИ сегодня.

Каждый раз, когда вы выполняете поиск с помощью Yandex или Google, в фоновом режиме есть Ограниченный ИИ, помогающий ранжировать страницы.
Когда вы используете Facebook или инструмент от Apple, чтобы пометить на изображениях лица людей, на фоне работает Ограниченный AI, который тихо у вас учится.
Возможности перевода появляются благодаря ИИ, как на автономных веб-сайтах, так и онлайн в Facebook и в виде интегрированных инструментов в Outlook, PowerPoint и Skype.

Фактически, Ограниченный ИИ начинает распространяться во многих аспектах нашей жизни. Помимо повседневного использования мы смогли использовать машинное обучение для разработки Ограниченного ИИ, способного победить наших чемпионов в шахматы, Го, Jeopardy, получить максимально возможный балл на Ms. Pac-man, а также пытаться создавать автомобили, которые ездят сами.

Теперь вы можете задать простой вопрос. Почему это Ограниченный ИИ? Ответ прост. Компьютер, обученный побеждать в шахматах, не может играть в Go. Компьютер, предназначенный для игры Go, не может играть в шахматы, компьютер Jeopardy не может играть в Pac-man, а автономная автомобильная система, скорее всего, не сможет управлять самолетом.

Каждый из них был разработан и обучен для одной задачи, которую он освоил. Любая новая задача потребует обширной подготовки. Если же мы говорим об Общем ИИ, компьютер должен уметь погрузиться в любую новую задачу, которую необходимо изучить, и стать экспертом в этом, без внешней поддержки. Давайте поразмышляем об этом.

Истина заключается в том, что большинство Ограниченных ИИ, с которыми мы возимся сегодня, фокусируются на использовании машинного обучения (ML). Многие люди используют этот термин, не понимая его, поэтому давайте разбираться.

Что такое машинное обучение?

В 1959 году Артур Самуэль описал машинное обучение таким образом: «Область обучения, которая дает компьютерам возможность учиться, не будучи явно запрограммированной». Это было базовое простое определение, но оно подтвердилось тем, что Артур создал компьютер, который мог бы играть в шашки лучше, чем он сам. Ключевым аспектом здесь является то, что вы не программируете компьютер на каждое возможное движение и сценарий. Идея заключается в том, что компьютер учится играть в сотнях партий и, в конечном итоге, улучшает свои навыки настолько, что начинает играть лучше, чем человек. Это ничем не отличается от того, как люди изучают, что происходит вокруг, учатся и адаптируются. Разница в том, что компьютер никогда не скучает и может играть миллионы игр неоднократно без перерыва.

В 1998 году Том Митчелл дал более точное определение, когда описал машинное обучение с использованием формулы: «Говорят, что компьютерная программа учится на опыте E в отношении некоторой задачи T и некоторой оценки производительности P, если ее производительность на T, измеренная P, улучшается с опытом».

Опять же, главное, что компьютер учится на постоянном опыте и со временем становится всё лучше и лучше. Опыт в этом случае — данные. То, что мы всё чаще получаем сегодня с изобилием.
Если придерживаться простого определения машинного обучения высокого уровня, тогда вы можете думать об этом так: компьютер использует специальные алгоритмы, чтобы смотреть на данные, учиться на них, а затем принимать решения или предсказать что-то. По сути, мы перестаем пытаться написать код со всеми возможными комбинациям для достижения задачи и вместо этого мы «обучаем» компьютер, предоставляя ему множество разных данных. Таким образом, компьютер учится выполнять конкретную задачу.

Методы машинного обучения

Есть несколько способов машинного обучения, о которых вы можете услышать:

Обучение с учителем;
Обучение без учителя;
Смешанное обучение (с учителем и без);
Усиленное обучение.

Каждое из них имеет различное применение. Всё это - типы методов машинного обучения, со своими собственными алгоритмами, поддерживающими их. Обучение с учителем (1) и обучение без учителя (2) – это наиболее популярные методы машинного обучения сегодня.

В чем разница? Обучение с учителем VS Обучение без учителя

Обучение с учителем предоставляет собой набор помеченных данных для обучения, по существу, пара значений с известным входом (input) и известным выводом (output), из которых алгоритм затем создает функцию, через которую вы можете «прогонять» новые данные, чтобы выработать вероятный вывод на основе новых входов.

Обучение без учителя позволяет алгоритму найти выходные данные на основе входных данных без каких-либо меток. С этой целью машина поможет определить выходы в зависимости от того, сколько их нужно (это ей указывает человек), используя структуру данных, которые вы ей подаете, и любые ограничения, которые вы ей придумаете. Подумай об этом. НЕТ правильных ответов и НЕТ учителя. Компьютеру остается искать и представлять интересные структуры и находки в данных.

Я не буду здесь вдаваться в конкретные алгоритмы, используемые в этих методах. У машинного обучения есть много отличных алгоритмов, которые можно использовать сегодня. Большинство этих алгоритмов легко доступно через абстрактные API. Когда вы добавляете к этому вычислительную мощность и данные, которые становятся все доступней сейчас, становится понятно, почему эта область сегодня вызывает настоящий взрыв по сферам применения, популярности и точности.

Что насчет Глубокого обучения?

В моей следующей статье я буду глубже погружаться в глубокое обучение (Deep Learning). Подсказка - это всего лишь тип машинного обучения. Я также расскажу о когнитивных вычислениях, которые сейчас сильно обсуждаются вокруг глубокого обучения. Кроме того, я рассмотрю несколько вариантов практического применения.

В завершении, давайте подведем итоги. Вот так я смотрю на вещи:

Искусственный интеллект — это широкая тема, которая существует уже давно. У этой области амбициозные цели. Для достижения этих целей необходимо освоить много областей. Одной из них является машинное обучение.
В области искусственного интеллекта у нас пока есть только машинное обучение. Это область исследований, которая позволяет машинам учиться на собственном опыте.
Глубокая аналитика охватывает классический статистический подход и машинное обучение. Таким образом, всё, что связано с машинным обучением, можно рассматривать как часть аналитики, НО не всё в аналитике является частью ИИ.
Ограниченный ИИ является результатом машинного обучения, где нам удалось заставить компьютеры изучать очень конкретные задачи, чтобы они могли выполнять их так же или лучше, чем человек.
Глубокое обучение (Deep Learning) — это подмножество методов в пространстве машинного обучения. Эти методы часто упоминаются особенно в отношении когнитивных вычислений, хотя они не ограничиваются только этим.
Когнитивные вычисления в целом относятся к попытке заставить компьютеры взаимодействовать с нами по-человечески. Глубокое обучение часто помогает в когнитивных вычислениях в таких вещах, как распознавание образов и речи.

Часто эти темы смешиваются и обозначаются как искусственный интеллект. Люди используют фразу верхнего уровня, так как она новая. Часто вам нужно копать, чтобы посмотреть, какую проблему они хотят решить. Это затем позволяет понять, что они подразумевают под словом искусственный интеллект.

Продолжение в следующем материале.

4580