Бизнес-подход к искусственному интеллекту: как использовать датацентричный и моделецентричный ИИ в синергии

В исследовании Hype Cycle for Artificial Intelligence аналитики Gartner называют генеративный искусственный интеллект наиболее перспективной прорывной технологией, а также указывают на важность управления доверием, рисками и безопасностью ИИ (AI TRiSM). Исследователи традиционно упоминают четыре взаимосвязанные категории ИИ: датацентричный, моделецентричный, ориентированный на приложения и ориентированный на человека. Возможности бизнеса по применению моделей искусственного интеллекта растут одновременно со сложностями их внедрения. Каким образом компании могут нарастить экспертизу в этой области и разумно сочетать разные подходы – рассказывает старший вице-президент по информационным технологиям ПАО «Ростелеком» Кирилл Меньшов.

Технологии искусственного интеллекта и машинного обучения уже давно используются для решения многих бизнес-задач, и с каждым годом сценариев их применения становится всё больше. Искусственный интеллект, ориентированный на данные, позволяет компаниям анализировать большие массивы структурированных данных, выстраивать прогнозы и принимать на их основе взвешенные решения. В то же время набирают популярность моделецентричные модели искусственного интеллекта, которые предлагают бизнесу широкий инструментарий для решения прикладных задач. В чем принципиальное отличие между ними?

Датацентричные (или основанные на данных) модели искусственного интеллекта, как правило, создаются внутри каждой компании и не предназначены для распространения вовне.

Организации десятилетиями накапливают данные, которые доступны для анализа, обработки и обогащения. Со временем они понимают, как создавать и обучать на основе Big Data модели искусственного интеллекта, развивают специализированные лаборатории, наращивают штат дата-сайентистов.

Благодаря этому им удается облегчить решение таких задач, как прогнозирование оттока абонентов, планирование допродаж, работа рекомендательного движка для цифрового сервиса и т.д.

Моделецентричный искусственный интеллект – наоборот, оперирует не внутренними данными компании, а общечеловеческими. Нейросетей вроде ChatGPT или Midjourney сегодня насчитывается уже около сотни. С точки зрения бизнеса можно рассматривать их как некий «ящик с инструментами», которыми компания должна мастерски овладеть. Условно говоря, если раньше сборщики мебели вкручивали шурупы отверткой, то сегодня им предлагается шуруповерт. Он не был придуман специально для них, но они активно его освоили и оценили преимущества. Примерно такую же задачу необходимо решить компаниям в сфере моделецентричных моделей ИИ.

Для датацентричных моделей искусственного интеллекта характерен следующий алгоритм создания: фиксируем задачу, находим решение, генерируем модель, обучаем ее данными, получаем результат. Для моделецентричных – ситуация обратная: у нас уже есть готовые внешние модели, которые мы можем относительно легко «примерить» на своих бизнес-процессах и определить, будут ли они оптимизированы с помощью того или иного инструмента.

Интеллект на основе данных

Датацентричный искусственный интеллект используется в большом количестве моделей, которые «заточены» непосредственно под конкретную компанию. Например, онлайн-кинотеатр Wink «Ростелекома», как и другие подобные видеосервисы, на основе предыдущих предпочтений пользователя может рекомендовать ему подборку фильмов для просмотра. Чат-бот службы поддержки обрабатывает более четверти обращений клиентов. Таких моделей множество.

Чтобы внедрить датацентричную модель, компании необходима собственная ИТ-команда или привлечение внешних специалистов. Так, в «Ростелекоме» существует подразделение по управлению Big Data и искусственным интеллектом, которое решает большое количество универсальных общих задач. Если же искусственный интеллект погружен в определенный цифровой продукт, то его развитием занимаются группы дата-сайентистов, интегрированные в соответствующие продуктовые команды: команда Wink отвечает за рекомендательный движок, команда «Нетрис» – за модели на основе компьютерного зрения для видеонаблюдения и т. д. Наконец, в целый ряд новых продуктов «Ростелекома» технологии искусственного интеллекта, ориентированного на данные, закладываются изначально.

Основное правило работы с датацентричными моделями – оперирование достаточными по объему качественными данными. Они могут получены в том случае, если в компании налажено централизованное хранилище и Big Data для сбора и структурирования информации.

Без решения этой задачи невозможно построение моделей ИИ. Дальше остается вопрос разметки данных, но при успешном завершении этапа сбора и структурирования это становится совсем не сложным делом.

Опыт моделецентричного подхода

У моделецентричного искусственного интеллекта существует несколько нюансов применения, которые зачастую становятся проблемами. В первую очередь, поскольку подобные модели изначально размещены вне периметра организации, возникает задача безопасного взаимодействия с ними, сохранения конфиденциальности корпоративной информации. Можно ли работать обезличено с искусственным интеллектом? Как применять политики ИБ при работе с публичными моделями? Каждая компания решает эти вопросы по-своему. С одной стороны, можно выстроить портал управления искусственным интеллектом, который будет контролировать информацию, уходящую в публичные сети. С другой стороны, есть определенное количество моделей, которые можно размещать on-premise. На рынке есть поставщики таких моделей, которые их обучают и затем продают. Мы в «Ростелекоме» видим потенциал и определенный прогресс в обоих этих направлениях.

Второй аспект состоит в изменении пользовательского опыта: условно говоря – как сделать так, чтобы люди перестали работать отвертками и научились применять шуруповерт? Если углубиться в этот процесс, он окажется достаточно сложным. Просто «отменить» отвертку не получится, потребуется гораздо более глубинная перестройка всех операционных процессов. И это большой вызов. По опыту «Ростелекома», переход к полноценному применению моделей ИИ должен содержать несколько этапов:

Первый шаг: компании необходимо организовать для всех сотрудников портал доступа к моделецентричному ИИ – по той же схеме, как она создавала, например, портал по работе с данными. Этот ресурс позволит каждому сотруднику протестировать модели ИИ для решения собственных прикладных задач. Одновременно портал будет контролировать политики информационной безопасности, чтобы не допустить отправки в сторону публичных моделей информации, которая не должна покидать корпоративный периметр.

Второй шаг: обучение пользователей работе с моделями ИИ и обязательная практика. Это могут быть курсы в корпоративном университете, проведение практических мероприятий, вебинаров. Очень важно, чтобы пользователи получили реальный опыт взаимодействия с искусственным интеллектом. После этого можно повышать их уровень компетенций в соответствии с конкретными прикладными задачами: разработки, текстрайтинга, работы с изображениями, подготовки презентаций и т. д. Эти обучающие курсы должны подвести пользователей к освоению следующего аспекта работы с модельными нейросетями – промптинга.

Третий шаг: практика промптинга, то есть генерации четких и логичных задач для нейросети. Текущие модели ИИ работают глубоко реактивно, выдавая конкретный результат под конкретные запросы или входные данные. Важно учесть, что практику промптинга необходимо подстраивать под конкретную нейросеть и под конкретную прикладную задачу.

Четвертый шаг: формирование портфеля трансформации организации, учитывающую максимальное использование моделецентричного ИИ. Для этого топ-менеджерам и дата-сайентистам стоит провести рад «мозговых штурмов»: в каких именно процессах и как именно возможно пилотирование или полноценное внедрение моделей ИИ. Это происходит примерно так же, как ранее организация готовилась к цифровой трансформации и исследовала возможность внедрения цифровых технологий в свои бизнес-процессы.

В частности, «Ростелеком» на сегодняшний день уже завершает основные процессы цифровой трансформации и, применяя полученный опыт, приступает к планомерной «интеллектуализации» компании. То же самое мы видим и в других высокотехнологичных компаниях.

Искусственный интеллект для бизнеса – уже сегодня

Отрасль телекоммуникаций практически не отличается от других с точки зрения сценариев применения моделецентричного ИИ. Так, на текущий момент мы используем универсальные, самые распространенные модели – ChatGPT, различные российские и зарубежные генераторы изображений. В стадии пилотирования и апробации находятся модели для разработчиков ПО – связанные с генерацией кода, тест-кейсов и т. д.

Один из немногих специфичных сценариев использования ИИ в телекоме связан с необходимостью мониторинга распределенной сетевой инфраструктуры, прогнозирования отказов оборудования, анализа логов сетевых элементов на аномальное поведение.

Особенностью моделецентричного ИИ является то, что этот «ящик с инструментами» универсален и готов к работе, создавать что-то свое компании не придется.

Тем более что это очень затратно по времени и ресурсам. Только единицы компаний обладают достаточной экспертизой для того, чтобы создавать свои модели искусственного интеллекта.

Но здесь есть исключения. Наши эксперименты в применении ИИ для разработки ПО показывают, что для генерации кода правильнее обучать моделецентричную нейросеть примерами из собственного репозитория компании. В этом случае эффективность нейросети оказывается выше, чем у универсальных моделей, обученных на GitHub. Также для целого ряда задач крупного бизнеса видится целесообразным дообучение ИИ на собственных данных. Это связано с тем, что разные системы внутри компании по-разному разрабатываются, даже если они написаны на одном и том же языке.

Критика искусственного интеллекта

На текущем этапе развития у технологий искусственного интеллекта, безусловно, существует целый ряд «узких мест». Например, когда датацентричный искусственный интеллект обучается на большом объеме данных, то редко встречающиеся данные для него близки к информационному шуму. То есть, если генерирующая текст нейросеть встречает много упоминаний о каком-то событии, то, скорее всего, не ошибется. Если же нужно описать не популярного человека, то она может легко спутать его с другим историческим персонажем.

Понятно, что у текущих моделей искусственного интеллекта есть некий верхний уровень, до которого они будут развиваться, и остановятся на этом до тех пор, пока не произойдет следующего технологического скачка. Также понятно, что когда известные трудности ИИ будут решены, возникнут другие. Это естественный процесс.

Поэтому одна из задач разработчиков нейросетей как раз и заключается в преодолении этих «узких мест». Так, в области генерации текстов уже существуют поисковые системы, которые проводят дополнительный фактчекинг и выдают ссылки на те материалы, на которых составила свое заключение нейросеть. Скоро также появятся сервисы, которые будут автоматически переходить по этим ссылкам и оценивать показатель достоверности текста.

Резюме

Итак, для того, чтобы успешно внедрять технологии искусственного интеллекта в бизнес-процессы компании, сегодня ей необходимо одновременно развивать и датацентричный, и моделецентричный подходы.

При этом нужно изучать и использовать новые технологии для усиления датацентричного ИИ. А с моделецентричным ИИ нужно активно экспериментировать, предлагать его максимально широкой аудитории пользователей, учить людей грамотно промптить.

Важно заметить, что эти направления не обособлены и могут взаимодействовать. Например, мы в «Ростелекоме» экспериментируем над тем, чтобы объединить нашего внутреннего чат-бота с аналогами ChatGPT. С одной стороны, мы не можем предоставить доступ публичной нейросети к персональным данным клиентов. С другой стороны, ее возможности хочется использовать в полной мере.

Моделецентричный ИИ (в частности, генеративные нейросети) сейчас находится в стадии высокого хайпа. Вместе с тем мы пока не можем сказать, что полностью адаптировали новую технологию и начали активно ее использовать. Большинство внедрений, помимо совсем простых, находятся в стадии пилотирования или подготовки к пилотам. Полноценным использованием мы назовем это только тогда, когда сможем качественно изменить тот или иной бизнес-процесс с помощью моделецентричного искусственного интеллекта.