Как в сжатые сроки создать виртуального ассистента для Минцифры. Иван Смирнов, Сбер
Виртуальные ассистенты Салют от Сбера помогают пользователям получать госуслуги. Достаточно сказать «Салют, запусти госуслуги», и ассистенты вызовут робота Макса — цифрового помощника портала госуслуг. Как рассказал руководитель SmartMarket и NLP-платформы SberDevices Иван Смирнов путь от чат-бота до полноценного голосового ассистента занял всего полтора месяца.
Во всем мире есть тренд на умные устройства. Сбер тоже идет в этом направлении. Например, компанией были созданы SberBox (ТВ-приставка - позволяет сделать апгрейд старых телевизоров, чтобы они реагировали на голос), различные устройства умного дома, SberPortal (смарт-дисплей с мощным звуком), SberBox Top (ТВ-приставка с камерой - с помощью нее удобно, например, делать видеозвонки), Салют ТВ (телевизор со встроенным ассистентом Салют).
Год назад Сбер запустил своих первых виртуальных ассистентов. Были созданы три разных персонажа, чтобы клиенты могли сами выбрать подходящий тип именно для них. Например, у ассистентов Сбер и Афина — деловой стиль общения и умеренный тон. Если хочется более неформального общения, то можно поговорить с Джой, отмечает господин Смирнов.
Виртуальные ассистенты мультимодальны. «Для нас это особенно важно. Голос — только один из способов взаимодействия, в некоторых случаях он не нужен и не удобен. Наши мультимедийные ассистенты умеют работать через текст, голос, жесты, прикосновения к экрану», — отметил спикер.
Главные компоненты
Приложения, которые пишутся для ассистентов, делятся на три типа:
Chat App (диалоговое приложение с карточками и кнопками), Canvas App (смартап с визуальным интерфейсом и виртуальным ассистентом), Native App (Android-приложения).
Среди основных компонентов ассистентов выделяются такие, как Assistant SDK (решение для интеграции в поверхности, например, вызов робота или поиск), SmartMarket (настраиваемый каталог приложений, внутренние и внешние навыки), SmartNLP (обработка и интерпретация мультимодальных запросов пользователя, например, построение диалога), SmartSpeech (создание собственного голоса для ассистента), SmartBIO (биометрические технологии).
Умный Макс
Когда у компании была уже наработана серьезная база и созданы свои ассистенты, к Сберу обратилось Министерство цифрового развития. Ведомство предложило сделать виртуального ассистента, который мог бы помочь пользователям в получении госуслуг. Так началась работа над роботом Максом, которая заняла 1,5 месяца.
«Для государств это очень быстрый срок разработки, а для нашей компании — стандартный темп. Например, раз в неделю у нас выходит 50-60 релизов различных компонентов, подсистем», — подчеркнул господин Смирнов.
По его словам, делать ассистентов быстро и качественно позволяет высокопрофессиональная команда с релевантным опытом, современный, адаптивный технологический стек Ассистента Салют, а также уже готовая библиотека голосов. За полтора месяца удалось создать самостоятельного персонажа, сделать мультимодальный и эмпатичный интерфейс, использовать передовые технологические решения (NLP платформа, синтез речи).
С помощью Макса можно получить справочную информацию об оформлении российского или заграничного паспорта, регистрации и расторжении брака или о вакцинации. Функция доступна на умных устройствах SberBox и SberPortal, а также в мобильных приложениях СберБанк Онлайн и Сбер Салют.
Иван Смирнов отмечает, что виртуальных ассистентов можно поделить на два уровня. Первый — это простой персонаж, который обладает какими-то навыками и помогает с конкретными задачами. Второй — эксперт в своей области. Робот Макс относится ко второй категории.
Спикер уверен, что в ближайшем будущем все больше компаний будут стремиться создавать своих мультимодальных ассистентов. Он также добавил, что Сбер выкладывает документацию, инструменты и технологии на сайт developers.sber, чтобы сторонние разработчики могли ознакомиться со всей информацией.
Подготовила Мария Строителева