Яндекс запускает новое поколение языковых моделей YandexGPT 4: они научились рассуждать и обрабатывать в четыре раза больше текста

25 октября 2024

2538

Яндекс выпустил новое поколение генеративных нейросетей — YandexGPT 4. Новая линейка включает мощную языковую модель Pro и облегчённую версию Lite. Они превосходят по качеству ответов предыдущие версии, способны рассуждать и обрабатывать в четыре раза более длинные запросы — порядка 60 страниц текста. Это позволяет использовать нейросети для решения более сложных и разнообразных бизнес-задач, от анализа обращений клиентов до автоматизации закупок.

Модели четвёртого поколения уже доступны по API в Yandex Cloud, часть функций пока работают в тестовом режиме. Новые модели применимы в разных сферах бизнеса. С их помощью можно сортировать письма и заявки клиентов, анализировать резюме и решать другие задачи, связанные с обработкой текста. Версия Pro больше подходит для сложных трудоёмких задач — например, анализа продаж. Lite будет полезна в более простых сценариях, где важна скорость ответа. Попробовать новые модели можно в демоверсии — в чате на платформе Yandex Cloud. В будущем они появятся в сервисах Яндекса для широкой аудитории. Первым таким сервисом станет Алиса с опцией «Про».

Качество ответов

По качеству ответов YandexGPT 4 Pro выигрывает у модели прошлого поколения в среднем в 70% случаев, а в некоторых типах задач — например, в ответах на открытые вопросы — вплотную приближается к GPT-4o. Версия Lite отвечает не хуже самой мощной модели Яндекса прошлого поколения. Это стало возможным благодаря улучшению процесса обучения. В частности, разработчики научили нейросеть рассуждать — на примерах с пошаговым решением задач.

Рассуждения

Модели нового поколения способны рассуждать (поддерживать функцию chain-of-thought). Прежде чем ответить на сложный вопрос, они разбивают задачу на более простые и решают их пошагово, выстраивая цепочку рассуждений. Это не только улучшает качество ответов, но и помогает нейросети отвечать на вопросы, которые требуют анализа. Например, новая модель способна изучить жалобу клиента, разобраться в проблеме и предложить выход из ситуации. В будущем в API появится возможность включать скрытые рассуждения для всех запросов.

Обработка данных

Нейросети нового поколения обрабатывают в четыре раза больше текста, чем модели третьего поколения. В итоге они гораздо дольше удерживают контекст беседы, могут отвечать на сложные длинные вопросы и анализировать порядка 60 страниц текста. Новые модели лучше отвечают на вопросы с опорой на внешние источники (применяется в системах RAG, Retrieval Augmented Generation). Такими источниками могут быть, например, документы компании или статьи. Доля ошибок, в том числе выдуманных фактов, снизилась в таких сценариях почти в два раза — с 4% до 2,1%. Кроме того, новые модели в среднем в два раза быстрее предыдущих отвечают на вопросы.

Работа с внешними приложениями

YandexGPT 4 умеет генерировать команды для сторонних приложений. Например, если попросить нейросеть найти билет на самолет, она напишет команду для сервиса авиабилетов, чтобы он запустил функцию поиска мест. Генерация команд станет доступна в Yandex Cloud в ближайшее время, и разработчики смогут использовать новые модели для работы с внешними приложениями. Для этого им нужно будет описать функции и правила составления команд, а модель будет сама определять, когда ими воспользоваться.