ML-проект: Сегментация 2.0

Заказчик
Росгосстрах
Руководитель проекта со стороны заказчика
ИТ-поставщик
Компания "Синимекс"
Год завершения проекта
2022
Сроки выполнения проекта
Август, 2020 - Ноябрь, 2022
Масштаб проекта
16000 человеко-часов
Цели

В высококонкурентной среде страхового бизнеса требуется постоянно поддерживать высокую клиентоориентированность и оптимизацию параметров убыточности. Для этого компаниям требуется постоянно развивать и совершенствовать инструменты, решающие проблемы прогнозирования убытков. Усовершенствовать эти инструменты можно с помощью моделей машинного обучения на основе геосегментации, а также для оценки стоимости контракта и мониторинга портфелей агентов, брокеров и партнеров. В сочетании данные инструменты позволяют вывести подход KYC на новый уровень.

На основе большого количества данных, генерируемого бизнесом, возможно построение современных моделей прогнозирования с применением методов машинного обучения. Такой подход позволяет «Росгосстраху» сохранять лидирующие позиции на страховом рынке, а с помощью машинного обучения достигать поставленных целей – путем нахождения новых инсайдов при работе с данными.

Уникальность проекта

В процессе сегментации, как по числовым исходным данным (много источников), так и привязке к геолокации каждого клиента (геосегментация) в РФ. Исходя из этого можно персонализировать потребность каждого клиента и предоставить оптимальный с точки зрения рисков и стоимости набор продуктов. Подход повышает лояльность клиентов к страховой компании, которая максимально эффективно оценивает риски. За каждую из подзадач отвечают разные модели машинного обучения, которые эффективно работают не только автономно, но и в связке.
Модель оценивает риск с привязкой к территории, проанализировав множество факторов влияния, учитываются геокоординаты вплоть до дома и инфраструктуры поблизости. Модель может показать территорию для потенциального роста продаж. Проект позволяет перейти от прогнозирования на уровне «регионов» к уровню «улиц». Модель покрывает всю территорию РФ и работает с SLA менее 100мс, что позволяет использовать высоконагруженную систему как стратегический инструмент принятия решений.
Проект решает задачи импортозамещения
Да
Использованное ПО

  • Для задачи, связанной с геосегментацией, был использован подход Loc2Vec с применением PostGIS, Open Street Map, Mapnik.

  • Для визуализации карты с нанесением на нее рисковых районов был разработан собственный tile сервер, способный работать с высоконагруженными DB.

  • Для работы с сервисом выявления высокорисковых клиентов использовались такие инструменты как Graph-tool, Numba, PyMotif.

  • Для мониторинга и оценки портфелей агентов, брокеров и партнеров были реализованы дашборды в Qlik на базе данных Postgres, куда выводились результаты оценки моделью всех агентов, брокеров и партнеров.

Сложность реализации

Решение разрабатывалось с «нуля», что было обусловлено тем, что никакое коробочное решение или набор таких решений не могли удовлетворить те цели, которые были поставлены бизнесом. Особенно это было заметно в части работы с данными. Сильная зашумленность и большое количество разнородных источников требовали больших затрат на предпроцессинг и первичную обработку. Также достаточно жесткие условия на SLA работы программы делали задачу крайне нетривиальной из-за высокой нагруженности сервиса. Это требование также было выполнено, что позволило модели обрабатывать запросы с Oracle DB за менее чем 100мс. Помимо требования к SLA, также столкнулись со следующей проблемой:  имеющийся open source tile сервер для визуализации работы модели не справлялся с таким объемом данных, из-за чего пришлось реализовать tile сервер собственной разработки.

Большое количество гипотез, которые требовали долгой и тщательной проверки, а также необходимость в детальной дополнительной настройке open source библиотек внесли свой вклад в трудоемкость процесса разработки данного проекта.

Описание проекта

Компания  «Росгосстрах» совместно с компанией «Синимекс» реализовала комплексный проект по разработке новых сервисов для оценки рисков, прогнозирования крупных убытков и мониторинга портфелей агентов, брокеров и партнеров.

Результатами проекта являются:

  1. Географическая сегментация клиентской базы. Задача подразумевала переход от анализа фактора риска в масштабе региона к анализу рисков на уровне улицы. Данный сервис интегрирован в общий тарифный модуль «Росгосстраха» и сейчас используется при расчете котировок для каждого договора страхования транспортных средств.

  2. Сервис для оценки рисковости клиента с использованием алгоритмов машинного обучения. Определение рисковости клиента на основании информации о его окружении на стадии заключения договора. Данный сервис также применяется в совокупности со скоринговой системой бизнеса.

  3. ML сервис с последующей BI визуализацией в Qlik для мониторинга и оценки портфелей сотрудничающих с компанией агентов, брокеров и партнеров.


География проекта

Российская Федерация

Коментарии: 2

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Максим Часовиков
    Рейтинг: 4767
    Центр цифровой экономики МГУ
    Ведущий специалист
    05.01.2023 13:15

    Добрый день! ВЫ пишите: Географическая сегментация клиентской базы. Задача подразумевала переход от анализа фактора риска в масштабе региона к анализу рисков на уровне улицы. Данный сервис интегрирован в общий тарифный модуль «Росгосстраха» и сейчас используется при расчете котировок для каждого договора страхования транспортных средств.
    А разве стоимость страхования не регламентирована законодательством?
    И на сколько тарифы реально зависят от улицы? Если такая зависимость есть, то чем она обусловлена?

    • Юлия Полякова Максим
      Рейтинг: 5
      Cinimex
      Руководитель отдела маркетинга
      21.02.2023 11:51

      По ОСАГО регламентирована, но в рамках тарифного коридора. По КАСКО тариф является свободным, под контролем ЦБ. Зависимость тарифов прослеживается не только от улицы, но и от множества районных особенностей. Это обусловлено наличием перекрестков, поворотов, общим удобством движения. Но стоит учитывать, что это является дополняющими факторами для сегментации.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.