ML-проект: Сегментация 2.0
- Заказчик:
- Росгосстрах
- Руководитель проекта со стороны заказчика
- Поставщик
- Компания "Синимекс"
- Год завершения проекта
- 2022
- Сроки выполнения проекта
- Август, 2020 - Ноябрь, 2022
- Масштаб проекта
- 16000 человеко-часов
- Цели
В высококонкурентной среде страхового бизнеса требуется постоянно поддерживать высокую клиентоориентированность и оптимизацию параметров убыточности. Для этого компаниям требуется постоянно развивать и совершенствовать инструменты, решающие проблемы прогнозирования убытков. Усовершенствовать эти инструменты можно с помощью моделей машинного обучения на основе геосегментации, а также для оценки стоимости контракта и мониторинга портфелей агентов, брокеров и партнеров. В сочетании данные инструменты позволяют вывести подход KYC на новый уровень.
На основе большого количества данных, генерируемого бизнесом, возможно построение современных моделей прогнозирования с применением методов машинного обучения. Такой подход позволяет «Росгосстраху» сохранять лидирующие позиции на страховом рынке, а с помощью машинного обучения достигать поставленных целей – путем нахождения новых инсайдов при работе с данными.
Уникальность проекта
В процессе сегментации, как по числовым исходным данным (много источников), так и привязке к геолокации каждого клиента (геосегментация) в РФ. Исходя из этого можно персонализировать потребность каждого клиента и предоставить оптимальный с точки зрения рисков и стоимости набор продуктов. Подход повышает лояльность клиентов к страховой компании, которая максимально эффективно оценивает риски. За каждую из подзадач отвечают разные модели машинного обучения, которые эффективно работают не только автономно, но и в связке.Модель оценивает риск с привязкой к территории, проанализировав множество факторов влияния, учитываются геокоординаты вплоть до дома и инфраструктуры поблизости. Модель может показать территорию для потенциального роста продаж. Проект позволяет перейти от прогнозирования на уровне «регионов» к уровню «улиц». Модель покрывает всю территорию РФ и работает с SLA менее 100мс, что позволяет использовать высоконагруженную систему как стратегический инструмент принятия решений.
- Проект решает задачи импортозамещения
- Да
- Использованное ПО
-
Для задачи, связанной с геосегментацией, был использован подход Loc2Vec с применением PostGIS, Open Street Map, Mapnik.
-
Для визуализации карты с нанесением на нее рисковых районов был разработан собственный tile сервер, способный работать с высоконагруженными DB.
-
Для работы с сервисом выявления высокорисковых клиентов использовались такие инструменты как Graph-tool, Numba, PyMotif.
-
Для мониторинга и оценки портфелей агентов, брокеров и партнеров были реализованы дашборды в Qlik на базе данных Postgres, куда выводились результаты оценки моделью всех агентов, брокеров и партнеров.
-
- Сложность реализации
Решение разрабатывалось с «нуля», что было обусловлено тем, что никакое коробочное решение или набор таких решений не могли удовлетворить те цели, которые были поставлены бизнесом. Особенно это было заметно в части работы с данными. Сильная зашумленность и большое количество разнородных источников требовали больших затрат на предпроцессинг и первичную обработку. Также достаточно жесткие условия на SLA работы программы делали задачу крайне нетривиальной из-за высокой нагруженности сервиса. Это требование также было выполнено, что позволило модели обрабатывать запросы с Oracle DB за менее чем 100мс. Помимо требования к SLA, также столкнулись со следующей проблемой: имеющийся open source tile сервер для визуализации работы модели не справлялся с таким объемом данных, из-за чего пришлось реализовать tile сервер собственной разработки.
Большое количество гипотез, которые требовали долгой и тщательной проверки, а также необходимость в детальной дополнительной настройке open source библиотек внесли свой вклад в трудоемкость процесса разработки данного проекта.
- Описание проекта
Компания «Росгосстрах» совместно с компанией «Синимекс» реализовала комплексный проект по разработке новых сервисов для оценки рисков, прогнозирования крупных убытков и мониторинга портфелей агентов, брокеров и партнеров.
Результатами проекта являются:
-
Географическая сегментация клиентской базы. Задача подразумевала переход от анализа фактора риска в масштабе региона к анализу рисков на уровне улицы. Данный сервис интегрирован в общий тарифный модуль «Росгосстраха» и сейчас используется при расчете котировок для каждого договора страхования транспортных средств.
-
Сервис для оценки рисковости клиента с использованием алгоритмов машинного обучения. Определение рисковости клиента на основании информации о его окружении на стадии заключения договора. Данный сервис также применяется в совокупности со скоринговой системой бизнеса.
-
ML сервис с последующей BI визуализацией в Qlik для мониторинга и оценки портфелей сотрудничающих с компанией агентов, брокеров и партнеров.
-
- География проекта
Российская Федерация