Модели транзакционной активности FMCD (для дебетовых и кредитный карт)
- Заказчик:
- ПАО ВТБ
- Руководитель проекта со стороны заказчика
- Год завершения проекта
- 2025
- Сроки выполнения проекта
- октябрь, 2024 — январь, 2025
- Масштаб проекта
- 2400 человеко-часов
- Цели
Разработать модели машинного обучения для прогнозирования количества (Frequency), суммы (Monetary), частоты (Consistency), вариативности (Diversity) транзакций (отдельно для дебетовых и кредитных карт) через 1.5 месяца после отчетной даты для каждой из 8-ми категорий MCC:
-
Медицина, красота, здоровье
-
Кафе, рестораны
-
Супермаркеты, торговые центры
-
Коммунальные платежи, связь, интернет-провайдеры
-
Интернет-магазины, электронные деньги
-
Техника, электроника
-
Транспорт, такси, перевозки, услуги почты
-
Автомобиль, АЗС, личный транспорт
Модели применяются в бизнес-процессах заказчика для формирования индивидуальных маркетинговых предложений, скидок клиентам с целью увеличения оборота транзакций по ДК/КК клиентами и своевременного предотвращения оттока за счет раннего выявления трендов на снижение оборотов по отдельным MCC-категориям при сравнении факта за предыдущие 1.5 мес. и прогнозов (это также реализовано в решении) и поиска наилучшего пути взаимодействия с клиентами.
-
-
Автоматизирован процесс подбора релевантного пути взаимодействия с клиентом на основе понимания сильных и слабых транзакционных механик по результатам работы решения.
-
Автоматическая стратегия сегментации пользователя по транзакционной активности.
В цифрах:
-
Прирост конверсии в подключение категорий кешбэка у целевого сегмента составил +51%.
-
В 3 раза увеличилось среднее количество транзакций в релевантных категориях кешбэка на одного клиента.
-
Прирост средней суммы транзакций на одного клиента составил +37%.
-
Уникальность проекта
-
Решение - автоматизация и улучшение (усложнение) RFM-анализа
-
Использованная архитектура решения позволила сократить необходимое число моделей с 64 до 8 – уменьшились трудозатраты и увеличилась скорость на разработку и применение
-
Аналогов в банке нет и на рынке у конкурентов только в одном банке ТОП-3 (по известной информации)
-
Решение позволяет гибко работать с каждым клиентом и автоматически подбирать наиболее релевантные предложения для влияния на транзакционные обороты.
-
Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).
-
Динамические расчеты стратегии в зависимости от результатов всего спектра моделей и дополнительных расчетных факторов.
- Использованное ПО
JupyterHub, Hadoop, PySpark, CatBoost, PyArrow, Система управления CRM предложениями
- Сложность реализации
-
Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).
-
Краткие сроки проекта: необходимость проведения работ в параллели.
-
Необходимость генерации, расчета и проверки новых признаков, полезных для прогноза.
-
Большое количество изменений стратегии и расчета механик в процессе проекта и внедрения решения.
-
В параллели с проектом шла миграция источников данных в банке (импортозамещение), что требовало дополнительных работ по подготовке данных и отбору периодов разработки для моделей.
-
- Описание проекта
-
В качестве данных для разработки модели использовались данные клиентов с кредитными/дебетовыми картами, объем данных составил ~150 млн. записей и ~13 тыс. признаков, в том числе сгенерированные для этой модели (соц-дем информация, кредитная история, транзакционное поведение клиента).
-
Был создан пайплайн на PySpark, позволяющий в течение 24 часов на больших объемах данных, указанных ранее, автоматизированно производить отбор предсказательных признаков и обучать модель так, чтобы она была устойчива к изменению данных.
-
Для каждой метрики (например, частоты) была разработана модель множественной регрессии на основе градиентного бустинга (реализация CatBoost) для 8-ми MCC-категорий.
-
Решение сравнивает фактическое и прогнозное значение транзакционных механик (F, M, C, D), для подбора наилучшего предложения клиенту (например, повышенный кэшбэк на категорию «Здоровье»).
-
Исследованы и выбраны наиболее удачные с т.з. бизнес-применения алгоритмы расчета транзакционных механик (пр.: Diversity может быть рассчитана по-разному).
-
В результате разработки решения было создано: 12 пром. витрин применения, все модели находятся в пром. эксплуатации (рассчитываются ежемесячно).
-
Динамические расчеты бизнес-стратегии в зависимости от результатов всего спектра моделей и расчета дополнительных факторов. Пример: автоматическое определение порогов скорбалла для отнесения клиентов к группе транзакционной активности и авто-выделение сильных и слабых значений транзакционных механик каждого клиента, определяющих путь взаимодействия с клиентом. Т.о., подбирается оптимальный путь взаимодействия с клиентом (что и в каком объеме предлагать).
-
Идут работы по дальнейшей оптимизации подбора пути взаимодействия на основе, в том числе, CLTV.
-
- География проекта
Все регионы РФ