Модели транзакционной активности FMCD (для дебетовых и кредитный карт)

Заказчик:
ПАО ВТБ
Руководитель проекта со стороны заказчика
Год завершения проекта
2025
Сроки выполнения проекта
октябрь, 2024 — январь, 2025
Масштаб проекта
2400 человеко-часов
Цели

Разработать модели машинного обучения для прогнозирования количества (Frequency), суммы (Monetary), частоты (Consistency), вариативности (Diversity) транзакций (отдельно для дебетовых и кредитных карт) через 1.5 месяца после отчетной даты для каждой из 8-ми категорий MCC:

  1. Медицина, красота, здоровье

  2. Кафе, рестораны

  3. Супермаркеты, торговые центры

  4. Коммунальные платежи, связь, интернет-провайдеры

  5. Интернет-магазины, электронные деньги

  6. Техника, электроника

  7. Транспорт, такси, перевозки, услуги почты

  8. Автомобиль, АЗС, личный транспорт

Модели применяются в бизнес-процессах заказчика для формирования индивидуальных маркетинговых предложений, скидок клиентам с целью увеличения оборота транзакций по ДК/КК клиентами и своевременного предотвращения оттока за счет раннего выявления трендов на снижение оборотов по отдельным MCC-категориям при сравнении факта за предыдущие 1.5 мес. и прогнозов (это также реализовано в решении) и поиска наилучшего пути взаимодействия с клиентами.

  • Автоматизирован процесс подбора релевантного пути взаимодействия с клиентом на основе понимания сильных и слабых транзакционных механик по результатам работы решения.

  • Автоматическая стратегия сегментации пользователя по транзакционной активности.

В цифрах:

  • Прирост конверсии в подключение категорий кешбэка у целевого сегмента составил +51%.

  • В 3 раза увеличилось среднее количество транзакций в релевантных категориях кешбэка на одного клиента.

  • Прирост средней суммы транзакций на одного клиента составил +37%.

Уникальность проекта

  • Решение - автоматизация и улучшение (усложнение) RFM-анализа

  • Использованная архитектура решения позволила сократить необходимое число моделей с 64 до 8 – уменьшились трудозатраты и увеличилась скорость на разработку и применение

  • Аналогов в банке нет и на рынке у конкурентов только в одном банке ТОП-3 (по известной информации)

  • Решение позволяет гибко работать с каждым клиентом и автоматически подбирать наиболее релевантные предложения для влияния на транзакционные обороты.

  • Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).

  • Динамические расчеты стратегии в зависимости от результатов всего спектра моделей и дополнительных расчетных факторов.

Использованное ПО

JupyterHub, Hadoop, PySpark, CatBoost, PyArrow, Система управления CRM предложениями

Сложность реализации
  • Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).

  • Краткие сроки проекта: необходимость проведения работ в параллели.

  • Необходимость генерации, расчета и проверки новых признаков, полезных для прогноза.

  • Большое количество изменений стратегии и расчета механик в процессе проекта и внедрения решения.

  • В параллели с проектом шла миграция источников данных в банке (импортозамещение), что требовало дополнительных работ по подготовке данных и отбору периодов разработки для моделей.

Описание проекта
  • В качестве данных для разработки модели использовались данные клиентов с кредитными/дебетовыми картами, объем данных составил ~150 млн. записей и ~13 тыс. признаков, в том числе сгенерированные для этой модели (соц-дем информация, кредитная история, транзакционное поведение клиента).

  • Был создан пайплайн на PySpark, позволяющий в течение 24 часов на больших объемах данных, указанных ранее, автоматизированно производить отбор предсказательных признаков и обучать модель так, чтобы она была устойчива к изменению данных.

  • Для каждой метрики (например, частоты) была разработана модель множественной регрессии на основе градиентного бустинга (реализация CatBoost) для 8-ми MCC-категорий.

  • Решение сравнивает фактическое и прогнозное значение транзакционных механик (F, M, C, D), для подбора наилучшего предложения клиенту (например, повышенный кэшбэк на категорию «Здоровье»).

  • Исследованы и выбраны наиболее удачные с т.з. бизнес-применения алгоритмы расчета транзакционных механик (пр.: Diversity может быть рассчитана по-разному).

  • В результате разработки решения было создано: 12 пром. витрин применения, все модели находятся в пром. эксплуатации (рассчитываются ежемесячно).

  • Динамические расчеты бизнес-стратегии в зависимости от результатов всего спектра моделей и расчета дополнительных факторов. Пример: автоматическое определение порогов скорбалла для отнесения клиентов к группе транзакционной активности и авто-выделение сильных и слабых значений транзакционных механик каждого клиента, определяющих путь взаимодействия с клиентом. Т.о., подбирается оптимальный путь взаимодействия с клиентом (что и в каком объеме предлагать).

  • Идут работы по дальнейшей оптимизации подбора пути взаимодействия на основе, в том числе, CLTV. 

География проекта

Все регионы РФ

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.