• 497

    Заявлено проектов

  • 200

    Опубликовано проектов

  • 2

    Дней до завершения приема заявок

← Вернуться к списку

Модели транзакционной активности FMCD (для дебетовых и кредитный карт)

  • Руководитель проекта со стороны заказчика

  • Категория

  • Номинация

  • Цели

    Разработать модели машинного обучения для прогнозирования количества (Frequency), суммы (Monetary), частоты (Consistency), вариативности (Diversity) транзакций (отдельно для дебетовых и кредитных карт) через 1.5 месяца после отчетной даты для каждой из 8-ми категорий MCC:

    1. Медицина, красота, здоровье

    2. Кафе, рестораны

    3. Супермаркеты, торговые центры

    4. Коммунальные платежи, связь, интернет-провайдеры

    5. Интернет-магазины, электронные деньги

    6. Техника, электроника

    7. Транспорт, такси, перевозки, услуги почты

    8. Автомобиль, АЗС, личный транспорт

    Модели применяются в бизнес-процессах заказчика для формирования индивидуальных маркетинговых предложений, скидок клиентам с целью увеличения оборота транзакций по ДК/КК клиентами и своевременного предотвращения оттока за счет раннего выявления трендов на снижение оборотов по отдельным MCC-категориям при сравнении факта за предыдущие 1.5 мес. и прогнозов (это также реализовано в решении) и поиска наилучшего пути взаимодействия с клиентами.

  • Сроки выполнения

    октябрь, 2024 — январь, 2025
  • Год завершения проекта

    2025

  • Масштаб проекта

    2400 человеко-часов
  • Результаты

    • Автоматизирован процесс подбора релевантного пути взаимодействия с клиентом на основе понимания сильных и слабых транзакционных механик по результатам работы решения.

    • Автоматическая стратегия сегментации пользователя по транзакционной активности.

    В цифрах:

    • Прирост конверсии в подключение категорий кешбэка у целевого сегмента составил +51%.

    • В 3 раза увеличилось среднее количество транзакций в релевантных категориях кешбэка на одного клиента.

    • Прирост средней суммы транзакций на одного клиента составил +37%.

  • Уникальность проекта

    • Решение - автоматизация и улучшение (усложнение) RFM-анализа

    • Использованная архитектура решения позволила сократить необходимое число моделей с 64 до 8 – уменьшились трудозатраты и увеличилась скорость на разработку и применение

    • Аналогов в банке нет и на рынке у конкурентов только в одном банке ТОП-3 (по известной информации)

    • Решение позволяет гибко работать с каждым клиентом и автоматически подбирать наиболее релевантные предложения для влияния на транзакционные обороты.

    • Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).

    • Динамические расчеты стратегии в зависимости от результатов всего спектра моделей и дополнительных расчетных факторов.

  • Использованное ПО

    JupyterHub, Hadoop, PySpark, CatBoost, PyArrow, Система управления CRM предложениями

  • Решение из каталога Global CIO

    В проекте не используются решения из каталога Global CIO

  • Сложность реализации

    • Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).

    • Краткие сроки проекта: необходимость проведения работ в параллели.

    • Необходимость генерации, расчета и проверки новых признаков, полезных для прогноза.

    • Большое количество изменений стратегии и расчета механик в процессе проекта и внедрения решения.

    • В параллели с проектом шла миграция источников данных в банке (импортозамещение), что требовало дополнительных работ по подготовке данных и отбору периодов разработки для моделей.

  • Описание

    • В качестве данных для разработки модели использовались данные клиентов с кредитными/дебетовыми картами, объем данных составил ~150 млн. записей и ~13 тыс. признаков, в том числе сгенерированные для этой модели (соц-дем информация, кредитная история, транзакционное поведение клиента).

    • Был создан пайплайн на PySpark, позволяющий в течение 24 часов на больших объемах данных, указанных ранее, автоматизированно производить отбор предсказательных признаков и обучать модель так, чтобы она была устойчива к изменению данных.

    • Для каждой метрики (например, частоты) была разработана модель множественной регрессии на основе градиентного бустинга (реализация CatBoost) для 8-ми MCC-категорий.

    • Решение сравнивает фактическое и прогнозное значение транзакционных механик (F, M, C, D), для подбора наилучшего предложения клиенту (например, повышенный кэшбэк на категорию «Здоровье»).

    • Исследованы и выбраны наиболее удачные с т.з. бизнес-применения алгоритмы расчета транзакционных механик (пр.: Diversity может быть рассчитана по-разному).

    • В результате разработки решения было создано: 12 пром. витрин применения, все модели находятся в пром. эксплуатации (рассчитываются ежемесячно).

    • Динамические расчеты бизнес-стратегии в зависимости от результатов всего спектра моделей и расчета дополнительных факторов. Пример: автоматическое определение порогов скорбалла для отнесения клиентов к группе транзакционной активности и авто-выделение сильных и слабых значений транзакционных механик каждого клиента, определяющих путь взаимодействия с клиентом. Т.о., подбирается оптимальный путь взаимодействия с клиентом (что и в каком объеме предлагать).

    • Идут работы по дальнейшей оптимизации подбора пути взаимодействия на основе, в том числе, CLTV. 

  • География проекта

    Все регионы РФ

Комментировать

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Заказчик

    ПАО ВТБ

    ПАО ВТБ

Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.