- 
                
497
Заявлено проектов
 - 
                
200
Опубликовано проектов
 - 
                
2
Дней до завершения приема заявок
 
Модели транзакционной активности FMCD (для дебетовых и кредитный карт)
- 
						
Руководитель проекта со стороны заказчика
 - 
							
Категория
 - 
							
Номинация
 - 
						
Цели
Разработать модели машинного обучения для прогнозирования количества (Frequency), суммы (Monetary), частоты (Consistency), вариативности (Diversity) транзакций (отдельно для дебетовых и кредитных карт) через 1.5 месяца после отчетной даты для каждой из 8-ми категорий MCC:
- 
	
Медицина, красота, здоровье
 - 
	
Кафе, рестораны
 - 
	
Супермаркеты, торговые центры
 - 
	
Коммунальные платежи, связь, интернет-провайдеры
 - 
	
Интернет-магазины, электронные деньги
 - 
	
Техника, электроника
 - 
	
Транспорт, такси, перевозки, услуги почты
 - 
	
Автомобиль, АЗС, личный транспорт
 
Модели применяются в бизнес-процессах заказчика для формирования индивидуальных маркетинговых предложений, скидок клиентам с целью увеличения оборота транзакций по ДК/КК клиентами и своевременного предотвращения оттока за счет раннего выявления трендов на снижение оборотов по отдельным MCC-категориям при сравнении факта за предыдущие 1.5 мес. и прогнозов (это также реализовано в решении) и поиска наилучшего пути взаимодействия с клиентами.
 - 
	
 - 
						
Сроки выполнения
октябрь, 2024 — январь, 2025 - 
						
Год завершения проекта
2025
 - 
						
Масштаб проекта
2400 человеко-часов - 
						
Результаты
- 
	
Автоматизирован процесс подбора релевантного пути взаимодействия с клиентом на основе понимания сильных и слабых транзакционных механик по результатам работы решения.
 - 
	
Автоматическая стратегия сегментации пользователя по транзакционной активности.
 
В цифрах:
- 
	
Прирост конверсии в подключение категорий кешбэка у целевого сегмента составил +51%.
 - 
	
В 3 раза увеличилось среднее количество транзакций в релевантных категориях кешбэка на одного клиента.
 - 
	
Прирост средней суммы транзакций на одного клиента составил +37%.
 
 - 
	
 - 
						
Уникальность проекта
- 
	
Решение - автоматизация и улучшение (усложнение) RFM-анализа
 - 
	
Использованная архитектура решения позволила сократить необходимое число моделей с 64 до 8 – уменьшились трудозатраты и увеличилась скорость на разработку и применение
 - 
	
Аналогов в банке нет и на рынке у конкурентов только в одном банке ТОП-3 (по известной информации)
 - 
	
Решение позволяет гибко работать с каждым клиентом и автоматически подбирать наиболее релевантные предложения для влияния на транзакционные обороты.
 - 
	
Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).
 - 
	
Динамические расчеты стратегии в зависимости от результатов всего спектра моделей и дополнительных расчетных факторов.
 
 - 
	
 - 
						
Использованное ПО
JupyterHub, Hadoop, PySpark, CatBoost, PyArrow, Система управления CRM предложениями
 - 
													
Решение из каталога Global CIO
В проекте не используются решения из каталога Global CIO
 - 
						
Сложность реализации
- 
	
Для разработки использовались большие объемы данных (~150 млн. записей и ~13 тыс. признаков для моделирования).
 - 
	
Краткие сроки проекта: необходимость проведения работ в параллели.
 - 
	
Необходимость генерации, расчета и проверки новых признаков, полезных для прогноза.
 - 
	
Большое количество изменений стратегии и расчета механик в процессе проекта и внедрения решения.
 - 
	
В параллели с проектом шла миграция источников данных в банке (импортозамещение), что требовало дополнительных работ по подготовке данных и отбору периодов разработки для моделей.
 
 - 
	
 - 
						
Описание
- 
	
В качестве данных для разработки модели использовались данные клиентов с кредитными/дебетовыми картами, объем данных составил ~150 млн. записей и ~13 тыс. признаков, в том числе сгенерированные для этой модели (соц-дем информация, кредитная история, транзакционное поведение клиента).
 - 
	
Был создан пайплайн на PySpark, позволяющий в течение 24 часов на больших объемах данных, указанных ранее, автоматизированно производить отбор предсказательных признаков и обучать модель так, чтобы она была устойчива к изменению данных.
 - 
	
Для каждой метрики (например, частоты) была разработана модель множественной регрессии на основе градиентного бустинга (реализация CatBoost) для 8-ми MCC-категорий.
 - 
	
Решение сравнивает фактическое и прогнозное значение транзакционных механик (F, M, C, D), для подбора наилучшего предложения клиенту (например, повышенный кэшбэк на категорию «Здоровье»).
 - 
	
Исследованы и выбраны наиболее удачные с т.з. бизнес-применения алгоритмы расчета транзакционных механик (пр.: Diversity может быть рассчитана по-разному).
 - 
	
В результате разработки решения было создано: 12 пром. витрин применения, все модели находятся в пром. эксплуатации (рассчитываются ежемесячно).
 - 
	
Динамические расчеты бизнес-стратегии в зависимости от результатов всего спектра моделей и расчета дополнительных факторов. Пример: автоматическое определение порогов скорбалла для отнесения клиентов к группе транзакционной активности и авто-выделение сильных и слабых значений транзакционных механик каждого клиента, определяющих путь взаимодействия с клиентом. Т.о., подбирается оптимальный путь взаимодействия с клиентом (что и в каком объеме предлагать).
 - 
	
Идут работы по дальнейшей оптимизации подбора пути взаимодействия на основе, в том числе, CLTV.
 
 - 
	
 - 
						
География проекта
Все регионы РФ
 
- 
			
Заказчик
            ПАО ВТБ
 
            
Комментировать могут только авторизованные пользователи.
Предлагаем Вам войти в систему или зарегистрироваться.