Система интеллектуальной сегментации клиентов. Динамическая сегментация с использованием массивов неструктурированных данных (Big Data) для увеличения входящего потока клиентов
- Заказчик:
- «Аэрофлот»
- Поставщик
- «Техносерв»
- Год завершения проекта
- 2017
- Сроки выполнения проекта
- Январь, 2016 — Декабрь, 2016
- Масштаб проекта
- 63000 человеко-часов
- Цели
- Развитие системы управления взаимоотношениями с клиентами, предполагающее аккумулирование и анализ данных о существующих и потенциальных клиентах из различных источников (см. описание ниже), а также открытой информации по конкурентам с целью осуществления узко таргетированных и персонифицированных коммуникаций и повышения эффективности маркетинговых кампаний.
Уникальность проекта
1. Первое и единственное на текущий момент внедрение систем класса Big Data в транспортной авиаотрасли РФ;2. Кратчайшие для данного типа проекта (сложный) сроки внедрения (менее 1 года).
- Использованное ПО
- Модуль «Клиент 360» представляет собой алгоритм сопоставления и объединения данных о пассажирах из различных источников с целью выявления уникальных профилей клиентов. Реализация модуля предполагает аккумулирование и анализ структурированных и неструктурированных данных, поступающих из большого числа разнообразных источников информации: ежедневная выгрузка записей о полетах и пассажирах из системы бронирования и резервирования авиабилетов, развернутая характеристика посетителей сайта. Аэрофлота (которая собирается из Google Analytics Premium на основе установленных меток) и модель их поведения (поиск, просмотр, бронирование, оплата, загрузка, переход по ссылкам и др.). Регулярная автоматическая выгрузка данных о WEB-активности клиентов из Google Analytics Premium, а также данные по маркетинговым коммуникациям (e-mail, sms и др.). Кроме того, предусмотрена возможность обогащения профиля клиента данными, полученными на основании реализации других модулей. В качестве основного инструмента, позволяющего осуществить интеграцию данных и выделить уникальные клиентские записи, выступает семейство решений IBM InfoSphere Information Server.
Модуль «Сервис рекомендаций» реализует алгоритм, позволяющий подобрать альтернативные предложения клиенту по возможным пунктам авиапутешествия, основываясь на исторических данных о полетах пассажиров и выявленных корреляциях. Реализация модуля основывается на применении метода корреляционного анализа - выявление взаимосвязанных событий и установлении степени их родства, факторного анализа - определение структуры взаимосвязей между событиями, регрессионного анализа – определение вклада каждого независимого атрибута в изменение изучаемого признака и т.д. Также с помощью широкого инструментария data mining данный модуль способен ранжировать авиа направления по привлекательности для клиента и установить наиболее вероятный следующий выбор пассажира в контексте географических зон с возможностью визуализации результатов посредством продукта Business Intelligence. Подбор персональных предложений осуществляется в виде баннеров для демонстрации на сайте авиакомпании. В ходе проекта были протестированы несколько data mining подходов по определению потенциальных интересов клиентов, основанных на интересах клиентов с похожей историей. Методологически подход заключается в решение двух задач: 1) классификация клиентов с использованием: методов k-ближайших соседей, классификация на базе деревьев-решений, регрессии.... 2) подбор предложений, которые интересны данной группе клиентов, и могут быть интересны конкретному клиенту из группы. Реализация на SPSS Modeler с использованием: KNN node, Neural Net node, Desicion list node, Linear / Logistic node. - Описание проекта
- 1. Обеспечена возможность сбора большого массива данных из ряда разнообразных источников: более 40 Тб данных загружено в систему хранения неструктурированных данных; 2. Обеспечена возможность обработки данных и построения аналитических моделей; 3. Обеспечена возможность сопоставления данных о клиентах с целью идентификации уникальных пассажиров: выделено более 30 млн уникальных клиентов; 4. Произведена сегментация по более 200 атрибутам; 5. Обеспечено хранение клиентского профиля в оперативной базе данных с целью предоставления информации по клиентам внешним системам в режиме реального времени с минимальной (менее 0.5 с) задержкой; 6. Разработана методика определения средней стоимости перелета по направлениям авиалиний: на основе сопоставления полетной информации и анализа данных о бронировании будет реализована аналитическая модель, которая позволит вычислить среднюю стоимость перелета (в том числе по направлениям авиалиний и в разрезе по классам бронирования); 7. Реализована возможность скоринга предложений для соответствующей сегментации с возможностью запуска маркетинговых кампаний; 8. Реализован алгоритм, позволяющий фиксировать участие каналов в коммуникационном процессе, предшествующем покупке каждого клиента (или кластера), а также увеличение числа новых уникальных клиентских записей при осуществлении медийной активности, в т.ч. офлайн. Предоставлена возможность учета вклада каждого канала в воронке продаж различных клиентских групп для последующей оценки эффективности и маркетинговой оптимизации.
- География проекта
- Клиенты Аэрофлота по всему миру.