Система аналитической отчетности по данным межоператорских расчетов

Заказчик
ПАО «Ростелеком»
Руководитель проекта со стороны заказчика
ИТ-поставщик
"Форсайт"
Год завершения проекта
2020
Сроки выполнения проекта
Январь, 2019 - Август, 2020
Масштаб проекта
100 автоматизированных рабочих мест
Цели

  1. Оптимизировать модель взаимодействия с операторами связи и предоставить инструмент выявления фродового трафика за счет использования в работе прогнозных моделей, инструментов кластерного анализа.
  2. Повысить оперативность подготовки отчетности по межоператорским расчетам.
  3. Пользователи системы могут формировать аналитику перераспределения трафика по кластеру номеров и строить отчеты по международному доходному трафику, с детализацией по контрагентам, формировать прогнозы по показателям


Уникальность проекта

Система обеспечивает решение задач по формированию отчетности, визуализации, прогнозированию, моделированию. В ней используются технологии — Big Data, Data Discovery, геоаналитика, инструменты предиктивной аналитики (моделирование, прогнозирование), инструменты Self-Service BI.

Решение обеспечивает высокую скорость расчетов на больших объемах данных: реализована возможность построения отчета на сырых данных объемом более 5 ТБ, возможно извлечение и хранение в кэше выборок объёмом более 200 Gb.

Решение обеспечивает работу 100 пользователей, позволяет обрабатывать десятки миллиардов строк данных, предоставляет оперативный доступ к нужной информации и сохраняет высокую производительность при выполнении сложных расчетов (возможность анализа данных с учетом 30 показателей, 50 измерений).
Использованное ПО

Система разработана на базе продукта «Форсайт. Аналитическая платформа». В качестве источника информации выступает витрина в СУБД Greenplum. 

Система интегрирована с корпоративным хранилищем данных (DWH).

Сложность реализации

В результате проекта – создана единая информационно-аналитическая система и унифицированное хранилище данных с большим массивом данных (за месяц формируется 5-7 млрд записей о вызовах в сети «Ростелекома». В каждой записи – 126 атрибутов). В системе можно посмотреть данные с детализацией до каждого вызова, начиная с 2016 года. Большой объем данных и инструментарий для их анализа (в т.ч. с помощью средств «продвинутой» аналитики) позволяет настраивать специализированные отчеты, контролировать маржинальность объектов, выявлять фродовый трафик, определять сезонные тренды и учитывать их при прогнозировании объемов продаж по каждой услуге, строить сценарии и планы продаж, контролировать реализацию смежных проектов, связанных с предоставлением голосовых и иных услуг.

Описание проекта
Основная задача проекта – контроль и детальный анализ трафика в сфере B2O. Система обеспечивает сбор данных, контролирует тенденции и отклонения прохождения трафика, формирует аналитическую отчетность. Отчет по трафику формируется в различных разрезах: по филиалам, видам услуг, контрагентам, договорам, с возможностью сопоставления данных в динамике за несколько лет. Пользователи системы могут формировать аналитику перераспределения трафика по кластеру номеров и строить отчеты по международному доходному трафику, с детализацией по контрагентам, формировать прогнозы по показателям.
География проекта
Система охватывает все филиалы компании «Ростелеком».
Дополнительные презентации:



САО-B2O конкурс Global CIO.pdf
Коментарии: 4
  • Алексей Ильин
    Рейтинг: 25
    Adastra
    Генеральный директор
    24.12.2020 17:15

    Расскажите, пожалуйста, используете ли вы какие-либо инструменты мониторинга и контроля качества данных. Если да, то насколько это уникальные для данного проекта средства, либо используете что-то стандартное.

  • Алексей Кулешов
    Рейтинг: 92
    ПАО Ростелеком
    Директор программ
    30.12.2020 17:27

    Алексей, спасибо за вопрос!

    Для контроля качества данных применяется несколько типов проверок:
    • ряд технических проверок, выполняемых во время и по факту загрузки данных, цель которых убедиться, что тот или иной этап механизма загрузки отработал корректно;
    • предварительный контроль данных на некоторых системах-источниках;
    • проверки, выполняемые по факту загрузки – контроль наличия записей с незаполненными атрибутами, контрольная проверка объемов стоимостных и натуральных показателей в разрезе услуг и региональных филиалов. Сформирован ряд метрик и контролей, переданный сотрудникам эксплуатации системы;
    • контроль и мониторинг доступности БД GP, на основании которого выявляются возможные проблемы, которые могли произойти в процессе ежедневных загрузок.

  • Максим Часовиков
    Рейтинг: 1020
    МГУ имени М.В.Ломоносова, Центр цифровой экономики
    Заместитель руководителя службы управления проектами
    05.01.2021 22:00

    Интересный проект, но не описаны какие модели и как на основании данных производится выявления фродового трафика. Будут ли эти модели и прогностические подходы совершенствоваться и как? Возможно что в этом как раз могут быть использованы модели машинного обучения.

  • Алексей Кулешов
    Рейтинг: 92
    ПАО Ростелеком
    Директор программ
    18.01.2021 12:43

    Для выявления фродового трафика используется несколько основных сценариев, большинство из них они основаны на несоответствии А и В номеров в пропускаемом трафике уровню договора или другим его условиям. Безусловно, сценарии периодически пополняются сотрудниками, занимающимися выявлением и предотвращением фрода.

Год
Предметная область
Отрасль
Управление