Решение зонтичного мониторинга на базе CЕР (Complex Event Processing)
- Заказчик:
- Ростелеком
- Руководитель проекта со стороны заказчика
- Год завершения проекта
- 2025
- Сроки выполнения проекта
- апрель, 2022 — ноябрь, 2025
- Масштаб проекта
- 33000 человеко-часов
- Цели
-
Сокращение времени устранения аварий и простоя абонентских сервисов за счет повышения точности диагностики и уменьшения времени регистрации инцидентов;
-
Снижение нагрузки на службу мониторинга за счет объединения всех информационных потоков и корреляции событий в «едином окне»;
-
Снижение нагрузки на выездной персонал за счет определения первопричины аварий и исключения дублирующих и «холостых» выездов;
-
Повышение качества и скорости информирования персонала и руководства об аварийных событиях и статусе их устранения;
-
Обеспечение средства сквозного контроля и отчетности по процессу устранения аварий на сети;
-
Повышение качества технической поддержки и ускорение обслуживания клиентов за счет увеличения покрытия доменов сети средствами автоматического централизованного мониторинга.
-
Решение CEP стало федеральным централизованным средством управления аварийными событиями в "Ростелекоме". Решение значительно повысило эффективность службы мониторинга, обеспечило сокращение времени устранения аварий и простоя абонентских сервисов.
Решение обеспечивает покрытие всех доменов и всех уровней сети "Ростелекома", обрабатывая более 7000 событий/мин. Реализованы сквозные интеграции с системами Fault Management, SQM, TTM, NRI, ЦХД, email/messenger. Обеспечено формирование более 1000 параметров по объектам повреждения, сервисам, информированию для дальнейшей аналитики.
Все цели проекта достигнуты в полном объеме, обеспечен рост производительности функции мониторинга в 2,9 раза, сокращено время информирования и обработки аварий в 5 раз.
Уникальность проекта
В настоящее время единственный пример на российском телеком-ландшафте, построенный на отечественном ПО, охватывающий сеть подобного масштаба.
Решение охватывает домен Fault Management и Service Problem Management карты приложений TM Forum.
Охват – вся сеть "Ростелекома".
Примеры мониторинга:
-
Местные сети (уровень доступа и агрегации);
-
Уровень РСПД;
-
Магистральная сеть AS12389;
-
Транспорт PDH/SDH/xWDM (все уровни);
-
Сегменты vIMS, VoIP, ТФОП;
-
Оборудование и платформа IPTV;
-
Сервисные платформы;
-
Системы жизнеобеспечения.
- Использованное ПО
ПО CEP Sceptor, Java, Groovy, РЕД ОС, PostresPRO, HAProxy, RabbitMQ, ReactJS, Delphi.
- Сложность реализации
Сложность реализации обусловлена большим количеством решаемых задач, а также высокими требованиями к производительности Решения:
-
Сбор событийных данных воедино со всех информационных источников в реальном времени;
-
Автоматическое определение зависимостей событий/инцидентов;
-
Автоматическое создание инцидентов о первопричине событий/инцидентов;
-
Расчет метрик инцидентов в реальном режиме времени;
-
Обогащение инцидентов данными из сторонних информационных систем;
-
Диагностика инцидентов посредством выполнения сценариев взаимодействия со сторонними информационными системами и с активным оборудованием;
-
Диспетчеризация инцидентов;
-
Уведомление пользователей и смежных систем об изменении инцидентов;
-
Долговременное хранение архива инцидентов;
-
Формирование отчетов.
Пользователи: более 1000 сотрудников подразделений технического блока.
Количество систем-источников событий: более 200.
Количество обрабатываемых событий: более 7000 событий/мин.
Количество регистрируемых инцидентов: более 10 млн/год.
-
- Описание проекта
Решение зонтичного мониторинга на базе CEP (Complex Event Processing) предназначено для сбора, обработки и корреляции событий, получаемых от различных систем мониторинга и других источников сети "Ростелекома".
Решение CEP является федеральным централизованным средством управления аварийными событиями в Ростелеком.
Основой решения является отечественное ПО — система "Sceptor".
Система "Sceptor" является инструментом учета и корреляции любых событий, собираемых с различных систем. Является информационной шиной, принимающей, обрабатывающей и визуализирующей инциденты. Система "Sceptor" относится к классу систем наблюдения за событиями, происходящими на всех уровнях организации. Обозначаемые как системы CEP (Complex Event Processing) — автоматизированного анализа и обработки множества событий, они реализуют технологию отслеживания, анализа и обработки в режиме реального времени потоковых данных из множества источников событий, идентификацию наиболее значимых событий из их множества с последующей выработкой соответствующих заключений, а также способ быстрой реакции на эти события. Технология сложной обработки событий основана на принципах управления событиями и поддержки реального времени. Особенность технологии состоит в том, что при ее использовании устанавливаются непрерывные запросы, на вход которых подается поток постоянно меняющихся данных из различных источников. Благодаря этому результаты постоянных запросов выдаются с близкой к нулю задержкой. Таким образом, данная технология позволяет решать задачи с высокой скоростью обработки и передачи данных и выдавать результаты с низкой задержкой.
Использование ПО "Sceptor" в решении зонтичного мониторинга позволило обеспечить сбор и обработку данных со всей сети "Ростелекома" без задержек, и достичь всех целей, которые стояли перед проектом внедрения.
- География проекта
РФ, вся сеть "Ростелекома".