Решение зонтичного мониторинга на базе CЕР (Complex Event Processing)

Заказчик:
Ростелеком
Руководитель проекта со стороны заказчика
Год завершения проекта
2025
Сроки выполнения проекта
апрель, 2022 — ноябрь, 2025
Масштаб проекта
33000 человеко-часов
Цели
  1. Сокращение времени устранения аварий и простоя абонентских сервисов за счет повышения точности диагностики и уменьшения времени регистрации инцидентов;

  2. Снижение нагрузки на службу мониторинга за счет объединения всех информационных потоков и корреляции событий в «едином окне»;

  3. Снижение нагрузки на выездной персонал за счет определения первопричины аварий и исключения дублирующих и «холостых» выездов;

  4. Повышение качества и скорости информирования персонала и руководства об аварийных событиях и статусе их устранения;

  5. Обеспечение средства сквозного контроля и отчетности по процессу устранения аварий на сети;

  6. Повышение качества технической поддержки и ускорение обслуживания клиентов за счет увеличения покрытия доменов сети средствами автоматического централизованного мониторинга.

Решение CEP стало федеральным централизованным средством управления аварийными событиями в "Ростелекоме". Решение значительно повысило эффективность службы мониторинга, обеспечило сокращение времени устранения аварий и простоя абонентских сервисов.

Решение обеспечивает покрытие всех доменов и всех уровней сети "Ростелекома", обрабатывая более 7000 событий/мин. Реализованы сквозные интеграции с системами Fault Management, SQM, TTM, NRI, ЦХД, email/messenger. Обеспечено формирование более 1000 параметров по объектам повреждения, сервисам, информированию для дальнейшей аналитики.

Все цели проекта достигнуты в полном объеме, обеспечен рост производительности функции мониторинга в 2,9 раза, сокращено время информирования и обработки аварий в 5 раз.

Уникальность проекта

В настоящее время единственный пример на российском телеком-ландшафте, построенный на отечественном ПО, охватывающий сеть подобного масштаба.

Решение охватывает домен Fault Management и Service Problem Management карты приложений TM Forum.

Охват – вся сеть "Ростелекома".

Примеры мониторинга:

  1. Местные сети (уровень доступа и агрегации);

  2. Уровень РСПД;

  3. Магистральная сеть AS12389;

  4. Транспорт PDH/SDH/xWDM (все уровни);

  5. Сегменты vIMS, VoIP, ТФОП;

  6. Оборудование и платформа IPTV;

  7. Сервисные платформы;

  8. Системы жизнеобеспечения.

Использованное ПО

ПО CEP Sceptor, Java, Groovy, РЕД ОС, PostresPRO, HAProxy, RabbitMQ, ReactJS, Delphi.

Сложность реализации

Сложность реализации обусловлена большим количеством решаемых задач, а также высокими требованиями к производительности Решения:

  1. Сбор событийных данных воедино со всех информационных источников в реальном времени;

  2. Автоматическое определение зависимостей событий/инцидентов;

  3. Автоматическое создание инцидентов о первопричине событий/инцидентов;

  4. Расчет метрик инцидентов в реальном режиме времени;

  5. Обогащение инцидентов данными из сторонних информационных систем;

  6. Диагностика инцидентов посредством выполнения сценариев взаимодействия со сторонними информационными системами и с активным оборудованием;

  7. Диспетчеризация инцидентов;

  8. Уведомление пользователей и смежных систем об изменении инцидентов;

  9. Долговременное хранение архива инцидентов;

  10. Формирование отчетов.

Пользователи: более 1000 сотрудников подразделений технического блока.

Количество систем-источников событий: более 200.

Количество обрабатываемых событий: более 7000 событий/мин.

Количество регистрируемых инцидентов: более 10 млн/год.

Описание проекта

Решение зонтичного мониторинга на базе CEP (Complex Event Processing) предназначено для сбора, обработки и корреляции событий, получаемых от различных систем мониторинга и других источников сети "Ростелекома".

Решение CEP является федеральным централизованным средством управления аварийными событиями в Ростелеком.

Основой решения является отечественное ПО — система "Sceptor".

Система "Sceptor" является инструментом учета и корреляции любых событий, собираемых с различных систем. Является информационной шиной, принимающей, обрабатывающей и визуализирующей инциденты. Система "Sceptor" относится к классу систем наблюдения за событиями, происходящими на всех уровнях организации. Обозначаемые как системы CEP (Complex Event Processing) — автоматизированного анализа и обработки множества событий, они реализуют технологию отслеживания, анализа и обработки в режиме реального времени потоковых данных из множества источников событий, идентификацию наиболее значимых событий из их множества с последующей выработкой соответствующих заключений, а также способ быстрой реакции на эти события. Технология сложной обработки событий основана на принципах управления событиями и поддержки реального времени. Особенность технологии состоит в том, что при ее использовании устанавливаются непрерывные запросы, на вход которых подается поток постоянно меняющихся данных из различных источников. Благодаря этому результаты постоянных запросов выдаются с близкой к нулю задержкой. Таким образом, данная технология позволяет решать задачи с высокой скоростью обработки и передачи данных и выдавать результаты с низкой задержкой.

Использование ПО "Sceptor" в решении зонтичного мониторинга позволило обеспечить сбор и обработку данных со всей сети "Ростелекома" без задержек, и достичь всех целей, которые стояли перед проектом внедрения.

География проекта

РФ, вся сеть "Ростелекома".

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.