Решение зонтичного мониторинга на базе CЕР (Complex Event Processing)

Компания Ростелеком создала «единое окно» для тысяч сбоев. Результат: время информирования и обработки аварий снизилось в 5 раз, а нагрузка на инженеров сократилась. Интеграция 200+ систем и рост производительности функции мониторинга в 2.9 раза - ответ на любую сложность.

Хотите такой же прорыв? Читайте подробный разбор проекта и берите на вооружение!

Виталий Трепыхалин, вице-Президент по развитию информационных систем, ПАО «Ростелеком»

Спикер: Виталий Трепыхалин, вице-президент по развитию информационных систем, ПАО «Ростелеком»

Блицинтервью:

Каковы основные цели вашего проекта?

  • Сокращение времени устранения аварий и простоя абонентских сервисов за счет повышения точности диагностики и уменьшения времени регистрации инцидентов
  • Снижение нагрузки на службу мониторинга за счет объединения всех информационных потоков и корреляции событий в «едином окне»
  • Снижение нагрузки на выездной персонал за счет определения первопричины аварий и исключения дублирующих и «холостых» выездов
  • Повышение качества и скорости информирования персонала и руководства об аварийных событиях и статусе их устранения
  • Обеспечение средства сквозного контроля и отчетности по процессу устранения аварий на сети
  • Повышение качества технической поддержки и ускорение обслуживания клиентов за счет увеличения покрытия доменов сети средствами автоматического централизованного мониторинга

С какими основными трудностями вы столкнулись в процессе реализации?

Специфика группы компаний Ростелеком, связанная с большим количеством слияний и поглощений, обуславливает многообразие и разнородный характер управляемых сетей.

Все эти особенности и разнообразие оборудования и систем управления и мониторинга необходимо было учесть при внедрении зонтичного решения.

Кроме того, большой поток собираемых событий, сложные правила корреляции накладывают высокие требования к производительности решения.

Каких ключевых показателей удалось достичь по итогам проекта?

Решение обеспечивает покрытие всех доменов и всех уровней сети Ростелеком. Реализованы сквозные интеграции с системами класса Fault Management, SQM, TTM, NRI, Data Lake, email/messenger.

Проинтегрировано более 200 систем-источников событий.

Обеспечено формирование более 1000 параметров по объектам повреждения, сервисам, информированию для дальнейшей аналитики.

Внедрение решения позволило заказчику обеспечить рост производительности функции мониторинга в 2,9 раза, сократить время информирования и обработки аварий в 5 раз.

Рассматриваете ли вы возможности для дальнейшего развития проекта?

Процесс развития решения не останавливается вместе с окончанием проекта внедрения решения, а только лишь переходит в новую фазу.

Появляются новые источники событий, новое оборудование на сети со своими параметрами мониторинга, добавляются новые правила корреляции событий.

Какие рекомендации вы могли бы дать командам, которые внедряют похожие решения?

Обратить внимание на наше решение и другие ИТ-продукты из витрины Ростелеком https://prosoft-oss.rt.ru/

Среди них есть интересные импортозамещенные OSS-решения в том числе и для мониторинга отдельных доменов сети, а также для выполнения других задач в домене OSS.

Наши продукты, экспертиза и опыт могут быть полезны компаниям, перед которыми стоят задачи импортозамещения подобных западных решений, а также тем, кто внедряет подобные решения впервые.


61

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.