Мониторинг доступности серверов, мониторинг качества услуг от аутсорсера

Заказчик
РесурсТранс
Руководитель проекта со стороны заказчика
ИТ-поставщик
Силами департамента ИТ
Год завершения проекта
2018
Сроки выполнения проекта
Июль, 2017 — Апрель, 2018
Масштаб проекта
960 человеко-часов
2000 автоматизированных рабочих мест
Цели
1)Бизнес оценивает работу ИТ по 1-му показателю
2)Мониторить доступность сервисов предоставляемых внешними подрядчиками

Уникальность проекта

126 серверов, 2000 почтовых ящиков
Использованное ПО
PRTG
Описание проекта
Цель 1)Бизнес оценивает работу ИТ по 1-му показателю 2)Мониторить доступность сервисов предоставляемых внешними подрядчиками Описание В компании более 126 серверов, различные сотрудники и подрядчики отвечают за различные сервисы. Бизнес требует оценивать качество доступности сервисов по 1-му показателю, для этих целей собственными силами департамента ИТ было внедрена система мониторинга серверов и сервисов на базе продукта PRTG. Почта отдана полностью на аутсорсинг как сервис SAAS но возникли проблемы как оценивать доступность данного сервиса, для чего после длительных переговором мы смогли мониторить доступность баз аутсорсера. Проблемы: 1)Большое кол-во серверов с различными ответственными - перекидка ответсвенности на друг-друга 2)Как точно мониторить доступность, бывают косвенные причины 3)Нет четких разграничений ответсвенности Результат 1)Бизнес видит качество предоставления всех сервисов. 2)Общий показатель доступности повысили с 97% до 99,8
География проекта
Россия
Дополнительные презентации:
Мониторинг доступности серверов_ мониторинг качество сервисов предоставляемых от аутсорсера.pptx
Коментарии: 7

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Руслан Айсин
    Управляющая компания Л7
    Начальник службы IT
    27.11.2018 14:41

    Слово "ОУТСОСЕР" поправьте ))

  • Александр Артюхов
    Рейтинг: 95
    Организация "Агат", АО
    Руководитель проекта
    14.12.2018 14:51

    Поясните, пожалуйста, что имеется в виду под "временем реакции"? А также в каких процентах оценивается сокращение простоя: до 0,01% от ... ?

  • Леонид Кушнир
    Рейтинг: 482
    РесурсТранс
    Заместитель генерального директора по ИТ
    14.12.2018 22:44

    время реакции это время которое длиться от начала появления сбоя в системе до обращения внимания специалиста на решение данного сбоя. Здесь подразумевается: что сервис не доступен только в 0,01% времени в мес.

  • Александр Балабанов
    Рейтинг: 310
    Айсберри
    CDO
    21.12.2018 16:35

    Сергей приветствую! Думаю, что все-таки бизнес получил критерий оценки доступности сервисов, но не оценку качества. И вопрос: речь идет о серверах, или сервисах? Каков результат для Бизнеса от того, что он видит доступность 99,80% - ему спокойнее ;)

    • Леонид Кушнир Александр
      Рейтинг: 482
      РесурсТранс
      Заместитель генерального директора по ИТ
      24.12.2018 15:35

      Вопрос идет о серверах и сервисах, не всех сервисах т.к. не все сервисы получается мониторить доступность, но мы как раз сейчас ведем работу по доработке части сервисов, для последующего мониторинга всех сервисов.

  • Роман Кузнецов
    Рейтинг: 420
    Счетная палата РФ
    Начальник отдела проектного управления и экосистемы ДЦТ
    22.12.2018 12:16

    Добрый день!
    Расскажите подробнее про выбор системы мониторинга. Какие критерии были ключевыми при выборе? С какими системами сравнивали? Были ли пилоты?
    Количественный результат проекта – общий показатель доступности. Рассчитывается доступность серверов?
    В презентации зацепился еще за один количественный результат: «Сокращение времени реакции на инцидент до 1 минуты». Если речь идет об автоматической регистрации инцидента, то минута – это частота обмена данными между системами? Если речь идет о реакции сотрудника, то обеспечить реакцию в течении минуты невозможно.

  • Леонид Кушнир
    Рейтинг: 482
    РесурсТранс
    Заместитель генерального директора по ИТ
    28.12.2018 15:34

    Ключевыми критериями было получение необходимых параметров со всего вида оборудования. Сравнивали многие системы и с бесплатными в том числе. Пилоты были. Рассчитывается и доступность серверов, систем хранения и части сервисов. 1-минут - это автоматическое уведомление инженера о сбое работы системы (смс уведомление инженера и регистрация инцидента).

Предметная область
Отрасль
Управление