«Цифровой техлид»: ИИ-агент для управления сложной ИТ-инфраструктурой
«Цифровой техлид» — первый в России ИИ-агент, способный заменить технического лидера в управлении инцидентами внутри сложной виртуализированной инфраструктуры. Внедрение уменьшило время на рутину на 20–50%, ускорило операции до 6 раз и повысило CSI на 14% и NPS на 10 пунктов. Алексей Забродин, технический директор «РТК-ЦОД», рассказал об основных целях проекта, как прошло внедрение, чего достигли и дал рекомендации по реализации схожих проектов.
Спикер: Алексей Забродин, технический директор «РТК-ЦОД»
1. Каковы основные цели проекта?
Главная задача — создать ИИ-агента, который повышает надежность инфраструктуры, снижает зависимость от дефицита экспертизы и переходит от реактивной к проактивной поддержке. Цель в том, чтобы у инженеров появился цифровой техлид — виртуальный эксперт, который участвует в решении задач и постепенно передает знания команде.
2. С какими трудностями столкнулись?
Прежде всего столкнулись с разрозненными, неструктурированными данными, которые нужно было собрать и привести к единому виду. Второй пласт — обучение модели на доменных знаниях: виртуализация, Kubernetes как система оркестрации контейнеров, типовые и нетиповые сценарии эксплуатации. Третья зона — глубокая интеграция с продуктами нашей дочерней компании «Базис»: платформой виртуализации Basis Dynamix, решениями для управления программно-определяемыми хранилищами и сетями, Basis SDS и Basis SDN. Параллельно пришлось решать вопросы безопасности и соответствия требованиям регуляторов. И, наконец, самое тонкое — внедрение в культуру: важно было снять страх замены и показать, что агент усиливает команду, а не конкурирует с людьми.
3. Каких показателей удалось достичь?
Мы фиксируем заметный эффект по ключевым метрикам. Среднее время реакции и восстановления (MTTR) сократилось в 6–10 раз и вышло на уровень 2–5 минут. Число обращений на вторую линию поддержки уменьшилось примерно на 70%. Время адаптации новых сотрудников сократилось на 60% благодаря тому, что агент помогает им осваиваться в продуктах. Уровень автоматизации в создании и поддержке скриптов вырос примерно до 60%. Индекс удовлетворенности клиентов (CSAT) держится на уровне 4,9 из 5. Время простоя инфраструктуры сократилось примерно в шесть раз.
4. Возможности дальнейшего развития?
Мы движемся в сторону цифрового бадди, который помогает сотрудникам в обучении и профессиональном росте. Второе направление — аварийный менеджер, где агент участвует в управлении инцидентами. И третья линия — развитие AIUI и AIGUI: голосовые и текстовые интерфейсы, а также адаптивные пользовательские сценарии, формируемые ИИ.
5. Рекомендации для других команд?
Лучше начинать не с технологии, а с боли — с тех точек, где действительно теряется время и качество. Затем навести порядок в данных: без этого любой ИИ будет работать поверхностно. Мы рекомендуем опираться на RAG, потому что этот подход дает быструю и точную работу модели на базе ваших собственных знаний. И внедрять все поэтапно, начиная с MVP и пилота. Самое важное — воспринимать ИИ как партнера инженера, а не как замену: тогда он действительно становится частью команды.