Импортозамещение платформы управления данными Cloudera в Сбере
- Заказчик:
- ПАО «Сбербанк»
- Руководитель проекта со стороны заказчика
- Поставщик
- АО "СБЕРТЕХ"
- Год завершения проекта
- 2024
- Сроки выполнения проекта
- июль, 2023 — декабрь, 2024
- Масштаб проекта
- 350000 человеко-часов
- Цели
-
Обеспечить технологическую независимость от иностранных вендоров Cloudera и Red Hat для сервисов мониторинга и журналирования более 1000 автоматизированных систем банка.
-
Повысить надежность и безопасность сервисов управления данными, которые используются в том числе при проверках ЦБ и в процессах кибербезопасности.
Критерии достижения:
-
ПО для мониторинга и журналирования Platform V Monitor (АО «СБЕРТЕХ») доработано для совместимости с SDP Hadoop (ПАО «Сбербанк») - целевой заменой платформы Cloudera. Функционал импортозамещенного решения не уступает вендорскому и на 100% соответствует повышенным требованиям надежности и безопасности банка.
-
100% серверов с установленным ПО Cloudera HDFS и Red Hat Enterprise Linux (требуется для продуктов Cloudera) переведены на целевые решения: SDP Hadoop и Platform V SberLinux OS Server (АО «СБЕРТЕХ»).
-
При миграции обеспечена 100%-ная сохранность данных.
-
Обеспечены независимость банка от ИТ-решений иностранных вендоров и снижение операционных издержек.
Сокращены риски нарушения работоспособности систем благодаря отказоустойчивым механизмам внутреннего HDFS-решения.
Обеспечено выполнение повышенных требований безопасности к процессам авторизации/аутентификации, шифрования данных, использования внутреннего сервиса хранения секретов (Secman).
Итоговая успешная миграция показала высокий уровень профессионализма и технической зрелости команд АО «СБЕРТЕХ» и ПАО «Сбербанк», а также подтвердила способность российских компаний самостоятельно решать крупные технологические задачи.
Уникальность проекта
Сочетание масштаба:
более 100 000 строк кода,
40 кластеров Hadoop на более, чем 1000 серверов,
более 350 000 человеко-часов,
распределенные команды в офисах Сбера по всей России,
и человекоцентричности:
благодаря способности видеть людей за каждой проектной вехой, за каждым тикетом, за каждым графиком сгорания, мы смогли создать и, главное, поддерживать множество кросс-функциональных связей в 15 командах из 4 крупных департаментов ПАО «Сбербанк» и АО «СБЕРТЕХ»,
на выходе дало объем интеграции внутренних решений и внешней экосистемы технологий, не имеющий аналогов среди отечественных банков.
- Использованное ПО
SDP Hadoop (https://reestr.digital.gov.ru/reestr/1334271/?sphrase_id=5445845)
Platform V Monitor (https://reestr.digital.gov.ru/reestr/936882/?sphrase_id=7164518)
Platform V SberLinux OS Server (https://reestr.digital.gov.ru/reestr/1765429/?sphrase_id=7164541)
- Сложность реализации
Ключевой сложностью проекта являлась необходимость провести масштабную миграцию основного компонента инфраструктуры, сохранив бесперебойную работу критически важных автоматизированных систем. Потребовалось детальное проектирование архитектуры и сценария миграции, а затем - следование требованиям и исправление мельчайших недочетов разработки.
Большое количество зависимостей в дорожной карте превращало любое отклонение от плана в масштабное перепланирование, а большинство решений принималось коллегиально, что требовало серьезного управленческого ресурса.
Отдельным вызовом стали закупка физического оборудования и развертывание инфраструктуры с нуля в сжатые сроки.
- Описание проекта
Работа в проекте велась по нескольким стримам:
Разработка. Целевая платформа для управления данными SDP Hadoop – одна из крупнейших Hadoop-инфраструктур в мире (потребление – более 200 ПБ данных пользователей). Это решение активно использовалось в банке уже на старте проекта, как и прикладное ПО Platform V Monitor. Однако совместимость продуктов требовала
доработок со стороны обеих команд. Также необходимо было следовать развивающимся требованиям безопасности и надежности. Согласование архитектуры, разработка и тестирование заняли более 6 месяцев.
Внедрение целевого решения потребовало около 5 месяцев. Исправления мельчайших недочетов, выявленных при тестировании, были обусловлены высокой ценой потери критичных данных. Одним из удачных решений этого этапа стала практика «гемба»: смежные команды не просто передавали друг другу важные результаты работ, но совместно проходили путь внедрения. Это позволяло экономить время на выяснении «есть ли проблема?» и сразу приступать к ее решению.
Тираж занял также 5 месяцев и был завершен в декабре 2024 г. Команда сопровождения сервисов журналирования и мониторинга обеспечила миграцию без влияния на бизнес-процессы своих пользователей.
Подготовка инфраструктуры шла параллельно и включала себя
Закупку. Для миграции ПО требовалось подменное оборудование (физические сервера) с повышением отказоустойчивости и кратным уменьшением риска потери данных. Поставка в сроки проекта оказалась амбициозной задачей, с которой удалось справиться благодаря оперативному контролю и нестандартным решениям внутреннего управления инфраструктурой (например, переговорам с другими проектами, ожидавшими такое же оборудование).
Развертывание кластеров hadoop «с нуля», что подразумевало выход в новые сегменты хранения данных со своими требованиями надежности и безопасности. Всего команда сопровождения SDP Hadoop развернула 40 кластеров на более, чем 1000 серверов CPU 64/ RAM 512 GB / HDD 72TB.
Управление проектом осуществлялось централизованно из проектного офиса Программы Импортозамещения при поддержке проектных офисов департаментов банка и АО «СБЕРТЕХ». Включало в себя:
- Согласование и утверждение годовых и квартальных целей,
- Разработку и актуализацию интегрального плана (дорожной карты) проекта и детальных планов стримов,
- Организацию Рабочей группы с представителями всех команд и еженедельные встречи,
- Создание Управляющего комитета уровня начальников департаментов и проведение встреч раз в 2 недели для обсуждения статуса, эскалаций и принятия решений.
Еще на старте проекта стало понятно, что выстраивание коммуникаций – залог успеха такой сложной структуры. Много времени было инвестировано в модерацию обсуждений по спорным вопросам и обеспечение участия всех заинтересованных сторон. Представительство участников Рабочей группы требовало больших временных затрат, но позволяло решать многие вопросы практически онлайн.
- География проекта
Офисы Сбера по всей России