Внедрение одной из крупнейших в России Платформ Данных

Заказчик:
ВТБ
Руководитель проекта со стороны заказчика
Поставщик
ГК "Иннотех"
Год завершения проекта
2025
Сроки выполнения проекта
ноябрь, 2019 — январь, 2025
Масштаб проекта
1325303 человеко-часа
Цели
  1. Внедрить Платформу Данных на полностью импортозамещенных технологиях

  2. Реализовать отказоустойчивую, масштабируемую и геораспределенную архитектуру повышенной надежности

  3. Реализовать ролевую модель доступа в соответствии с требованиями информационной безопасности без необходимости настройки доступов на уровне хранения данных

  4. Внедрить корпоративные стандарты аналитической Платформы Данных, обеспечивающие унифицированные интерфейсы и правила обмена данными

  5. Снизить общую стоимость владения

Результаты

В рамках цифровой трансформации Банка создана новая Платформа Данных на основе которой разработаны новые продукты, услуги и сервисы и Платформа Данных помогает:

  1. Запускать реферальные продажи и привлекать клиентов

  2. Прозрачно мотивировать сотрудников продаж

  3. Быстрее и надёжнее взаимодействовать с государственными органами

  4. Управлять рисками и точно считать капитал (IRB/ПВР)

  5. Управлять активами и пассивами (ALM)

  6. Формировать обязательную и управленческую отчётность

  7. Точнее скорить клиентов

  8. Эффективнее взаимодействовать с Бюро кредитных историй

  9. Быстро выдавать клиентские справки и выписки

  10. Предотвращать мошенничество и соблюдать AML

  11. Делать CRM-кампании безопаснее

  12. Поставлять данные в модели Искусственного Интеллекта

Уникальность проекта

Проект является одним из крупнейших в России по полноте решения и объемам данных (более 10 ПБ). Реализована первая в стране платформа такого масштаба, обеспечивающая 100% технологический суверенитет на базе отечественных решений.

Помимо решаемых бизнес-задач решены технологические задачи:

  1. консолидация данных из более чем 200 источников

  2. снижение общей стоимости владения

  3. сокращение времени на формирование данных для бизнес-витрин и приложений

  4. создание фундамента для разработки новых продуктов и сервисов

  5. полное исключение санкционных рисков

Использованное ПО

Кластер Arenadata DB, PostgreSQL, Kafka, Prometheus, Grafana, nginx, Airflow, JupyterHub, Elasticsearch, ПАК «Сила СХД», Dremio, ETL Framework (собственная разработка), Arenadata Hadoop, Spark, Hive, Zeppelin, RabbitMQ, PostgreSQL, FluentD, Grafana, Kibana, Elastic search, Платформа репликации Hadoop Sync (собственная разработка), OpenShift, RStudio, DBeaver.

Сложность реализации

В рамках программы было создано более 30 новых информационных систем. Три ключевых системы настолько большие:

  1. Хранилище Данных

  2. Озеро Данных

  3. Оперативный склад данных

что состоят из более 300 подсистем.

Все новые системы и подсистемы Платформы Данных созданы на 100% импортозамещенном технологическом стеке.

В разработке и внедрении которого приняли участие более 2700 специалистов из разных городов России, работавших в составе 250 команд.

Объем данных, обрабатываемых на платформе, превышает 10 Петабайт.

В создание Платформы Данных инвестировано более 1 200 000 чел. часов.

Техническая сложность заключалась в реализации огромного объема бизнес-логики:

  1. 46 млн строк кода

  2. оптимизации алгоритмов обработки больших данных и построении огромного количества моделей ИИ

  3. Ключевым вызовом стала миграция с зарубежных решений на отечественный стек технологий без остановки бизнес-процессов.

Описание проекта
  1. Проект представлял собой масштабную программу по созданию и внедрению централизованной Платформы Данных, призванной заменить унаследованные системы. Технологическим ядром стали три компонента: Централизованное хранилище (Arenadata DB) для сложных аналитических расчетов, Озеро данных (Arenadata Hadoop) для хранения и обработки больших данных и Оперативное хранилище как единая точка входа для данных.

  2. Проект является одним из крупнейших в России по полноте решения и объемам данных (более 10 ПБ). Реализована первая в стране платформа такого масштаба, обеспечивающая 100% технологический суверенитет на базе отечественных решений. На ее основе построено более 30 бизнес-приложений и огромное количество моделей искусственного интеллекта.

  3. Внедрение потребовало консолидации данных из более чем 200 источников, создания сотен интеграционных потоков и написания свыше 46 миллионов строк кода. Проект управлялся по гибридной методологии с горизонтом планирования более 3 лет, использованием ежеквартальных суперспринтов и двухнедельных спринтов. Для обеспечения качества было подготовлено и успешно пройдено более 2,1 миллиона тест-кейсов.

География проекта

Данная инициатива реализована в масштабах национального проекта, что подтверждается как географией ее исполнения — более 2700 специалистов из разных городов России, работавших в составе 250 команд, — так и объемом вложенных ресурсов, превысившим 1 200 000 человеко-часов.

Коментарии: 14

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Дмитрий Турчановский
    Рейтинг: 2074
    ЗН Цифра
    Заместитель Генерального директора по ИТ
    вчера, 14:55

    Добрый день. Одной из целью вы ставили снизить общую стоимость владения, с учетом масштабов проекта полученное решение потребовало значительных инвестиций, а также последующую ежегодную поддержку, в связи с этим напрашивается вопрос, удалось ли достичь поставленную цель, какие параметры используете для расчета?

    • Сергей Федечкин Дмитрий
      Рейтинг: 446
      ВТБ, ПАО
      Директор по управлению проектами
      вчера, 17:04

      Уважаемый коллега, спасибо за ваш важный и глубокий вопрос. Вы абсолютно правы, обозначив кажущийся парадокс между целью снижения общей стоимости владения (TCO) и масштабом первоначальных инвестиций. Отвечая прямо — да, стратегическая цель по снижению TCO была не просто достигнута, а перевыполнена, но эффект носит долгосрочный и комплексный характер.

    • Сергей Федечкин Дмитрий
      Рейтинг: 446
      ВТБ, ПАО
      Директор по управлению проектами
      вчера, 18:01

      Вы затронули крайне важный вопрос долгосрочной жизнеспособности нашей экосистемы. Ключевой принцип, который мы заложили — это «открытое ядро с контролируемыми расширениями». Ядро платформы (Arenadata DB/Hadoop, PostgreSQL) основано на продуктах стратегических отечественных вендоров, с которыми у нас заключены долгосрочные партнерские соглашения о совместной дорожной карте развития. Собственные разработки (вроде ETL Framework и Hadoop Sync) мы сознательно минимизировали, создавая их только там, где не было рыночных аналогов, и они имеют модульную, хорошо документированную архитектуру. Для управления технологическим долгом и совместимостью действует строгий архитектурный комитет, который утверждает все новые версии компонентов и контролирует цикл тестирования на совместимость. Мы также активно участвуем в рабочих группах поставщиков, чтобы наши требования попадали в их бэклоги. Таким образом, мы балансируем между использованием надежной «коробки» и необходимой для уникальных задач кастомизацией.

  • Валерий Левченко
    Рейтинг: 60
    DIS Group
    Руководитель направления PR
    вчера, 17:18

    Здравствуйте! Какая управленческая методология (гибридная, Agile, Waterfall и т.д.) была применена для координации работ в рамках проекта, и как конкретно она помогла балансировать между соблюдением жестких сроков/бюджета и необходимостью гибко реагировать на возникающие вызовы и изменяющиеся требования?

    • Сергей Федечкин Валерий
      Рейтинг: 446
      ВТБ, ПАО
      Директор по управлению проектами
      вчера, 17:23

      Здравствуйте. Для координации работ использовалась гибридная методология, которую мы называем «программным каскадом с адаптивными циклами».На верхнем уровне программа длительностью более 5 лет управлялась по классическим принципам Waterfall: были четко определены и зафиксированы стратегические цели, бюджетное финансирование, архитектурный фундамент и ключевые этапы (майлстоуны) с горизонтом планирования в 3 года. Это обеспечивало стабильность и контроль со стороны стейкхолдеров.

      • Сергей Федечкин Сергей
        Рейтинг: 446
        ВТБ, ПАО
        Директор по управлению проектами
        вчера, 18:02

        Спасибо за вопрос, который затрагивает основу доверия к любой платформе данных. Data Governance был не следствием, а обязательным фундаментом проекта. Ещё до начала массовой миграции мы разработали и внедрили общебанковский глоссарий бизнес-терминов и унифицированные правила описания данных (метаданные). Технически это обеспечивается централизованным каталогом данных, который автоматически собирает технические метаданные из всех компонентов платформы и связывает их с бизнес-атрибутами. Для качества реализован сквозной Data Quality Framework, который в режиме, близком к реальному времени, проверяет ключевые метрики (полнота, консистентность, свежесть) на критичных маршрутах данных.

  • Валерий Левченко
    Рейтинг: 60
    DIS Group
    Руководитель направления PR
    вчера, 17:19

    Добрый вечер! Как была структурирована проектная команда, и какие конкретные инструменты и практики (ежедневные стендапы, совместные рабочие пространства, регламенты) были использованы для обеспечения эффективной коммуникации и синергии между всеми участниками, включая заказчика, исполнителей и ключевых стейкхолдеров?

    • Сергей Федечкин Валерий
      Рейтинг: 446
      ВТБ, ПАО
      Директор по управлению проектами
      вчера, 17:24

      Добрый вечер. Проектная команда была структурирована по гибридному принципу «Программный офис + Дивизиональные потоки + Сквозные гильдии». На вершине — единый программный комитет от заказчика и интегратора. Оперативное управление осуществлял Центр управления программой (ЦУП), который координировал 7 тематических потоков (например, «Миграция данных», «Безопасность», «Разработка ядра») и более 250 кросс-функциональных команд.

  • Валерий Левченко
    Рейтинг: 60
    DIS Group
    Руководитель направления PR
    вчера, 17:19

    Добрый вечер! Какие три наиболее значимых профессиональных или технических вызова возникли в ходе реализации проекта, и какие проактивные или реактивные меры по управлению рисками были предприняты для их успешного преодоления без существенного воздействия на сроки, бюджет или качество итогового результата?

    • Сергей Федечкин Валерий
      Рейтинг: 446
      ВТБ, ПАО
      Директор по управлению проектами
      вчера, 17:25

      Добрый вечер. Три ключевых вызова были следующими:

      1. Технологический суверенитет и миграция без остановки бизнеса. Это был главный риск. Проактивной мерой стало решение о параллельном запуске: мы развернули новую отечественную платформу и наладили непрерывную репликацию и синхронизацию данных со старых систем через собственные инструменты (Hadoop Sync). Это позволило постепенно переводить нагрузки, а не делать «большой взрыв». Риск был заложен в план с самого начала.
      2. Консолидация более 200 разрозненных источников данных..
      3. Координация работы 2700 специалистов и 250 команд.

  • Валерий Левченко
    Рейтинг: 60
    DIS Group
    Руководитель направления PR
    вчера, 17:20

    Какие ключевые показатели эффективности (KPI) были определены на старте проекта для оценки его успешности, и какие количественные или качественные результаты были фактически достигнуты по каждому из этих показателей к моменту завершения всех работ?

    • Сергей Федечкин Валерий
      Рейтинг: 446
      ВТБ, ПАО
      Директор по управлению проектами
      вчера, 17:25

      На старте проекта были определены как бизнес-ориентированные, так и технические KPI. По каждому из них достигнуты значительные количественные результаты:

      1. Снижение общей стоимости владения (TCO): Качественная цель, достигнутая через консолидацию систем (с >200 до 3 ключевых компонентов) и отказ от лицензионных отчислений зарубежным вендорам. Количественный эффект проявился в сокращении сроков разработки новых витрин с недель до дней.
      2. Технологическая независимость
      3. Производительность и масштаб
      4. Надежность и доступность
      5. Бизнес-эффект

  • Валерий Левченко
    Рейтинг: 60
    DIS Group
    Руководитель направления PR
    вчера, 17:20

    В чем заключается основная уникальность и/или инновационность данного проекта в контексте отрасли или внутренних процессов заказчика, и можно ли считать его пилотным или флагманским, задающим новый стандарт для будущих аналогичных инициатив?

    • Сергей Федечкин Валерий
      Рейтинг: 446
      ВТБ, ПАО
      Директор по управлению проектами
      вчера, 17:27

      Основная уникальность данного проекта заключается в его беспрецедентной комплексности, масштабе и успешной реализации в условиях санкционного давления, что позволяет однозначно считать его флагманским, задающим новый отраслевой стандарт.Если конкретизировать, уникальность состоит в одновременном достижении четырех ключевых атрибутов, что до сих пор не было реализовано в России в одном проекте:

      1. Полный технологический суверенитет на национальном уровне.
      2. Бизнес-непрерывность при гигантской миграции.
      3. Конвергенция архитектурных парадигм.
      4. Отраслевой масштаб и тиражируемость.

Год
Предметная область
Отрасль
Управление
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.