• Рейтинг рассчитывает взвешенные оценки. Система динамически пересчитывает показатели при каждом новом голосе, учитывая весовые коэффициенты и мультикритериальную оценку. Текущее значение рейтинга может демонстрировать нелинейную динамику.
  • 489

    Опубликовано проектов

  • 217

    Оставлено комментариев

  • 2068

    Количество голосов

← Вернуться к списку

Внедрение Lakehouse-платформы Data Ocean Nova в Альфа-Банк

  • Руководитель проекта со стороны заказчика

    Александр Заболоцкий

    Альфа-Банк

    Руководитель дирекции технологических платформ и развития процессов управления данными

  • Категория

  • Номинация

  • Цели

    Импортозамещение старой big data на базе сборки Clouder-a

  • Сроки выполнения

    апрель, 2024 — ноябрь, 2025
  • Год завершения проекта

    2025

  • Масштаб проекта

    10000 человеко-часов
  • Результаты

    В среднем поток изменений данных, загружаемых в Lakehouse, после внедрения Data Ocean Nova составляет 7 000 RPS Upsert операций с продолжительными пиковыми значениями до 15 000 RPS. Больше 200 таблиц загружаются онлайн в режиме Upsert. На данный момент в системе суммарно ~600 Тб сжатых полезных данных в S3. Текущие мощности решения рассчитаны на хранение 2,4 Пб данных в сжатом виде, и с учетом планов 2025-2026 года по миграции Hadoop кластеров и Oracle Exadata в Data Ocean Nova планируется расширение до 6 Пб в течение полутора лет. Производительность объектного хранилища S3 в настоящий момент составляет 45/70 (Put/Get) гигабайт/с, что позволяет обеспечить все бизнес требования большого количества пользователей и сервисов. Объектное хранилище развернуто в отказоустойчивой геораспределенной конфигурации.

  • Уникальность проекта

    Внедрение Data Ocean Nova в IT-инфраструктуру Альфа-Банка позволило решить задачи Real-time Data Hub. Благодаря интеграции Lakehouse-платформы стало возможным получать оперативные изменения из 200+ систем, сократился зоопарк технологий и понизилась стоимость IT-инфраструктуры банка. Данные из разных источников теперь агрегируются в одном хранилище и в едином формате. Пользователи могут обращаться к оперативным данным хаба для проверки гипотез (ad-hoc анализ над real-time ODS) и строить онлайн-отчетность над ODS. Были обеспечены предоставление data-сервисов, обучение моделей и проверка их функциональности.

  • Использованное ПО

    Решение Data Ocean Nova – первая российская Lakehouse-платформа данных нового поколения, представленная отечественным вендором Data Sapience, доказав свою высокую эффективность, было внедрено в инфраструктуру Альфа-Банка на промышленной основе.

    Data Ocean Nova – универсальная Lakehouse-платформа данных нового поколения, представленная вендором Data Sapience. Продукт решает комплексные задачи массивно-параллельной обработки данных. В том числе позволяет создавать и масштабировать оперативные слои данных в реальном времени, бесшовно работать с CRM- и ML-платформами, предоставлять федеративный доступ к базам данных и выступает в качестве виртуального хранилища. Поддерживает on-premise инсталляцию, частное облако и гибридный сценарий использования, а также Multi-tenant развертывание для создания изолированных сред на базе общей инфраструктуры.

  • Решение из каталога Global CIO

    В проекте не используются решения из каталога Global CIO

  • Сложность реализации

    При выборе платформы данных Альфа-Банк руководствовался определенными требованиями. Решение должно поддерживать масштабирование оперативного слоя данных и предоставлять возможность изолирования ресурсов на регламентные процессы и аналитические задачи с поддержкой мультитенантности в одном кластере. Также платформа должна обладать инструментами разработки собственных приложений для работы с данными, иметь высокопроизводительный и высококонкурентный MPP-движок для SQL ELT, решать задачи DWH и Data Lake одновременно. Обновление всех компонент должны быть независимым. Решение должно разворачиваться в окружении Kubernetes, обладать высокой отказоустойчивостью и возможностью гетерогенной работы из коробки. Важным также являлось следование современной архитектурной парадигме разделения compute и storage слоев. Lakehouse-платформа Data Ocean Nova обладает всеми перечисленными требованиями, поэтому выбор банка остановился на ней.

  • Описание

    Начиная с 2023 года Альфа Банк пилотировал и искал платформу больших данных для импортозамещения старой big data на базе сборки Clouder-a. В 2025 г. решение Data Ocean Nova – первая российская Lakehouse-платформа данных нового поколения, представленная отечественным вендором Data Sapience, доказав свою высокую эффективность, было внедрено в инфраструктуру Альфа-Банка на промышленной основе. Среди предпосылок для интеграции можно выделить: потребность в загрузке данных и формирование отчетов в режиме NRT, а также накапливать историю изменений состояния источников при условии, что источники данных нельзя нагружать.

  • География проекта

    Только РФ

Комментировать 10

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Сергей Исаев

    Сергей Исаев

    GlowByte

    Директор по продажам

    Подскажите, что пользователям дал переход на новую платформу?
    Ответить
    • Александр Заболоцкий

      Александр Заболоцкий

      Альфа-Банк

      Руководитель дирекции технологических платформ и развития процессов управления данными

      Добрый, день. Так как вся система развернута в кластере кубернетес, пользователи имеют гарантированные выделенные высичлительные ресурсы для своих групп или бизнес-доменов (вендор называет это мультитенантность). Производительность их функионала теперь зависит только от них самих. Второй момент который они отмечают - разнообразие вычислительных сервисов что позволяет им решить все задачи в одноу платформе без дублирования данных по разным системам
      Ответить
  • Иван  Котляровский

    Иван Котляровский

    СПАО “Ингосстрах”

    Руководитель направления Управления сопровождения урегулирования

    Александр, добрый день! У вас платформа развернута в концепции раздельных вычислений?
    Ответить
    • Александр Заболоцкий

      Александр Заболоцкий

      Альфа-Банк

      Руководитель дирекции технологических платформ и развития процессов управления данными

      Здравствуйте, Иван. Ответ на вопрос - Да. Мы изначально ориентировались на раздельное аппратное обеспечение compute и storage: кластер узлов одного типа для хранения и кластер узлов другого типа для вычислений с общей сетью. При этом все вендорское ПО (и storage и compute) устанваливаются в общем kubernetes кластере.
      Ответить
  • Сергей Черномырдин

    Сергей Черномырдин

    ПАО Магнит

    Руководитель

    Подскажите, какое среднее время задержки данных от источника до приемника в вашем решении?
    Ответить
    • Александр Заболоцкий

      Александр Заболоцкий

      Альфа-Банк

      Руководитель дирекции технологических платформ и развития процессов управления данными

      Мы выдерживаем требования отставания события в lakehouse-систему с отставанием не более 5 мин в пиковые моменнты нагрузки (закрытие операционного дня в основной банковской АБС), но в обычное регламентное время задержки могут быть всего 15 секунд
      Ответить
  • Евгений Вилков

    Евгений Вилков

    Databorn

    IT Director

    Какое количество систем-источников из заявленных 200+ обновляется в настоящий момент в режиме реального времени в целевой платформе?
    Ответить
    • Александр Заболоцкий

      Александр Заболоцкий

      Альфа-Банк

      Руководитель дирекции технологических платформ и развития процессов управления данными

      Добрый день, спасибо за вопрос. В настоящий момент напрямую интегрировано примерно 50 БД источников из планируемых 200. То есть мы напрямую читаем транзаккционные журналы и пишим изменения в lakehouse-платформу данных Data Ocean Nova. Главная АБС интегрированна не напрямую через CDC, а через Kafka так как у нас это было общебанковским решением и оттуда приходит инкремент данных 2 Тб в сутки который фиксируется в платформу раз в 5-10 минут (в зависимости от объекта)
      Ответить
  • Елизавета Рощина

    Елизавета Рощина

    ООО Дата Сапиенс

    PR-менеджер

    Последние лет 5 понятие по-настоящему цифрового банка у меня ассоциируется именно с АБ. Только запуская такие смелые и амбициозные проекты, можно иметь гандикап на конкурентной рынке
    Ответить
    • Александр Заболоцкий

      Александр Заболоцкий

      Альфа-Банк

      Руководитель дирекции технологических платформ и развития процессов управления данными

      Спасибо! Внутри команды банка есть полное взаимопонимание того, что на конкурентном банковском розничном рынке необходимо быть на шаг впереди в плане технологического превосходства в вопросах принятия решений на основе данных.
      Ответить
  • Заказчик

    Альфа-Банк

  • ИТ-поставщик

    Data Sapience

Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.