Российское облако для Тотального диктанта

Заказчик
Тотальный диктант
Руководитель проекта со стороны заказчика
ИТ-поставщик
ООО «Сервионика»
Год завершения проекта
2018
Сроки выполнения проекта
Январь, 2018 — Апрель, 2018
Масштаб проекта
120 человеко-часов
150000 автоматизированных рабочих мест
Цели

Тотальный диктант — всемирная образовательная акция, один из самых масштабных культурно-образовательных проектов. С каждым годом онлайн-аудитория диктанта растет как количественно, так и по региональному охвату. В 2018 году она увеличилась на 25 % по сравнению с 2017 годом.

С учетом постоянного роста онлайн-аудитории перед ИТ-специалистами была поставлена задача обеспечить надежную работу сайта totaldict.ru, а также экономичность и простоту управления ИТ-инфраструктурой. Особенностью проекта является значительная разница в уровне нагрузок на сайт: пиковые нагрузки он испытывает только один день в году, во время проведения Тотального диктанта, но именно в этот день любой сбой имеет максимальный резонанс. Инвестировать значительные средства в собственную аппаратную инфраструктуру в таких условиях нерентабельно.

Решением стал переход в облако: с 2016 года Тотальный диктант проводится на базе российского публичного облака на open source платформе OpenStack, которую предоставляет «Сервионика» (ГК «АйТеко»). В 2018 году на платформе была реализована новая ИТ-архитектура, рассчитанная на дальнейший рост нагрузок и новые требования к защите данных.

14 апреля 2018 года Тотальный диктант поставил новые рекорды: он проводился в 76 странах, 24,5 тысячи человек писали его в онлайне, более 120 тыс. человек смотрели трансляции на сайте, а общее количество участников превысило 200 тысяч. ИТ-инфраструктура на базе облачной платформы обеспечила надежную поддержку проекта — онлайн-диктант прошел без сбоев.

Уникальность проекта

Тотальный диктант за 15 лет превратился из локальной инициативы студентов НГУ в масштабное всемирное событие — один из самых известных образовательно-культурных проектов для популяризации русского языка и литературы. Уже третий год подряд он успешно проводится на облачной платформе и стал ярким примером преимуществ использования российских облачных технологий для масштабных международных проектов.

Опыт Тотального диктанта показывает, что интеллектуальный анализ данных, параллельно-последовательные вычисления, стабильная работа и оперативное управление вычислительными ресурсами — задачи, для которых облачная инфраструктура подходит в полной мере.

Опыт применения платформы для масштабных высоконагруженных проектов позволил создать надежную, защищенную, экономичную и легко масштабируемую виртуальную ИТ-инфраструктуру Тотального диктанта, обеспечивая его доступность для участников проекта во всех регионах и часовых поясах.

«В проект вовлечены лучшие люди и новейшие технологии, это придает уверенности в том, что мы будем готовы к существенному росту участников онлайн-диктанта и пользователей сайта totaldict.ru», — Ольга Ребковец, руководитель проекта «Тотальный диктант» (https://clck.ru/EhdAf).

Опыт Тотального диктанта может быть полезен для проектов во всех отраслях, где ключевой задачей является обеспечение поддержки масштабной виртуальной ИТ-инфраструктуры в условиях пиковых нагрузок в течение длительного времени, в том числе — с обеспечением высокого уровня защиты данных. Примерами таких проектов являются распродажи и другие масштабные маркетинговые акции в ритейле и телекоме, онлайн-трансляции популярных событий культуры и спорта на сайтах СМИ, игровые и образовательные сервисы.

Использованное ПО
  • Виртуальная ИТ-инфраструктура на платформе OpenStack
  • Сегмент публичного облака со сверхвысокой скоростью обмена данными между виртуальными серверами: 100 гигабит в секунду
  • ЦОД «ТрастИнфо» уровня TierIII.
Описание проекта

Тотальный диктант — всемирная акция по популяризации русского языка и литературы. Он проходит один раз в год, в один день, одновременно по всему миру. Растет популярность онлайн-формата: в 2018 году аудитория онлайн-участников и зрителей увеличилась почти на 25 % по сравнению с 2017 годом.

В день диктанта тысячи пользователей одновременно заходят на сайт акции и выполняют там множество однотипных действий. С подобными пиковыми нагрузками сталкиваются интернет-магазины во время массовых распродаж вроде «Чёрной пятницы» или сайты по продаже электронных билетов перед выходными и крупными праздниками. Сайт проекта в этот день испытывает пиковые нагрузки практически круглые сутки, особенно при проведении в городах-миллионниках в разных часовых поясах.

Для успеха проекта важно, чтобы сайт работал без сбоев при любых нагрузках:

  • Одним из преимуществ онлайн-участия является возможность сразу узнать свой результат.
  • Диктант не только пишут, но и смотрят: на сайте ведутся онлайн-трансляции с площадок в разных городах.
  • Тотальный диктант выполняет важную социальную функцию создания доступной среды для тех, кто не может приехать на очную площадку по состоянию здоровья или другим причинам.
  • Онлайн-формат дает возможность написать диктант в любой точке мира — даже там, где нет очных площадок.
  • В течение года на сайте диктанта работают онлайн-курсы и справочные ресурсы для участников, партнеров, волонтеров проекта.

В течение года хостинг сайта Тотального диктанта справляется с плановыми нагрузками, и инвестировать в усиление «железной» инфраструктуры и серверов ради нескольких пиковых дней в году — слишком расточительно. Поэтому в 2016 году Тотальный диктант «переехал» на облачный хостинг на платформе, разработанной на базе технологий OpenStack.

Преимущества виртуальной инфраструктуры очевидны:

  • Быстрая адаптация к изменяющимся нагрузкам.
  • Широкий спектр встроенных инструментов управления и мониторинга позволяет контролировать нагрузку на виртуальные машины, гибко и оперативно управлять распределением ресурсов и их объемом.
  • Быстродействие и легкая масштабируемость с учетом всемирного распространения диктанта.
  • Высоко доступная физическая ИТ-инфраструктура на базе ЦОД уровня TierIII.

Переход в облако оправдал себя: облачное решение оказалось максимально надежным и экономичным, обеспечивая любой необходимый объем ресурсов для задач проекта. По итогам диктантов 2016 и 2017 года в начале 2018 года ИТ-команда проекта разработала и протестировала обновленную архитектуру, рассчитанную на существенный рост онлайн-аудитории проекта. Кроме того, было решено разместить проект в сегменте публичного облака со сверхвысокой скоростью обмена данными между виртуальными серверами: 100 гигабит в секунду, реализованное на базе облачной платформы «Сервионики».

Виртуальная ИТ-инфраструктура в публичном облаке на базе ЦОД уровня TierIII (доступность 99, 982 %) позволила решить ряд важных инфраструктурных задач Тотального диктанта-2018:

  • Оптимизировать загрузку материалов координаторами в разных городах. По условиям Тотального диктанта, доступ к тексту и видеоматериалам открывался не ранее, чем за 1 сутки до акции. За это время координаторы в разных городах (в 2018 году их было 1021) должны были выкачать с ftp-сервера пакеты объёмом около 4 Гб и раздать по своим площадкам. В прошлые годы это создавало большую нагрузку на сайт и высокие риски сбоев.

Специалисты «Сервионики» предложили три метода скачивания: по протоколам ftp и http, а также с использованием программ для обмена файлами на основе протокола torrent. Третий способ стал самым популярным и снял основную сетевую нагрузку: пользователи фактически скачивали архив друг у друга.

  • Оптимальное распределение нагрузки в разных часовых поясах. Диктант проходит в четырёх временных зонах: для Дальнего Востока и Восточной Сибири, для Центральной и Западной Сибири и Урала, для Центральной России и Европы, а также для Северной и Южной Америки. В трёх поясах проходят онлайн-трансляции из крупных городов. В 2018 году трансляцию вели из Дальневосточного федерального университета, для второй зоны — из аудиторий НГУ, в третьей зоне — из 5 точек в Москве, Санкт-Петербурге и Таллинне.

Как и ожидалось, наибольшая нагрузка пришлась на московский часовой пояс: количество обращений к сайту во время проведения диктанта в этой зоне выросло в 5 раз. Момент наибольшей нагрузки был пройден с лучшими показателями по доступности сайта.

  • Оперативное управление нагрузками в пиковые периоды — плановые и внеплановые. Во время проведения диктанта внеплановый пиковый рост числа онлайн-участников был отмечен во второй временной зоне.

На основе данных мониторинга, используя инструменты балансировки нагрузки и другой типовой функционал управления облачной платформой, до начала онлайн-трансляции из Новосибирска было оперативно проведено динамическое наращивание виртуальных ресурсов, что позволило обеспечить стабильную работу сайта в этой зоне.

География проекта
Более 1000 населенных пунктов в 76 странах на всех континентах – от Антарктиды до Японии. (https://totaldict.ru/about/)
Дополнительные презентации:
SberCloud logo.png
TotalDict_logo_maxresdefault-1.jpg
Сервионика_Благодарственное письмо_Тотальный диктант.jpg
Коментарии: 4

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Александр Артюхов
    Рейтинг: 94
    АО "Организация "Агат"
    Начальник Службы эксплуатации ИТ
    14.12.2018 18:09

    Добрый день!
    Поясните, пожалуйста, в 2016-17 гг. ресурс уже находился в облаке, или же проводились только тестовые испытания, а нагрузка основная ложилась на "железную" инфраструктуру? Не совсем понятно из текста.
    И когда какой-то ресурс "перекочёвывает" в "облако", всегда хочется спросить, а куда девали освободившееся "железо"?

    • Костырева Зоя Александр
      Рейтинг: 212
      Тотальный диктант
      Координатор ИТ-группы по поддержке Тотального диктанта
      28.12.2018 12:09

      Здравствуйте!

      Собственного оборудования у Тотального диктанта нет. Ещё до сотрудничества с Сервионикой мы пользовались выделенными серверами у другого сервис-провайдера, однако по мере роста масштаба проекта эти условия устраивать перестали как по надежности, так и по стоимости. И компания "Сервионика" очень вовремя пришла со своим предложением перенести диктант в облако :)

  • Александр Балабанов
    Рейтинг: 310
    Независимый эксперт в области ИТ-менеджмента и Цифровой трансформации
    CIO
    24.12.2018 21:26

    Зоя приветствую! Как проводилось тестирование решения под высокой нагрузкой? Ведь, как вы и пишите, критерий нагрузки был одним из критичных и рискованных для проекта. Как осуществлялась приемка решения у партнера? Не было ли проблем в телеком-составляющей проекта - в пиковое время работы?

  • Костырева Зоя
    Рейтинг: 212
    Тотальный диктант
    Координатор ИТ-группы по поддержке Тотального диктанта
    27.12.2018 14:52

    Здравствуйте!
    1) Всё нагрузочные тестирования команда Тотального диктанта проводила самостоятельно и силами других подрядчиков – участников данного проекта (QratorLAB, Bitrixoid, IT-Summa).
    Команда Сервионики изначально собрала со всех участников данные по ожидаемой нагрузке и определила требуемые мощности согласно их планам, и оказалась права. Были даны рекомендации по оптимизации нагрузки с точки зрения инфраструктуры. Часть из них были приняты, но не все, ввиду сжатых сроков.

    2) Собственного оборудования у Тотального диктанта нет. Ещё до сотрудничества с Сервионикой мы пользовались выделенными серверами у другого сервис-провайдера, однако по мере роста масштаба проекта эти условия устраивать перестали как по надежности, так и по стоимости. И компания "Сервионика" очень вовремя пришла со своим предложением перенести диктант в облако :)

Предметная область
Отрасль
Управление