На что следует обращать внимание при выборе центра обработки данных?

21 октября 2014
4

Конечно, можно своими силами построить современный ЦОД, который удовлетворит потребности бизнеса. Для этого нужно, чтобы у компании было свободное помещение с достаточной энергетической мощностью, хорошая команда IТ-инженеров и служба эксплуатации. Но строительство ЦОД занимает длительное время, и задаваться вопросом о его строительстве надо за полтора года до того, как он понадобится. Но главное — строительство собственного ЦОД требует существенных финансовых вложений, которые не каждая компания может себе позволить. Поэтому многие обращаются к профессиональным поставщикам услуг дата-центров.

Для каждого вида бизнеса выбор ЦОД будет зависеть от задач, которые он должен решать. Например, для крупных корпораций, уже достаточно давно размещающих серверы в дата-центрах, важны, в первую очередь безопасность и надежность, а также то, что аутсорсинг ЦОД позволяет при смене офиса не перевозить ядро информационной системы и не тратить лишнее время на настройку оборудования, а сразу приступить к работе. Для среднего и малого бизнеса важным моментом при выборе ЦОД является гибкость в выборе количества и объема предоставляемых услуг.

Не менее важно обращать внимание и на технические характеристики дата-центра при его выборе. Это, прежде всего, система электроснабжения, системы охлаждения, автоматическая система пожаротушения, системы безопасности, служба технической поддержки, план действий в чрезвычайных ситуациях, подготовка персонала для предотвращения аварий, профилактический ремонт и техническое обслуживание.

1. Система электроснабжения

При оценке современных центров обработки данных следует исходить из предпосылки, что сети общего пользования не являются надёжным источником электропитания. ЦОД должен быть способен обеспечить автономное гарантированное электропитание ИТ-инфраструктуры своих клиентов. Единственной гарантией надежного и бесперебойного электропитания (и охлаждения) оборудования является соответствие центра обработки данных требованиям к системе параллельного технического обслуживания. Такая система подразумевает возможность производить проверку, техническое обслуживание, ремонт и замену любого из критически важных элементов инженерной инфраструктуры центра обработки данных без остановки и отключения ИТ-нагрузки. Если объект не обеспечивает возможности параллельного техобслуживания систем электропитания и охлаждения, то аварии неизбежны. Вопрос только в том, когда они произойдут?

2. Системы охлаждения

Несмотря на то, что охлаждение оборудования столь же важно, как и его электропитание, зачастую ему уделяют гораздо меньше внимания. Плохо спроектированные и некачественно эксплуатируемые центры обработки данных способны обеспечить электропитание при потере городского ввода, чего, к сожалению, нельзя сказать об их системах охлаждения. Это происходит потому, что система охлаждения не была зарезервирована на требуемом уровне избыточности. Так что же случится? Серверы будут без охлаждения, и буквально через считанные минуты их микросхемы начнут плавиться. А это — полная и безвозвратная потеря данных.

Грамотно построенная система климат-контроля ЦОД не только обезопасит его от аварийных ситуаций, но и поддержит должный уровень эксплуатации оборудования, что скажется на длительности его работы.

3. Автоматическая система пожаротушения

Большинство коммерческих центров обработки данных использует машинные залы большой площади, в которых размещается оборудование сразу многих клиентов. И, как правило, в такой ситуации каждому заказчику достаточно сложно держать руку на пульсе всего происходящего в машинном зале. Зачастую, вам будет просто неизвестно, какие работы производятся в стойке, стоящей по соседству с вашей. Может быть, там сваривают оптику, или припаивают контакт? Или, может быть, проводят нагрузочные испытания? И если что-то пойдет не так, то система пожарной сигнализации активирует пожаротушение. При этом ОЧЕНЬ ВАЖНО понимать, какой тип системы используется в центре обработки данных. В нашей системе используется самое современное огнетушащее вещество — NOVEK 1230. Оно способно максимально быстро потушить источник возгорания, и при этом безвредно для людей и оборудования. В большинстве центров обработки данных используется либо вода, либо токсичные газы. Активация любой из таких систем приведет к приостановке оказываемых услуг.

4. Служба технической поддержки

Цель предоставления таких услуг — помощь клиентам в обслуживании их ИТ-инфраструктуры и оборудования. Ключевыми для таких услуг являются чёткая и прозрачная система получения, обработки и исполнения заявок, а также постоянное присутствие на объекте опытных и квалифицированных сотрудников в режиме 24/7/365.

5. Обучение и квалификация персонала

Обучение — важнейший элемент надежности ЦОД. У вас может быть идеальный с технической точки зрения ЦОД, с прекрасно продуманной системой параллельного обслуживания, но причиной подавляющего большинства аварий в центрах обработки данных является человеческий фактор. Важно, чтобы поставщик услуг ЦОД посвящал значительные усилия обучению и отработке практических навыков инженеров, для того, чтобы и ЦОД, и команда, эксплуатирующая его, были одинаково надёжными.

Недавно наша компания получила сертификат системы эксплуатационной устойчивости Tier III Operational Sustainability-Gold от Uptime Institute (пятый подобный сертификат во всём мире). Это стало возможно благодаря обучению наших сотрудников на уровне заводов-изготовителей оборудования. Таким образом, компания DataSpace создала новую группу специалистов по эксплуатации ЦОД с высочайшим уровнем квалификации. В промежуток времени, когда наш объект был уже готов к эксплуатации, но разрешение на ввод всё ещё оформлялось, мы смогли на практике отработать сценарии действий в случае практически любых возможных ситуаций и аварий. Эти тренировки не прекратились и после ввода в эксплуатацию: наша команда продолжает практиковаться и готовиться к любым ситуациям, представляющим потенциальную угрозу для функционирования ИТ-систем наших клиентов.

6. Профилактический ремонт и техническое обслуживание

Профилактический ремонт, фактически, невозможен, если только ЦОД не является параллельно обслуживаемым. Это означает, что любой компонент критически важной инфраструктуры может быть изолирован, отключен, обследован, обслужен, отремонтирован или заменен, и при этом ИТ-системы клиентов не будут затронуты. Единственным способом убедиться в том, что ваш поставщик ДЕЙСТВИТЕЛЬНО способен обеспечить подобный режим эксплуатации объекта является независимый аудит и сертификация на соответствие уровню Tier III со стороны Uptime Institute.

7. Системы безопасности. Надежность ЦОД.

Это самое главное, на что стоит обращать внимание при выборе поставщика услуг ЦОД. Клиенты платят в первую очередь за надежность и безопасность. Физическая безопасность не менее важный элемент, чем среда и условия, в которых функционирует оборудование. Важно, чтобы поставщик услуг ЦОД вкладывал инвестиции во все уровни физической безопасности объекта — от защиты периметра и промежуточной зоны, до инженерных систем обеспечения физической безопасности и внутреннего режима объекта.

Одним из авторитетных показателей надежности ЦОД являются сертификаты Uptime Institute — это международный стандарт во всём, что касается обеспечения максимально высокого коэффициента доступности центров обработки данных четырёх различных уровней Tier. DataSpace выбрала уровень Tier III, так как этот уровень предполагает возможность проведения плановых ремонтных работ и замены оборудования без остановки сервисов, благодаря резервированию всех инженерных подсистем, тем самым обеспечивая доступность на уровне 99.98%.

Для того, чтобы получить сертификаты на проектную документацию (Tier III Design), собственник центра обработки данных должен сначала представить полный пакет проектной документации на рассмотрение экспертов Uptime. После этого компания инспекторов Uptime посещает уже построенный и введенный в эксплуатацию ЦОД с выездным аудитом для того, чтобы подтвердить его полное соответствие ранее сертифицированной документации. На этом этапе у владельца/оператора должен быть готовый объект, построенный в полном соответствии со строгими стандартами Tier III, который способен работать с заявленным уровнем надежности — это обязательные условия для получения сертификата Tier III Constructed Faciliity. Третьим этапом программы сертификации является эксплуатационная устойчивость (Tier III Operational Sustainability), которая подразумевает дополнительные визиты и проверки со стороны специалистов Uptime, направленные на подтверждение того, что структура, процедуры и повседневное функционирование команды эксплуатации дата-центра соответствуют требованиям, необходимым для эксплуатации ЦОДа с заявленным уровнем надежности Tier III. В этом смысле центр обработки данных можно сравнить с коммерческим авиалайнером. Если вы сидите в пассажирском кресле, и вам известно, что проект самолёта был проверен и сертифицирован в соответствии с международными стандартами, то для вас, как для пассажира, это будет весьма обнадеживающей информацией. Теперь представьте себе, что у нас есть два самолёта, оба построенные по одному и тому же сертифицированному проекту, но при этом только один из них прошел дополнительную проверку и сертификацию после сборки, и только пилот сертифицированного авиалайнера получил лётную лицензию высшей категории, подтверждающую его профессиональную надёжность . Какой из них вы выберете? На каком из них вам хотелось бы полететь? Сертификат эксплуатационной устойчивости от Uptime это и есть подобная система сертификация «пилотов» центра обработки данных – команды, эксплуатирующей его каждый день.

В конечном итоге, нужно задать себе два одинаково важных вопроса:

  1. Является ли сейчас этот центр обработки данных объектом, которому я готов доверить свои критически важные ИТ-системы и данные?
  2. Смогу ли я доверить свои критически важные ИТ-системы и данные этому центру обработки данных и через пять лет?

Какие вопросы задают в Вашей компании при выборе поставщика услуг ЦОД? Что для Вас является решающим фактором при этом выборе?

Конкурсные проекты по теме:

Перенос в «облако» ИТ-инфраструктуры компании «Европарт Рус» и организации облачного окружения для 200 рабочих мест

Создание единого информационного пространства на базе Microsoft Dynamics AX, развернутого в корпоративном облаке eCloud

Создание гибридного облака Новолипецкого металлургического комбината

Перевод на облачные сервисы Google сети магазинов «Снежная Королева»

Проект вне конкурса: ЦОД для МТС

7454
Поделиться
Коментарии: 4
  • 24.10.2014 09:32

    Во многом полностью согласен с автором. Описаны все основные моменты, на которые стоит обратить внимание.
    От себя добавлю, что при выборе ЦОД хорошо бы учесть наличие резервной площадки у его провайдера, на которую будет произведено переключение в случае недоступности основной (не важно по каким причинам).
    По сертификации институтом Uptime - вещь полезная при наличии. Однако стоит учесть, что она достаточно дорогая (особенно вторая и третья часть), так что все это ляжет в ценник. Как вариант можно выбрать ЦОД с сертификатом Tier III Design, в котором сам провайдер эксплуатирует свое высококритичное оборудование. То есть раз дизайн проверен и сам провайдер доверяет этому ЦОДу, то и я доверяю.

  • Ольга Мельник
    Рейтинг: 200
    Независимый эксперт
    24.10.2014 20:27

    Вопрос с Tier III - насколько все же это критично для выбора? насколько я знаю, в России таких ЦОДов единицы. И что сертификация "легла в ценник" - это всем понятно. Вопрос - оно того стоит? Видимо, речь идет все же о разных уровнях потребления услуг. И машины бывают разных классов, и отели, и рестораны, и все выбирают свое не по абсолютному "лучше", а по соотношению цена/качество. Надо думать, и с ЦОДами дело обстоит также. И более точный тогда вопрос: насколько массовый этот верхний сегмент, где реально нужна и окупается сертификация?

  • 27.10.2014 15:41

    Про машины, отели и рестораны хорошая аллегория. Как говорится вам шашечки или ехать :)
    Думаю, что сейчас массовый сегмент не готов к переходу в ЦОДы вообще (в любые). Считается проще поднять 1С на отдельно стоящем РС, чем арендовать виртуальную машину у провайдера. Все это живет так до момента потери данных по тем или иным причинам. Тогда-то и происходит созревание до необходимости инвестировать в надежность данных и тут возможны варианты в зависимости от потребностей. Если допускается простой во время закрытия налогового периода, то можно и подешевле площадку арендовать. Если доступность важна, то лучше посмотреть на критерии, которые автор статьи написал.

    Касаемо же сертификата, то тут важнее фактическое состояние дел, нежели бумага. Если сам провайдер серьезный и использует тот же самый ЦОД, то гораздо больше шансов, что он там сделал все надежно. На мой взгляд это золотая середина.

  • Сергей Рассказов
    Рейтинг: 10
    DataSpace
    Президент, Генеральный директор DataSpace
    27.10.2014 16:56

    Уважаемые Коллеги, большое спасибо за комментарии!

    Позволю себе несколько добавлений относительно сертификации. Для компаний, бизнес которых очень чувствителен к простою инфраструктуры ИТ, вопрос сертификации является критичным и мы видим все больше таких запросов. Причем вопрос стоимости сертификации как таковой и стоимость убытков от возможных простоев в большинстве случаев величины несоизмеримые. При этом недостаточно просто правильно спроектировать и получить Tier III Design. Не секрет, что очень часто между хорошим проектом и его реализацией существует большая разница, особенно у нас в стране. Также по статистике подавляющее большинство сбоев в работе центров обработки данных связано с человеческим фактором и именно поэтому только сертификация на Tier III Operational Sustainability-Gold сможет ответить на вопросы надежности не только в теоретическом, но и в прикладном плане. Если кратко, то если вы не хотите идти на компромиссы с надежностью, то лучше не иди на компромиссы и в требованиях по сертификации.

Предметная область
Отрасль
Управление