Две грани виртуализации СХД

Виртуализация ИТ-инфраструктуры - один из главных способов оптимизации ресурсов «железа». В зависимости от задач виртуализируются все классические компоненты, включая системы хранения данных. Гендиректор компании «Аэродиск» Вячеслав Володкович объясняет, для чего и как виртуализировать СХД, когда стоит, и, самое главное, не стоит это делать.

Разбираемся с терминами

Сегодня существует путаница между двумя понятиями “виртуализация СХД”.

Это происходит потому, что любая система хранения использует в своей работе принцип виртуализации на уровне архитектуры. Так, RAID-массивы дисков обладают всеми признаками виртуализированного хранилища.

Несколько физических дисков представлены пользователю как единое устройство хранения. Физический уровень хранения (сколько дисков используется, какой емкости и т.д.) не виден - работа реализуется с виртуальным хранилищем, которое в консоли управления выглядит как один физический диск.

На базе RAID-групп можно формировать следующий уровень абстракции - логический номер единицы или LUN, который далее отдается хостам. Такие LUN’ы - это в чистом виде виртуализация.

Также в СХД можно создавать пулы емкости и поверх них формировать LUN’ы с уровнем виртуального RAID. Помимо LUN также можно разворачивать и файловые системы, если СХД поддерживает соответствующую функцию.  

Именно эти инструменты имеют в виду, когда говорят, что СХД обладает возможностями виртуализации.

Второй смысл, вкладываемый в понятие “виртуализация СХД”, предполагает задачу, при решении которой несколько систем хранения разных производителей (или одного, но с разным функционалом) нужно объединить в единое пространство с помощью специального ПО в пул доступной емкости.

Он управляется с центральной консоли, а его ресурсы далее отдаются хостам. Физическим хранилищем данных при этом может выступать практически любые устройства или массивы.

Как это работает?

В самом упрощенном виде виртуализация СХД работает так: программное обеспечение для виртуализации «перехватывает» запросы ввода/вывода (I/O) от физических или виртуальных машин и отправляет их в соответствующее физическое местоположение устройств хранения, которые входят в пул.

Слой виртуализации СХД позволяет операционным системам (ОС) и приложениям получать доступ к данным и использовать их в рамках различных практических задач.

Гиперконвергентные или HCI-решения используют виртуализацию хранения в двух вариантах.

Первый реализуется в качестве встроенной файловой системы, когда поверх обычных дисков делается растянутый пул между разными серверами - scale out СХД.

Второй - многие HCI-решения и их файловые системы из-за схожести принципа работы с ПО для виртуализации могут подключать внешние виртуализированные СХД по умолчанию. Принцип “2 в 1” - ГКС плюс сторонние хранилища в одном решении.

Виртуализация: быть или не быть?

Для чего в принципе виртуализировать СХД, если современные решения в этом сегменте отказоустойчивы, производительны, а также, как мы выяснили, уже несут в базовой комплектации виртуализированные компоненты?

Самый главный сценарий виртуализации СХД, популярный в недавнем прошлом, - объединение систем хранения на предприятии в единое пространство: прозрачное, более управляемое и гибкое.

Однако на практике виртуализация для этих задач не прижилась. Оказалось, что каждый элемент ИТ-инфраструктуры имеет свои особенности подключения к виртуализатору, далеко не все элементы совместимы с ним в принципе и т.д.

Также, в итоговом решении в случае возникновения инцидентов и сбоев в работе зачастую оказывалось невозможным выяснить источник проблемы или точку отказа.

Вторая классическая задача виртуализации СХД - строительство высокодоступных метрокластеров на базе виртуализированных ресурсов хранения между несколькими дата-центрами. Виртуализатор позволяет разворачивать scale out хранилище с привлечением любого “железа” на физическом уровне.

Такой подход используется сегодня многими компаниями, хотя широкого распространения он не получил из-за дороговизны, связанной с обеспечением развернутой техподдержки со стороны вендоров и интеграторов.

Помимо этого, подобные решения поставляются производителями active-active хранилищ для развертывания метрокластеров. Целесообразнее заказывать их у одного вендора и экономить на интеграции.

Третий сценарий: продление жизни старой и ненужной техники, на которой хранятся архивные данные, некритичная корпоративная информация и информационные системы. Это оптимальный сценарий для виртуализации СХД, однако здесь необходимо решать задачу ограничений по бюджету.

Поскольку данные и ИТ-системы, виртуализируемые таким образом, не носят характер критически важных, а виртуализация стоит недешево, нужно хорошо просчитывать экономику решения, чтобы не переплатить за ненужный избыточный функционал. То есть, здесь нужны либо крайне доступные решения (их почти нет), либо open source-инструменты.

В рамках этого сценария виртуализации СХД также нередко ставится цель выполнения задачи создания продвинутого функционала по хранению данных. Его реализуют не часто, поскольку это неосновной функционал СХД.

Суммируя, к числу основных преимуществ виртуализации СХД можно отнести:

  • Упрощение управления. Единая консоль управления для мониторинга и обслуживания нескольких виртуализированных массивов сокращает время и ресурсы для управления работой СХД. Эффект особенно выражен в случае, если в пул виртуализации входят решения нескольких производителей.
  • Оптимизация использования ресурсов СХД. Объединение всех доступных ресурсов хранения в пул упрощает их распределение, поэтому они используются более эффективно. При использовании разрозненных систем без объединения их на уровне виртуализации, скорее всего, некоторые элементы системы будут работать на пределе возможностей, а другие могут простаивать.
  • Продление срока службы старой инфраструктуры. Виртуализация позволяет продлить срок службы старых «хранилок», включив их в пул в качестве уровня для обработки архивных или некритически важных данных.
  • Возможность использования продвинутого функционала. Многие передовые возможности СХД - многоуровневое хранение, кэширование и репликация - могут реализовываться только в виртуализованной среде. Единый пул позволяет стандартизировать методы управления всех подсистем и распространить на них возможности применения современного функционала.

Выводы

В любом проекте, где в качестве решения рассматривается виртуализации ресурсов СХД, необходимо помнить, что виртуализация - это дополнительная нагрузка на инфраструктурную основу и снижение производительности основного функционала.

Встроенных инструменты виртуализации СХД вполне хватает для решения почти всех задач по хранению.

Если у компании накопилось очень много старого железа, на котором размещен определенный объем полезных данных, если критически важные ИС размещены на оборудовании с техническими ограничениями для их переноса, если существует перспектива получения реальной бизнес-пользы от их использования, а также в наличии есть команда Linux-инженеров, способных довести это все до ума с помощью open source-инструментов, - только тогда виртуализацию СХД стоит рассматривать как рабочую опцию.

1104
Поделиться
Предметная область
Отрасль
Управление