Использование систем хранения данных EMC в современной IT-инфраструктуре

Среди тенденций развития IT-инфраструктуры современных предприятий можно выделить 2 заметных тренда – виртуализация практически всех возможных технологических ресурсов, а так же выделение и консолидация определенных ресурсов в отдельные функциональные единицы.

Эти тенденции обусловлены желанием довести до максимума эффективность используемых ресурсов с увеличением специализированного функционала на них. Так, сегодня с помощью технологий виртуализации создаются виртуальные компьютеры и сервера, виртуализуются маршрутизаторы и коммутаторы, брандмауэры и системы предотвращения вторжений, оперативная память, жесткие диски и многое другое. Реальные ресурсы через специальную программную прослойку предстают перед их конечным потребителем уже в виде, не отличимом от реального, но при этом могут быть поделены между множеством таких же потребителей. Примеров консолидации и выделения определенных дочерних ресурсов из материнских так же достаточно много – тут и разделение различных приложений по серверам в целях сбалансированности нагрузки, появление различных устройств со специализированными функциями, такими как контент-маршрутизаторы, системы предотвращения вторжений и др.

В этой статье мы рассмотрим современные системы хранения данных, которые позволяют организовывать выделенное хранение и использование информации со специализированным функционалом по управлению этой информацией. Используя различные технологии в системе хранения данных (далее СХД), мы виртуализируем жесткие диски, которые использует конкретный хост с операционной системой, предоставляя их с необходимыми параметрами производительности и безопасности. СХД позволяют консолидировать хранение информации предприятия на специально выделенных для этого устройствах, отстранившись от конкретных серверов и рабочих станций.

Абстрагировавшись от конкретных реализаций СХД, можно выделить следующие преимущества при их использовании по сравнению с хранением данных на самих серверах и рабочих станциях:
1. Возможность использования большей емкости для хранения информации на каком-либо конкретном сервере.
2. Возможность более эффективного использования пространства на жестких дисках за счет выделения только необходимого дискового пространства каждому серверу.
3. Выполнение всех процессов по организации безопасного хранения данных, не используя ресурсы самих серверов. Обеспечение эффективных систем контроля целостности хранимых данных.
4. Создание различных вариантов резервных копий данных незаметно для серверных процессов.
5. Простая организация систем восстановления данных в случае бедствий и катастроф.
6. Организация централизованной системы управления информацией всей организации.

Важно понимать, когда именно использование СХД дает преимущества перед использованием ряда серверов и распределенным хранением информации на них. Так, если в компании используются 2-3 сервера с объемом информации в 200 Гб без повышенных требований к производительности, то установка выделенной СХД будет явно экономически нецелесообразной. Однако, если серверная база компании насчитывает десятки или сотни единиц техники, то консолидация данных с помощью СХД и виртуализация становятся очень востребованными. В случаях, когда к данным предъявляются повышенные требования по надежности и безопасности, использование СХД также вполне может стать неотъемлемой частью построения IT-инфраструктуры предприятия.

Компания EMC является ведущим поставщиком решений по организации систем хранения и управления данными. Компания обладает широким портфелем продуктов и решений в этой сфере. Мы в данной статье сосредоточимся на продуктах по консолидации данных среднего уровня — VNX, VNXe, CLARiiON, Celerra. В данной статье мы не будем затрагивать флагманскую СХД компании EMC high-end уровня — Symmetrix, с которой начиналась история построения СХД компанией EMC. Описание сложной архитектуры Symmetrix будет для вводного материала о системах хранения данных излишне сложным.

При вынесении хранилища данных из серверов нам необходимо организовывать стыковку внешних СХД с серверами. Тут возможно организовывать доступ к данным как на уровне файлов, так и на уровне блоков данных. При использовании доступа на уровне блоков пользователь получает доступ к логическому диску на СХД с возможностью записи/чтения по блокам так же, как это происходит на локальном жестком диске компьютера. Обмен данными между сервером и СХД происходит по протоколу SCSI, который инкапсулируется в протоколы более низкого уровня. Для этих целей на данный момент используют несколько альтернатив:
1. Сети FibreChannel — FC-SAN.
2. Сети IP — IP-SAN.
3. Сети Ethernet — FСoE вкупе с FC-SAN.

Рис. 1. Пример организации сети хранения данных.

Без углубления в теоретическую часть можно сказать, что с той или иной эффективностью данные протокола SCSI передаются по различным сетям. Так, сети FC-SAN были разработаны и используются специально для соединения серверов с системами хранения данных, позволяя организовать высокоскоростные линки с очень низкими задержками при передаче. Благодаря широкому распространению сетей IP и Ethernet, сегодня активно используются и эти сети для стыковки серверов с СХД. Однако, в силу своей специфики, они зачастую не способны предоставить нужный уровень сервиса, что требует особого внимания при их использовании.

Организация доступа к информации на уровне файлов, как правило, реализуется либо с помощью протокола NFS в средах ОС Linux/*nix, либо с помощью протокола CIFS в средах ОС Windows. Оба способа имеют свою специфику использования, предоставляя доступ для чтения/записи файлов на уже существующей файловой системе СХД. Системы, предоставляющие доступ к информации подобным образом, называются NAS (Network Attached Storage). Для доступа к ним используется сеть IP.

Рассмотрим конкретные реализации систем хранения данных компании EMC. Анонсированные в 2011 году системы VNX/VNXe представляют собой интегрированные СХД, совмещающие в себе возможности доступа как с помощью FC/iSCSI, так и с помощью CIFS/NFS. Помимо этого, в них реализована возможность использования протокола FCoE, позволяющего инкапсулировать протокол Fibre Channel напрямую в кадры Ethernet. Эта передовая технология в сфере современных сетей хранения данных дает возможность интегрировать сеть передачи данных с сетью хранения данных в крупных ЦОДах. Системы VNX/VNXe объединили в себе возможности СХД SAN EMC CLARiiON и систем NAS EMC Celerra, представляя единую унифицированную платформу для хранения и управления данными.

Линейка устройств VNX/VNXe представлена следующими моделями: VNXe 3100, VNXe 3300 (работающими по типу доступа на уровне файлов), VNX 5100 (доступ к данным на уровне блоков), VNX 5300, VNX 5500, VNX 5700, VNX 7500 (унифицированные системы с обоими типами доступа к данным), а также шлюзы NAS VNX VG2 и VNX VG8. Последние два устройства позволяют организовывать NAS сервер путем подключения шлюза VG2/VG8 к сети SAN и транслируя данные из сети SAN в сеть IP по протоколам CIFS/NFS.

Рис. 2. Линейка СХД EMC VNX и VNXe.

В целом все модели этой линейки имеют общий базовый функционал, но отличаются производительностью и масштабируемостью. Кроме этого, модели VNXe по сравнению с моделями VNX имеют ряд ограничений по возможностям репликации и защите данных.

Долгое время система CLARiiON была основным локомотивом и базой для ряда других решений EMC. На базе CLARiiON строились NAS Celerra, виртуальная ленточная библиотека EMC Disk Library. Последняя серия моделей CLARiiON представлена линейкой устройств AX4, CX4-120, CX4-240, CX4-480, CX4-960. Данные системы были первыми в своем классе, которые начали использовать твердотельные накопители уровня энтерпрайз, позволяющие в десятки раз увеличить IOPS (количество операций чтения/записи на диск в секунду). СХД CLARiiON обеспечивает доступ к данным через FC-SAN, IP-SAN с возможностью масштабирования системы до 960 дисков.

Вышеупомянутая система Celerra позволяет организовывать доступ к хранимым данным по протоколам CIFS/NFS, а также через iSCSI. Линейка представлена моделями NX4, NS-120, NS-480, NS-960, NS-G2, NS-G8. Система масштабируется до 960 дисков в своем составе.

Хотелось бы отметить основные отличия систем хранения данных среднего уровня от их аналогов начального уровня. Прежде всего, это производительность, отказоустойчивость и масштабируемость. Так, за счет использования значительного объема кеш-памяти, а также эффективных алгоритмов ее использования, таким системам удается добиться высоких скоростей и производительности по количеству IOPS, что просто крайне необходимо для эффективной работы СХД с десятками и даже сотнями подключенных к ней серверов. Отказоустойчивость обеспечивается различными методиками резервирования практически всех компонентов системы. К масштабируемости можно отнести возможность использования до 1000 дисков на одной системе, способности обслуживать десятки внешних серверов и рабочих станций.

Разберем несколько компонентов и технологий, которые используются в данных системах: флеш-диски, metaLUN, защита целостности информации на уровне блоков.

На сегодняшний день большая часть информации хранится на магнитных жестких дисках, которые используют круглые пластины для чтения и записи данных на них. В силу различных физических и технологических ограничений, количество операций чтения/записи у них не превышает 200 в секунду. Для использования в приложениях с большим количеством одновременных транзакций этот факт становится причиной существенного замедления работы. Решение этой проблемы видится в использовании дисков с флеш-памятью, которые за счет параллельного доступа к чипам памяти позволяют на порядок увеличить количество IOPS. При значительном увеличении количества IOPS одновременно снижается время отклика диска, а также энергопотребление, что так же немаловажно — вспомним, в крупных СХД количество дисков может приближаться к тысяче. Накопители на флеш-памяти появились на рынке уже довольно давно, однако, для их использования в профессиональных системах хранения долгое время существовали такие препятствия, как ограниченное количество циклов записи информации на носитель и ограниченный объем дисков. На сегодняшний момент эти проблемы так или иначе решены, и SSD-диски уже могут использоваться для полноценной замены жестких дисков. В системах VNX используются 100 и 200 Гб SSD-диски. Системы с такими дисками будут прежде всего интересны финансовым организациям, где их IT-системы совершают большое количество одновременных транзакций за небольшой промежуток времени.

Рис. 3. Сравнительные графики SSD флеш-диска и группы жестких дисков со скоростью вращения шпинделя 15 000 об/мин.

Также хотелось бы рассказать о metaLUN и его использовании в СХД. Каждый том, который импортируется с СХД на сервер, называется LUN (Logical Unit Number). При создании LUN мы выделяем для него определенное дисковое пространство. Со временем этого дискового пространства может стать недостаточно. Бывают случаи, когда использование другого тома в системе для хранения информации крайне проблематично или нецелесообразно. Так, если ваша СУБД Oracle хранит файл с данными на определенном томе и места на томе не осталось, вопрос переноса на другой том может стать проблематичным. Технология metaLUN позволяет расширять используемый LUN за счет добавления к нему в СХД других LUN. При этом увеличение объема тома для сервера проходит совершенно прозрачно. После завершения операции по увеличению объема тома на СХД, на сервере с помощью специальных утилит производится расширение партиции на томе, в результате чего операционная система и приложения получают дополнительное пространство для хранения файлов.

Защита целостности хранимой информации является одной из главных задач любой СХД для корпоративного использования. В системах EMC используется несколько методик и технологий по защите данных. Сюда можно отнести использование RAID-массивов разных типов, зеркалирование кеш-памяти, использование специальной партиции для записи кеша в случаях возникновения проблем, специальный резервный источник питания для корректного завершения работы системы. Среди прочих методов защиты в СХД EMC используется специальная разбивка жестких дисков. Каждый блок на жестком диске состоит из 520 байт — 512 байт выделены под данные, оставшиеся 8 байт используются для контрольной суммы. С помощью этого можно контролировать поблочно целостность записанных данных и выявлять проблемные участки в информации.

Технологий, которые используются при работе СХД, довольно много, и одной статьи явно недостаточно даже для беглого знакомства с ними. Тут и различные схемы репликации данных, и тонкости организации различных уровней кеша, и сама физическая организация СХД, и система QoS обработки транзакций записи/чтения. В этой статье я попытался познакомить читателя лишь с некоторыми особенностями работы систем хранения данных на базе оборудования EMC. Ведь только разобравшись во всех тонкостях работы таких систем, можно будет эффективно эксплуатировать их в своей работе.

mars_28_06_2011_3

Автор статьи Андрей Усеинов, CCIE по информационной безопасности, CCSE, системный инженер Mars Solutions, специализируется на проектировании комплексных решений в области информационной безопасности. Компания Mars Solutions — системный интегратор, разрабатывающий и внедряющий интеллектуальные решения в сфере телекоммуникаций и информационных технологий. Защита информации и информационных потоков – одно из приоритетных направлений деятельности компании.

mars_28_06_2011_4

Компания Mars Solutions (http://www.followmars.com) является системным интегратором в области информационных технологий и телекоммуникационных решений на территории стран СНГ и Монголии. Приоритетные направления работы компании – объединенные коммуникации, телефония, ВКС и системы видеонаблюдения, информационная безопасность, системы хранения данных. В нашем штате имеются высококвалифицированные инженеры, в т.ч. Cisco CCIE по информационной безопасности и Cisco CCIE по маршрутизации и коммутации, а также собственная лаборатория с богатым набором оборудования различных производителей.

Orphus system