Экономический рост в стране, активизация конкуренции во многих сегментах рынка, ужесточение требований контролирующих органов заставляют предприятия уделять все больше внимания корпоративным ИТ-системам вообще и системам хранения в частности. Одновременно со взрывным ростом объемов данных наблюдается повышение значимости информации, потеря которой может нанести непоправимый урон бизнесу компании. Как следствие этого, отечественные компании все более продуманно подходят к выбору архитектур и конкретных продуктов для систем хранения.

Компании, работающие сегодня на поприще систем хранения (EMC, HDS, HP, IBM, NetApp и др.) различаются не только составом линейки продуктов, но и своими историческими корнями, определяющими в конечном итоге базовую архитектуру и состав этой линейки. Большинство производителей начинали с производства так называемых «монолитных» массивов, рассчитанных на обслуживание мэйнфреймов в корпоративных центрах обработки данных, потом освоили рынок открытых систем и модульную архитектуру, что позволило им выпустить продукты для среднего бизнеса. Компании, подобные NetApp и 3PAR, начинали с выпуска простых в развертывании и эксплуатации модульных сетевых устройств хранения (не случайно, к примеру, полное название компании NetApp, Network Appliance, переводится как «сетевая приставка»), предназначенных в первую очередь для среднего сектора рынка и открытых систем. Затем в NetApp существенно изменили позиционирование своих продуктов серии FAS (Fabric-Attached Storage), и теперь они продвигаются не просто как «файлеры» (специализированные файловые серверы), а как универсальные системы хранения (Unified Storage), которые поддерживают архитектуры NAS (network attached storage — «подключаемое к сети устройство хранения») и SAN (storage area network — «сеть хранения»). Очевидно, NetApp рассчитывает увеличить свое присутствие в корпоративном секторе. Тем не менее главным «коньком» компании по-прежнему остаются решения категории NAS, которые она разрабатывает почти полтора десятилетия и, несмотря на растущую конкуренцию в этом секторе, пока остается здесь лидером. Не случайно корпорация IBM после попыток продвигать собственную NAS-систему сначала на базе Intel-серверов, а потом и RISC-серверов в прошлом году пошла на заключение OEM-соглашения, которое позволило ей под своей маркой продавать файлеры NetApp. Помимо IBM, продукция NetApp представлена так же в портфеле компании Fujitsu Siemens Computers.

 

Требования растущих компаний

Благодаря высоким темпам роста именно предприятия среднего размера во многом определяют сегодня спрос на отечественном ИТ-рынке. Можно выделить несколько специфичных для таких предприятий требований к решениям по хранению данных.

Начальная стоимость решения. В отличие от крупных корпораций, для средних предприятий стоимость приобретения и владения — один из важнейших критериев выбора решения. С другой стороны, высокие темпы роста и динамичность бизнеса иногда приводят к необходимости многократно наращивать емкость и функциональность системы хранения за время ее эксплуатации.

Стоимость владения. Весьма насущная проблема для отечественных предприятий — поддержка созданной ИТ-инфраструктуры. Возможности систем хранения очень богаты, что ведет к сложности в управлении и обслуживании, а в условиях «кадрового голода» не всегда имеется возможность организовать эффективную техническую поддержку (особенно в отдаленных регионах), а аутсорсинг по различным причинам далеко не всегда возможен. Для средних компаний характерно наличие достаточно компактной ИТ-службы — обычно не практикуется штатная единица инженера, отвечающего за системы хранения.

Выбор технологии консолидации. При построении корпоративной системы хранения данных существует неоднозначность выбора способа доступа к дисковому массиву, что также осложняет жизнь ИТ-менеджеров средних компаний. На сегодняшний день хорошо проработаны два принципиально разных способа консолидации данных — SAN и NAS. Конфигурации SAN могут быть реализованы как на протоколе Fibre Channel, так и на протоколе iSCSI. Первый имеет высокую производительность и хорошо подходит для требовательных к ресурсам приложений, однако он отличается высокой сложностью и стоимостью решений на его основе, что требует значительных затрат на покупку оборудования и обучение специалистов ИТ-отдела. Этих недостатков лишен альтернативный протокол — iSCSI. Эта технология позволяет строить конфигурацию SAN на базе имеющейся инфраструктуры Ethernet, хотя по производительности она уступает Fibre Channel. Каждая из технологий обладает как набором достоинств, так и недостатками, и не всегда легко определить, какую технологию использовать в том или ином случае. Во многих ситуациях заказчику требуется возможность использования нескольких способов доступа.

 

Предложение в ответ на спрос

Все ведущие производители систем хранения, представленные на отечественном рынке, предлагают сегодня свои решения по удовлетворению требований растущих компаний.

NetApp предусматривает единую архитектуру для всех продуктов семейства FAS с использованием специализированной встроенной операционной системы Data ONTAP, что означает совместимость и возможность безболезненного масштабирования и модернизации от самой младшей модели до флагманской. Не требуется производить никаких операций миграции данных — достаточно установить только новый управляющий модуль, и массив превращается в систему классом выше. В результате пользователь защищен от риска, который может возникнуть: через некоторое время возможности наращивания емкости и производительности системы хранения будут исчерпаны и придется приобретать другую, более мощную, что, как правило, предполагает проведение процедуры миграции данных. Стоимость модернизации файлера фактически равна разнице в цене между новым и старым файлером, что позволяет сохранить ранее сделанные инвестиции. Кроме этого, полная совместимость файлеров разного класса позволяет снизить затраты на построение резервных центров данных — если обычно в них ставится та же система хранения, что и на основном центре, то при использовании продуктов NetApp в качестве резервной системы можно применять устройство семейства FAS классом ниже (начального или среднего).

Подобная унификация, по мнению автора, является уникальной — у других поставщиков систем хранения продуктовый портфель сформирован, как правило, из нескольких семейств дисковых массивов, ограниченно совместимых между собой.

Другой особенностью FAS является простота развертывания и управления. Администрировать файлер можно с помощью графического интерфейса или командной строки, а для его обслуживания не требуется специального обучения. (Косвенным подтверждением этого является отсутствие необходимости приобретать вместе с любым продуктом NetApp услуги по пусконаладке; у других ведущих производителей систем хранения это условие является обязательным.)

Наконец, одним из самых важных достоинств решений NetApp является унификация способов подключения хостов к массиву. Сегодня компания активно продвигает свои файлеры как решения для SAN, отказавшись от их позиционирования только как специализированных устройств, ориентированных на файловые сервисы. Все модели FAS сейчас поддерживают доступ к данным как на уровне файлов, так и через применяемый в SAN блочный доступ. Это позволяет консолидировать хранение данных практически для любых задач. При этом протокол Fibre Channel можно использовать для ресурсоемких применений, а в остальных случаях — обеспечить доступ к блочным данным по протоколу iSCSI, что позволит существенно сократить стоимость сети хранения в расчете на порт. iSCSI можно использовать на начальном этапе развертывания сети хранения в небольшой компании: iSCSI дает более чем двукратную экономию средств по сравнению с Fibre Channel. По мере роста задач компании и увеличения нагрузок на системы хранения перейти с iSCSI на Fibre Channel не составит труда. Широкие возможности в части создания снимков и клонов данных позволяет выполнить подобную миграцию безболезненно для приложений.

Ряд других производителей также идет к созданию универсальных систем хранения, но в обратном направлении — постепенно добавляя в массивы, разработанные для работы в конфигурациях SAN, функциональность NAS. К примеру, HDS, которая совсем недавно использовала для реализации этой функциональности файлеры NetApp, теперь самостоятельно предлагает для своих массивов AMS опцию NAS.

Помимо возможности унифицированных подключений, файловая система WAFL и программное обеспечение RAID-DP поддерживают все необходимые функции, свойственные корпоративным системам: виртуализация на уровне RAID и SAN, управление путями доступа, защита данных от изменений (WORM) и т.п. Операционная система Data ONTAP поддерживает разные процессорные платформы (сейчас FAS выпускаются на базе Intel Xeon, AMD Opteron и MIPS, а в прошлом использовались также DEC Alpha), обеспечивая совместимость с файлерами предыдущих модификаций. Data ONTAP позволяет сделать до 255 мгновенных снимков (snapshot) состояния файловой системы. Такие снимки позволяют с помощью функции SnapRestore восстановить состояние файловой системы на определенный момент времени в прошлом; в отличие от других реализаций мгновенных снимков в момент создания они не занимают места на диске. Наконец, функция SnapMirror реплицирует изменения блоков данных между файлерами, соединенными локальными или даже глобальными сетями. Доступен также набор программных средств для обслуживания серверных приложений, реализующий глубокую интеграцию Data ONTAP с системами Oracle, Microsoft SQL Server и Exchange; благодаря этому удается в полной мере уже на аппаратном уровне задействовать функции управления данными, заложенные в приложения.

До недавнего времени Data ONTAP поддерживала только двухузловые конфигурации кластера файлеров, но после выхода версии Data ONTAP GX максимальное число узлов в кластере выросло до 24.

 

Подводные камни

Не стоит утверждать, что файлеры NetApp могут решить все проблемы хранения любого предприятия: каждое преимущество имеет свою цену. В частности, массивы FAS построены на базе стандартных серверных компонентов, в которых реализован пусть и эффективный, но все-таки программный вариант RAID. Можно сказать, что массивы NetApp даже начального уровня «отягощены интеллектом». Однако, имеется определенный круг задач, для которых столь обширная функциональность мешает; к примеру, некоторые наши заказчики заинтересованы в дешевых и функционально простых массивах, а то, что предлагает NetApp, едва ли можно отнести к этой категории.

Увы, не всегда такие заказчики ясно представляют отличие NAS-устройств от обычных файловых серверов на базе Windows или Linux, а потому считают цены на файлеры NetApp неоправданно высокими. Все без исключения массивы семейства FAS от NetApp даже начального уровня поддерживают функциональность высокоуровневых систем, что может стать причиной более высокой стоимости таких систем по сравнению с младшими моделями массивов других производителей.

У программной реализации RAID имеется и технологический минус — повышенные накладные расходы на хранение метаданных. Это значит, что при одинаковом количестве дисков полезная емкость массива NetApp будет меньше, чем у систем, использующих чисто аппаратные RAID-контроллеры. «Монолитные» высокоуровневые массивы в силу особенностей своей конструкции поддерживают больший объем кэш-памяти, что позволяет существенно ускорить обработку транзакций. Поэтому использовать решения NetApp для работы с крупными транзакционными приложениями следует осторожно: чтобы достичь аналогичной «монолитным» системам производительности, может потребоваться несколько систем FAS6000, что иногда затруднено ввиду особенностей внутренней архитектуры приложения.

Стоит упомянуть и еще об одном ограничении — файлеры NetApp не могут обслуживать такие платформы, как AS/400 или AlphaServer (для подобных внедрений единственный путь консолидации — использование протоколов NAS)

***

Решения NetApp подходят для относящихся к сектору быстрорастущего среднего бизнеса предприятий с ИТ-инфраструктурой, базирующейся на открытых системах, для которых крайне важен вопрос надежного хранения и управления данными, а также простоты администрирования. Число таких заказчиков сегодня быстро растет. С другой стороны, по мере повышения уровня зрелости отечественных компаний, на рынке все больше становятся востребованными высокоинтеллектуальные и технологически продвинутые решения, и все меньше заказчиков ориентируются на дешевые и примитивные «дисковые полки», выбранные по принципу минимальной стоимости гигабайта.

В нашей стране первые файлеры появились в начале нынешнего десятилетия. Тогда их приобретали для российских филиалов транснациональные корпорации. Сегодня продукция NetApp востребована и в крупных Internet-компаниях, например, один из российских партнеров NetApp в прошлом году реализовал проект в компании «Яндекс», где были установлены два массива FAS3020 емкостью свыше 50 Тбайт. Также выполнены несколько проектов в геофизических компаниях, конструкторских бюро и медицинских учреждениях. Наша компания в настоящее время внедряет решение но базе дискового массива NetApp FAS у SunWay Group, крупнейшего в стране дистрибьютора фруктов и овощей. В этом проекте дисковый массив входит в инфраструктуру хранения для ERP-приложений SAP.

Юрий Садовенко (YSadovenko@microtest.ru)— руководитель направления вычислительных систем и систем хранения компании «Микротест» (Москва).


 

Линейка продуктов NetApp

Базовая линейка систем хранения NetApp представляет собой три семейства универсальных масштабируемых систем Primary Storage: series 2000 — модели начального уровня FAS250 и FAS270; series 3000 — системы уровня предприятия; series 6000 — системы для решения задач крупных предприятий и центров данных.

Кроме линейки Primary Storage, имеются системы класса Nearline Storage (промежуточное хранилище для организации иерархического хранения, поддержки ILM-решений и резервного копирования), NearStore и VTL (Virtual Tape Library), а также системы виртуализации хранилищ v-Series, позволяющие интегрировать разнородные системы разных производителей. Помимо дисковых систем имеются также устройства кэширования и шифрования трафика сетей хранения.

Системы FAS состоят из дисковых полок и управляющего модуля, на котором установлены процессоры. Для повышения надежности в конфигурации файлера можно использовать два управляющих модуля, объединенные в кластер типа active-active, что обеспечивает почти удвоенную производительность, емкость кэша, дисков и портов ввода-вывода. Возможен одновременный доступ к данным, хранящимся на файлерах, как с Unix/Linux-серверов по протоколу NFS, так и с Windows-серверов по CIFS, с полноценной поддержкой средств инфраструктуры аутентификации Active Directory и NIS. Одновременно система может выступать как полноценный SAN-массив, работающий с протоколами Fibre Channel и iSCSI.


 

Некоторые особенности технологий NetApp

Одна из основных особенностей файлеров NetApp — программная реализация RAID внутри встроенной операционной системы. В качестве базового варианта RAID используется RAID-4 либо RAID-DP. Технология RAID-4 похожа на RAID-5, но под диск контрольных сумм выделяется отдельный физический диск, что позволяет наращивать емкость RAID-массива тома путем установки нового физического диска, не перестраивая при этом весь массив, как это приходится делать в случае использования RAID-5 с ущербом для производительности и надежности. На практике RAID-4 применяют редко из-за того, что обычно производительность массива ограничена быстродействием диска с контрольными суммами — при каждой операции записи требуется обращение к этому диску для записи контрольной суммы. Инженеры NetApp решили эту проблему с помощью специального режима записи журналируемой файловой системы WAFL (Write Anywhere File System), входящей в состав OС Data ONTAP, и оснащения файлеров большой оперативной памятью, используемой в качестве кэша в операциях чтения.

В технологии RAID-DP (diagonal parity), предложенной в развитие RAID-4, используются уже два диска с контрольными суммами, рассчитанные по разным формулам, что позволяет сохранять доступ к данным при выходе из строя даже двух произвольных дисков RAID-массива. В отличие от аналогичной схемы RAID-6, данный вариант RAID не ведет к снижению быстродействия.

Главной особенностью технологии создания «мгновенных снимков» данных в файлерах NetApp является организация записи данных. Запись или изменение данных ведется в очередной свободный блок из пула свободных блоков. Кроме оптимизации процесса записи, дающей выигрыш в случае операций случайной записи, такая схема работы позволяет быстро фиксировать состояние файловой системы в мгновенный снимок. При этом, в отличие от других реализаций этой функции, не происходит переноса данных, не используется дополнительное место и нет необходимости резервировать место под данные снимка.

Схему организации данных на диске можно представить таким образом (рис. а):

Файл FILE001.dat представляет собой таблицу связей на блоки данных A, B, C и D, в которых хранится собственно его содержимое. В момент создания снимка фиксируется состояние таблицы связей файловой системы. Поскольку файловая система не перезаписывает уже записанные блоки до полного их освобождения, а использует для этого блоки из пула свободных, то, сохранив таблицу связей между файлом и его содержимым на момент времени создания снимка, можно получить виртуальную копию данных, хотя при этом физически блоки данных останутся на своих прежних местах.

Теперь, после создания снимка (т. е. копии таблицы связей файловой системы), возникает необходимость выполнить запись в блок D (рис. б). В этом случае Data ONTAP возьмет свободный блок из пула и занесет в него изменения, обновив связь в таблице связей для этого файла. Таким образом, оставив в снимке нетронутыми связи на прежние блоки данных и обновив связи в текущей «файловой таблице», можно одновременно иметь доступ к состоянию файла на момент создания снимка и к текущему его состоянию без необходимости формировать для этого физическую копию данных файла.

Мгновенные снимки доступны не только для чтения, но и для записи (writable snapshot), что вместе с FlashClone (начиная с Data ONTAP 7) удобно использовать как мгновенные копии «боевой» базы данных для отладки и тестирования новых приложений или формирования отчетов. Использование мгновенных отчетов из баз данных Microsoft SQL Server или Oracle, систем Microsoft Exchange и Lotus Notes/Domino осуществляется с помощью группы программ SnapManager. Так, например, с использованием SnapManager for Exchange и Single Mailbox Recovery можно облегчить работу системных администраторов по восстановлению поврежденной почтовой базы Exchange или восстановлению содержимого почтового ящика из снимка.