Оказывается, существуют высокопроизводительные СХД, которым не страшны ни вода, ни кувалда, ни кривые руки. 26 ноября 2015 г. в Москве прошла демонстрация работы программно-определяемой платформы EMC ScaleIO, установленной инженерами КРОК на кластере из четырех серверов. На мероприятии было наглядно показано, как в действительности работает распределенная среда хранения данных и что происходит с информацией, если один или несколько серверов с использованием EMC ScaleIO выходят из строя. Победили серверы.
Сама по себе концепция программно-определяемых СХД не нова, но только сейчас на рынке начинают появляться готовые предложения для решения конкретных задач. В частности, с таким решением вышла на рынок корпорация EMC, совместно с которой КРОК предлагает строить корпоративные среды хранения данных повышенной производительности, экономической эффективности и устойчивости.
Долой спецоборудование
Сегодня хранение данных становится все более щекотливым вопросом, потому что объемы информации продолжают расти, закон требует хранить определенные виды архивной информации, а высокопроизводительные специализированные решения класса SAN (Storage Area Network) или NAS (Network Attached Storage) стоят достаточно дорого, а также нуждаются в специальных технологиях подключения, например Fibre Channel. В связи с этим классическое сетевое хранилище, используемое несколькими серверами, сложно масштабировать — для этого требуется новое оборудование и внушительные затраты. В текущих экономических условиях этот вариант не устраивает многих.
Иной подход предлагают программно-определяемые платформы хранения и, в частности, EMC ScaleIO. От других аналогичных решений ScaleIO отличает наличие готовых интерфейсов для интеграции с другим программным обеспечением. Например, как отмечает Вадим Болотнов, директор Центра решений КРОК на базе технологий EMC, ScaleIO очень легко установить на кластере под управлением VMWare vSphere.
Серверы мыли пылесосом, заливая водой…
Но самое главное — для работы ScaleIO не требуется наличие какого-либо специализированного оборудования. Система запускается на любом «железе». В частности, если вы будете использовать его вместе с VMware — везде, где удалось создать пул виртуальных машин, может работать хранилище ScaleIO. Впрочем, на базе ScaleIO можно объединить как виртуальные серверы, так и физические, причем, как утверждает вендор, без ограничений по количеству узлов. «Для серверов, работающих со ScaleIO, нет каких-то конкретных требований, — говорит Вадим Болотнов, — Да, есть матрица совместимости, условия использования процессоров, минимального объема памяти, современных сетевых интерфейсов, но все это можно добавить или заменить. Сервер может быть абсолютно любой».
Надежность и избыточность
Есть, конечно, в новом подходе и вызывающие опасения моменты, такие как проблемы надежности неспециализированного, а порой — старого оборудования. Ведь дорогостоящие хранилища данных от известных брендов отличаются именно гарантией производительности и сохранности данных, чтобы ни произошло. Но, во-первых, они слишком дорогие, учитывая текущие курсы валют, а во-вторых, никто не говорит, что «самодельная» или собранная рукам инженеров КРОК распределенная система на базе ScaleIO будет работать менее стабильно.
Чтобы доказать это, эксперты КРОК соединили четыре сервера в виртуальную систему хранения. На большом экране отображался статус ScaleIO для данной конфигурации. Потом началось действо, которое иначе как вандализмом по отношению к ИТ-оборудованию не назовешь. Серверы начали мыть пылесосом, заливая водой, крушить битой (это особенно понравилось публике), а также выдергивать из них отдельные диски. И система осталась полностью функциональной, даже когда два сервера оказались неработоспособны.
Их пытались «убить» битой…
Нужно понимать, что за надежность такой распределенной среды придется платить ее избыточностью. То есть сохранность данных при выходе из строя половины серверов возможна только в том случае, если применяются специальные схемы дублирования и резервирования RAIDX. И для устойчивости 50/50 придется пожертвовать половиной емкости среды хранения. Если же серверы не такие «старые», можно заложить другие параметры отказоустойчивости, например, при выходе из строя 1/10 или 1/5 всех дисков.
Рывок в производительности
Впрочем, как сообщил Вадим Болотнов, «цена — это только одно из преимуществ программно-определяемых хранилищ данных. За последние годы уровень SDS (Software Defined Storage) серьезно вырос, и в мы убедились, что это действительно зрелые системы, обладающие большими преимуществами». Одним из таких преимуществ оказывается скорость. То есть при работе серверов в одной сети, скажем, 10 GbE, добавление каждого нового сервера дает почти линейный прирост производительности ввода/вывода в секунду (IOPS). Таким образом, в КРОК утверждают, что на 43 серверах компании удалось добиться производительности более чем в 10 млн IOPS.
… имитировали пожар и выдергивали из них отдельные диски…
На практике это можно оценить следующим образом: если у вас есть 10 серверов с 1 ТБ дисками SSD каждый, и для каждого доступна производительность 8 тыс. IOPS, то при отсутствии виртуализации хранения, емкость каждого будет ограничена имеющимся терабайтом и скорость будет определяться физическими параметрами. Тем временем в конфигурации ScaleIO без резервирования скорость увеличивается до 80 000 IOPS, а общая емкость сохраняет все имеющиеся 10 ТБ. При желании можно уменьшить их до 9 ТБ, чтобы предусмотреть выход одного сервера из строя.
Будущее — за распределенным хранением
Представив ScaleIO в таком виде, в котором это ПО работает сегодня, EMC по сути предложили полностью пересмотреть подход к хранению данных. Так, вместо создания SAN или других архитектур хранения возникает возможность использовать собственные емкости серверов для организации единого хранилища с рекордно высокой пропускной способностью. Вся логика распределения нагрузки, восстановления, резервного копирования, оптимизации и балансировки нагрузки уже зашита в ScaleIO, и это является большим плюсом для заказчика. Да, конечно, внедряя ScaleIO, придется потратить больше усилий, чем при установке готовой системы хранения, но зато по итогам будет создана платформа, обладающая широким спектром дополнительных функций, таких как выбор уровня сервиса и отказоустойчивости, QoS для разделения трафика между приложениями и интеллектуальная организация дисков в домены для оптимального хранения информации.
Система осталась полностью функциональной, даже когда два сервера из четырех оказались неработоспособны
«Решение EMC в целом очень интересно и создает достойную альтернативу готовым массивам», — подчеркнул Вадим Болотнов, — В частности, клиенты, которые не хотят самостоятельно собирать и настраивать что-то, теперь могут заказать виртуализацию хранения у системного интегратора и получить инфраструктуру, которую в любой момент можно дополнить любым количеством серверов с новыми дисками. Это принципиально новый подход к расширению корпоративных хранилищ данных».
Источник: Www. cnews. ru