Гибридные системы хранения данных (Hybrid Flash Storage)
Компания ИТЦ-М предлагает вам купить Hybrid Flash Storage ведущих производителей: NetApp, Dell EMC, Lenovo и Huawei.
В дополнение к массивам хранения мы поставляем такие компоненты, как жесткие диски, оперативную память, контроллеры, блоки питания и дополнительные вентиляторы. Поможем с настройкой и внедрением СХД в ИТ-инфраструктуру вашей компании.
Большинство предприятий используют несколько типов данных, каждый из которых имеет различные приоритеты, которые определяются размером данных и скоростью, необходимой приложениям, имеющим доступ к этим данным. По этой причине большинство крупных центров обработки данных не имеют единого, однородного типа хранилища. Поскольку немногие предприятия могут позволить себе размещать все данные на самых быстрых флэш-накопителях, гибридные массивы, в которых используются как твердотельные накопители (SSD), так и жесткие диски (HDD), являются основным продуктом во многих ЦОД.
Гибридные массивы хранения данных позволяют решать различные приоритетные задачи и снижать затраты за счет объединения различных типов носителей информации. Все чаще речь идет об объединении не только флеш-памяти и жестких дисков, но и многоуровневой флеш-памяти, многоуровневых жестких дисков, ленточных, объектных и облачных хранилищ в единую прозрачную виртуальную инфраструктуру хранения данных, способную поддерживать эффективную производительность всей системы хранения данных на уровне, соответствующем каждому типу данных и приложениям.
Гибридные системы хранения данных
- Гибридные системы хранения данных имеют более низкие начальные капитальные затраты на один гигабайт памяти, чем на флэш-массивы. Это делает их пригодными для приложений с высокими требованиями к хранению данных, например, для резервного копирования и восстановления, а также для простого хранения файлов.
- Обеспечивают прирост производительности в средах с низким уровнем транзакций, где небольшой объем высокоскоростной флэш-памяти может иметь существенное преимущество.
- Плотность хранения у гибридных систем не намного ниже, чем у массива на жестких дисках.
- Производительность гибридных систем хранения может быть непредсказуемой и значительно ухудшаться при интенсивном использовании ресурсов системы хранения данных.
- Несколько приложений могут конкурировать за ограниченные ресурсы флеш-кэша, это может фактически снизить производительность некоторых приложений. Это означает, что на сравнение производительности гибридных систем и флеш-массивов не всегда можно положиться.
Для каких типов данных использовать гибридные системы хранения?
Большие данные в реальном времени, основанные на транзакциях.
Живые данные обычно активны и постоянны; базы данных или другие приложения, использующие данные в реальном времени, будут регулярно передавать данные, поскольку пользователи выполняют поиск, отслеживают продажи или выполняют любые другие действия. Программное обеспечение для автоматического разделения на уровни, как правило, хранит все активные данные на максимально возможном уровне, однако администраторы, возможно, захотят назначить некоторые базы данных, разделы или тома данных, которые должны храниться вместе на определенном уровне, чтобы гарантировать отсутствие задержек при переносе части данных с более низкого уровня, если они неактивны в течение определенного периода времени.
Типичные данные файлового сервера.
Обычные данные, хранящиеся на файловом сервере, включая текст, текстовые редакторы, электронные таблицы и презентации, редко требуют высокой скорости флэш-памяти. После загрузки документа или файла пользовательский ввод обычно может быть измерен в символах в секунду, что не требует времени отклика менее микросекунды. Даже графика, обрабатываемая при создании спецэффектов, трассировки лучей или компилируемых больших программ, будет больше ограничена возможностями ЦП или обработки графики, чем скоростью доступа к данным. Исключения существуют, но они встречаются достаточно редко, и администратор может решить их в индивидуальном порядке.
Потоковые данные.
Поскольку потоковые данные по определению являются предсказуемыми и последовательными, для них не требуются возможности флэш-памяти с малой задержкой и произвольным доступом. Даже потоковые данные, к которым имеют доступ многие пользователи, довольно просто оптимизировать для достижения наилучшей производительности без использования большого количества флэш-памяти. Кроме того, обычно большие размеры файлов и количество передаваемых данных делают потоковые данные большим потребителем пространства для хранения и идеальной целью для хранения данных на более низких уровнях.
Виртуальные системы.
В отличие от потоковой передачи данных, виртуальные серверы и инфраструктура виртуальных рабочих столов (VDI) являются идеальными кандидатами для флеш-массива. Они могут воспользоваться преимуществами флеш-памяти и дедупликации с низкой задержкой, поскольку многие виртуальные машины (ВМ) разделяют высокий процент своего контента с другими ВМ. Например, система VDI со 100 виртуальными машинами Windows может иметь 99% данных, общих для всех виртуальных машин, в результате чего коэффициент дедупликации составляет почти 100: 1, так что 100 виртуальных машин будут занимать немного больше места, чем одна. Флэш-хранилище достаточно быстрое, чтобы поддерживать дедупликацию и выдерживать пиковые нагрузки, типичные для развертываний VDI; например, пользователи входят в систему в 8:00, выходят из системы на обед в полдень, снова входят в систему в 13:00 и снова выходят из системы в 17:00.
Перенос данных между уровнями
Программное обеспечение с автоматическим многоуровневым размещением прозрачно для пользователя и часто для администратора. Два файла, которые появляются в одном каталоге, на самом деле могут находиться на разных уровнях системы хранения или, возможно, даже в разных системах или центрах обработки данных. Программное обеспечение виртуализации хранилища идентифицирует редко используемые файлы и перемещает их в более медленное и менее дорогое хранилище, сохраняя идентификатор, чтобы сообщить системе, где находится файл. Если пользователь открывает этот файл, система автоматически извлекает его из более медленного хранилища и перемещает на более быстрый уровень.
Некоторые из первых автоматизированных многоуровневых систем основывались исключительно на деятельности пользователя. Многие системы используют алгоритмы прогнозирования для переноса связанных данных, а так же перемещают данные на уровне блоков, а не файлов. Таким образом, большой файл, который обычно получает только небольшие изменения к некоторым данным, может оставить основную часть файла в более медленном хранилище. Только блоки, которые часто меняются, сохраняются на более быстром уровне.
Многие факторы могут определять, на каком уровне следует хранить данные, включая соглашения об уровне обслуживания, данные, поиск по которым выполняется только в конце квартала, критические данные, которые должны иметь максимальную избыточность, и данные, требующие экстремального уровня пропускной способности. Эти данные могут быть отнесены к определенным уровням, которые программное обеспечение автоматического многоуровневого хранения не может обрабатывать должным образом самостоятельно.
Гибридные системы хранения обеспечивают достаточную скорость и низкую задержку для многих приложений. Они более сложные, чем системы all-flash или all-HDD, но гибкость и низкая стоимость делают их привлекательными. Администраторы должны быть знакомы с тем, как работают эти системы, и с их возможностями сэкономить своей ИТ-организации значительные суммы денег.