В принципе все системы хранения данных классифицируется как блочные, файловые или объектные, причем эти термины вытекают из того, как осуществляется доступ к данным в каждом из видов.
По сути, физическое хранилище, в котором хранятся данные, имеет общую характеристику — оно содержит носитель, который может регистрировать наличие или отсутствие битов данных, и не важно, это будет самый медленный жесткий диск или сверхбыстрая флэш-память NVMe. Основное отличие между блочным, файловым и объектным хранилищем — это то, как именно они формируют общие данные из этой элементарной битовой информации.
Большая часть того, что мы знаем о способах хранения данных, основано на концепции файловой системы, которой уже несколько десятилетий.
Файловый и блочный — это методы доступа к хранилищу на основе файловой системы и различаются эти методы своим отношением к ней.
В обоих случаях есть файловая система. Все мы с ними знакомы — FAT и NTFS в Windows, ext в Linux и так далее. Они организуют данные в файлы и папки в древовидной иерархии и указывают путь к файлу, сохраняя при этом небольшой объем метаданных о файле.
Это то, что мы видим снаружи. Но внутри файловая система также обрабатывает адресацию к физическому расположению блоков хранения на самом носителе.
Ключевое различие между файловым доступом/NAS и блочным доступом/SAN заключается в том, что в NAS файловая система находится в самом массиве. Здесь запросы ввода-вывода приложения проходят через файловую систему, находящуюся на аппаратном обеспечении NAS, доступ к которой осуществляется как к тому или диску. В SAN файловая система является внешней по отношению к массиву, и запросы ввода-вывода обрабатываются файловой системой на сервере, при этом для доступа к данным из SAN требуется только информация на блочном уровне.
Системы хранения с блочным доступом — например, развернутые в виде сетевых (SAN) систем — предоставляют только средства для адресации блоков хранения из файловых систем, баз данных и т. д. Когда вы покупаете SAN/блочное хранилище, вы просто покупаете массив хранения и возможность настраивать тома, чтобы сделать их доступными для приложений через файловую систему, находящуюся в другом месте в программном стеке.
SAN позволяют изменять блоки внутри целых файлов, поэтому они очень хорошо подходят для обработки баз данных и транзакций.
Системы хранения с файловым доступом — обычно используемые как сетевое хранилище (NAS) — проще всего понять как противовес вышесказанному. Другими словами, когда вы покупаете устройство NAS или связанный кластер из горизонтально масштабируемых узлов NAS, они поставляются со своей собственной файловой системой, представляя приложениям и пользователям в знакомом формате буквы дисков. Все, что делает SAN, также выполняется в системе NAS, но скрыто.
NAS лучше всего подходит для хранения и доступа к целым файлам и имеет системы блокировки, предотвращающие одновременное изменение и повреждение файлов.
SAN и NAS хорошо подходят для того, что они делают, но имеют недостатки. Древовидная иерархия файловой системы может довольно легко обрабатывать миллионы файлов, но после масштабирования до миллиардов она может начать замедляться.
Объектные системы хранения совсем другое. Они основаны на «плоской» структуре с доступом к объектам через уникальные идентификаторы, что несколько похоже на то, как веб-сайты адресуются в системе доменных имен (DNS). Это отличает их от иерархической древовидной структуры файловой системы.
Системы с объектным доступом обеспечивает огромную масштабируемость. Это потому, что они работают иначе, чем протоколы SAN и NAS. У них нет файловой системы, которая становится громоздкой по мере ее увеличения, но, как и у NAS, изменения происходят на уровне файлов, но без механизма блокировки файлов.
У объектов также есть метаданные, и многие из них потенциально могут быть определены заказчиком. Это означает, что любой атрибут может быть связан с объектом в его метаданных заголовка: приложение, с которым он связан, его характеристики защиты данных, информация о многоуровневости, когда его следует удалить, а также настраиваемые атрибуты, связанные с бизнесом или организацией.
Таким образом, объектное хранилище в высшей степени подходит для аналитики, будучи доступным для поиска в очень больших наборах данных практически по любому атрибуту.
Однако почти всегда данные объектного хранилища не являются строго согласованными, то есть, если вы просматриваете объект, который был недавно изменен, нет гарантии, что это самая последняя копия, если в ней часто вносятся изменения. Напротив, данные SAN и NAS могут быть строго согласованными, с возможностью зеркалирования наборов данных почти в реальном времени и обеспечивая гарантию безопасности.
Кроме того, хранилище объектов не может работать так же хорошо, как SAN, а иногда и NAS, в основном из-за больших служебных заголовков файлов. Оно также не может предложить манипуляцию на уровне блоков суб-файлов, необходимую для работы с базами данных и транзакционной работы, которую может выполнять SAN.
По этим ключевым причинам объектное хранилище лучше всего подходит для больших наборов неструктурированных данных, в которых объекты меняются не так часто.
Флэш-массивы достаточно распространены в средах для работы критически важных приложений, где время отклика и производительность имеет существенное значение. Но если сделать шаг назад к тому, где происходит процесс архивирования, то гибридных систем хранения данных будет достаточно много. Это связано с тем, что обычные жесткие диски сохранили одно преимущество перед твердотельными: емкость. В шпиндельных жестких дисках [...]
Что такое SSD? SSD или твердотельный накопитель, - это тип устройства хранения данных, используемый в компьютерах. Этот энергонезависимый носитель хранит постоянные данные на твердотельной флэш-памяти. Твердотельные накопители заменяют в компьютерах традиционные жесткие диски (HDD) и выполняют те же основные функции, что и жесткие диски. Однако твердотельные накопители значительно быстрее. С твердотельным накопителем операционная система устройства [...]
Петербургская компания – разработчик программного обеспечения RAIDIX совместно с китайской Lenovo создадут новые высокопроизводительные системы хранения данных для операторов связи.
FAS500f - это первый флэш массив компании NetApp, в котором используются твердотельные накопители QLC (Quad-Level Cell). Накопители, сделанные по этой технологии имеют большую плотность записи, это упрощает увеличение их объема, а стоимость оказывается меньше, чем у SSD с «традиционными» ячейками MLC и TLC. Из минусов: более низкая скорость доступа, меньше надежность хранения информации. Бизнесу не [...]
Сетевое хранилище (NAS) - это выделенное файловое хранилище, которое позволяет нескольким пользователям и разнородным клиентским устройствам получать данные с централизованного дискового пространства. Пользователи в локальной сети (LAN) получают доступ к общему хранилищу через стандартное соединение Ethernet. Устройства NAS настраиваются и управляются с помощью служебной программы на основе браузера. Каждый NAS находится в локальной сети как [...]
Блочные, файловые и объектные СХД
В принципе все системы хранения данных классифицируется как блочные, файловые или объектные, причем эти термины вытекают из того, как осуществляется доступ к данным в каждом из видов.
По сути, физическое хранилище, в котором хранятся данные, имеет общую характеристику — оно содержит носитель, который может регистрировать наличие или отсутствие битов данных, и не важно, это будет самый медленный жесткий диск или сверхбыстрая флэш-память NVMe. Основное отличие между блочным, файловым и объектным хранилищем — это то, как именно они формируют общие данные из этой элементарной битовой информации.
Большая часть того, что мы знаем о способах хранения данных, основано на концепции файловой системы, которой уже несколько десятилетий.
Системы хранения с блочным доступом — например, развернутые в виде сетевых (SAN) систем — предоставляют только средства для адресации блоков хранения из файловых систем, баз данных и т. д. Когда вы покупаете SAN/блочное хранилище, вы просто покупаете массив хранения и возможность настраивать тома, чтобы сделать их доступными для приложений через файловую систему, находящуюся в другом месте в программном стеке.
SAN позволяют изменять блоки внутри целых файлов, поэтому они очень хорошо подходят для обработки баз данных и транзакций.
Системы хранения с файловым доступом — обычно используемые как сетевое хранилище (NAS) — проще всего понять как противовес вышесказанному. Другими словами, когда вы покупаете устройство NAS или связанный кластер из горизонтально масштабируемых узлов NAS, они поставляются со своей собственной файловой системой, представляя приложениям и пользователям в знакомом формате буквы дисков. Все, что делает SAN, также выполняется в системе NAS, но скрыто.
NAS лучше всего подходит для хранения и доступа к целым файлам и имеет системы блокировки, предотвращающие одновременное изменение и повреждение файлов.
Объектные системы хранения совсем другое. Они основаны на «плоской» структуре с доступом к объектам через уникальные идентификаторы, что несколько похоже на то, как веб-сайты адресуются в системе доменных имен (DNS). Это отличает их от иерархической древовидной структуры файловой системы.
Системы с объектным доступом обеспечивает огромную масштабируемость. Это потому, что они работают иначе, чем протоколы SAN и NAS. У них нет файловой системы, которая становится громоздкой по мере ее увеличения, но, как и у NAS, изменения происходят на уровне файлов, но без механизма блокировки файлов.
У объектов также есть метаданные, и многие из них потенциально могут быть определены заказчиком. Это означает, что любой атрибут может быть связан с объектом в его метаданных заголовка: приложение, с которым он связан, его характеристики защиты данных, информация о многоуровневости, когда его следует удалить, а также настраиваемые атрибуты, связанные с бизнесом или организацией.
Таким образом, объектное хранилище в высшей степени подходит для аналитики, будучи доступным для поиска в очень больших наборах данных практически по любому атрибуту.
Однако почти всегда данные объектного хранилища не являются строго согласованными, то есть, если вы просматриваете объект, который был недавно изменен, нет гарантии, что это самая последняя копия, если в ней часто вносятся изменения. Напротив, данные SAN и NAS могут быть строго согласованными, с возможностью зеркалирования наборов данных почти в реальном времени и обеспечивая гарантию безопасности.
Кроме того, хранилище объектов не может работать так же хорошо, как SAN, а иногда и NAS, в основном из-за больших служебных заголовков файлов. Оно также не может предложить манипуляцию на уровне блоков суб-файлов, необходимую для работы с базами данных и транзакционной работы, которую может выполнять SAN.
По этим ключевым причинам объектное хранилище лучше всего подходит для больших наборов неструктурированных данных, в которых объекты меняются не так часто.
Related Posts
All-Flash или Hybrid Flash? Какую систему хранения выбрать?
SSD и HDD
Lenovo и RAIDIX вместе создадут высокопроизводительные СХД
Петербургская компания – разработчик программного обеспечения RAIDIX совместно с китайской Lenovo создадут новые высокопроизводительные системы хранения данных для операторов связи.
Флэш-массив с накопителями QLC NetApp FAS500f
Сетевое хранилище (NAS — Network-Attached Storage)