stringtranslate.com

Распределение данных

В компьютерном хранении данных чередование данных — это метод сегментации логически последовательных данных, таких как файл, так что последовательные сегменты сохраняются на разных физических устройствах хранения.

Пример чередования данных. Файлы A и B по четыре блока каждый распределены по дискам от D1 до D3.

Чередование полезно, когда устройство обработки запрашивает данные быстрее, чем одно устройство хранения может их предоставить. Распределяя сегменты по нескольким устройствам, к которым можно получить доступ одновременно, общая пропускная способность данных увеличивается. Это также полезный метод для балансировки нагрузки ввода-вывода на массив дисков. Чередование используется на дисках в хранилищах избыточных массивов независимых дисков (RAID), контроллерах сетевых интерфейсов , дисковых массивах, различных компьютерах в кластерных файловых системах и сетевых хранилищах , а также в оперативной памяти в некоторых системах.

Метод

Один из методов чередования осуществляется путем чередования последовательных сегментов на устройствах хранения в циклическом порядке с начала последовательности данных. Это хорошо работает для потоковой передачи данных, но для последующего произвольного доступа потребуется знание того, какое устройство содержит данные. Если данные хранятся таким образом, что физическому адресу каждого сегмента данных назначается однозначное сопоставление с конкретным устройством, устройство для доступа к каждому запрошенному сегменту может быть рассчитано на основе адреса, не зная смещения данных внутри полная последовательность.

Могут использоваться и другие методы, при которых последовательные сегменты не сохраняются на последовательных устройствах. Такое непоследовательное перемежение может иметь преимущества в некоторых схемах исправления ошибок .

Преимущества и недостатки

Преимущества чередования включают производительность и пропускную способность. Последовательное временное чередование доступа к данным позволяет кумулятивно умножать меньшую пропускную способность доступа к данным каждого устройства хранения на количество используемых устройств хранения. Повышенная пропускная способность позволяет устройству обработки данных продолжать свою работу без перерывов и тем самым быстрее завершать свои процедуры. Это проявляется в повышении производительности обработки данных.

Поскольку разные сегменты данных хранятся на разных устройствах хранения, отказ одного устройства приводит к повреждению всей последовательности данных. По сути, частота отказов массива устройств хранения равна сумме частот отказов каждого устройства хранения. Этот недостаток чередования можно преодолеть за счет хранения избыточной информации, такой как четность , с целью исправления ошибок. В такой системе этот недостаток преодолевается за счет необходимости дополнительного хранилища.

Терминология

Сегменты последовательных данных, записываемых на диск или считываемых с него перед продолжением операции на следующем диске, обычно называются кусками , страйдами или блоками страйпа , а их логические группы, образующие отдельные чередующиеся операции, называются полосами или страйпами . Объем данных в одном фрагменте (единице страйпа), часто выраженный в байтах, по-разному называется размером фрагмента , размером шага , размером страйпа , глубиной страйпа или длиной страйпа . Количество дисков данных в массиве иногда называют шириной полосы , но оно также может относиться к объему данных в полосе. [1] [2] [3] [4]

Количество данных за один шаг, умноженное на количество дисков с данными в массиве (т. е. глубину полосы , умноженную на ширину полосы , что в геометрической аналогии дает площадь), иногда называют размером полосы или шириной полосы . [5] Широкое чередование происходит, когда фрагменты данных распределяются по нескольким массивам, возможно, по всем дискам в системе. Узкое чередование происходит, когда фрагменты данных распределяются по дискам в одном массиве.

Приложения

Чередование данных используется в некоторых базах данных , таких как Sybase , и в некоторых RAID-устройствах под программным или аппаратным управлением, таких как подсистема IBM 9394 RAMAC Array. Файловые системы кластеров также используют чередование. Автоматическое управление хранилищем Oracle позволяет файлам ASM быть грубыми или мелкими.

Рейд
В некоторых конфигурациях RAID, например RAID 0 , выход из строя одного диска массива RAID приводит к потере всех сохраненных данных. В других конфигурациях RAID, таких как RAID 5 , который содержит распределенную четность и обеспечивает избыточность , в случае сбоя одного диска-члена данные можно восстановить с использованием других дисков в массиве.
LVM2
Чередование данных также может быть достигнуто с помощью управления логическими томами Linux (LVM). Система LVM позволяет регулировать грубость рисунка полос. Инструменты LVM позволят реализовать чередование данных в сочетании с зеркалированием . LVM предлагает дополнительное преимущество кэширования чтения и записи на NVM Express для медленно вращающегося хранилища. У LVM есть и другие преимущества, не связанные напрямую с чередованием данных (например, снимки, динамическое изменение размера и т. д.).
Btrfs и ZFS
Имеет функции, подобные RAID, но с безопасностью целостности фрагментов для обнаружения плохих блоков и дополнительной гибкостью добавления произвольного количества дополнительных дисков. У них есть и другие преимущества, не связанные напрямую с чередованием данных (копирование при записи и т. д.).

Смотрите также

Рекомендации

  1. ^ «Руководство по администрированию хранилища Red Hat Enterprise Linux 6, глава 6. Файловая система ext4» . Красная Шапка . 9 октября 2014 года . Проверено 8 февраля 2015 г.
  2. ^ "mdadm(8) - справочная страница Linux" . linux.die.net . Проверено 8 февраля 2015 г.
  3. ^ «Документация по ядру Linux: настройка RAID» . ядро.орг . 11 ноября 2014 года . Проверено 8 февраля 2015 г.
  4. ^ «Размер блока RAID» (PDF) . xyratex.com . Январь 2008 г. стр. 6–7. Архивировано из оригинала (PDF) 1 августа 2014 года . Проверено 8 февраля 2015 г.
  5. ^ «Глубина страйпа — это размер страйпа, иногда называемый единицей страйпа. Ширина страйпа — это произведение глубины страйпа и количества дисков в чередующемся наборе».