В дисковом хранилище компьютера сектор — это подразделение дорожки на магнитном диске или оптическом диске . Для большинства дисков каждый сектор хранит фиксированный объем данных, доступных пользователю, традиционно 512 байт для жестких дисков (HDD) и 2048 байт для CD-ROM , DVD-ROM и BD-ROM . [1] Более новые HDD и SSD используют сектора размером 4096 байт (4 КиБ ), которые известны как Расширенный формат (AF).
Сектор — это минимальная единица хранения жесткого диска. [2] Большинство схем разбиения диска разработаны таким образом, чтобы файлы занимали целое число секторов независимо от фактического размера файла. Файлы, которые не заполняют целый сектор, будут иметь остаток своего последнего сектора, заполненный нулями. На практике операционные системы обычно работают с блоками данных , которые могут охватывать несколько секторов. [3]
Геометрически слово сектор означает часть диска между центром, двумя радиусами и соответствующей дугой (см. рис. 1, пункт B), которая имеет форму куска пирога. Таким образом, сектор диска (рис. 1, пункт C) относится к пересечению дорожки и геометрического сектора .
В современных дисковых накопителях каждый физический сектор состоит из двух основных частей: области заголовка сектора (обычно называемой «ID») и области данных. Заголовок сектора содержит информацию, используемую накопителем и контроллером; эта информация включает в себя байты синхронизации, идентификацию адреса , флаг дефекта и информацию об обнаружении и исправлении ошибок. Заголовок также может включать альтернативный адрес, который будет использоваться, если область данных ненадежна. Идентификация адреса используется для того, чтобы гарантировать, что механика накопителя разместила головку чтения/записи в правильном месте. Область данных содержит байты синхронизации, пользовательские данные и код исправления ошибок (ECC), который используется для проверки и возможного исправления ошибок, которые могли быть внесены в данные.
Первый дисковый накопитель, IBM 350 disk storage 1957 года , имел десять 100-символьных секторов на дорожку; каждый символ состоял из шести бит и включал бит четности. Количество секторов на дорожку было одинаковым на всех записывающих поверхностях. Не было записанного поля идентификатора (ID), связанного с каждым сектором. [4]
В дисковом накопителе IBM 1301 1961 года появились секторы переменной длины, [ спорные (поскольку в литературе не используется термин «сектор» для блоков переменной длины) – обсудите ] названные IBM записями или физическими записями , и к каждой записи было добавлено поле адреса записи, отдельное от данных в записи. [5] [6] Все современные дисковые накопители имеют поля адреса сектора, называемые полями идентификатора, отдельные от данных в секторе.
Также в 1961 году Bryant в серии 4000 представил концепцию зонированной записи (ZBR), которая позволяла изменять количество секторов на дорожку в зависимости от диаметра дорожки — на внешней дорожке было больше секторов, чем на внутренней. [7] В конце 1980-х годов ZBR снова стали использовать в дисководах, о которых затем объявили Imprimis и Quantum [8] , а к 1997 году его использование в отрасли стало повсеместным. [9]
Дисковые накопители и другие DASD, анонсированные с IBM System/360 в 1964 году, использовали самоформатирующиеся секторы переменной длины, [ спорный (поскольку в литературе не используется термин сектор для блоков переменной длины) – обсудите ] называемые IBM записями или физическими записями . Они обнаруживали ошибки во всех полях своих записей с помощью циклического избыточного кода (CRC), заменяющего четность посимвольного обнаружения предыдущих поколений. Эти физические записи IBM состоят из трех основных частей: поля Count, которое действует как поле ID, необязательного поля Key для помощи в поиске данных и поля Data; на практике большинство записей не имели поля Key, что обозначалось нулевой длиной ключа. Структура этих трех полей называется форматом дорожки CKD для записи.
Дисковое хранилище IBM 3330 1970 года заменило CRC в поле данных каждой записи на код исправления ошибок (ECC) для улучшения целостности данных за счет обнаружения большинства ошибок и обеспечения возможности исправления многих ошибок. [10] В конечном итоге все поля секторов диска имели ECC.
До 1980-х годов размеры секторов были слабо стандартизированы; дисководы имели максимальное количество бит на дорожку, и различные производители систем подразделяли дорожку на различные размеры секторов в соответствии со своими ОС и приложениями. Популярность ПК, начавшаяся в 1980-х годах, и появление интерфейса IDE в конце 1980-х годов привели к тому, что сектор в 512 байт стал отраслевым стандартом для HDD и аналогичных устройств хранения данных. [11] [ не удалось проверить ]
В 1970-х годах IBM добавила к своей линейке CKD DASD устройства хранения данных с фиксированной архитектурой и прямым доступом (FBA DASD) . CKD DASD поддерживали несколько секторов переменной длины, в то время как IBM FBA DASD поддерживали размеры секторов 512, 1024, 2048 или 4096 байт.
В 2000 году отраслевая торговая организация, Международная ассоциация производителей оборудования и материалов для дисковых накопителей ( IDEMA ), начала работу по определению внедрения и стандартов, которые будут регулировать форматы размеров секторов, превышающих 512 байт, чтобы обеспечить будущее увеличение емкости хранения данных. [11] К концу 2007 года в ожидании будущего стандарта IDEMA компании Samsung и Toshiba начали поставки 1,8-дюймовых жестких дисков с секторами по 4096 байт. В 2010 году IDEMA завершила разработку стандарта Advanced Format для дисков с секторами по 4096 байт, [11] установив дату перехода с секторов 512 на секторы 4096 байт для всех производителей, [12] и диски Advanced Format вскоре стали преобладать.
В то время как сектор конкретно означает область физического диска, термин блок использовался в широком смысле для обозначения небольшого фрагмента данных. Блок имеет несколько значений в зависимости от контекста. В контексте хранения данных блок файловой системы является абстракцией над секторами диска, возможно, охватывающей несколько секторов. В других контекстах это может быть единица потока данных или единица операции для утилиты. [13] Например, программа Unix dd позволяет установить размер блока, который будет использоваться во время выполнения с помощью параметра . Он определяет размер фрагментов данных, предоставляемых dd, и не связан с секторами или блоками файловой системы. bs=bytes
В Linux размер сектора диска можно определить с помощью sudo fdisk -l | grep "Sector size"
, а размер блока — с помощью sudo blockdev --getbsz /dev/sda
. [14]
В компьютерных файловых системах кластер (иногда также называемый единицей распределения или блоком ) — это единица распределения дискового пространства для файлов и каталогов. Чтобы сократить накладные расходы на управление структурами данных на диске, файловая система по умолчанию не выделяет отдельные секторы диска, а непрерывные группы секторов, называемые кластерами.
На диске, использующем 512-байтовые сектора, 512-байтовый кластер содержит один сектор, тогда как 4- кибибайтовый ( КиБ ) кластер содержит восемь секторов.
Кластер — это наименьший логический объем дискового пространства, который может быть выделен для хранения файла. Хранение небольших файлов в файловой системе с большими кластерами, следовательно, будет тратить дисковое пространство; такое потраченное впустую дисковое пространство называется резервным пространством . Для кластеров, размеры которых малы по сравнению со средним размером файла, потраченное впустую пространство на файл будет статистически составлять около половины размера кластера; для больших размеров кластера потраченное впустую пространство станет больше. Однако больший размер кластера снижает накладные расходы на ведение учета и фрагментацию, что может повысить общую скорость чтения и записи. Типичные размеры кластера варьируются от 1 сектора (512 Б) до 128 секторов (64 КиБ ).
Кластер не обязательно должен быть физически непрерывным на диске; он может охватывать более одной дорожки или, если используется чередование секторов , может быть даже не непрерывным внутри дорожки. Это не следует путать с фрагментацией , так как сектора по-прежнему логически непрерывны.
«Потерянный кластер» возникает, когда файл удаляется из списка каталогов, но таблица размещения файлов (FAT) по-прежнему показывает кластеры, выделенные для файла. [15]
Термин кластер был изменен на единицу распределения в DOS 4.0. Однако термин кластер все еще широко используется. [16]
Если сектор определяется как пересечение радиуса и дорожки, как это было в случае с ранними жесткими дисками и большинством гибких дисков, то сектора, расположенные ближе к внешней стороне диска, физически длиннее, чем те, что ближе к шпинделю. Поскольку каждый сектор по-прежнему содержит одинаковое количество байтов, внешние сектора имеют более низкую плотность битов , чем внутренние, что является неэффективным использованием магнитной поверхности. Решением является зонная битовая запись, при которой диск делится на зоны, каждая из которых охватывает небольшое количество смежных дорожек. Затем каждая зона делится на сектора таким образом, что каждый сектор имеет схожий физический размер. Поскольку внешние зоны имеют большую окружность, чем внутренние зоны, им выделяется больше секторов. Это известно как зонная битовая запись . [17]
Следствием зонной битовой записи является то, что последовательные чтения и записи на внешних дорожках (соответствующих более низким адресам блоков) выполняются заметно быстрее, чем на внутренних дорожках, поскольку при каждом обороте под головкой проходит больше бит; эта разница может составлять 25% и более.
В 1998 году традиционный размер сектора в 512 байт был определен как одно из препятствий для увеличения емкости, которая в то время росла со скоростью, превышающей закон Мура . Увеличение длины поля данных путем внедрения расширенного формата с использованием секторов по 4096 байт устранило это препятствие; это увеличило эффективность поверхности данных на пять-тринадцать процентов, одновременно увеличив прочность ECC, что в свою очередь позволило увеличить емкость. Формат был стандартизирован отраслевым консорциумом в 2005 году и к 2011 году включен во все новые продукты всех производителей жестких дисков.