stringtranslate.com

Дисковый сектор

Рисунок 1. Структуры диска:
  ( Трек
  ( C ) Сектор диска
  ( Д ) Кластер

В компьютерном дисковом хранилище сектор это подразделение дорожки на магнитном или оптическом диске . Для большинства дисков каждый сектор хранит фиксированный объем доступных пользователю данных, традиционно 512 байт для жестких дисков (HDD) и 2048 байт для CD-ROM и DVD-ROM . В новых жестких дисках и твердотельных накопителях используются сектора размером 4096 байт (4  КиБ ), которые известны как расширенный формат (AF).

Сектор — это минимальная единица хранения данных на жестком диске. [1] Большинство схем разбиения диска рассчитаны на то, чтобы файлы занимали целое число секторов независимо от фактического размера файла. В файлах, которые не заполняют целый сектор, оставшаяся часть последнего сектора будет заполнена нулями. На практике операционные системы обычно работают с блоками данных , которые могут охватывать несколько секторов. [2]

Геометрически слово сектор означает часть диска между центром, двумя радиусами и соответствующей дугой (см. рис. 1, пункт Б), имеющую форму куска пирога. Таким образом, сектор диска (рисунок 1, позиция С) относится к пересечению дорожки и геометрического сектора .

В современных дисковых накопителях каждый физический сектор состоит из двух основных частей: области заголовка сектора (обычно называемой «ID») и области данных. Заголовок сектора содержит информацию, используемую накопителем и контроллером; эта информация включает в себя байты синхронизации, идентификацию адреса , флаг неисправности, а также информацию об обнаружении и исправлении ошибок. Заголовок также может включать альтернативный адрес, который будет использоваться, если область данных ненадежна. Идентификация адреса используется для обеспечения того, чтобы механика привода расположила головку чтения/записи в правильном месте. Область данных содержит байты синхронизации, пользовательские данные и код исправления ошибок (ECC), который используется для проверки и, возможно, исправления ошибок, которые могли быть внесены в данные.

История

Первый дисковод IBM 350 1957 года имел десять секторов по 100 символов на каждой дорожке; каждый символ имел шесть битов и включал бит четности. Количество секторов на дорожку было одинаково на всех записывающих поверхностях. Не было записанного поля идентификатора (ID), связанного с каждым сектором. [3]

В дисковом хранилище IBM 1301 1961 года были представлены секторы переменной длины, [ оспариваемые (поскольку: в литературе не используется термин «сектор» для блоков переменной длины) – обсудить ] названные IBM записями или физическими записями , и добавлено к каждой записи поле адреса записи. отдельно от данных в записи. [4] [5] Все современные жесткие диски имеют поля адреса сектора, называемые полями идентификатора, которые отделены от данных в секторе.

Также в 1961 году Брайант со своей серией 4000 представил концепцию зональной записи (ZBR), которая позволяла изменять количество секторов на дорожке в зависимости от диаметра дорожки - на внешней дорожке секторов больше, чем на внутренней дорожке. [6] В конце 1980-х годов ZBR снова использовался в дисководах, о чем тогда объявили Imprimis и Quantum [7] , и к 1997 году его использование в промышленности стало повсеместным. [8]

Дисковые накопители и другие DASD, анонсированные вместе с IBM System/360 в 1964 году, использовали самоформатирующиеся сектора переменной длины, [ оспаривается (поскольку: в литературе не используется термин сектор для блоков переменной длины) – обсуждать ] называемые записями или физическими записями. компанией IBM. Они обнаружили ошибки во всех полях своих записей с помощью проверки циклического избыточного кода (CRC), заменившей определение четности на каждый символ предыдущих поколений. Эти физические записи IBM состоят из трех основных частей: поля количества, которое действует как поле идентификатора, дополнительного поля ключа, помогающего в поиске данных, и поля данных; на практике большинство записей не имели поля «Ключ», о чем свидетельствует нулевая длина ключа. Структура этих трех полей называется форматом дорожки CKD для записи.

Дисковое хранилище IBM 3330 1970 года заменило CRC в поле данных каждой записи кодом исправления ошибок (ECC), чтобы улучшить целостность данных за счет обнаружения большинства ошибок и возможности исправления многих ошибок. [9] В конечном итоге все поля секторов диска имели ECC.

До 1980-х годов стандартизация размеров секторов была незначительной; Дисковые накопители имели максимальное количество бит на дорожку, и различные производители систем разделяли дорожку на сектора разного размера в соответствии со своими операционными системами и приложениями. Популярность ПК , начавшаяся в 1980-х годах, и появление интерфейса IDE в конце 1980-х годов привели к тому, что сектор размером 512 байт стал отраслевым стандартом размера сектора для жестких дисков и аналогичных устройств хранения данных. [10] [ не удалось проверить ]

В 1970-х годах IBM добавила устройства хранения данных с прямым доступом с фиксированной блочной архитектурой (FBA DASD) к своей линейке CKD DASD. CKD DASD поддерживал несколько секторов переменной длины, тогда как IBM FBA DASD поддерживал размеры секторов 512, 1024, 2048 или 4096 байт.

В 2000 году отраслевая торговая организация, Международная ассоциация дискового оборудования и материалов ( IDEMA ), начала работу по определению реализации и стандартов, которые будут регулировать форматы секторов размером более 512 байт, чтобы обеспечить будущее увеличение емкости хранения данных. [10] К концу 2007 года в ожидании будущего стандарта IDEMA компании Samsung и Toshiba начали поставки 1,8-дюймовых жестких дисков с размером секторов 4096 байт. В 2010 году компания IDEMA завершила разработку стандарта расширенного формата для накопителей с размером 4096 секторов, [10] установив дату перехода от секторов с размером 512 к 4096 байт в январе 2011 года для всех производителей, [11] и диски расширенного формата вскоре стали преобладать.

Связанные подразделения

Секторы против блоков

Хотя сектор конкретно означает область физического диска, термин « блок» широко использовался для обозначения небольшого фрагмента данных. Блок имеет несколько значений в зависимости от контекста. В контексте хранения данных блок файловой системы представляет собой абстракцию секторов диска, возможно, охватывающую несколько секторов. В других контекстах это может быть единица потока данных или единица работы утилиты. [12] Например, программа Unix dd позволяет установить размер блока, который будет использоваться во время выполнения, с помощью параметра . Это определяет размер фрагментов данных, доставляемых dd, и не имеет отношения к секторам или блокам файловой системы. bs=bytes

В Linux размер сектора диска можно определить с помощью, sudo fdisk -l | grep "Sector size"а размер блока — с помощью sudo blockdev --getbsz /dev/sda. [13]

Секторы против кластеров

В компьютерных файловых системах кластер (иногда также называемый единицей выделения или блоком ) это единица распределения дискового пространства для файлов и каталогов. Чтобы уменьшить накладные расходы на управление структурами данных на диске, файловая система по умолчанию выделяет не отдельные секторы диска, а смежные группы секторов, называемые кластерами.

На диске, использующем секторы размером 512 байт, кластер размером 512 байт содержит один сектор, тогда как кластер размером 4 кибибайта ( КиБ ) содержит восемь секторов.

Кластер — это наименьший логический объем дискового пространства, который можно выделить для хранения файла. Поэтому хранение небольших файлов в файловой системе с большими кластерами приведет к потере дискового пространства; такое потраченное впустую дисковое пространство называется свободным пространством . Для размеров кластера, которые малы по сравнению со средним размером файла, потраченное впустую пространство на файл будет статистически составлять около половины размера кластера; для кластеров больших размеров неиспользуемое пространство станет больше. Однако больший размер кластера снижает накладные расходы на бухгалтерский учет и фрагментацию, что может улучшить общую скорость чтения и записи. Типичные размеры кластеров варьируются от 1 сектора (512 байт) до 128 секторов (64 КБ ).

Кластер не обязательно должен быть физически непрерывным на диске; он может охватывать более одной дорожки или, если используется перемежение секторов , может даже быть несмежным внутри дорожки. Это не следует путать с фрагментацией , поскольку сектора по-прежнему логически смежны.

«Потерянный кластер» возникает, когда файл удаляется из списка каталогов, но таблица размещения файлов (FAT) по-прежнему показывает кластеры, выделенные для этого файла. [14]

Термин « кластер» был изменен на единицу размещения в DOS 4.0. Однако термин кластер все еще широко используется. [15]

Запись битов зоны

Если сектор определяется как пересечение радиуса и дорожки, как это было в случае с ранними жесткими дисками и большинством дискет, секторы, расположенные снаружи диска, физически длиннее, чем те, что ближе к шпинделю. Поскольку каждый сектор по-прежнему содержит одинаковое количество байтов, внешние сектора имеют меньшую битовую плотность , чем внутренние, что является неэффективным использованием магнитной поверхности. Решением является зонная побитовая запись, при которой диск делится на зоны, каждая из которых включает небольшое количество смежных дорожек. Затем каждая зона делится на сектора так, чтобы каждый сектор имел одинаковый физический размер. Поскольку внешние зоны имеют большую окружность, чем внутренние, им выделяется больше секторов. Это известно как зонированная битовая запись . [16]

Следствием записи битов зоны является то, что последовательные операции чтения и записи выполняются заметно быстрее на внешних дорожках (соответствующих адресам нижних блоков), чем на внутренних дорожках, поскольку при каждом вращении под головкой проходит больше битов; эта разница может составлять 25% и более.

Расширенный формат

В 1998 году традиционный размер сектора в 512 байт был определен как одно из препятствий на пути увеличения емкости, которая в то время росла со скоростью, превышающей закон Мура . Увеличение длины поля данных за счет реализации расширенного формата с использованием секторов размером 4096 байт устранило это препятствие; это увеличило эффективность площади поверхности данных на пять-тринадцать процентов, одновременно увеличив мощность ECC, что, в свою очередь, позволило повысить емкость. Формат был стандартизирован отраслевым консорциумом в 2005 году и к 2011 году включен во все новые продукты всех производителей жестких дисков.

Смотрите также

Рекомендации

  1. ^ Хэмингтон, Сьюзи (1 января 2004 г.). Информатика. Лотос Пресс. п. 42. ИСБН 9788189093242.
  2. ^ Такер, Аллен Б. (28 июня 2004 г.). Справочник по информатике, второе издание. ЦРК Пресс. п. 86. ИСБН 9780203494455.
  3. ^ 305 Руководство по эксплуатации метода произвольного доступа RAMAC для учета и контроля (PDF) . ИБМ . 1957.
  4. ^ IBM 1301, модели 1 и 2, дисковое хранилище и IBM 1302, модели 1 и 2, дисковое хранилище с системами обработки данных IBM 7090, 7094 и 7094 II (PDF) . ИБМ. А22-6785.
  5. ^ IBM 1301, модели 1 и 2, дисковое хранилище и IBM 1302, модели 1 и 2, дисковое хранилище с системами обработки данных IBM 1410 и 7010 (PDF) . ИБМ. А22-6788.
  6. ^ Технические данные — Дисковый файл Series 4000 (PDF) . Брайант Компьютерные продукты. 1963.
  7. ^ Портер, Джеймс (октябрь 1988 г.). «Характеристики жесткого магнитного диска». ОТЧЕТ О ДИСКЕ/ТЕНДЕНЦИЯХ 1988 ГОДА, ЖЕСТКИЕ ДИСКОВЫЕ ПРИВОДЫ . ДИСК/ТРЕНД, Инк. 63, 122.
  8. ^ Портер, Джеймс (июнь 1997 г.). «Характеристики жесткого магнитного диска». ОТЧЕТ О ДИСКЕ/ТЕНДЕНЦИЯХ 1997 ГОДА, ЖЕСТКИЕ ДИСКОВЫЕ ПРИВОДЫ . ДИСК/ТРЕНД, Инк.
  9. ^ Справочное руководство для дискового хранилища IBM 3330 Series (PDF) . ИБМ. Март 1974 г. GA26-1615-3.
  10. ^ abc «Появление расширенного формата». ИДЕМА . Проверено 18 ноября 2013 г.
  11. Скиннер, Хизер (29 июня 2010 г.). «IDEMA запускает кампанию «Готовы ли вы?», чтобы подготовить отрасль к изменению формата сектора жестких дисков» (PDF) . www.idema.org . Архивировано из оригинала 14 декабря 2020 года . Проверено 14 декабря 2020 г.
  12. ^ «Разница между размером блока и размером кластера» . unix.stackexchange.com . Проверено 13 декабря 2015 г.
  13. ^ «Сектор диска и распределение блоков для файла» . stackoverflow.com . Проверено 13 декабря 2015 г.
  14. ^ «Ошибки, вызванные перекрестными ссылками файлов или потерянными кластерами» . Архивировано из оригинала 6 марта 2015 г. Проверено 3 августа 2020 г.
  15. ^ Мюллер, Скотт (2002). Модернизация и ремонт ПК , с. 1354. ISBN 0-7897-2745-5
  16. ^ Керн Вонг (январь 1989 г.), DP8459 Zoned Bit Recording (PDF) , National Semiconductor, заархивировано из оригинала (PDF) 15 июня 2011 г. , получено 10 марта 2010 г.