Байт

Байт — это единица цифровой информации , которая чаще всего состоит из восьми бит . Исторически байтом называли количество битов, используемых для кодирования одного символа текста в компьютере ^[1]^[2] , и по этой причине это наименьшая адресуемая единица памяти во многих компьютерных архитектурах . Чтобы устранить неоднозначность байтов произвольного размера из общего 8-битного определения, документы сетевых протоколов, такие как Интернет-протокол ( RFC 791), называют 8-битный байт октетом . ^[3] Эти биты в октете обычно нумеруются от 0 до 7 или от 7 до 0 в зависимости от порядка байтов .

Размер байта исторически зависел от аппаратного обеспечения , и не существовало окончательных стандартов, определяющих этот размер. Использовались размеры от 1 до 48 бит. ^[4]^[5]^[6]^[7] Шестибитный код символов часто использовался в ранних системах кодирования, а компьютеры, использующие шестибитные и девятибитные байты, были обычным явлением в 1960-х годах. Эти системы часто имели слова памяти длиной 12, 18, 24, 30, 36, 48 или 60 бит, что соответствовало 2, 3, 4, 5, 6, 8 или 10 шестибитным байтам. В то время группы битов в потоке команд часто назывались слогами^[a] или slab , прежде чем термин байт стал общепринятым.

Современный стандарт де-факто восьми бит, как описано в ISO/IEC 2382-1:1993, представляет собой удобную степень двойки , позволяющую использовать двоично-кодированные значения от 0 до 255 для одного байта, поскольку 2 в восьмой степени равно 256. ^[8] Международный стандарт IEC 80000-13 закрепил это общее значение. Многие типы приложений используют информацию, представленную в восьми или менее битах, и разработчики процессоров обычно оптимизируют ее для такого использования. Популярность основных коммерческих вычислительных архитектур способствовала повсеместному принятию 8-битного байта. ^[9] В современных архитектурах обычно используются 32- или 64-битные слова, состоящие из четырех или восьми байтов соответственно.

Символ единицы байта был обозначен Международной электротехнической комиссией (IEC) и Институтом инженеров по электротехнике и электронике (IEEE) как заглавная буква B. ^[10] На международном уровне единичный октет , символ o, явно определяет последовательность из восьми битов, устраняя потенциальную двусмысленность термина «байт». ^[11]^[12]

Этимология и история

Термин « байт» был придуман Вернером Бухгольцем в июне 1956 года, ^[4]^[13]^[14]^[b] на раннем этапе проектирования IBM Stretch ^[15]^[16]^[1]^{[13] [}^14]^{[17] ]}^[18] компьютер, который имел адресацию к битам и инструкциям переменной длины поля (VFL) с размером байта, закодированным в инструкции. ^[13] Это преднамеренное изменение байта , чтобы избежать случайной мутации в бит . ^[1]^[13]^[19]^[в]

Другое происхождение байтовых групп битов, меньших размера компьютерного слова, и в частности групп из четырех бит , зарегистрировано Луисом Г. Дули, который утверждал, что придумал этот термин, когда работал с Жюлем Шварцем и Диком Билером над системой противовоздушной обороны. под названием SAGE в Лаборатории Линкольна Массачусетского технологического института в 1956 или 1957 году и был разработан совместно Рэндом , Массачусетским технологическим институтом и IBM. ^[20]^[21] Позже этот термин действительно использовался в языке Шварца JOVIAL , но автор смутно припоминает, что он произошел от AN/FSQ-31 . ^[22]^[21]

Ранние компьютеры использовали различные четырехбитные двоично-десятичные представления (BCD) и шестибитные коды для печатных графических шаблонов, распространенных в армии США ( FIELDATA ) и военно- морском флоте . Эти изображения включали буквенно-цифровые символы и специальные графические символы. Эти наборы были расширены в 1963 году до семи битов кодирования, названных Американским стандартным кодом обмена информацией (ASCII) в качестве Федерального стандарта обработки информации , который заменил несовместимые коды телетайпов, использовавшиеся различными ветвями правительства и университетами США в 1960-х годах. . ASCII включал в себя различие прописных и строчных алфавитов и набор управляющих символов для облегчения передачи письменного языка, а также функций печатающего устройства, таких как продвижение страницы и перевод строки, а также физический или логический контроль потока данных при передаче. СМИ. ^[18] В начале 1960-х годов, одновременно активно занимаясь стандартизацией ASCII, IBM одновременно представила в своей линейке продуктов System/360 восьмибитный расширенный двоично-десятичный код обмена (EBCDIC), расширение их шестибитного двоично-десятичного кода обмена. десятичные представления (BCDIC) ^[d], использовавшиеся в более ранних перфорациях карт. ^[23] Популярность System/360 привела к повсеместному принятию восьмибитного размера памяти, ^[18]^[16]^[13] , хотя в деталях схемы кодирования EBCDIC и ASCII различны.

В начале 1960-х годов компания AT&T представила цифровую телефонию на междугородных магистральных линиях . В них использовалась восьмибитная кодировка по закону μ . Эти крупные инвестиции обещали снизить затраты на передачу восьмибитных данных.

В первом томе книги «Искусство компьютерного программирования» (впервые опубликованной в 1968 году) Дональд Кнут использует байт в своем гипотетическом компьютере MIX для обозначения единицы, которая «содержит неопределённое количество информации… способной содержать по меньшей мере 64 различных значения… ... не более 100 различных значений. Поэтому на двоичном компьютере байт должен состоять из шести битов". ^[24] Он отмечает, что «примерно с 1975 года слово байт стало означать последовательность ровно из восьми двоичных цифр... Когда мы говорим о байтах в связи с MIX, мы ограничимся прежним смыслом этого слова, возвращаясь к тем временам, когда байты еще не были стандартизированы». ^[24]

Разработка восьмибитных микропроцессоров в 1970-х годах популяризировала этот размер хранилища. Микропроцессоры, такие как Intel 8008 , прямой предшественник 8080 и 8086 , использовавшиеся в ранних персональных компьютерах, также могли выполнять небольшое количество операций с четырехбитными парами в байте, например десятичное сложение-регулирование ( ДАА) инструкция. Четырехбитную величину часто называют полубайтом , а также полубайтом , который удобно представить одной шестнадцатеричной цифрой.

Термин октет используется для однозначного указания размера в восемь бит. ^[18]^[12] Он широко используется в определениях протоколов .

Исторически термин «октада» или «октада» использовался для обозначения восьми битов, по крайней мере, в Западной Европе; ^[25]^[26] Однако такое использование больше не распространено. Точное происхождение этого термина неясно, но его можно найти в британских, голландских и немецких источниках 1960-х и 1970-х годов, а также в документации к мэйнфреймам Philips .

Символ единицы

Символ единицы измерения байта указан в IEC 80000-13 , IEEE 1541 и метрическом формате обмена ^[10] как символ B в верхнем регистре.

В Международной системе величин (ISQ) B также является символом бел , единицы логарифмического отношения мощностей, названной в честь Александра Грэма Белла , что создает конфликт со спецификацией IEC. Однако опасность путаницы невелика, поскольку ремень используется редко. Он используется в основном в своей десятичной дроби, децибеле (дБ), для измерения силы сигнала и уровня звукового давления , тогда как единица измерения одной десятой байта, децибайт и другие дроби используются только в производных единицах, таких как как скорость передачи.

Строчная буква o для обозначения октета определяется как символ октета в IEC 80000-13 и обычно используется в таких языках, как французский ^[27] и румынский , а также сочетается с метрическими префиксами для кратных чисел, например ko и Mo.

Многобайтовые единицы

Существует более одной системы для определения кратных единиц на основе байта. Некоторые системы основаны на степени 10 в соответствии с Международной системой единиц (СИ), которая определяет, например, префикс килограмм как 1000 (10 ³ ); другие системы основаны на степенях 2 . Номенклатура этих систем имеет путаницу. Системы, основанные на степенях 10, используют стандартные префиксы СИ ( кило , мега , гига ,...) и соответствующие им символы (k, M, G,...). Однако системы, основанные на степенях двойки, могут использовать двоичные префиксы ( киби , меби , гиби , ...) и соответствующие им символы (Ки, Ми, Ги, ...) или префиксы К, М и G, создавая двусмысленность при использовании префиксов M или G.

Хотя разница между десятичной и двоичной интерпретацией относительно невелика для килобайта (примерно на 2% меньше, чем кибибайт), системы отклоняются все больше по мере увеличения единиц (относительное отклонение увеличивается на 2,4% на каждые три порядка). Например, терабайт, основанный на степени 10, примерно на 9% меньше тебибайта, основанного на степени 2.

Единицы на основе степени 10

Определение префиксов с использованием степеней 10, в которых 1 килобайт (символ КБ) равен 1000 байтам, рекомендовано Международной электротехнической комиссией (МЭК). ^[28] Стандарт IEC определяет восемь таких кратных, до 1 йоттабайта (YB), что соответствует 1000 ⁸ байтам. ^[29] Дополнительные префиксы ronna- для 1000 ⁹ и quetta- для 1000 ¹⁰ были приняты Международным бюро мер и весов (BIPM) в 2022 году. ^[30]^[31]

Это определение чаще всего используется для единиц скорости передачи данных в компьютерных сетях , скорости внутренней шины, жесткого диска и флэш-носителей, а также для емкости большинства носителей информации , особенно жестких дисков , ^[32] флэш -накопителей, ^[33] и ^DVD- ^диски^. _ К операционным системам , использующим это определение, относятся macOS , ^[34]iOS , ^[34]Ubuntu , ^[35] и Debian . ^[36] Это также согласуется с другими видами использования префиксов SI в вычислениях, такими как тактовая частота процессора или показатели производительности .

Единицы на основе степеней 2

Система единиц, основанная на степенях 2 , в которой 1 кибибайт (КиБ) равен 1024 (т. е. 2 ¹⁰ ) байтам, определена международным стандартом IEC 80000-13 и поддерживается национальными и международными органами по стандартизации ( BIPM , IEC , НИСТ ). Стандарт IEC определяет восемь таких кратных, до 1 йобибайта (YiB), что соответствует 1024 ⁸ байтам. Естественные бинарные аналоги ронна- и кветта- были указаны в консультационном документе Консультативного комитета по единицам Международного комитета мер и весов (CCU) как роби- (Ri, 1024 ⁹ ) и квеби- (Qi, 1024 ¹⁰ ). , но еще не были приняты МЭК и ИСО. ^[37]

Альтернативная система номенклатуры для тех же единиц (называемая здесь общепринятым соглашением ), в которой 1 килобайт (КБ) равен 1024 байтам, ^[38]^[39]^[40] 1 мегабайт (МБ) равен 1024. ² байта и 1 гигабайт (ГБ) равны 1024. ³ байта упоминаются в стандарте JEDEC 1990-х годов . В стандарте JEDEC упоминаются только первые три кратных (до ГБ), в котором не упоминается ТБ и более крупные. Хотя это сбивает с толку и неверно ^[41]. Обычное соглашение используется операционной системой Microsoft Windows ^[42]^{[ нужен лучший источник ]} и емкостью оперативной памяти , такой как основная память и размер кэша ЦП , а также в маркетинге и выставлении счетов телекоммуникационными компаниями. , такие как Vodafone , ^[43] AT&T , ^[44] Orange ^[45] и Telstra . ^[46]

Что касается емкости хранилища , в macOS и iOS использовалось обычное соглашение до Mac OS X 10.6 Snow Leopard и iOS 10, после чего они перешли на единицы измерения, основанные на степени 10. ^[34]

Приходские единицы

Различные поставщики компьютеров придумали термины для данных разных размеров, иногда с разными размерами для одного и того же термина даже в пределах одного поставщика. Эти термины включают двойное слово , полуслово , длинное слово , четверное слово , плиту , сверхслово и слог . Есть и неофициальные условия. например, полубайт и полубайт для 4 бит, восьмеричная K для 1000 ₈ .

История противоречивых определений

Процентная разница между десятичной и двоичной интерпретацией префиксов единиц измерения увеличивается с увеличением размера хранилища.

Современная компьютерная память ^[e] имеет двоичную архитектуру , что делает определение единиц памяти на основе степеней 2 наиболее практичным. Использование метрического префикса «кило» для двоичных кратных возникло для удобства, поскольку 1024 примерно равно 1000. ^[27] Это определение было популярно в первые десятилетия развития персональных компьютеров , когда такие продукты, как дискета Tandon 5 1 / 4 -дюймового формата DD (объемом 368 640 байт), рекламировались как «360 КБ», в соответствии с соглашением о 1024 байтах. Однако оно не было универсальным. Дискета Shugart SA-400 размером 5 1/4 дюйма содержала 109 375 байт в неформатированном виде ^[47] и рекламировалась как «110 Кбайт», используя соглашение 1000 . ^[48] Аналогичным образом, 8-дюймовая дискета DEC RX01 (1975 г.) содержала отформатированные 256 256 байт и рекламировалась как «256 КБ». ^[49] Другие диски рекламировались с использованием смеси этих двух определений: в частности, 3+1 / 2 -дюймовые HD-диски, рекламируемые как «1,44 МБ», на самом деле имеют емкость 1440 КиБ, что эквивалентно 1,47 МБ или 1,41 МБ.

В 1995 году Межотраслевой комитет по номенклатуре и символам Международного союза теоретической и прикладной химии (IUPAC) попытался разрешить эту двусмысленность, предложив набор двоичных префиксов для степеней 1024, включая киби (килобинарный), меби (мегабинарный). и гиби (гигабинарный). ^[50]^[51]

В декабре 1998 года IEC рассмотрел такие многочисленные варианты использования и определения, приняв предложенные IUPAC префиксы (киби, меби, гиби и т. д.) для однозначного обозначения степеней 1024. ^[52] Таким образом, один кибибайт (1 КиБ) равен 1024 ¹ байт = 1024 байта, один мебибайт (1 МиБ) равен 1024 ² байта =1 048 576 байт и так далее.

В 1999 году Дональд Кнут предложил называть кибибайт «большим килобайтом» ( KKB ). ^[53]

Современные стандартные определения

МЭК приняла предложение ИЮПАК и опубликовала стандарт в январе 1999 года. ^[54]^[55] Префиксы МЭК являются частью Международной системы величин . МЭК далее уточнила, что килобайт следует использовать только для обозначения 1000 байт.

Судебные разбирательства по поводу определения

Иски, возникающие из-за предполагаемого замешательства потребителей по поводу двоичных и десятичных определений кратных байту, обычно заканчивались в пользу производителей, при этом суды постановляли, что юридическое определение гигабайта или ГБ составляет 1 ГБ = 1 000 000 000 (10 ⁹ ) байт (десятичное число определение), а не двоичное определение (2 ³⁰ , т. е. 1 073 741 824). В частности, Окружной суд США Северного округа Калифорнии постановил, что «Конгресс США счел десятичное определение гигабайта «предпочтительным» для целей «торговли и коммерции США» [...] Калифорнийский суд Законодательное собрание также приняло десятичную систему для всех «транзакций в этом штате » » ^{[56] .}

Предыдущие судебные иски завершились мировым соглашением без какого-либо решения суда по этому вопросу, как, например, иск против производителя накопителей Western Digital . ^[57]^[58] Western Digital решила проблему и добавила к продуктам явный отказ от ответственности за то, что полезная емкость может отличаться от заявленной. ^[57] На компанию Seagate был подан иск на аналогичных основаниях, который также был урегулирован. ^[57]^[59]

Практические примеры

Обычное использование

Многие языки программирования определяют тип данных byte .

Языки программирования C и C++ определяют байт как «адресную единицу хранения данных, достаточно большую, чтобы вместить любой член базового набора символов среды выполнения» (пункт 3.6 стандарта C). Стандарт C требует, чтобы целочисленный тип данных unsigned char содержал не менее 256 различных значений и был представлен как минимум восемью битами (пункт 5.2.4.2.1). Различные реализации C и C++ резервируют 8, 9, 16, 32 или 36 бит для хранения байта. ^[66]^[67]^[g] Кроме того, стандарты C и C++ требуют, чтобы между двумя байтами не было пробелов. Это означает, что каждый бит в памяти является частью байта. ^[68]

Байт примитивного типа данных Java определяется как восемь бит. Это знаковый тип данных, содержащий значения от –128 до 127.

Языки программирования .NET , такие как C# , определяют byte как беззнаковый тип, а sbyte как знаковый тип данных, содержащий значения от 0 до 255 и от -128 до 127 соответственно.

В системах передачи данных байт используется как непрерывная последовательность битов в последовательном потоке данных, представляющая наименьшую выделенную единицу данных. Для асинхронной связи полный блок передачи обычно дополнительно включает в себя стартовый бит, 1 или 2 стоповых бита и, возможно, бит четности , и, таким образом, его размер может варьироваться от семи до двенадцати бит для пяти-восьми бит реальных данных. ^[69] Для синхронной связи проверка ошибок обычно использует байты в конце кадра .

Смотрите также

Примечания

^ Термин «слог» использовался для байтов, содержащих инструкции или составляющие инструкций, а не для байтов данных.
^ Многие источники ошибочно указывают день рождения термина « байт» в июле 1956 года, но Вернер Бухгольц утверждал, что этот термин был придуман в июне 1956 года. Фактически, самый ранний документ, подтверждающий это, датируется 11 июня 1956 года. Бухгольц заявил, что переход к 8-битным байтам был задуман в августе 1956 года, но самый ранний документ, найденный с использованием этого понятия, датируется сентябрем 1956 года.
^ Некоторые более поздние машины, например, Burroughs B1700 , CDC 3600 , DEC PDP-6, DEC PDP-10, имели возможность работать с произвольными байтами, не превышающими размер слова.
^ Было более одной кодовой страницы BCD.
^ В 1970-е годы существовали машины с десятичной архитектурой.
^ Видео кодируется с битрейтом 27,8 Мбит/с, длительностью 1403 минуты ^[70] (84 180 секунд), что дает приблизительный размер 0,2925 ТБ (0,2661 ТиБ).
^ Фактическое количество битов в конкретной реализации документировано в том виде, в котором CHAR_BITоно реализовано, в файле limit.h .

Рекомендации

^ абв Блаау, Геррит Энн ; Брукс-младший, Фредерик Филлипс ; Бухгольц, Вернер (1962), «Глава 4: Естественные единицы данных» (PDF) , в Бухгольце, Вернер (ред.), Планирование компьютерной системы - проект , McGraw-Hill Book Company, Inc. / The Maple Press Company, Йорк, Пенсильвания, стр. 39–40, LCCN 61-10466, заархивировано из оригинала (PDF) 3 апреля 2017 г. , получено 3 апреля 2017 г.
    Термины, используемые здесь для описания структуры, заданной конструкцией машины, помимо бита , перечислены ниже.
    Байт обозначает группу битов, используемых для кодирования символа, или количество битов, передаваемых параллельно к блокам ввода-вывода и от них. Здесь используется термин, отличный от символа , поскольку данный символ может быть представлен в разных приложениях более чем одним кодом, а разные коды могут использовать разное количество битов (т. е. разные размеры байтов). При передаче ввода-вывода группировка битов может быть совершенно произвольной и не иметь никакого отношения к реальным символам. (Термин произошел от укуса , но был изменен во избежание случайной мутации на бит .)
    Слово состоит из количества битов данных, передаваемых параллельно из или в память за один цикл памяти . Таким образом, размер слова определяется как структурное свойство памяти. (Термин катена был придуман для этой цели разработчиками компьютера Bull GAMMA 60 [fr] .)
    Блок относится к количеству слов, передаваемых в или из устройства ввода-вывода в ответ на одну команду ввода-вывода. Размер блока — структурное свойство блока ввода-вывода; оно могло быть исправлено в проекте или оставлено для изменения в программе.
^ Бемер, Роберт Уильям (1959), «Предложение об обобщенном коде карты из 256 символов», Communications of the ACM , 2 (9): 19–23, doi : 10.1145/368424.368435 , S2CID 36115735
^ Постел, Дж. (сентябрь 1981 г.). СПЕЦИФИКАЦИЯ ПРОТОКОЛА ИНТЕРНЕТ-ПРОГРАММЫ DARPA. п. 43. дои : 10.17487/RFC0791 . РФК 791 . Проверено 28 августа 2020 г. октет Восьмибитный байт.
^ аб Бухгольц, Вернер (11 июня 1956 г.). «7. Матрица сдвига» (PDF) . Система ссылок . ИБМ . стр. 5–6. Растяжка Памятка № 39Г. Архивировано из оригинала (PDF) 4 апреля 2017 г. Проверено 4 апреля 2016 г.
    […] Самым важным, с точки зрения редактирования, будет возможность обработки любых символов и цифр длиной от 1 до 6 бит.
    На рисунке 2 показана матрица сдвига, которая будет использоваться для преобразования 60-битного слова , параллельно поступающего из памяти, в символы или «байты», как мы их назвали, для последовательной отправки в сумматор . 60 бит сбрасываются в магнитные сердечники на шести разных уровнях. Таким образом, если 1 выходит из позиции 9, она появляется во всех шести ядрах ниже. Подача импульса на любую диагональную линию отправит шесть битов, хранящихся по этой линии, в сумматор. Сумматор может принимать все или только некоторые биты.
    Предположим, что требуется работать с 4-битными десятичными цифрами , начиная справа. Первой подается импульс по диагонали 0, отправляя шесть битов от 0 до 5, из которых сумматор принимает только первые четыре (0-3). Биты 4 и 5 игнорируются. Далее импульсируется 4-я диагональ. При этом отправляются биты с 4 по 9, из которых последние два снова игнорируются и так далее.
    Так же легко использовать все шесть битов в буквенно-цифровой работе, или обрабатывать байты, состоящие только из одного бита, для логического анализа, или смещать байты на любое количество битов. Все это можно сделать, потянув за соответствующие диагонали переключения передач. Аналогичное расположение матриц используется для перехода от последовательного к параллельному режиму работы на выходе сумматора. […]
^ Компьютерная система 3600 — Справочное руководство (PDF) . К. Сент-Пол, Миннесота, США: Control Data Corporation (CDC). 11 октября 1966 г. [1965]. 60021300. Архивировано из оригинала (PDF) 5 апреля 2017 г. Проверено 05 апреля 2017 г. Байт — часть компьютерного слова.
Примечание. Обсуждаются 12-битные, 24-битные и 48-битные байты.
^ Рао, Таммаварам Р.Н.; Фудзивара, Эйдзи (1989). Маккласки, Эдвард Дж. (ред.). Кодирование с контролем ошибок для компьютерных систем. Серия Прентис Холл по компьютерной инженерии (1-е изд.). Энглвуд Клиффс, Нью-Джерси, США: Прентис Холл . ISBN 0-13-283953-9. LCCN 88-17892.
Примечание. Пример использования кода для «4-битных байтов».
^ Тафель, Ханс Йорг (1971). Einführung in die digitale Datenverarbeitung [ Введение в цифровую обработку информации ] (на немецком языке). Мюнхен: Карл Хансер Верлаг . п. 300. ИСБН 3-446-10569-7. Байт = zusammengehörige Folge von ia neun Bits; davon sind acht Datenbits, das neunte ein Prüfbit
Примечание. Определяет байт как группу обычно из 9 бит; 8 бит данных плюс 1 бит четности.
^ ISO/IEC 2382-1: 1993, Информационные технологии. Словарь. Часть 1. Основные термины . 1993.
    байт:
    строка, состоящая из нескольких битов, рассматриваемая как единица и обычно представляющая символ или часть символа.
    ПРИМЕЧАНИЯ:
    1 Число битов в байте фиксировано для данной системы обработки данных.
    2 Число бит в байте обычно равно 8.
^ «История Интернета 1960-х годов № 1964» . Музей истории компьютеров . 2017 [2015]. Архивировано из оригинала 24 июня 2022 г. Проверено 17 августа 2022 г.
^ аб Джаффер, Обри (2011) [2008]. «Метрический формат обмена». Архивировано из оригинала 3 апреля 2017 г. Проверено 3 апреля 2017 г.
^ Козерок, Чарльз М. (20 сентября 2005 г.) [2001]. «Руководство по TCP/IP — Двоичная информация и представление: биты, байты, полубайты, октеты и символы — байты и октеты». 3.0. Архивировано из оригинала 3 апреля 2017 г. Проверено 3 апреля 2017 г.
^ ab ISO 2382-4, Организация данных (2-е изд.). байт, октет, 8-битный байт: строка, состоящая из восьми бит.
^ абкде Бухгольц, Вернер (февраль 1977 г.). «Слово «Байт» достигает совершеннолетия…» Журнал «Байт» . 2 (2): 144.
    Мы получили следующее от У. Бухгольца, одного из людей, работавших над проектом IBM Project Stretch в середине 1950-х годов. В его письме рассказывается эта история.

    Не будучи постоянным читателем вашего журнала, я услышал в номере за ноябрь 1976 года о происхождении термина «байт» от коллеги, который знал, что я использовал этот жаргон [ см. стр. 77 за ноябрь 1976 г. BYTE, «Старый английский»] . Я поискал в своих файлах и не смог найти свидетельство о рождении. Но я уверен, что «Байт» достигнет совершеннолетия в 1977 году, когда ему исполнится 21 год.
    Многие предполагали, что байт, то есть 8 бит, произошел от IBM System/360, которая распространила такие байты повсюду в середине 1960-х годов. Редактор прав, указывая, что этот термин восходит к более раннему компьютеру Stretch (но неверен в том смысле, что Stretch был первым, а не последним из разработанных IBM транзисторных компьютеров второго поколения).
    Первая ссылка, найденная в файлах, содержалась во внутренней записке, написанной в июне 1956 года, в первые дни разработки Stretch . Байт описывался как состоящий из любого количества параллельных битов от одного до шести. Таким образом, предполагалось, что длина байта соответствует данному случаю. Его первое использование было в контексте оборудования ввода-вывода 1950-х годов, которое обрабатывало шесть бит одновременно. Возможность перехода на 8-битные байты рассматривалась в августе 1956 года и вскоре после этого была включена в конструкцию Stretch.
    Первая опубликованная ссылка на этот термин произошла в 1959 году в статье Г. А. Блаау , Ф. П. Брукса-младшего и У. Бухгольца «Обработка данных в битах и фрагментах» в журнале IRE Transactions on Electronic Computers , июнь 1959 года, стр. 121. Понятия этой статьи были подробно описаны в главе 4 книги «Планирование компьютерной системы (расширение проекта)» под редакцией В. Бухгольца, McGraw-Hill Book Company (1962). Обоснование введения этого термина было объяснено на странице 40 следующим образом:
Байт обозначает группу битов, используемых для кодирования символа, или количество битов, передаваемых параллельно к блокам ввода-вывода и от них. Здесь используется термин, отличный от символа , поскольку данный символ может быть представлен в разных приложениях более чем одним кодом, а разные коды могут использовать разное количество битов (т. е. разные размеры байтов). При передаче ввода-вывода группировка битов может быть совершенно произвольной и не иметь никакого отношения к реальным символам. (Термин произошел от укуса , но был изменен во избежание случайной мутации на бит. )
    System/360 перенял многие концепции Stretch, включая базовые размеры байтов и слов, которые являются степенями 2. Однако в целях экономии размер байта был зафиксирован на максимальном уровне 8 бит, а адресация на уровне битов была заменена на байтовая адресация.
    С тех пор термин «байт» обычно означал 8 бит и, таким образом, вошел в общий словарь.
    Существуют ли какие-либо другие термины, придуманные специально для компьютерной области и попавшие в общие словари английского языка?
^ ab «Хронология эпохи IBM Stretch/Harvest (1956-1961)» . Музей истории компьютеров . Июнь 1956 г. Архивировано из оригинала 29 апреля 2016 г. Проверено 3 апреля 2017 г.
    Лето 1956 года: Геррит Блаау , Фред Брукс , Вернер Буххольц , Джон Кок и Джим Померен присоединяются к команде Stretch . Ллойд Хантер обеспечивает лидерство в области транзисторов .
    Июль 1956 года [ sic ]: В отчете Вернер Бухгольц перечисляет преимущества 64-битной длины слова для Stretch. Он также поддерживает требования АНБ к 8-битным байтам. Термин Вернера «Байт» впервые популяризировался в этой записке.
    Примечание. Эта временная шкала ошибочно указывает дату рождения термина «байт» как июль 1956 года , тогда как Бухгольц фактически использовал этот термин еще в июне 1956 года .
^ Бухгольц, Вернер (31 июля 1956). «5. Ввод-вывод» (PDF) . Длина слова памяти . ИБМ . п. 2. Растянуть памятку № 40. Архивировано из оригинала (PDF) 4 апреля 2017 г. Проверено 4 апреля 2016 г.
[…] 60 кратно 1, 2, 3, 4, 5 и 6. Следовательно, байты длиной от 1 до 6 бит могут быть эффективно упакованы в 60-битное слово без необходимости разделения байта между одним словом и следующий. Если бы требовались более длинные байты, 60 бит, конечно, уже не были бы идеальными. В современных приложениях действительно важными являются 1, 4 и 6 бит.
При использовании 64-битных слов часто приходится идти на некоторые компромиссы, например оставлять 4 бита неиспользуемыми в слове при работе с 6-битными байтами на входе и выходе. Однако компьютер LINK можно оборудовать для устранения этих пробелов и разрешить обработку байтов, разделенных между словами. […]
^ аб Бухгольц, Вернер (19 сентября 1956 г.). «2. Размер байта ввода-вывода» (PDF) . Длина слова памяти и индексация . ИБМ . п. 1. Растянуть памятку № 45. Архивировано из оригинала (PDF) 4 апреля 2017 г. Проверено 4 апреля 2016 г.
[…] Максимальный размер байта ввода-вывода для последовательной операции теперь будет составлять 8 бит, не считая бит обнаружения и исправления ошибок. Таким образом, Exchange будет работать на основе 8-битных байтов, и любые блоки ввода-вывода с менее чем 8 битами на байт оставят оставшиеся биты пустыми. Возникшие пробелы можно будет позже отредактировать, запрограммировав […]
^ Раймонд, Эрик Стивен (2017) [2003]. «определение байта». Архивировано из оригинала 3 апреля 2017 г. Проверено 3 апреля 2017 г.
^ abcd Бемер, Роберт Уильям (8 августа 2000 г.). «Почему байт 8 бит? Или нет?». Виньетки по истории компьютеров . Архивировано из оригинала 3 апреля 2017 г. Проверено 3 апреля 2017 г.
Я пришел работать в IBM и увидел всю путаницу, вызванную ограничением в 64 символа. Особенно когда мы начали думать об обработке текста, которая требует как верхнего, так и нижнего регистра.
    Добавьте 26 строчных букв к 47 существующим, и получится 73 — 9, которые могут представлять более 6 бит.
    Я даже сделал предложение (ввиду STRETCH , самого первого известного мне компьютера с 8-битным байтом), которое расширило бы количество кодов символов перфокарты до 256 [1].
    Некоторые люди отнеслись к этому серьезно. Я думал об этом как о пародии.
    Поэтому некоторые люди начали думать о 7-битных персонажах, но это было смешно. В качестве фона использовался компьютер IBM STRETCH, обрабатывающий 64-символьные слова, делимые на группы по 8 (я разработал набор символов для него под руководством доктора Вернера Бухгольца , человека, который ДЕЙСТВИТЕЛЬНО придумал термин «байт» для 8-битного слова). группировка). [2] Казалось разумным создать универсальный 8-битный набор символов, поддерживающий до 256. В те дни моей мантрой было: «Степень 2 — это магия». И вот группа, которую я возглавлял, разработала и обосновала такое предложение [3].
    Это был слишком большой прогресс, когда его представили группе по стандартизации, которая должна была формализовать ASCII, поэтому на данный момент они остановились на 7-битном наборе или же на 8-битном наборе, в котором верхняя половина осталась для будущей работы.
    IBM 360 использовал 8-битные символы, хотя и не напрямую ASCII. Таким образом, «байт» Бухгольца прижился повсюду. Мне самому это имя не понравилось по многим причинам. В конструкции было 8 бит, перемещающихся параллельно. Но затем появилась новая часть IBM, с 9 битами для самопроверки, как внутри ЦП, так и в стримерах . Я представил прессе этот 9-битный байт в 1973 году. Но задолго до этого, когда я возглавлял операции по программному обеспечению в Cie. Bull во Франции в 1965-66 годах, я настаивал на том, чтобы слово «байт» было устаревшим в пользу « октета ».
    Вы можете заметить, что мое предпочтение тогда стало предпочтительным термином.
    Это оправдано новыми методами связи, которые могут передавать параллельно 16, 32, 64 и даже 128 бит. Но некоторые глупые люди теперь называют «16-битный байт» из-за этой параллельной передачи, которая видна в наборе UNICODE . Я не уверен, но, возможно, это следует назвать « гекстетом ».
    Но вы заметите, что я по-прежнему прав. Степени двойки по-прежнему волшебны!
^ Блаау, Геррит Энн ; Брукс-младший, Фредерик Филлипс ; Бухгольц, Вернер (июнь 1959 г.). «Обработка данных по частям». IRE-транзакции на электронных компьютерах : 121.
^ Дули, Луи Г. (февраль 1995 г.). «Байт: Слово». БАЙТ . Окала, Флорида, США. Архивировано из оригинала 20 декабря 1996 г.
Слово «байт» было придумано примерно с 1956 по 1957 год в лабораториях Линкольна Массачусетского технологического института в рамках проекта под названием SAGE (Североамериканская система противовоздушной обороны), который был совместно разработан Rand , Lincoln Labs и IBM . В ту эпоху структура компьютерной памяти уже определялась размером слова . Слово состояло из х битов ; бит представлял собой двоичную позицию в слове. Операции обычно выполняются со всеми битами полного слова.
Мы придумали слово байт для обозначения логического набора битов, меньшего размера полного слова. В то время он не определялся конкретно как x бит, а обычно назывался набором из 4 битов , поскольку это был размер большинства наших элементов закодированных данных. Вскоре после этого я перешел к другим обязанностям, которые отстранили меня от SAGE. Проведя много лет в Азии, я вернулся в США и был ошеломлен, узнав, что слово байт используется в новой микрокомпьютерной технологии для обозначения базовой адресуемой единицы памяти.
^ Аб Рам, Стефан (17 января 2003 г.). «Erklärung des Wortes «Byte» im Rahmen der Lehre binärer Codes» (на немецком языке). Берлин, Германия: Свободный университет Берлина . Архивировано из оригинала 10 июня 2021 г. Проверено 10 апреля 2017 г.
↑ Происхождение термина «байт», 1956 г., заархивировано из оригинала 10 апреля 2017 г. , получено 17 августа 2022 г.
    Сессия вопросов и ответов на конференции ACM по истории языков программирования включала в себя такой обмен мнениями:

    [ Джон Гуденаф :
    Вы упомянули, что термин «байт» используется в JOVIAL . Откуда взялся этот термин? ]
    [ Жюль Шварц (изобретатель JOVIAL):
    Насколько я помню, AN/FSQ-31 , совершенно другой компьютер, чем 709 , был байт-ориентированным. Я точно не помню, но вполне уверен, что в описании этого компьютера было слово «байт», и мы его использовали. ]
    [ Фред Брукс :
    Могу я поговорить об этом? Вернер Бухгольц придумал это слово как часть определения STRETCH , а AN/FSQ-31 заимствовал его из STRETCH, но Вернер определенно является автором этого слова. ]
    [ Шварц:
    Верно. Спасибо. ]
^ «Список кодов EBCDIC от IBM» . IBM.com . 2020-01-02. Архивировано из оригинала 3 июля 2020 г. Проверено 3 июля 2020 г.
^ Аб Кнут, Дональд (1997) [1968]. Искусство компьютерного программирования: Том 1: Фундаментальные алгоритмы (3-е изд.). Бостон: Аддисон-Уэсли. п. 125. ИСБН 9780201896831.
^ Уильямс, Р.Х. (1969). Британский коммерческий компьютерный дайджест: Серия компьютерных данных Pergamon . Пергамон Пресс . ISBN 1483122107. ISBN 978-1483122106 ^{[ необходимы разъяснения ]}
^ «Ассортимент продукции Philips Data Systems» (PDF) . Филипс . Апрель 1971 г. Архивировано из оригинала (PDF) 4 марта 2016 г. Проверено 3 августа 2015 г.
^ аб
    [
    |*| О битах и байтах: префиксы для двоичных кратных - IEC
    |*| v0: https://web.archive.org/web/20090818042050/http://www.iec.ch/online_news/etech/arch_2003/etech_0503/focus.htm
    |*| версия 1: https://www.iec.ch/prefixes-binary-multiples. Архивировано 16 августа 2021 г. в Wayback Machine ]
^ Префиксы для двоичных кратных. Архивировано 8 августа 2007 г. в Wayback Machine - Справочник NIST по константам, единицам измерения и неопределенности.
^ Мацуока, Сатоши; Сато, Хитоши; Татебе, Осаму; Коибучи, Мичихиро; Фудзивара, Икки; Сузуки, Сюдзи; Какута, Масанори; Исида, Такаши; Акияма, Ютака; Судзумура, Тойотаро; Уэно, Кодзи (15 сентября 2014 г.). «Экстремальные большие данные (EBD): технологии инфраструктуры больших данных следующего поколения на пути к Йоттабайту в год». Перспективы суперкомпьютеров и инновации . 1 (2): 89–107. дои : 10.14529/jsfi140206 . ISSN 2313-8734. Архивировано из оригинала 13 марта 2022 г. Проверено 27 мая 2022 г.
^ «Список резолюций 27-го заседания Генеральной конференции по мерам и весам» (PDF) . 2022-11-18. Архивировано (PDF) из оригинала 18 ноября 2022 г. Проверено 18 ноября 2022 г.
↑ Гибни, Элизабет (18 ноября 2022 г.). «Сколько йоттабайтов в кветтабайте? Экстремальные числа получают новые имена». Природа . дои : 10.1038/d41586-022-03747-9. PMID 36400954. S2CID 253671538. Архивировано из оригинала 16 января 2023 года . Проверено 21 ноября 2022 г.
^ 1977 Disk/Trend Report Rigid Disk Drives, опубликовано в июне 1977 г.
^ USB-накопитель SanDisk. Архивировано 13 мая 2008 г. на Wayback Machine. «Примечание: 1 мегабайт (МБ) = 1 миллион байт; 1 гигабайт (ГБ) = 1 миллиард байт».
^ abc «Как iOS и macOS сообщают о емкости хранилища» . Поддержка Apple . 27 февраля 2018 года. Архивировано из оригинала 9 апреля 2020 года . Проверено 9 января 2022 г.
^ "Политика единиц". Убунту Вики . Убунту. Архивировано из оригинала 18 ноября 2021 года . Проверено 9 января 2022 г.
^ "ConsistentUnitPrefixes" . Дебиан Вики . Архивировано из оригинала 3 декабря 2021 года . Проверено 9 января 2022 г.
↑ Браун, Ричард Дж. К. (27 апреля 2022 г.). «Ответ на «Столкнувшись с нехваткой латинских букв для потенциальных новых символов SI: альтернативное предложение для новых префиксов SI»". Аккредитация и обеспечение качества . 27 (3): 143–144. doi : 10.1007/s00769-022-01499-7. S2CID 248397680.
^ Килобайт - определение и многое другое из бесплатного словаря Merriam-Webster, заархивировано 9 апреля 2010 г. в Wayback Machine . Merriam-webster.com (13 августа 2010 г.). Проверено 7 января 2011 г.
^ Килобайт - Определение килобайта на Dictionary.com. Архивировано 1 сентября 2010 г. на Wayback Machine . Dictionary.reference.com (29 сентября 1995 г.). Проверено 7 января 2011 г.
^ Определение килобайта из Оксфордских онлайн-словарей, архивировано 25 июня 2006 г. в Wayback Machine . Askoxford.com. Проверено 7 января 2011 г.
^ Префиксы для двоичных и десятичных кратных: двоичные и десятичные.
^ «Определение фактического размера диска: почему 1,44 МБ должно быть 1,40 МБ» . Поддержка Майкрософт. 06 мая 2003 г. Архивировано из оригинала 9 февраля 2014 г. Проверено 25 марта 2014 г.
^ «Скорость передачи данных 3G/GPRS» . Водафон Ирландия. Архивировано из оригинала 26 октября 2016 года . Проверено 26 октября 2016 г.
^ «Шкала измерения данных». АТ&Т . Проверено 26 октября 2016 г.^{[ постоянная мертвая ссылка ]}
^ «Мобильный доступ в Интернет» . Оранжевая Румыния. Архивировано из оригинала 26 октября 2016 года . Проверено 26 октября 2016 г.
^ «Условия наших клиентов» (PDF) . Тельстра. п. 7. Архивировано (PDF) из оригинала 10 апреля 2017 г. Проверено 26 октября 2016 г.
^ "Минидискета SA400" . Swtpc.com. 14 августа 2013 г. Архивировано из оригинала 27 мая 2014 г. Проверено 25 марта 2014 г.
^ «Диск-накопитель Shugart Associates SA 400 minifloppy™» (PDF) . Архивировано из оригинала (PDF) 8 июня 2011 г. Проверено 24 июня 2011 г.
^ «Руководство по техническому обслуживанию системы гибких дисков RXS / RX11» (PDF) . Мейнард, Массачусетс: Корпорация цифрового оборудования. Май 1975 г. Архивировано из оригинала (PDF) 23 апреля 2011 г. Проверено 24 июня 2011 г.
^ Отчет IUCr за 1995 г. - Межведомственный комитет ИЮПАК по номенклатуре и символам (IDCNS) http://ww1.iucr.org/iucr-top/cexec/rep95/idcns.htm. Архивировано 19 декабря 2020 г. в Wayback Machine.
^ «Двоичный префикс», факультет компьютерных наук Оклендского университета https://wiki.cs.auckland.ac.nz/stageonewiki/index.php/Binary_prefix. Архивировано 16 октября 2020 г. на Wayback Machine.
^ Национальный институт стандартов и технологий . «Префиксы для двоичных кратных». Архивировано из оригинала 8 августа 2007 г.«В декабре 1998 года Международная электротехническая комиссия (МЭК) [...] утвердила в качестве международного стандарта МЭК имена и символы для префиксов двоичных кратных чисел для использования в области обработки и передачи данных».
^ «Что такое килобайт?» Архивировано из оригинала 6 июня 2011 г. Проверено 20 мая 2010 г.
^ NIST «Префиксы для двоичных кратных» https://physical.nist.gov/cuu/Units/binary.html. Архивировано 14 января 2018 г. в Wayback Machine.
^ Поправка 2 к международному стандарту IEC IEC 60027-2: Буквенные символы, используемые в электротехнике. Часть 2: Телекоммуникации и электроника.
^ «Приказ о выдаче ходатайства об отклонении» (PDF) . Окружной суд США Северного округа Калифорнии . Архивировано (PDF) из оригинала 07 октября 2021 г. Проверено 24 января 2020 г.
^ abc Мук, Нейт (28 июня 2006 г.). «Western Digital устанавливает емкость». Бетаньюс. Архивировано из оригинала 7 сентября 2009 г. Проверено 30 марта 2009 г.
^ Баскин, Скотт Д. (1 февраля 2006 г.). «Краткая информация ответчика Western Digital Corporation в поддержку ходатайства истца о предварительном одобрении». Орин Сафьер против Western Digital Corporation . Корпорация Вестерн Диджитал . Архивировано из оригинала 2 января 2009 г. Проверено 30 марта 2009 г.
^ Судья Питер (26 октября 2007 г.). «Seagate платит за разрешение в гигабайтах». ЗДНет . Архивировано из оригинала 3 сентября 2014 г. Проверено 16 сентября 2014 г.
^ Эллисон Декстер, «Сколько слов в Гарри Поттере?», [1] Архивировано 25 января 2021 г. в Wayback Machine ; показывает 190 637 слов
^ «Килобайты Мегабайты Гигабайты Терабайты (Стэнфордский университет)» . Архивировано из оригинала 08.11.2020 . Проверено 12 декабря 2020 г.
↑ Перенсон, Мелисса Дж. (4 января 2007 г.). «Hitachi представляет жесткий диск емкостью 1 терабайт». www.pcworld.com . Архивировано из оригинала 24 октября 2012 года . Проверено 5 декабря 2020 г.
^ «Как выглядит петабайт?» Архивировано из оригинала 28 января 2018 года . Проверено 19 февраля 2018 г.
^ Гросс, Грант (24 ноября 2007 г.). «Интернет может достичь максимума через 2 года, говорится в исследовании» . Мир ПК . Архивировано из оригинала 26 ноября 2007 года . Проверено 28 ноября 2007 г.
^ «Эра зеттабайтов официально начинается (сколько это стоит?)» . Блоги Cisco . 09.09.2016. Архивировано из оригинала 2 августа 2021 г. Проверено 4 августа 2021 г.
^ Клайн, Маршалл. «Я мог бы представить себе машину с 9-битными байтами. Но уж точно не с 16-битными или 32-битными байтами, верно?». Архивировано из оригинала 21 марта 2019 г. Проверено 18 июня 2015 г.
^ Кляйн, Джек (2008), Целочисленные типы в C и C++, заархивировано из оригинала 27 марта 2010 г. , получено 18 июня 2015 г.
^ Клайн, Маршалл. «Часто задаваемые вопросы по C++: правила относительно байтов, символов и символов». Архивировано из оригинала 21 марта 2019 г. Проверено 18 июня 2015 г.
^ «Внешние интерфейсы/API». Северо-Западный университет. Архивировано из оригинала 9 августа 2018 г. Проверено 2 сентября 2016 г.
^ «Аватар - Последний маг воздуха: Полная серия Blu-ray» . Blu-ray.com . Архивировано из оригинала 28 апреля 2020 г. Проверено 24 февраля 2021 г.

дальнейшее чтение

«2,5-байтовые манипуляции» (PDF) . Программирование с использованием набора инструкций PDP-10 (PDF) . Справочное руководство по системе PDP-10. Том. 1. Корпорация цифрового оборудования (DEC). Август 1969 г., стр. 2-15–2-17. Архивировано (PDF) из оригинала 5 апреля 2017 г. Проверено 05 апреля 2017 г.
Эшли Тейлор. «Биты и байты». Стэнфорд. https://web.stanford.edu/class/cs101/bits-bytes.html