stringtranslate.com

Шестибитный код символа

Шестибитный код символа — это кодировка символов, разработанная для использования на компьютерах с длиной слова , кратной 6. Шесть бит могут кодировать только 64 различных символа, поэтому эти коды обычно включают только заглавные буквы, цифры, некоторые знаки препинания и иногда управляющие символы. Формат магнитной ленты с 7 дорожками был разработан для хранения данных в таких кодах вместе с дополнительным битом четности .

Типы шестибитных кодов

Ранний шестибитный двоичный код использовался для шрифта Брайля — системы чтения для слепых, разработанной в 1820-х годах.

Самые ранние компьютеры работали только с числовыми данными и не предусматривали символьные данные. Шестибитный BCD с несколькими вариантами использовался IBM на ранних компьютерах, таких как IBM 702 в 1953 году и IBM 704 в 1954 году. [1] : стр.35  Шестибитные кодировки были заменены 8-битным кодом EBCDIC , начиная с 1964 года, когда System/360 стандартизировала 8-битные байты . Существует несколько вариантов этого типа кода (см. ниже).

Шестибитные коды символов, как правило, пришли на смену пятибитному коду Бодо и предшествовали семибитному коду ASCII .

Шестибитные коды могли кодировать более 64 символов с помощью символов Shift Out и Shift In , по сути, объединяя два различных набора из 62 символов и переключаясь между ними. Например, популярный коммуникационный терминал IBM 2741 поддерживал различные наборы символов до 88 печатных символов плюс управляющие символы.

Код телетайпа

Специальное 6-уровневое расширение 5-уровневого Международного Телеграфного Алфавита использовалось для дистанционного управления линотипными машинами, начиная примерно с 1930 года. К 1950 году оно широко использовалось телеграфными службами для отправки предварительно отформатированных новостных статей в участвующие газеты. Оно поддерживало 90 печатных символов линотипной машины, а также пробельные символы .

Код TTS имел две пары кодов сдвига, что позволяло в общей сложности четыре состояния сдвига. Первый действовал во многом как клавиша Shift на клавиатуре и выбирал между строчными буквами и цифрами, а также заглавными буквами и символами. Вторая пара кодов сдвига Linotype "нижняя направляющая" и "верхняя направляющая" выбирала альтернативный (обычно курсивный) шрифт.

Шестибитный код BCD

Шестибитный код BCD был адаптацией кода перфокарт к двоичному коду . IBM применила термины двоично-десятичный и BCD к вариациям буквенно-цифровых кодов BCD , которые использовались в большинстве ранних компьютеров IBM, включая IBM 1620 , IBM 1400 series и недесятичные архитектурные элементы IBM 700/7000 series .

Базы данных COBOL шестибитный код

Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно. [ необходима цитата ]

Шестибитный код магнитной полосы карты

Шестибитный код с добавленным битом нечетности используется на дорожке 1 карт с магнитной полосой , как указано в стандарте ISO/IEC 7811-2 .

Код DEC SIXBIT

Популярным шестибитным кодом был DEC SIXBIT. Это просто коды символов ASCII от 32 до 95, закодированные как 0 до 63 путем вычитания 32 (т. е. столбцы 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), смещенные в столбцы 0-3 путем вычитания 2 из старших бит); он включает пробел, знаки препинания, цифры и заглавные буквы, но не содержит управляющих символов. Поскольку он не включал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестисимвольные имена, такие как имена файлов и символы ассемблера, могли храниться в одном 36-битном слове PDP-10 , и три символа помещались в каждое слово PDP-1 , а два символа помещались в каждое слово PDP-8 . См. таблицу ниже.

Другой, менее распространенный вариант получается путем простого удаления старшего бита кода ASCII в диапазоне 32 - 95 (коды 32 - 63 остаются на своих позициях, более высокие значения имеют 64 вычитаемыми из них). Такой вариант иногда использовался на PDP-8 компании DEC (1965).

Шестибитный код ECMA

Шестибитный код, аналогичный коду DEC, но заменяющий несколько знаков препинания наиболее полезными управляющими символами, включая SO/SI , что позволяет расширять код, был определен как ECMA -1 в 1963 году (см. ниже).

Шестибитный код FIELDATA

FIELDATA представлял собой семибитный код (с опциональной четностью), из которого формально были определены только 64 кодовые позиции (занимающие шесть бит). [2] Вариант использовался компьютерами UNIVAC серии 1100. [3] Рассматривая код как шестибитный, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA). [4]

Шестибитный код Брайля

Символы Брайля представлены с помощью шести позиций точек, расположенных в прямоугольнике. Каждая позиция может содержать выпуклую точку или нет, поэтому Брайль можно считать шестибитным двоичным кодом. Некоторые более современные системы Брайля добавляют дополнительные две точки, что делает эти системы восьмибитным кодом.

Шестибитные коды для двоично-текстового кодирования

Передача двоичных данных через системы, которые предназначены только для текста, иногда может вызывать проблемы. Например, электронная почта исторически поддерживала только 7-битные коды ASCII и удаляла 8-й бит, тем самым повреждая двоичные данные, отправленные напрямую через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы, неправильно интерпретируя управляющие символы во время хранения или передачи. Существует ряд схем для упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в пункте назначения. Примерами 6-битных подмножеств символов, используемых для упаковки двоичных данных, являются Uuencode и Base64 . Эти наборы не содержат управляющих символов (только печатные цифры, буквы, некоторые знаки препинания и, возможно, пробел) и позволяют передавать данные через любой носитель, который также способен передавать текст, понятный человеку.

Примеры шестибитных кодов BCD

Компания IBM, доминировавшая в области коммерческой обработки данных, использовала различные шестибитные коды, которые были привязаны к набору символов, используемому на перфокартах , см. BCD (кодировка символов) .

Ниже показаны другие коды символов поставщиков и их эквиваленты в Unicode .

Примеры шестибитных вариантов ASCII

ГОСТ 6-битный код

Пример шестибитных кодов Брайля

В следующей таблице показано расположение символов с шестнадцатеричным значением, соответствующим символом ASCII, 6-битными кодами Брайля (комбинациями точек), глифами Брайля Unicode и общим значением (фактическое значение может меняться в зависимости от контекста). [6] [7]

Смотрите также

Ссылки

  1. ^ Корпорация IBM (1954). Электронная вычислительная машина 704: руководство по эксплуатации (PDF) .
  2. ^ Mackenzie, Charles E. (1980). Coded Character Sets, History and Development (PDF) . The Systems Programming Series (1-е изд.). Addison-Wesley Publishing Company, Inc. ISBN  978-0-201-14460-4. LCCN  77-90165. Архивировано (PDF) из оригинала 26 мая 2016 г. Получено 25 августа 2019 г.
  3. ^ Уокер, Джон (1996-08-06). "UNIVAC 1100 Series FIELDATA Code". UNIVAC Memories . Архивировано из оригинала 2016-05-22 . Получено 2016-05-22 .
  4. ^ Дженнингс, Томас Дэниел (2016-04-20) [1999]. "Аннотированная история некоторых кодов символов или ASCII: Американский стандартный код для проникновения информации". чувствительные исследования (SR-IX) . FIELDATA . Получено 01.06.2022 .
  5. ^ Рэймонд, Эрик С. (2023-06-24). "Декодирование протокола AIVDM/AIVDO". Типы данных полезной нагрузки AIS . Получено 2024-03-14 .
  6. ^ "Представление и отображение шрифта Брайля". DotlessBraille.org . 2002-02-20 . Получено 14.03.2024 .
  7. ^ Халлек, Джон (2000-08-24). "braille-ascii.ads". Braille.Ascii . Архивировано из оригинала 2010-06-13 . Получено 2009-08-10 .

Внешние ссылки