stringtranslate.com

Шестибитный код символа

Шестибитный код символов — это кодировка символов , предназначенная для использования на компьютерах с длиной слова , кратной 6. Шесть битов могут кодировать только 64 различных символа, поэтому эти коды обычно включают только заглавные буквы, цифры и некоторые знаки пунктуации. , а иногда и управляющие символы. Для хранения данных в таких кодах был разработан формат 7-дорожечной магнитной ленты вместе с дополнительным битом четности .

Виды шестибитных кодов

Ранний шестибитный двоичный код использовался для Брайля , системы чтения для слепых, разработанной в 1820-х годах.

Самые ранние компьютеры работали только с числовыми данными и не предусматривали символьных данных. Шестибитный BCD , с несколькими вариантами, использовался IBM на ранних компьютерах, таких как IBM 702 в 1953 году и IBM 704 в 1954 году. [1] : стр.35  Шестибитные кодировки были заменены 8-битным кодом EBCDIC . начиная с 1964 года, когда System/360 стандартизировал 8-битные байты . Существует несколько вариантов этого типа кода (см. ниже).

Шестибитные коды символов обычно следовали за пятибитным кодом Бодо и предшествовали семибитному ASCII .

Шестибитные коды могут кодировать более 64 символов с помощью символов Shift Out и Shift In , по существу объединяя два отдельных набора по 62 символа и переключаясь между ними. Например, популярный коммуникационный терминал IBM 2741 поддерживал различные наборы символов, содержащие до 88 печатных символов плюс управляющие символы.

Шестибитный BCD-код

Шестибитный двоично- десятичный код представлял собой адаптацию кода перфокарты к двоичному коду . IBM применила термины « двоично-десятичный » и «BCD» к вариантам буквенно -цифрового кодирования BCD , использовавшимся в большинстве ранних компьютеров IBM, включая IBM 1620 , IBM 1400 series и члены недесятичной архитектуры серии IBM 700/7000 .

Шестибитный код баз данных COBOL

Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно. [ нужна цитата ]

Шестибитный код карты с магнитной полосой

Шестибитный код с добавленным битом нечетной четности используется на дорожке 1 карт с магнитной полосой , как указано в ISO/IEC 7811-2 .

Декабрьский шестибитный код

Популярным шестибитным кодом был DEC SIXBIT. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63 путем вычитания 32 (т. е. столбцы 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутые к столбцам с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не содержит управляющих символов. Поскольку он не содержал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестисимвольные имена, такие как имена файлов и ассемблерные символы , могут храниться в одном 36-битном слове PDP -10 , при этом три символа помещаются в каждое слово PDP -1 , а два символа — в каждое слово PDP . -8 . См. таблицу ниже.

Другой, менее распространенный вариант получается путем удаления старшего бита кода ASCII в диапазоне 32–95 (коды 32–63 остаются на своих позициях, из них вычитается 64). Такой вариант иногда использовался на PDP-8 от DEC (1965 г.).

Шестибитный код ECMA

Шестибитный код, аналогичный коду DEC, но с заменой нескольких знаков препинания наиболее полезными управляющими символами, включая SO/SI , допускающий расширение кода, был указан как ECMA -1 в 1963 году (см. ниже).

ПОЛЕ ДАННЫХ шестибитный код

FIELDATA представлял собой семибитный код (с необязательной четностью), из которого формально были определены только 64 позиции кода (занимающие шесть бит). [2] Вариант использовался компьютерами UNIVAC серии 1100. [3] Рассматривая код как шестибитный код, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA). [4]

Шестибитный код Брайля

Символы Брайля представлены шестью точками, расположенными в прямоугольнике. Каждая позиция может содержать выпуклую точку или нет, поэтому Брайль можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют дополнительные две точки, превращая эти системы в восьмибитный код.

Шестибитные коды для кодирования двоичного текста в текст.

Передача двоичных данных по системам, предназначенным только для текста, иногда может создавать проблемы. Например, электронная почта исторически поддерживала только 7-битные коды ASCII и удаляла 8-й бит, тем самым повреждая двоичные данные, отправляемые непосредственно через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи. Существует ряд схем упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в пункте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают Uuencode и Base64 . Эти наборы не содержат управляющих символов (только печатные цифры, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные по любой среде, которая также способна передавать удобочитаемый текст.

Примеры шестибитных BCD-кодов

IBM, которая доминировала в сфере коммерческой обработки данных, использовала различные шестибитные коды, которые были привязаны к набору символов, используемому на перфокартах , см. BCD (кодировка символов) .

Коды символов других производителей показаны ниже вместе с их эквивалентами в Юникоде .

Примеры шестибитных вариантов ASCII

ГОСТ 6-битный код

Пример шестибитных кодов Брайля

В следующей таблице показано расположение символов с указанием шестнадцатеричного значения, соответствующего символа ASCII, 6-битных кодов Брайля (комбинаций точек), символов Юникода Брайля и общего значения (фактическое значение может меняться в зависимости от контекста). [6] [7]

Смотрите также

Рекомендации

  1. ^ Корпорация IBM (1954). Электронная машина обработки данных 704: инструкция по эксплуатации (PDF) .
  2. ^ Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие (1-е изд.). Аддисон-Уэсли Паблишинг Компани, Инк. с. 64. ИСБН 0-201-14460-3. LCCN  77-90165 . Проверено 22 мая 2016 г. {{cite book}}: |work=игнорируется ( помощь )
  3. ^ Уокер, Джон (6 августа 1996 г.). «Код ПОЛЕВЫХ ДАННЫХ UNIVAC серии 1100». УНИВАК Воспоминания . Архивировано из оригинала 22 мая 2016 г. Проверено 22 мая 2016 г.
  4. ^ Дженнингс, Томас Дэниел (20 апреля 2016 г.) [1999]. «Аннотированная история некоторых кодов символов или ASCII: американский стандартный код для проникновения информации». чувствительные исследования (SR-IX) . ПОЛЕВЫЕ ДАННЫЕ . Проверено 1 июня 2022 г.
  5. ^ Раймонд, Эрик С. (29 августа 2017 г.). «Типы полезных данных AIS». catb.org . Проверено 16 ноября 2017 г.
  6. ^ «Представление и отображение шрифта Брайля». DotlessBraille.org . 20 февраля 2002 г. Проверено 9 августа 2009 г.
  7. ^ Халлек, Джон (24 августа 2000 г.). "braille-ascii.ads". Брайль.Ascii . Проверено 10 августа 2009 г.

Внешние ссылки