Шестибитный код символов — это кодировка символов , предназначенная для использования на компьютерах с длиной слова , кратной 6. Шесть битов могут кодировать только 64 различных символа, поэтому эти коды обычно включают только заглавные буквы, цифры и некоторые знаки пунктуации. , а иногда и управляющие символы. Для хранения данных в таких кодах был разработан формат 7-дорожечной магнитной ленты вместе с дополнительным битом четности .
Ранний шестибитный двоичный код использовался для Брайля , системы чтения для слепых, разработанной в 1820-х годах.
Самые ранние компьютеры работали только с числовыми данными и не предусматривали символьных данных. Шестибитный BCD , с несколькими вариантами, использовался IBM на ранних компьютерах, таких как IBM 702 в 1953 году и IBM 704 в 1954 году. [1] : стр.35 Шестибитные кодировки были заменены 8-битным кодом EBCDIC . начиная с 1964 года, когда System/360 стандартизировал 8-битные байты . Существует несколько вариантов этого типа кода (см. ниже).
Шестибитные коды символов обычно следовали за пятибитным кодом Бодо и предшествовали семибитному ASCII .
Шестибитные коды могут кодировать более 64 символов с помощью символов Shift Out и Shift In , по существу объединяя два отдельных набора по 62 символа и переключаясь между ними. Например, популярный коммуникационный терминал IBM 2741 поддерживал различные наборы символов, содержащие до 88 печатных символов плюс управляющие символы.
Шестибитный двоично- десятичный код представлял собой адаптацию кода перфокарты к двоичному коду . IBM применила термины « двоично-десятичный » и «BCD» к вариантам буквенно -цифрового кодирования BCD , использовавшимся в большинстве ранних компьютеров IBM, включая IBM 1620 , IBM 1400 series и члены недесятичной архитектуры серии IBM 700/7000 .
Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно. [ нужна цитата ]
Шестибитный код с добавленным битом нечетной четности используется на дорожке 1 карт с магнитной полосой , как указано в ISO/IEC 7811-2 .
Популярным шестибитным кодом был DEC SIXBIT. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63 путем вычитания 32 (т. е. столбцы 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутые к столбцам с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не содержит управляющих символов. Поскольку он не содержал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестисимвольные имена, такие как имена файлов и ассемблерные символы , могут храниться в одном 36-битном слове PDP -10 , при этом три символа помещаются в каждое слово PDP -1 , а два символа — в каждое слово PDP . -8 . См. таблицу ниже.
Другой, менее распространенный вариант получается путем удаления старшего бита кода ASCII в диапазоне 32–95 (коды 32–63 остаются на своих позициях, из них вычитается 64). Такой вариант иногда использовался на PDP-8 от DEC (1965 г.).
Шестибитный код, аналогичный коду DEC, но с заменой нескольких знаков препинания наиболее полезными управляющими символами, включая SO/SI , допускающий расширение кода, был указан как ECMA -1 в 1963 году (см. ниже).
FIELDATA представлял собой семибитный код (с необязательной четностью), из которого формально были определены только 64 позиции кода (занимающие шесть бит). [2] Вариант использовался компьютерами UNIVAC серии 1100. [3] Рассматривая код как шестибитный код, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA). [4]
Символы Брайля представлены шестью точками, расположенными в прямоугольнике. Каждая позиция может содержать выпуклую точку или нет, поэтому Брайль можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют дополнительные две точки, превращая эти системы в восьмибитный код.
Передача двоичных данных по системам, предназначенным только для текста, иногда может создавать проблемы. Например, электронная почта исторически поддерживала только 7-битные коды ASCII и удаляла 8-й бит, тем самым повреждая двоичные данные, отправляемые непосредственно через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи. Существует ряд схем упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в пункте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают Uuencode и Base64 . Эти наборы не содержат управляющих символов (только печатные цифры, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные по любой среде, которая также способна передавать удобочитаемый текст.
IBM, которая доминировала в сфере коммерческой обработки данных, использовала различные шестибитные коды, которые были привязаны к набору символов, используемому на перфокартах , см. BCD (кодировка символов) .
Коды символов других производителей показаны ниже вместе с их эквивалентами в Юникоде .
В следующей таблице показано расположение символов с указанием шестнадцатеричного значения, соответствующего символа ASCII, 6-битных кодов Брайля (комбинаций точек), символов Юникода Брайля и общего значения (фактическое значение может меняться в зависимости от контекста). [6] [7]
{{cite book}}
: |work=
игнорируется ( помощь )