Телеграфный код — это одна из кодировок символов , используемых для передачи информации по телеграфу . Код Морзе — самый известный из таких кодов. Телеграфия обычно относится к электрическому телеграфу , но телеграфные системы, использующие оптический телеграф, использовались и до этого. Код состоит из ряда кодовых точек , каждая из которых соответствует букве алфавита, цифре или какому-либо другому символу. В кодах, предназначенных для машин, а не для людей, кодовые точки для управляющих символов , таких как возврат каретки , требуются для управления работой механизма. Каждая кодовая точка состоит из ряда элементов, расположенных уникальным образом для этого символа. Обычно существует два типа элементов (двоичный код), но в некоторых кодах, не предназначенных для машин, использовалось больше типов элементов. Например, американская азбука Морзе имела около пяти элементов, а не два (точка и тире) международной азбуки Морзе .
Коды, предназначенные для человеческой интерпретации, были разработаны таким образом, чтобы символы, которые встречались чаще всего, имели наименьшее количество элементов в соответствующей кодовой точке. Например, код Морзе для E , самой распространенной буквы в английском языке, представляет собой одну точку ( ▄ ), тогда как Q — это ▄▄▄ ▄▄▄ ▄ ▄▄▄ . Эти договоренности означали, что сообщение можно было отправить быстрее, и оператору требовалось больше времени, чтобы устать. Телеграфы всегда обслуживались людьми до конца 19 века. Когда появились автоматические телеграфные сообщения, коды с кодовыми точками переменной длины были неудобны для машинного проектирования того периода. Вместо этого использовались коды с фиксированной длиной. Первым из них был код Бодо , пятибитный код . У Бодо было достаточно кодовых точек только для печати в верхнем регистре . Более поздние коды имели больше бит ( в ASCII их семь), так что можно было печатать как заглавные, так и строчные буквы. За пределами телеграфной эпохи современным компьютерам требуется очень большое количество кодовых точек ( Unicode имеет 21 бит), чтобы можно было обрабатывать несколько языков и алфавитов ( наборов символов ) без необходимости менять кодировку символов. Современные компьютеры могут легко обрабатывать коды переменной длины, такие как UTF-8 и UTF-16 , которые теперь стали повсеместными.
До появления электрического телеграфа широко используемым методом построения национальных телеграфных сетей был оптический телеграф, состоящий из цепи башен, с которых сигналы могли передаваться с помощью семафора или ставней от башни к башне. Это было особенно развито во Франции и берет свое начало во время Французской революции . Код, используемый во Франции, был кодом Шаппа, названным в честь изобретателя Клода Шаппа . Британское Адмиралтейство также использовало семафорный телеграф, но со своим собственным кодом. Британский код обязательно отличался от того, который использовался во Франции, потому что британский оптический телеграф работал по-другому. Система Шаппа имела подвижные рычаги, как если бы она размахивала флагами, как в семафоре-флажке . Британская система использовала ряд ставней, которые можно было открывать или закрывать. [1]
Система Шаппа состояла из большой поворотной балки (регулятора) с рычагом на каждом конце (индикаторы), который поворачивался вокруг регулятора на одном конце. Углы, которые разрешалось принимать этим компонентам, были ограничены кратными 45° для облегчения чтения. Это давало кодовое пространство 8×4×8 кодовых точек , но положение индикатора на одной линии с регулятором никогда не использовалось, потому что его было трудно отличить от индикатора, откинутого назад на верхнюю часть регулятора, оставляя кодовое пространство 7×4×7 = 196. Символы всегда формировались с регулятором либо на левой, либо на правой наклонной диагонали (наклонной) и принимались как действительные только тогда, когда регулятор перемещался либо в вертикальное, либо в горизонтальное положение. Левый наклонный всегда использовался для сообщений, а правый наклонный использовался для управления системой. Это еще больше сократило кодовое пространство до 98, из которых либо четыре, либо шесть кодовых точек (в зависимости от версии) были управляющими символами , оставляя кодовое пространство для текста 94 или 92 соответственно.
Система Шаппа в основном передавала сообщения с помощью кодовой книги с большим количеством установленных слов и фраз. Впервые она была использована на экспериментальной цепи башен в 1793 году и введена в эксплуатацию от Парижа до Лилля в 1794 году. Кодовая книга, использовавшаяся в то время, точно неизвестна, но неидентифицированная кодовая книга в Парижском почтовом музее могла быть для системы Шаппа. Расположение этого кода в столбцах по 88 записей привело Хольцмана и Персона к предположению, что могло использоваться 88 кодовых точек. Однако предложение в 1793 году касалось десяти кодовых точек, представляющих цифры 0–9, и Буше говорит, что эта система все еще использовалась вплоть до 1800 года (Хольцман и Персон относят изменение к 1795 году). Кодовая книга была пересмотрена и упрощена в 1795 году для ускорения передачи. Код состоял из двух разделов, первый раздел состоял из 94 буквенных и цифровых символов, а также некоторых часто используемых комбинаций букв. Второе подразделение представляло собой кодовую книгу из 94 страниц с 94 записями на каждой странице. Каждому числу до 94 была назначена кодовая точка. Таким образом, для передачи целого предложения требовалось отправить всего два символа — номера страницы и строки кодовой книги, по сравнению с четырьмя символами при использовании десятисимвольного кода.
В 1799 году были добавлены три дополнительных раздела. Они содержали дополнительные слова и фразы, географические места и имена людей. Эти три раздела требовали добавления дополнительных символов перед символом кода для определения правильной книги. Код был снова пересмотрен в 1809 году и с тех пор оставался стабильным. В 1837 году Габриэль Флокон ввел горизонтальную систему кодирования, которая не требовала перемещения тяжелого регулятора. Вместо этого в центре регулятора был предусмотрен дополнительный индикатор для передачи этого элемента кода. [2]
Система Эделькранца использовалась в Швеции и была второй по величине сетью, построенной после французской. Телеграф состоял из набора из десяти заслонок. Девять из них были расположены в матрице 3×3. Каждый столбец заслонок представлял собой двоично-кодированную восьмеричную цифру с закрытой заслонкой, представляющей «1», и старшей цифрой внизу. Таким образом, каждый символ телеграфной передачи был трехзначным восьмеричным числом. Десятая заслонка была сверхбольшой наверху. Ее смысл заключался в том, что перед кодовой точкой должна стоять «A».
Одним из применений затвора "A" было то, что цифровая кодовая точка, предшествующая "A", означала добавление нуля (умножение на десять) к цифре. Большие числа можно было указать, указав после цифры код для сотен (236), тысяч (631) или их комбинацию. Это требовало передачи меньшего количества символов, чем отправка всех нулевых цифр по отдельности. Однако основным назначением кодовых точек "A" была кодовая книга предопределенных сообщений, во многом похожая на кодовую книгу Шаппа.
Символы без «A» представляли собой большой набор цифр, букв, общих слогов и слов для облегчения сжатия кода . Около 1809 года Эделькранц представил новую кодовую книгу с 5120 кодовыми точками, каждая из которых требовала двухсимвольной передачи для идентификации.
Было много кодовых точек для исправления ошибок (272, ошибка), управления потоком и контрольных сообщений. Обычно сообщения должны были передаваться по всей линии, но были обстоятельства, когда отдельным станциям требовалось общаться напрямую, обычно в управленческих целях. Наиболее распространенной и простой ситуацией была связь между соседними станциями. Для этой цели использовались кодовые точки 722 и 227, чтобы привлечь внимание следующей станции к солнцу или от него соответственно. Для более удаленных станций использовались кодовые точки 557 и 755 соответственно, за которыми следовала идентификация запрашивающей и целевой станций. [3]
Сигнализация флагами широко использовалась для двухточечной сигнализации до появления оптического телеграфа, но было сложно построить общенациональную сеть с ручными флагами. Для достижения большего расстояния между связями требовался гораздо более крупный механический аппарат семафорных телеграфных башен. Однако во время Гражданской войны в США была построена обширная сеть с ручными флагами . Это была система wig-wag , которая использовала код, изобретенный Альбертом Дж. Майером . Некоторые из используемых башен были огромными, до 130 футов, чтобы обеспечить хороший диапазон. Код Майера требовал только одного флага, использующего троичный код . То есть каждый элемент кода состоял из одной из трех отдельных позиций флага. Однако алфавитные кодовые точки требовали только двух позиций, третья позиция использовалась только в управляющих символах . Использование троичного кода в алфавите привело бы к более коротким сообщениям, поскольку в каждой кодовой точке требуется меньше элементов, но двоичную систему легче читать на большом расстоянии, поскольку нужно различать меньше позиций флага. В руководстве Майера также описывается троичный алфавит с фиксированной длиной в три элемента для каждой кодовой точки. [4]
На раннем этапе развития электрического телеграфа было изобретено множество различных кодов . Практически каждый изобретатель создавал свой собственный код, подходящий для своего конкретного аппарата. Самым ранним кодом, который использовался в коммерческих целях на электрическом телеграфе, был пятиигольный телеграфный код Кука и Уитстона (C&W5). Впервые он был использован на Большой Западной железной дороге в 1838 году. Главным преимуществом кода C&W5 было то, что оператору не нужно было его изучать; буквы можно было считывать прямо с табло. Однако его недостатком было то, что для него требовалось слишком много проводов. Был разработан одноигольный код C&W1, для которого требовался только один провод. C&W1 широко использовался в Великобритании и Британской империи.
Некоторые другие страны использовали C&W1, но он так и не стал международным стандартом, и обычно каждая страна разрабатывала свой собственный код. В США использовалась американская азбука Морзе , элементы которой состояли из точек и тире, отличающихся друг от друга длиной импульса тока в телеграфной линии. Этот код использовался в телеграфе, изобретенном Сэмюэлем Морзе и Альфредом Вейлом , и впервые был использован в коммерческих целях в 1844 году. Первоначально у Морзе были кодовые точки только для цифр. Он планировал, что числа, отправляемые по телеграфу, будут использоваться в качестве индекса для словаря с ограниченным набором слов. Вейл изобрел расширенный код, который включал кодовые точки для всех букв, так что можно было отправить любое желаемое слово. Именно код Вейла стал американской азбукой Морзе. Во Франции телеграф использовал телеграф Фуа-Бреге , двухстрелочный телеграф, который отображал стрелки в коде Шаппа, том же коде, что и французский оптический телеграф, который все еще был более широко распространен, чем электрический телеграф во Франции. Для французов это имело большое преимущество, поскольку им не нужно было переучивать своих операторов новому коду. [5]
В Германии в 1848 году Фридрих Клеменс Герке разработал сильно модифицированную версию американской азбуки Морзе для использования на немецких железных дорогах. Американская азбука Морзе имела три разных длины тире и две разные длины пробела между точками и тире в кодовой точке. Код Герке имел только одну длину тире, и все межэлементные пробелы в кодовой точке были равны. Герке также создал кодовые точки для немецких букв умляута , которых нет в английском языке. Многие страны Центральной Европы входили в Германо-Австрийский телеграфный союз. В 1851 году Союз решил принять общий код во всех своих странах, чтобы сообщения могли отправляться между ними без необходимости для операторов перекодировать их на границах. Для этой цели был принят код Герке.
В 1865 году конференция в Париже приняла код Герке в качестве международного стандарта, назвав его Международным кодом Морзе . С некоторыми очень незначительными изменениями это код Морзе , используемый сегодня. Телеграфные стрелочные приборы Кука и Уитстона могли использовать код Морзе, поскольку точки и тире можно было отправлять как левые и правые движения стрелки. К этому времени стрелочные приборы изготавливались с концевыми упорами, которые издавали две отчетливо разные ноты, когда игла касалась их. Это позволяло оператору писать сообщение, не глядя на иглу, что было намного эффективнее. Это было похожее преимущество телеграфа Морзе, в котором операторы могли слышать сообщение по щелчку релейной арматуры. Тем не менее, после того, как британские телеграфные компании были национализированы в 1870 году, Главное почтовое управление решило стандартизировать телеграф Морзе и избавиться от множества различных систем, которые они унаследовали от частных компаний.
В США телеграфные компании отказались использовать международную азбуку Морзе из-за стоимости переподготовки операторов. Они выступили против попыток правительства сделать это законом. В большинстве других стран телеграф контролировался государством, поэтому изменение можно было просто ввести в обязательном порядке. В США не было единого органа, управляющего телеграфом. Скорее, это было множество частных компаний. Это привело к тому, что международным операторам пришлось свободно владеть обеими версиями азбуки Морзе и перекодировать как входящие, так и исходящие сообщения. США продолжали использовать американскую азбуку Морзе на наземных линиях связи ( радиотелеграфия обычно использовала международную азбуку Морзе), и так продолжалось до появления телетайпов, которые требовали совершенно других кодов и делали этот вопрос спорным. [6]
Скорость отправки в ручном телеграфе ограничена скоростью, с которой оператор может отправлять каждый элемент кода. Скорость обычно указывается в словах в минуту . Слова не все имеют одинаковую длину, поэтому буквальный подсчет слов даст разный результат в зависимости от содержания сообщения. Вместо этого слово определяется как пять символов с целью измерения скорости, независимо от того, сколько слов на самом деле содержится в сообщении. Код Морзе и многие другие коды также не имеют одинаковой длины кода для каждого символа слова, что снова вводит переменную, связанную с содержанием. Чтобы преодолеть это, используется скорость оператора, многократно передающего стандартное слово. PARIS классически выбран в качестве этого стандарта, потому что это длина среднего слова в азбуке Морзе. [7]
В американской азбуке Морзе символы, как правило, короче, чем в международной азбуке Морзе. Это отчасти потому, что американская азбука Морзе использует больше точечных элементов, а отчасти потому, что наиболее распространенное тире, короткое тире, короче, чем тире в международной азбуке Морзе — два точечных элемента против трех точечных элементов. В принципе, американская азбука Морзе будет передаваться быстрее, чем международная азбука Морзе, если все остальные переменные равны. На практике есть две вещи, которые отвлекают от этого. Во-первых, американская азбука Морзе, с примерно пятью элементами кодирования, была сложнее для правильной синхронизации при быстрой отправке. Неопытные операторы были склонны отправлять искаженные сообщения, эффект, известный как « свиной Морзе» . Вторая причина заключается в том, что американская азбука Морзе более подвержена межсимвольным помехам (ISI) из-за большей плотности близко расположенных точек. Эта проблема была особенно серьезной на подводных телеграфных кабелях , что делало американскую азбуку Морзе менее подходящей для международной связи. Единственное решение, которое оператор имел немедленно под рукой, чтобы справиться с ISI, — это замедлить скорость передачи. [8]
Код Морзе для нелатинских алфавитов , таких как кириллица или арабское письмо , достигается путем построения кодировки символов для рассматриваемого алфавита с использованием тех же или почти тех же кодовых точек, которые используются в латинском алфавите . Слоговые азбуки , такие как японская катакана , также обрабатываются таким же образом ( код Вабун ). Альтернатива добавления большего количества кодовых точек к коду Морзе для каждого нового символа привела бы к тому, что кодовые передачи были бы очень длинными в некоторых языках. [9]
Языки, использующие логограммы , сложнее обрабатывать из-за гораздо большего количества требуемых символов. Китайский телеграфный код использует кодовую книгу из около 9800 символов (7000 при первоначальном запуске в 1871 году), каждому из которых присвоен четырехзначный номер. Именно эти числа передаются, поэтому китайский код Морзе состоит полностью из цифр. Цифры необходимо искать на принимающей стороне, что делает этот процесс медленным, но в эпоху, когда телеграф широко использовался, опытные китайские телеграфисты могли вспомнить многие тысячи общих кодов по памяти. Китайский телеграфный код до сих пор используется правоохранительными органами, поскольку это однозначный метод записи китайских имен в некитайских письменностях. [10]
Ранние печатные телеграфы продолжали использовать код Морзе, но оператор больше не отправлял точки и тире напрямую с помощью одной клавиши. Вместо этого они управляли клавиатурой пианино с символами, которые нужно было отправить, отмеченными на каждой клавише. Машина генерировала соответствующую точку кода Морзе из нажатия клавиши. Совершенно новый тип кода был разработан Эмилем Бодо , запатентован в 1874 году. Код Бодо представлял собой 5-битный двоичный код, в котором биты отправлялись последовательно . Наличие кода фиксированной длины значительно упростило конструкцию машины. Оператор вводил код с небольшой 5-клавишной клавиатуры пианино, каждая клавиша соответствовала одному биту кода. Как и азбука Морзе, код Бодо был организован так, чтобы свести к минимуму усталость оператора, при этом точки кода, требующие наименьшего количества нажатий клавиш, были назначены наиболее распространенным буквам.
Ранние печатные телеграфы требовали механической синхронизации между отправляющей и принимающей машинами. Печатный телеграф Хьюза 1855 года достиг этого, посылая тире Морзе на каждом обороте машины. Другое решение было принято в сочетании с кодом Бодо. Стартовые и стоповые биты добавлялись к каждому символу при передаче, что позволяло осуществлять асинхронную последовательную связь . Эта схема стартовых и стоповых битов использовалась во всех более поздних основных телеграфных кодах. [11]
На загруженных телеграфных линиях использовался вариант кода Бодо с перфорированной бумажной лентой . Это был код Мюррея, изобретенный Дональдом Мюрреем в 1901 году. Вместо прямой передачи на линию, нажатие клавиш оператора пробивало отверстия в ленте. Каждый ряд отверстий на ленте имел пять возможных позиций для пробивания, соответствующих пяти битам кода Мюррея. Затем лента пропускалась через считывающее устройство ленты, которое генерировало код и отправляло его по телеграфной линии. Преимущество этой системы состояло в том, что несколько сообщений можно было очень быстро отправлять на линию с одной ленты, что позволяло лучше использовать линию, чем при прямом ручном управлении.
Мюррей полностью перестроил кодировку символов, чтобы минимизировать износ машины, поскольку усталость оператора больше не была проблемой. Таким образом, наборы символов исходных кодов Бодо и Мюррея несовместимы. Пяти бит кода Бодо недостаточно для представления всех букв, цифр и знаков препинания, необходимых в текстовом сообщении. Кроме того, для лучшего управления машиной печатным телеграфом требуются дополнительные символы. Примерами этих управляющих символов являются перевод строки и возврат каретки . Мюррей решил эту проблему, введя коды сдвига . Эти коды предписывают принимающей машине изменить кодировку символов на другой набор символов. В коде Мюррея использовались два кода сдвига: сдвиг цифры и сдвиг буквы. Другим управляющим символом, введенным Мюрреем, был символ удаления (DEL, код 11111), который пробивался во всех пяти отверстиях на ленте. Его предполагаемое назначение состояло в том, чтобы удалять ошибочные символы с ленты, но Мюррей также использовал несколько DEL для обозначения границы между сообщениями. Пробив все отверстия, мы получили перфорацию, которую было легко разорвать на отдельные сообщения на принимающей стороне. Вариант кода Бодо-Мюррея стал международным стандартом как Международный телеграфный алфавит № 2 (ITA 2) в 1924 году. «2» в ITA 2 означает, что исходный код Бодо стал основой для ITA 1. ITA 2 оставался стандартным телеграфным кодом, использовавшимся до 1960-х годов и продолжал использоваться в местах и после этого. [12]
Телетайп был изобретен в 1915 году. Это печатающий телеграф с клавиатурой, похожей на пишущую машинку, на которой оператор печатает сообщение. Тем не менее, телеграммы продолжали отправлять только заглавными буквами, поскольку в кодах Бодо-Мюррея или ITA 2 не было места для набора символов нижнего регистра.
Телетайпы быстро были приняты новостными организациями, и развивались « телеграфные службы », поставляющие истории нескольким газетам, но вскоре появилось и дополнительное приложение: отправка готовой копии из городской редакции в удаленную типографию. Ограниченный набор символов 5-уровневых кодов означал, что кому-то приходилось вручную перепечатывать телеграмму в смешанном регистре, что было трудоемкой и подверженной ошибкам операцией.
Система Monotype уже имела отдельные клавиатуры и ролики, сообщающиеся посредством бумажной ленты, но она использовала очень широкую 28-позиционную бумажную ленту для выбора одной из 15 строк и 15 столбцов в матричном корпусе . Чтобы конкурировать, компания Mergenthaler Linotype разработала систему TeleTypeSetter (TTS), которая функционировала аналогично, но использовала более узкий 6-уровневый код (название «bit» появится только в 1948 году ), который был более экономичным для передачи. TTS сохранила управляющие символы shift и unshift , но они работали во многом как современная клавиатура: состояние unshift обеспечивало строчные буквы, цифры и общие знаки препинания, в то время как состояние shift обеспечивало заглавные буквы и специальные символы. TTS также включала специфические для Linotype функции, такие как лигатуры и вторая функция shift «верхней направляющей», обычно используемая для курсивного шрифта .
«Перфоратор», похожий на пишущую машинку, создавал бумажную ленту и имел большой циферблат, показывающий длину строки на данный момент при минимальной и максимальной ширине пробела , чтобы машинистка могла решить, где прерывать строки. Затем эта лента передавалась в «реперфоратор», а воссозданная бумажная лента подавалась в линотип с ленточным считывателем на типографии. (Ленточный считыватель можно было модернизировать в существующем линотипе, но также были созданы специальные высокоскоростные линотипы, которые могли работать быстрее, чем печатать вручную оператор.)
Оператору по-прежнему требовалось работать с лентами, переносить готовые шрифты на макет, добавлять металлическую литеру по мере необходимости, устранять замятия и т. д., но один оператор мог управлять несколькими линотипными машинами.
Чтобы сохранить перфорацию подачи в середине ленты, код TTS добавил строку "0" рядом со строкой "1" в ITA-2. Чтобы показать сходство с кодом ITS-2, следующие таблицы отсортированы так, как будто это самый значимый бит.
Каждое состояние сдвига имеет 41 уникальный символ, что в сумме составляет 82. Если добавить 8 символов фиксированной ширины, которые дублируются в двух состояниях сдвига, это соответствует 90-матрицной емкости стандартной машины линотипа. (Пробелы переменной ширины — это 91-й символ.)
Первые компьютеры использовали существующие 5-битные клавиатуры и принтеры ITA-2 из-за их доступности, но ограниченный набор символов быстро стал проблемой.
К 1960-м годам усовершенствование технологии телетайпа означало, что более длинные коды уже не были столь значимым фактором в стоимости телетайпа, как когда-то. Пользователи компьютеров хотели строчные символы и дополнительную пунктуацию, в то время как и производители телетайпов, и производители компьютеров хотели избавиться от кодов сдвига. Это привело к тому, что Американская ассоциация стандартов разработала 7-битный код, Американский стандартный код для обмена информацией ( ASCII ). Окончательная форма ASCII была опубликована в 1964 году, и она быстро стала стандартным кодом телетайпа. ASCII был последним основным кодом, разработанным явно для телеграфного оборудования. После этого телеграфия быстро пришла в упадок и была в значительной степени заменена компьютерными сетями , особенно Интернетом в 1990-х годах.
ASCII имел несколько функций, направленных на помощь в программировании компьютеров. Буквенные символы располагались в числовом порядке кодовой точки, поэтому алфавитную сортировку можно было осуществить, просто отсортировав данные по числам. Кодовая точка для соответствующих заглавных и строчных букв отличалась только значением бита 6, что позволяло сортировать смесь регистров по алфавиту, если этот бит игнорировался. Были введены и другие коды, в частности EBCDIC от IBM, полученный из метода ввода с помощью перфокарт , но именно ASCII и его производные победили в качестве лингва-франка обмена компьютерной информацией. [18]
Появление микропроцессора в 1970-х годах и персонального компьютера в 1980-х годах с его 8-битной архитектурой привело к тому, что 8-битный байт стал стандартной единицей хранения данных в компьютере. Упаковка 7-битных данных в 8-битное хранилище неудобна для извлечения данных. Вместо этого большинство компьютеров хранили один символ ASCII на байт. Это оставляло один бит, который не делал ничего полезного. Производители компьютеров использовали этот бит в расширенном ASCII , чтобы преодолеть некоторые ограничения стандартного ASCII. Основная проблема заключалась в том, что ASCII был приспособлен к английскому языку, особенно американскому английскому, и в нем отсутствовали акцентированные гласные, используемые в других европейских языках, таких как французский. Символы валют других стран также были добавлены в набор символов. К сожалению, разные производители реализовали разные расширенные ASCII, что сделало их несовместимыми между платформами . В 1987 году Международная организация по стандартизации выпустила стандарт ISO 8859-1 для 8-битной кодировки символов на основе 7-битной ASCII, которая получила широкое распространение.
Кодировки символов ISO 8859 были разработаны для нелатинских шрифтов, таких как кириллица , иврит , арабский и греческий . Это все еще было проблематично, если документ или данные использовали более одного шрифта. Требовалось несколько переключений между кодировками символов. Это было решено публикацией в 1991 году стандарта для 16-битного Unicode , который разрабатывался с 1987 года. Unicode поддерживал символы ASCII в тех же кодовых точках для совместимости. Помимо поддержки нелатинских шрифтов, Unicode предоставлял кодовые точки для логограмм, таких как китайские иероглифы , и многих специальных символов, таких как астрологические и математические символы. В 1996 году Unicode 2.0 допускал кодовые точки больше 16 бит; до 20 бит и 21 бит с дополнительной областью частного использования. 20-битный Unicode обеспечивал поддержку вымерших языков, таких как старое курсивное письмо и многих редко используемых китайских иероглифов. [19]
В 1931 году Международный свод сигналов , изначально созданный для связи на судах посредством подачи сигналов с помощью флагов, был расширен за счет добавления набора пятибуквенных кодов для использования радиотелеграфистами.
Альтернативное представление кодов игл — использовать цифру «1» для левой иглы и «3» для правой иглы. Цифра «2», которая не появляется в большинстве кодов, представляет иглу в нейтральном вертикальном положении. Кодовые точки, использующие эту схему, отмечены на лицевой стороне некоторых инструментов для игл, особенно тех, которые используются для обучения. [32]
При использовании с печатным телеграфом или сифонным самописцем «тире» кодов точка-тире часто делаются той же длины, что и «точка». Обычно отметка на ленте для точки делается над отметкой для тире. Пример этого можно увидеть в коде Штейнгеля 1837 года, который почти идентичен коду Штейнгеля 1849 года, за исключением того, что они представлены в таблице по-разному. Международная азбука Морзе обычно использовалась в этой форме на подводных телеграфных кабелях . [40]