Китайский телеграфный код , китайский телеграфный код или китайский торговый код ( упрощенный китайский :中文电码; традиционный китайский :中文電碼; пиньинь : Чжунвэнь дианмо или упрощенный китайский :中文电报码; традиционный китайский :中文電報碼; пиньинь : дианбаома ) [1] — четырёхзначный десятичный код ( кодировка символов ) для электротелеграфных сообщений, написанных китайскими иероглифами .
Для кодирования и декодирования китайского телеграфного кода предоставляется кодовая книга. Она показывает однозначное соответствие между китайскими иероглифами и четырехзначными числами от 0000
до 9999
. Китайские иероглифы расположены и пронумерованы в словарном порядке в соответствии с их радикалами и штрихами. На каждой странице книги показано 100 пар китайского иероглифа и числа в таблице 10×10. Старшие две цифры кода соответствуют номеру страницы, следующая цифра соответствует номеру строки, а младшая цифра соответствует номеру столбца, причем 1 соответствует столбцу в крайнем правом положении. Например, код 0022
иероглифа中(zhōng), означающего «центр», приведен на странице 00, строке 2, столбце 2 кодовой книги, а код 2429
иероглифа文(wén), означающего «письмо», приведен на странице 24, строке 2, столбце 9. В Стандартной кодовой книге телеграфных сообщений КНР (Министерство почт и телекоммуникаций, 2002 г.) приведены коды приблизительно для 7000 китайских иероглифов.
Отправители преобразуют свои сообщения, написанные китайскими иероглифами, в последовательность цифр в соответствии с кодовой книгой. Например, фраза中文信息(Zhōngwén xìnxī), означающая «информация на китайском языке», преобразуется в код как 0022 2429 0207 1873
. Она передается с помощью кода Морзе . Получатели декодируют код Морзе, чтобы получить последовательность цифр, разбивают его на массив четверок, а затем декодируют их одну за другой, ссылаясь на книгу. Из-за того, что нецифровые символы не использовались, коды Морзе для цифр могли быть упрощены, например, несколько последовательных тире можно было заменить одним тире.
В кодовой книге также определены коды для алфавита чжуинь , латинского алфавита, кириллицы и различных символов, включая специальные символы для месяцев, дней месяца и часов.
Отправители могут переводить свои сообщения в числа самостоятельно или заплатить небольшую плату за их перевод телеграфистом. [2] Китайские опытные телеграфисты помнили несколько тысяч кодов наиболее частого использования.
The Standard Telegraph Codebook дает альтернативный трехбуквенный код ( AAA
, AAB
, ...) для китайских иероглифов. Он сжимает телеграммы и снижает международные сборы на 25% по сравнению с четырехзначным кодом. [3]
Поиск символа по номеру прост: страница, строка, столбец. Однако поиск числа по символу сложнее, так как требует анализа символа. Метод четырех углов был разработан в 1920-х годах, чтобы позволить людям легче находить символы по форме, и по сей день используется как китайский метод ввода для компьютеров .
Телеграфия пришла в Китай в 1871 году, когда недавно проложенный кабель между Шанхаем и Гонконгом соединил Китай эпохи Цин с международной телеграфной системой, в которой доминировала Британия. [4] : 36
Первый телеграфный код для китайского языка был введен в употребление вскоре после того, как Great Northern Telegraph Company (大北電報公司/大北电报公司Dàběi Diànbào Gōngsī) ввела телеграфию в Китае в 1871 году. Септим Огюст Вигье, француз и таможенник в Шанхае, опубликовал книгу кодов (Viguier 1872), продолжив более раннюю работу датского астронома Ганса Карла Фредерика Кристиана Шьеллерупа . Шьеллеруп и Вигье выбрали небольшое подмножество обычно используемых китайских иероглифов и присвоили каждому символу четырехзначный код от 0001 до 9999. [4] : 36 В результате десятки тысяч китайских иероглифов просто не были включены в телеграфию. [4] : 36
Учитывая недостаточность и беспорядок символов прежнего кодекса, Чжэн Гуаньин в 1881 году составил новую книгу кодов. Она действовала до тех пор, пока Министерство транспорта и коммуникаций не напечатало новую книгу в 1929 году. В 1933 году к книге было добавлено дополнение.
После создания Китайской Народной Республики в 1949 году кодовая книга разделилась на две разные версии из-за изменений, сделанных в материковом Китае и на Тайване независимо друг от друга. Версия для материкового Китая, Стандартная телеграфная кодовая книга , приняла упрощенные китайские иероглифы в 1983 году.
Китайский телеграфный код может быть использован для китайского метода ввода для компьютеров . Обычные пользователи компьютеров сегодня едва ли осваивают его, поскольку он требует большого механического запоминания. Однако используется связанный с ним метод четырех углов , который позволяет искать символы по форме.
Идентификационные карты резидента Гонконга и Макао отображают китайский телеграфный код для китайского имени владельца. Деловые формы, предоставляемые правительством и корпорациями в Гонконге, часто требуют заполнения телеграфных кодов для китайских имен. Коды помогают вводить китайские иероглифы в компьютер. При заполнении формы DS-160 для визы в США китайские телеграфные коды требуются, если у заявителя есть имя, написанное китайскими иероглифами.
Китайский телеграфный код широко используется в расследованиях правоохранительных органов по всему миру, которые связаны с этническими китайцами, где различные фонетические написания китайских имен могут создавать путаницу. Диалектические различия (г-н У на мандаринском становится г-ном Нг на кантонском диалекте (吳先生); в то время как г-н У на кантонском диалекте станет г-ном Ху на мандаринском диалекте (胡先生)) и различные системы романизации (г-н Сяо в системе Ханьюй Пиньинь и г-н Сяо в системе Уэйда-Джайлса ) могут создавать серьезные проблемы для следователей, но их можно устранить путем применения китайского телеграфного кода. Например, исследователи, отслеживающие человека на Тайване по имени Сяо Ай-Куо, могут не знать, что это тот же человек, который в материковом Китае известен как Сяо Айго, а в Гонконге как Сиу Ой-Квок, пока коды не будут проверены на наличие настоящих китайских иероглифов, чтобы определить все совпадения, например, CTC: 5618/1947/0948 для 萧爱国 (упрощенный) / 蕭愛國 (традиционный). [5]
Unihan_OtherMappings.txt
).