stringtranslate.com

ГБ 12345

GB 12345 [ 1] под названием «Дополнительный набор кодов китайских иероглифов для обмена информацией» ( китайский :信息交換用漢字編碼字符集輔助集), является стандартом набора традиционных китайских символов, установленным Китаем , и может считаться традиционным аналогом GB 2312. Он используется в качестве кодировки традиционных китайских символов, хотя и не так широко используется, как Big5 . Он содержит 6866 символов и не имеет никакой связи или совместимости с Big5 и CNS 11643 .

Персонажи

Символы в GB 12345 расположены в сетке 94×94 (как в ISO/IEC 2022 ), а двухбайтовая кодовая точка каждого символа выражается в форме qu - wei , которая определяет строку ( qu区) и положение символа в строке (ячейка, wei位).

Строки (пронумерованные от 1 до 94) содержат следующие символы: [2]

Строки 10–15 и 90–94 не назначены.

Кодировки

Спецификация для кодировки ISO-2022-CN-EXT гласит, что последовательность, ESC $ )за которой следует еще не определенный байт (показанный заполнителем <X12345>), может использоваться для обозначения символов GB 12345 , аналогично последовательности ESC $ ) A(также с ESC $ )префиксом), указывающей GB 2312 , но только после того, как она получит регистрацию в реестре ISO-IR , указывающую, какой последний байт последовательности. [3] По состоянию на 2023 год такой регистрации не существует. [4] Однако тот же Запрос на комментарии также определяет метку кодировки CN-GB-12345для GB 12345, используемую с ASCII, аналогично EUC-CN . [3]

Включение нестандартных традиционных китайских иероглифов

В стандарт GB/T 12345 включено несколько традиционных иероглифов, которые отличаются от таблицы соответствий между упрощенными китайскими иероглифами и традиционными китайскими иероглифами в стандартном Общем списке упрощенных китайских иероглифов .

GB 12345 и Unicode

Символы в GB 12345 были взяты в качестве одного из источников для унификации Хань , что привело к унифицированному набору символов CJK в первоначальном стандарте ISO 10646 / Unicode . Все 6866 китайских символов были включены.

Смотрите также

Ссылки

  1. ^ "GB/T 12345-1990: Код набора китайских идеограмм для обмена информацией — Дополнительный набор". Администрация по стандартизации Китайской Народной Республики . Получено 2022-10-01 .
  2. ^ Лунде, Кен (2009). Обработка информации CJKV: китайская, японская, корейская и вьетнамская вычислительная техника (2-е изд.). Севастополь, Калифорния : O'Reilly . С. 99–103. ISBN 978-0-596-51447-1.
  3. ^ ab Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). Китайская кодировка символов для сообщений в Интернете. IETF . doi : 10.17487/RFC1922 . RFC 1922. Примечание: в настоящее время некоторые наборы GB не зарегистрированы в ISO. Здесь <X7589>, <X7590>, <X12345>, <X13131> и <X13132> представляют собой конечный символ, который будет назначен ISO для этих наборов. Эти наборы GB должны использоваться только после назначения этих конечных символов.
  4. ^ ISO-IR: Международный регистр кодированных наборов символов ISO/IEC для использования с управляющими последовательностями (PDF) (Индекс реестра). ITSCJ/ IPSJ .

Внешние ссылки