Основной китайский набор CCITT [ 2] представляет собой многобайтовый набор графических символов для китайской связи, созданный для Консультативного комитета по международной телефонии и телеграфу (CCITT) в 1992 году . [3] Он определен в ITU T.101 , приложение C, который кодифицирует синтаксис данных 2 Videotex . [2] Он зарегистрирован в реестре ISO-IR для использования с ISO/IEC 2022 как ISO-IR-165 , [4] и кодируется в кодовой версии ISO-2022-CN-EXT . [1]
Это расширенная модификация GB/T 2312-80 , соответствующая объединению стандартов GB материкового Китая GB 6345.1-86 и GB 8565.2-88 с некоторыми дальнейшими модификациями и расширениями. Подмножество расширений GB 6345.1 включено в GB 18030 , а GB 8565.2 служит ссылкой на источник в материковом Китае для некоторых унифицированных иероглифов CJK .
GB 6345.1-86 ( Набор точечно-матричных шрифтов размером 32 × 32 китайских иероглифов для обмена информацией ) включает как исправление , так и расширение для GB 2312. [3] Исправление изменяет следующие два символа:
Развернутые реализации, включающие GB 2312, такие как кодовая страница Windows 936 , обычно следуют этим исправлениям при сопоставлении 79-81 с U+953A. [7]
Расширение добавляет символы ISO 646-CN половинной ширины в строке 10 (в дополнение к существующим символам полной ширины в строке 3) и расширяет набор из 26 символов пиньинь , не входящих в ASCII, в строке 8 шестью дополнительными такими символами. Эти расширения GB 6345.1 также включены в GB/T 12345 , традиционный китайский аналог GB 2312, в дополнение к 29 формам вертикального представления в строке 6. [3] [8]
Более поздний GB/T 6345.1-2010, опубликованный в 2011 году, официально добавляет формы половинной ширины из 32 символов пиньинь (включая шесть новых дополнений) в строке 8 к строке 11. [9] Это дополнение не представлено в GB 18030. [6]
Шесть дополнительных символов пиньинь из GB 6345.1 и формы вертикального представления из GB 12345 — но не формы половинной ширины — включены в классическую кодировку Mac OS для упрощенного китайского языка (модификация EUC-CN ), [10] , а также как двухбайтовые коды в GB 18030 . [6] Дополнительные символы пиньинь: [10]
Эти расширения и модификации GB 2312 были впервые представлены в GB 5007.1-85 в 1985 году.
GB 8565.2-88 ( Обработка информации. Наборы кодированных символов для текстовой связи. Часть 2: Графические символы ) определяет расширение для GB 2312, добавляя 705 символов между строками 13–15 и 90–94, из которых 69 (все в строке 15). не являются ханзи. Он включает исправления GB 2312 из GB 6345.1, но не его расширения. [3]
База данных Unihan ссылается на GB 8565.2 как на материковый китайский источник нескольких ханьцзы, включенных в Unicode . Его исходное сокращение Unihan — G8
. [2]
ISO-IR-165 включает расширения GB 2312 из GB 6345.1-86 и GB 8565.2-88. [3] Кроме того, он добавляет еще 161 иероглиф (включая 139 ханьцзы, определенных как «общекитайские иероглифы и их варианты»). [3] [4] Эти расширения CCITT hanzi иногда ошибочно принимались за стандартные символы GB 8565.2, в том числе в предыдущих версиях базы данных Unihan . [2] Всего в наборе 8446 символов.
В строку 6 включено несколько узорчатых полуграфических символов . [4] Это противоречит формам вертикального представления, включенным в другие расширения, такие как Mac OS Simplified Chinese [10] и GB 18030. [6]
Исправления GB 6345.1 к GB 2312 применяются, но два сопоставления Unicode меняются местами по сравнению с другими кодировками, которые включают GB 2312 с расширениями GB 6345.1. В таблице ниже показаны сопоставления и соответствующие им глифы, включая GB 18030 :
{{cite book}}
: |work=
игнорируется ( помощь ){{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )