stringtranslate.com

ДЖИС Х 0212

JIS X 0212 — это японский промышленный стандарт , определяющий набор кодированных символов для кодирования дополнительных символов для использования в японском языке. Этот стандарт предназначен для дополнения JIS X 0208 (кодовая страница 952). Кодовая страница IBM имеет номер 953 или 5049 (см. ниже).

Это один из исходных стандартов для унифицированных иероглифов CJK Unicode .

История

В 1990 году Японская ассоциация стандартов (JSA) выпустила дополнительный стандарт набора символов: JIS X 0212-1990 Код дополнительного набора японских графических символов для обмена информацией (情報交換用漢字符号-補助漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo). Кандзи ) . Этот стандарт был предназначен для развития диапазона символов, доступных в основном наборе символов JIS X 0208 , и устранения недостатков в охвате этого набора.

Функции

Диаграмма Эйлера , сравнивающая репертуары JIS X 0208 , JIS X 0212, JIS X 0213 , Windows-31J , стандартного репертуара Microsoft и Unicode .

В стандарте указано 6067 символов, включая:

Кодировки

Следующие кодировки или инкапсуляции используются для использования символов JIS X 0212 в файлах и т. д.

Инкапсуляция символов JIS X 0212 в популярной кодировке Shift JIS невозможна, поскольку Shift JIS не имеет достаточного нераспределенного кодового пространства для символов.

Реализации

Кодировка JIS X 0212 в соответствии с EUC-JP (слева) и кодовой страницей Windows 20932 (справа).

JIS X 0212 называется IBM кодовой страницей 953 и включает расширения поставщиков. [2] [3] [4] Альтернативный CCSID 5049 исключает эти расширения. [5]

Поскольку символы JIS X 0212 не могут быть закодированы в Shift JIS, системе кодирования, которая традиционно доминировала в японской обработке информации, практических реализаций этого набора символов было мало. Как упоминалось выше, его можно закодировать в EUC-JP, который обычно используется в системах Unix/Linux, и именно здесь произошло большинство реализаций:

Многие WWW-браузеры, такие как семейство Netscape/Mozilla/ Firefox , Opera и т. д., а также связанные приложения, такие как Mozilla Thunderbird, поддерживают отображение символов JIS X 0212 в кодировке EUC-JP, однако Internet Explorer не поддерживает символы JIS X 0212. Современные пакеты эмуляции терминала, такие как GNOME Terminal , также поддерживают символы JIS X 0212.

Приложения, поддерживающие JIS X 0212 в кодировке EUC, включают:

JIS X 0212 и Юникод

Кандзи в JIS X 0212 были взяты в качестве одного из источников для унификации Хань , которая привела к созданию унифицированного набора символов CJK в исходном стандарте ISO 10646 / Unicode . Были включены все 5801 кандзи.

Будущее

Если не считать упомянутых выше приложений, стандарт JIS X 0212 фактически мертв. 2743 кандзи из него были включены в более поздний стандарт JIS X 0213 . В долгосрочной перспективе его вкладом, вероятно, станет 5801 кандзи, включенный в Unicode .

Смотрите также

Рекомендации

  1. ^ ван Кестерен, Энн . «5. Индексы (§ Индекс jis0212)». Стандарт кодирования . ЧТОРГ .
  2. ^ «Информационный документ с кодовой страницей 953» . Архивировано из оригинала 17 марта 2016 г.
  3. ^ «Информационный документ CCSID 953» . Архивировано из оригинала 28 марта 2016 г.
  4. ^ Кодовая страница CPGID 00953 (pdf) (PDF) , IBM
  5. ^ «Информационный документ CCSID 5049» . Архивировано из оригинала 27 марта 2016 г.

Внешние ссылки