JIS X 0212 — это японский промышленный стандарт , определяющий набор кодированных символов для кодирования дополнительных символов для использования в японском языке. Этот стандарт предназначен для дополнения JIS X 0208 (кодовая страница 952). Кодовая страница IBM имеет номер 953 или 5049 (см. ниже).
Это один из исходных стандартов для унифицированных иероглифов CJK Unicode .
В 1990 году Японская ассоциация стандартов (JSA) выпустила дополнительный стандарт набора символов: JIS X 0212-1990 Код дополнительного набора японских графических символов для обмена информацией (情報交換用漢字符号-補助漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo). Кандзи ) . Этот стандарт был предназначен для развития диапазона символов, доступных в основном наборе символов JIS X 0208 , и устранения недостатков в охвате этого набора.
В стандарте указано 6067 символов, включая:
Следующие кодировки или инкапсуляции используются для использования символов JIS X 0212 в файлах и т. д.
Инкапсуляция символов JIS X 0212 в популярной кодировке Shift JIS невозможна, поскольку Shift JIS не имеет достаточного нераспределенного кодового пространства для символов.
JIS X 0212 называется IBM кодовой страницей 953 и включает расширения поставщиков. [2] [3] [4] Альтернативный CCSID 5049 исключает эти расширения. [5]
Поскольку символы JIS X 0212 не могут быть закодированы в Shift JIS, системе кодирования, которая традиционно доминировала в японской обработке информации, практических реализаций этого набора символов было мало. Как упоминалось выше, его можно закодировать в EUC-JP, который обычно используется в системах Unix/Linux, и именно здесь произошло большинство реализаций:
Многие WWW-браузеры, такие как семейство Netscape/Mozilla/ Firefox , Opera и т. д., а также связанные приложения, такие как Mozilla Thunderbird, поддерживают отображение символов JIS X 0212 в кодировке EUC-JP, однако Internet Explorer не поддерживает символы JIS X 0212. Современные пакеты эмуляции терминала, такие как GNOME Terminal , также поддерживают символы JIS X 0212.
Приложения, поддерживающие JIS X 0212 в кодировке EUC, включают:
Кандзи в JIS X 0212 были взяты в качестве одного из источников для унификации Хань , которая привела к созданию унифицированного набора символов CJK в исходном стандарте ISO 10646 / Unicode . Были включены все 5801 кандзи.
Если не считать упомянутых выше приложений, стандарт JIS X 0212 фактически мертв. 2743 кандзи из него были включены в более поздний стандарт JIS X 0213 . В долгосрочной перспективе его вкладом, вероятно, станет 5801 кандзи, включенный в Unicode .