Том 1 стандарта Ассоциации радиопромышленности и бизнеса ( ARIB ) STD-B24 для языка разметки вещания [2] определяет, среди прочих деталей, кодировку символов для использования в японоязычном вещании. Он был представлен 26 октября 1999 г. [ 2] Последняя редакция — версия 6.3 от 6 июля 2016 г.
Он включает в себя ряд расширенных символов ARIB ( ARIB外字, ARIB gaiji ), которых нет в базовых стандартах ( JIS X 0208 и JIS X 0201 ). Это был исходный стандарт для многих символов, которые были добавлены в Unicode , включая части блоков Miscellaneous Symbols , Enclosed Alphanumeric Supplement и Enclosed Ideographic Supplement . [3] Его вклад частично перекрывает эмодзи Unicode , но был добавлен годом ранее, в Unicode 5.2. [4]
Раздел 1 стандарта ARIB STD-B62, опубликованный в 2014 году, определяет сопоставления Unicode для ряда расширенных символов B24 (за исключением, например, тех, которые дублируются JIS X 0213 ), а также нескольких расширенных символов Kanji. [5] Он также включает сопоставление используемых символов за пределами базовой многоязыковой плоскости с областью частного использования BMP .
Стандарт ARIB STD B24 определяет несколько наборов символов и метод переключения между ними. Они включают набор кандзи (расширение JIS X 0208 ), алфавитно-цифровой набор, набор хираганы, наборы катаканы двух различных макетов и четыре мозаичных набора. [6] Наборы выбираются с использованием механизмов ISO 2022 для 94-наборов, используя следующие коды (пропорциональные наборы используют ту же раскладку, что и соответствующие непропорциональные): [7]
Это двухбайтовый набор символов, расширяющий JIS X 0208 .
Байты кодирования соответствуют номеру строки или ячейки плюс 0x20 или 32 в десятичной системе (см. ниже). Таким образом, набор кодов, начинающийся с 0x21, имеет номер строки 1, а его ячейка 1 имеет байт продолжения 0x21 (или 33) и т. д. Большая часть кода соответствует JIS X 0208.
Символы с 90-45 по 90-63 и с 90-66 по 90-84 (показаны ниже затененными) перечислены в стандарте B24 только в таблице 7-10 (список символов расширения), а также являются единственными символами в строках с 90 по 91, которые не являются символами, связанными с транспортом; это отмечено в стандарте B24 в примечании к таблице 7-10. [10] Остальные расширения перечислены как в таблице 7-4 (таблица двухбайтовых кодов), так и в таблице 7-10. [10]
Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.
Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.
Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.
Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.
Большая часть набора D мозаики ARIB STD-B24 не существует в Unicode.
В дополнение к измененной кодировке ISO 2022 стандарт B24 также определяет кодировку Shift JIS, следующую за JIS X 0208:1997, но с добавлением расширенных символов в наборе кандзи. [1]
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка )