stringtranslate.com

Набор символов ARIB STD B24

Том 1 стандарта Ассоциации радиопромышленности и бизнеса ( ARIB ) STD-B24 для языка разметки вещания [2] определяет, среди прочих деталей, кодировку символов для использования в японоязычном вещании. Он был представлен 26 октября 1999 г. [ 2] Последняя редакция — версия 6.3 от 6 июля 2016 г.

Он включает в себя ряд расширенных символов ARIB ( ARIB外字, ARIB gaiji ), которых нет в базовых стандартах ( JIS X 0208 и JIS X 0201 ). Это был исходный стандарт для многих символов, которые были добавлены в Unicode , включая части блоков Miscellaneous Symbols , Enclosed Alphanumeric Supplement и Enclosed Ideographic Supplement . [3] Его вклад частично перекрывает эмодзи Unicode , но был добавлен годом ранее, в Unicode 5.2. [4]

Раздел 1 стандарта ARIB STD-B62, опубликованный в 2014 году, определяет сопоставления Unicode для ряда расширенных символов B24 (за исключением, например, тех, которые дублируются JIS X 0213 ), а также нескольких расширенных символов Kanji. [5] Он также включает сопоставление используемых символов за пределами базовой многоязыковой плоскости с областью частного использования BMP .

Наборы и коды

Стандарт ARIB STD B24 определяет несколько наборов символов и метод переключения между ними. Они включают набор кандзи (расширение JIS X 0208 ), алфавитно-цифровой набор, набор хираганы, наборы катаканы двух различных макетов и четыре мозаичных набора. [6] Наборы выбираются с использованием механизмов ISO 2022 для 94-наборов, используя следующие коды (пропорциональные наборы используют ту же раскладку, что и соответствующие непропорциональные): [7]

Кодовые таблицы

Набор кандзи (двухбайтовых)

Это двухбайтовый набор символов, расширяющий JIS X 0208 .

Ведущий байт

Байты кодирования соответствуют номеру строки или ячейки плюс 0x20 или 32 в десятичной системе (см. ниже). Таким образом, набор кодов, начинающийся с 0x21, имеет номер строки 1, а его ячейка 1 имеет байт продолжения 0x21 (или 33) и т. д. Большая часть кода соответствует JIS X 0208.

Наборы символов 0x21-0x74 (номера строк 1-84: знаки препинания, алфавиты, цифры, кана, кандзи)

Набор символов 0x7A (номер строки 90, символы дорожного движения)

Символы с 90-45 по 90-63 и с 90-66 по 90-84 (показаны ниже затененными) перечислены в стандарте B24 только в таблице 7-10 (список символов расширения), а также являются единственными символами в строках с 90 по 91, которые не являются символами, связанными с транспортом; это отмечено в стандарте B24 в примечании к таблице 7-10. [10] Остальные расширения перечислены как в таблице 7-4 (таблица двухбайтовых кодов), так и в таблице 7-10. [10]

Набор символов 0x7B (номер строки 91, символы карты)

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Набор символов 0x7C (номер строки 92, единицы измерения, вложенные формы, маркеры списков, стрелки)

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Набор символов 0x7D (номер строки 93, игровые и погодные символы, дроби, единицы, вложенные формы)

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Набор символов 0x7E (номер строки 94, маркеры списка)

Символы из ARIB STD-B24, которые не были сохранены в ARIB STD-B62, показаны затененными.

Однобайтовые наборы

Буквенно-цифровой набор

Набор хираганы

Набор катаканы

JIS X 0201 Набор катаканы

Наборы мозаики

Большая часть набора D мозаики ARIB STD-B24 не существует в Unicode.

Вариант Shift_JIS

В дополнение к измененной кодировке ISO 2022 стандарт B24 также определяет кодировку Shift JIS, следующую за JIS X 0208:1997, но с добавлением расширенных символов в наборе кандзи. [1]


Смотрите также

Сноски

  1. ^ В таблице 7-10 B24 (список дополнительных символов) указано как «храм» (т. е. буддийский храм ).
  2. ^ abcdef Малая форма (размер 70% на кодовую таблицу / таблицу 7-10) символа кандзи. Здесь показано смоделированное изображение. Частное использование Указанные кодовые точки зоны используются шрифтом Nishiki-teki. [13]
  3. ^ abcdefghijklmnopqrstu vwxyz aa ab ac ad Музыкальная аббревиатура (или ее половина), не представленная в Unicode, здесь смоделирована с помощью нескольких символов. Частное использование Указанные кодовые точки зоны используются шрифтом Nishiki-teki.

Ссылки

  1. ^ ab ARIB (2008), стр. 105, часть 2, раздел 7.3
  2. ^ ab ARIB (2008)
  3. ^ Сюиньяр, Мишель (11.03.2008). "ISO/IEC JTC1/SC2/WG2 N 3397: Японские телевизионные символы" (PDF) .
  4. ^ "Список эмодзи Unicode 5.2". Emojipedia.
  5. ^ abcdef ARIB (2014), стр. 33–50, часть 2, таблица 5-2
  6. ^ ARIB (2008), стр. 48–52
  7. ^ ab ARIB (2008), стр. 39, часть 2, таблица 7-3
  8. ^ Японский национальный комитет по ISO/TC97/SC2 (1984-07-01). Японский набор графических символов для обмена информацией (PDF) . ITSCJ/ IPSJ . ISO-IR -87.{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  9. ^ ab RFC  1468 (IETF)
  10. ^ ab ARIB (2008), стр. 72
  11. ^ abcde ARIB (2008), стр. 54–72, часть 2, таблица 7-10
  12. ^ abcd ARIB (2008), стр. 46–47, часть 2, таблица 7-4.
  13. ^ «Nishiki-teki Версия 3.82b (2021-07-23) - 6416 символов в зонах частного использования» (PDF) .
  14. ^ ARIB (2008), стр. 48, часть 2, таблица 7-5
  15. ^ ARIB (2008), стр. 50, часть 2, таблица 7-7
  16. ^ ARIB (2008), стр. 49, часть 2, таблица 7-6
  17. ^ ARIB (2008), стр. 52, часть 2, таблица 7-9
  18. ^ ARIB (2008), стр. 51, часть 2, таблица 7-8
  19. ^ CCITT (1983-10-01). Второй дополнительный набор мозаичных символов (PDF) . ITSCJ/ IPSJ . ISO-IR -71.
  20. ^ ARIB (2008), стр. 51, часть 2, таблица 7-8
  21. ^ CCITT (1987-07-31). Синтаксис набора данных Mosaic-1 1 Рекомендации CCITT T.101 (PDF) . ITSCJ/ IPSJ . ISO-IR -137.
  22. ^ ARIB (2008), стр. 51, часть 2, таблица 7-8

Дальнейшее чтение

Внешние ссылки