stringtranslate.com

Формы половинной и полной ширины (блок Unicode)

Halfwidth and Fullwidth Forms — это название блока Unicode U+FF00–FFEF, предоставленного для того, чтобы старые кодировки, содержащие как полуширинные, так и полноширинные символы, могли без потерь переводиться в/из Unicode. Это предпоследний блок Basic Multilingual Plane , за которым следует только короткий блок Specials в U+FFF0–FFFF. Его название блока в Unicode 1.0 было Halfwidth and Fullwidth Variants . [4]

Диапазон U+FF01–FF5E воспроизводит символы ASCII 21–7E в полноширинных формах. U+FF00 не соответствует полноширинному ASCII 20 (символу пробела), поскольку эта роль уже выполняется U+3000 « идеографическим пробелом ».

Диапазон U+FF61–FF9F кодирует полуширинные формы катаканы и связанные с ней знаки пунктуации в транспозиции A1 в DF в кодировке JIS X 0201 – см. полуширинную кана .

Диапазон U+FFA0–FFDC кодирует полуширинные формы совместимых символов jamo для хангыль в транспозиции их стандартной раскладки 1974 года. Он используется в отображении некоторых кодировок IBM для корейского языка, таких как кодовая страница IBM 933, которая позволяет использовать символы Shift Out и Shift In для перехода к двухбайтовому набору символов. [5] Поскольку двухбайтовый набор символов может содержать совместимый jamo, для обеспечения двусторонней совместимости необходимы варианты полуширины. [6] [7]

Диапазон U+FFE0–FFEE включает символы полной и половинной ширины.

Блокировать

В блоке определены последовательности вариаций для восточноазиатских позиционных вариантов пунктуации. [8] [9] Они используют U+FE00 VARIATION SELECTOR-1 (VS01) и U+FE01 VARIATION SELECTOR-2 (VS02):

Дополнительный вариант определен для полноширинного нуля с коротким диагональным штрихом : U+FF10 ПОЛНОШИРИННАЯ ЦИФРА НОЛЬ, U+FE00 VS1 (0︀). [10] [9]

История

В следующих документах, связанных с Unicode, описаны цель и процесс определения конкретных символов в блоках полуширинных и полноширинных форм:

Смотрите также

Ссылки

  1. ^ "Unicode 1.0.1 Addendum" (PDF) . Стандарт Unicode . 1992-11-03 . Получено 2016-07-09 .
  2. ^ "База данных символов Unicode". Стандарт Unicode . Получено 2023-07-26 .
  3. ^ "Перечисленные версии стандарта Unicode". Стандарт Unicode . Получено 2023-07-26 .
  4. ^ "3.8: Поблочные диаграммы" (PDF) . Стандарт Unicode . версия 1.0. Консорциум Unicode .
  5. ^ "Демонстрация ICU - Converter Explorer". demo.icu-project.org . Получено 7 мая 2018 г. .
  6. ^ «Виноваты полуширина и полная ширина».
  7. ^ «Данные преобразования — старое расположение Руководства пользователя отделения интенсивной терапии».
  8. ^ Лунде, Кен (21.01.2018). «L2/17-436: Предложение добавить стандартизированные последовательности вариаций для полноширинной восточноазиатской пунктуации» (PDF) .
  9. ^ ab "База данных символов Unicode: стандартизированные последовательности вариаций". Консорциум Unicode.
  10. ^ Битон, Барбара; Фрейтаг, Асмус; Янку, Лаурентиу; Сарджент, Мюррей (30 октября 2015 г.). «L2 / 15-268: Предложение представить вариант пустого набора с перечеркнутым нулем» (PDF) .