stringtranslate.com

Мьянма (блок Unicode)

Бирманский блок юникода

Мьянма — это блок Unicode , содержащий символы для бирманского , монского , шанского , палаунгского и каренского языков Мьянмы, а также языков айтонов и факе северо-восточной Индии. Он также используется для записи пали и санскрита в Мьянме.

Блокировать

Блок имеет шестнадцать последовательностей вариаций, определенных для стандартизированных вариантов . [3] Они используют U+FE00 VARIATION SELECTOR-1 (VS01) для обозначения точечных букв, используемых для языков кхамти , айтон и факе . [4] (Обратите внимание, что это зависит от шрифта. Например, шрифт падаук поддерживает некоторые точечные формы.)

История

В следующих документах, связанных с Unicode, описаны цель и процесс определения конкретных символов в блоке Мьянмы:

Историческое и нестандартное использование диапазона

В Unicode 1.0.0 часть текущего блока Myanmar использовалась для Tibetan . В Microsoft Windows данные сортировки , относящиеся к старому блоку Tibetan, сохранялись вплоть до Windows XP и были удалены в Windows 2003. [5]

В Мьянме локализация устройств и программного обеспечения часто использует шрифты Zawgyi, а не шрифты, совместимые с Unicode. [6] Они используют тот же диапазон, что и блок Unicode Myanmar (0x1000–0x109F), и даже применяются к тексту, закодированному как UTF-8 (хотя текст Zawgyi официально не является UTF-8), несмотря на то, что только подмножество кодовых точек интерпретируется таким же образом. Zawgyi не поддерживает языки с мьянманским письмом, кроме бирманского, но существуют эвристические методы для определения кодировки текста, который предположительно является бирманским. [7]

Смотрите также

Ссылки

  1. ^ "База данных символов Unicode". Стандарт Unicode . Получено 2023-07-26 .
  2. ^ "Перечисленные версии стандарта Unicode". Стандарт Unicode . Получено 2023-07-26 .
  3. ^ "База данных символов Unicode: стандартизированные последовательности вариаций". Консорциум Unicode.
  4. ^ Хоскен, Мартин (03.11.2015). «L2/15-320: Предложение о создании вариативных последовательностей для персонажей кхамти» (PDF) .
  5. ^ Каплан, Майкл (28.08.2007). "У каждого персонажа есть история #29: U+1000^H^H^H^H0f40, (ТИБЕТСКАЯ или МЬЯНМСКАЯ БУКВА КА, в зависимости от того, когда вы спрашиваете)". Разбираемся во всем этом .
  6. ^ Нагараджа, Саша. «Zawgyi против Unicode». Глобальное тестирование приложений.
  7. ^ Лумис, Стивен Р.; Корнелиус, Крейг (2019). «Письменность и языки Мьянмы». Часто задаваемые вопросы . Консорциум Unicode .