Мьянма — это блок Unicode , содержащий символы для бирманского , монского , шанского , палаунгского и каренского языков Мьянмы, а также языков айтонов и факе северо-восточной Индии. Он также используется для записи пали и санскрита в Мьянме.
Блок имеет шестнадцать последовательностей вариаций, определенных для стандартизированных вариантов . [3] Они используют U+FE00 VARIATION SELECTOR-1 (VS01) для обозначения точечных букв, используемых для языков кхамти , айтон и факе . [4] (Обратите внимание, что это зависит от шрифта. Например, шрифт падаук поддерживает некоторые точечные формы.)
В следующих документах, связанных с Unicode, описаны цель и процесс определения конкретных символов в блоке Мьянмы:
В Unicode 1.0.0 часть текущего блока Myanmar использовалась для Tibetan . В Microsoft Windows данные сортировки , относящиеся к старому блоку Tibetan, сохранялись вплоть до Windows XP и были удалены в Windows 2003. [5]
В Мьянме локализация устройств и программного обеспечения часто использует шрифты Zawgyi, а не шрифты, совместимые с Unicode. [6] Они используют тот же диапазон, что и блок Unicode Myanmar (0x1000–0x109F), и даже применяются к тексту, закодированному как UTF-8 (хотя текст Zawgyi официально не является UTF-8), несмотря на то, что только подмножество кодовых точек интерпретируется таким же образом. Zawgyi не поддерживает языки с мьянманским письмом, кроме бирманского, но существуют эвристические методы для определения кодировки текста, который предположительно является бирманским. [7]