ISO 15924 , Коды для представления названий письменностей , является международным стандартом, определяющим коды для систем письма или письменностей («набор графических символов, используемых для письменной формы одного или нескольких языков»). Каждой письменности присваивается как четырехбуквенный код, так и числовой код. [1]
Где это возможно, коды получены из ISO 639-2 , где название письменности и название языка, использующего эту письменность, идентичны (например: Gujarātī ISO 639 guj, ISO 15924 Gujr). Предпочтение отдается библиографическим кодам 639-2, что отличается от часто предпочитаемого использования терминологических кодов. [1]
Четырехбуквенные коды ISO 15924 включены в Реестр языковых субтегов IANA для языковых тегов IETF и поэтому могут использоваться в форматах файлов, которые используют такие языковые теги. Например, их можно использовать в HTML и XML , чтобы помочь веб-браузерам определить, какой шрифт использовать для иностранного текста. Таким образом, можно различать, например, сербский язык, написанный кириллицей ( ) sr-Cyrl
или латиницей ( sr-Latn
), или отмечать латинизированный или транслитерированный текст как таковой.
ISO назначила Консорциум Unicode в качестве Регистрационного органа (RA) для стандарта. RA отвечает за назначение регистратора, который работает с Объединенным консультативным комитетом (JAC) над разработкой и внедрением стандарта. Регистратором с 2004 по 2018 год был Майкл Эверсон , а с января 2019 года регистратором стал Маркус Шерер, технический директор Консорциума Unicode. [2] [3] JAC состоит из шести членов: одного представителя RA (Маркус Шерер), одного представителя ISO 639-2 (Рэндалл К. Барри из Библиотеки Конгресса ), одного представителя ISO TC37 (Кристиан Галински), одного представителя ISO TC46 (Питер Пялль) и двух представителей ISO/IEC JTC 1/SC 2 (Рик Макгоуэн и Кен Уистлер, оба также являются должностными лицами Консорциума Unicode). [4]
Два четырехбуквенных кода зарезервированы по запросу проекта Common Locale Data Repository (CLDR): [8]
Этот список кодов взят из стандарта ISO 15924. [8]
Следующие стандарты считаются обязательными согласно стандарту ISO 15924.
Для определения шрифта и глифа стандарт ссылается на
В Unicode определено около 160 скриптов . С помощью ссылки, называемой «Псевдоним значения свойства», Unicode установил связь 1:1 между определенным скриптом и его стандартом ISO 15924. См. Скрипт (Unicode) .
Inherited
— это значение свойства скрипта Unicode для «символов, которые могут использоваться с несколькими скриптами и которые наследуют свой скрипт от предшествующего базового символа. К ним относятся непробеловые объединяющие знаки и охватывающие объединяющие знаки, а также U+200C ZERO WIDTH NON-JOINER и U+200D ZERO WIDTH JOINER». Значение Inherited
описывается как соответствующее коду ISO 15924 Zinh
.Qaag — это специальный код скрипта для идентификации нестандартного использования символов Мьянмы для отображения со шрифтом Zawgyi. Цель кода — обеспечить переход к стандартному, совместимому использованию Unicode путем предоставления идентификатора для Zawgyi для маркировки текста, приложений, методов ввода, таблиц шрифтов, преобразований и других механизмов, используемых для перехода.