ISO 639 — это стандарт Международной организации по стандартизации (ISO), касающийся представления языков и языковых групп . В настоящее время он состоит из четырех наборов (1-3, 5) кода, названных в честь каждой части, которая ранее описывала соответствующий набор (часть 4 представляла собой руководство без собственной системы кодирования); часть 6 была опубликована, но отозвана. Впервые он был утвержден в 1967 году как Рекомендация ISO , состоящая из одной части , ISO/R 639 , [1] , замененная в 2002 году частью 1 новой серии ISO 639-1 , [2], за которой последовали дополнительные части. Все существующие части серии были объединены в единый стандарт в 2023 году [3] во многом на основе текста ISO 639-4.
Коды языков, определенные в нескольких разделах стандарта ISO 639, используются в библиографических целях, а в вычислительной среде и в Интернете — в качестве ключевого элемента данных локали . Коды также находят применение в различных приложениях, например, в URL-адресах Википедии для разных языковых версий.
Каждый набор стандартов поддерживается агентством по техническому обслуживанию, которое при необходимости добавляет коды и изменяет статус кодов. ISO 639-6 был отменен в 2014 году [8] и не включен в ISO 639:2023.
Области применения:
mis
не подходит), или трехбуквенный код для коллекций, например стандартные коды в наборе 5.Типы (для отдельных языков): [ требуется обновление ]
chb
, chg
, cop
, lui
, sam
; ни одного нет в Наборе 1)ave
, chu
, lat
, pli
и san
, также имеют код в Наборе 1: ae
, cu
, la
, pi
, sa
)afh
, epo
, ido
, ile
, , ina
, jbo
, tlh
, vol
, zbl
; 5 из них в Наборе 1: eo
, ia
, ie
, io
, vo
)Отдельные языки и макроязыки с двумя разными трехбуквенными кодами в наборе 2:
Различные наборы ISO 639 разработаны для совместной работы таким образом, что ни один код не означает одно в одном наборе, а другое — в другом. Однако не все языки входят во все наборы, и существует множество различных способов обработки конкретных языков и других элементов в разных наборах. Это зависит, например, от того, включен ли язык в наборы 1 или 2, имеет ли он отдельные коды B/T в наборе 2 или классифицируется как макроязык в наборе 3 и т.д.
Эти различные методы лечения подробно описаны в следующей таблице. В каждой группе строк (по одной для каждой области набора 3) последние четыре столбца содержат коды репрезентативного языка, который иллюстрирует определенный тип отношений между наборами ISO 639, второй столбец дает объяснение взаимосвязи, и первый столбец указывает количество элементов, имеющих этот тип отношений. Например, есть четыре элемента, которые имеют код в наборе 1, имеют код B/T и классифицируются как макроязыки в наборе 3. Одним из представителей этих четырех элементов является «персидский» fa
/ per
/ fas
.
Эти различия обусловлены следующими факторами.
В наборе 2 ISO 639 22 отдельным языкам были присвоены два отдельных кода, а именно библиографический и терминологический код (коды B/T). [15] Коды B были включены по историческим причинам, поскольку предыдущие широко используемые библиографические системы использовали языковые коды, основанные на английском названии языка. Напротив, коды Набора 1 были основаны на родном названии языка, и также существовало сильное желание иметь коды Набора 2 (T-коды) для этих языков, которые были бы похожи на соответствующий двухсимвольный код в Наборе 1.
de
) имеет два кода в наборе 2: ger
(код B) и (код T), тогда как для английского языкаdeu
в наборе 2 имеется только один код .eng
Отдельные языки в Наборе 2 всегда имеют код в Наборе 3 (там повторно используется только терминологический код Набора 2), но могут иметь или не иметь код в Наборе 1, как показано в следующих примерах:
eng
соответствует набору 2 eng
и набору 1.en
ast
соответствует набору 2 ast
, но в наборе 1 отсутствует код.Некоторые коды (62) набора 3 являются макроязыками. Это группы, содержащие несколько отдельных языков, которые хорошо понимают друг друга и обычно смешиваются или путаются. Некоторые макроязыки разработали стандартную форму по умолчанию для одного из своих отдельных языков (например, для китайского макроязыка по умолчанию подразумевается мандаринский язык, при необходимости другие отдельные языки все еще можно различать, но специальный код cmn
для мандаринского языка используется редко).
nor
/ no
содержит non
/ nn
, nob
/ nb
; илиper
/ fas
/ fa
, may
/ msa
/ ms
, alb
/ sqi
/ sq
и chi
/ zho
/ zh
;Коллективные коды в Наборе 2 имеют код в Наборе 5: например, aus
в Наборах 2 и 5, которые обозначают австралийские языки .
sqj
Наборы 2 и 3 также имеют зарезервированный диапазон и четыре специальных кода:
qaa
через qtz
зарезервированы для локального использования.mis
для языков, которым еще не присвоен код, mul
для «несколько языков», und
для «неопределенных» и zxx
для «нет языкового содержания, неприменимо».Двухбуквенные (ранее «Альфа-2») идентификаторы (для кодов, состоящих из 2 букв основного латинского алфавита ISO ) используются в Наборе 1 . Когда требовались коды для более широкого диапазона языков, которые могли охватывать более двух буквенных комбинаций (максимум 26 2 = 676), Набор 2 был разработан с использованием трехбуквенных кодов. (Правда, последний был формально опубликован первым. [16] [17] )
Трехбуквенные идентификаторы (ранее «Альфа-3») (для кодов, состоящих из 3 букв основного латинского алфавита ISO ) используются в Наборе 2 , Наборе 3 и Наборе 5 . Число языков и языковых групп, которые могут быть представлены таким образом, составляет 26 3 = 17 576.
Общее использование трехбуквенных кодов тремя наборами ISO 639 требует некоторой координации в рамках более крупной системы.
Набор 2 определяет четыре специальных кода mis
, mul
, und
, zxx
, зарезервированный диапазон qaa-qtz
(20 × 26 = 520 кодов) и имеет 20 двойных записей (коды B/T), а также 2 записи с устаревшими B-кодами. В сумме получается 520 + 22 + 4 = 546 кодов, которые нельзя использовать в Наборе 3 для обозначения языков или в Наборе 5 для обозначения языковых семей или групп. Остаток равен 17 576 – 546 = 17 030.
Сегодня на Земле существует где-то около шести-семи тысяч языков. [18] Таким образом, этих 17 030 кодов достаточно для присвоения уникального кода каждому языку, хотя некоторые языки могут иметь произвольные коды, которые совсем не похожи на традиционные названия этого языка.
Коды «Альфа-4» (для кодов, состоящих из 4 букв основного латинского алфавита ISO ) было предложено использовать в ISO 639-6 , который был отозван. Верхний предел количества языков и диалектов, которые могут быть представлены, составляет 26 4 = 456 976.
Дата публикации: 1998-10 гг.
Дата публикации: 2002-07.