stringtranslate.com

ИСО 639-3

ISO 639-3:2007 , Коды для представления названий языков. Часть 3: Код Alpha-3 для всестороннего охвата языков , является международным стандартом для языковых кодов серии ISO 639 . Он определяет трехбуквенные коды для идентификации языков. Стандарт был опубликован Международной организацией по стандартизации (ISO) 1 февраля 2007 года. [1]

ISO 639-3 расширяет коды ISO 639-2 альфа-3 с целью охватить все известные естественные языки . Расширенный языковой охват был основан в первую очередь на языковых кодах, использованных в «Этнологе» (тома 10–14), опубликованном SIL International , которая в настоящее время является органом регистрации ISO 639-3. [2] Он обеспечивает максимально полный перечень языков, включая живые и вымершие, древние и искусственные, основные и второстепенные, письменные и неписьменные. [1] Однако он не включает реконструированные языки , такие как протоиндоевропейский . [3]

ISO 639-3 предназначен для использования в качестве кодов метаданных в широком спектре приложений. Он широко используется в компьютерных и информационных системах, таких как Интернет, в которых необходимо поддерживать множество языков. В архивах и других хранилищах информации он используется в системах каталогизации, указывая, на каком языке или о каком языке изложен ресурс. Коды также часто используются в лингвистической литературе и других источниках, чтобы компенсировать тот факт, что названия языков могут быть неясными или двусмысленными.

Коды языков

ISO 639-3 включает все языки ISO 639-1 и все отдельные языки ISO 639-2 . ISO 639-1 и ISO 639-2 ориентированы на основные языки, наиболее часто представленные в мировой литературе. Поскольку ISO 639-2 также включает наборы языков, а Часть 3 — нет, ISO 639-3 не является расширенным набором ISO 639-2. Там, где в ISO 639-2 существуют коды B и T , в ISO 639-3 используются T-коды.

По состоянию на 23 января 2023 года стандарт содержит 7916 записей. [6] Список языков основан на ряде источников, включая: отдельные языки, содержащиеся в 639–2, современные языки из «Этнолога» , исторические разновидности, древние языки и искусственные языки из « Списка лингвистов» , [7] , а также языки, рекомендованные в течение ежегодного периода общественного обсуждения.

Машиночитаемые файлы данных предоставляются регистрирующим органом. [6] С помощью этих файлов данных можно выполнить сопоставление ISO 639-1 или ISO 639-2 с ISO 639-3.

ISO 639-3 предполагает различия, основанные на не совсем объективных критериях. [8] Он не предназначен для документирования или предоставления идентификаторов диалектов или других подъязыковых вариаций. [9] Тем не менее, суждения относительно различий между языками могут быть субъективными, особенно в случае языковых разновидностей без устоявшихся литературных традиций, использования в образовании или средствах массовой информации или других факторов, которые способствуют конвенционализации языка. Таким образом, стандарт следует рассматривать не как авторитетное заявление о том, какие языки существуют в мире (по поводу которых в некоторых случаях могут возникнуть существенные разногласия), а скорее как один из полезных способов точного определения различных языковых разновидностей.

Кодовое пространство

Поскольку код состоит из трех букв, одна верхняя граница количества языков, которые могут быть представлены, составляет 26 × 26 × 26 = 17 576. Поскольку ISO 639-2 определяет специальные коды (4), зарезервированный диапазон (520) и коды только B (22), коды 546 не могут использоваться в части 3. Следовательно, более строгая верхняя граница составляет 17 576 - 546 = 17 030.

Верхняя граница становится еще более строгой, если вычесть языковые коллекции, определенные в 639-2, и те, которые еще не определены в ISO 639-5 .

Макроязыки

В ISO 639-2 указано 58 языков, которые для целей стандарта считаются «макроязыками» в ISO 639-3. [10]

Некоторые из этих макроязыков не имели отдельного языка, определенного ISO 639–3 в кодовом наборе ISO 639-2, например «ара» (общий арабский язык). Другие, такие как «nor» (норвежский), уже имели две отдельные части («nno» ( нюнорск ), «nob» ( букмол )) уже в ISO 639-2.

Это означает, что некоторые языки (например, «арб», стандартный арабский язык), которые в соответствии с ISO 639–2 считались диалектами одного языка («ара»), теперь в ISO 639–3 в определенных контекстах сами считаются отдельными языками.

Это попытка разобраться с разновидностями, которые могут лингвистически отличаться друг от друга, но воспринимаются их носителями как две формы одного и того же языка, например, в случаях диглоссии .

Например:

Полный список см. в [11] .

Коллективные языки

«Элемент коллективного языкового кода — это идентификатор, который представляет группу отдельных языков, которые не считаются одним языком ни в каком контексте использования». [12] Эти коды не точно представляют конкретный язык или макроязык.

Хотя ISO 639-2 включает трехбуквенные идентификаторы коллективных языков, эти коды исключены из ISO 639-3. Следовательно, ISO 639-3 не является расширенной версией ISO 639-2.

ISO 639-5 определяет трехбуквенные коллективные коды для языковых семей и групп, включая коллективные языковые коды из ISO 639-2.

Специальные коды

Четыре кода выделены в ISO 639-2 и ISO 639-3 для случаев, когда ни один из конкретных кодов не подходит. Они предназначены в первую очередь для таких приложений, как базы данных, где требуется код ISO независимо от того, существует ли он.

Кроме того, 520 кодов в диапазоне qaaqtz«зарезервированы для локального использования». Например, Ребекка Беттанкур присваивает построенным языкам код , а новые назначения делаются по запросу. [14] В « Списке лингвистов» они используются для обозначения вымерших языков . Лингвист Лист присвоил одному из них общее значение: qnpбезымянный протоязык. Это используется для предлагаемых промежуточных узлов в генеалогическом дереве, у которых нет имени.

Процессы обслуживания

Таблица кодов ISO 639-3 открыта для изменений. Чтобы защитить стабильность существующего использования, разрешенные изменения ограничены: [15]

Код, присвоенный языку, не изменяется, если не изменяется также его обозначение. [16]

Изменения вносятся ежегодно. Каждому запросу дается минимум три месяца на общественное рассмотрение.

На веб-сайте ISO 639-3 есть страницы, описывающие «объемы обозначений» [17] (языковые типы) и типы языков, [18] которые объясняют, какие понятия входят в область кодирования и определенные критерии, которым необходимо соответствовать. Например, искусственные языки могут быть закодированы, но только если они предназначены для человеческого общения и имеют достаточно литературы, что предотвращает запросы на идиосинкразические изобретения.

Регистрирующий орган размещает на своем веб-сайте инструкции, содержащиеся в тексте стандарта ISO 639-3, относительно того, как следует поддерживать кодовые таблицы. [19] В нем также документированы процессы, используемые для получения и обработки запросов на изменения. [20]

Предусмотрена форма запроса на изменение, а также имеется вторая форма для сбора информации о предлагаемых дополнениях. Любая сторона может подать запрос на изменение. После подачи запросы первоначально проверяются регистрирующим органом на предмет полноты.

Когда получен полностью документированный запрос, он добавляется в опубликованный индекс запросов на изменение. Кроме того, объявления отправляются в общий список обсуждения ЛИНГВИСТОВ в Списке лингвистов и в другие списки, которые регистрирующий орган может счесть уместными, приглашая общественность рассмотреть и внести свой вклад в запрошенное изменение. Любой владелец списка или физическое лицо может запросить уведомления о запросах на изменение для определенных регионов или языковых семей. Полученные комментарии публикуются для просмотра другими сторонами. На основании консенсуса в полученных комментариях запрос на изменение может быть отозван или повышен до «статуса кандидата».

За три месяца до окончания ежегодного цикла рассмотрения (обычно в сентябре) в список обсуждений ЛИНГВИСТ и другие списки отправляется объявление о запросах на изменение статуса кандидата. Все запросы остаются открытыми для рассмотрения и комментариев до конца ежегодного цикла рассмотрения.

Решения объявляются в конце ежегодного цикла рассмотрения (обычно в январе). В это время запросы могут быть приняты полностью или частично, изменены и перенесены в следующий цикл рассмотрения или отклонены. Отказы часто включают предложения о том, как изменить предложения для повторной подачи. Публичный архив каждого запроса на изменение сохраняется вместе с принятыми решениями и их обоснованием. [21]

Критика

Лингвисты Мори, Пост и Фридман выдвигают различные критические замечания по поводу ISO 639 и, в частности, ISO 639-3: [16]

Мартин Хаспелмат согласен с четырьмя из этих пунктов, но не с пунктом об изменении языка. [22] Он не согласен, потому что любое описание языка требует его идентификации, и мы можем легко определить различные стадии развития языка. Он предполагает, что лингвисты могут предпочесть использовать кодификацию, выполненную на лангуоидном уровне, поскольку «для лингвистов редко имеет значение, является ли то, о чем они говорят, языком, диалектом или сплоченной семьей языков». Он также задается вопросом, подходит ли стандарт ISO для идентификации языка, поскольку ISO является промышленной организацией, в то время как он рассматривает языковую документацию и номенклатуру как научную деятельность. Он ссылается на первоначальную потребность в стандартизированных идентификаторах языка как на «экономическое значение перевода и локализации программного обеспечения », для чего были установлены стандарты ISO 639-1 и 639-2. Но он ставит под сомнение потребность отрасли во всестороннем охвате, предусмотренном ISO 639-3, в том числе в отношении «малоизвестных языков небольших сообществ, которые никогда или почти не используются в письменной форме и часто находятся под угрозой исчезновения».

Применение

Рекомендации

  1. ^ ab «Состояние и аннотация ISO 639-3» . Международная Организация Стандартизации. 20 июля 2010 г. Проверено 14 июня 2012 г.
  2. ^ «Агенства по техническому обслуживанию и регистрационные органы» . ИСО.
  3. ^ «Типы отдельных языков - Древние языки». sil.org . Проверено 11 июня 2018 г.
  4. ^ Отчет Ethnologue для кода ISO 639: zho. Архивировано 12 сентября 2014 г. на Wayback Machine на ethnologue.com.
  5. ^ ISO639-3 на SIL.org
  6. ^ ab «Набор кодов ISO 639-3». Сил.орг. 18 февраля 2021 г. Проверено 7 апреля 2021 г.
  7. ^ «ИСО 639-3». sil.org.
  8. ^ «Объем обозначения: отдельные языки». sil.org.
  9. ^ «Объем обозначения: диалекты». sil.org.
  10. ^ «Объем обозначения: макроязыки». sil.org . Проверено 14 июня 2012 г.
  11. ^ «Макроязыковые сопоставления». sil.org . Проверено 2 ноября 2021 г.
  12. ^ «Сфера обозначения: Коллективные языки». sil.org . Проверено 14 июня 2012 г.
  13. ^ Полевые записи криков верветок. Запись в каталоге Консорциума лингвистических данных . Проверено 15 января 2023 г.
  14. ^ Бетанкур, Ребекка. «Реестр кодов ConLang». КреативКорп . Проверено 12 марта 2021 г.
  15. ^ «Отправка запросов на изменение ISO 639-3: типы изменений» . sil.org.
  16. ^ аб Мори, Стивен; Пост, Марк В.; Фридман, Виктор А. (2013). Языковые коды ISO 639: преждевременная, в конечном итоге недостижимая и, возможно, разрушительная стандартизация. Конференция PARADISEC РРР. Архивировано из оригинала 23 февраля 2016 г. Проверено 3 ноября 2015 г.
  17. ^ «Объем обозначения языковых идентификаторов» . sil.org.
  18. ^ «Типы языков». sil.org.
  19. ^ «ISO 639-3 Управление изменениями». sil.org.
  20. ^ «Отправка запросов на изменение ISO 639-3» . sil.org.
  21. ^ «Указатель запроса на изменение ISO 639-3» . sil.org.
  22. ^ Мартин Хаспельмат, «Можно ли стандартизировать языковую идентичность? О критике ISO 639-3 Мори и др.», Комментарий Diversity Linguistics , 4 декабря 2013 г.
  23. ^ «Языковое расширение OLAC» . язык-архивы.org . Проверено 3 августа 2015 г.
  24. ^ «Более 7000 языков, всего 1 Windows» . Майкрософт. 05.02.2014.
  25. ^ «Политика языковых предложений» . Wikimedia.org . Проверено 3 августа 2015 г.
  26. ^ «BCP 47 - Теги для определения языков» . ietf.org . Проверено 3 августа 2015 г.
  27. ^ ab «Публикации EPUB 3.0». idpf.org . Проверено 3 августа 2015 г.
  28. ^ «Условия метаданных DCMI» . Purl.org . Проверено 3 августа 2015 г.
  29. ^ «Двухбуквенные или трехбуквенные коды языков ISO» . W3C . Проверено 3 августа 2015 г.
  30. ^ «Реестр языков». Управление по присвоению номеров в Интернете . Проверено 12 августа 2015 г.
  31. ^ «Семантика, структура и API HTML-документов — HTML5». W3C . Проверено 3 августа 2015 г.
  32. ^ «Расширяемый язык разметки (XML) 1.0 (пятое издание)» . W3C . Проверено 3 сентября 2022 г.
  33. ^ «Масштабируемая векторная графика (SVG) 2» . W3C . Проверено 3 сентября 2022 г.
  34. ^ «Элементы - Рекомендации пользователя MODS: Схема описания объекта метаданных: MODS» . Библиотека Конгресса . Проверено 3 августа 2015 г.
  35. ^ «Язык элементов TEI» . Инициатива по кодированию текста . Проверено 3 августа 2015 г.

дальнейшее чтение

Внешние ссылки