Документация языка (также: документальная лингвистика ) — это подраздел лингвистики , целью которого является описание грамматики и использования человеческих языков . Она направлена на предоставление всеобъемлющей записи лингвистических практик, характерных для данного речевого сообщества . [1] [2] [3] Документация языка стремится создать как можно более полную запись речевого сообщества как для потомков, так и для возрождения языка . Эта запись может быть публичной или частной в зависимости от потребностей сообщества и цели документации. На практике документация языка может варьироваться от индивидуальных лингвистических антропологических полевых работ до создания обширных онлайн-архивов, которые содержат десятки различных языков, таких как FirstVoices или OLAC . [4]
Документация языка обеспечивает более прочную основу для лингвистического анализа, поскольку она создает корпус материалов на языке. Рассматриваемые материалы могут варьироваться от списков слов и правил грамматики до детских книг и переведенных произведений. Эти материалы затем могут подкреплять утверждения о структуре языка и его использовании. [5] Это следует рассматривать как основную таксономическую задачу для лингвистики, определяющую диапазон языков и их характеристики.
Типичные шаги включают запись, поддержание метаданных, транскрибирование (часто с использованием Международного фонетического алфавита и/или «практической орфографии », созданной для этого языка), аннотацию и анализ, перевод на язык более широкого общения, архивирование и распространение. [6] Критически важным является создание хороших записей в ходе выполнения описания языка. Материалы могут быть архивированы, но не все архивы одинаково искусны в обработке языковых материалов, сохраненных в различных технологических форматах, и не все они одинаково доступны для потенциальных пользователей. [7]
Документация языка дополняет описание языка , которое направлено на описание абстрактной системы структур и правил языка в форме грамматики или словаря. Практикуя хорошую документацию в форме записей с транскриптами, а затем коллекций текстов и словаря, лингвист работает лучше и может предоставить материалы для использования носителями языка. Новые технологии позволяют делать лучшие записи с лучшими описаниями, которые могут быть размещены в цифровых архивах, таких как AILLA , Pangloss или Paradisec . Затем эти ресурсы могут быть предоставлены носителям языка. Первым примером грамматики с корпусом медиа является грамматика Южного Эфате Тибергера (2006). [8]
Документирование языков также привело к появлению новых специализированных публикаций, таких как бесплатный онлайн-журнал Language Documentation & Conservation , рецензируемый экспертами , и рабочие документы SOAS Language Documentation & Description .
Оцифровка архивов является важнейшим компонентом документации и проектов по возрождению языка . [ 9 ] Существуют описательные записи местных языков, которые можно было бы использовать в проектах по возрождению языка, но которые упускаются из виду из-за устаревшего форматирования, неполных записей на бумажных носителях или систематической недоступности. Местные архивы, в частности, которые могут иметь важные записи о языках коренных народов региона , хронически недофинансируются и недоукомплектованы. [10] Исторические записи, относящиеся к языку, которые были собраны нелингвистами, такими как миссионеры, могут быть упущены из виду, если коллекция не оцифрована. [11] Физические архивы, естественно, более уязвимы к повреждениям и потере информации. [9]
Документация языка может быть полезна для людей, которые хотели бы преподавать или изучать исчезающий язык. [12] Если язык имеет ограниченную документацию, это также ограничивает то, как его можно использовать в контексте возрождения языка. Обучение с документацией и полевыми заметками лингвиста может предоставить больше контекста для тех, кто преподает язык, и может добавить информацию, о которой они не знали. [12] Документация может быть полезна для понимания культуры и наследия, а также для изучения языка. Важные компоненты при обучении языку включают: аудирование, чтение, говорение, письмо и культурные компоненты. Документация дает ресурсы для дальнейшего развития навыков изучения языка. [12] Например, язык каурна был возрожден с помощью письменных ресурсов. [13] Эти письменные документы служили единственным ресурсом и использовались для повторного введения языка, и одним из способов было обучение, которое также включало создание учебного пособия для языка каурна. [13] Документация языка и обучение связаны, потому что, если нет бегло говорящих на языке, документацию можно использовать в качестве учебного ресурса.
Описание языка как задача в лингвистике можно разделить на отдельные области специализации: