Лингвистическая типология (или типология языка ) — это область лингвистики , которая изучает и классифицирует языки в соответствии с их структурными особенностями, чтобы обеспечить их сравнение. Ее цель — описать и объяснить структурное разнообразие и общие свойства языков мира. [1] Ее субдисциплины включают, но не ограничиваются фонологической типологией, которая имеет дело со звуковыми особенностями; синтаксической типологией, которая имеет дело с порядком и формой слов; лексической типологией, которая имеет дело со словарным запасом языка; и теоретической типологией, которая стремится объяснить универсальные тенденции. [2]
Лингвистическая типология противопоставляется генеалогической лингвистике на том основании, что типология группирует языки или их грамматические особенности на основе формального сходства, а не исторического происхождения. [3] Однако вопрос генеалогического отношения имеет отношение к типологии, поскольку современные наборы данных стремятся быть репрезентативными и беспристрастными. Образцы собираются равномерно из разных языковых семей , что подчеркивает важность менее известных языков для понимания человеческого языка. [4]
Предположения о существовании (логической) общей или универсальной грамматики, лежащей в основе всех языков, были опубликованы в Средние века, особенно школой Модистэ . В то время латынь была образцовым языком лингвистики, хотя транскрипция ирландского и исландского в латинский алфавит была признана проблематичной. Межъязыковое измерение лингвистики было установлено в эпоху Возрождения . Например, Grammaticae quadrilinguis partitiones (1544) Иоганна Дрозеуса сравнивал французский и три «священных языка»: иврит, греческий и латынь. Подход был расширен в Port-Royal Grammar (1660) Антуана Арно и Клода Ланселота , которые добавили испанский, итальянский, немецкий и арабский. Книга Николя Бозе 1767 года включает примеры английского, шведского, саамского , ирландского, валлийского , баскского , кечуа и китайского. [5]
Завоевание и обращение мира европейцами породило «миссионерскую лингвистику», которая создавала списки слов из первых рук и грамматические описания экзотических языков. Такая работа описана в «Каталоге языков известных нам народов» (1800) испанского иезуита Лоренцо Эрваса . Иоганн Кристоф Аделунг собрал первый большой языковой образец молитвы Господней на почти пятистах языках (посмертно в 1817 году). [5]
Более развитые сравнительные работы девятнадцатого века включают «Систему спряжения» Франца Боппа (1816) и «О различии в человеческой языковой структуре и ее влиянии на интеллектуальное развитие человечества» Вильгельма фон Гумбольдта (посмертно 1836). В 1818 году Август Вильгельм Шлегель классифицировал языки мира на три типа: (i) языки, лишенные грамматической структуры, например, китайский; (ii) агглютинативные языки, например, турецкий; и (iii) флективные языки, которые могут быть синтетическими, как латынь и древнегреческий, или аналитическими, как французский. Эта идея была позже развита другими, включая Августа Шлейхера , Хеймана Штейнталя , Франца Мистели, Франца Николауса Финка и Макса Мюллера . [3]
Слово «типология» было предложено Георгом фон дер Габеленцем в его Sprachwissenschaft (1891). Луи Ельмслев предложил типологию как масштабную эмпирико-аналитическую попытку сравнения грамматических признаков для раскрытия сущности языка. Такой проект начался с конференции 1961 года по языковым универсалиям в Доббс-Ферри . Среди докладчиков были Роман Якобсон , Чарльз Ф. Хоккет и Джозеф Гринберг , которые предложили сорок пять различных типов языковых универсалий на основе своих наборов данных из тридцати языков. Выводы Гринберга были в основном известны по грамматикам девятнадцатого века, но его систематическое представление их послужило моделью для современной типологии. [3] Винфред П. Леманн представил типологическую теорию Гринберга в индоевропейских исследованиях в 1970-х годах. [6]
В двадцатом веке типология, основанная на миссионерской лингвистике, сосредоточилась вокруг SIL International , которая сегодня размещает свой каталог живых языков Ethnologue в качестве онлайн-базы данных. Гринбергианский или универсалистский подход объясняется , среди прочего, Всемирным атласом языковых структур . Типология также проводится в рамках функциональной грамматики, включая функциональную дискурсивную грамматику , ролевую и референтную грамматику и системную функциональную лингвистику . Однако в первые годы двадцать первого века существование языковых универсалий стало подвергаться сомнению лингвистами, предлагающими эволюционную типологию. [7]
Количественная типология занимается распределением и совместной встречаемостью структурных моделей в языках мира. [8] Основные типы неслучайного распределения включают:
Лингвистические универсалии — это закономерности, которые можно наблюдать кросс-лингвистически. Универсалии могут быть либо абсолютными, что означает, что каждый задокументированный язык демонстрирует эту характеристику, либо статистическими, что означает, что эта характеристика наблюдается в большинстве языков или вероятна в большинстве языков. Универсалии, как абсолютные, так и статистические, могут быть неограниченными, что означает, что они применяются к большинству или всем языкам без каких-либо дополнительных условий. И наоборот, как абсолютные, так и статистические универсалии могут быть ограниченными или импликационными, что означает, что характеристика будет истинной при условии чего-то еще (если характеристика Y истинна, то характеристика X истинна). [9] Примером импликационной иерархии является то, что двойственные местоимения встречаются только в языках с местоимениями множественного числа , в то время как местоимения единственного числа (или неопределенные с точки зрения числа) встречаются во всех языках. Таким образом, импликационная иерархия такова: единственное число < множественное число < двойственное число (и т. д.).
Качественная типология разрабатывает кросс-лингвистически жизнеспособные понятия или типы, которые обеспечивают основу для описания и сравнения языков.
Основные подполя лингвистической типологии включают эмпирические области синтаксической, фонологической и лексической типологии. Кроме того, теоретическая типология стремится объяснить эмпирические результаты, особенно статистические тенденции или импликационные иерархии.
Синтаксическая типология изучает широкий спектр грамматических явлений из языков мира. Две хорошо известные проблемы включают доминирующий порядок и лево-правую симметрию.
Один набор типов отражает основной порядок подлежащего , глагола и прямого дополнения в предложениях:
Эти метки обычно появляются сокращенно как «SVO» и т. д., и могут называться «типологиями» языков, к которым они применяются. Наиболее часто засвидетельствованные порядки слов — SOV и SVO, в то время как наименее распространенные порядки — те, которые начинаются с объекта, а OVS является наименее распространенным, имея всего четыре засвидетельствованных примера. [10]
В 1980-х годах лингвисты начали подвергать сомнению значимость географического распределения различных значений для различных особенностей языковой структуры. Возможно, они хотели выяснить, встречается ли конкретная грамматическая структура, встречающаяся в одном языке, в другом языке в том же географическом месте. [11] В некоторых языках глаголы делятся на вспомогательный глагол и инфинитив или причастие и между ними помещаются подлежащее и/или дополнение. Например, в немецком ( Ich habe einen Fuchs im Wald gesehen - *"Я видел лису в лесу"), голландском ( Hans vermoedde dat Jan Marie zag leren zwemmen - *"Ганс подозревал, что Ян Мари увидел, чтобы научиться плавать") и валлийском ( Mae 'r gwirio sillafu wedi'i gwblhau - *"Проверка правописания после него завершается"). В этом случае лингвисты основывают типологию на неаналитических временах (т. е. предложениях, в которых глагол не разделен) или на положении вспомогательного глагола. Таким образом, в немецком языке в главных предложениях используется SVO, а в валлийском — VSO (и предложные фразы будут идти после инфинитива).
Многие типологи [ кто? ] относят немецкий и голландский языки к языкам V2 , поскольку глагол в них неизменно выступает в качестве второго элемента полного предложения.
Некоторые языки допускают различные степени свободы в порядке составляющих, что создает проблему для их классификации в схеме субъект-глагол-объект. Например, языки с маркировкой связанного падежа для существительных, как правило, имеют более гибкий порядок слов, чем языки, где падеж определяется позицией в предложении или наличием предлога. Например, в некоторых языках с маркировкой связанного падежа для существительных, таких как язык X, наблюдаются различные степени свободы в порядке составляющих. Эти языки демонстрируют более гибкий порядок слов, допуская такие вариации, как структура субъект-глагол-объект (SVO), как в 'The cat ate the mouse,' и структура объект-подлежащее-глагол (OSV), как в 'The mouse the cat ate.' Чтобы определить базовый тип порядка составляющих в этом случае, обычно смотрят на частоту различных типов в повествовательных утвердительных главных предложениях в прагматически нейтральных контекстах, предпочтительно только со старыми референтами. Так, например, русский язык широко считается языком SVO, поскольку это наиболее частый порядок составляющих в таких условиях — хотя всевозможные вариации возможны и встречаются в текстах. Во многих флективных языках, таких как русский, латинский и греческий, отступления от порядка слов по умолчанию допустимы, но обычно подразумевают смещение фокуса, акцент на конечном элементе или некоторый особый контекст. В поэзии этих языков порядок слов также может свободно меняться в соответствии с метрическими требованиями. Кроме того, свобода порядка слов может варьироваться в пределах одного языка — например, формальные, литературные или архаизирующие разновидности могут иметь другие, более строгие или более мягкие структуры порядка составляющих, чем неформальная разговорная разновидность того же языка.
С другой стороны, когда при описанных условиях нет явных предпочтений, считается, что язык имеет «гибкий порядок составляющих» (тип в себе).
Дополнительная проблема заключается в том, что в языках без живых речевых сообществ, таких как латынь , древнегреческий и старославянский , лингвисты располагают только письменными свидетельствами, возможно, написанными в поэтическом, формализующем или архаичном стиле, который неверно характеризует фактическое повседневное использование языка. [12] Повседневный разговорный язык Софокла или Цицерона мог демонстрировать иной или гораздо более регулярный синтаксис, чем указывает их письменное наследие.
В таблице ниже показано распределение доминирующего порядка слов в более чем 5000 отдельных языках и 366 языковых семьях. SOV является наиболее распространенным типом в обоих языках, хотя гораздо более отчетливо в данных языковых семей, включая изоляты . «NODOM» представляет языки без единого доминирующего порядка. [13]
Хотя причина доминирования иногда считается нерешенной или неразрешимой типологической проблемой, было предложено несколько объяснений модели распределения. Эволюционные объяснения включают объяснения Томаса Гивона (1979), который предполагает, что все языки происходят от языка SOV, но развиваются в разные виды; и Дерека Бикертона (1981), который утверждает, что исходный язык был SVO, который поддерживает более простую грамматику, использующую порядок слов вместо падежных маркеров для различения клаузальных ролей. [14]
Универсалистские объяснения включают модель Рассела Томлина (1986), основанную на трех функциональных принципах: (i) одушевленное перед неодушевленным; (ii) тема перед комментарием; и (iii) связь глагола и объекта. Трехсторонняя модель приблизительно предсказывает реальную иерархию (см. таблицу выше), предполагая отсутствие статистической разницы между SOV и SVO, а также отсутствие статистической разницы между VOS и OVS. Напротив, теория эффективности обработки Джона А. Хокинса (1994) предполагает, что составляющие упорядочены от самых коротких к самым длинным в языках VO и от самых длинных к самым коротким в языках OV, что приводит к подтвержденному распределению. Этот подход опирается на представление о том, что в языках OV есть тяжелые подлежащие, а в языках VO есть тяжелые объекты, что оспаривается. [14]
Второй основной способ синтаксической категоризации — исключение субъекта из рассмотрения. Хорошо документированная типологическая особенность заключается в том, что языки с доминирующим порядком OV (объект перед глаголом), например японский, склонны иметь послелоги . Напротив, языки VO (глагол перед объектом), такие как английский, склонны иметь предлоги в качестве своего основного адпозиционного типа. Было обнаружено несколько корреляций OV/VO. [15]
В 1980-х и 1990-х годах было предложено несколько объяснений обработки для вышеуказанных корреляций. Они предполагают, что мозгу легче анализировать синтаксические шаблоны , которые являются либо правыми, либо левыми ветвями , но не смешанными. Наиболее широко распространенным таким объяснением является теория эффективности анализа Джона А. Хокинса , которая утверждает, что язык является неврожденной адаптацией к врожденным когнитивным механизмам. Типологические тенденции считаются основанными на предпочтении пользователей языка к грамматикам, которые организованы эффективно, и на их избегании порядка слов, который вызывает трудности обработки. Теория обработки Хокинса предсказывает приведенную выше таблицу, но также делает прогнозы для некорреляционных пар, включая порядок прилагательного, указательного местоимения и числительного по отношению к существительному. Эта теория была основана на корпусном исследовании и не имеет поддержки в психолингвистических исследованиях. [14]
Некоторые языки демонстрируют регулярную «неэффективную» модель. К ним относятся языки VO китайский , с адпозитивной фразой перед глаголом, и финский , в котором есть послелоги. Но есть несколько других глубоко исключительных языков. Недавно было высказано предположение, что лево-правая ориентация ограничена связками, маркирующими роль ( адпозиции и подчиненные ), вытекающими непосредственно из семантического отображения предложения. Поскольку истинные пары корреляции в приведенной выше таблице либо включают такую связку, либо, возможно, следуют из канонического порядка, ориентация предсказывает их, не делая проблемных утверждений. [17]
Другая распространенная классификация различает модели выравнивания номинативно-аккузативного и эргативно-абсолютивного типа. В языке с падежами классификация зависит от того, имеет ли подлежащее (S) непереходного глагола тот же падеж, что и агент (A) или пациент (P) переходного глагола. Если в языке нет падежей, но порядок слов AVP или PVA, то классификация может отражать, появляется ли подлежащее непереходного глагола на той же стороне, что и агент или пациент переходного глагола. Бикель (2011) утверждал, что выравнивание следует рассматривать как свойство, специфичное для конструкции, а не как свойство, специфичное для языка. [18]
Во многих языках наблюдается смешанное аккузативное и эргативное поведение (например: эргативная морфология, отмечающая аргументы глагола, поверх синтаксиса аккузатива). В других языках (называемых « активными языками ») есть два типа непереходных глаголов — некоторые из них («активные глаголы») присоединяются к подлежащему в том же падеже, что и агент переходного глагола, а остальные («статичные глаголы») присоединяются к подлежащему в том же падеже, что и пациент [ нужен пример ] . В то же время другие языки ведут себя эргативно только в некоторых контекстах (эта « разделенная эргативность » часто основана на грамматическом лице аргументов или на времени/виде глагола). [19] Например, только некоторые глаголы в грузинском ведут себя таким образом, и, как правило, только при использовании совершенного вида (аориста).
Лингвистическая типология также стремится выявить закономерности в структуре и распределении звуковых систем среди языков мира. Это достигается путем исследования и анализа относительных частот различных фонологических свойств. Ниже приведены примерные относительные частоты для определенных звуков речи, образованных препятствующим потоку воздуха (шумные) . Эти относительные частоты показывают, что контрастное озвончение обычно происходит со взрывными , как в английских словах neat и need , но встречается гораздо реже среди фрикативных , таких как английские niece и knees . Согласно всемирной выборке из 637 языков, [20] 62% имеют контраст звонкости в смычных, но только 35% имеют это во фрикативных. В подавляющем большинстве этих случаев отсутствие контраста звонкости происходит из-за отсутствия звонких фрикативных и потому, что во всех языках есть некоторая форма взрывных (окклюзионных) , [21] но есть языки без фрикативных. Ниже представлена диаграмма, показывающая распределение свойств звонкости среди языков в вышеупомянутой выборке.
[20]
Языки по всему миру также различаются по количеству используемых звуков. Эти языки могут варьироваться от очень маленького фонематического инвентаря ( ротокас с шестью согласными и пятью гласными) до очень большого инвентаря ( !Xóõ со 128 согласными и 28 гласными). Интересное фонологическое наблюдение, обнаруженное с помощью этих данных, заключается в том, что чем больше инвентарь согласных в языке, тем больше вероятность, что он будет содержать звук из определенного набора сложных согласных (щелчки, глоттализованные согласные, дважды артикулированные лабиально-велярные смычные, боковые фрикативные и аффрикаты, увулярные и фарингальные согласные, а также зубные или альвеолярные несвистящие фрикативные). Из этого списка только около 26% языков в исследовании [20] более 600 с небольшими инвентарями (менее 19 согласных) содержат члена этого набора, в то время как 51% средних языков (19-25) содержат по крайней мере одного члена, а 69% больших инвентарей согласных (более 25 согласных) содержат члена этого набора. Затем видно, что сложные согласные пропорциональны размеру инвентаря.
Гласные содержат более скромное количество фонем, в среднем 5–6, что характерно для 51% языков, участвовавших в исследовании. Примерно у трети языков запасы гласных больше среднего. Однако наиболее интересным является отсутствие связи между размером запаса согласных и размером запаса гласных. Ниже приведена диаграмма, демонстрирующая это отсутствие предсказуемости между размерами запасов согласных и гласных по отношению друг к другу.
[20]