Лингвистическая типология (или языковая типология ) — это область лингвистики , которая изучает и классифицирует языки в соответствии с их структурными особенностями, чтобы обеспечить возможность их сравнения. Его цель — описать и объяснить структурное разнообразие и общие свойства языков мира. [1] Его субдисциплины включают, помимо прочего, фонологическую типологию, которая занимается звуковыми характеристиками; синтаксическая типология, которая занимается порядком и формой слов; лексическая типология, занимающаяся языковой лексикой; и теоретическая типология, целью которой является объяснение универсальных тенденций. [2]
Лингвистическая типология противопоставляется генеалогической лингвистике на том основании, что типология группирует языки или их грамматические особенности на основе формального сходства, а не исторического происхождения. [3] Тем не менее, вопрос генеалогической связи имеет отношение к типологии, поскольку современные наборы данных стремятся быть репрезентативными и беспристрастными. Образцы собираются равномерно из разных языковых семей , что подчеркивает важность менее известных языков для понимания человеческого языка. [4]
Предположения о существовании (логической) общей или универсальной грамматики, лежащей в основе всех языков, были опубликованы в средние века, особенно школой Модистов . В то время латынь была образцовым языком лингвистики, хотя транскрипция ирландского и исландского языков на латиницу оказалась проблематичной. Межъязыковое измерение языкознания утвердилось в эпоху Возрождения . Например, в разделах Grammaticae Quadrilinguis (1544 г.) Иоганна Дрозеуса французский язык сравнивается с тремя «священными языками»: ивритом, греческим и латынью. Этот подход был расширен «Грамматикой Пор-Рояля» (1660 г.) Антуана Арно и Клода Ланселота , которые добавили испанский, итальянский, немецкий и арабский языки. Книга Николя Бозе 1767 года включает примеры английского, шведского, саамского , ирландского, валлийского , баскского , кечуа и китайского языков. [5]
Завоевание и обращение мира европейцами привело к возникновению «миссионерской лингвистики», производящей списки слов из первых рук и грамматические описания экзотических языков. Такая работа описана в «Каталоге языков известного нам населения» 1800 года испанского иезуита Лоренцо Эрваса . Иоганн Кристоф Аделунг собрал первый большой языковой образец молитвы Господней почти на пятистах языках (посмертно, 1817 г.). [5]
К более развитым сравнительным работам девятнадцатого века относятся «Система спряжения» Франца Боппа (1816 г.) и «О различии в языковой структуре человека и ее влиянии на интеллектуальное развитие человечества» Вильгельма фон Гумбольдта (посмертно, 1836 г.). В 1818 году Август Вильгельм Шлегель классифицировал языки мира на три типа: (i) языки, лишенные грамматической структуры, например китайский; (ii) агглютинативные языки, например турецкий; и (iii) флективные языки, которые могут быть синтетическими, как латынь и древнегреческий, или аналитическими, как французский. Эта идея позже была развита другими, включая Августа Шлейхера , Хеймана Штейнталя , Франца Мистели, Франца Николауса Финка и Макса Мюллера . [3]
Слово «типология» было предложено Георгом фон дер Габеленцем в его «Sprachwissenschaft» (1891). Луи Ельмслев предложил типологию как крупномасштабную эмпирико-аналитическую попытку сравнения грамматических особенностей с целью раскрытия сущности языка. Начало такому проекту положила конференция 1961 года по языковым универсалиям в Доббс-Ферри . Среди докладчиков были Роман Якобсон , Чарльз Ф. Хокетт и Джозеф Гринберг , которые предложили сорок пять различных типов лингвистических универсалий на основе своих наборов данных из тридцати языков. Выводы Гринберга были в основном известны от грамматиков девятнадцатого века, но его систематическое изложение их послужит моделью для современной типологии. [3] Уинфред П. Леманн представил типологическую теорию Гринберга в индоевропейских исследованиях в 1970-х годах. [6]
В течение двадцатого века типология, основанная на миссионерской лингвистике, сосредоточилась вокруг SIL International , которая сегодня размещает свой каталог живых языков Ethnologue в качестве онлайн-базы данных. Гринберговский или универсалистский подход объясняется, среди прочего, Всемирным атласом языковых структур . Типология также осуществляется в рамках функциональной грамматики, включая грамматику функционального дискурса , грамматику ролей и ссылок и системную функциональную лингвистику . Однако в первые годы двадцать первого века существование лингвистических универсалий было поставлено под сомнение лингвистами, предлагающими эволюционную типологию. [7]
Количественная типология занимается распределением и сосуществованием структурных моделей в языках мира. [8] К основным типам неслучайного распределения относятся:
Лингвистические универсалии — это модели, которые можно рассматривать в межлингвистическом контексте. Универсалии могут быть либо абсолютными, то есть каждый документированный язык обладает этой характеристикой, либо статистическими, то есть эта характеристика наблюдается в большинстве языков или вероятна в большинстве языков. Универсалии, как абсолютные, так и статистические, могут быть неограниченными, то есть они применимы к большинству или ко всем языкам без каких-либо дополнительных условий. И наоборот, как абсолютные, так и статистические универсалии могут быть ограниченными или подразумеваемыми, что означает, что характеристика будет истинной при условии чего-то еще (если характеристика Y истинна, то характеристика X истинна). [9] Примером импликативной иерархии является то, что двойные местоимения встречаются только в языках с местоимениями во множественном числе , тогда как местоимения в единственном числе (или неуказанные по числу) встречаются во всех языках. Таким образом, импликативная иерархия имеет форму единственного < множественного < двойственного (и т. д.).
Качественная типология разрабатывает межлингвистически жизнеспособные понятия или типы, которые обеспечивают основу для описания и сравнения языков.
К основным подполям лингвистической типологии относятся эмпирические поля синтаксической, фонологической и лексической типологии. Кроме того, теоретическая типология направлена на объяснение эмпирических результатов, особенно статистических тенденций или подразумеваемых иерархий.
Синтаксическая типология изучает широкий спектр грамматических явлений в языках мира. Две хорошо известные проблемы включают доминирующий порядок и симметрию левых и правых.
Один набор типов отражает основной порядок подлежащего , глагола и прямого дополнения в предложениях:
Эти ярлыки обычно обозначаются сокращенно «SVO» и т. д. и могут называться «типологиями» языков, к которым они применяются. Наиболее часто проверяемыми порядками слов являются SOV и SVO, тогда как наименее распространенными являются порядки, которые являются начальными объектами, при этом OVS является наименее распространенным и имеет только четыре подтвержденных экземпляра. [10]
В 1980-е годы лингвисты начали подвергать сомнению актуальность географического распределения различных значений для различных особенностей языковой структуры. Возможно, они хотели выяснить, встречается ли определенная грамматическая структура, встречающаяся в одном языке, в другом языке в том же географическом месте. [11] Некоторые языки разделяют глаголы на вспомогательный глагол и инфинитив или причастие и помещают между ними подлежащее и/или дополнение. Например, немецкий ( Ich habe einen Fuchs im Wald gesehen - *"Я видел лису в лесу"), голландский ( Hans vermoedde dat Jan Marie zag leren zwemmen - *"Ганс подозревал, что Ян Мари видел, чтобы научиться плавать ") и валлийский ( Mae 'r gwirio sillafu wedi'i gwblhau - *"Проводится ли проверка правописания после ее завершения"). В этом случае лингвисты основывают типологию на неаналитических временах (т.е. на тех предложениях, в которых глагол не расчленяется) или на положении вспомогательного слова. Таким образом, в главных предложениях немецкого языка используется SVO, а в валлийском — VSO (и предлоги идут после инфинитива).
Многие типологи [ кто? ] классифицируют немецкий и голландский языки как языки V2 , поскольку глагол неизменно встречается как второй элемент полного предложения.
Некоторые языки допускают различные степени свободы в порядке их составляющих, что создает проблему для их классификации в рамках схемы субъект-глагол-объект. Например, языки со связанным регистром существительных, как правило, имеют более гибкий порядок слов, чем языки, где регистр определяется положением в предложении или наличием предлога. Например, в некоторых языках со связанным падежным обозначением существительных, таких как язык X, наблюдаются различные степени свободы в порядке составляющих. Эти языки демонстрируют более гибкий порядок слов, допуская такие вариации, как структура субъект-глагол-объект (SVO), как в «Кот съел мышь», и структура объект-субъект-глагол (OSV), как в «Мышь, кот». ел.' Чтобы определить базовый тип порядка составляющих в этом случае, обычно смотрят на частоту различных типов в декларативно-утвердительных главных предложениях в прагматически нейтральных контекстах, желательно только с старыми референтами. Так, например, русский язык широко считается языком СВО, поскольку это наиболее частый составной порядок в таких условиях, хотя возможны всевозможные вариации, которые встречаются в текстах. Во многих флективных языках, таких как русский, латынь и греческий, отклонения от порядка слов по умолчанию допустимы, но обычно подразумевают смещение фокуса, акцент на последнем элементе или какой-то особый контекст. В поэзии этих языков порядок слов также может свободно меняться в соответствии с требованиями метрики. Кроме того, свобода порядка слов может различаться в пределах одного и того же языка - например, формальные, литературные или архаичные варианты могут иметь разные, более строгие или более мягкие структуры порядка слов, чем неформальные разговорные варианты того же языка.
С другой стороны, когда в описанных условиях нет явного предпочтения, считается, что язык имеет «гибкий порядок составляющих» (тип сам по себе).
Дополнительная проблема заключается в том, что в языках без живых речевых сообществ, таких как латинский , древнегреческий и старославянский , лингвисты располагают только письменными свидетельствами, возможно, написанными в поэтическом, формализованном или архаическом стиле, который неверно характеризует фактическое повседневное использование языка. . [12] Повседневный разговорный язык Софокла или Цицерона мог иметь другой или гораздо более регулярный синтаксис, чем указывает их письменное наследие.
В таблице ниже показано распределение доминирующего порядка слов в более чем 5000 отдельных языках и 366 языковых семьях. SOV является наиболее распространенным типом в обоих случаях, хотя гораздо более четко это видно по данным языковых семей, включая изоляты . «NODOM» представляет языки без единого доминирующего порядка. [13]
Хотя причину доминирования иногда считают нерешенной или неразрешимой типологической проблемой, было предложено несколько объяснений схемы распределения. К эволюционным объяснениям относятся объяснения Томаса Гивона (1979), который предполагает, что все языки произошли от языка SOV, но эволюционировали в разные виды; и Дерек Бикертон (1981), который утверждает, что исходным языком был SVO, который поддерживает более простую грамматику, использующую порядок слов вместо маркеров регистра для различения клаузальных ролей. [14]
Универсалистские объяснения включают модель Рассела Томлина (1986), основанную на трех функциональных принципах: (i) одушевленное прежде неодушевленного; (ii) тема перед комментарием; и (iii) связь глагол-объект. Трехфакторная модель примерно предсказывает реальную иерархию (см. таблицу выше), предполагая отсутствие статистической разницы между SOV и SVO, а также отсутствие статистической разницы между VOS и OVS. Напротив, теория эффективности обработки Джона А. Хокинса (1994) предполагает, что составляющие упорядочены от самых коротких к самым длинным в языках VO и от самых длинных к самым коротким в языках OV, что приводит к подтвержденному распределению. Этот подход основан на представлении о том, что в языках OV есть тяжелые предметы, а в языках VO — тяжелые объекты, что является спорным. [14]
Второй основной способ синтаксической категоризации — исключение предмета из рассмотрения. Хорошо задокументированной типологической особенностью является то, что языки с доминирующим порядком OV (дополнение перед глаголом), например японский, имеют тенденцию иметь послелоги . Напротив, в языках VO (глагол перед дополнением), таких как английский , в качестве основного адпозиционного типа обычно используются предлоги . Было обнаружено несколько корреляций OV/VO. [15]
В 1980-х и 1990-х годах было предложено несколько объяснений вышеупомянутых корреляций . Они предполагают, что мозгу легче анализировать синтаксические шаблоны , имеющие либо правое, либо левое ветвление , но не смешанные. Наиболее широко распространенное такое объяснение — это теория эффективности синтаксического анализа Джона А. Хокинса , которая утверждает, что язык — это неврожденная адаптация к врожденным когнитивным механизмам. Считается, что типологические тенденции основаны на предпочтении пользователями языка эффективно организованных грамматик и на избегании ими порядка слов, который вызывает трудности с обработкой. Теория обработки Хокинса предсказывает приведенную выше таблицу, но также делает прогнозы для некорреляционных пар, включая порядок прилагательных, указательных чисел и числительных по отношению к существительному. Эта теория была основана на корпусных исследованиях и не имеет поддержки в психолингвистических исследованиях. [14]
Некоторые языки демонстрируют регулярные «неэффективные» шаблоны. К ним относятся языки ВО: китайский с придаточной фразой перед глаголом и финский с послелогами. Но есть несколько других глубоко исключительных языков. Совсем недавно высказано предположение, что ориентация лево-право ограничивается ролевыми связками ( прилагательствами и подчинителями ), вытекающими непосредственно из семантического отображения предложения. Поскольку истинные корреляционные пары в приведенной выше таблице либо включают такую связку, либо, возможно, следуют из канонического порядка, ориентация предсказывает их, не делая проблемных утверждений. [17]
Другая распространенная классификация различает номинативно-винительный падеж и эргативно-абсолютный падеж. В языке с падежами классификация зависит от того, имеет ли подлежащее (S) непереходного глагола тот же падеж, что и действующее лицо (А) или пациент (P) переходного глагола. Если в языке нет падежей, но порядок слов AVP или PVA, то классификация может отражать, появляется ли подлежащее непереходного глагола на той же стороне, что и действующее лицо или пациент переходного глагола. Бикель (2011) утверждал, что выравнивание следует рассматривать как свойство, специфичное для конструкции, а не свойство, специфичное для языка. [18]
Многие языки демонстрируют смешанное винительное и эргативное поведение (например: эргативная морфология, обозначающая аргументы глагола, поверх синтаксиса винительного падежа). В других языках (называемых « активными языками ») есть два типа непереходных глаголов — некоторые из них («активные глаголы») присоединяются к подлежащему в том же падеже, что и агент переходного глагола, а остальные («стативные глаголы») присоединяются к субъекту в том же падеже, что и агент переходного глагола. субъект в том же случае, что и пациент [ необходим пример ] . Тем не менее, другие языки ведут себя эргативно только в некоторых контекстах (эта « расщепленная эргативность » часто основана на грамматическом лице аргументов или на времени/виде глагола). [19] Например, так ведут себя только некоторые глаголы в грузинском языке , и, как правило, только при употреблении перфекта (аориста).
Лингвистическая типология также направлена на выявление закономерностей в структуре и распределении звуковых систем среди языков мира. Это достигается путем исследования и анализа относительных частот различных фонологических свойств. Ниже приведены примерные относительные частоты для некоторых звуков речи, образующихся за счет препятствия потоку воздуха (помех) . Эти относительные частоты показывают, что контрастная звонкость обычно встречается со взрывными звуками , например, в английском аккуратный и нуждающийся , но гораздо реже встречается среди фрикативных звуков , таких как английская племянница и колени . Согласно всемирной выборке из 637 языков, [20] 62% имеют голосовой контраст в стопах, но только 35% имеют его в фрикативных звуках. В подавляющем большинстве этих случаев отсутствие голосового контраста происходит из-за отсутствия звонких фрикативов и из-за того, что все языки имеют ту или иную форму взрывного (окклюзионного) звука , [21] но есть языки без фрикативов. Ниже приведена диаграмма, показывающая распределение голосовых свойств между языками в вышеупомянутой выборке.
[20]
Языки во всем мире также различаются по количеству используемых звуков. Эти языки могут варьироваться от очень маленького фонематического набора ( ротока с шестью согласными и пятью гласными) до очень большого набора ( !Xóõ со 128 согласными и 28 гласными). На основе этих данных было обнаружено интересное фонологическое наблюдение: чем больше в языке запас согласных, тем с большей вероятностью он содержит звуки из определенного набора сложных согласных (щелчки, голосовые согласные, двучленные губно-велярные остановки, латеральные фрикативные звуки). и аффрикаты, увулярные и глоточные согласные, а также зубные или альвеолярные несвистящие фрикативные звуки). Из этого списка только около 26% языков в опросе [20] из более чем 600 с небольшим набором (менее 19 согласных) содержат член этого набора, в то время как 51% средних языков (19-25) содержат хотя бы один член, и 69% больших согласных (более 25 согласных) содержат член этого набора. Тогда видно, что сложные согласные пропорциональны размеру инвентаря.
Гласные содержат более скромное количество фонем, в среднем 5–6, что имеется в 51% языков, принявших участие в исследовании. Примерно в трети языков запас гласных превышает средний показатель. Однако наиболее интересным является отсутствие связи между размером запаса согласных и размером запаса гласных. Ниже приведена диаграмма, показывающая отсутствие предсказуемости между размерами запасов согласных и гласных по отношению друг к другу.
[20]