В лингвистике синтаксис ( / ˈ s ɪ n t æ k s / SIN -taks ) [1] [2] - это изучение того, как слова и морфемы объединяются в более крупные единицы , такие как фразы и предложения . Центральные вопросы синтаксиса включают порядок слов , грамматические отношения , иерархическую структуру предложения ( конститут ), [3] согласование , природу кросс-лингвистических вариаций и связь между формой и значением ( семантика ). Существует множество подходов к синтаксису, которые различаются по своим центральным предположениям и целям.
Слово «синтаксис» происходит от древнегреческих корней: σύνταξις «координация», которая состоит из σύν syn «вместе» и τάξις táxis «упорядочение».
Область синтаксиса содержит ряд различных тем, которые часто разрабатываются для обработки синтаксической теорией. Связь между темами рассматривается по-разному в разных теориях, и некоторые из них могут не считаться отдельными, а вместо этого выводимыми друг из друга (т. е. порядок слов можно рассматривать как результат правил движения, выводимых из грамматических отношений).
Одним из основных описаний синтаксиса языка является последовательность, в которой субъект (S), глагол (V) и объект (O) обычно появляются в предложениях. Более 85% языков обычно помещают субъект на первое место, либо в последовательности SVO , либо в последовательности SOV . Другие возможные последовательности — VSO , VOS , OVS и OSV , последние три из которых встречаются редко. В большинстве генеративных теорий синтаксиса поверхностные различия возникают из-за более сложной структуры клаузальных фраз, и каждый порядок может быть совместим с несколькими производными. Однако порядок слов может также отражать семантику или функцию упорядоченных элементов. [4]
Другое описание языка рассматривает набор возможных грамматических отношений в языке или в целом и то, как они ведут себя по отношению друг к другу в морфосинтаксическом выравнивании языка. Описание грамматических отношений может также отражать транзитивность, пассивизацию и зависимую от головы маркировку или другое соглашение. Языки имеют разные критерии для грамматических отношений. Например, критерии субъектности могут иметь последствия для того, как субъект упоминается из относительного предложения или кореферентного с элементом в бесконечном предложении. [5]
Составляющая — это свойство быть составной частью и то, как слова могут работать вместе, образуя составную часть (или фразу ). Составные части часто перемещаются как единицы, а составная часть может быть областью согласования. Некоторые языки допускают прерывистые фразы, в которых слова, принадлежащие к одной и той же составляющей, не являются непосредственно смежными, а разбиваются другими составными частями. Составные части могут быть рекурсивными , так как они могут состоять из других составляющих, потенциально того же типа.
«Аштадхьяйи» Панини , написанное около 4 в . до н. э. в Древней Индии , часто приводится в качестве примера досовременной работы, которая по сложности приближается к современной синтаксической теории, поскольку работы по грамматике были написаны задолго до появления современного синтаксиса. [6] На Западе школа мысли, которая стала известна как «традиционная грамматика», началась с работы Дионисия Фракийского .
На протяжении столетий структура, известная как grammaire générale , впервые изложенная в 1660 году Антуаном Арно и Клодом Ланселотом в книге с тем же названием , доминировала в работах по синтаксису: [7] в качестве ее основной предпосылки предполагалось, что язык является прямым отражением мыслительных процессов и поэтому существует единственный наиболее естественный способ выражения мысли. [8]
Однако в 19 веке, с развитием историко-сравнительного языкознания , лингвисты начали осознавать огромное разнообразие человеческого языка и подвергать сомнению фундаментальные предположения о связи между языком и логикой. Стало очевидно, что не существует такого понятия, как наиболее естественный способ выражения мысли, и поэтому на логику больше нельзя было полагаться как на основу для изучения структуры языка. [ необходима цитата ]
Грамматика Пор-Рояля смоделировала изучение синтаксиса по образцу логики. (Действительно, большие части Логики Пор-Рояля были скопированы или адаптированы из Grammaire générale . [9] ) Синтаксические категории были отождествлены с логическими, и все предложения анализировались в терминах «субъект – связка – сказуемое». Первоначально эта точка зрения была принята даже ранними сравнительными лингвистами, такими как Франц Бопп .
Центральная роль синтаксиса в теоретической лингвистике стала ясна только в 20 веке, который можно было бы с полным основанием назвать «веком синтаксической теории» в том, что касается лингвистики. (Подробный и критический обзор истории синтаксиса за последние два столетия см. в монументальном труде Джорджио Граффи (2001). [10] )
Существует ряд теоретических подходов к дисциплине синтаксиса. Одна школа мысли, основанная в работах Дерека Бикертона , [11] рассматривает синтаксис как раздел биологии, поскольку она понимает синтаксис как изучение лингвистических знаний, воплощенных в человеческом разуме . Другие лингвисты (например, Джеральд Газдар ) придерживаются более платонистской точки зрения, поскольку считают синтаксис изучением абстрактной формальной системы . [12] Другие же (например, Джозеф Гринберг ) считают синтаксис таксономическим приемом для достижения широких обобщений в разных языках.
Синтаксисты пытались объяснить причины вариаций порядка слов в отдельных языках и в межъязыковом плане. Большая часть такой работы была проделана в рамках генеративной грамматики, которая утверждает, что синтаксис зависит от генетического дара, общего для человеческого вида. В этой и других рамках лингвистическая типология и универсалии были основными экспликандами. [13]
Альтернативные объяснения, такие как объяснения функциональных лингвистов , были найдены в обработке языка . Предполагается, что мозгу легче анализировать синтаксические шаблоны , которые являются либо правыми, либо левыми, но не смешанными. Наиболее широко распространенным подходом является гипотеза соответствия производительности и грамматики Джона А. Хокинса , который предполагает, что язык является неврожденной адаптацией к врожденным когнитивным механизмам. Считается, что кросс-лингвистические тенденции основаны на предпочтении пользователями языка грамматик, которые организованы эффективно, и на их избегании порядка слов, который вызывает трудности в обработке. Однако некоторые языки демонстрируют регулярную неэффективную шаблонизацию, например, языки VO китайский с предложной фразой перед глаголом и финский с послелогами, но есть несколько других глубоко исключительных языков. [14] Совсем недавно было высказано предположение, что модели лево- и правостороннего ветвления кросс-лингвистически связаны только с местом ролевых связок ( прилагательных и подчиненных ), которые связывают явления с семантическим отображением предложений. [15]
Грамматика зависимости — это подход к структуре предложения, в котором синтаксические единицы располагаются в соответствии с отношением зависимости, в отличие от отношения конституентности грамматик фразовой структуры . Зависимости — это направленные связи между словами. (Конечный) глагол рассматривается как корень всей структуры предложения, а все остальные слова в предложении напрямую или косвенно зависят от этого корня (т. е. глагола). Вот некоторые известные теории синтаксиса, основанные на зависимости:
Люсьен Тесньер (1893–1954) широко рассматривается как отец современных теорий синтаксиса и грамматики, основанных на зависимости. Он решительно выступал против бинарного деления предложения на подлежащее и сказуемое , которое ассоциировалось с грамматиками его времени (S → NP VP) и остается в основе большинства грамматик фразовой структуры. Вместо этого разделения он позиционировал глагол как корень всех структур предложений. [16]
Категориальная грамматика — это подход, в котором составляющие объединяются как функция и аргумент , в соответствии с комбинаторными возможностями, указанными в их синтаксических категориях . Например, другие подходы могут постулировать правило, которое объединяет именную группу (NP) и глагольную группу (VP), но CG постулирует синтаксическую категорию NP и другую NP\S , читаемую как «категория, которая ищет слева (обозначается \) NP (элемент слева) и выводит предложение (элемент справа)». Таким образом, синтаксическая категория для непереходного глагола — это сложная формула, представляющая тот факт, что глагол действует как служебное слово, требующее NP в качестве входных данных и производящее структуру уровня предложения в качестве выходных данных. Сложная категория обозначается как (NP\S) вместо V. Категория переходного глагола определяется как элемент, требующий двух NP (его подлежащего и его прямого дополнения) для формирования предложения. Это обозначается как (NP/(NP\S)), что означает: «Категория, которая ищет NP (объект) справа (обозначается /) и генерирует функцию (эквивалентную VP), которая есть (NP\S), которая, в свою очередь, представляет собой функцию, которая ищет NP слева и генерирует предложение».
Древовидная грамматика — это категориальная грамматика, которая добавляет к категориям частичные древовидные структуры .
Теоретические подходы к синтаксису, основанные на теории вероятностей, известны как стохастические грамматики . Одна из распространенных реализаций такого подхода использует нейронную сеть или коннекционизм .
Функционалистские модели грамматики изучают взаимодействие формы и функции путем проведения структурного и функционального анализа.
Генеративный синтаксис — это изучение синтаксиса в рамках всеобъемлющей структуры генеративной грамматики . Генеративные теории синтаксиса обычно предлагают анализ грамматических моделей с использованием формальных инструментов, таких как грамматики фразовой структуры, дополненные дополнительными операциями, такими как синтаксическое движение . Их цель при анализе конкретного языка — указать правила, которые генерируют все и только те выражения, которые хорошо сформированы в этом языке. При этом они стремятся выявить врожденные принципы лингвистического познания, специфичные для данной области, в соответствии с более широкими целями генеративного предприятия. Генеративный синтаксис относится к подходам, которые принимают принцип автономии синтаксиса , предполагая, что значение и коммуникативное намерение определяются синтаксисом, а не наоборот.
Генеративный синтаксис был предложен в конце 1950-х годов Ноамом Хомским , основываясь на более ранних работах Зеллига Харриса , Луиса Ельмслева и других. С тех пор под его эгидой было предложено множество теорий:
Другие теории, берущие свое начало в генеративной парадигме:
Когнитивная лингвистическая структура происходит из генеративной грамматики , но придерживается эволюционной , а не хомскианской лингвистики. Когнитивные модели часто распознают генеративное предположение, что объект принадлежит глагольной фразе. Когнитивные структуры включают следующее:
[
Аштадхьяйи] представляет собой
весьма точное и подробное описание структуры санскрита, несколько напоминающее современную генеративную грамматику... [оно] оставалось самым передовым лингвистическим анализом любого рода вплоть до двадцатого века.
Nous avons emprunté... ce que nous avons dit... d'un petit Livre... sous le titre de Grammaire générale.