stringtranslate.com

Грамматика зависимостей

Грамматика зависимости ( DG ) — это класс современных грамматических теорий, которые все основаны на отношении зависимости (в отличие от отношения избирательного округа в структуре фразы ) и восходят к работам Люсьена Тесниера . Зависимость – это представление о том, что лингвистические единицы, например слова, связаны друг с другом направленными связями. (Конечный) глагол считается структурным центром структуры предложения. Все остальные синтаксические единицы (слова) либо прямо, либо косвенно связаны с глаголом направленными связями, которые называются зависимостями . Грамматика зависимостей отличается от грамматики фразовой структуры тем, что, хотя она и может идентифицировать фразы, она имеет тенденцию упускать из виду фразовые узлы. Структура зависимостей определяется отношением между словом (головой ) и его зависимыми элементами. Структуры зависимостей более плоские, чем фразовые структуры, отчасти потому, что в них отсутствует конечная глагольная составляющая фразы , и поэтому они хорошо подходят для анализа языков со свободным порядком слов, таких как чешский или варлпири .

История

Понятие зависимостей между грамматическими единицами существовало со времен самых ранних зарегистрированных грамматик, например Панини , и, следовательно, концепция зависимости, возможно, на много столетий предшествует концепции структуры фразы. [1] Ибн Мадах , лингвист XII века из Кордовы, Андалусия , возможно, был первым грамматистом, который использовал термин « зависимость» в том грамматическом смысле, в котором мы используем его сегодня. В раннее Новое время концепция зависимости, по-видимому, сосуществовала бок о бок с концепцией фразовой структуры, причем последняя вошла в латинскую, французскую, английскую и другие грамматики в результате широкомасштабного изучения логики терминов в древности. [2] Зависимость также конкретно присутствует в работах Самуэля Брассаи (1800–1897), венгерского лингвиста, Франца Керна (1830–1894), немецкого филолога, и Хеймана Харитона Тиктина (1850–1936), румынского лингвиста. . [3]

Однако современные грамматики зависимостей начинаются прежде всего с работ Люсьена Тесниера. Тесниер был французом, полиглотом и профессором лингвистики в университетах Страсбурга и Монпелье. Его основная работа «Элементы структурного синтаксиса» была опубликована посмертно в 1959 году – он умер в 1954 году. Базовый подход к синтаксису, который он разработал, похоже, был независимо подхвачен другими в 1960-х годах [4] , а также ряд других грамматик, основанных на зависимостях. приобрел известность со времен этих ранних работ. [5] DG вызвал большой интерес в Германии [6] как к теоретическому синтаксису, так и к языковой педагогике. В последние годы большое развитие в области теорий, основанных на зависимостях, произошло в компьютерной лингвистике и отчасти связано с влиятельной работой, которую Дэвид Хейс проделал в области машинного перевода в корпорации RAND в 1950-х и 1960-х годах. Системы, основанные на зависимостях, все чаще используются для анализа естественного языка и создания банков деревьев . Интерес к грамматике зависимостей в настоящее время растет, международные конференции по лингвистике зависимостей стали относительно недавним событием (Деплинг 2011, Деплинг 2013, Деплинг 2015, Деплинг 2017, Деплинг 2019. Архивировано 6 марта 2019 г. на Wayback Machine ).

Зависимость против структуры фразы

Зависимость — это взаимно однозначное соответствие: для каждого элемента (например, слова или морфа) в предложении существует ровно один узел в структуре этого предложения, соответствующий этому элементу. Результатом этого взаимно однозначного соответствия является то, что грамматики зависимостей являются грамматиками слов (или морфов). Все, что существует, — это элементы и зависимости, которые соединяют элементы в структуру. Эту ситуацию следует сравнить со структурой фразы . Структура фразы представляет собой соответствие «один к одному» или более, что означает, что для каждого элемента в предложении есть один или несколько узлов в структуре, соответствующих этому элементу. Результатом этого различия является то, что структуры зависимостей минимальны [7] по сравнению с их аналогами фразовых структур, поскольку они, как правило, содержат гораздо меньше узлов.

Эти деревья иллюстрируют два возможных способа отображения отношений зависимости и структуры фразы (см. ниже). Это дерево зависимостей является «упорядоченным» деревом, т. е. оно отражает реальный порядок слов. Многие деревья зависимостей абстрагируются от линейного порядка и фокусируются только на иерархическом порядке, что означает, что они не отображают фактический порядок слов. Это дерево округов (= структура фраз) следует соглашениям о простой структуре фраз (BPS), при этом сами слова используются в качестве меток узлов.

Различие между грамматиками зависимости и фразовой структуры во многом проистекает из первоначального разделения предложения. Отношение структуры фразы возникает в результате первоначального бинарного деления, при котором предложение разделяется на подлежащую именную группу (NP) и глагольную группу- сказуемое (VP). Это разделение, безусловно, присутствует в базовом анализе предложения, который мы находим, например, в работах Леонарда Блумфилда и Ноама Хомского . Тесьер, однако, яростно выступал против такого бинарного разделения, предпочитая вместо этого позиционировать глагол как корень всей структуры предложения. Позиция Теньера заключалась в том, что деление субъекта на предикат вытекает из терминологической логики и ему нет места в лингвистике. [8] Важность этого различия состоит в том, что если признать, что первоначальное субъектно-предикатное деление в синтаксисе реально, то, скорее всего, пойти по пути грамматики фразовой структуры, а если отвергнуть это деление, то необходимо рассмотреть глагол как корень всей структуры, и поэтому мы идем по пути грамматики зависимости.

Грамматики зависимостей

Следующие платформы основаны на зависимостях:

Гибридное дерево избирательных округов/зависимостей из Арабского корпуса Корана

Грамматика ссылок аналогична грамматике зависимостей, но грамматика ссылок не включает направленность между связанными словами и, следовательно, не описывает отношения, зависящие от головы. Грамматика гибридной структуры зависимостей/фраз использует зависимости между словами, но также включает зависимости между фразовыми узлами – см., например, Quranic Arab Dependency Treebank . Деревья вывода древовидной грамматики представляют собой структуры зависимостей, хотя полные деревья TAG визуализируются с точки зрения структуры фраз, поэтому в этом отношении неясно, следует ли рассматривать TAG больше как грамматику зависимости или структуры фраз.

Между только что перечисленными грамматиками существуют существенные различия. В этом отношении отношение зависимости совместимо с другими основными принципами теорий грамматики. Таким образом, подобно грамматикам фразовой структуры, грамматики зависимостей могут быть моно- или многоуровневыми, репрезентативными или деривационными, основанными на конструкциях или правилах.

Представление зависимостей

Существуют различные соглашения, которые генеральные директора используют для представления зависимостей. Следующие схемы (в дополнение к дереву выше и деревьям ниже) иллюстрируют некоторые из этих соглашений:

Представления в (a – d) представляют собой деревья, при этом конкретные соглашения, используемые в каждом дереве, различаются. Сплошные линии — это края зависимостей , а слегка пунктирные линии — это линии проекции . Единственная разница между деревом (a) и деревом (b) состоит в том, что дерево (a) использует класс категории для обозначения узлов, тогда как дерево (b) использует сами слова в качестве меток узлов. [9] Дерево (c) является уменьшенным деревом, поскольку строка слов ниже и линии проекции считаются ненужными и поэтому опускаются. Дерево (d) абстрагируется от линейного порядка и отражает только иерархический порядок. [10] Дуги стрелок в (e) представляют собой альтернативное соглашение, используемое для отображения зависимостей и предпочитаемое Word Grammar . [11] Скобки в (f) используются редко, но, тем не менее, вполне способны отразить иерархию зависимостей; иждивенцы кажутся заключенными в большее количество скобок, чем их головы. И, наконец, отступы, подобные тем, что в (g), — это еще одно соглашение, которое иногда используется для обозначения иерархии слов. [12] Иждивенцы располагаются под головами с отступом. Как и в дереве (d), углубления в (g) абстрагируются от линейного порядка.

Суть этих соглашений в том, что они всего лишь условности. Они не влияют на базовую приверженность зависимости как отношению, группирующему синтаксические единицы.

Типы зависимостей

Представления зависимостей выше (и ниже) показывают синтаксические зависимости. Действительно, большая часть работ по грамматике зависимостей сосредоточена на синтаксических зависимостях. Однако синтаксические зависимости — это лишь один из трех или четырех типов зависимостей. Теория значения и текста , например, подчеркивает роль семантических и морфологических зависимостей в дополнение к синтаксическим зависимостям. [13] Можно также выделить четвертый тип — просодические зависимости. Различие между этими типами зависимостей может быть важным, отчасти потому, что, если этого не сделать, велика вероятность того, что семантические, морфологические и/или просодические зависимости будут ошибочно приняты за синтаксические зависимости. Следующие четыре подраздела кратко описывают каждый из этих типов зависимостей. В ходе обсуждения существование синтаксических зависимостей принимается как нечто само собой разумеющееся и используется как ориентир для установления природы трех других типов зависимостей.

Семантические зависимости

Семантические зависимости понимаются с точки зрения предикатов и их аргументов . [14] Аргументы предиката семантически зависят от этого предиката. Часто семантические зависимости перекрываются и указывают в том же направлении, что и синтаксические зависимости. Однако иногда семантические зависимости могут указывать в направлении, противоположном синтаксическим зависимостям, или они могут быть полностью независимыми от синтаксических зависимостей. Иерархия слов в следующих примерах показывает стандартные синтаксические зависимости, тогда как стрелки указывают семантические зависимости:

Два аргумента Sam и Sally в дереве (a) зависят от предиката Likes , при этом эти аргументы также синтаксически зависят от Likes . Это означает, что семантические и синтаксические зависимости перекрываются и указывают в одном направлении (вниз по дереву). Однако атрибутивные прилагательные представляют собой предикаты, которые принимают главное существительное в качестве аргумента, следовательно, big — это предикат в дереве (b), который принимает кости в качестве своего единственного аргумента; семантическая зависимость указывает вверх по дереву и, следовательно, противоречит синтаксической зависимости. Аналогичная ситуация имеет место в (c), где предикат предлог on принимает два аргумента : картину и стену ; одна из этих семантических зависимостей указывает вверх по синтаксической иерархии, тогда как другая — вниз. Наконец, предикат to help в (d) принимает один аргумент Jim , но не связан с Jim напрямую в синтаксической иерархии, что означает, что семантическая зависимость полностью независима от синтаксических зависимостей.

Морфологические зависимости

Морфологические зависимости возникают между словами или частями слов. [15] Когда данное слово или часть слова влияет на форму другого слова, то последнее морфологически зависит от первого. Таким образом, согласие и согласие являются проявлениями морфологических зависимостей. Подобно семантическим зависимостям, морфологические зависимости могут перекрываться и указывать в том же направлении, что и синтаксические зависимости, перекрываться и указывать в противоположном направлении синтаксических зависимостей или быть полностью независимыми от синтаксических зависимостей. Стрелки теперь используются для обозначения морфологических зависимостей.

Дома во множественном числе в (а) требуют множественного числа указательного определителя, следовательно, появляются эти , а не это , что означает, что существует морфологическая зависимость, указывающая вниз по иерархии от домов к этим . Ситуация обратная в (b), где подлежащее единственного числа Sam требует появления суффикса согласия -s у конечного глагола Works , что означает, что существует морфологическая зависимость, указывающая вверх по иерархии от Sam до Works . Тип определителя в немецких примерах (c) и (d) влияет на флективный суффикс, который появляется в прилагательном alt . При использовании неопределенного артикля ein в прилагательном появляется сильное окончание мужского рода -er . Напротив, при употреблении определенного артикля der в прилагательном появляется слабое окончание -e . Таким образом, поскольку выбор определителя влияет на морфологическую форму прилагательного, существует морфологическая зависимость, указывающая от определителя к прилагательному, причем эта морфологическая зависимость совершенно не зависит от синтаксических зависимостей. Рассмотрим далее следующие французские предложения:

Подлежащее мужского рода le chien в (а) требует мужской формы предикативного прилагательного blanc , тогда как подлежащее женского рода la maison требует женской формы этого прилагательного. Таким образом, морфологическая зависимость, совершенно независимая от синтаксических зависимостей, снова указывает на синтаксическую иерархию.

Морфологические зависимости играют важную роль в типологических исследованиях . Языки классифицируются как преимущественно с головной маркировкой ( Sam Work-s ) или преимущественно с зависимой маркировкой ( эти дома ), при этом большинство, если не все языки, содержат, по крайней мере, некоторую незначительную степень как головной, так и зависимой маркировки. [16]

Просодические зависимости

Просодические зависимости признаются для того, чтобы приспособиться к поведению критиков . [17] Клитика – это синтаксически автономный элемент, просодически зависимый от хозяина. Таким образом, клитика интегрируется в просодию своего хозяина, а это означает, что она образует со своим хозяином одно слово. Просодические зависимости существуют полностью в линейном измерении (горизонтальном измерении), тогда как стандартные синтаксические зависимости существуют в иерархическом измерении (вертикальном измерении). Классическими примерами клитик в английском языке являются сокращенные вспомогательные слова (например , -ll , -s , -ve ) и притяжательный маркер -s . Просодические зависимости в следующих примерах обозначены дефисом и отсутствием вертикальной линии проекции:

Дефисы и отсутствие проекционных линий указывают на просодические зависимости. Дефис, который появляется слева от клитики, указывает на то, что клитика просодически зависит от слова, находящегося непосредственно слева от нее ( Он будет , Там ), тогда как дефис, который появляется с правой стороны клитики (здесь не показано), указывает что клитика просодически зависит от слова, которое появляется непосредственно справа от нее. Данная клитика часто просодически зависит от своей синтаксической зависимости ( Он будет , Там ) или от своей головы ( бы ). В других случаях оно может просодически зависеть от слова, которое не является ни его главой, ни его непосредственным зависимым словом ( Флорида ).

Синтаксические зависимости

Как указано выше, синтаксические зависимости находятся в центре внимания большей части работы в DG. То, как определяются наличие и направление синтаксических зависимостей, конечно, часто является предметом дискуссий. В связи с этим следует признать, что достоверность синтаксических зависимостей в деревьях на протяжении всей статьи принимается как нечто само собой разумеющееся. Однако эти иерархии таковы, что многие генеральные директора могут в значительной степени их поддержать, хотя, безусловно, будут возникать разногласия. На основной вопрос о том, как распознаются синтаксические зависимости, оказалось трудно ответить однозначно. Однако в этой области следует признать, что основная задача выявления и выяснения наличия и направления синтаксических зависимостей ГД не легче и не сложнее, чем определение составляющих группировок грамматик фразовых структур. С этой целью используются различные эвристики, полезными инструментами являются базовые тесты компонентов ; синтаксические зависимости, предполагаемые в деревьях в этой статье, группируют слова таким образом, который наиболее точно соответствует результатам стандартных тестов на перестановку, замену и многоточие для составляющих. Этимологические соображения также дают полезные подсказки о направлении зависимостей. Многообещающим принципом, на котором можно основывать существование синтаксических зависимостей, является распределение. [18] Когда кто-то пытается определить корень данной фразы, то слово, которое наиболее ответственно за определение распространения этой фразы в целом, является ее корнем.

Линейный порядок и разрывы

Традиционно у генеральных директоров был другой подход к линейному порядку (порядку слов), чем к грамматикам фразовой структуры. Структуры зависимостей минимальны по сравнению с их аналогами фразовых структур, и эти минимальные структуры позволяют сосредоточить внимание на двух измерениях порядка. [19] Отделить вертикальное измерение (иерархический порядок) от горизонтального измерения (линейный порядок) легко. Этот аспект структур зависимостей позволил генеральным директорам, начиная с Тесниера (1959), сосредоточиться на иерархическом порядке, что вряд ли возможно для грамматик фразовых структур. Для Тесниера линейный порядок был вторичен по отношению к иерархическому порядку, поскольку иерархический порядок предшествовал линейному порядку в сознании говорящего. Стебли (деревья), созданные Тесьером, отражали эту точку зрения; они абстрагировались от линейного порядка и почти полностью сосредоточились на иерархическом порядке. Многие генеральные директора, последовавшие за Тесниером, переняли эту практику, то есть они создали древовидные структуры, которые отражают только иерархический порядок, например

Традиционное внимание к иерархическому порядку создало впечатление, что ГД мало что могут сказать о линейном порядке, и это способствовало мнению, что ГД особенно хорошо подходят для изучения языков со свободным порядком слов. Однако отрицательным результатом такого внимания к иерархическому порядку является недостаток исследований DG конкретных явлений порядка слов, таких как стандартные разрывы . Комплексные описания грамматики зависимостей, связанные с тематикой , WH -фронтированием , шифрованием и экстрапозицией, по большей части отсутствуют во многих устоявшихся структурах DG. Эту ситуацию можно противопоставить грамматикам фразовой структуры, которые приложили огромные усилия для изучения этих явлений.

Однако природа отношения зависимости не мешает сосредоточиться на линейном порядке. Структуры зависимостей так же способны исследовать явления порядка слов, как и структуры фраз. Следующие деревья иллюстрируют это; они представляют собой один из способов исследования разрывов с использованием структур зависимостей. Деревья подсказывают, каким образом можно устранить распространенные разрывы. Для иллюстрации разрыва скремблирования используется пример из немецкого языка :

A-деревья слева показывают нарушения проективности (= пересечение линий), а b-деревья справа демонстрируют один из способов устранения этих нарушений. Перемещенный избиратель берет на себя слово, которое не является его губернатором . Слова, выделенные красным, обозначают катену (= цепочку) слов, которая простирается от корня смещенного компонента до правителя этого компонента. [20] Затем разрывы исследуются с точки зрения этих катен. Ограничения топализации, фронтализации , скремблирования и экстрапозиции можно изучить и выявить, исследуя природу задействованных катен.

Синтаксические функции

Традиционно генеральные директора рассматривали синтаксические функции (= грамматические функции, грамматические отношения ) как примитивные. Они постулируют перечень функций (например, субъект, объект, наклонность, определитель, атрибут, предикатив и т. д.). Эти функции могут появляться как метки зависимостей в древовидных структурах, например [21]

Синтаксические функции в этом дереве показаны зеленым цветом: ATTR (атрибут), COMP-P (дополнение предлога), COMP-TO (дополнение to), DET (определитель), P-ATTR (предложный атрибут), PRED (предикативный ), SUBJ (предмет), TO-COMP (дополнять). Выбранные функции и сокращения, использованные в дереве здесь, просто отражают общую позицию DG по отношению к синтаксическим функциям. Фактический перечень используемых функций и обозначений варьируется от DG к DG.

В примитиве теории статус этих функций сильно отличается от статуса в некоторых грамматиках фразовых структур. Традиционно грамматики фразовой структуры извлекают синтаксические функции из созвездия. Например, объект идентифицируется как НП, появляющаяся внутри конечной ВП, а субъект — как НП, появляющаяся вне конечной ВП. Поскольку генеральные директора отвергают существование конечной составляющей VP, им никогда не предоставлялась возможность просматривать синтаксические функции таким образом. Проблема заключается в том, что стоит на первом месте: традиционно ГД считают синтаксические функции примитивными, а затем выводят совокупность из этих функций, тогда как грамматики фразовой структуры традиционно считают совокупность примитивной, а затем выводят синтаксические функции из созвездие.

Вопрос о том, что первично (функции или созвездие), не является непреложным вопросом. Позиции обоих типов грамматики (зависимость и структура фразы) не ограничиваются традиционными взглядами. Зависимость и структура фразы полностью совместимы с обоими подходами к синтаксическим функциям. Действительно, моностратальные системы, основанные исключительно на зависимостях или фразовой структуре, скорее всего, отвергнут представление о том, что функции происходят из совокупности или что совокупность выводится из функций. Они будут считать оба примитивными, что означает, что ни один из них не может быть выведен из другого.

Смотрите также

Примечания

  1. ^ Об истории концепции зависимости см. Персиваль (1990).
  2. ^ О влиянии терминологической логики на теорию грамматики см. Персиваль (1976).
  3. ^ О зависимости в работах Брассаи см. Имреньи (2013). По поводу зависимости в творчестве Керна см. его очерки (например, Керн 1883, 1884). О зависимости в работах Тиктина см. Coseriu (1980).
  4. ^ О ранних грамматиках зависимостей, которые, возможно, были разработаны независимо от работ Тесниера, см., например, Хейс (1960), Гайфман (1965) и Робинсон (1970).
  5. ^ Некоторые известные грамматики зависимостей, которые были хорошо известны к 1980-м годам, взяты из Хадсона (1984), Сгалла, Гайичовой и Паневовой (1986), Мельчука (1988) и Старосты (1988).
  6. ^ Некоторые известные грамматики зависимостей из немецких школ взяты из Heringer (1996), Engel (1994), Eroms (2000) и Ágel et al. (2003/6) представляет собой массивный двухтомный сборник эссе по грамматике зависимостей и теории валентности, написанный более чем 100 авторами.
  7. ^ Минимальность структур зависимости подчеркивается, например, Нинио (2006), Хадсон 2007: 117, а также Осборном и др. (2011).
  8. Относительно отклонения Тесьером разделения предложения на субъект-предикат см. Tesnière (1959:103–105), а обсуждение эмпирических соображений, подтверждающих точку зрения Теньера, см. Matthews (2007:17ff.), Miller (2011:54ff. ), а также Осборн и др. (2011:323 и далее).
  9. ^ Условные обозначения, проиллюстрированные деревьями (a) и (b), предпочитают Осборн и др. (2011, 2013).
  10. ^ Неупорядоченные деревья типа (d) связаны прежде всего со стеммами Тесьера и с синтаксическими пластами теории значения и текста Мельчука.
  11. ^ Три основные работы по грамматике слов: Хадсон (1984, 1990, 2007).
  12. ^ Лобин (2003) активно использует эти углубления.
  13. Обсуждение семантических, морфологических и синтаксических зависимостей в теории значения и текста см. в Melcuk (2003:191ff.) и Osborne 2019: Ch. 5).
  14. О семантических зависимостях см. Melc̆uk (2003:192f.).
  15. О морфологических зависимостях см. Мельчук (2003:193ff.).
  16. ^ Различие между маркировкой головы и зависимой маркировкой было установлено Николсом (1986). Николс использовал понимание этих различий на основе зависимостей.
  17. ^ О просодических зависимостях и анализе клитики см. Groß (2011).
  18. Распределение — это основной принцип, используемый Оуэнсом (1984:36), Шубертом (1988:40) и Мелькуком (2003:200) для выявления синтаксических зависимостей.
  19. О важности двух измерений порядка см. Tesnière (1959:16ff).
  20. ^ См. Осборн и др. (2012) относительно катен.
  21. ^ Обсуждение и примеры меток для синтаксических функций, прикрепленных к ребрам и дугам зависимостей, см., например, в Mel'cuk (1988:22, 69) и van Valin (2001:102ff.).

Рекомендации

Внешние ссылки