В синтаксическом анализе составляющая — это слово или группа слов, которые функционируют как единое целое в иерархической структуре. Составляющая структура предложений определяется с помощью тестов на составляющие . [1] Эти тесты применяются к части предложения, и результаты предоставляют доказательства о составляющей структуре предложения. Многие составляющие являются фразами . Фраза — это последовательность из одного или нескольких слов (в некоторых теориях двух или более), построенная вокруг главного лексического элемента и работающая как единое целое в предложении. Последовательность слов считается фразой/составляющей, если она демонстрирует одно или несколько поведений, обсуждаемых ниже. Анализ составляющей структуры в основном связан с грамматиками структуры фраз , хотя грамматики зависимостей также позволяют разбить структуру предложения на составные части.
Тесты на составляющие являются диагностикой, используемой для определения структуры предложения. Существует множество тестов на составляющие, которые обычно используются для определения составляющих английских предложений. 15 наиболее часто используемых тестов перечислены ниже: 1) координация (конъюнкция), 2) замена проформы (замена), 3) топикализация (фронтирование), 4) замена do-so , 5) замена one , 6) многоточие ответа (вопросительный тест), 7) расщепление , 8) многоточие VP , 9) псевдорасщепление, 10) пассивизация, 11) пропуск (удаление), 12) вторжение, 13) замена wh, 14) общая замена, 15) поднятие правого узла (RNR).
Порядок, в котором перечислены эти 15 тестов, соответствует частоте использования, причем наиболее часто используемым из 15 тестов является координация, а наименее часто используемым — RNR. При использовании этих тестов следует соблюдать общую осторожность, поскольку они часто дают противоречивые результаты. Тесты — это всего лишь грубые инструменты, которые грамматики используют для выявления подсказок о синтаксической структуре. Некоторые синтактики даже располагают тесты по шкале надежности, при этом менее надежные тесты считаются полезными для подтверждения принадлежности, хотя и недостаточными сами по себе. Непрохождение одного теста не означает, что тестовая строка не является компонентом, и наоборот, прохождение одного теста не обязательно означает, что тестовая строка является компонентом. Лучше всего применить как можно больше тестов к данной строке, чтобы доказать или исключить ее статус как компонента.
Ниже представлены, обсуждены и проиллюстрированы 15 тестов, в основном опирающихся на одно и то же предложение: [2]
Ограничивая введение и обсуждение тестов для составляющих ниже в основном этим одним предложением, становится возможным сравнить результаты тестов. Для облегчения обсуждения и иллюстрации структуры составляющих этого предложения используются следующие две диаграммы предложений (D = определитель, N = существительное, NP = именная группа, Pa = частица, S = предложение, V = глагол, VP = глагольная группа):
Эти диаграммы показывают два потенциальных анализа структуры составляющих предложения. Данный узел в древовидной диаграмме понимается как маркирующий составляющую, то есть составляющая понимается как соответствующая данному узлу и всему, что этот узел исчерпывающе доминирует. Следовательно, первое дерево, которое показывает структуру составляющих согласно грамматике зависимостей , отмечает следующие слова и словосочетания как составляющие: Drunks , off , the , the customers , и put off the customers . [3] Второе дерево, которое показывает структуру составляющих согласно грамматике фразовой структуры , отмечает следующие слова и словосочетания как составляющие: Drunks , could , put , off , the , customers , the customers , put off the customers , и could put off the customers . Анализы в этих двух древовидных диаграммах дают ориентацию для обсуждения тестов для составляющих, которое теперь следует.
Тест на координацию предполагает, что только составляющие могут быть скоординированы, т.е. объединены с помощью координатора, такого как and , or , or but : [4] Следующие примеры показывают, что координация идентифицирует отдельные слова как составляющие:
Квадратные скобки обозначают конъюнкты структур координат. На основе этих данных можно предположить, что drunks , could , put off и customers являются составляющими в тестовом предложении, поскольку эти строки могут быть согласованы с bums , would , drive away и neighbors соответственно. Координация также определяет многословные строки как составляющие:
Эти данные свидетельствуют о том, что клиенты , отталкивать клиентов и может отталкивать клиентов являются составляющими тестового предложения.
Примеры, такие как (ag), не являются спорными, поскольку многие теории структуры предложения легко рассматривают строки, протестированные в предложениях (ag), как составляющие. Однако дополнительные данные проблематичны, поскольку они предполагают, что некоторые строки также являются составляющими, хотя большинство теорий синтаксиса не признают их таковыми, например
Эти данные предполагают, что could put off , put off these и Drunks could являются составляющими в тестовом предложении. Большинство теорий синтаксиса отвергают идею о том, что эти строки являются составляющими. Такие данные, как (hj), иногда рассматриваются в терминах механизма поднятия правого узла (RNR).
Проблема для координационного теста, представленного примерами (hj), усугубляется, когда смотришь дальше тестового предложения, поскольку быстро обнаруживаешь, что координация предполагает, что широкий спектр строк является составляющими, которые большинство теорий синтаксиса не признают таковыми, например:
Строки from home on Tuesday и from home on Tuesday on his bicycle не рассматриваются как составляющие в большинстве теорий синтаксиса, а что касается предложения (m), то там очень сложно даже различить, как следует разграничивать конъюнкты координатной структуры. Координатные структуры в (kl) иногда характеризуются в терминах неконъюнктивных конъюнктов (NCC), а пример координации в предложении (m) иногда обсуждается в терминах удаления и/или зазора .
Из-за трудностей, предложенных с примерами (hm), многие грамматисты скептически относятся к координации относительно ее ценности как теста на составляющие. Обсуждение других тестов на составляющие ниже показывает, что этот скептицизм оправдан, поскольку координация определяет гораздо больше строк как составляющие, чем другие тесты на составляющие. [5]
Замена проформы , или замена, подразумевает замену тестовой строки соответствующей проформой (например, местоимением, про-поговоркой, про-прилагательным и т. д.). Замена обычно подразумевает использование определенной проформы, например it , he , there , here , и т. д. вместо фразы или предложения. Если такое изменение приводит к грамматическому предложению, в котором общая структура не была изменена, то тестовая строка, скорее всего, является составной частью: [6]
Эти примеры показывают, что Drunks , the customers , и put off the customers в тестовом предложении являются составными частями. Важным аспектом теста proform является тот факт, что он не может определить большинство подфразовых строк как составные части, например
Эти примеры предполагают, что отдельные слова could , put , off и customers не следует рассматривать как составляющие. Это предложение, конечно, спорно, поскольку большинство теорий синтаксиса предполагают, что отдельные слова являются составляющими по умолчанию. Однако вывод, к которому можно прийти на основе таких примеров, заключается в том, что замена проформы с использованием определенной проформы идентифицирует только фразовые составляющие; она не может идентифицировать подфразовые строки как составляющие.
Топикализация подразумевает перемещение тестовой строки в начало предложения. Это простая операция перемещения. [7] Многие примеры топикализации кажутся лишь в минимальной степени приемлемыми, если их вырвать из контекста. Поэтому, чтобы указать на контекст, пример топикализации может предваряться ...and , а также может быть добавлено модальное наречие (например, certain ):
Эти примеры предполагают, что the customers и put off the customers являются составляющими в тестовом предложении. Тематическое определение, как и многие другие тесты, определяет только фразовые составляющие. Когда тестовая последовательность представляет собой субфразовую строку, топическое определение не выполняется:
Эти примеры показывают, что клиенты , могли , put , off , и не прошли тест на топикализация. Поскольку все эти строки являются субфразовыми, можно сделать вывод, что топикализация неспособна идентифицировать субфразовые строки как составляющие.
Do-so -substitution — это тест, который подставляет форму do so ( does so , did so , done so , doing so ) в тестовое предложение для целевой строки. Этот тест широко используется для проверки структуры строк, содержащих глаголы (потому что do — это глагол). [8] Однако тест ограничен в своей применимости именно потому, что он применим только к строкам, содержащим глаголы:
Пример «a» предполагает, что put off the customers является составной частью в тестовом предложении, тогда как пример b не предполагает, что could put off the customers является составной частью, поскольку do so не может включать значение модального глагола could . Чтобы более полно проиллюстрировать, как используется тест do so , теперь используется другое тестовое предложение, которое содержит две поствербальные адъюнктные фразы:
Эти данные предполагают, что встретил их , встретил их в пабе и встретил их в пабе, потому что у нас было время, являются составляющими в тестовом предложении. Взятые вместе, такие примеры, по-видимому, мотивируют структуру для тестового предложения, которое имеет левостороннюю глагольную фразу, потому что только левосторонняя глагольная фраза может рассматривать каждую из указанных строк как составляющую. Однако с таким типом рассуждений есть проблема, как иллюстрирует следующий пример:
В этом случае did so , по-видимому, заменяет прерывистое словосочетание, состоящее из met them и because we had time . Такое прерывистое словосочетание не может быть истолковано как составная часть. То, что такая интерпретация did so действительно возможна, видно в более полном предложении, например You met them in the cafe because you had time, and we did so in the pub . В этом случае предпочтительным прочтением did so является то, что оно действительно одновременно заменяет met them и because we had time .
Тест на одно -замену заменяет тестовую строку неопределенным местоимением one или ones . [9] Если результат приемлем, то тестовая строка считается составной частью. Поскольку one является типом местоимения, одно -замена имеет значение только при исследовании структуры именных групп. В связи с этим тестовое предложение выше расширено, чтобы лучше проиллюстрировать способ, которым обычно используется одно-замена:
Эти примеры предполагают, что клиенты , лояльные клиенты , клиенты вокруг здесь , лояльные клиенты вокруг здесь и клиенты вокруг здесь, на которых мы полагаемся, являются составляющими в тестовом предложении. Однако некоторые указали на проблему, связанную с заменой одного в этой области. Эта проблема заключается в том, что невозможно создать единую составляющую структуру существительного словосочетания лояльные клиенты вокруг здесь, на которых мы полагаемся, которая могла бы одновременно рассматривать все указанные строки как составляющие. [10] Другая проблема, которая была отмечена относительно замены одного в качестве теста на составляющие, заключается в том, что она иногда предполагает, что нестроковые словосочетания являются составляющими, [11] например
Словосочетание, включающее в себя как лояльных клиентов , так и тех, на кого мы полагаемся, является прерывистым в тестовом предложении, и этот факт должен побудить нас вообще усомниться в ценности замены одного на другого в качестве теста для составляющих.
Тест фрагмента ответа включает в себя формирование вопроса, который содержит одно слово-wh (например, who , what , where , и т.д.). Если тестовая строка может затем появиться отдельно в качестве ответа на такой вопрос, то она, вероятно, является составной частью тестового предложения: [12]
Эти примеры показывают, что Drunks , the customers и put off the customers являются составляющими в тестовом предложении. Тест фрагмента ответа похож на большинство других тестов на составные части тем, что он не определяет подфразовые строки как составные части:
Все эти фрагменты ответов грамматически неприемлемы, что говорит о том, что could , put , off и customers не являются составляющими. Обратите внимание также на то, что последние два вопроса сами по себе неграмотны. По-видимому, часто невозможно сформулировать вопрос таким образом, чтобы успешно выявить указанные строки как фрагменты ответов. Таким образом, вывод заключается в том, что тест фрагментов ответов похож на большинство других тестов в том, что он не может идентифицировать подфразовые строки как составляющие.
Расщепление подразумевает размещение тестовой строки X в структуре, начинающейся с It is/was : It was X that... [ 13] Тестовая строка выступает в качестве стержня предложения с расщепиной:
Эти примеры предполагают, что Drunks и the customers являются составляющими в тестовом предложении. Пример c имеет сомнительную приемлемость, предполагая, что put off the customers может не быть составляющим в тестовой строке. Clefting похож на большинство других тестов на составляющую в том, что он не может идентифицировать большинство отдельных слов как составляющие:
Примеры показывают, что каждое из отдельных слов could , put , off , the , и customers не являются составными частями, вопреки тому, что предполагает большинство теорий синтаксиса. В этом отношении clefting похож на многие другие тесты на составные части в том, что он успешно идентифицирует только определенные фразовые строки как составные части.
Тест VP-ellipsis проверяет, какие строки, содержащие один или несколько предикативных элементов (обычно глаголов), могут быть исключены из предложения. Строки, которые могут быть исключены, считаются составными частями: [14] Символ ∅ используется в следующих примерах для обозначения положения многоточия:
Эти примеры показывают, что откладывать не является составной частью в тестовом предложении, но что немедленно откладывать клиентов , откладывать клиентов, когда они прибывают , и немедленно откладывать клиентов, когда они прибывают, являются составными частями. Что касается строки откладывать клиентов в (b), предельная приемлемость затрудняет вывод о откладывать клиентов .
С этим тестом связаны различные трудности. Первая из них заключается в том, что он может идентифицировать слишком много составляющих, как в этом случае, когда невозможно создать единую структуру составляющих, которая могла бы одновременно рассматривать каждый из трех приемлемых примеров (ce) как исключающий составляющую. Другая проблема заключается в том, что тест иногда может предполагать, что прерывистое словосочетание является составляющей, например:
В этом случае, по-видимому, пропущенный материал соответствует прерывистому словосочетанию, включающему help и in the office .
Псевдорасщелина похожа на расщелину тем, что она делает акцент на определенной фразе в предложении. Существует два варианта теста на псевдорасщелину. Один вариант вставляет тестовую строку X в предложение, начинающееся со свободного относительного предложения: What.....is/are X ; другой вариант вставляет X в начале предложения, за которым следует it/are и затем свободное относительное предложение: X is/are what/who... Здесь проиллюстрирован только последний из этих двух вариантов. [15]
Эти примеры показывают, что Drunks , the customers и put off the customers являются составляющими в тестовом предложении. Pseudoclefting не может определить большинство отдельных слов как составные части:
Таким образом, тест на псевдорасщепление похож на большинство других тестов, поскольку он определяет фразовые цепочки как составляющие, но не предполагает, что субфразовые цепочки являются составляющими.
Пассивизация подразумевает изменение активного предложения на пассивное предложение или наоборот. Объект активного предложения меняется на субъект соответствующего пассивного предложения: [16]
Тот факт, что предложение (b), страдательное предложение, приемлемо, предполагает, что Drunks и the customers являются составляющими в предложении (a). Тест на пассивизацию, используемый таким образом, способен идентифицировать только слова, фразы и предложения субъекта и объекта как составные части. Он не помогает идентифицировать другие фразовые или субфразовые цепочки как составные части. В этом отношении ценность пассивизации как теста на составные части весьма ограничена.
Пропуск проверяет, можно ли опустить целевую строку, не влияя на грамматичность предложения. В большинстве случаев местные и временные обстоятельства, атрибутивные модификаторы и необязательные дополнения можно безопасно опустить и, таким образом, они считаются составными частями. [17]
Это предложение предполагает, что определенный артикль the является составной частью в тестовом предложении. Однако, что касается тестового предложения, тест на пропуск очень ограничен в своей способности определять составляющие, поскольку строки, которые нужно проверить, не появляются факультативно. Поэтому тестовое предложение адаптировано для лучшей иллюстрации теста на пропуск:
Возможность пропускать obnoxious , immediately , и when they arrive предполагает, что эти строки являются составляющими в тестовом предложении. Пропуск, используемый таким образом, имеет ограниченную применимость, поскольку он не способен идентифицировать какой-либо составляющий, который появляется обязательно. Следовательно, существует много целевых строк, которые большинство отчетов о структуре предложения принимают за составные части, но которые не проходят тест на пропуск, потому что эти составные части появляются обязательно, например, фразы подлежащего.
Вторжение исследует структуру предложения, заставляя наречие «вторгаться» в части предложения. Идея заключается в том, что строки по обе стороны от наречия являются составляющими. [18]
Пример (a) предполагает, что Drunks и could оттолкнуть клиентов являются составляющими. Пример (b) предполагает, что Drunks could и put off the customers являются составляющими. Сочетание (a) и (b) дополнительно предполагает, что could является составляющим. Предложение (c) предполагает, что Drunks could оттолкнуть и off the customers не являются составляющими. Пример (d) предполагает, что Drunks could оттолкнуть и the customers не являются составляющими. И пример (e) предполагает, что Drunks could оттолкнуть и customers не являются составляющими.
Те, кто использует тест на вторжение, обычно используют модальное наречие, например, certain . Однако этот аспект теста проблематичен, поскольку результаты теста могут варьироваться в зависимости от выбора наречия. Например, наречия образа действия распределяются иначе, чем модальные наречия, и, следовательно, будут предполагать отличную составную структуру от той, что предлагается модальными наречиями.
Wh-fronting проверяет, может ли тестовая строка быть fronted как wh-word. [19] Этот тест похож на тест фрагмента ответа, поскольку он использует только первую половину этого теста, игнорируя потенциальный ответ на вопрос.
Эти примеры показывают, что Drunks , the customers и put off the customers являются составными частями тестового предложения. Wh-fronting похож на ряд других тестов в том, что он не может определить многие подфразовые строки как составные части:
Эти примеры демонстрируют отсутствие доказательств для рассмотрения отдельных слов would , put , off , the и customers как составляющих.
Общий тест замены заменяет тестовую строку другим словом или фразой. [20] Он похож на замену проформы, единственное отличие состоит в том, что заменяющее слово или фраза не является проформой, например
Эти примеры предполагают, что строки Drunks , the customers и could являются составными частями тестового предложения. С этим тестом связана одна серьезная проблема, поскольку легко можно найти заменяющее слово для строк, которые, как предполагают другие тесты, явно не являются составными частями, например
Эти примеры предполагают, что could put , Drunks could , и could put of the являются составляющими в тестовом предложении. Это противоречит тому, что показывают другие тесты, и тому, что предполагает большинство теорий структуры предложения. Поэтому ценность общей подстановки как теста на составные части сомнительна. Это похоже на координационный тест в том, что он предполагает, что слишком много строк являются составными частями.
Поднятие правого узла , сокращенно RNR, является тестом, который изолирует тестовую строку на правой стороне координатной структуры. [21] Предполагается, что только составляющие могут быть общими для конъюнктов координатной структуры, например
Эти примеры предполагают, что could put off the customers , put off the customers , и the customers являются составляющими в тестовом предложении. Есть две проблемы с диагностикой RNR как тестом на составляющие. Первая заключается в том, что она ограничена в своей применимости, поскольку она способна идентифицировать строки как составляющие, только если они появляются в правой части тестового предложения. Вторая заключается в том, что она может предполагать строки как составляющие, которые большинство других тестов предполагают, что не являются составляющими. Чтобы проиллюстрировать этот момент, необходимо использовать другой пример:
Эти примеры предполагают, что их велосипеды (его велосипед) to us to use if need be , to us to use if need be и to use if need be являются составляющими в тестовом предложении. Большинство теорий синтаксиса не рассматривают эти строки как составные части, и, что еще важнее, большинство других тестов предполагают, что они не являются составными частями. Короче говоря, эти тесты не принимаются как должное, потому что составная часть может пройти один тест и не пройти много других. Нам нужно консультироваться с нашим интуитивным мышлением при оценке составной части любого набора слов.
Следует предостеречь относительно тестов на составляющие, как только что обсуждалось выше. Эти тесты можно найти в учебниках по лингвистике и синтаксису, которые написаны в основном с учетом синтаксиса английского языка, и обсуждаемые примеры взяты в основном из английского языка. Тесты могут быть или не быть валидными и полезными при исследовании структуры составляющих других языков. В идеале для каждого языка можно и нужно разработать набор тестов на составляющие, учитывающих особенности рассматриваемого языка.
Анализы структуры составляющих предложений являются центральным вопросом для теорий синтаксиса. Данная теория может произвести анализ структуры составляющих, который совершенно не похож на следующий. Этот момент очевиден с двумя древовидными диаграммами выше предложения Drunks could put off the customers , где анализ грамматики зависимости структуры составляющих выглядит совсем не похожим на анализ структуры фразы. Решающее различие между двумя анализами заключается в том, что анализ структуры фразы рассматривает каждое отдельное слово как составляющую по умолчанию, тогда как анализ грамматики зависимости рассматривает только те отдельные слова как составляющие, которые не доминируют над другими словами. Таким образом, грамматики структуры фразы признают гораздо больше составляющих, чем грамматики зависимости.
Второй пример дополнительно иллюстрирует эту точку зрения (D = детерминант, N = существительное, NP = именная группа, Pa = частица, S = предложение, V = глагол, V' = глагольная черта, VP = глагольная группа):
Дерево грамматики зависимости показывает пять слов и словосочетаний в качестве составляющих: who , these , us , these diagrams , and show us . Дерево структуры фразы, напротив, показывает девять слов и словосочетаний в качестве составляющих: what , do , these , diagrams , show , us , these diagrams , show us , and do these diagrams show us . Таким образом, две диаграммы расходятся во мнениях относительно статуса do , diagrams , show , and do these diagrams show us , диаграмма структуры фразы показывает их как составляющие, а диаграмма грамматики зависимости показывает их как не-составляющие. Чтобы определить, какой анализ более правдоподобен, следует обратиться к тестам на составляющие, обсуждавшимся выше. [22]
В грамматиках фразовой структуры взгляды на составную структуру также могут значительно различаться. Многие современные грамматики фразовой структуры предполагают, что синтаксическое ветвление всегда является бинарным, то есть каждый больший компонент обязательно разбивается на два меньших компонента. Однако более устаревшие анализы фразовой структуры с большей вероятностью допускают n-арное ветвление, то есть каждый больший компонент может быть разбит на один, два или более меньших компонентов. Следующие два дерева иллюстрируют различие (Aux = вспомогательный глагол, AuxP = вспомогательная глагольная группа, Aux' = Aux-bar, D = определитель, N = существительное, NP = именная группа, P = предлог, PP = предложная группа, Pa = частица, S = предложение, t = след, V = глагол, V' = глагол-bar, VP = глагольная группа):
Детали во второй диаграмме здесь не имеют решающего значения для рассматриваемого вопроса. Этот момент заключается в том, что все разветвления там строго бинарные, тогда как в первой древовидной диаграмме тернарное разветвление присутствует дважды, для AuxP и для VP. Обратите внимание в этой связи, что строго бинарные анализы разветвлений увеличивают количество (явных) составляющих до возможного. Комбинации слов послали нам много вещей , и многие вещи для нас показаны как составляющие во второй древовидной диаграмме, но не в первой. Какой из этих двух анализов лучше, снова, по крайней мере отчасти, зависит от того, что могут выявить тесты на составляющие.