В синтаксическом анализе составляющая — это слово или группа слов, которые функционируют как единое целое в иерархической структуре. Составной состав предложений выявляется с помощью тестов на составляющие . [1] Эти тесты применяются к части предложения, а результаты предоставляют данные о составной структуре предложения. Многие составляющие являются фразами . Фраза — это последовательность одного или нескольких слов (в некоторых теориях — двух или более), построенная вокруг главного лексического элемента и работающая как единица внутри предложения. Последовательность слов считается фразой/составляющей, если она демонстрирует одно или несколько свойств, обсуждаемых ниже. Анализ составной структуры связан в основном с грамматиками фразовой структуры , хотя грамматики зависимостей также позволяют разбить структуру предложения на составные части.
Тесты на составляющие — это диагностика, используемая для определения структуры предложения. Существует множество тестов на составляющие, которые обычно используются для определения составляющих английских предложений. Далее перечислены 15 наиболее часто используемых тестов: 1) координация (конъюнкция), 2) проформозамещение (замещение), 3) топизация (фронтирование), 4) до-так -замещение, 5) одно -замещение, 6 ) многоточие ответа (вопрос-тест), 7) расщелина , 8) ВП-многоточие , 9) псевдорасщепление, 10) пассивизация, 11) пропуск (удаление), 12) вторжение, 13) бе-фронтирование, 14) общая подмена, 15) Поднятие правого узла (РНР).
Порядок, в котором эти 15 тестов перечислены здесь, соответствует частоте использования: из 15 тестов наиболее часто используется координация, а наименее часто используется RNR. При использовании этих тестов следует соблюдать общую осторожность, поскольку они часто дают противоречивые результаты. Тесты — это всего лишь грубые инструменты, которые грамматисты используют, чтобы выявить подсказки о синтаксической структуре. Некоторые специалисты по синтаксису даже организуют тесты по шкале надежности, при этом менее надежные тесты считаются полезными для подтверждения целостности, но сами по себе недостаточными. Непрохождение одного теста не означает, что тестовая строка не является составной частью, и наоборот, прохождение одного теста не обязательно означает, что тестовая строка является составной частью. Лучше всего применить к данной строке как можно больше тестов, чтобы доказать или исключить ее статус как составной части.
15 тестов представлены, обсуждаются и иллюстрируются ниже, в основном опираясь на одно и то же предложение: [2]
Ограничив введение и обсуждение приведенных ниже тестов для компонентов главным образом этим одним предложением, становится возможным сравнить результаты тестов. Чтобы облегчить обсуждение и иллюстрацию составной структуры этого предложения, используются следующие две диаграммы предложений (D = определитель, N = существительное, NP = именное словосочетание, Pa = частица, S = предложение, V = глагол, VP = глагол фраза):
На этих диаграммах показаны два возможных анализа составной структуры предложения. Данный узел в древовидной диаграмме понимается как маркирующий компонент, то есть компонент понимается как соответствующий данному узлу и всему, над чем этот узел исчерпывающе доминирует. Следовательно, первое дерево, показывающее структуру составляющих в соответствии с грамматикой зависимостей , помечает в качестве составляющих следующие слова и словосочетания: Пьяные , выключено , the , клиенты и отстранены от клиентов . [3] Второе дерево, показывающее составляющую структуру в соответствии с грамматикой фразовой структуры , отмечает в качестве составляющих следующие слова и словосочетания: Пьяные , мог , отложить , выключить , the , клиенты , клиенты , отложить клиентов , и мог отпугнуть клиентов . Анализ в этих двух древовидных диаграммах дает ориентир для последующего обсуждения тестов на составляющие.
Тест на координацию предполагает, что только составляющие могут быть скоординированы, т. е. соединены посредством координатора, такого как и , или , или но : [4] Следующие примеры демонстрируют, что координация идентифицирует отдельные слова как составляющие:
Квадратными скобками отмечены соединения координатных структур. Основываясь на этих данных, можно предположить, что пьяные , могли , отложили , а клиенты являются составляющими тестового предложения, поскольку эти строки можно согласовать с бомжами , бы , отогнать и соседями соответственно. Координация также идентифицирует строки, состоящие из нескольких слов, как составляющие:
Эти данные позволяют предположить, что клиенты , отпугивают клиентов и могли бы оттолкнуть клиентов являются составными частями тестового предложения.
Такие примеры, как (ag), не являются спорными, поскольку многие теории структуры предложений легко рассматривают строки, проверяемые в предложениях (ag), как составляющие. Однако дополнительные данные проблематичны, поскольку они предполагают, что определенные строки также являются составляющими, хотя большинство теорий синтаксиса не признают их как таковые, например
Эти данные позволяют предположить, что могли бы отложить , отложить эти , а Пьяные могли бы быть составными частями тестового предложения. Однако большинство теорий синтаксиса отвергают идею о том, что эти строки являются составляющими. Такие данные, как (hj), иногда рассматриваются с точки зрения механизма поднятия правого узла (RNR).
Проблема теста координации, представленного примерами (hj), усложняется, когда кто-то смотрит за пределы проверочного предложения, поскольку быстро обнаруживается, что координация предполагает, что широкий диапазон строк является составляющими, которые большинство теорий синтаксиса не признают как таковые, например
Строки из дома во вторник и из дома во вторник на велосипеде не рассматриваются как составляющие в большинстве теорий синтаксиса, а что касается предложения (m), то там очень трудно даже понять, как следует разграничивать конъюнкты координатной структуры. . Координатные структуры в (kl) иногда характеризуются с точки зрения несоставных союзов (NCC), а случай координации в предложении (m) иногда обсуждается с точки зрения разделения и/или разрыва .
Из-за трудностей, возникающих с примерами (хм), многие грамматики скептически относятся к координации в отношении ее ценности как проверки составляющих. Обсуждение других тестов на составляющие ниже показывает, что этот скептицизм оправдан, поскольку координация идентифицирует гораздо больше строк как составляющих, чем другие тесты на составляющие. [5]
Замена или замена проформы включает замену тестовой строки соответствующей проформой (например, местоимением, пословицей, проприлагательным и т. д.). Замена обычно предполагает использование определенной формы, такой как it , he , there , here и т. д., вместо фразы или предложения. Если такое изменение приводит к появлению грамматического предложения, общая структура которого не изменилась, то тестовая строка, скорее всего, является составной частью: [6]
Эти примеры показывают, что пьяницы , клиенты и отстраненные клиенты в тестовом предложении являются составляющими. Важным аспектом теста проформы является тот факт, что он не может идентифицировать большинство подфразовых строк как составляющие, например
Эти примеры предполагают , что отдельные слова можно откладывать , а клиенты не должны рассматриваться как составные части. Это предположение, конечно, спорно, поскольку большинство теорий синтаксиса предполагают, что отдельные слова по умолчанию являются составляющими. Однако на основе таких примеров можно прийти к выводу, что замена проформы с использованием определенной проформы идентифицирует только фразовые составляющие; он не может идентифицировать подфразовые строки как составляющие.
Тематика предполагает перемещение тестовой строки в начало предложения. Это простая операция перемещения. [7] Многие случаи тематики кажутся лишь незначительно приемлемыми, если их вырвать из контекста. Следовательно, чтобы указать контекст, экземпляру тематики может предшествовать ...and, а также может быть добавлено модальное наречие (например, конечно ):
Эти примеры показывают, что клиенты и отстраненные клиенты являются составными частями проверочного предложения. Тематика похожа на многие другие тесты тем, что она идентифицирует только фразовые составляющие. Если тестовая последовательность представляет собой подфразовую строку, топизация не удалась:
Эти примеры демонстрируют, что клиенты могут отложить тест на тематику и не пройти его . Поскольку все эти строки являются субфразовыми, можно сделать вывод, что топизация не позволяет идентифицировать субфразовые строки как составляющие.
Do-so -замена — это проверка, которая подставляет форму do so ( делает это , сделал это , сделал это , делаю это ) в тестовое предложение для целевой строки. Этот тест широко используется для проверки структуры строк, содержащих глаголы (потому что do — это глагол). [8] Однако применимость этого теста ограничена именно потому, что он применим только к строкам, содержащим глаголы:
Пример «а» предполагает, что « оттолкнуть клиентов» является составной частью проверочного предложения, тогда как пример «б» не позволяет предположить, что « может оттолкнуть клиентов» является составной частью, поскольку « сделай это» не может включать в себя значение модального глагола « могла» . Чтобы более полно проиллюстрировать, как применяется тест « сделай это» , теперь используется еще одно тестовое предложение, содержащее две поствербальные дополнительные фразы:
Эти данные позволяют предположить, что встретились с ними , встретились с ними в пабе и встретились с ними в пабе, потому что у нас было время — это составляющие тестового предложения. В совокупности такие примеры, похоже, мотивируют структуру тестового предложения, содержащую глагольную фразу с левым разветвлением, поскольку только глагольная фраза с левым разветвлением может рассматривать каждую из указанных строк как составную часть. Однако в подобных рассуждениях есть проблема, как иллюстрирует следующий пример:
В данном случае слово «сделал» означает прерывистую словосочетание, состоящее из слов « встретил их» и «потому что у нас было время» . Такое прерывистое сочетание слов не может быть истолковано как составляющее. То, что такая интерпретация слова « сделал это» действительно возможна, видно из более полного предложения, например: « Вы встретили их в кафе, потому что у вас было время, а мы сделали это в пабе ». В этом случае предпочтительное прочтение слова « сделал это» состоит в том, что оно действительно одновременно означает и то, и другое , и то, что у нас было время .
Тест с одной заменой заменяет тестовую строку неопределенным местоимением one или ones . [9] Если результат приемлем, то тестовая строка считается составной. Поскольку one является типом местоимения, замена one имеет значение только при исследовании структуры именной группы. В связи с этим приведенное выше тестовое предложение расширено, чтобы лучше проиллюстрировать, как обычно используется одна замена:
Эти примеры показывают, что клиенты , лояльные клиенты , клиенты здесь , лояльные клиенты здесь и клиенты здесь, на которых мы полагаемся, являются составляющими проверочного предложения. Однако некоторые указали на проблему, связанную с заменой одного в этой области. Эта проблема заключается в том, что невозможно создать единую составляющую структуру именной группы, которую лояльные клиенты здесь, на которых мы полагаемся, могли бы одновременно рассматривать все указанные строки как составляющие. [10] Другая проблема, которая была отмечена в отношении одной -замены как критерия составляющих, заключается в том, что иногда она предполагает, что нестроковые словосочетания являются составляющими, [11] например
Словосочетание, состоящее как из лояльных клиентов , так и из тех, на кого мы полагаемся, в тестовом предложении прерывается, и этот факт должен побудить человека вообще поставить под сомнение ценность одной -замены как проверки составляющих.
Тест фрагмента ответа предполагает формирование вопроса, содержащего одно слово «wh» (например , кто , что , где и т. д.). Если тестовая строка может появиться отдельно в качестве ответа на такой вопрос, то, скорее всего, она является составной частью тестового предложения: [12]
Эти примеры показывают, что Пьяные , клиенты и отстраненные клиенты являются составляющими проверочного предложения. Тест фрагмента ответа похож на большинство других тестов на составные части тем, что он не идентифицирует подфразовые строки как составляющие:
Все эти фрагменты ответов грамматически неприемлемы, что позволяет предположить, что could , put , off , а клиенты не являются составляющими. Обратите также внимание, что последние два вопроса сами по себе неграмматичны. По-видимому, зачастую невозможно сформулировать вопрос таким образом, чтобы можно было успешно извлечь указанные строки в качестве фрагментов ответа. Таким образом, вывод заключается в том, что тест фрагмента ответа похож на большинство других тестов тем, что он не может идентифицировать подфразовые строки как составляющие.
Расщепление предполагает размещение тестовой строки X внутри структуры, начинающейся с It is/was : It is X that... . [13] Тестовая строка отображается как центральная часть расщепленного предложения:
Эти примеры позволяют предположить, что Пьяные и клиенты являются составными частями проверочного предложения. Пример c имеет сомнительную приемлемость, поскольку предполагает, что отстраненные клиенты могут не входить в тестовую строку. Расщепление похоже на большинство других тестов на составные части тем, что оно не позволяет идентифицировать большинство отдельных слов как составляющие:
Примеры показывают, что каждое из отдельных слов может , отложить , от и клиенты не являются составными частями, вопреки тому , что предполагает большинство теорий синтаксиса. В этом отношении расщепление похоже на многие другие тесты на составные части тем, что оно позволяет идентифицировать только определенные фразовые строки как составляющие.
Тест VP-эллипсис проверяет, какие строки, содержащие один или несколько предикативных элементов (обычно глаголы), можно исключить из предложения. Строки, которые можно опустить, считаются составляющими: [14] Символ ∅ используется в следующих примерах для обозначения положения многоточия:
Эти примеры показывают, что «отложить» не является составной частью тестового предложения, но что « немедленно отложить клиентов» , « отложить клиентов, когда они приходят» , и «немедленно отложить клиентов, когда они придут», являются составляющими. Что касается строки, отпугивающей клиентов в (b), предельная приемлемость затрудняет вывод об отстранении клиентов .
С этим тестом связаны различные трудности. Первый из них заключается в том, что он может идентифицировать слишком много составляющих, как в данном случае, когда невозможно создать единую составляющую структуру, которая могла бы одновременно рассматривать каждый из трех приемлемых примеров (ce) как исключающий составляющую. Другая проблема заключается в том, что тест иногда может указать на то, что прерывистое словосочетание является составной частью, например:
В этом случае создается впечатление, что исключенный материал соответствует разрывному словосочетанию, включающему помощь и в офисе .
Псевдоклефтинг похож на расщелину в том, что он подчеркивает определенную фразу в предложении. Существует два варианта теста псевдорасщелины. Один из вариантов вставляет тестовую строку X в предложение, начинающееся со свободного придаточного предложения: Что.....есть/являются X ; другой вариант вставляет X в начале предложения, за которым следует оно/являются , а затем свободное относительное предложение: X есть/являются тем/кто... Здесь показан только последний из этих двух вариантов. [15]
Эти примеры показывают, что Пьяные , клиенты и отстраненные клиенты являются составляющими проверочного предложения. Псевдоклефтинг не позволяет идентифицировать большинство отдельных слов как составляющие:
Таким образом, тест на псевдорасщепление похож на большинство других тестов, поскольку он идентифицирует фразовые строки как составляющие, но не предполагает, что подфразовые строки являются составляющими.
Пассивизация предполагает замену активного предложения пассивным предложением или наоборот. Объект активного предложения заменяется подлежащим соответствующего пассивного предложения: [16]
Тот факт, что предложение (b), пассивное предложение, является приемлемым, предполагает, что Пьяные и клиенты являются составными частями предложения (a). Используемый таким образом тест пассивизации способен идентифицировать только подлежащие и объектные слова, фразы и предложения как составляющие. Это не помогает идентифицировать другие фразовые или подфразовые строки как составляющие. В этом отношении ценность пассивизации как проверки составляющих очень ограничена.
Пропуск проверяет, можно ли пропустить целевую строку, не влияя на грамматику предложения. В большинстве случаев местные и временные наречия, атрибутивные модификаторы и необязательные дополнения можно безопасно опустить и, таким образом, квалифицировать как составляющие. [17]
Это предложение предполагает, что определенный артикль the является составляющим проверочного предложения. Однако что касается проверочного предложения, то тест на пропуск очень ограничен в своей способности идентифицировать составляющие, поскольку строки, которые нужно проверить, не появляются необязательно. Поэтому тестовое предложение адаптировано для лучшей иллюстрации теста на пропуск:
Возможность опускать obnoxious немедленно и по мере их поступления предполагает , что эти строки являются составляющими проверочного предложения. Использованное таким образом пропуск имеет ограниченное применение, поскольку он не способен идентифицировать какую-либо составляющую, которая появляется в обязательном порядке. Следовательно, существует множество целевых строк, которые в большинстве описаний структуры предложений считаются составляющими, но не проходят тест на пропуск, поскольку эти составляющие появляются обязательно, например, подлежащие фразы.
Вторжение исследует структуру предложения, используя наречие, «вторгающееся» в части предложения. Идея состоит в том, что строки по обе стороны от наречия являются составляющими. [18]
Пример (а) предполагает, что пьяницы и клиенты могут отпугнуть клиентов . Пример (b) предполагает, что пьяницы могут отпугнуть клиентов и являются их избирателями. Комбинация (а) и (б) дополнительно предполагает, что мог бы быть составной частью. Предложение (c) предполагает, что пьяницы могут отпугнуть клиентов, а не их избирателей. Пример (d) предполагает, что пьяницы могут откладывать , а клиенты не являются избирателями. А пример (д) предполагает, что пьяницы могут откладывать, а клиенты не являются избирателями.
Те, кто использует тест на вторжение, обычно используют модальное наречие, например определенно . Однако этот аспект теста проблематичен, поскольку результаты теста могут различаться в зависимости от выбора наречия. Например, наречия образа действия распределяются иначе, чем модальные наречия, и, следовательно, предполагают структуру, отличную от структуры, предлагаемой модальными наречиями.
Wh-fronting проверяет, может ли тестовая строка быть оформлена как WH-слово. [19] Этот тест аналогичен тесту фрагмента ответа, поскольку в нем используется только первая половина этого теста, без учета потенциального ответа на вопрос.
Эти примеры показывают, что Пьяные , клиенты и отстраненные клиенты являются составляющими проверочного предложения. Wh-fronting похож на ряд других тестов тем, что он не может идентифицировать многие подфразовые строки как составляющие:
Эти примеры демонстрируют отсутствие доказательств того, что отдельные слова будут , откладывать , от и клиенты как составные части.
Общий тест замены заменяет тестовую строку другим словом или фразой. [20] Это похоже на замену проформы, с той лишь разницей, что заменяющее слово или фраза не является проформой, например
Эти примеры позволяют предположить, что строки Drunks , customer и could являются составляющими тестового предложения. В этом тесте есть серьезная проблема, поскольку легко можно найти слово-замену для строк, которые, как предполагают другие тесты, явно не являются составляющими, например
Эти примеры показывают, что could put , Drunks could и could put of the are являются составляющими проверочного предложения. Это противоречит тому, что показывают другие тесты, и тому, что предполагает большинство теорий структуры предложений. Поэтому ценность общего замещения как критерия составляющих сомнительна. Это похоже на тест на координацию: он предполагает, что слишком много строк являются составляющими.
Поднятие правого узла , сокращенно RNR, — это тест, который изолирует тестовую строку на правой стороне координатной структуры. [21] Предполагается, что только составляющие могут быть общими для конъюнктов координатной структуры, например
Эти примеры показывают, что могли бы оттолкнуть клиентов , оттолкнуть клиентов , а клиенты являются составными частями проверочного предложения. Есть две проблемы с диагностикой RNR как тестом на составляющие. Во-первых, его применимость ограничена, поскольку он способен идентифицировать строки как составляющие только в том случае, если они появляются в правой части проверочного предложения. Во-вторых, он может предположить, что строки являются составляющими, которые, по мнению большинства других тестов, не являются составляющими. Чтобы проиллюстрировать этот момент, необходимо использовать другой пример:
Эти примеры предполагают, что их велосипеды (его велосипед), которые мы можем использовать в случае необходимости , чтобы мы использовали, если необходимо , и чтобы использовать, если необходимо, являются составляющими проверочного предложения. Большинство теорий синтаксиса не рассматривают эти строки как составляющие, и, что более важно, большинство других тестов предполагают, что они не являются составляющими. Короче говоря, эти тесты не считаются чем-то само собой разумеющимся, поскольку избиратель может пройти один тест и не пройти многие другие. Нам нужно обращаться к своему интуитивному мышлению при оценке содержания любого набора слов.
Следует сделать несколько предостережений относительно тестов на компоненты, которые только что обсуждались выше. Эти тесты можно найти в учебниках по лингвистике и синтаксису, которые написаны в основном с учетом синтаксиса английского языка, а обсуждаемые примеры взяты в основном из английского языка. Тесты могут быть действительными и полезными при исследовании составной структуры других языков, а могут и не быть. В идеале для каждого языка можно и нужно разработать набор тестов для составляющих с учетом особенностей данного языка.
Анализ структуры предложений является центральной темой теорий синтаксиса. Одна теория может дать анализ конституентной структуры, совершенно непохожий на другую. Этот момент очевиден на двух древовидных диаграммах выше предложения «Пьяные могут отпугнуть клиентов» , где анализ грамматики зависимостей структуры составляющих очень сильно отличается от анализа структуры фразы. Принципиальное различие между двумя анализами заключается в том, что анализ структуры фразы рассматривает каждое отдельное слово как составную часть по умолчанию, тогда как анализ грамматики зависимостей рассматривает только те отдельные слова как составные части, которые не доминируют над другими словами. Таким образом, грамматики фразовой структуры признают гораздо больше составляющих, чем грамматики зависимостей.
Второй пример дополнительно иллюстрирует этот момент (D = определитель, N = существительное, NP = именная группа, Pa = частица, S = предложение, V = глагол, V' = глагольная черта, VP = глагольная группа):
Дерево грамматики зависимостей показывает пять слов и словосочетаний в качестве составляющих: who , эти , us , эти диаграммы и show us . Дерево структуры фразы, напротив, показывает девять слов и словосочетаний в качестве составляющих: что , делают , эти , диаграммы , показывают , нам , эти диаграммы , показывают нам и показывают ли нам эти диаграммы . Таким образом, две диаграммы расходятся во мнениях относительно статуса do , диаграмм , show и do эти диаграммы показывают нам , диаграмма структуры фразы показывает их как составные части, а диаграмма грамматики зависимостей показывает их как не составляющие. Чтобы определить, какой анализ более правдоподобен, можно обратиться к тестам на составляющие, обсуждавшиеся выше. [22]
В рамках грамматик фразовой структуры взгляды на составляющую структуру также могут существенно различаться. Многие современные грамматики фразовой структуры предполагают, что синтаксическое ветвление всегда бинарно, то есть каждая большая составляющая обязательно разбивается на две меньшие составляющие. Однако анализ более устаревших структур фраз с большей вероятностью допускает n-арное ветвление, то есть каждый более крупный компонент может быть разбит на один, два или несколько меньших компонентов. Следующие два дерева иллюстрируют различие (Aux = вспомогательный глагол, AuxP = фраза вспомогательного глагола, Aux' = Aux-bar, D = определитель, N = существительное, NP = именной фразы, P = предлог, PP = предложная фраза, Pa = частица, S = предложение, t = след, V = глагол, V' = глагол-бар, VP = глагольная фраза):
Детали второй диаграммы здесь не имеют решающего значения для рассматриваемого вопроса. Дело в том, что там все ветвления строго бинарные, тогда как в первой древовидной диаграмме тройное ветвление присутствует дважды, для AuxP и для VP. Обратите внимание в связи с этим, что анализ строго бинарного ветвления увеличивает количество (явных) составляющих до максимально возможного. Словосочетания послали нам много вещей , и многие вещи для нас показаны как составляющие на второй древовидной диаграмме, но не на первой. Какой из этих двух анализов лучше, опять-таки, по крайней мере частично, зависит от того, что могут выявить тесты на составляющие.