stringtranslate.com

Правила построения фразы

Правила структуры фраз представляют собой тип правил перезаписи, используемых для описания синтаксиса данного языка , и тесно связаны с ранними стадиями трансформационной грамматики , предложенной Ноамом Хомским в 1957 году. [1] Они используются для разбиения предложения естественного языка на его составные части, также известные как синтаксические категории , включающие как лексические категории ( части речи ), так и фразовые категории. Грамматика, использующая правила фразовой структуры, является разновидностью грамматики фразовой структуры . Правила структуры фразы в том виде, в каком они обычно используются, действуют в соответствии с отношением избирательного округа , и грамматика, в которой используются правила структуры фразы, поэтому является грамматикой избирательного округа ; как таковая, она отличается от грамматик зависимостей , которые основаны на отношении зависимости . [2]

Определение и примеры

Правила построения фраз обычно имеют следующий вид:

это означает, что составляющая разделена на две субкомпоненты и . Вот некоторые примеры английского языка:

Первое правило гласит: AS ( предложение ) состоит из NP ( именная группа ), за которой следует VP ( глагольная группа ). Второе правило гласит: Именительная группа состоит из необязательного Det ( определителя ), за которым следует N (существительное). Третье правило означает, что букве N (существительное) может предшествовать необязательная AP ( прилагательная фраза ), а за ней может следовать необязательная PP ( предложная фраза ). Круглые скобки обозначают необязательные составляющие.

Начиная с символа предложения S и последовательно применяя правила структуры фразы и, наконец, применяя правила замены для замены абстрактных символов реальными словами, можно сгенерировать множество правильных предложений английского языка (или любого другого языка, для которого указаны правила). Если правила верны, то любое предложение, составленное таким образом, должно быть грамматически (синтаксически) правильным . Также следует ожидать, что правила будут генерировать синтаксически правильные, но семантически бессмысленные предложения, как в следующем хорошо известном примере:

Бесцветные зеленые идеи яростно спят

Это предложение было построено Ноамом Хомским как иллюстрация того, что правила структуры фраз способны генерировать синтаксически правильные, но семантически неверные предложения. Правила построения фраз разбивают предложения на составные части. Эти составляющие часто представляются в виде древовидных структур ( дендрограмм ). Дерево предложения Хомского можно представить следующим образом:

Бесцветные зеленые идеи яростно спят.

Составляющая — это любое слово или комбинация слов, в которых доминирует один узел. Таким образом, каждое отдельное слово является составной частью. Кроме того, субъект NP «Бесцветные зеленые идеи» , второстепенные NP « зеленые идеи» и ВП яростно спят, являются составляющими. Правила структуры фраз и связанные с ними древовидные структуры представляют собой форму непосредственного анализа составляющих .

В трансформационной грамматике системы правил построения фраз дополняются правилами трансформации, которые воздействуют на существующую синтаксическую структуру для создания новой (выполняя такие операции, как отрицание , пассивизация и т. д.). Эти преобразования не являются строго обязательными для генерации, поскольку создаваемые ими предложения могут быть созданы только с помощью достаточно расширенной системы правил структуры фраз, но преобразования обеспечивают большую экономию и позволяют отразить в грамматике существенные отношения между предложениями.

Сверху вниз

Важным аспектом правил структуры фраз является то, что они рассматривают структуру предложения сверху вниз. Категория слева от стрелки представляет собой большую составляющую, а непосредственные составляющие справа от стрелки — меньшие составляющие. Составные части последовательно разбиваются на части по мере продвижения вниз по списку правил построения фраз для данного предложения. Этот взгляд на структуру предложения сверху вниз контрастирует с большой работой, проделанной в области современного теоретического синтаксиса. Например, в «Минимализме» [3] структура предложения генерируется снизу вверх. Операция «Слияние» объединяет меньшие составляющие для создания более крупных составляющих до тех пор, пока не будет достигнута наибольшая составляющая (т. е. предложение). В этом отношении теоретический синтаксис давно отказался от правил структуры фраз, хотя их значение для компьютерной лингвистики, похоже, остается неизменным.

Альтернативные подходы

Избирательный округ против зависимости

Правила структуры фраз в том виде, в каком они обычно используются, приводят к тому, что структура предложения основывается на группах . Таким образом, грамматики, в которых используются правила структуры фраз, являются грамматиками избирательного округа (= грамматиками структуры фраз ), в отличие от грамматик зависимостей , [4] которые рассматривают структуру предложения как основанную на зависимостях . Это означает, что для того, чтобы правила структуры фраз вообще были применимы, необходимо стремиться к пониманию структуры предложений на основе групп населения. Отношение избирательного округа представляет собой соответствие «один к одному или нескольким». Для каждого слова в предложении существует по крайней мере один узел синтаксической структуры, соответствующий этому слову. Отношение зависимости, напротив, является отношением «один к одному»; для каждого слова в предложении существует ровно один узел синтаксической структуры, соответствующий этому слову. Различие иллюстрируется следующими деревьями:

Дерево избирательных округов слева может быть создано с помощью правил структуры фраз. Предложение S разбивается на все более мелкие составные части. Напротив, дерево зависимостей справа не может быть создано с помощью правил структуры фраз (по крайней мере, в том смысле, в котором они обычно интерпретируются).

Репрезентативные грамматики

Ряд теорий репрезентативной структуры фраз в грамматике никогда не признавали правила структуры фраз, а вместо этого стремились к пониманию структуры предложений в терминах понятия схемы . Здесь фразовые структуры выводятся не из правил объединения слов, а из спецификации или реализации синтаксических схем или конфигураций, часто выражающих некое семантическое содержание независимо от конкретных слов, которые в них появляются. Этот подход по существу эквивалентен системе правил построения фраз в сочетании с некомпозиционной семантической теорией , поскольку грамматические формализмы, основанные на правилах переписывания, обычно эквивалентны по силе тем, которые основаны на замене в схемы.

Таким образом, в этом типе подхода, вместо того, чтобы быть полученным в результате применения ряда правил структуры фраз, предложение « Бесцветные зеленые идеи яростно спят» будет генерироваться путем заполнения слов в слотах схемы, имеющей следующую структуру:

[NP[ADJ N] VP[V] AP[ADV]]

И который выражал бы следующее концептуальное содержание:

X ДЕЛАЕТ Y ПО ТАКЖЕ Z

Такие модели хотя и некомпозиционны, но монотонны. Этот подход получил широкое развитие в грамматике построения [5] и оказал некоторое влияние на грамматику фразовой структуры с управлением головой [6] и лексическую функциональную грамматику , [7] две последние явно квалифицируются как грамматики фразовой структуры.

Смотрите также

Примечания

  1. ^ Общие обсуждения правил структуры фраз см., например, Borsley (1991:34ff.), Brinton (2000:165), Falk (2001:46ff.).
  2. ^ Грамматики зависимостей связаны прежде всего с работами Люсьена Тесниера (1959).
  3. ^ См., например, Хомский (1995).
  4. ^ Наиболее полный источник по грамматике зависимостей - Ágel et al. (2003/6).
  5. ^ О строительной грамматике см. Goldberg (2006).
  6. ^ О грамматике структуры фраз, управляемых головой, см. Поллард и Саг (1994).
  7. ^ Относительно лексико-функциональной грамматики см. Бреснан (2001).

Рекомендации