Правила структуры фразы — это тип правила переписывания, используемого для описания синтаксиса данного языка , и тесно связаны с ранними стадиями трансформационной грамматики , предложенной Ноамом Хомским в 1957 году. [1] Они используются для разбиения предложения естественного языка на его составные части, также известные как синтаксические категории , включая как лексические категории ( части речи ), так и фразовые категории. Грамматика, использующая правила структуры фразы, является типом грамматики структуры фразы . Правила структуры фразы, как они обычно используются, работают в соответствии с отношением составляющих , и грамматика, использующая правила структуры фразы, является, следовательно, грамматикой составляющих ; как таковая, она отличается от грамматик зависимости , которые основаны на отношении зависимости . [2]
Правила структуры фразы обычно имеют следующий вид:
означает, что составляющая разделена на две подсоставляющие и . Вот несколько примеров для английского языка:
Первое правило гласит: AS ( предложение ) состоит из NP ( именной группы ), за которой следует VP ( глагольная группа ). Второе правило гласит: Именная группа состоит из необязательного Det ( определителя ), за которым следует N (существительное). Третье правило означает, что N (существительное) может предшествовать необязательная AP ( адъективная группа ), а за ней может следовать необязательная PP ( предложная группа ). Круглые скобки указывают на необязательные составляющие.
Начиная с символа предложения S и последовательно применяя правила структуры фразы, наконец, применяя правила замены для замены реальных слов на абстрактные символы, можно сгенерировать много правильных предложений на английском языке (или на любом другом языке, для которого правила указаны). Если правила верны, то любое предложение, созданное таким образом, должно быть грамматически (синтаксически) правильным . Также следует ожидать, что правила будут генерировать синтаксически правильные, но семантически бессмысленные предложения, такие как следующий известный пример:
Это предложение было построено Ноамом Хомским в качестве иллюстрации того, что правила структуры фраз способны генерировать синтаксически правильные, но семантически неправильные предложения. Правила структуры фраз разбивают предложения на их составные части. Эти составляющие часто представляются в виде древовидных структур ( дендрограмм ). Дерево для предложения Хомского можно представить следующим образом:
Составляющая — это любое слово или сочетание слов, в котором доминирует один узел. Таким образом, каждое отдельное слово является составной частью. Кроме того, подлежащее NP Colorless green ideas , второстепенное NP green ideas и VP sleep furiously являются составными частями. Правила структуры фразы и связанные с ними древовидные структуры являются формой анализа непосредственных составляющих .
В трансформационной грамматике системы правил фразовой структуры дополняются правилами трансформации, которые действуют на существующую синтаксическую структуру, чтобы создать новую (выполняя такие операции, как отрицание , пассивация и т. д.). Эти трансформации не являются строго обязательными для генерации, поскольку предложения, которые они производят, могут быть сгенерированы только с помощью соответствующим образом расширенной системы правил фразовой структуры, но трансформации обеспечивают большую экономию и позволяют отражать в грамматике значимые отношения между предложениями.
Важным аспектом правил структуры фразы является то, что они рассматривают структуру предложения сверху вниз. Категория слева от стрелки является большей составляющей, а непосредственные составляющие справа от стрелки являются меньшими составляющими. Составляющие последовательно разбиваются на части по мере продвижения вниз по списку правил структуры фразы для данного предложения. Этот вид структуры предложения сверху вниз контрастирует с большой работой, проделанной в современном теоретическом синтаксисе. В минимализме [3] , например, структура предложения генерируется снизу вверх. Операция Merge объединяет меньшие составляющие для создания больших составляющих, пока не будет достигнута наибольшая составляющая (т. е. предложение). В этом отношении теоретический синтаксис давно отказался от правил структуры фразы, хотя их важность для компьютерной лингвистики, по-видимому, остается неизменной.
Правила структуры фразы, как они обычно используются, приводят к представлению о структуре предложения, основанной на членстве . Таким образом, грамматики, которые используют правила структуры фразы, являются грамматиками членства (= грамматиками структуры фразы ), в отличие от грамматик зависимости , [4], которые рассматривают структуру предложения как основанную на зависимости . Это означает, что для того, чтобы правила структуры фразы были применимы вообще, необходимо стремиться к пониманию структуры предложения на основе членства. Отношение членства является соответствием один к одному или более. Для каждого слова в предложении существует по крайней мере один узел в синтаксической структуре, который соответствует этому слову. Отношение зависимости, напротив, является отношением один к одному; для каждого слова в предложении существует ровно один узел в синтаксической структуре, который соответствует этому слову. Различие иллюстрируется следующими деревьями:
Дерево избирательных округов слева может быть сгенерировано правилами структуры фраз. Предложение S разбивается на все меньшие и меньшие составные части. Дерево зависимостей справа, напротив, не может быть сгенерировано правилами структуры фраз (по крайней мере, не так, как они обычно интерпретируются).
Ряд теорий репрезентативной структуры фраз в грамматике никогда не признавали правила структуры фраз, но вместо этого стремились к пониманию структуры предложения в терминах понятия схемы . Здесь структуры фраз выводятся не из правил, которые объединяют слова, а из спецификации или инстанциации синтаксических схем или конфигураций, часто выражающих некое семантическое содержание независимо от конкретных слов, которые в них появляются. Этот подход по сути эквивалентен системе правил структуры фраз в сочетании с некомпозиционной семантической теорией , поскольку грамматические формализмы, основанные на правилах переписывания, в целом эквивалентны по мощности тем, которые основаны на подстановке в схемы.
Таким образом, при таком подходе предложение «Цветные зеленые идеи спят неистово» вместо того, чтобы быть выведенным из применения ряда правил структуры фраз, будет сгенерировано путем заполнения словами слотов схемы, имеющей следующую структуру:
И которое выражало бы следующее концептуальное содержание:
Хотя они не являются композиционными, такие модели являются монотонными. Этот подход хорошо развит в грамматике конструкций [5] и оказал некоторое влияние на грамматику структур фраз, управляемых головой [6] и лексическую функциональную грамматику [7] , последние две явно квалифицируются как грамматики структур фраз.