Теория оптимальности (часто сокращенно OT ) — это лингвистическая модель, предполагающая, что наблюдаемые формы языка возникают из оптимального удовлетворения конфликтующих ограничений. OT отличается от других подходов к фонологическому анализу, которые обычно используют правила, а не ограничения. Однако фонологические модели представления, такие как автосегментная фонология , просодическая фонология и линейная фонология (SPE), в равной степени совместимы с моделями, основанными на правилах и ограничениях. OT рассматривает грамматики как системы, которые обеспечивают сопоставления входов с выходами; как правило, входы рассматриваются как базовые представления , а выходы — как их поверхностные реализации. Это подход в более широкой структуре генеративной грамматики .
Теория оптимальности берет свое начало в докладе Алана Принса и Пола Смоленского , прочитанном в 1991 году [1] , который впоследствии был развит в рукописи книги тех же авторов в 1993 году [2].
Теория состоит из трех основных компонентов:
Теория оптимальности предполагает, что эти компоненты универсальны. Различия в грамматиках отражают различные ранги универсального набора ограничений, Con . Часть усвоения языка может быть описана как процесс корректировки рангов этих ограничений.
Теория оптимальности применительно к языку была первоначально предложена лингвистами Аланом Принсом и Полом Смоленским в 1991 году, а затем расширена Принсом и Джоном Дж. Маккарти . Хотя большая часть интереса к ОТ была связана с его использованием в фонологии , области, к которой ОТ был впервые применен, теория также применима к другим разделам лингвистики (например, синтаксису и семантике ).
Теория оптимальности, как и другие теории порождающей грамматики, сосредоточена на исследовании универсальных принципов , лингвистической типологии и усвоении языка .
Теория оптимальности также имеет корни в исследовании нейронных сетей . Она возникла отчасти как альтернатива коннекционистской теории гармонической грамматики , разработанной в 1990 году Жеральдин Лежандр , Ёсиро Миятой и Полом Смоленским . Варианты OT с коннекционистскими весовыми ограничениями продолжают изучаться в более поздних работах (Pater 2009).
Теория оптимальности предполагает, что на входные данные не накладываются ограничения, специфичные для языка. Это называется «богатством базы». Каждая грамматика может обрабатывать любые возможные входные данные. Например, язык без сложных кластеров должен уметь обрабатывать такие входные данные, как /flask/ . Языки без сложных кластеров различаются по тому, как они будут решать эту проблему; некоторые будут использовать эпентез (например, [falasak] или [falasaka], если все коды запрещены), а некоторые будут удалять (например, [fas], [fak], [las], [lak] ).
Gen может свободно генерировать любое количество выходных кандидатов, как бы сильно они ни отклонялись от входных. Это называется «свободой анализа». Грамматика (ранжирование ограничений) языка определяет, какой из кандидатов будет оценен Eval как оптимальный . [3]
В теории оптимальности каждое ограничение универсально. Con одинаково в каждом языке. Существует два основных типа ограничений:
Каждый играет важную роль в теории. Ограничения маркированности мотивируют изменения базовой формы, а ограничения верности не позволяют каждому вводу осознаваться как некоторая полностью немаркированная форма (например, [ba] ).
Универсальная природа Con делает некоторые немедленные предсказания о типологии языка. Если грамматики отличаются только тем, что имеют разные ранги Con , то набор возможных человеческих языков определяется существующими ограничениями. Теория оптимальности предсказывает, что не может быть больше грамматик, чем есть перестановок ранга Con . Количество возможных рангов равно факториалу общего числа ограничений, что дает начало термину факторная типология . Однако может оказаться невозможным различить все эти потенциальные грамматики, поскольку не каждое ограничение гарантированно будет иметь наблюдаемый эффект в каждом языке. Два общих порядка на ограничениях Con могут генерировать один и тот же диапазон отображений ввода-вывода, но отличаться относительным рангом двух ограничений, которые не конфликтуют друг с другом. Поскольку нет способа различить эти два ранга, говорят, что они принадлежат к одной и той же грамматике. Грамматика в OT эквивалентна антиматроиду . [5] Если рейтинги с равными шансами разрешены, то число возможностей представляет собой упорядоченное число Белла , а не факториал, что допускает значительно большее число возможностей. [6]
Маккарти и Принс (1995) предлагают три основных семейства ограничений верности:
При желании каждое из имен ограничений может быть дополнено суффиксом «-IO» или «-BR», обозначающим ввод/вывод и базу/редупликант соответственно — последний из которых используется при анализе редупликации . F в Ident (F) заменяется именем отличительной особенности , как в Ident-IO (голос).
Max и Dep заменяют Parse и Fill, предложенные Prince и Smolensky (1993), которые утверждали, что «базовые сегменты должны быть разобраны на слоговую структуру» и «позиции слогов должны быть заполнены базовыми сегментами» соответственно. [7] [8] Parse и Fill выполняют по сути те же функции, что и Max и Dep , но отличаются тем, что оценивают только вывод, а не отношение между вводом и выводом, что довольно характерно для ограничений маркированности. [9] Это вытекает из модели, принятой Prince и Smolensky, известной как теория сдерживания , которая предполагает, что входные сегменты, не реализованные выводом, не удаляются, а скорее «оставляются неразобранными» слогом. [10] Модель, предложенная McCarthy и Prince (1995, 1999), известная как теория соответствия , с тех пор заменила ее в качестве стандартной структуры. [8]
Маккарти и Принс (1995) также предлагают:
Ограничения маркированности, введенные Принсом и Смоленским (1993), включают:
Точные определения в литературе различаются. Некоторые ограничения иногда используются как «ограничение покрытия», заменяя набор ограничений, которые не полностью известны или не важны. [11]
Некоторые ограничения маркированности являются контекстно-независимыми, а другие — контекстно-зависимыми. Например, *V nose указывает, что гласные не должны быть носовыми в любой позиции, и, таким образом, является контекстно-независимым, тогда как *V oral N указывает, что гласные не должны быть оральными, когда предшествуют таутосиллабическому носовому, и, таким образом, является контекстно-зависимым. [12]
Два ограничения могут быть объединены в одно ограничение, называемое локальной конъюнкцией , которая дает только одно нарушение каждый раз, когда оба ограничения нарушаются в пределах заданного домена, такого как сегмент, слог или слово. Например, сегмент [ NoCoda & VOP ] нарушается один раз на каждый звонкий шумный в коде («VOP» означает «звонкий шумный запрет»), и может быть эквивалентно записан как *VoicedCoda . [13] [14] Локальные конъюнкции используются как способ обойти проблему фонологической непрозрачности , которая возникает при анализе цепных сдвигов . [13]
В исходном предложении, учитывая двух кандидатов, A и B, A лучше или более «гармоничен», чем B по ограничению, если A вызывает меньше нарушений, чем B. Кандидат A более гармоничен, чем B по всей иерархии ограничений, если A вызывает меньше нарушений ограничения с наивысшим рангом, отличающего A и B. A является «оптимальным» в своем наборе кандидатов, если он лучше по иерархии ограничений, чем все другие кандидаты. Однако это определение Eval способно моделировать отношения , которые превышают регулярность . [15]
Например, если заданы ограничения C 1 , C 2 и C 3 , где C 1 доминирует над C 2 , который доминирует над C 3 (C 1 ≫ C 2 ≫ C 3 ), A превосходит B или более гармонично, чем B, если A имеет меньше нарушений, чем B, на самом ранговом ограничении, которое назначает им разное количество нарушений (A является «оптимальным», если A превосходит B, а набор кандидатов состоит только из A и B). Если A и B равны по C 1 , но A лучше, чем B, на C 2 , A является оптимальным, даже если A имеет гораздо больше нарушений C 3, чем B. Это сравнение часто иллюстрируется таблицей. Указательный палец отмечает оптимального кандидата, и каждая ячейка отображает звездочку для каждого нарушения для данного кандидата и ограничения. Как только кандидат показывает худшие результаты, чем другой кандидат по самому высокому рангу ограничения, отличающему их, он подвергается фатальному нарушению (отмечено в таблице восклицательным знаком и затененными ячейками для ограничений с более низким рангом). Как только кандидат подвергается фатальному нарушению, он не может быть оптимальным, даже если он превосходит других кандидатов по остальной части Con .
Другие соглашения об обозначениях включают пунктирные линии, разделяющие столбцы неранжированных или одинаково ранжированных ограничений, галочку ✔ вместо пальца в предварительно ранжированных таблицах (обозначающую гармоничные, но не окончательно оптимальные), и обведенную звездочку ⊛, обозначающую нарушение победителем; в выходных кандидатах угловые скобки ⟨ ⟩ обозначают сегменты, опущенные в фонетической реализации, а □ и □́ обозначают вставные согласную и гласную соответственно. [16] Знак «намного больше, чем» ≫ (иногда вложенный ⪢) обозначает доминирование одного ограничения над другим («C 1 ≫ C 2 » = «C 1 доминирует над C 2 »), в то время как оператор «преуспевает» ≻ обозначает высшую гармонию по сравнению с выходными кандидатами («A ≻ B» = «A более гармонично, чем B»). [17]
Ограничения ранжируются в иерархии строгого доминирования. Строгость строгого доминирования означает, что кандидат, который нарушает только высокоранговое ограничение, хуже справляется с иерархией, чем тот, который не нарушает, даже если второй кандидат хуже справился с любым другим ограничением с более низким рангом. Это также означает, что ограничения нарушаются; победивший (т. е. наиболее гармоничный) кандидат не обязательно должен удовлетворять всем ограничениям, пока для любого кандидата-соперника, который справляется лучше победителя с каким-либо ограничением, существует ограничение с более высоким рангом, с которым победитель справляется лучше этого соперника. В пределах языка ограничение может быть ранжировано достаточно высоко, чтобы оно всегда соблюдалось; оно может быть ранжировано достаточно низко, чтобы не иметь наблюдаемых эффектов; или оно может иметь некоторый промежуточный рейтинг. Термин возникновение неотмеченного описывает ситуации, в которых ограничение маркированности имеет промежуточный рейтинг, так что оно нарушается в некоторых формах, но тем не менее имеет наблюдаемые эффекты, когда ограничения с более высоким рангом не имеют значения.
Ранним примером, предложенным Маккарти и Принсом (1994), является ограничение NoCoda , которое запрещает слогам заканчиваться на согласные. В Balangao NoCoda не имеет достаточно высокого ранга, чтобы всегда соблюдаться, как это видно в таких корнях, как taynan (верность вводу предотвращает удаление конечного /n/ ). Но в редуплицированной форме ma-tayna-taynan 'неоднократно быть оставленным позади', конечный /n/ не копируется. Согласно анализу Маккарти и Принса, это происходит потому, что верность вводу не применяется к редуплицированному материалу, и, таким образом, NoCoda может предпочесть ma-tayna-taynan гипотетическому ma-taynan-taynan (что имеет дополнительное нарушение NoCoda ).
Некоторые теоретики оптимальности предпочитают использовать сравнительные таблицы, как описано в Prince (2002b). Сравнительные таблицы отображают ту же информацию, что и классические или "пятнистые" таблицы, но информация представлена таким образом, что она выделяет наиболее важную информацию. Например, таблица выше будет отображена следующим образом.
Каждая строка в сравнительной таблице представляет пару победитель-проигравший, а не отдельного кандидата. В ячейках, где ограничения оценивают пары победитель-проигравший, ставится «W», если ограничение в этом столбце предпочитает победителя, «L», если ограничение предпочитает проигравшего, и «e», если ограничение не делает различий между парами. Представление данных таким образом упрощает обобщения. Например, для того, чтобы иметь последовательный рейтинг, некоторые W должны доминировать над всеми L. Брашовяну и Принс (2005) описывают процесс, известный как слияние, и различные способы представления данных в сравнительной таблице для достижения необходимых и достаточных условий для данного аргумента.
В качестве упрощенного примера рассмотрим проявление множественного числа в английском языке:
Также рассмотрим следующий набор ограничений в порядке убывания доминирования:
Независимо от того, как переупорядочены ограничения, алломорф [ɪs] всегда будет проигрывать [ɪz] . Это называется гармоническим ограничением . Нарушения, допущенные кандидатом [dɒɡɪz], являются подмножеством нарушений, допущенных [dɒɡɪs] ; в частности, если вы эпентезируете гласную, изменение звонкости морфемы является неоправданным нарушением ограничений. В таблице /dɒɡ/ + /z/ есть кандидат [dɒɡz] , который не допускает никаких нарушений. В пределах набора ограничений задачи [dɒɡz] гармонически ограничивает всех других возможных кандидатов. Это показывает, что кандидату не обязательно быть победителем, чтобы гармонически ограничить другого кандидата.
Таблицы, представленные выше, повторяются ниже с использованием формата сравнительных таблиц.
Из сравнительной таблицы для /dɒɡ/ + /z/ можно заметить, что любой рейтинг этих ограничений даст наблюдаемый результат [dɒɡz] . Поскольку нет сравнений, предпочитающих проигравшего, [dɒɡz] выигрывает при любом рейтинге этих ограничений; это означает, что на основе этого ввода нельзя установить рейтинг.
Таблица для /kæt/ + /z/ содержит строки с одним W и одним L. Это показывает, что Agree , Max и Dep должны доминировать над Ident ; однако на основе этих входных данных невозможно установить ранжирование между этими ограничениями. На основе этой таблицы был установлен следующий ранжирование:
Таблица для /dɪʃ/ + /z/ показывает, что для прогнозирования желаемого результата необходимо несколько дополнительных ранжирований. Третья строка ничего не говорит; в третьей строке нет сравнения предпочтения проигравшего. Первая строка показывает, что либо *SS, либо Agree должны доминировать над Dep , основываясь на сравнении между [dɪʃɪz] и [dɪʃz] . Четвертая строка показывает, что Max должен доминировать над Dep . Вторая строка показывает, что либо *SS, либо Ident должны доминировать над Dep . Из таблицы /kæt/ + /z/ было установлено, что Dep доминирует над Ident ; это означает, что *SS должен доминировать над Dep .
На сегодняшний день доказана необходимость следующих рейтингов:
Хотя вполне возможно, что Agree может доминировать над Dep , это не обязательно; рейтинг, приведённый выше, достаточен для появления наблюдаемого [dɪʃɪz] .
Если объединить рейтинги из таблиц, можно получить следующий свод рейтингов:
При линейном написании рейтингов есть два возможных места для Agree ; ни одно из них не является абсолютно точным. Первое подразумевает, что *SS и Max должны доминировать над Agree , а второе подразумевает, что Agree должен доминировать над Dep . Ни одно из них не является истинным, что является недостатком линейного написания рейтингов, как это. Такого рода проблемы являются причиной того, что большинство лингвистов используют решетчатый граф для представления необходимых и достаточных рейтингов, как показано ниже.
Диаграмма, которая представляет необходимые рейтинги ограничений в этом стиле, называется диаграммой Хассе .
Теория оптимальности вызвала значительную критику, большая часть которой направлена на ее применение в фонологии (а не в синтаксисе или других областях). [18] [19] [20] [21] [22] [23]
Утверждается, что ОТ не может объяснить фонологическую непрозрачность (см., например, Idsardi 2000). В деривационной фонологии можно увидеть эффекты, которые необъяснимы на поверхностном уровне, но объяснимы посредством «непрозрачного» упорядочения правил; но в ОТ, где нет промежуточных уровней для правил, на которых можно было бы работать, эти эффекты трудно объяснить.
Например, в квебекском французском высокие передние гласные вызвали аффрикацию /t/ (например, /tipik/ → [tˢpɪk] ), но потеря высоких гласных (видимая на поверхностном уровне) оставила аффрикацию без видимого источника. Деривационная фонология может объяснить это, заявив, что синкопа гласного (потеря гласного) «контркровила» аффрикацию — то есть, вместо того, чтобы возникать синкопа гласного и « кровоточить » (т. е. предотвращать) аффрикацию, она говорит, что аффрикация применяется перед синкопой гласного, так что высокий гласный удаляется, а среда, вызвавшая аффрикацию, разрушается. Такие упорядочения правил контркровоточения поэтому называются непрозрачными (в отличие от прозрачных ), потому что их эффекты не видны на поверхностном уровне.
Непрозрачность таких явлений не находит прямого объяснения в OT, поскольку теоретические промежуточные формы недоступны (ограничения относятся только к поверхностной форме и/или базовой форме). Было сделано несколько предложений, призванных объяснить это, но большинство предложений существенно изменяют базовую архитектуру OT и поэтому, как правило, весьма спорны. Часто такие изменения добавляют новые типы ограничений (которые не являются ограничениями универсальной верности или маркированности) или изменяют свойства Gen (например, допуская последовательные производные) или Eval . Примерами этого являются теория симпатии Джона Дж. Маккарти и теория цепей-кандидатов.
Соответствующей проблемой является существование циклических цепных сдвигов , т. е. случаев, когда вход /X/ отображается на выход [Y] , но вход /Y/ отображается на выход [X] . Многие версии OT предсказывают, что это невозможно (см. Moreton 2004, Prince 2007).
Теория оптимальности также критикуется как невозможная модель производства/восприятия речи: вычисление и сравнение бесконечного числа возможных кандидатов заняло бы бесконечно много времени для обработки. Идсарди (2006) отстаивает эту позицию, хотя другие лингвисты оспаривают это утверждение на том основании, что Идсарди делает необоснованные предположения о наборе ограничений и кандидатах, и что более умеренные реализации ОТ не представляют таких значительных вычислительных проблем (см. Корнаи (2006) и Хайнц, Кобеле и Риггл (2009)). [24] [25] Другим распространенным опровержением этой критики ОТ является то, что структура является чисто репрезентативной. С этой точки зрения ОТ рассматривается как модель лингвистической компетенции и, следовательно, не предназначена для объяснения специфики лингвистического исполнения . [26] [27]
Другое возражение против ОТ заключается в том, что технически это не теория, поскольку она не делает фальсифицируемых предсказаний. Источник этой проблемы может быть в терминологии: термин теория здесь используется иначе, чем в физике, химии и других науках. Конкретные реализации ОТ могут делать фальсифицируемые предсказания, так же как и конкретные предложения в других лингвистических рамках. Какие именно предсказания делаются и проверяемы ли они, зависит от специфики отдельных предложений (чаще всего это вопрос определений ограничений, используемых в анализе). Таким образом, ОТ как фреймворк лучше всего описывается [ по мнению кого? ] как научная парадигма . [28] [ нерелевантная цитата ]
На практике реализации ОТ часто используют многие концепции фонологических теорий представлений, такие как слог , мора или геометрия признаков . Полностью отличаясь от них, существуют подтеории, которые были предложены полностью в рамках ОТ, такие как теория позиционной верности, теория соответствия (Маккарти и Принс, 1995), теория симпатии, стратальная ОТ и ряд теорий обучаемости, в первую очередь Брюса Тезара. Другие теории в рамках ОТ касаются таких вопросов, как необходимость деривационных уровней в фонологической области, возможные формулировки ограничений и взаимодействия ограничений, отличные от строгого доминирования.
Теория оптимальности чаще всего ассоциируется с областью фонологии , но также применяется и в других областях лингвистики. Джейн Гримшоу , Джеральдин Лежандр и Джоан Бреснан разработали примеры теории в синтаксисе . [29] [30] Подходы теории оптимальности также довольно заметны в морфологии (и в интерфейсе морфологии и фонологии в частности). [31] [32]
В области семантики ОТ используется реже. Но были разработаны системы на основе ограничений, чтобы обеспечить формальную модель интерпретации. [33] ОТ также использовался в качестве основы для прагматики . [34]
Для орфографии анализ на основе ограничений также был предложен, среди прочих, Ричардом Визе [35] и Силке Хаманн/Иларией Коломбо. [36] Ограничения охватывают как отношения между звуком и буквой, так и предпочтения в отношении самого написания.