stringtranslate.com

Смыслово-текстовая теория

Теория смысла и текста ( MTT ) — теоретическая лингвистическая концепция, впервые предложенная в Москве Александром Жолковским и Игорем Мельчуком [ 1] для построения моделей естественного языка. Теория обеспечивает обширную и сложную основу для лингвистического описания и, благодаря своему формальному характеру, особенно хорошо подходит для компьютерных приложений , включая машинный перевод , фразеологию и лексикографию . [ нужна цитата ]

Уровни представительства

Лингвистические модели в теории значения и текста основаны на том принципе, что язык состоит в отображении содержания или значения (семантики) высказывания на его форму или текст (фонетика). Промежуточными между этими полюсами являются дополнительные уровни репрезентации на синтаксическом и морфологическом уровнях.

Уровни репрезентации в теории смысла и текста [ противоречивы ]

Представления на разных уровнях последовательно отображаются от неупорядоченной сети семантического представления (SemR) через древовидные структуры зависимостей синтаксического представления (SyntR) к линеаризованной цепочке морфем морфологического представления (MorphR) и, в конечном итоге, упорядоченная во времени строка телефонов фонетического представления (PhonR) (обычно не рассматриваемая в работах по этой теории). Отношения между представлениями на разных уровнях считаются переводами или отображениями, а не преобразованиями, и опосредуются наборами правил, называемых «компонентами», которые обеспечивают соответствующие, специфичные для языка переходы между уровнями.

Семантическое представление

Семантические представления (SemR) в теории смысла и текста состоят в основном из семантической структуры, напоминающей паутину (SemS), которая сочетается с другими структурами семантического уровня (в первую очередь семантико-коммуникативной структурой [SemCommS], [2] которая представляет то, что обычно в других структурах называется « информационной структурой »). Сама SemS состоит из сети предикатов , представленных в виде узлов со стрелками, идущими от узлов предикатов к узлам аргументов . Аргументы могут быть общими для нескольких предикатов, а предикаты сами могут быть аргументами других предикатов. Узлы обычно соответствуют лексическим и грамматическим значениям, поскольку они непосредственно выражаются элементами лексикона или флективными средствами, но теория допускает возможность разложения значений на более детальное представление посредством процессов семантического перефразирования, [3] которые также Ключ к решению проблем синонимии и переводческой эквивалентности между языками. SemR отображаются на следующий уровень представления, глубоко-синтаксическое представление, по правилам семантического компонента, которые допускают связь один ко многим между уровнями (то есть один SemR потенциально может быть выражен с помощью множества синтаксических структур). , в зависимости от лексического выбора, сложности SemR и т. д.). Структурное описание и (полу)автоматическое создание SemR подлежат исследованию. [4] Здесь при декомпозиции используются семантические простые числа естественного семантического метаязыка для определения критерия завершения декомпозиции.

Синтаксическое представление

Синтаксические представления (SyntR) в теории смысла и текста реализуются с помощью деревьев зависимостей , которые составляют синтаксическую структуру (SyntS). SyntS сопровождается различными другими типами структур, в первую очередь синтаксической коммуникативной структурой и анафорической структурой. В теории значения и текста существует два уровня синтаксиса: глубокое синтаксическое представление (DSyntR) и поверхностное синтаксическое представление (SSyntR). Хороший обзор синтаксиса теории значения и текста, включая его описательное применение, можно найти у Мельчука (1988). [5] Комплексная модель поверхностного синтаксиса английского языка представлена ​​в работе Мельчука и Перцова (1987). [6]

Глубокое синтаксическое представление (DSyntR) напрямую связано с SemS и стремится уловить «универсальные» аспекты синтаксической структуры. Деревья на этом уровне представляют отношения зависимости между лексемами (или между лексемами и ограниченным набором абстрактных сущностей, таких как лексические функции). Глубокие синтаксические отношения между лексемами в DSyntR ограничены универсальным набором из дюжины синтаксических отношений, включая семь ранговых актантных (аргументных) отношений, модификационное отношение и координационное отношение. Лексемы с чисто грамматической функцией, такие как лексически управляемые предлоги, не включены на этот уровень представления; значения флективных категорий, которые получены из SemR, но реализованы морфологией, представлены в виде индексов на соответствующих лексических узлах, к которым они относятся. DSyntR отображается на следующий уровень представления по правилам глубинного синтаксического компонента.

Поверхностно-синтаксическое представление (SSyntR) представляет собой специфичную для языка синтаксическую структуру высказывания и включает узлы для всех лексических единиц (в том числе имеющих чисто грамматическую функцию) в предложении. Синтаксические отношения между лексическими единицами на этом уровне не ограничены и считаются полностью специфичными для языка, хотя считается, что многие из них схожи (или, по крайней мере, изоморфны) в разных языках. SSyntR отображается на следующий уровень представления по правилам поверхностно-синтаксического компонента.

Морфологическое представление

Морфологические представления (MorphR) в теории значения и текста реализуются в виде строк морфем, расположенных в фиксированном линейном порядке, отражающем порядок элементов в реальном высказывании. Это первый уровень репрезентации, на котором линейный приоритет считается лингвистически значимым, эффективно группируя порядок слов вместе с морфологическими процессами и просодией как одно из трех нелексических средств, с помощью которых языки могут кодировать синтаксическую структуру. Как и в случае с синтаксическим представлением, существует два уровня морфологического представления — глубокое и поверхностное морфологическое представление. Подробные описания морфологических представлений теории смысла и текста можно найти у Мельчука (1993–2000) [7] и Мельчука (2006). [8]

Глубокое морфологическое представление (DMorphR) состоит из строк лексем и морфем — например, THE SHOE + PL ON BILL + POSS FOOT + PL . Глубокий морфологический компонент правил отображает эту строку на поверхностное морфологическое представление (SMorphR), преобразуя морфемы в соответствующие морфы и выполняя морфологические операции, реализующие неконкатенативные морфологические процессы - в случае нашего примера выше, давая нам /the Shoes+s на ногах Билла/. Правила поверхностного морфологического компонента, подмножество которых включает морфонематические правила, отображают SMorphR на фонетическое представление [ðə ʃuz on bɪlz fi:t].

Лексикон

Важнейшим аспектом теории значения-текста является лексикон, который считается всеобъемлющим каталогом лексических единиц (ЛЕ) языка, причем этими единицами являются лексемы, словосочетания и другие фраземы , конструкции и другие конфигурации лингвистических элементов, которые являются усваивается и реализуется в речи пользователями языка. Лексика в теории значения-текста представлена ​​пояснительным комбинаторным словарем (ECD) [9] [10] , который включает статьи для всех LU языка, а также информацию, которую носители должны знать относительно их синтаксиса (специфичные для LU правила и условия их комбинаторики). РДРВ для русского языка подготовили Мельчук и др. (1984), [11] и ECD на французском языке были опубликованы как Mel'čuk et al. (1999) [12] и Мельчук и Польгер (2007). [13]

Лексические функции

Одним из важных открытий лингвистики значения и текста стало признание того, что LU в языке могут быть связаны друг с другом в абстрактном семантическом смысле и что это же отношение также сохраняется для многих лексически несвязанных пар или наборов LU. Эти отношения представлены в теории смысла-текста как лексические функции (ЛФ). [14] Примером простого LF является Magn(L), который представляет собой словосочетания, используемые для усиления, например, проливной дождь , сильный ветер или интенсивная бомбардировка . Носитель английского знает, что для данной лексемы L, такой как ДОЖДЬ, значение Magn(RAIN) = HEAVY, тогда как Magn(WIND) = STRONG и так далее. Теория значения и текста в настоящее время признает несколько десятков стандартных LF, которые, как известно, повторяются в разных языках.

Смотрите также

Рекомендации

  1. ^ Жолковский, Александр К.; Игорь Алексеевич Мельчук (1965). «О возможном методе и инструментах семантического синтеза». Научно-техническая информация . 5 : 23–28.
  2. ^ Мельчук, Игорь А. (2001). Коммуникативная организация в естественном языке: Семантико-коммуникативная структура предложений . Амстердам: Джон Бенджаминс.
  3. ^ Миличевич, Ясмина (2007). Ла перефраз. Моделизация языкового парафраза . Берн: Питер Лэнг.
  4. ^ Фендрих, Дж. и др. 2014: «Разложение формального языка на семантические простые числа». ADCAIJ: Достижения в области распределенных вычислений и искусственного интеллекта, журнал 3.8 (2014): 56-73.
  5. ^ Мельчук, Игорь А. (1988). Синтаксис зависимостей: Теория и практика . Олбани, Нью-Йорк: SUNY Press.
  6. ^ Мельчук, Игорь А.; Николай Владимирович Перцов (1987). Поверхностный синтаксис английского языка: формальная модель в рамках структуры «Смысл-текст» . Амстердам: Джон Бенджаминс.
  7. ^ Мельчук, Игорь А. (1993–2000). Курс общей морфологии . Монреаль: Les Presses de l'Université de Montréal.
  8. ^ Мельчук, Игорь А. (2006). Аспекты теории морфологии . Берлин: Мутон де Грюйтер.
  9. ^ Мельчук, Игорь А.; Андре Клас; Ален Польгер (1995). Введение в объяснительную и комбинаторную лексику . Париж: Дюкуло.
  10. ^ Мельчук, Игорь А. (2006). Сика, Дж. (ред.). «Толковый комбинаторный словарь». Открытые проблемы языкознания и лексикографии . Монца: Полиметрика: 222–355.
  11. ^ Мельчук, Игорь А.; Александр К. Жолковский; Юрий Апресян (1984). Толково-комбинаторный словарь современного русского языка: Опыты семантико-синтаксического описания русской лексики. Толковый комбинаторный словарь современного русского языка: семантико-синтаксические исследования русской лексики . Венский славистский альманах: Вена.
  12. ^ Мельчук, Игорь А.; Н. Арбачевский-Жумари; Лида Иорданская; С. Манта; Ален Польгер (1999). Объяснительный и комбинационный словарь современного французского языка. Лексико-семантические исследования IV . Монреаль: Les Presses de l'Université de Montréal.
  13. ^ Мельчук, Игорь А.; Ален Польгер (2007). Lexique actif du français: L'apprentissage du vocabulairefundé sur 20000 семантических производных и словосочетаний французского языка . Париж: Дюкуло.
  14. ^ Мельчук, Игорь А. (1996). Ваннер, Лео (ред.). «Лексические функции: инструмент описания лексических отношений в лексиконе». Лексические функции в лексикографии и обработке естественного языка : 37–102.

дальнейшее чтение

Обзоры

Общий

Синтаксис

Морфология

Лексикография

Внешние ссылки

Значение – текстовое программное обеспечение