Теория смысла и текста

Теория смысла и текста ( MTT ) — это теоретическая лингвистическая структура, впервые предложенная в Москве Александром Жолковским и Игорем Мельчуком ^[1] для построения моделей естественного языка. Теория обеспечивает большую и сложную основу для лингвистического описания и, благодаря своему формальному характеру, особенно хорошо подходит для компьютерных приложений , включая машинный перевод , фразеологию и лексикографию . ^{[ требуется ссылка ]}

Уровни представительства

Лингвистические модели в теории смысла–текста работают по принципу, что язык состоит в отображении содержания или смысла (семантики) высказывания на его форму или текст (фонетику). Промежуточными между этими полюсами являются дополнительные уровни представления на синтаксическом и морфологическом уровнях.

Уровни представления в теории смысла–текста ^{[ противоречиво ]}

Представления на разных уровнях отображаются последовательно из неупорядоченной сети семантического представления (SemR) через древовидные структуры зависимостей синтаксического представления (SyntR) в линеаризованную цепочку морфем морфологического представления (MorphR) и, в конечном счете, во временно упорядоченную строку фонов фонетического представления (PhonR) (обычно не рассматриваемую в работе по этой теории). Отношения между представлениями на разных уровнях считаются переводами или отображениями, а не преобразованиями, и опосредуются наборами правил, называемых «компонентами», которые обеспечивают соответствующие, специфичные для языка переходы между уровнями.

Семантическое представление

Семантические представления (SemR) в теории смысла–текста в основном состоят из семантической структуры, похожей на сеть (SemS), которая объединяется с другими структурами семантического уровня (в частности, семантико-коммуникативной структурой [SemCommS], ^[2] , которая представляет то, что обычно называют « информационной структурой » в других фреймворках). Сама SemS состоит из сети предикаций , представленных в виде узлов со стрелками, идущими от узлов предикатов к узлам аргументов . Аргументы могут совместно использоваться несколькими предикатами, а предикаты сами могут быть аргументами других предикатов. Узлы обычно соответствуют лексическим и грамматическим значениям, поскольку они напрямую выражаются элементами в лексиконе или с помощью словоизменительных средств, но теория допускает возможность разложения значений на более мелкозернистые представления с помощью процессов семантического парафразирования, ^[3], которые также являются ключом к работе с синонимией и эквивалентностями перевода между языками. SemR отображаются на следующем уровне представления, глубоком синтаксическом представлении, по правилам семантического компонента, которые допускают связь один ко многим между уровнями (то есть один SemR может быть потенциально выражен различными синтаксическими структурами в зависимости от лексического выбора, сложности SemR и т. д.). Структурное описание и (полу)автоматическая генерация SemR являются предметом исследования. ^[4] Здесь декомпозиция использует семантические примитивы естественного семантического метаязыка для определения критерия завершения декомпозиции.

Синтаксическое представление

Синтаксические представления (SyntR) в теории смысла–текста реализуются с использованием деревьев зависимостей , которые составляют синтаксическую структуру (SyntS). SyntS сопровождается различными другими типами структур, наиболее заметными из которых являются синтаксическая коммуникативная структура и анафорическая структура. В теории смысла–текста существует два уровня синтаксиса: глубокое синтаксическое представление (DSyntR) и поверхностное синтаксическое представление (SSyntR). Хороший обзор синтаксиса теории смысла–текста, включая его описательное применение, можно найти в Mel'čuk (1988). ^[5] Комплексная модель поверхностного синтаксиса английского языка представлена в Mel'čuk & Pertsov (1987). ^[6]

Глубокое синтаксическое представление (DSyntR) напрямую связано с SemS и стремится охватить «универсальные» аспекты синтаксической структуры. Деревья на этом уровне представляют отношения зависимости между лексемами (или между лексемами и ограниченным перечнем абстрактных сущностей, таких как лексические функции). Глубокие синтаксические отношения между лексемами на DSyntR ограничены универсальным перечнем из дюжины синтаксических отношений, включая семь ранжированных актантных (аргументных) отношений, модификативное отношение и координационное отношение. Лексемы с чисто грамматической функцией, такие как лексически управляемые предлоги, не включены на этом уровне представления; значения флективных категорий, которые выводятся из SemR, но реализуются морфологией, представлены в виде нижних индексов на соответствующих лексических узлах, на которые они опираются. DSyntR отображается на следующий уровень представления правилами компонента глубокого синтаксиса.

Поверхностно-синтаксическое представление (SSyntR) представляет собой специфичную для языка синтаксическую структуру высказывания и включает узлы для всех лексических элементов (включая те, которые имеют чисто грамматическую функцию) в предложении. Синтаксические отношения между лексическими элементами на этом уровне не ограничены и считаются полностью специфичными для языка, хотя многие из них считаются схожими (или, по крайней мере, изоморфными) в разных языках. SSyntR отображается на следующий уровень представления правилами поверхностно-синтаксического компонента.

Морфологическое представление

Морфологические представления (MorphR) в теории смысла–текста реализуются как строки морфем, организованные в фиксированном линейном порядке, отражающем порядок элементов в фактическом высказывании. Это первый уровень представления, на котором линейное предшествование считается лингвистически значимым, эффективно группируя порядок слов вместе с морфологическими процессами и просодией , как одно из трех нелексических средств, с помощью которых языки могут кодировать синтаксическую структуру. Как и в случае с синтаксическим представлением, существует два уровня морфологического представления — глубокое и поверхностное морфологическое представление. Подробные описания морфологических представлений теории смысла–текста можно найти в работах Мельчука (1993–2000) ^[7] и Мельчука (2006). ^[8]

Глубокое морфологическое представление (DMorphR) состоит из строк лексем и морфем, например, THE SHOE + PL ON BILL + POSS FOOT + PL . Глубокий морфологический компонент правил отображает эту строку на поверхностное морфологическое представление (SMorphR), преобразуя морфемы в соответствующие морфы и выполняя морфологические операции, реализующие неконкатенативные морфологические процессы, в случае нашего примера выше, давая нам /the shoe+s on Bill+s feet/. Правила поверхностного морфологического компонента, подмножество которого включает морфофонемические правила, отображают SMorphR на фонетическое представление [ðə ʃuz on bɪlz fi:t].

Лексикон

Важнейшим аспектом теории смысла и текста является лексикон, который считается всеобъемлющим каталогом лексических единиц (ЛЕ) языка, причем эти единицы являются лексемами, словосочетаниями и другими фразеологизмами , конструкциями и другими конфигурациями языковых элементов, которые изучаются и реализуются в речи пользователями языка. Лексикон в теории смысла и текста представлен толковым комбинаторным словарем (ЭКС) ^[9]^[10] , который включает записи для всех ЛЕ языка вместе с информацией, которую носители языка должны знать относительно их синтактики (специфичные для ЛЕ правила и условия их комбинаторики). ЭКС для русского языка был создан Мельчуком и др. (1984), ^[11] , а ЭКС для французского языка были опубликованы как Мельчук и др. (1999) ^[12] и Мельчук и Польгер (2007). ^[13]

Лексические функции

Одним из важных открытий лингвистики смысла и текста стало признание того, что ЛЕ в языке могут быть связаны друг с другом в абстрактном семантическом смысле и что это же отношение также сохраняется во многих лексически не связанных парах или наборах ЛЕ. Эти отношения представлены в теории смысла и текста как лексические функции (ЛФ). ^[14] Примером простой ЛФ является Magn(L), которая представляет собой словосочетания, используемые при интенсификации, такие как сильный дождь , сильный ветер или интенсивная бомбардировка . Носитель английского языка знает, что для данной лексемы L, такой как RAIN, значение Magn(RAIN) = HEAVY, тогда как Magn(WIND) = STRONG и так далее. Теория смысла и текста в настоящее время распознает несколько десятков стандартных ЛФ, которые, как известно, повторяются в разных языках.

Смотрите также

Генерация естественного языка

Ссылки

^ Жолковский, Александр К.; Игорь Алексеевич Мельчук (1965). «О возможном методе и инструментах семантического синтеза». Научно-техническая информация . 5 : 23–28.
^ Мельчук, Игорь А. (2001). Коммуникативная организация в естественном языке: семантико-коммуникативная структура предложений . Амстердам: Джон Бенджаминс.
^ Миличевич, Ясмина (2007). Ла перефраз. Моделизация языкового парафраза . Берн: Питер Лэнг.
^ Fähndrich, J. et al. 2014: «Формальная языковая декомпозиция в семантические простые числа». ADCAIJ: Advances in Distributed Computing and Artificial Intelligence Journal 3.8 (2014): 56-73.
^ Мельчук, Игорь А. (1988). Синтаксис зависимости: теория и практика . Олбани, Нью-Йорк: SUNY Press.
^ Мельчук, Игорь А.; Николай В. Перцов (1987). Поверхностный синтаксис английского языка: формальная модель в рамках концепции «смысл-текст» . Амстердам: Джон Бенджаминс.
^ Мельчук, Игорь А. (1993–2000). Курс общей морфологии . Монреаль: Les Presses de l'Université de Montréal.
^ Мельчук, Игорь А. (2006). Аспекты теории морфологии . Берлин: Mouton de Gruyter.
^ Мельчук, Игорь А.; Андре Клас; Ален Польгер (1995). Введение в объяснительную и комбинаторную лексику . Париж: Дюкуло.
^ Мельчук, Игорь А. (2006). Сика, Г (ред.). «Толковый комбинаторный словарь». Открытые проблемы лингвистики и лексикографии . Монца: Polimetrica: 222–355.
^ Мельчук, Игорь А.; Александр К. Жолковский; Юрий Апресян (1984). Толково-комбинаторный словарь современного русского языка: Опыты семантико-синтаксического описания русской лексики. Толковый комбинаторный словарь современного русского языка: семантико-синтаксические исследования русской лексики . Венский славистский альманах: Вена.
^ Мельчук, Игорь А.; Н. Арбачевский-Жумари; Лида Иорданская; С. Манта; Ален Польгер (1999). Объяснительный и комбинационный словарь современного французского языка. Лексико-семантические исследования IV . Монреаль: Les Presses de l'Université de Montréal.
^ Мельчук, Игорь А.; Ален Польгер (2007). Lexique actif du français: L'apprentissage du vocabulairefoundé sur 20000 семантических производных и словосочетаний французского языка . Париж: Дюкуло.
^ Мельчук, Игорь А. (1996). Ваннер, Лео (ред.). «Лексические функции: инструмент для описания лексических отношений в лексиконе». Лексические функции в лексикографии и обработке естественного языка : 37–102.

Дальнейшее чтение

Обзоры

Мельчук, Игорь А. (1981). «Модели смысл-текст: недавнее направление в советской лингвистике». Annual Review of Anthropology . 10 : 27–62. doi :10.1146/annurev.an.10.100181.000331.
Мельчук, Игорь А. (1988). Синтаксис зависимости: теория и практика. Олбани, Нью-Йорк: SUNY Press. ISBN 9780887064500.

Общий

Жолковский А.К. и Мельчук Игорь А. (1965). О возможном методе и инструментах семантического синтеза. Научно-техническая информация 5, 23–28.
И. А. Мельчук . Опыт теории лингвистических моделей «Смысл ↔ Текст». М., 1974 (2-е изд., 1999).
И. А. Мельчук. Русский язык в моделях «Смысл ↔ Текст». Москва-Вена, 1995.
И. А. Мельчук. Vers une linguistique Sens-Texte. Вступительный урок. П.: Коллеж де Франс, Международная кафедра, 1997.
Лео Ваннер (ред.), Последние тенденции в теории смысла и текста. Амстердам, Филадельфия: J. Benjamins Pub., 1997. ISBN 1-55619-925-2 , ISBN 90-272-3042-0
Большаков И.А., Гельбух А.Ф. Модель «смысл-текст»: тридцать лет спустя. Международный форум по информации и документации, FID 519, ISSN 0304-9701, N 1, 2000.

Синтаксис

И. А. Мельчук. Поверхностный синтаксис русских числовых выражений. Вена: Венский славистский альманах, 1985.
И. А. Мельчук и Н. В. Перцов. Поверхностный синтаксис английского языка: формальная модель в рамках концепции «смысл-текст». Амстердам, Филадельфия: Benjamins, 1987. ISBN 90-272-1515-4
Мельчук И. А. Синтаксис зависимости: теория и практика. Олбани, Нью-Йорк: SUNY, 1988. ISBN 0-88706-450-7 , ISBN 0-88706-451-5
Мельчук И. А. Актанты в семантике и синтаксисе. I, II, Языкознание, 2004, 42:1, 1–66; 42:2, 247—291.

Морфология

И.А. Мельчук. Курс общей морфологии, том. 1–5. Монреаль: Les Presses de l'Université de Montréal / Париж: CNRS Editions, 1993–2000 гг.
Мельчук И. А. Аспекты теории морфологии. Берлин; Нью-Йорк: Mouton de Gruyter, 2006. ISBN 3-11-017711-0

Лексикография

И.А. Мельчук, А.К. Жолковский, Ю. Д. Апресян и др. Толково-комбинаторный словарь современного русского языка: Опыты семантико-синтаксического описания русской лексики. Вена: Венский славистский альманах, 1984.
И. А. Мельчук, А. Клас и А. Польгер. Введение в объяснительную и комбинаторную лексику. П.: Дюкуло, 1995. — ISBN 2-8011-1106-6.
И.А. Мельчук и др. Объяснительный и комбинационный словарь современного французского языка. Лексико-семантические исследования IV, Монреаль: Les Presses de l'Université de Montréal, 1999. - ISBN 2-7606-1738-6

Внешние ссылки

На веб-сайте Meaning-Text Theory размещаются материалы двухгодичной конференции MTT.
Обсерватория лингвистики Sens-Texte (OLST)
Значение–Текст @ neuvel.net, отличное введение в теорию
Значение–Текстовая он-лайн библиотека

Значение–текстовое программное обеспечение

Лингвистическая виртуальная машина Carabao, предоставленная LinguaSys
Система лингвистической обработки ETAP-3 , описанная как «полноценная реализация теории «смысл-текст» на языке НЛП» (официальный сайт)