Обработка предложений происходит всякий раз, когда читатель или слушатель обрабатывает языковое высказывание, как изолированно, так и в контексте разговора или текста. Многие исследования процесса понимания человеческого языка были сосредоточены на чтении отдельных высказываний (предложений) без контекста. Обширные исследования показали, что на понимание языка влияет контекст, предшествующий данному высказыванию, а также многие другие факторы.
Понимание предложений должно иметь дело с неоднозначностью [1] в устных и письменных высказываниях, например, с лексической , структурной и семантической неоднозначностью . Неоднозначность вездесуща, но люди обычно разрешают ее так легко, что даже не замечают ее. Например, предложение Время летит как стрела имеет (по крайней мере) толкования Время движется так же быстро, как стрела , Особый вид мухи, называемый временной мухой, любит стрелы и Измеряйте скорость мух так, как вы бы измеряли скорость стрелы . Обычно читатели будут знать только о первой интерпретации. Образованные читатели, однако, спонтанно думают о стреле времени , но подавляют эту интерпретацию, потому что она отклоняется от исходной фразы, а височная доля действует как переключатель.
Случаи неоднозначности можно классифицировать как локальные или глобальные неоднозначности. Предложение является глобально неоднозначным, если оно имеет две различные интерпретации. Примерами являются предложения вроде « Кто-то застрелил слугу актрисы, который был на балконе» (был ли на балконе слуга или актриса?) или «Полицейский преследовал преступника на быстрой машине» (была ли быстрая машина у полицейского или преступника?). Понимающие могут иметь предпочтительную интерпретацию для любого из этих случаев, но синтаксически и семантически ни одна из возможных интерпретаций не может быть исключена.
Локальные неоднозначности сохраняются только в течение короткого времени, пока высказывание слушается или пишется, и разрешаются в ходе высказывания, поэтому полное высказывание имеет только одну интерпретацию. Примерами служат предложения вроде The critic wrote the book was enlightening , которые являются неоднозначными, когда The critic wrote the book has been encountered, but was enlightening still be performed. Затем предложение может закончиться, заявив, что критик является автором книги, или может продолжиться, чтобы уточнить, что критик написал что-то о книге. Неоднозначность заканчивается на was enlightening , что определяет, что вторая альтернатива верна.
Когда читатели обрабатывают локальную неоднозначность, они немедленно останавливаются на одной из возможных интерпретаций, не дожидаясь, пока услышат или прочитают больше слов, которые могли бы помочь решить, какая интерпретация верна (такое поведение называется инкрементальной обработкой ). Если читатели удивлены поворотом, который действительно принимает предложение, обработка замедляется и становится заметной, например, во время чтения. Поэтому локально неоднозначные предложения использовались в качестве тестовых случаев для исследования влияния ряда различных факторов на обработку предложений человеком. Если фактор помогает читателям избегать трудностей, ясно, что этот фактор играет роль в обработке предложений.
Экспериментальные исследования породили большое количество гипотез об архитектуре и механизмах понимания предложений. Такие вопросы, как модульность против интерактивной обработки и последовательное против параллельного вычисления анализов, были теоретическими разногласиями в этой области.
Модульный взгляд на обработку предложений предполагает, что каждый фактор, участвующий в обработке предложений, вычисляется в своем собственном модуле, который имеет ограниченные средства связи с другими модулями. Например, создание синтаксического анализа происходит без ввода семантического анализа или контекстно-зависимой информации, которые обрабатываются отдельно. Распространенным предположением модульных счетов является архитектура прямой связи , в которой вывод одного шага обработки передается на следующий шаг без механизмов обратной связи, которые позволили бы исправить вывод первого модуля. Синтаксическая обработка обычно считается самым базовым шагом анализа, который вводится в семантическую обработку и включение другой информации. Отдельный ментальный модуль анализирует предложения, и сначала происходит лексический доступ. Затем рассматривается одна синтаксическая гипотеза за раз. Нет никакого начального влияния смысла или семантики. Обработка предложений поддерживается височно-фронтальной сетью. В сети височные области обслуживают аспекты идентификации, а фронтальные области — построение синтаксических и семантических отношений. Временной анализ активации мозга в этой сети подтверждает справедливость моделей, ориентированных на синтаксис, поскольку он показывает, что построение синтаксической структуры предшествует семантическим процессам и что они взаимодействуют только на более поздней стадии. [2] [3]
Интерактивные учетные записи предполагают, что вся доступная информация обрабатывается одновременно и может немедленно влиять на вычисление окончательного анализа. В интерактивной модели обработки предложений нет отдельного модуля для синтаксического анализа. Лексический доступ, назначение синтаксической структуры и назначение значения происходят одновременно параллельно. Несколько синтаксических гипотез могут рассматриваться одновременно. Интерактивная модель демонстрирует онлайн-взаимодействие между структурным, лексическим и фонетическим уровнями обработки предложений. Каждое слово, как оно слышится в контексте обычного дискурса, немедленно вводится в систему обработки на всех уровнях описания и одновременно анализируется на всех этих уровнях в свете любой информации, доступной на каждом уровне в этой точке обработки предложения. [4] Интерактивные модели обработки языка предполагают, что информация течет как снизу вверх, так и сверху вниз, так что представления, сформированные на каждом уровне, могут находиться под влиянием как более высоких, так и более низких уровней. Структура, называемая структурой интерактивной активации, которая встраивает это ключевое предположение среди других, включая предположение о том, что влияния из разных источников объединяются нелинейно. Нелинейность означает, что информация, которая может быть решающей при некоторых обстоятельствах, может иметь небольшой или нулевой эффект при других условиях. В интерактивной структуре активации знания, направляющие обработку, хранятся в связях между блоками на одном и смежных уровнях. Обрабатывающие блоки, которые они соединяют, могут получать входные данные из ряда различных источников, что позволяет знаниям, направляющим обработку, быть полностью локальными, в то же время позволяя результатам обработки на одном уровне влиять на обработку на других уровнях, как выше, так и ниже. Основное предположение структуры заключается в том, что взаимодействия обработки всегда являются взаимными; именно эта двунаправленная характеристика делает систему интерактивной. Двунаправленные возбуждающие взаимодействия между уровнями допускают взаимное одновременное ограничение между смежными уровнями, а двунаправленные тормозящие взаимодействия внутри уровня допускают конкуренцию между взаимно несовместимыми интерпретациями части ввода. Возбуждающие взаимодействия между уровнями фиксируются в моделях в двусторонних возбуждающих связях между взаимно совместимыми обрабатывающими блоками. Синтаксические неоднозначности фактически основаны на лексическом уровне. Кроме того, более поздние исследования с более чувствительными машинами для отслеживания глаз показали ранние эффекты контекста. Частота и контекстная информация будут модулировать активацию альтернатив, даже если они разрешены в пользу простой интерпретации. Структурная простота сооснована частотой, что противоречит теории садовых дорожек [5]
Последовательные счета предполагают, что люди сначала строят только одну из возможных интерпретаций и пробуют другую, только если первая оказывается неверной. Параллельные счета предполагают построение нескольких интерпретаций одновременно. Чтобы объяснить, почему осмысляющие обычно знают только об одном возможном анализе того, что они слышат, модели могут предполагать, что все анализы ранжированы, и рассматривается анализ с наивысшим рангом.
Существует ряд влиятельных моделей обработки предложений человеком, которые основываются на различных комбинациях архитектурных решений.
Модель садовой дорожки (Frazier 1987) — это последовательная модульная модель синтаксического анализа. Она предполагает, что отдельный синтаксический анализ строится синтаксическим модулем. Контекстные и семантические факторы влияют на обработку на более позднем этапе и могут вызвать повторный анализ синтаксического анализа. Повторный анализ является дорогостоящим и приводит к заметному замедлению чтения. Когда синтаксический анализатор сталкивается с неоднозначностью, он руководствуется двумя принципами: позднее закрытие и минимальное присоединение. Модель была подкреплена исследованиями ранней левой передней негативности , связанного с событием потенциала, часто вызываемого в ответ на нарушения структуры фразы .
Позднее закрытие приводит к присоединению новых слов или фраз к текущему предложению. Например, «Джон сказал, что он уедет вчера» будет проанализировано как Джон сказал (он уедет вчера) , а не как Джон сказал (он уедет) вчера (т. е. он говорил вчера).
Минимальное присоединение — это стратегия экономии: анализатор строит максимально простую синтаксическую структуру (то есть такую, которая содержит наименьшее количество фразовых узлов).
Теории понимания языка, основанные на ограничениях [6], подчеркивают, как люди используют огромное количество вероятностной информации, доступной в языковом сигнале. Благодаря статистическому обучению [ 7] можно выбрать частоты и распределение событий в языковой среде, которые информируют о понимании языка. Таким образом, говорят, что пользователи языка приходят к определенной интерпретации по сравнению с другой во время понимания неоднозначного предложения, быстро интегрируя эти вероятностные ограничения.
Достаточно хороший подход к пониманию языка, разработанный Фернандой Феррейрой и другими, предполагает, что слушатели не всегда участвуют в полной детальной обработке лингвистического ввода. Скорее, система имеет тенденцию развивать поверхностные и неглубокие представления, когда сталкивается с некоторыми трудностями. Теория использует подход, который в некоторой степени объединяет как модель садовой дорожки, так и модель, основанную на ограничениях. Теория фокусируется на двух основных вопросах. Первый заключается в том, что представления, сформированные из сложного или трудного материала, часто являются поверхностными и неполными. Второй заключается в том, что ограниченные источники информации часто консультируются в случаях, когда система понимания сталкивается с трудностями. Теорию можно проверить с помощью различных экспериментов в психолингвистике, которые включают неправильное толкование садовой дорожки и т. д. [8] [9]
В поведенческих исследованиях субъектам часто предъявляют лингвистические стимулы и просят выполнить действие. Например, их могут попросить вынести суждение о слове ( лексическое решение ), воспроизвести стимул или назвать визуально представленное слово вслух. Скорость (часто время реакции: время, необходимое для ответа на стимул) и точность (доля правильных ответов) являются обычно используемыми мерами производительности в поведенческих задачах. Исследователи делают вывод, что природа базового процесса(ов), требуемого задачей, приводит к различиям; более медленные скорости и более низкая точность в этих задачах принимаются как меры повышенной сложности. Важным компонентом любой поведенческой задачи является то, что она остается относительно верной «нормальному» пониманию языка — способность обобщать результаты любой задачи ограничена, когда задача имеет мало общего с тем, как люди на самом деле сталкиваются с языком.
Распространенная поведенческая парадигма включает эффекты прайминга , когда участникам сначала предъявляют прайм, а затем целевое слово. Время ответа на целевое слово зависит от связи между праймом и целью. Например, Фишлер (1977) исследовала кодирование слов с помощью задачи лексического решения. Она просила участников принять решение о том, являются ли две строки букв английскими словами. Иногда строки были фактическими английскими словами, требующими ответа «да», а в других случаях они были не словами, требующими ответа «нет». Подмножество допустимых слов было семантически связано (например, кошка-собака), в то время как другие были не связаны (например, хлеб-стебель). Фишлер обнаружила, что на связанные пары слов реагировали быстрее по сравнению с не связанными парами слов, что говорит о том, что семантическая связанность может способствовать кодированию слов. [10]
Отслеживание глаз использовалось для изучения обработки языка онлайн. Этот метод оказал влияние на информирование о знании чтения. [11] Кроме того, Таненхаус и др. (1995) [12] создали парадигму визуального мира, которая использует движения глаз для изучения обработки устного языка онлайн. Эта область исследований опирается на связывающую гипотезу о том, что движения глаз тесно связаны с текущим фокусом внимания.
Рост неинвазивных методов предоставляет множество возможностей для изучения мозговых основ понимания языка. Распространенными примерами являются позитронно-эмиссионная томография (ПЭТ), функциональная магнитно-резонансная томография (фМРТ), потенциалы, связанные с событиями (ERPs) в электроэнцефалографии (ЭЭГ) и магнитоэнцефалографии (МЭГ), а также транскраниальная магнитная стимуляция (ТМС). Эти методы различаются по пространственному и временному разрешению (фМРТ имеет разрешение в несколько тысяч нейронов на пиксель, а ERP имеет миллисекундную точность), и каждый тип методологии представляет набор преимуществ и недостатков для изучения конкретной проблемы понимания языка.
Вычислительное моделирование — еще один способ исследования понимания языка. Модели, такие как модели, реализованные в нейронных сетях , особенно полезны, поскольку они требуют от теоретиков быть явными в своих гипотезах и поскольку их можно использовать для генерации точных прогнозов для теоретических моделей, которые настолько сложны, что делают дискурсивный анализ ненадежным. Классическим примером вычислительного моделирования в исследовании языка является модель восприятия речи TRACE Макклелланда и Элмана . [13] Модель обработки предложений можно найти в «рациональном» синтаксическом анализаторе Generalized Left Corner Хейла (2011). [14] Эта модель выводит эффекты садовой дорожки, а также явления локальной когерентности. Вычислительное моделирование также может помочь связать обработку предложений с другими функциями языка. Например, одна из моделей эффектов ERP в обработке предложений (например, N400 и P600) утверждает, что эти явления возникают из процессов обучения, которые поддерживают усвоение языка и лингвистическую адаптацию. [15]
ранняя левая передняя негативация.