stringtranslate.com

Обработка предложений

Обработка предложения происходит всякий раз, когда читатель или слушатель обрабатывает языковое высказывание, изолированно или в контексте разговора или текста. Многие исследования процесса понимания человеческой речи были сосредоточены на чтении отдельных высказываний (предложений) без контекста. Обширные исследования показали, что на понимание языка влияет контекст, предшествующий данному высказыванию, а также многие другие факторы.

Двусмысленность

Пониманию предложения приходится иметь дело с двусмысленностью [1] в устной и письменной речи, например, с лексической , структурной и семантической двусмысленностью . Неоднозначность встречается повсеместно, но люди обычно разрешают ее настолько легко, что даже не замечают ее. Например, предложение « Время летит как стрела» имеет (по крайней мере) интерпретацию «Время движется так же быстро, как стрела » . Стрелка . Обычно читатели знают только первую интерпретацию. Однако образованные читатели спонтанно думают о стреле времени , но препятствуют этой интерпретации, поскольку она отклоняется от исходной фразы, а височная доля действует как переключатель.

Случаи неоднозначности можно классифицировать как локальные или глобальные неоднозначности. Предложение является глобально двусмысленным, если оно имеет две различные интерпретации. Примерами могут служить такие предложения, как Кто-то застрелил слугу актрисы, который был на балконе (это был слуга или актриса, которая была на балконе?) или Полицейский преследовал преступника на быстрой машине (у полицейского или у преступника был быстрая машина?). Постигатели могут иметь предпочтительную интерпретацию для любого из этих случаев, но синтаксически и семантически ни одна из возможных интерпретаций не может быть исключена.

Локальные двусмысленности сохраняются лишь в течение короткого промежутка времени, пока высказывание слышится или пишется, и разрешаются в ходе высказывания, поэтому полное высказывание имеет только одну интерпретацию. Примеры включают такие предложения, как Критик написал, что книга была поучительной , что является двусмысленным, когда Критик написал, что книга была встречена, но была поучительной, еще предстоит обработать. Затем предложение может закончиться заявлением о том, что критик является автором книги, или может продолжиться пояснением, что критик написал что-то о книге. Неоднозначность заканчивается на «было просвещающим» , что определяет, что второй вариант верен.

Когда читатели обрабатывают локальную двусмысленность, они немедленно останавливаются на одной из возможных интерпретаций, не дожидаясь, пока услышат или прочитают дополнительные слова, которые могут помочь решить, какая интерпретация правильна (поведение называется инкрементальной обработкой ). Если читатели удивлены поворотом предложения, обработка замедляется и это заметно, например, по времени чтения. Поэтому локально неоднозначные предложения использовались в качестве тестовых примеров для изучения влияния ряда различных факторов на обработку предложений человеком. Если какой-то фактор помогает читателям избежать затруднений, то ясно, что этот фактор играет роль в обработке предложения.

Теории

Экспериментальные исследования породили большое количество гипотез об архитектуре и механизмах понимания предложений. Такие вопросы, как модульность по сравнению с интерактивной обработкой и последовательные и параллельные вычисления анализа, были теоретическими разногласиями в этой области.

Архитектурные вопросы

Модульный или интерактивный

Модульный подход к обработке предложений предполагает, что каждый фактор, участвующий в обработке предложений, вычисляется в отдельном модуле, который имеет ограниченные средства связи с другими модулями. Например, создание синтаксического анализа происходит без ввода семантического анализа или контекстно-зависимой информации, которые обрабатываются отдельно. Распространенным предположением о модульных счетах является архитектура прямой связи, в которой выходные данные одного шага обработки передаются на следующий шаг без механизмов обратной связи, которые позволяли бы корректировать выходные данные первого модуля. Синтаксическую обработку обычно считают самым основным этапом анализа, который способствует семантической обработке и включению другой информации. Отдельный ментальный модуль анализирует предложения, и сначала происходит лексический доступ. Затем поочередно рассматривается одна синтаксическая гипотеза. Здесь нет первоначального значения или семантического влияния. Обработка предложений поддерживается височно-фронтальной сетью. Внутри сети височные регионы служат аспектам идентификации, а фронтальные регионы - построению синтаксических и семантических отношений. Временной анализ активации мозга в этой сети поддерживает модели, ориентированные на синтаксис, поскольку они показывают, что построение синтаксической структуры предшествует семантическим процессам и что они взаимодействуют только на более поздней стадии. [2] [3]

Интерактивные учетные записи предполагают, что вся доступная информация обрабатывается одновременно и может немедленно повлиять на расчет окончательного анализа. В интерактивной модели обработки предложений нет отдельного модуля для синтаксического анализа. Лексический доступ, присвоение синтаксической структуры и присвоение значения происходят одновременно и параллельно. Одновременно можно рассматривать несколько синтаксических гипотез. Интерактивная модель демонстрирует онлайн-взаимодействие структурного и лексико-фонетического уровней обработки предложений. Каждое слово, услышанное в контексте обычного дискурса, немедленно вводится в систему обработки на всех уровнях описания и одновременно анализируется на всех этих уровнях в свете любой информации, доступной на каждом уровне в данный момент описания. обработка приговора. [4] Интерактивные модели языковой обработки предполагают, что информация течет как снизу вверх, так и сверху вниз, так что на представления, сформированные на каждом уровне, могут влиять как более высокие, так и более низкие уровни. Структура, называемая структурой интерактивной активации, которая включает это ключевое предположение среди других, включая предположение о том, что влияния из разных источников комбинируются нелинейно. Нелинейность означает, что информация, которая может иметь решающее значение при некоторых обстоятельствах, может иметь незначительный эффект или вообще не иметь его при других условиях. В рамках интерактивной активации знания, управляющие обработкой, хранятся в связях между модулями на одном и соседних уровнях. Подключаемые к ним процессоры могут получать входные данные из множества различных источников, что позволяет знаниям, управляющим обработкой, быть полностью локальными и в то же время позволяет результатам обработки на одном уровне влиять на обработку на других уровнях, как над и под. Основное предположение структуры заключается в том, что взаимодействия обработки всегда взаимны; именно эта двунаправленная характеристика делает систему интерактивной. Двунаправленные возбуждающие взаимодействия между уровнями допускают взаимное одновременное ограничение между соседними уровнями, а двунаправленные тормозящие взаимодействия внутри уровня допускают конкуренцию между взаимно несовместимыми интерпретациями части входных данных. Межуровневые возбуждающие взаимодействия фиксируются в моделях в виде двусторонних возбуждающих связей между взаимно совместимыми процессорами. Синтаксическая неоднозначность фактически базируется на лексическом уровне. Кроме того, недавние исследования с использованием более чувствительных машин слежения за глазами показали ранние контекстные эффекты. Частотная и контекстная информация будут модулировать активацию альтернатив, даже если они решены в пользу простой интерпретации. Структурная простота основана на частоте, что противоречит теории садовых дорожек [5].

Последовательный или параллельный

Серийные отчеты предполагают, что люди сначала создают только одну из возможных интерпретаций и пробуют другую только в том случае, если первая оказывается неверной. Параллельные отчеты предполагают построение нескольких интерпретаций одновременно. Чтобы объяснить, почему воспринимающие обычно знают только об одном возможном анализе того, что они слышат, модели могут предположить, что все анализы ранжированы, а анализ с самым высоким рейтингом развлекается.

Модели

Существует ряд влиятельных моделей обработки человеческих предложений, основанных на различных комбинациях архитектурных решений.

Модель садовой дорожки

Модель садовой дорожки (Фрейзер, 1987) представляет собой модель последовательного модульного анализа. Он предполагает, что один синтаксический анализ строится с помощью синтаксического модуля. Контекстуальные и семантические факторы влияют на обработку на более позднем этапе и могут вызвать повторный анализ синтаксического анализа. Повторный анализ обходится дорого и приводит к заметному замедлению чтения. Когда парсер сталкивается с неоднозначностью, он руководствуется двумя принципами: позднее закрытие и минимальное вложение. Модель была подтверждена исследованиями раннего негативизма левой передней частипотенциала, связанного с событием, который часто возникает в качестве реакции на нарушения структуры фразы .

Позднее закрытие приводит к добавлению новых слов или фраз к текущему предложению. Например, фраза «Джон сказал, что уйдет вчера» будет анализироваться так, как сказал Джон (он уйдет вчера) , а не так, как сказал Джон (он уйдет) вчера (т. е. он говорил вчера).

Минимальное вложение — это стратегия экономии: анализатор строит максимально простую синтаксическую структуру (то есть структуру с наименьшим количеством фразовых узлов).

Модель на основе ограничений

Теории понимания языка, основанные на ограничениях [6], подчеркивают, как люди используют огромное количество вероятностной информации, доступной в лингвистическом сигнале. С помощью статистического обучения [ 7] можно определить частоту и распределение событий в языковой среде, которые влияют на понимание языка. Таким образом, говорят, что пользователи языка приходят к определенной интерпретации по сравнению с другой во время понимания неоднозначного предложения за счет быстрой интеграции этих вероятностных ограничений.

Достаточно хорошая теория

Достаточно хороший подход к пониманию языка, разработанный Фернандой Феррейрой и другими, предполагает, что слушатели не всегда участвуют в полной детальной обработке лингвистической информации. Скорее, система имеет тенденцию развивать неглубокие и поверхностные представления, когда сталкивается с некоторыми трудностями. Теория использует подход, который в некоторой степени сочетает в себе модель садовой дорожки и модель, основанную на ограничениях. Теория фокусируется на двух основных вопросах. Во-первых, представления, сформированные на основе сложного или сложного материала, часто бывают поверхностными и неполными. Во-вторых, в тех случаях, когда система понимания сталкивается с трудностями, часто обращаются к ограниченным источникам информации. Теорию можно проверить с помощью различных психолингвистических экспериментов, включающих неправильное толкование садовых дорожек и т. д. [8] [9]

Методы

Поведенческие задачи

В поведенческих исследованиях испытуемым часто предъявляют лингвистические стимулы и просят выполнить действие. Например, их могут попросить высказать суждение о слове ( лексическое решение ), воспроизвести стимул или назвать вслух визуально представленное слово. Скорость (часто время реакции: время, необходимое для реакции на стимул) и точность (доля правильных ответов) обычно используются для измерения производительности в поведенческих задачах. Исследователи приходят к выводу, что природа основного процесса(ов), требуемого задачей, приводит к различиям; более медленные темпы и меньшая точность выполнения этих задач воспринимаются как меры повышенной сложности. Важным компонентом любой поведенческой задачи является то, что она остается относительно верной «нормальному» пониманию языка — способность обобщать результаты любой задачи ограничена, когда задача имеет мало общего с тем, как люди на самом деле сталкиваются с языком.

Распространенная поведенческая парадигма включает в себя эффекты прайминга , при которых участникам сначала предъявляется простое слово, а затем целевое слово. На время ответа целевого слова влияет отношение между основным и целевым словом. Например, Фишлер (1977) исследовал кодирование слов с помощью задачи лексического решения. Она попросила участников принять решение о том, являются ли две строки букв английскими словами. Иногда строки представляют собой настоящие английские слова, требующие ответа «да», а иногда это не слова, требующие ответа «нет». Часть разрешенных слов были связаны семантически (например, «кошка-собака»), тогда как другие не были связаны между собой (например, «стебель хлеба»). Фишлер обнаружил, что на связанные пары слов реагировали быстрее по сравнению с несвязанными парами слов, что предполагает, что семантическая связанность может облегчить кодирование слов. [10]

Движения глаз

Отслеживание взгляда использовалось для изучения языковой обработки в Интернете. Этот метод оказал влияние на информирование о чтении. [11] Кроме того, Таненхаус и др. (1995) [12] разработали парадигму визуального мира, которая использует движения глаз для изучения обработки разговорной речи в Интернете. Эта область исследований опирается на гипотезу о том, что движения глаз тесно связаны с текущим фокусом внимания.

Нейровизуализация и вызванные потенциалы

Развитие неинвазивных методов открывает множество возможностей для изучения мозговых основ понимания языка. Общие примеры включают позитронно-эмиссионную томографию (ПЭТ), функциональную магнитно-резонансную томографию (фМРТ), потенциалы, связанные с событиями (ERP) в электроэнцефалографии (ЭЭГ) и магнитоэнцефалографии (МЭГ), а также транскраниальную магнитную стимуляцию (ТМС). Эти методы различаются своим пространственным и временным разрешением (фМРТ имеет разрешение в несколько тысяч нейронов на пиксель, а ERP имеет миллисекундную точность), и каждый тип методологии имеет ряд преимуществ и недостатков для изучения конкретной проблемы понимания языка.

Компьютерное моделирование

Компьютерное моделирование — еще один способ изучения понимания языка. Модели, например модели, созданные в нейронных сетях , особенно полезны, поскольку они требуют от теоретиков четкости своих гипотез и потому что их можно использовать для создания точных предсказаний для теоретических моделей, которые настолько сложны, что делают дискурсивный анализ ненадежным. Классическим примером компьютерного моделирования в языковых исследованиях является модель восприятия речи TRACE Макклелланда и Элмана . [13] Модель обработки предложений можно найти в «рациональном» анализаторе обобщенного левого угла Хейла (2011). [14] Эта модель выводит эффекты садовых дорожек, а также явления локальной когерентности. Компьютерное моделирование также может помочь связать обработку предложений с другими функциями языка. Например, одна модель эффектов ERP при обработке предложений (например, N400 и P600) утверждает, что эти явления возникают в результате процессов обучения, которые поддерживают овладение языком и лингвистическую адаптацию. [15]

Смотрите также

Примечания

  1. ^ Альтманн, Джерри (апрель 1998 г.). «Неоднозначность в обработке предложений». Тенденции в когнитивных науках . 2 (4): 146–151. дои : 10.1016/s1364-6613(98)01153-x. PMID  21227111. S2CID  12113211.
  2. ^ Хиллерт, Д., изд. (1998). Обработка предложений: межлингвистическая перспектива. Синтаксис и семантика 31 . Сан-Диего: Академическая пресса . п. 464. ИСБН 978-0126135312.
  3. ^ Фридеричи, Анжела (1 февраля 2002 г.). «К нейронной основе обработки слуховых предложений». Тенденции в когнитивных науках . 6 (2): 78–84. дои : 10.1016/S1364-6613(00)01839-8 . hdl : 11858/00-001M-0000-0010-E573-8 . ПМИД  15866191.
  4. ^ Абрахамс, ВК; Роуз, ПК (18 июля 1975 г.). «Восприятие предложения как интерактивный параллельный процесс». Наука . 189 (4198): 226–228. Бибкод : 1975Sci...189..226M. дои : 10.1126/science.189.4198.226. PMID  17733889. S2CID  30410322.
  5. ^ Макдональд, Перлмуттер и Зайденберг, 1994).
  6. ^ Макдональд, MC; Перлмуттер, М.; Зайденберг, М. (1994). «Лексическая природа разрешения неоднозначности». Психологический обзор . 101 (4): 676–703. дои : 10.1037/0033-295x.101.4.676. PMID  7984711. S2CID  15560738.
  7. ^ Зайденберг, Марк С.; Дж. Л. Макклелланд (1989). «Распределенная модель развития распознавания и именования слов». Психологический обзор . 96 (4): 523–568. CiteSeerX 10.1.1.127.3083 . дои : 10.1037/0033-295X.96.4.523. ПМИД  2798649. 
  8. ^ Феррейра и др. (2009)
  9. ^ Феррейра и др. (2002)
  10. ^ Фишлер И. (1977). «Семантическая помощь без ассоциации в задаче лексического решения». Память и познание . 5 (3): 335–339. дои : 10.3758/bf03197580 . ПМИД  24202904.
  11. ^ Рейнер К. (1978). «Движения глаз при чтении и обработке информации». Психологический вестник . 85 (3): 618–660. CiteSeerX 10.1.1.294.4262 . дои : 10.1037/0033-2909.85.3.618. ПМИД  353867. 
  12. ^ Таненхаус МК; Спайви-Ноултон, MJ; Эберхард К.М.; Седиви Дж. Э. (1995). «Интеграция визуальной и языковой информации в понимании разговорной речи». Наука . 268 (5217): 1632–1634. Бибкод : 1995Sci...268.1632T. дои : 10.1126/science.7777863. PMID  7777863. S2CID  3073956.
  13. ^ Макклелланд, JL; Элман, Дж.Л. (1986). «Модель восприятия речи TRACE». Когнитивная психология . 18 (1): 1–86. дои : 10.1016/0010-0285(86)90015-0. PMID  3753912. S2CID  7428866.
  14. ^ Хейл, Джон Т. (2011). «Что сделал бы рациональный парсер». Когнитивная наука . 35 (3): 399–443. дои : 10.1111/j.1551-6709.2010.01145.x .
  15. ^ Фитц, Хартмут; Чанг, Франклин (01 июня 2019 г.). «Языковые ERP отражают обучение посредством распространения ошибок прогнозирования». Когнитивная психология . 111 : 15–52. doi :10.1016/j.cogpsych.2019.03.002. hdl : 21.11116/0000-0003-474D-8 . ISSN  0010-0285. PMID  30921626. S2CID  85501792.

Рекомендации

дальнейшее чтение