Моторная теория восприятия речи — это гипотеза о том, что люди воспринимают произнесенные слова , определяя жесты речевого тракта , с помощью которых они произносятся, а не определяя звуковые паттерны, которые генерирует речь. [1] [2] [3] [4] [5] Первоначально утверждалось, что восприятие речи осуществляется через специализированный модуль , который является врожденным и специфичным для человека. Хотя идея модуля была уточнена в более поздних версиях теории, [5] идея остается в том, что роль речевой моторной системы заключается не только в создании речевых артикуляций, но и в их обнаружении.
Гипотеза берет свое начало в исследовании, в котором использовалось воспроизведение шаблонов для создания читающих машин для слепых , которые заменяли бы звуки орфографическими буквами. [6] Это привело к тщательному изучению того, как произносимые звуки соответствуют их акустической спектрограмме как последовательности слуховых звуков. Было обнаружено, что последовательные согласные и гласные накладываются друг на друга во времени (явление, известное как коартикуляция ). [7] [8] [9] Это предполагает, что речь не воспринимается как акустический «алфавит» или «шифр», а как «код» перекрывающихся речевых жестов.
Ассоциативный подход
Первоначально теория была ассоциативной: младенцы подражают слышимой ими речи, и это приводит к поведенческим ассоциациям между артикуляцией и ее сенсорными последствиями. Позже эта явная мимикрия была бы закорочена и стала бы восприятием речи. [8] Однако этот аспект теории был отброшен с открытием того, что доязыковые младенцы уже могли обнаруживать большинство фонетических контрастов, используемых для разделения различных звуков речи. [1]
Когнитивистский подход
Бихевиористский подход был заменен на когнитивистский , в котором был речевой модуль . [1] Модуль обнаруживал речь в терминах скрытых дистальных объектов, а не на проксимальном или непосредственном уровне их ввода. Доказательством этого стали результаты исследований, показавшие, что обработка речи была особенной, такой как дуплексное восприятие . [10]
Изменение дистальных объектов
Первоначально предполагалось, что восприятие речи связано с речевыми объектами, которые одновременно
инвариантные движения речевых артикуляторов [8]
инвариантные двигательные команды, посылаемые мышцам для приведения в движение артикуляторов голосового тракта [11]
Позднее это было пересмотрено, чтобы включить фонетические жесты вместо двигательных команд, [1] а затем жесты, подразумеваемые говорящим на предречевом, лингвистическом уровне, а не фактические движения. [12]
Современная редакция
Утверждение о том, что «речь является чем-то особенным», было отклонено [5] , поскольку было обнаружено, что восприятие речи может происходить и для неречевых звуков (например, хлопанье дверьми для дуплексного восприятия ). [13]
Зеркальные нейроны
Открытие зеркальных нейронов привело к возобновлению интереса к моторной теории восприятия речи, и эта теория до сих пор имеет своих сторонников [5] , хотя есть и критики. [14]
Поддерживать
Неслуховая информация о жестах
Если речь определяется с точки зрения того, как она физически создается, то неслуховая информация должна быть включена в речевые восприятия , даже если она все еще субъективно воспринимается как «звуки». Это, по сути, так и есть.
Эффект МакГерка показывает, что наблюдение за производством произнесенного слога , который отличается от слухового сигнала, синхронизированного с ним, влияет на восприятие слухового сигнала. Другими словами, если кто-то слышит «ба», но видит видео, на котором кто-то произносит «га», то то, что он слышит, отличается — некоторые люди считают, что слышат «да».
Людям легче слышать речь в шуме , если они видят говорящего. [15]
Люди лучше слышат слоги, когда их произношение можно ощутить тактильно . [16]
Категорическое восприятие
Используя синтезатор речи , звуки речи могут варьироваться вместо артикуляции вдоль континуума от /bɑ/ до /dɑ/ до /ɡɑ/ или во времени начала голоса на континууме от /dɑ/ до /tɑ/ (например). Когда слушателей просят различить два разных звука, они воспринимают звуки как принадлежащие к дискретным категориям, хотя звуки непрерывно изменяются. Другими словами, 10 звуков (со звуком на одном конце /dɑ/ и звуком на другом конце /tɑ/ , а те, что посередине, изменяются по шкале) могут акустически отличаться друг от друга, но слушатель услышит их все как /dɑ/ или /tɑ/ . Аналогично, английская согласная /d/ может различаться по своим акустическим деталям в разных фонетических контекстах ( например, /d/ в /du/ технически звучит не так же, как в /di/ ), но все /d/ , воспринимаемые слушателем, попадают в одну категорию (звонкий альвеолярный взрывной согласный), и это потому, что «лингвистические представления являются абстрактными, каноническими, фонетическими сегментами или жестами, которые лежат в основе этих сегментов». [17] Это говорит о том, что люди идентифицируют речь с помощью категориального восприятия , и, таким образом, специализированный модуль, такой как предложенный моторной теорией восприятия речи, может быть на правильном пути. [18]
Имитация речи
Если люди могут слышать жесты в речи, то имитация речи должна быть очень быстрой, как в случае повторения слов, которые слышны в наушниках, как при имитации речи . [19] Люди могут повторять услышанные слоги быстрее, чем они могли бы их произнести в обычном режиме. [20]
Речевое производство
Слушание речи активирует мышцы голосового тракта [21] , а также моторную кору [22] и премоторную кору [23] . Интеграция слухового и визуального входного сигнала в восприятие речи также задействует эти области. [24]
Нарушение премоторной коры нарушает восприятие речевых единиц, таких как взрывные согласные . [25]
Активация двигательных зон происходит с помощью фонематических признаков, которые связаны с артикуляторами голосовых дорожек, создающими речевые жесты. [26]
Восприятие звука речи облегчается за счет упреждающей стимуляции двигательного представительства артикуляторов, ответственных за его произношение. [27]
Слуховая и двигательная корковая связь ограничена определенным диапазоном частоты нейронной активности. [28]
Сетка восприятия-действия
Существуют доказательства того, что восприятие и производство, как правило, сопряжены в двигательной системе. Это подтверждается существованием зеркальных нейронов , которые активируются как при видении (или услышании) действия, так и при его выполнении. [29] Другим источником доказательств является общая теория кодирования между представлениями, используемыми для восприятия и действия. [30]
Критика
Моторная теория восприятия речи не получила широкого распространения в области восприятия речи, хотя она более популярна в других областях, таких как теоретическая лингвистика . Как отметили трое ее сторонников, «у нее мало сторонников в области восприятия речи, и многие авторы цитируют ее в первую очередь для того, чтобы предложить критические комментарии». [5] стр. 361 Существует несколько критических замечаний по ее поводу. [31] [32]
Несколько источников
На восприятие речи влияют непроизводственные источники информации, такие как контекст. Отдельные слова трудно понять изолированно, но легко, когда слышишь их в контексте предложения. Поэтому кажется, что восприятие речи использует несколько источников, которые оптимальным образом интегрированы вместе. [31]
Производство
Моторная теория восприятия речи предсказывает, что речевые двигательные способности младенцев предсказывают их способности восприятия речи, но на самом деле все наоборот. [33] Она также предсказывает, что дефекты в производстве речи ухудшат восприятие речи, но этого не происходит. [34] Однако это касается только первой и уже вытесненной бихевиористской версии теории, в которой младенцы должны были изучать все модели производства-восприятия путем подражания в раннем детстве. Это больше не является общепринятым взглядом теоретиков моторной речи.
Речевой модуль
Несколько источников доказательств существования специализированного речевого модуля не подтвердились.
Эффект МакГерка может быть достигнут и с помощью нелингвистических стимулов, например, показав кому-то видеозапись подпрыгивающего баскетбольного мяча, но при этом воспроизведя звук подпрыгивающего мяча для пинг-понга. [ необходима цитата ]
Что касается категориального восприятия , слушатели могут быть чувствительны к акустическим различиям в пределах отдельных фонетических категорий.
В результате эта часть теории была отвергнута некоторыми исследователями. [5]
Сублексические задачи
Доказательства, представленные в пользу моторной теории восприятия речи, ограничиваются такими задачами, как различение слогов, которые используют речевые единицы, а не полные произнесенные слова или произнесенные предложения. В результате, «восприятие речи иногда интерпретируется как относящееся к восприятию речи на сублексическом уровне. Однако, конечной целью этих исследований, по-видимому, является понимание нейронных процессов, поддерживающих способность обрабатывать звуки речи в экологически обоснованных условиях, то есть в ситуациях, в которых успешная обработка звуков речи в конечном итоге приводит к контакту с ментальным лексиконом и слуховым пониманием». [35] Однако это создает проблему «слабой связи с их неявной целью исследования, распознаванием речи». [35]
Птицы
Было высказано предположение, что птицы также слышат пение друг друга по вокальным жестам. [36]
^ Либерман, AM; Уэйлен, DH (2000). «О связи речи с языком». Тенденции в когнитивных науках . 4 (5): 187–196. doi :10.1016/S1364-6613(00)01471-6. PMID 10782105. S2CID 12252728.
^ abcdefg Галантуччи, Б.; Фаулер, Калифорния; Терви, М. Т. (2006). «Обзор моторной теории восприятия речи». Psychonomic Bulletin & Review . 13 (3): 361–377. doi :10.3758/bf03193857. PMC 2746041. PMID 17048719 .
^ Либерман, AM (1996). Речь: Специальный код. Кембридж, Массачусетс: MIT Press. ISBN 978-0-262-12192-7
^ Либерман, AM; Делатр, P.; Купер, FS (1952). «Роль выбранных стимульных переменных в восприятии глухих смычных согласных». Американский журнал психологии . 65 (4): 497–516. doi :10.2307/1418032. JSTOR 1418032. PMID 12996688.
^ abc Liberman, AM; Delattre, PC; Cooper, FS; Gerstman, LJ (1954). «Роль переходов согласный-гласный в восприятии смычных и носовых согласных». Psychological Monographs: General and Applied . 68 (8): 1–13. doi :10.1037/h0093673.PDF Архивировано 2016-03-03 на Wayback Machine
^ Фаулер, CA; Зальцман, E. (1993). «Координация и коартикуляция в речеобразовании». Язык и речь . 36 (ч. 2-3) (2–3): 171–195. doi :10.1177/002383099303600304. PMID 8277807. S2CID 7199908.PDF
^ Либерман, AM; Айзенберг, Д.; Ракерд, Б. (1981). «Дуплексное восприятие сигналов для смычных согласных: доказательства фонетического режима». Восприятие и психофизика . 30 (2): 133–143. doi : 10.3758/bf03204471 . PMID 7301513.
^ Либерман, AM (1970). "Грамматики речи и языка" (PDF) . Когнитивная психология . 1 (4): 301–323. doi :10.1016/0010-0285(70)90018-6. Архивировано из оригинала (PDF) 2015-12-31 . Получено 2009-06-02 .
^ ab Fowler, CA; Rosenblum, LD (1990). «Двойное восприятие: сравнение односложных слов и хлопающих дверей». Журнал экспериментальной психологии. Человеческое восприятие и производительность . 16 (4): 742–754. doi :10.1037/0096-1523.16.4.742. PMID 2148589.
^ Массаро, Д. В.; Чен, Т. Х. (2008). «Пересмотр моторной теории восприятия речи». Psychonomic Bulletin & Review . 15 (2): 453–457, обсуждение 457–62. doi : 10.3758/pbr.15.2.453. PMID 18488668. S2CID 9266946.
^ Маклеод, А.; Саммерфилд, К. (1987). «Количественная оценка вклада зрения в восприятие речи в шуме». British Journal of Audiology . 21 (2): 131–141. doi :10.3109/03005368709077786. PMID 3594015.
^ Фаулер, CA; Декле, DJ (1991). «Слушание глазами и руками: кросс-модальный вклад в восприятие речи». Журнал экспериментальной психологии. Человеческое восприятие и производительность . 17 (3): 816–828. doi :10.1037/0096-1523.17.3.816. PMID 1834793.
^ Nygaard LC, Pisoni DB (1995). "Восприятие речи: новые направления в исследованиях и теории". В JL Miller, PD Eimas (ред.). Справочник по восприятию и познанию: речь, язык и коммуникация . Сан-Диего: Academic Press. ISBN978-0-12-497770-9.
^ Либерман, AM; Харрис, KS; Хоффман, HS; Гриффит, BC (1957). «Распознавание звуков речи в пределах и за пределами границ фонем». Журнал экспериментальной психологии . 54 (5): 358–368. doi :10.1037/h0044417. PMID 13481283. S2CID 10117886.
^ Марслен-Уилсон, В. (1973). «Лингвистическая структура и речевое затенение при очень коротких задержках». Nature . 244 (5417): 522–523. Bibcode :1973Natur.244..522M. doi :10.1038/244522a0. PMID 4621131. S2CID 4220775.
^ Портер-младший, Р. Дж.; Любкер, Дж. Ф. (1980). «Быстрое воспроизведение последовательностей гласный-гласный: доказательства быстрой и прямой акустико-моторной связи в речи». Журнал исследований речи и слуха . 23 (3): 593–602. doi :10.1044/jshr.2303.593. PMID 7421161.
^ Fadiga, L.; Craighero, L.; Buccino, G.; Rizzolatti, G. (2002). «Прослушивание речи специфически модулирует возбудимость мышц языка: исследование TMS». Европейский журнал нейронауки . 15 (2): 399–402. CiteSeerX 10.1.1.169.4261 . doi :10.1046/j.0953-816x.2001.01874.x. PMID 11849307. S2CID 16504172.
^ Уоткинс, К. Э.; Страфелла, А. П.; Паус, Т. (2003). «Видение и слушание речи возбуждает двигательную систему, участвующую в речеобразовании». Neuropsychologia . 41 (8): 989–994. doi :10.1016/s0028-3932(02)00316-0. PMID 12667534. S2CID 518384.
^ Уилсон, С.М.; Сайгин, АЭП; Серено, Мичиган; Якобони, М. (2004). «Прослушивание речи активирует двигательные области, участвующие в речеобразовании». Природная неврология . 7 (7): 701–702. дои : 10.1038/nn1263. PMID 15184903. S2CID 8080063.
^ Скиппер, JI; Ван Вассенхов, V.; Нусбаум, HC; Смолл, SL (2006). «Слышать губы и видеть голоса: как корковые области, поддерживающие производство речи, опосредуют аудиовизуальное восприятие речи». Cerebral Cortex . 17 (10): 2387–2399. doi :10.1093/cercor/bhl147. PMC 2896890 . PMID 17218482.
^ Meister, IG; Wilson, SM; Deblieck, C.; Wu, AD; Iacoboni, M. (2007). «Важнейшая роль премоторной коры в восприятии речи». Current Biology . 17 (19): 1692–1696. doi :10.1016/j.cub.2007.08.064. PMC 5536895. PMID 17900904 .
^ Пульвермюллер, Ф.; Хасс, М.; Хериф, Ф.; Москосо дель Прадо Мартин Ф.; Хаук, О.; Штыров, Ю. (2006). «Моторная кора отображает артикуляционные особенности звуков речи». Труды Национальной академии наук . 103 (20): 7865–7870. Bibcode : 2006PNAS..103.7865P. doi : 10.1073/pnas.0509989103 . PMC 1472536. PMID 16682637 .
^ Assaneo, M. Florencia; Poeppel, David (2018). «Связь между слуховой и моторной корой ограничена скоростью: доказательства внутреннего речедвигательного ритма». Science Advances . 4 (2): eaao3842. Bibcode :2018SciA....4.3842A. doi :10.1126/sciadv.aao3842. PMC 5810610 . PMID 29441362.
^ Риццолатти, Г.; Крейгеро, Л. (2004). «Система зеркальных нейронов». Annual Review of Neuroscience . 27 : 169–192. doi :10.1146/annurev.neuro.27.070203.144230. PMID 15217330. S2CID 1729870.PDF Архивировано 30 июня 2007 г. на Wayback Machine
^ Хоммель, Б.; Мюсселер, Й.; Ашерслебен, Г.; Принц, В. (2001). «Теория кодирования событий (TEC): структура для восприятия и планирования действий». The Behavioral and Brain Sciences . 24 (5): 849–878, обсуждение 878–937. doi :10.1017/s0140525x01000103. PMID 12239891.
^ ab Massaro, DW (1997). Восприятие говорящих лиц: от восприятия речи к поведенческому принципу . Кембридж, Массачусетс: MIT Press. ISBN978-0-262-13337-1.
^ Лейн, Х. (1965). «Моторная теория восприятия речи: критический обзор». Psychological Review . 72 (4): 275–309. doi :10.1037/h0021986. PMID 14348425.
^ Tsao, FM; Liu, HM; Kuhl, PK (2004). «Восприятие речи в младенчестве предсказывает развитие языка на втором году жизни: продольное исследование». Child Development . 75 (4): 1067–84. doi :10.1111/j.1467-8624.2004.00726.x. PMID 15260865. S2CID 10954073.
^ MacNeilage, PF; Rootes, TP; Chase, RA (1967). «Производство и восприятие речи у пациента с тяжелым нарушением соместического восприятия и двигательного контроля». Журнал исследований речи и слуха . 10 (3): 449–67. doi :10.1044/jshr.1003.449. PMID 6081929.
^ ab Hickok, G.; Poeppel, D. (2007). «Кортикальная организация обработки речи». Nature Reviews Neuroscience . 8 (5): 393–402. doi :10.1038/nrn2113. PMID 17431404. S2CID 6199399.См. страницу 394
^ Уильямс, Х.; Ноттебом, Ф. (1985). «Слуховые реакции в вокальных двигательных нейронах птиц: двигательная теория восприятия песен у птиц». Science . 229 (4710): 279–282. Bibcode :1985Sci...229..279W. doi :10.1126/science.4012321. PMID 4012321.
Внешние ссылки
Haskins Laboratories Архивировано 2019-05-09 в Wayback Machine
Источник pdf-файлов по моторной теории восприятия речи Архивировано 2009-05-04 в Wayback Machine