Статистическое обучение изучению языка

Статистическое обучение — это способность людей и других животных извлекать статистические закономерности из окружающего мира, чтобы изучать окружающую среду. Хотя сейчас статистическое обучение считается обобщенным механизмом обучения, это явление было впервые выявлено при овладении языком младенцами .

Самые ранние доказательства статистических способностей к обучению получены в исследовании Дженни Сафран , Ричарда Эслина и Элиссы Ньюпорт , в котором 8-месячным младенцам предъявлялись бессмысленные потоки монотонной речи . Каждый поток состоял из четырех трехсложных « псевдослов » , которые повторялись случайным образом. После воздействия речевых потоков в течение двух минут младенцы по-разному реагировали на слух «псевдослов» в отличие от «неслов» из речевого потока, где неслова состояли из тех же слогов, которые младенцы слышали, но в другом порядке. . Это говорит о том, что младенцы способны выучить статистические отношения между слогами даже при очень ограниченном воздействии языка. То есть младенцы узнают, какие слоги всегда сочетаются друг с другом, а какие встречаются вместе сравнительно редко, что позволяет предположить, что они являются частями двух разных единиц. Считается, что этот метод обучения является одним из способов, с помощью которого дети узнают, какие группы слогов образуют отдельные слова. ^{[ нужна цитата ]}

С момента первоначального открытия роли статистического обучения в усвоении лексики тот же механизм был предложен для элементов фонологического и синтаксического усвоения, а также в нелингвистических областях. Дальнейшие исследования также показали, что статистическое обучение, вероятно, является общедоменным и даже общевидовым механизмом обучения, который происходит как для визуальной, так и для слуховой информации как у приматов , так и у неприматов.

Лексическое приобретение

Роль статистического обучения в овладении языком особенно хорошо документирована в области овладения лексикой . ^[1] Одним из важных вкладов в понимание младенцами сегментации слов из непрерывного потока речи является их способность распознавать статистические закономерности речи, слышимой в их среде. ^[1] Хотя многие факторы играют важную роль, этот конкретный механизм является мощным и может действовать в течение короткого времени. ^[1]

Оригинальные выводы

Спектрограмма говорящего мужчины, произносящего фразу «девятнадцатый век» . Нет четкого разграничения, где заканчивается одно слово и начинается следующее.

Хорошо известно, что, в отличие от письменного языка , разговорный язык не имеет четких границ между словами; Разговорная речь представляет собой непрерывный поток звуков, а не отдельные слова с паузами между ними. ^[2] Отсутствие сегментации между языковыми единицами представляет проблему для маленьких детей, изучающих язык, которые должны уметь выделять отдельные единицы из непрерывных речевых потоков, которые они слышат. ^[3] Один из предлагаемых методов решения этой проблемы детьми заключается в том, что они внимательны к статистическим закономерностям окружающего их мира. ^[2]^[3] Например, во фразе «милая малышка» дети с большей вероятностью услышат звуки « pre» и «ty» , услышанные вместе в течение всего лексического ввода вокруг них, чем звуки «ty» и «ba» вместе . . ^[3] В исследовании искусственного изучения грамматики с участием взрослых участников Саффран, Ньюпорт и Эслин обнаружили, что участники смогли определить местонахождение границ слов, основываясь только на переходных вероятностях, что позволяет предположить, что взрослые способны использовать статистические закономерности в задачах по изучению языка. ^[4] Это надежный вывод, который неоднократно повторялся. ^[1]

Чтобы определить, обладают ли маленькие дети такими же способностями, Саффран Эслин и Ньюпорт подвергали восьмимесячных младенцев искусственной грамматике. ^[3] Грамматика состояла из четырех слов, каждое из которых состояло из трех бессмысленных слогов. В ходе эксперимента младенцы слышали непрерывный речевой поток этих слов. Речь была монотонной, без каких-либо признаков (таких как паузы, интонация и т. д.) на границах слов, кроме статистических вероятностей . Внутри слова вероятность перехода двух пар слогов составляла 1,0: в слове бидаку , например, вероятность услышать слог да сразу после слога би составляла 100%. Однако между словами переходная вероятность услышать пару слогов была намного ниже: после предъявления любого данного слова (например, бидаку ) могло следовать одно из трех слов (в данном случае падоти , голабу или тупиро ), поэтому Вероятность услышать любой слог после «ку» составляла всего 33%.

Чтобы определить, уловили ли младенцы статистическую информацию, каждому младенцу было предложено несколько представлений либо слова из искусственной грамматики, либо неслова, состоящего из тех же слогов, но представленных в случайном порядке. Младенцы, которым на этапе тестирования предлагались неслова, слушали эти слова значительно дольше, чем младенцы, которым предлагались слова из искусственной грамматики, демонстрируя предпочтение новизны этим новым несловам. Однако реализация теста также может быть связана с изучением младенцами информации в последовательном порядке, а не с фактическим изучением вероятностей перехода между словами. То есть во время теста младенцы слышали такие струны, как дапику и тиладо , которые никогда не звучали во время обучения; они могли просто узнать, что слог «ку» никогда не следует за слогом «пи» . ^[3]

Чтобы более внимательно изучить этот вопрос, Сафран Эслин и Ньюпорт провели еще одно исследование, в котором младенцы проходили такое же обучение с использованием искусственной грамматики, но затем им предлагались либо слова, либо части слов, а не слова или неслова. ^[3] Неполные слова представляли собой последовательности слогов, состоящие из последнего слога одного слова и первых двух слогов другого слова (например, купадо ). Поскольку части слов были услышаны в то время, когда дети слушали искусственную грамматику, предпочтительное прослушивание этих частей слов указывало бы на то, что дети усваивали не только информацию о последовательном порядке, но и статистическую вероятность услышать определенные последовательности слогов. . Опять же, младенцы показали большее время прослушивания новых (неполных) слов, что указывает на то, что 8-месячные младенцы были способны извлекать эти статистические закономерности из непрерывного речевого потока.

Дальнейшие исследования

Этот результат послужил толчком для гораздо большего количества исследований роли статистического обучения в усвоении лексики и других областях (см. ^[1] ). В продолжение первоначального отчета ^[3] Эслин , Саффран и Ньюпорт обнаружили, что даже когда слова и части слов встречались в речевом потоке одинаково часто, но с разной вероятностью перехода между слогами слов и частями слов, младенцы были все еще были в состоянии обнаружить статистические закономерности и по-прежнему предпочитали слушать новые части слов, а не знакомые слова. ^[5] Это открытие является убедительным доказательством того, что младенцы способны улавливать переходные вероятности из речи, которую они слышат, а не просто осознают частоты отдельных последовательностей слогов. ^[1]

Другое последующее исследование изучало, в какой степени статистическая информация, полученная в ходе этого типа искусственного изучения грамматики, влияет на знания, которые младенцы могут уже иметь о своем родном языке . ^[6] Младенцы предпочитали слушать слова, а не части слов, тогда как в условиях бессмысленного кадра существенной разницы не было. Это открытие предполагает, что даже дети, не овладевшие языком, способны интегрировать статистические сигналы, которые они изучают в лаборатории, в свои ранее приобретенные знания языка. ^[1]^[6] Другими словами, как только младенцы приобретают некоторые лингвистические знания, они включают вновь полученную информацию в ранее приобретенные знания.

Связанный с этим вывод показывает, что младенцы немного старшего возраста могут приобретать как лексические, так и грамматические закономерности из одного набора входных данных ^[7] , что позволяет предположить, что они способны использовать результаты одного типа статистического обучения (сигналы, которые приводят к открытию границ слов). в качестве входных данных для второго типа (подсказки, которые приводят к открытию синтаксических закономерностей. ^[1]^[7] Во время тестирования 12-месячные дети предпочитали слушать предложения, которые имели ту же грамматическую структуру, что и искусственный язык, на котором они тестировались. Поскольку изучение грамматических закономерностей требует от младенцев умения определять границы между отдельными словами, это указывает на то, что младенцы, которые еще совсем маленькие, способны приобрести несколько уровней языковых знаний (как лексических), так и предложений, которые имели иную (неграмматическую) структуру. и синтаксический) одновременно, что указывает на то, что статистическое обучение является мощным механизмом изучения языка ^[1]^{[7] .}

Несмотря на большую роль, которую статистическое обучение, по-видимому, играет в усвоении лексики, это, вероятно, не единственный механизм, с помощью которого младенцы учатся сегментировать слова. Статистические исследования обучения обычно проводятся с использованием искусственных грамматик, которые не имеют никаких указаний на информацию о границах слов, кроме вероятностей перехода между словами. Однако в реальной речи имеется множество различных типов сигналов о границах слов, включая просодическую и фонотаксическую информацию. ^[8]

В совокупности результаты этих исследований статистического обучения при овладении языком показывают, что статистические свойства языка являются сильным сигналом, помогающим младенцам освоить свой первый язык. ^[1]

Фонологическое приобретение

Существует множество свидетельств того, что статистическое обучение является важным компонентом как выявления того, какие фонемы важны для данного языка, так и того, какие контрасты внутри фонем важны. ^[9]^[10]^[11] Наличие этих знаний важно для аспектов как восприятия речи , так и производства речи .

Распределительное обучение

С момента открытия статистических способностей младенцев к изучению слов тот же общий механизм стал изучаться и в других аспектах изучения языка. Например, хорошо известно, что младенцы могут различать фонемы многих разных языков, но со временем становятся неспособными различать фонемы, которых нет в их родном языке; ^[12] однако было неясно, как произошло такое снижение способности к распознаванию. Мэй и др. предположил, что ответственным механизмом может быть статистический механизм обучения, в котором младенцы отслеживают закономерности распределения звуков на своем родном языке. ^[12] Чтобы проверить эту идею, Maye et al. подвергали 6- и 8-месячных младенцев воздействию континуума речевых звуков, которые варьировались в зависимости от степени их озвучивания . Распределение, которое слышали младенцы, было либо бимодальным , когда чаще всего слышны звуки с обоих концов речевого континуума, либо унимодальным , когда чаще всего слышны звуки из середины распределения. Результаты показали, что младенцы обеих возрастных групп были чувствительны к распределению фонем. В ходе теста младенцы слышали либо непрерывные (повторяющиеся экземпляры жетонов 3 или 6 из континуума из 8 токенов), либо попеременные (образцы жетонов 1 и 8) воздействия определенных фонем в континууме. Младенцы, подвергшиеся воздействию бимодального распределения, дольше слушали чередующиеся пробы, чем нечередующиеся, при этом не было никакой разницы во времени прослушивания для младенцев, подвергшихся унимодальному распределению. Это открытие указывает на то, что младенцы, подвергшиеся бимодальному распределению, были способны лучше различать звуки с двух концов распределения, чем младенцы, находящиеся в унимодальном состоянии, независимо от возраста. Этот тип статистического обучения отличается от того, который используется при овладении лексикой, поскольку он требует от младенцев отслеживать частоты, а не вероятности перехода, и получил название «распределительное обучение». ^[10]

Также было обнаружено, что распределительное обучение помогает младенцам противопоставлять две фонемы, которые им изначально трудно различить. Мэй, Вайс и Эслин обнаружили, что младенцы, подвергшиеся воздействию бимодального распределения неродного контраста, который изначально было трудно различить, были лучше способны различать контраст, чем младенцы, подвергшиеся унимодальному распределению того же контраста. ^[13] Мэй и др. также обнаружили, что младенцы были способны абстрагировать особенности контраста (т. е. время начала озвучивания) и обобщать эти признаки на тот же тип контраста в другом месте артикуляции, чего не было обнаружено у взрослых.

В обзоре роли распределенного обучения в фонологическом освоении Werker et al. Обратите внимание, что распределенное обучение не может быть единственным механизмом приобретения фонетических категорий. ^[10] Однако кажется очевидным, что этот тип статистического механизма обучения может сыграть роль в развитии этого навыка, хотя исследования продолжаются. ^[10]

Эффект перцептивного магнита

Связанным с этим открытием, касающимся статистических сигналов фонологического усвоения, является явление, известное как эффект перцептивного магнита. ^[14]^[15]^[16] В этом случае прототипическая фонема родного языка человека действует как «магнит» для аналогичных фонем, которые воспринимаются как принадлежащие к той же категории, что и прототипическая фонема. В первоначальном тесте этого эффекта взрослых участников просили указать, отличается ли данный образец конкретной фонемы от референтной фонемы. ^[14] Если референтная фонема является непрототипической фонемой для этого языка, и взрослые, и 6-месячные младенцы демонстрируют меньшую генерализацию на другие звуки, чем для прототипических фонем, даже если субъективное расстояние между звуками одинаковое. . ^[14]^[16] То есть и взрослые, и младенцы с большей вероятностью заметят, что конкретная фонема отличается от референтной фонемы, если эта референтная фонема является непрототипическим примером, чем если это прототипический образец. Сами прототипы, по-видимому, обнаруживаются в процессе распределенного обучения, в ходе которого младенцы чувствительны к частотам, с которыми возникают определенные звуки, и рассматривают те, которые встречаются чаще всего, как прототипические фонемы своего языка. ^[11]

Синтаксическое приобретение

Статистическое обучающее устройство также было предложено в качестве компонента синтаксического обучения детей младшего возраста. ^[1]^[9]^[17] Ранние доказательства этого механизма были получены в основном из исследований компьютерного моделирования или анализа корпусов естественного языка. ^[18]^[19] Эти ранние исследования были сосредоточены в основном на распределении информации, а не на статистических механизмах обучения в целом. В частности, в этих ранних работах предлагалось, чтобы дети создавали шаблоны возможных структур предложений, включающие безымянные категории типов слов (т. е. существительные или глаголы, хотя дети не ставили эти ярлыки на свои категории). Считалось, что дети узнают, какие слова принадлежат к одним и тем же категориям, отслеживая схожие контексты, в которых появляются слова той же категории.

Более поздние исследования расширили эти результаты, изучив реальное поведение детей или взрослых, подвергшихся воздействию искусственных грамматик. ^[9] Эти более поздние исследования также рассматривали роль статистического обучения в более широком смысле, чем более ранние исследования, помещая свои результаты в контекст статистических механизмов обучения, которые, как считается, связаны с другими аспектами изучения языка, такими как овладение лексикой.

Результаты эксперимента

Данные серии из четырех экспериментов, проведенных Гомесом и Геркеном, показывают, что дети способны обобщать грамматические структуры менее чем за две минуты воздействия искусственной грамматики. ^[9]^[20] В первом эксперименте 11-12-месячные младенцы обучались искусственной грамматике, состоящей из бессмысленных слов с заданной грамматической структурой. В ходе теста младенцы слышали как новые грамматические, так и неграмматические предложения. Младенцы дольше ориентируются на грамматические предложения, что соответствует предыдущим исследованиям, которые показывают, что младенцы обычно дольше ориентируются на естественные примеры языка, а не на измененные примеры языка, например. ^[21] (Это предпочтение знакомства отличается от предпочтения новизны, которое обычно обнаруживается в исследованиях по изучению слов, из-за различий между лексическим и синтаксическим усвоением.) Этот результат указывает на то, что маленькие дети чувствительны к грамматической структуре языка даже после минимального воздействия. . Гомес и Геркен также обнаружили, что эта чувствительность очевидна, когда неграмматические переходы расположены в середине предложения (в отличие от первого эксперимента, в котором все ошибки происходили в начале и конце предложения), что результаты не могут быть из-за врожденного предпочтения грамматических предложений, вызванного чем-то иным, чем грамматика, и тем, что дети способны обобщать грамматические правила на новый словарный запас.

В совокупности эти исследования показывают, что младенцы способны извлекать значительный объем синтаксических знаний даже при ограниченном контакте с языком. ^[9]^[20] Дети, по-видимому, обнаруживали грамматические аномалии независимо от того, возникало ли грамматическое нарушение в тестовых предложениях в конце или в середине предложения. Кроме того, даже когда отдельные слова грамматики были изменены, младенцы все равно могли различать грамматические и неграмматические строки на этапе тестирования. Это обобщение указывает на то, что младенцы не изучали грамматические структуры, специфичные для словарного запаса, а абстрагировали общие правила этой грамматики и применяли эти правила к новому словарному запасу. Более того, во всех четырех экспериментах проверка грамматических структур происходила через пять минут после окончания первоначального воздействия искусственной грамматики, что позволяет предположить, что младенцы были способны сохранять усвоенные грамматические абстракции даже после небольшой задержки.

В аналогичном исследовании Шафран обнаружил, что взрослые и дети старшего возраста ( первоклассники и второклассники ) также были чувствительны к синтаксической информации после воздействия искусственного языка, который не имел никаких признаков структуры фразы, кроме имеющихся статистических закономерностей. ^[22] И взрослые, и дети могли выбирать предложения, которые были неграмматическими, с большей вероятностью, даже в условиях «случайного» воздействия, когда основной целью участников было выполнить другое задание, слушая речь.

Хотя количество исследований, посвященных статистическому изучению синтаксической информации, ограничено, имеющиеся данные указывают на то, что статистические механизмы обучения, вероятно, являются фактором, способствующим способности детей изучать свой язык. ^[9]^[17]

Статистическое обучение при двуязычии

Большая часть ранних работ с использованием статистических парадигм обучения была сосредоточена на способности детей или взрослых изучать один язык, ^[1] что соответствовало процессу овладения языком для одноязычных носителей или учащихся. Однако, по оценкам, примерно 60-75% людей в мире владеют двумя языками . ^[23] Совсем недавно исследователи начали изучать роль статистического обучения для тех, кто говорит более чем на одном языке. Хотя обзоров по этой теме пока нет, Вайс, Герфен и Митчел исследовали, как одновременное прослушивание нескольких искусственных языков может повлиять на способность изучать один или оба языка. ^[24] В ходе четырех экспериментов Weiss et al. обнаружили, что после изучения двух искусственных языков взрослые учащиеся способны определять границы слов на обоих языках, когда на каждом языке говорит другой говорящий. Однако когда на двух языках говорил один и тот же носитель, участники могли выучить оба языка только тогда, когда они были «конгруэнтны» — когда границы слов одного языка совпадали с границами слов другого. Когда языки были неконгруэнтны (слог, который появлялся в середине слова на одном языке, появлялся в конце слова на другом языке) и произносился одним носителем, участники могли выучить в лучшем случае один из языков. два языка. Последний эксперимент показал, что неспособность выучить неконгруэнтные языки, на которых говорят одним и тем же голосом, вызвана не совпадением слогов в языках, а различиями в границах слов.

Аналогичная работа подтверждает тот факт, что учащиеся могут выучить два набора статистических представлений при наличии дополнительного сигнала (в данном случае двух разных мужских голосов). ^[25] В их парадигме два языка были представлены последовательно, а не чередовались, как в парадигме Вайса и др., ^[24] и участники действительно выучили первый искусственный язык, с которым они познакомились, лучше, чем второй, хотя Выступление участников было выше всяких похвал для обоих языков.

Хотя статистическое обучение улучшает и укрепляет многоязычие, оказывается, что обратное неверно. В исследовании Йима и Рудоя ^[26] было обнаружено, что как одноязычные, так и двуязычные дети одинаково хорошо выполняют статистические учебные задачи.

Антович и Граф Эстес ^[27] обнаружили, что 14-месячные дети-билингвы лучше, чем монолингвы, сегментируют два разных искусственных языка, используя переходные вероятностные сигналы. Они предполагают, что двуязычная среда в раннем детстве приучает детей полагаться на статистические закономерности для сегментирования речевого потока и доступа к двум лексическим системам.

Ограничения статистического обучения

Сопоставление слов

Также был предложен статистический механизм обучения для изучения значения слов. В частности, Ю и Смит провели пару исследований, в которых взрослые видели изображения предметов и слышали бессмысленные слова. ^[28] Каждое бессмысленное слово сочеталось с определенным предметом. Всего было 18 пар слов-референтов, и каждому участнику предлагалось одновременно 2, 3 или 4 объекта, в зависимости от условия, и он слышал бессмысленное слово, связанное с одним из этих объектов. Каждая пара слово-референт предъявлялась 6 раз в ходе обучающих испытаний; после завершения обучающих испытаний участники проходили тест с принудительной альтернативой, в котором их просили выбрать правильный референт, соответствующий бессмысленному слову, которое им дали. Участники могли выбирать правильный элемент чаще, чем это могло случиться случайно, что, по мнению авторов, указывает на то, что они использовали статистические механизмы обучения для отслеживания вероятностей совместного возникновения в ходе обучающих испытаний.

Альтернативная гипотеза заключается в том, что учащиеся, выполняющие задачи такого типа, могут использовать механизм «предлагай, но проверяй», а не статистический механизм обучения. ^[29]^[30] Медина и др. и Трусвелл и др. утверждают, что, поскольку Ю и Смит отслеживали знания только в конце обучения, а не отслеживали знания от испытания к испытанию, невозможно узнать, действительно ли участники обновляли статистические вероятности совместного возникновения (и, следовательно, поддерживали несколько гипотез одновременно), или же вместо этого они формировали одну гипотезу и проверяли ее в следующем испытании. ^[28]^[29]^[30] Например, если участнику показывают изображение собаки и изображение обуви, и он слышит бессмысленное слово «ваш», он может предположить, что «ваш» относится к собаке. В следующем испытании она может увидеть изображение туфли и изображение двери и снова услышать слово «ваш» . Если статистическое обучение является механизмом, с помощью которого изучаются сопоставления слов, то участник с большей вероятностью выберет изображение обуви, чем двери, поскольку обувь появлялась бы в сочетании со словом «ваш» в 100% случаев. Однако, если участники просто формируют одну гипотезу, они могут не вспомнить контекст предыдущего предъявления слова «ваш» (особенно если, как и в экспериментальных условиях, между двумя предъявлениями «ваш» проводится несколько попыток с другими словами ) и поэтому в этом втором испытании у вас будет шанс. Согласно предложенному механизму изучения слов, если участница правильно догадалась, что «ваш» имела в виду туфлю в первом испытании, ее гипотеза подтвердится в последующем испытании.

Чтобы провести различие между этими двумя возможностями, Trueswell et al. провели серию экспериментов, аналогичных тем, что провели Ю и Смит, за исключением того, что участников просили указать свой выбор отображения слова-референта в каждом испытании, и в каждом испытании было представлено только одно имя объекта (с различным количеством объектов) . ^[28]^[30] Таким образом, у участников была бы случайность, когда они были вынуждены сделать выбор в своем первом испытании. Результаты последующих испытаний показывают, что в этих экспериментах участники не использовали статистический механизм обучения, а вместо этого использовали механизм «предлагай и проверяй», имея в виду только одну потенциальную гипотезу одновременно. В частности, если участники выбрали неправильное отображение референта слова при первоначальном предъявлении бессмысленного слова (из пяти возможных вариантов), их вероятность выбрать правильное отображение референта слова в следующем испытании этого слова все еще была на уровне шанс, или 20%. Однако если участник выбрал правильное отображение референта слова при первоначальном предъявлении бессмысленного слова, вероятность выбора правильного отображения референта слова при последующем предъявлении этого слова составляла примерно 50%. Эти результаты были также воспроизведены в условиях, когда участники выбирали только между двумя альтернативами. Эти результаты позволяют предположить, что участники не помнили окружающий контекст отдельных презентаций и поэтому не использовали статистические подсказки для определения сопоставлений слов. Вместо этого участники выдвигают гипотезу относительно сопоставления референтного слова и при следующем предъявлении этого слова либо подтверждают, либо отвергают гипотезу соответственно.

В целом, эти результаты, наряду с аналогичными результатами Медины и др., указывают на то, что значения слов не могут быть изучены с помощью статистического механизма обучения в этих экспериментах, которые просят участников выдвинуть гипотезу о сопоставлении даже при первом появлении (т. е. не перекрестно). ситуативно). ^[29] Однако, когда механизм «предлагай, но проверяй» сравнивали со статистическим механизмом обучения, первый не смог воспроизвести индивидуальные траектории обучения и не подходил так же хорошо, как второй. ^[31]

Потребность в социальном взаимодействии

Кроме того, статистическое обучение само по себе не может объяснить даже те аспекты овладения языком, в которых, как было показано, оно играет большую роль. Например, Куль , Цао и Лю обнаружили, что младенцы, изучающие английский язык, которые проводили время на лабораторных занятиях с носителем китайского языка , были способны различать фонемы, которые встречаются на китайском языке, но не в английском языке, в отличие от младенцев, которые находились в контрольной группе. состояние. ^[32] Младенцы в этом контрольном состоянии приходили в лабораторию так же часто, как и младенцы в экспериментальных условиях, но им говорили только на английском языке; при более позднем тестировании они не смогли различить фонемы китайского языка. Во втором эксперименте авторы предоставили младенцам аудио- или аудиовизуальные записи разговоров говорящих на мандаринском языке и проверили способность младенцев различать фонемы мандаринского языка. В этом состоянии младенцы не различали фонемы иностранного языка. Этот вывод указывает на то, что социальное взаимодействие является необходимым компонентом изучения языка и что, даже если младенцам предоставляются необработанные данные о том, как они слышат язык, они не могут воспользоваться статистическими подсказками, присутствующими в этих данных, если они также не испытывают социальное взаимодействие. ^[11]

Общность домена

Хотя феномен статистического обучения был впервые обнаружен в контексте овладения языком, и существует множество доказательств его роли в этой цели, исследования, проведенные после первоначального открытия, показали, что статистическое обучение может быть общим навыком в области и, вероятно, не является уникальным для людей. . ^[3]^[33] Например, Саффран, Джонсон, Эслин и Ньюпорт обнаружили, что и взрослые, и младенцы были способны выучить статистические вероятности «слов», созданных путем воспроизведения различных музыкальных тонов (т. е. участники слышали музыкальные ноты D, E). и F представили вместе во время обучения и смогли распознать эти примечания как единое целое на тесте по сравнению с тремя примечаниями, которые не были предъявлены вместе). ^[34] В неслуховых областях есть свидетельства того, что люди способны усваивать статистическую визуальную информацию независимо от того, представлена ли эта информация в пространстве, например, ^[35] или во времени, например. ^[36] Доказательства статистического обучения также были обнаружены у других приматов , например, ^[37] и некоторые ограниченные способности к статистическому обучению были обнаружены даже у неприматов, таких как крысы . ^[38] В совокупности эти результаты позволяют предположить, что статистическое обучение может быть обобщенным механизмом обучения, который используется при овладении языком, а не механизмом, уникальным для способности человеческого младенца изучать свой язык(и).

Дополнительные доказательства эффективности общего статистического обучения были предложены в исследовании, проведенном на факультете психологии Корнеллского университета, посвященном визуальному статистическому обучению в младенчестве. Исследователи в этом исследовании задались вопросом, будет ли общность статистического обучения в младенчестве видна с использованием визуальной информации. После первого просмотра изображений в статистически предсказуемых шаблонах младенцы затем подвергались воздействию тех же знакомых шаблонов в дополнение к новым последовательностям тех же самых идентичных компонентов стимула. Интерес к визуальным эффектам измерялся количеством времени, в течение которого ребенок смотрел на стимулы, которые исследователи назвали «временем просмотра». Участники всех возрастов проявили больший интерес к новой последовательности по сравнению со знакомой последовательностью. Демонстрируя предпочтение новых последовательностей (которые нарушали переходную вероятность, определяющую группировку исходных стимулов), результаты исследования подтверждают вероятность общего статистического обучения в младенчестве. ^[39]