stringtranslate.com

Классическое обусловливание

Классическое обусловливание (также респондентное обусловливание и павловское обусловливание ) — это поведенческая процедура, в которой биологически мощный стимул (например, еда, дуновение воздуха в глаз, потенциальный соперник) сочетается с нейтральным стимулом (например, звук музыкального треугольника ). Термин классическое обусловливание относится к процессу автоматического, условного ответа, который сочетается с определенным стимулом. [1]

Русский физиолог Иван Павлов изучал классическое обусловливание с помощью подробных экспериментов с собаками и опубликовал экспериментальные результаты в 1897 году. При изучении пищеварения Павлов заметил, что у подопытных собак выделялась слюна, когда их кормили красным мясом. [2] Павловское обусловливание отличается от оперантного обусловливания (инструментального обусловливания), посредством которого изменяется сила произвольного поведения либо подкреплением, либо наказанием . Однако классическое обусловливание может влиять на оперантное обусловливание; классически обусловленные стимулы могут подкреплять оперантные реакции.

Классическое обусловливание является базовым поведенческим механизмом, и его нейронные субстраты сейчас начинают пониматься. Хотя иногда бывает трудно отличить классическое обусловливание от других форм ассоциативного обучения (например, инструментального обучения и человеческой ассоциативной памяти ), ряд наблюдений различает их, особенно непредвиденные обстоятельства, посредством которых происходит обучение. [3]

Вместе с оперантным обусловливанием классическое обусловливание стало основой бихевиоризма , школы психологии , которая доминировала в середине 20-го века и до сих пор оказывает важное влияние на практику психологической терапии и изучение поведения животных. Классическое обусловливание применялось и в других областях. Например, оно может влиять на реакцию организма на психоактивные препараты , регуляцию голода, исследования нейронной основы обучения и памяти, а также на некоторые социальные явления, такие как эффект ложного консенсуса . [4]

Определение

Классическое обусловливание происходит, когда условный стимул (УС) сочетается с безусловным стимулом (БС). Обычно условный стимул является нейтральным стимулом (например, звук камертона ) , безусловный стимул является биологически сильным (например, вкус пищи), а безусловная реакция (БР) на безусловный стимул является невыученной рефлекторной реакцией (например, слюноотделение). После повторения спаривания организм проявляет условную реакцию (УР) на условный стимул, когда условный стимул предъявляется один. (Условная реакция может возникнуть только после одного сочетания.) Таким образом, в отличие от УР, УР приобретается через опыт, и он также менее постоянен, чем УР. [5]

Обычно условный ответ похож на безусловный, но иногда он совершенно другой. По этой и другим причинам большинство теоретиков обучения предполагают, что условный стимул приходит, чтобы сигнализировать или предсказывать безусловный стимул, и продолжают анализировать последствия этого сигнала. [6] Роберт А. Рескорла дал четкое резюме этого изменения в мышлении и его последствий в своей статье 1988 года «Павловское обусловливание: это не то, что вы думаете». [7] Несмотря на широкое признание, тезис Рескорлы может быть необоснованным. [8] [ weasel words ]

Классическое обусловливание отличается от оперантного или инструментального обусловливания : при классическом обусловливании поведение изменяется посредством ассоциации стимулов, как описано выше, тогда как при оперантном обусловливании поведение изменяется под воздействием эффекта, который оно производит (т. е. вознаграждение или наказание). [9]

Процедуры

Исследования Ивана Павлова по рефлекторной установке собак

Исследования Павлова

Самая известная и наиболее тщательная ранняя работа по классическому обусловливанию была сделана Иваном Павловым , хотя Эдвин Твитмайер опубликовал некоторые связанные с этим выводы годом ранее. [10] Во время своих исследований физиологии пищеварения у собак Павлов разработал процедуру, которая позволила ему изучать пищеварительные процессы животных в течение длительных периодов времени. Он перенаправил пищеварительные жидкости животных за пределы тела, где их можно было измерить.

Павлов заметил, что его собаки начинали выделять слюну в присутствии техника, который обычно их кормил, а не просто выделять слюну в присутствии еды. Павлов назвал опережающее слюноотделение собак «психической секрецией». Подвергая эти неформальные наблюдения экспериментальной проверке, Павлов предъявлял стимул (например, звук метронома ) , а затем давал собаке еду; после нескольких повторений собаки начинали выделять слюну в ответ на стимул. Павлов пришел к выводу, что если определенный стимул в окружении собаки присутствовал, когда собаке давали еду, то этот стимул мог ассоциироваться с едой и вызывать слюноотделение самостоятельно.

Терминология

В экспериментах Павлова безусловным стимулом (US) была еда, потому что ее эффекты не зависели от предыдущего опыта. Звук метронома изначально является нейтральным стимулом (NS), потому что он не вызывает слюноотделения у собак. После обусловливания звук метронома становится условным стимулом (CS) или условным стимулом; потому что его эффекты зависят от его ассоциации с пищей. [11] Аналогично, реакции собаки следуют той же схеме условного и безусловного стимула. Условный ответ (CR) является ответом на условный стимул, тогда как безусловный ответ (UR) соответствует безусловному стимулу.

Павлов сообщил много основных фактов об обусловливании; например, он обнаружил, что обучение происходит наиболее быстро, когда интервал между CS и появлением US был относительно коротким. [12]

Как отмечалось ранее, часто считается, что условный ответ является копией безусловного ответа, но Павлов отметил, что слюна, вырабатываемая CS, отличается по составу от слюны, вырабатываемой US. Фактически, CR может быть любой новой реакцией на ранее нейтральный CS, который можно четко связать с опытом условной связи CS и US. [7] [9] Также считалось, что для возникновения обусловливания необходимы повторные пары, но многие CR можно выучить с помощью одной попытки, особенно при обучении условному рефлексу страха и отвращению к вкусу .

Диаграмма, представляющая прямое обусловливание. Временной интервал увеличивается слева направо.

Прямое кондиционирование

Обучение происходит быстрее всего при прямом обусловливании. Во время прямого обусловливания начало CS предшествует началу US, чтобы сигнализировать, что US последует. [13] [14] : 69  Две распространенные формы прямого обусловливания — это задержка и следовое обусловливание.

Одновременное кондиционирование

Классические процедуры и эффекты кондиционирования

При одновременном обусловливании CS и US предъявляются и прекращаются одновременно. Например: если человек слышит звонок и в его глаз одновременно вдувают воздух, и повторяющиеся пары, подобные этой, приводят к тому, что человек моргает, когда слышит звонок, несмотря на отсутствие струи воздуха, это показывает, что произошло одновременное обусловливание.

Обусловливание второго и высшего порядка

Обусловливание второго или более высокого порядка следует двухэтапной процедуре. Сначала нейтральный стимул («CS1») поступает, чтобы сигнализировать US через прямое обусловливание. Затем второй нейтральный стимул («CS2») соединяется с первым (CS1) и начинает вызывать свой собственный условный ответ. [14] : 66  Например: Звонок может быть сопряжен с едой, пока звонок не вызовет слюноотделение. Если затем со звонком связать свет, то свет также может вызвать слюноотделение. Звонок — это CS1, а еда — это US. Свет становится CS2, как только он соединится с CS1.

Обратное обусловливание

Обратное обусловливание происходит, когда CS следует сразу за US. [13] В отличие от обычной процедуры обусловливания, в которой CS предшествует US, условный ответ, данный CS, имеет тенденцию быть тормозным. Предположительно, это происходит потому, что CS служит сигналом того, что US закончился, а не сигналом того, что US вот-вот появится. [14] : 71  Например, за струей воздуха, направленной в глаз человека, может последовать звук зуммера.

Временное обусловливание

При временном обусловливании US предъявляется через регулярные интервалы, например, каждые 10 минут. Говорят, что обусловливание происходит, когда CR имеет тенденцию происходить незадолго до каждого US. Это предполагает, что у животных есть биологические часы , которые могут служить CS. Этот метод также использовался для изучения способности к временному измерению у животных (см. Познание животных ).

Пример ниже показывает временное обусловливание, поскольку НАС, например, еда голодной мыши, просто доставляется по регулярному графику, например, каждые тридцать секунд. После достаточного воздействия мышь начнет выделять слюну непосредственно перед доставкой еды. Это делает это временным обусловливанием, поскольку может показаться, что мышь приучена к течению времени.

Процедура нулевого непредвиденного обстоятельства

В этой процедуре CS сопряжен с US, но US также происходит в другое время. Если это происходит, предсказывается, что US, вероятно, произойдет в отсутствие CS. Другими словами, CS не «предсказывает» US. В этом случае обусловливание не удается, и CS не вызывает CR. [15] Это открытие — что предсказание, а не пара CS-US является ключом к обусловливанию — значительно повлияло на последующие исследования и теорию обусловливания.

Вымирание

В процедуре угасания CS предъявляется повторно в отсутствие US. Это делается после того, как CS был обусловлен одним из вышеперечисленных методов. Когда это сделано, частота CR в конечном итоге возвращается к предтренировочным уровням. Однако угасание не устраняет эффекты предшествующего обусловливания. Это демонстрируется спонтанным восстановлением – когда происходит внезапное появление (CR) после того, как происходит угасание – и другими связанными с этим явлениями (см. «Восстановление после угасания» ниже). Эти явления можно объяснить, постулируя накопление торможения при предъявлении слабого стимула.

Наблюдаемые явления

Приобретение

Во время приобретения CS и US объединяются в пары, как описано выше. Степень обусловленности можно отслеживать с помощью тестовых испытаний. В этих тестовых испытаниях CS предъявляется отдельно, а CR измеряется. Одной пары CS-US может быть достаточно, чтобы получить CR в тесте, но обычно необходимо несколько пар, и происходит постепенное увеличение условной реакции на CS. Это повторяющееся количество испытаний постепенно увеличивает силу и/или частоту CR. Скорость обусловленности зависит от ряда факторов, таких как природа и сила как CS, так и US, предыдущий опыт и мотивационное состояние животного. [6] [9] Процесс замедляется по мере приближения к завершению. [16]

Вымирание

Если CS представлен без US, и этот процесс повторяется достаточно часто, CS в конечном итоге перестанет вызывать CR. В этот момент говорят, что CR «погашен». [6] [17]

Внешнее торможение

Внешнее торможение может наблюдаться, если сильный или незнакомый стимул предъявляется непосредственно перед КС или одновременно с ним. Это вызывает снижение условной реакции на КС.

Восстановление после вымирания

Несколько процедур приводят к восстановлению CR, который был сначала обусловлен, а затем погашен. Это иллюстрирует, что процедура погашения не устраняет эффект обусловленности. [9] Эти процедуры следующие:

Обобщение стимула

Говорят, что генерализация стимула происходит, если после того, как определенный CS начал вызывать CR, обнаруживается, что аналогичный тестовый стимул вызывает тот же CR. Обычно, чем больше тестовый стимул похож на CS, тем сильнее будет CR по отношению к тестовому стимулу. [6] И наоборот, чем больше тестовый стимул отличается от CS, тем слабее будет CR или тем больше он будет отличаться от того, что наблюдалось ранее.

Дискриминация стимулов

Наблюдается различение стимулов , когда один стимул («CS1») вызывает один CR, а другой стимул («CS2») вызывает либо другой CR, либо вообще никакого CR. Это может быть достигнуто, например, путем объединения CS1 с эффективным US и предъявления CS2 без US. [6]

Скрытое торможение

Скрытое торможение относится к наблюдению, что требуется больше времени, чтобы знакомый стимул стал КС, чем чтобы новый стимул стал КС, когда стимул сочетается с эффективным УС. [6]

Условное подавление

Это один из наиболее распространенных способов измерения силы обучения в классическом обусловливании. Типичный пример этой процедуры выглядит следующим образом: крыса сначала учится нажимать на рычаг посредством оперантного обусловливания . Затем в серии испытаний крыса подвергается воздействию CS, света или шума, а затем US, слабого электрического удара. Возникает ассоциация между CS и US, и крыса замедляет или прекращает нажатие на рычаг, когда включается CS. Скорость нажатия во время CS измеряет силу классического обусловливания; то есть, чем медленнее крыса нажимает, тем сильнее ассоциация CS и US. (Медленное нажатие указывает на условную реакцию «страха», и это пример условной эмоциональной реакции; см. раздел ниже.)

Условное торможение

Обычно используют три фазы кондиционирования.

Фаза 1

CS (CS+) сочетается с US до тех пор, пока не будут достигнуты асимптотические уровни CR.

Фаза 2

Испытания CS+/US продолжаются, но они перемежаются испытаниями, в которых CS+ сочетается со вторым CS (CS-), но не с US (т.е. испытания CS+/CS-). Обычно организмы показывают CR в испытаниях CS+/US, но перестают реагировать на испытания CS+/CS−.

Фаза 3

Блокировка

Эта форма классического обусловливания включает две фазы.

Фаза 1

CS (CS1) работает в паре с US.

Фаза 2

Соединение CS (CS1+CS2) сопряжено с US.

Тест

Проводится отдельный тест для каждого CS (CS1 и CS2). Эффект блокировки наблюдается при отсутствии условной реакции на CS2, что позволяет предположить, что первая фаза обучения заблокировала приобретение второго CS.

Теории

Источники данных

Эксперименты по теоретическим вопросам обусловливания в основном проводились на позвоночных , особенно на крысах и голубях. Однако обусловливание также изучалось на беспозвоночных , и очень важные данные о нейронной основе обусловливания были получены в ходе экспериментов на морском слизне, Aplysia . [6] Большинство соответствующих экспериментов использовали классическую процедуру обусловливания, хотя также использовались эксперименты по инструментальному (оперантному) обусловливанию , и сила классического обусловливания часто измеряется через его оперантные эффекты, как в условном подавлении (см. раздел «Феномен» выше) и автоформировании .

Теория замещения стимулов

По мнению Павлова, обусловливание не подразумевает приобретение нового поведения, а скорее тенденцию реагировать старыми способами на новые стимулы. Таким образом, он предположил, что CS просто заменяет US при вызывании рефлекторной реакции. Это объяснение называется теорией обусловливания с замещением стимула. [14] : 84  Критическая проблема теории обусловливания с замещением стимула заключается в том, что CR и UR не всегда одинаковы. Сам Павлов наблюдал, что слюна собаки, вырабатываемая как CR, отличалась по составу от той, которая вырабатывается как UR. [10] CR иногда даже противоположна UR. Например: безусловная реакция на электрошок — это увеличение частоты сердечных сокращений, тогда как CS, которая была сопряжена с электрошоком, вызывает уменьшение частоты сердечных сокращений. (Однако было высказано предположение [ кем? ] , что только когда UR не затрагивает центральную нервную систему, CR и UR являются противоположностями.)

Модель Рескорлы–Вагнера

Модель Рескорлы–Вагнера (R–W) [9] [18] является относительно простой, но мощной моделью обусловливания. Модель предсказывает ряд важных явлений, но также и не оправдывает ожиданий в важных аспектах, что приводит к ряду модификаций и альтернативных моделей. Однако, поскольку большая часть теоретических исследований обусловливания за последние 40 лет была инициирована этой моделью или реакциями на нее, модель R–W заслуживает краткого описания здесь. [19] [14] : 85 

Модель Рескорлы-Вагнера утверждает, что существует предел количества обусловленности, которое может возникнуть при сопряжении двух стимулов. Одним из определяющих факторов этого предела является природа US. Например: сочетание колокольчика с сочным стейком с большей вероятностью вызовет слюноотделение, чем сочетание колокольчика с куском сухого хлеба, а сухой хлеб, скорее всего, сработает лучше, чем кусок картона. Ключевая идея, лежащая в основе модели R–W, заключается в том, что CS сигнализирует или предсказывает US. Можно сказать, что до обусловливания субъект удивлен US. Однако после обусловливания субъект больше не удивлен, потому что CS предсказывает появление US. (Модель можно описать математически, и такие слова, как предсказывать, удивлять и ожидать, используются только для того, чтобы помочь объяснить модель.) Здесь работа модели проиллюстрирована краткими описаниями приобретения, угасания и блокировки. Модель также предсказывает ряд других явлений, см. основную статью о модели.

Уравнение

Это уравнение Рескорлы-Вагнера. Оно определяет объем обучения, который произойдет при единичном сочетании условного стимула (CS) с безусловным стимулом (US). Уравнение выше решается многократно, чтобы предсказать ход обучения в ходе множества таких испытаний.

В этой модели степень обучения измеряется тем, насколько хорошо CS предсказывает US, что задается «ассоциативной силой» CS. В уравнении V представляет текущую ассоциативную силу CS, а ∆V — изменение этой силы, которое происходит в данном испытании. ΣV — сумма сил всех стимулов, присутствующих в ситуации. λ — максимальная ассоциативная сила, которую будет поддерживать данный US; ее значение обычно устанавливается равным 1 в испытаниях, когда US присутствует, и 0, когда US отсутствует. α и β — константы, связанные с заметностью CS и скоростью обучения для данного US. То, как уравнение предсказывает различные экспериментальные результаты, объясняется в следующих разделах. Более подробную информацию см. в основной статье о модели. [14] : 85–89 

Модель R–W: приобретение

Модель R–W измеряет обусловленность, назначая «ассоциативную силу» CS и другим локальным стимулам. До того, как CS обусловлен, его ассоциативная сила равна нулю. Сочетание CS и US вызывает постепенное увеличение ассоциативной силы CS. Это увеличение определяется природой US (например, его интенсивностью). [14] : 85–89  Объем обучения, который происходит во время любого отдельного сопряжения CS-US, зависит от разницы между общими ассоциативными силами CS и других стимулов, присутствующих в ситуации (ΣV в уравнении), и максимумом, установленным US (λ в уравнении). При первом сопряжении CS и US эта разница велика, и ассоциативная сила CS резко возрастает. По мере накопления пар CS-US US становится более предсказуемым, и увеличение ассоциативной силы при каждом испытании становится все меньше и меньше. Наконец, разница между ассоциативной силой CS (плюс любая, которая может накапливаться от других стимулов) и максимальной силой достигает нуля. То есть US полностью предсказан, ассоциативная сила CS перестает расти, и обусловливание завершено.

Модель R–W: вымирание

Сравнение силы ассоциированного члена по модели RW в обучении

Ассоциативный процесс, описанный моделью R–W, также учитывает угасание (см. «процедуры» выше). Процедура угасания начинается с положительной ассоциативной силы CS, что означает, что CS предсказывает, что US произойдет. При испытании на угасание US не происходит после CS. В результате этого «неожиданного» результата ассоциативная сила CS снижается на шаг. Угасание завершается, когда сила CS достигает нуля; US не предсказывается, и US не происходит. Однако, если тот же CS предъявляется без US, но в сопровождении хорошо известного условного ингибитора (CI), то есть стимула, который предсказывает отсутствие US (в терминах RW, стимула с отрицательной ассоциативной силой), то RW предсказывает, что CS не подвергнется угасанию (его V не уменьшится в размере).

Модель R–W: блокировка

Самым важным и новым вкладом модели R–W является ее предположение о том, что обусловливание CS зависит не только от CS и его связи с US, но и от всех других стимулов, присутствующих в ситуации обусловливания. В частности, модель утверждает, что US предсказывается суммой ассоциативных сил всех стимулов, присутствующих в ситуации обусловливания. Обучение контролируется разницей между этой общей ассоциативной силой и силой, поддерживаемой US. Когда эта сумма сил достигает максимума, установленного US, обусловливание заканчивается, как только что описано. [14] : 85–89 

Объяснение феномена блокировки с точки зрения R–W иллюстрирует одно следствие только что высказанного предположения. При блокировке (см. «феномены» выше) CS1 сочетается с US до тех пор, пока не будет завершено обусловливание. Затем в дополнительных пробах на обусловливание появляется второй стимул (CS2) вместе с CS1, и за ними следует US. Наконец, CS2 тестируется и показывает, что не дает никакой реакции, потому что обучение CS2 было «заблокировано» первоначальным обучением CS1. Модель R–W объясняет это тем, что после первоначального обусловливания CS1 полностью предсказывает US. Поскольку нет никакой разницы между тем, что предсказывается, и тем, что происходит, никакого нового обучения не происходит в дополнительных пробах с CS1+CS2, поэтому CS2 позже не дает никакой реакции.

Теоретические вопросы и альтернативы модели Рескорлы–Вагнера

Одной из главных причин важности модели R–W является то, что она относительно проста и делает четкие прогнозы. Проверка этих прогнозов привела к ряду важных новых открытий и значительному повышению понимания обусловленности. Некоторая новая информация подтвердила теорию, но многое — нет, и в целом считается, что теория в лучшем случае слишком проста. Однако ни одна модель, похоже, не объясняет все явления, которые были получены в ходе экспериментов. [9] [20] Ниже приведены краткие резюме некоторых связанных теоретических вопросов. [19]

Содержание обучения

Модель R–W сводит обусловленность к ассоциации CS и US и измеряет ее одним числом, ассоциативной силой CS. Ряд экспериментальных данных указывают на то, что изучается больше, чем это. Среди них есть два явления, описанные ранее в этой статье

Роль внимания в обучении

Скрытое торможение может возникнуть из-за того, что субъект перестает фокусироваться на CS, который часто встречается до того, как он будет сопряжен с US. Фактически, изменения внимания к CS лежат в основе двух известных теорий, которые пытаются справиться с экспериментальными результатами, которые создают трудности для модели R–W. В одной из них, предложенной Николасом Макинтошем , [21] скорость обусловливания зависит от количества внимания, уделяемого CS, и это количество внимания, в свою очередь, зависит от того, насколько хорошо CS предсказывает US. Пирс и Холл предложили связанную модель, основанную на другом принципе внимания [22]. Обе модели были тщательно протестированы, и ни одна из них не объясняет всех экспериментальных результатов. Следовательно, различные авторы пытались создать гибридные модели, которые объединяют два процесса внимания. Пирс и Холл в 2010 году объединили свои идеи внимания и даже предложили возможность включения уравнения Рескорлы-Вагнера в интегрированную модель. [9]

Контекст

Как было сказано ранее, ключевая идея в обусловливании заключается в том, что CS сигнализирует или предсказывает US (см. «процедуру нулевой непредвиденности» выше). Однако, например, комната, в которой происходит обусловливание, также «предсказывает», что US может произойти. Тем не менее, комната предсказывает с гораздо меньшей уверенностью, чем сама экспериментальная CS, потому что комната также присутствует между экспериментальными испытаниями, когда US отсутствует. Роль такого контекста иллюстрируется тем фактом, что собаки в эксперименте Павлова иногда начинали выделять слюну, приближаясь к экспериментальному аппарату, прежде чем они видели или слышали какой-либо CS. [16] Такие так называемые «контекстные» стимулы всегда присутствуют, и их влияние помогает объяснить некоторые в противном случае загадочные экспериментальные результаты. Ассоциативная сила контекстных стимулов может быть введена в уравнение Рескорлы-Вагнера, и они играют важную роль в компараторных и вычислительных теориях, изложенных ниже. [9]

Теория компаратора

Чтобы узнать, что было изучено, мы должны каким-то образом измерить поведение («производительность») в тестовой ситуации. Однако, как хорошо знают студенты, производительность в тестовой ситуации не всегда является хорошей мерой того, что было изучено. Что касается обусловленности, есть доказательства того, что субъекты в эксперименте по блокированию действительно узнают что-то о «заблокированном» CS, но не могут продемонстрировать это обучение из-за способа, которым их обычно тестируют.

«Компараторные» теории обусловливания «основаны на производительности», то есть они подчеркивают то, что происходит во время теста. В частности, они рассматривают все стимулы, которые присутствуют во время тестирования, и то, как ассоциации, приобретенные этими стимулами, могут взаимодействовать. [23] [24] Чтобы несколько упростить, компараторные теории предполагают, что во время обусловливания субъект приобретает как ассоциации CS-US, так и ассоциации контекст-US. Во время теста эти ассоциации сравниваются, и реакция на CS возникает только в том случае, если ассоциация CS-US сильнее, чем ассоциация контекст-US. После того, как CS и US неоднократно сочетаются в простом приобретении, ассоциация CS-US становится сильной, а ассоциация контекст-US относительно слабой. Это означает, что CS вызывает сильную CR. В «нулевой контингентности» (см. выше) условная реакция слаба или отсутствует, потому что ассоциация контекст-US примерно такая же сильная, как ассоциация CS-US. Блокирование и другие более тонкие явления также можно объяснить с помощью компараторных теорий, хотя, опять же, они не могут объяснить всего. [9] [19]

Теория вычислений

Потребность организма предсказывать будущие события является центральной в современных теориях обусловливания. Большинство теорий используют ассоциации между стимулами для обеспечения этих предсказаний. Например: В модели R–W ассоциативная сила CS говорит нам, насколько сильно CS предсказывает US. Другой подход к предсказанию предлагается такими моделями, как предложенная Галлистелом и Гиббоном (2000, 2002). [25] [26] Здесь реакция не определяется ассоциативной силой. Вместо этого организм регистрирует время начала и окончания CS и US и использует его для расчета вероятности того, что US последует за CS. Ряд экспериментов показал, что люди и животные могут учиться определять время событий (см. Познание животных ), а модель Галлистела и Гиббона дает очень хорошие количественные соответствия различным экспериментальным данным. [6] [19] Однако недавние исследования показали, что модели, основанные на длительности, не могут объяснить некоторые эмпирические результаты так же, как ассоциативные модели. [27]

Модели на основе элементов

Модель Рескорлы-Вагнера рассматривает стимул как единое целое и представляет ассоциативную силу стимула одним числом, без записи того, как это число было достигнуто. Как отмечено выше, это затрудняет для модели учет ряда экспериментальных результатов. Большая гибкость обеспечивается предположением, что стимул внутренне представлен набором элементов, каждый из которых может переходить из одного ассоциативного состояния в другое. Например, сходство одного стимула с другим может быть представлено, если сказать, что два стимула имеют общие элементы. Эти общие элементы помогают учитывать генерализацию стимула и другие явления, которые могут зависеть от генерализации. Кроме того, разные элементы в одном наборе могут иметь разные ассоциации, и их активации и ассоциации могут меняться в разное время и с разной скоростью. Это позволяет моделям на основе элементов обрабатывать некоторые иначе необъяснимые результаты.

Модель СОП

Ярким примером элементного подхода является модель «SOP» Вагнера. [28] Модель была разработана различными способами с момента ее введения, и теперь она может в принципе объяснить очень большое разнообразие экспериментальных результатов. [9] Модель представляет любой заданный стимул с большим набором элементов. Время предъявления различных стимулов, состояние их элементов и взаимодействие между элементами определяют ход ассоциативных процессов и поведение, наблюдаемое во время экспериментов по обусловливанию.

Описание простого обусловливания в SOP иллюстрирует некоторые основные положения модели SOP. Для начала, модель предполагает, что CS и US представлены большой группой элементов. Каждый из этих стимульных элементов может находиться в одном из трех состояний:

Из элементов, представляющих один стимул в данный момент, некоторые могут находиться в состоянии A1, некоторые в состоянии A2, а некоторые в состоянии I.

Когда стимул появляется впервые, некоторые из его элементов переходят из состояния неактивности I в первичное состояние активности A1. Из состояния A1 они постепенно распадаются до A2 и, наконец, обратно в I. Активность элемента может изменяться только таким образом; в частности, элементы в A2 не могут напрямую вернуться в A1. Если элементы CS и US находятся в состоянии A1 одновременно, между двумя стимулами выучивается ассоциация. Это означает, что если позднее CS предъявляется перед US, и некоторые элементы CS входят в A1, эти элементы активируют некоторые элементы US. Однако элементы US, активированные косвенно таким образом, только усиливаются до состояния A2. (Это можно представить как CS, вызывающее воспоминание о US, которое не будет таким сильным, как настоящее.) При повторных испытаниях CS-US все больше и больше элементов ассоциируются, и все больше и больше элементов US переходят в A2, когда включается CS. Это постепенно оставляет все меньше и меньше элементов US, которые могут войти в A1, когда появляется сам US. В результате обучение замедляется и приближается к пределу. Можно сказать, что US «полностью предсказуем» или «не удивителен», потому что почти все его элементы могут войти в A2 только тогда, когда включается CS, оставляя лишь немногим возможность сформировать новые ассоциации.

Модель может объяснить результаты, которые учитываются моделью Рескорлы-Вагнера, а также ряд дополнительных результатов. Например, в отличие от большинства других моделей, SOP учитывает время. Рост и спад активации элемента позволяет модели объяснить зависящие от времени эффекты, такие как тот факт, что обусловленность сильнее всего, когда CS идет непосредственно перед US, и что когда CS идет после US («обратная обусловленность»), результатом часто является ингибирующая CS. Также объясняются многие другие более тонкие явления. [9]

В последние годы появилось несколько других мощных моделей, включающих представления элементов. Они часто включают предположение, что ассоциации включают сеть связей между «узлами», которые представляют стимулы, реакции и, возможно, один или несколько «скрытых» слоев промежуточных взаимосвязей. Такие модели вступают в контакт с текущим взрывом исследований нейронных сетей , искусственного интеллекта и машинного обучения . [ требуется цитата ]

Приложения

Нейронная основа обучения и памяти

Павлов предположил, что обусловливание включает связь между мозговыми центрами для условных и безусловных стимулов. Его физиологическое описание обусловливания было заброшено, но классическое обусловливание продолжает использоваться для изучения нейронных структур и функций, лежащих в основе обучения и памяти. Формы классического обусловливания, которые используются для этой цели, включают, среди прочего, обусловливание страха , обусловливание моргания и обусловливание сокращения ног Hermissenda crassicornis , морского слизняка. Как обусловливание страха, так и обусловливание моргания включают нейтральный стимул, часто тон, который становится парным с безусловным стимулом. В случае обусловливания моргания US является порывом воздуха, в то время как при обусловливании страха US является угрожающим или отталкивающим, таким как удар ногой.

Американский нейробиолог Дэвид А. Маккормик провел эксперименты, которые продемонстрировали, что «...отдельные области мозжечка и связанные с ним области ствола мозга содержат нейроны, которые изменяют свою активность во время обусловливания — эти области имеют решающее значение для усвоения и выполнения этой простой обучающей задачи. Похоже, что другие области мозга, включая гиппокамп , миндалевидное тело и префронтальную кору , вносят вклад в процесс обусловливания, особенно когда требования задачи становятся более сложными». [29]

Страх и условное моргание обычно включают неперекрывающиеся нейронные цепи, но имеют общие молекулярные механизмы. Обусловливание страха происходит в базолатеральной миндалине , которая получает глутаминовый вход непосредственно от таламических афферентов, а также косвенно от префронтальных проекций. Прямых проекций достаточно для отсроченного обусловливания, но в случае следового обусловливания, когда CS должен быть внутренне представлен, несмотря на отсутствие внешнего стимула, необходимы непрямые пути. Передняя поясная извилина является одним из кандидатов на промежуточное следовое обусловливание, но гиппокамп также может играть важную роль. Пресинаптическая активация протеинкиназы А и постсинаптическая активация рецепторов NMDA и ее сигнальный путь передачи необходимы для пластичности, связанной с обусловливанием. CREB также необходим для пластичности, связанной с обусловливанием , и он может вызывать нисходящий синтез белков, необходимых для этого. [30] Поскольку рецепторы NMDA активируются только после увеличения пресинаптического кальция (тем самым высвобождая блок Mg2+ ), они являются потенциальным детектором совпадений, который может опосредовать пластичность, зависящую от времени спайка . STDP ограничивает LTP ситуациями, когда CS предсказывает US, а LTD — наоборот. [31]

Поведенческая терапия

Некоторые методы лечения, связанные с классическим обусловливанием, включают терапию отвращения , систематическую десенсибилизацию и затопление .

Терапия отвращения — это тип поведенческой терапии, призванный заставить пациентов отказаться от нежелательной привычки, связывая привычку с сильным неприятным безусловным стимулом. [32] : 336  Например, лекарство может использоваться для того, чтобы связать вкус алкоголя с расстройством желудка. Систематическая десенсибилизация — это лечение фобий, при котором пациента обучают расслабляться, подвергаясь воздействию все более вызывающих беспокойство стимулов (например, злых слов). Это пример контробусловливания , направленного на то, чтобы связать пугающие стимулы с реакцией (расслаблением), которая несовместима с тревогой [32] : 136  Затопление — это форма десенсибилизации , которая пытается устранить фобии и тревоги путем повторного воздействия сильно вызывающих беспокойство стимулов до тех пор, пока отсутствие подкрепления реакции тревоги не приведет к ее исчезновению. [32] : 133  «Затопление» обычно подразумевает фактическое воздействие раздражителей, тогда как термин «имплозия» относится к воображаемому воздействию, но эти два термина иногда используются как синонимы.

Кондиционирующая терапия обычно занимает меньше времени, чем гуманистическая терапия. [33]

Условный ответ на наркотики

Стимул, который присутствует при введении или употреблении наркотика , может в конечном итоге вызвать условную физиологическую реакцию, которая имитирует эффект наркотика. Иногда это происходит с кофеином ; любители кофе могут обнаружить, что запах кофе дает им чувство бодрости. В других случаях условная реакция является компенсаторной реакцией, которая имеет тенденцию компенсировать эффекты наркотика. Например, если наркотик заставляет организм становиться менее чувствительным к боли, компенсаторная условная реакция может быть той, которая делает пользователя более чувствительным к боли. Эта компенсаторная реакция может способствовать толерантности к наркотику . Если это так, потребитель наркотиков может увеличить количество потребляемого наркотика, чтобы почувствовать его эффекты, и в конечном итоге принять очень большое количество наркотика. В этом случае может возникнуть опасная реакция передозировки, если CS отсутствует, так что условный компенсаторный эффект не происходит. Например, если наркотик всегда вводился в одном и том же помещении, стимулы, предоставляемые этим помещением, могут вызвать условный компенсаторный эффект; то реакция передозировки может возникнуть, если препарат вводится в другом месте, где отсутствуют условные раздражители. [34]

Условный голод

Сигналы, которые последовательно предшествуют приему пищи, могут стать условными стимулами для набора телесных реакций, которые подготавливают организм к еде и пищеварению . Эти рефлекторные реакции включают секрецию пищеварительных соков в желудок и секрецию определенных гормонов в кровоток, и они вызывают состояние голода. Примером условного голода является «эффект закуски». Любой сигнал, который последовательно предшествует приему пищи, например, часы, указывающие на то, что пора ужинать, может заставить людей чувствовать себя голоднее, чем до сигнала. Латеральный гипоталамус (ЛГ) участвует в инициировании приема пищи. Было показано, что нигростриарный путь , который включает черную субстанцию , латеральный гипоталамус и базальные ганглии , участвует в мотивации голода. [ необходима цитата ]

Условная эмоциональная реакция

Влияние классического обусловливания можно увидеть в эмоциональных реакциях, таких как фобия , отвращение , тошнота , гнев и сексуальное возбуждение . Распространенным примером является условная тошнота, в которой КС — это вид или запах определенной пищи, которая в прошлом приводила к безусловному расстройству желудка. Аналогично, когда КС — это вид собаки, а УС — боль от укуса, результатом может быть условный страх собак. Примером условной эмоциональной реакции является условное подавление.

Как адаптивный механизм, эмоциональное обусловливание помогает защитить индивидуума от вреда или подготовить его к важным биологическим событиям, таким как сексуальная активность. Таким образом, стимул, который произошел до сексуального взаимодействия, вызывает сексуальное возбуждение, которое готовит индивидуума к сексуальному контакту. Например, сексуальное возбуждение было обусловлено у людей путем сочетания стимула, такого как изображение банки с пенни, с просмотром эротического фильма. Аналогичные эксперименты с участием синих гурами и одомашненных перепелов показали, что такое обусловливание может увеличить количество потомства. Эти результаты показывают, что методы обусловливания могут помочь повысить показатели фертильности у бесплодных особей и исчезающих видов . [35]

Павловско-инструментальный перенос

Павловско-инструментальный перенос — это явление, которое происходит, когда условный стимул (УС, также известный как «сигнал»), который был связан с поощрительными или отталкивающими стимулами посредством классического обусловливания, изменяет мотивационную заметность и оперантное поведение . [36] [37] [38] [39] В типичном эксперименте крысе предъявляются пары звук-пища (классическое обусловливание). Отдельно крыса учится нажимать на рычаг, чтобы получить еду (оперантное обусловливание). Тестовые сессии теперь показывают, что крыса нажимает на рычаг быстрее в присутствии звука, чем в тишине, хотя звук никогда не был связан с нажатием рычага.

Предполагается, что павловско-инструментальный перенос играет роль в эффекте дифференциальных результатов , процедуре, которая усиливает оперантную дискриминацию путем объединения стимулов с определенными результатами. [ необходима цитата ]

Смотрите также

Ссылки

  1. ^ Рехман, Ибрагим; Махабади, Навид; Санвикторес, Терренс; Рехман, Чаудхри И. (2023), «Классическое обусловливание», StatPearls , Treasure Island (FL): StatPearls Publishing, PMID  29262194 , получено 18.05.2023
  2. ^ Кун, Деннис; Миттерер, Джон О. (2008). Введение в психологию: пути к разуму и поведению . Cengage Learning. стр. 220. ISBN 9780495599111.
  3. ^ МакСуини, Фрэнсис К.; Мерфи, Эрик С. (2014). Справочник Wiley Blackwell по оперантному и классическому обусловливанию . Malden. MA: John Wiley & Sons. стр. 3. ISBN 9781118468180.
  4. ^ Тарантола, Тор; Кумаран, Дхаршан; Даян, Питер; Де Мартино, Бенедетто (10.10.2017). «Предшествующие предпочтения благотворно влияют на социальное и несоциальное обучение». Nature Communications . 8 (1): 817. Bibcode : 2017NatCo...8..817T. doi : 10.1038/s41467-017-00826-8 . ISSN  2041-1723. PMC 5635122. PMID 29018195  . 
  5. ^ Черри К. «Что такое условный ответ?». About.com Guide . About.com . Архивировано из оригинала 21-01-2013 . Получено 10-02-2013 .
  6. ^ abcdefgh Шеттлворт С.Дж. (2010). Познание, эволюция и поведение (2-е изд.). Oxford University Press.
  7. ^ ab Rescorla RA (март 1988). "Павловское обусловливание. Это не то, что вы думаете" (PDF) . The American Psychologist . 43 (3): 151–60. CiteSeerX 10.1.1.156.1219 . doi :10.1037/0003-066X.43.3.151. PMID  3364852. Архивировано (PDF) из оригинала 2014-06-11 . Получено 2014-04-02 . 
  8. ^ Папини MR, Биттерман ME (июль 1990). «Роль контингентности в классическом обусловливании». Psychological Review . 97 (3): 396–403. doi :10.1037/0033-295X.97.3.396. PMID  2200077.
  9. ^ abcdefghijkl Bouton ME (2016). Обучение и поведение: современный синтез (2-е изд.). Сандерленд, Массачусетс: Sinauer.
  10. ^ ab Павлов IP (1960) [1927]. Условные рефлексы. Нью-Йорк: Dover Publications. Архивировано из оригинала 2020-09-21 . Получено 2007-05-02 .(издание 1960 года не является неизмененной переизданием перевода 1927 года, сделанного Oxford University Press)
  11. ^ Медин DL, Росс BH, Маркмен AB (2009). Когнитивная психология . С. 50–53.
  12. ^ Brink TL (2008). "Unit 6: Learning" (PDF) . Psychology: A Student Friendly Approach . стр. 97–98. Архивировано (PDF) из оригинала 2012-04-16 . Получено 2012-05-30 .
  13. ^ ab Chang RC, Stout S, Miller RR (январь 2004 г.). «Сравнение возбуждающего обратного и прямого обусловливания». The Quarterly Journal of Experimental Psychology. B, Comparative and Physiological Psychology . 57 (1): 1–23. doi :10.1080/02724990344000015. PMID  14690847. S2CID  20155918.
  14. ^ abcdefgh Chance P (2008). Обучение и поведение . Belmont/CA: Wadsworth. ISBN 978-0-495-09564-4.
  15. ^ Rescorla RA (январь 1967). «Павловское обусловливание и его надлежащие процедуры контроля» (PDF) . Psychological Review . 74 (1): 71–80. doi :10.1037/h0024109. PMID  5341445. Архивировано (PDF) из оригинала 2014-04-07 . Получено 2014-04-02 .
  16. ^ ab Schacter DL (2009). Психология. Кэтрин Вудс. стр. 267. ISBN 978-1-4292-3719-2.
  17. ^ Chan CK, Harris JA (август 2017 г.). «Исчезновение павловского обусловливания: влияние числа испытаний и истории подкрепления». Поведенческие процессы . SQAB 2016: Устойчивость и рецидив. 141 (Pt 1): 19–25. doi :10.1016/j.beproc.2017.04.017. PMID  28473250. S2CID  3483001. Архивировано из оригинала 27.06.2021 . Получено 25.05.2021 .
  18. ^ Rescorla RA, Wagner AR (1972). «Теория павловского обусловливания: вариации в эффективности подкрепления и неподкрепления». . В Black AH, Prokasy WF (ред.). Классическое обусловливание II: Текущая теория и исследования . Нью-Йорк: Appleton-Century. стр. 64–99.
  19. ^ abcd Miller R, Escobar M (2004-02-05). "Обучение: законы и модели базового обусловливания". В Pashler H, Gallistel R (ред.). Stevens' Handbook of Experimental Psychology . Vol. 3: Learning, Motivation & Emotion (3-е изд.). New York: Wiley. pp. 47–102. ISBN 978-0-471-65016-4.
  20. ^ Miller RR, Barnet RC, Grahame NJ (май 1995). «Оценка модели Рескорлы-Вагнера». Psychological Bulletin . 117 (3): 363–86. doi :10.1037/0033-2909.117.3.363. PMID  7777644.
  21. ^ Mackintosh NJ (1975). «Теория внимания: вариации в ассоциированности стимулов с подкреплением». Psychological Review . 82 (4): 276–298. CiteSeerX 10.1.1.556.1688 . doi :10.1037/h0076778. 
  22. ^ Pearce JM, Hall G (ноябрь 1980 г.). «Модель павловского обучения: различия в эффективности условных, но не безусловных стимулов». Psychological Review . 87 (6): 532–52. doi :10.1037/0033-295X.87.6.532. PMID  7443916.
  23. ^ Gibbon J, Balsam P (1981). «Распространение ассоциации во времени». В Locurto CM, Terrace HS, Gibbon J (ред.). Теория автоформирования и обусловливания . Нью-Йорк: Academic Press. С. 219–235.
  24. ^ Миллер Р. Р., Эскобар М. (август 2001 г.). «Противопоставление моделей приобретенного поведения, ориентированных на приобретение и на выполнение». Current Directions in Psychological Science . 10 (4): 141–5. doi :10.1111/1467-8721.00135. S2CID  7159340.
  25. ^ Галлистел CR, Гиббон ​​Дж (апрель 2000 г.). «Время, скорость и кондиционирование» (PDF) . Psychological Review . 107 (2): 289–344. CiteSeerX 10.1.1.407.1802 . doi :10.1037/0033-295X.107.2.289. PMID  10789198. Архивировано (PDF) из оригинала 2015-05-05 . Получено 2021-08-30 . 
  26. ^ Галлистел Р., Гиббон ​​Дж. (2002). Символические основы обусловленного поведения . Махвах, Нью-Джерси: Erlbaum.
  27. ^ Голкар А., Белландер М., Оман А. (февраль 2013 г.). «Временные свойства исчезновения страха — имеет ли значение время?». Поведенческая нейронаука . 127 (1): 59–69. doi :10.1037/a0030892. PMID  23231494.
  28. ^ Wagner AR (1981). "SOP: Модель автоматической обработки памяти в поведении животных". В Spear NE, Miller RR (ред.). Обработка информации у животных: Механизмы памяти . Hillsdale, NJ: Erlbaum. стр. 5–47. ISBN 978-1-317-75770-2.
  29. ^ Steinmetz JE (2010). «Нейронная основа классического обусловливания». Энциклопедия поведенческой нейронауки . Academic Press. стр. 313–319. ISBN 9780080453965. Архивировано из оригинала 2021-08-30 . Получено 2018-10-01 .
  30. ^ Fanselow MS, Poulos AM (февраль 2005 г.). «Нейробиология ассоциативного обучения млекопитающих». Annual Review of Psychology . 56 (1): 207–34. doi :10.1146/annurev.psych.56.091103.070213. PMID  15709934.
  31. ^ Markram H, Gerstner W, Sjöström PJ (2011). «История пластичности, зависящей от времени спайка». Frontiers in Synaptic Neuroscience . 3 : 4. doi : 10.3389/fnsyn.2011.00004 . PMC 3187646. PMID  22007168 . 
  32. ^ abc Kearney CA (январь 2011 г.). Аномальная психология и жизнь: пространственный подход .
  33. ^ McGee DL (2006). «Модификация поведения». Wellness.com, Inc. Архивировано из оригинала 24 марта 2012 года . Получено 14 февраля 2012 года .
  34. ^ Карлсон Н. Р. (2010). Психология: Наука о поведении. Нью-Джерси, США: Pearson Education Inc., стр. 599–604. ISBN 978-0-205-64524-4.
  35. ^ Карлсон НР (2010). Психология: Наука о поведении. Нью-Джерси, США: Pearson Education Inc. стр. 198–203. ISBN 978-0-205-64524-4.
  36. ^ Cartoni E, Puglisi-Allegra S, Baldassarre G (ноябрь 2013 г.). «Три принципа действия: гипотеза павловско-инструментального переноса». Frontiers in Behavioral Neuroscience . 7 : 153. doi : 10.3389/fnbeh.2013.00153 . PMC 3832805. PMID  24312025 . 
  37. ^ Geurts DE, Huys QJ, den Ouden HE, Cools R (сентябрь 2013 г.). "Aversive Pavlovian control of instrumental behavior in human" (PDF) . Journal of Cognitive Neuroscience . 25 (9): 1428–41. doi :10.1162/jocn_a_00425. PMID  23691985. S2CID  6453291. Архивировано (PDF) из оригинала 01.05.2019 . Получено 06.01.2019 .
  38. ^ Cartoni E, Balleine B, Baldassarre G (декабрь 2016 г.). «Appetitive Pavlovian-instrumental Transfer: A review» (Передача от павловского к инструментальному: обзор). Neuroscience and Biobehavioral Reviews . 71 : 829–848. doi : 10.1016/j.neubiorev.2016.09.020 . hdl : 11573/932246 . PMID  27693227. В этой статье рассматривается одна из экспериментальных парадигм, используемых для изучения эффектов сигналов, парадигма передачи от павловского к инструментальному. В этой парадигме сигналы, связанные с вознаграждениями через павловское обусловливание, изменяют мотивацию и выбор инструментальных действий. ... Предиктивные сигналы являются важной частью нашей жизни, которая постоянно влияет на наши действия и руководит ими. Услышав звук гудка, мы останавливаемся, прежде чем попытаться перейти улицу. Реклама фастфуда может вызвать у нас чувство голода и побудить нас искать определенный тип и источник пищи. В целом, сигналы могут как побуждать нас к определенному образу действий, так и останавливать нас от него. Они могут быть адаптивными (спасая нам жизнь при переходе улицы) или неадаптивными, приводя к неоптимальному выбору, например, заставляя нас есть, когда мы на самом деле не голодны (Colagiuri and Lovibond, 2015). В крайних случаях они могут даже играть роль в патологиях, таких как наркомания, когда сигналы, связанные с наркотиками, вызывают тягу и провоцируют рецидив (Belin et al., 2009).
  39. ^ Berridge KC (апрель 2012 г.). «От ошибки прогнозирования к значимости стимула: мезолимбическое вычисление мотивации вознаграждения». The European Journal of Neuroscience . 35 (7): 1124–43. doi :10.1111/j.1460-9568.2012.07990.x. PMC 3325516 . PMID  22487042. Стимулирующая значимость или «желание» — это специфическая форма павловской мотивации вознаграждения, опосредованная мезокортиколимбическими системами мозга... Стимулирующая значимость объединяет два отдельных входных фактора: (1) текущее физиологическое нейробиологическое состояние; (2) ранее усвоенные ассоциации о сигнале вознаграждения, или павловский CS ... Вызванное сигналом «желание» UCS Кратковременная встреча CS (или кратковременная встреча UCS) часто запускает импульс повышенной мотивации для получения и потребления большего количества вознаграждения UCS. Это характерная черта заметности стимула. В повседневной жизни запах еды может заставить вас внезапно почувствовать голод, хотя минуту назад вы этого не чувствовали. В экспериментах на животных нейробиологии CS для вознаграждения может вызвать более бешеный импульс увеличенных инструментальных усилий для получения этого связанного вознаграждения UCS в ситуациях, которые очищают измерение заметности стимула, например, в экспериментах по павловско-инструментальному переносу (PIT) ... Аналогичным образом, включение CS часто может стимулировать повышенное потребление вознаграждения UCS крысами или людьми по сравнению с потреблением того же UCS при отсутствии CS ... Таким образом, павловские сигналы могут вызывать импульсы повышенной мотивации для потребления своего вознаграждения UCS, возбуждая и усиливая аппетит. Однако сила мотивации никогда не заключается только в самих сигналах или их ассоциациях, поскольку мотивация, вызванная сигналами, может быть легко изменена и обращена вспять с помощью наркотиков, голода, насыщения и т. д., как обсуждается ниже. 

Дальнейшее чтение

Внешние ссылки