Формирование — это парадигма обусловливания, используемая в основном в экспериментальном анализе поведения . Используемый метод — дифференциальное подкрепление последовательных приближений . Он был введен Б. Ф. Скиннером [1] с голубями и распространен на собак, дельфинов, людей и другие виды. При формировании форма существующего ответа постепенно изменяется в ходе последовательных испытаний в направлении желаемого целевого поведения путем подкрепления точных сегментов поведения. Объяснение Скиннера формирования было следующим:
Сначала мы даем птице еду , когда она слегка поворачивается в направлении пятна из любой части клетки. Это увеличивает частоту такого поведения. Затем мы откладываем подкрепление до тех пор, пока не будет сделано небольшое движение в сторону пятна. Это снова изменяет общее распределение поведения, не производя новую единицу. Мы продолжаем подкреплять позиции последовательно ближе к пятну, затем подкрепляя только тогда, когда голова слегка выдвигается вперед, и, наконец, только когда клюв действительно касается пятна. ... Первоначальная вероятность ответа в его окончательной форме очень низка; в некоторых случаях она может быть даже нулевой. Таким образом, мы можем строить сложные операнты, которые в противном случае никогда бы не появились в репертуаре организма. Подкрепляя серию последовательных приближений, мы доводим редкую реакцию до очень высокой вероятности за короткое время. ... Полный акт поворота к пятну из любой точки в коробке, движения к нему, поднятия головы и удара по пятну может показаться функционально связной единицей поведения; но он создается посредством непрерывного процесса дифференцированного подкрепления из недифференцированного поведения, подобно тому, как скульптор лепит свою фигуру из куска глины. [2]
Последовательные подкрепленные приближения все более и более близки к целевому поведению, установленному тренером. По мере обучения тренер прекращает подкреплять менее точные приближения. Когда тренер прекращает подкреплять это поведение, ученик проходит через всплеск угасания, в котором он выполняет много поведений в попытке получить это подкрепление. Тренер выбирает одно из тех поведений, которое является более близким приближением к целевому поведению, и подкрепляет это выбранное поведение. [3] Тренер повторяет этот процесс с последовательными приближениями, которые становятся все ближе к целевому ответу, пока ученик не достигнет предполагаемого поведения.
Например, чтобы обучить крысу нажимать на рычаг, можно применить следующие последовательные приближения:
Тренер начинает с подкрепления всех видов поведения в первой категории, в данном случае поворота к рычагу. Когда животное регулярно выполняет эту реакцию (поворот), тренер ограничивает подкрепление реакциями во второй категории (движение к), затем третьей и так далее, продвигаясь к каждому более точному приближению по мере того, как животное узнает то, которое в данный момент подкрепляется. Таким образом, реакция постепенно приближается к желаемому поведению, пока, наконец, не установится целевая реакция (нажатие рычага). Сначала крыса, скорее всего, не нажмет на рычаг; в конце она нажимает быстро.
Формирование иногда терпит неудачу. Часто цитируемый пример — попытка Мэриан и Келлер Бреланд (учеников Б. Ф. Скиннера) сформировать свинью и енота, чтобы они клали монету в копилку, используя еду в качестве подкрепления. Вместо того чтобы научиться класть монету, свинья начала зарывать ее в землю, а енот «стирал» и тер монеты друг о друга. То есть животные обращались с монетой так же, как с продуктами, которые они готовили съесть, что называется «пищевым» поведением. В случае с енотом он смог научиться класть одну монету в коробку, чтобы получить пищевое вознаграждение, но когда условия изменились таким образом, что для получения вознаграждения требовалось две монеты, енот не смог усвоить новое, более сложное правило. После того, что можно было бы охарактеризовать как выражение разочарования, енот прибегает к базовому «пищевому» поведению, распространенному среди его вида. Эти результаты показывают ограничение когнитивной способности енота даже представить себе возможность обмена двух монет на еду, независимо от существующих обстоятельств автоформирования. С тех пор, как были зарегистрированы наблюдения Бреланда, было зарегистрировано много других примеров нетренированных реакций на естественные стимулы; во многих контекстах стимулы называются «знаковыми стимулами», а связанное с ними поведение называется «отслеживанием знаков». [4] [5]
Формирование используется при обучении оперантным реакциям у лабораторных животных и в прикладном поведенческом анализе для изменения поведения человека или животного, которое считается неадаптивным или дисфункциональным. Его также можно использовать для обучения поведению учеников, которые отказываются выполнять целевое поведение или испытывают трудности с его достижением. Эта процедура играет важную роль в коммерческой дрессировке животных. Формирование помогает в «различении», которое является способностью различать стимулы, которые подкрепляются, и стимулы, которые не подкрепляются, и в «обобщении», которое является применением реакции, усвоенной в одной ситуации, к другой, но похожей ситуации. [6]
Формирование также может использоваться в реабилитационном центре. Например, тренировка на параллельных брусьях может приближать ходьбу с ходунками . [7] Или шейпинг может научить пациентов увеличивать время между посещениями туалета.
Автоформированием (иногда называемым отслеживанием знаков ) является любая из множества экспериментальных процедур, используемых для изучения классического обусловливания . При автоформировании, в отличие от формирования, вознаграждение приходит независимо от поведения животного. В своей простейшей форме автоформирование очень похоже на процедуру слюноотделения Павлова с использованием собак. В самой известной процедуре Павлова короткий звуковой тон надежно предшествовал подаче пищи собакам. Собаки естественным образом, безусловно, выделяли слюну ( безусловная реакция ) на пищу ( безусловный стимул ), которую им давали, но посредством обучения, условно, начинали выделять слюну ( условная реакция ) на тон ( условный стимул ), который предсказывал пищу. При автоформировании свет надежно включается незадолго до того, как животным давали пищу. Животные естественным образом, безусловно, проявляют потребительские реакции на данную им пищу, но посредством обучения, обусловленного, они стали выполнять те же самые потребительские действия, направленные на условный стимул, который предсказывает получение пищи.
Автоформирование представляет собой интересную загадку для утверждения Б. Ф. Скиннера о том, что необходимо использовать формирование как метод обучения голубя клевать ключ. В конце концов, если животное может формировать себя, зачем использовать трудоемкий процесс формирования? Автоформирование также противоречит принципу подкрепления Скиннера. Во время автоформирования еда поступает независимо от поведения животного. Если бы подкрепление имело место, случайные поведения должны были бы увеличиваться в частоте, поскольку они должны были бы вознаграждаться случайной пищей. Тем не менее, клевание ключа надежно развивается у голубей, [8] даже если это поведение никогда не вознаграждалось.
Но самое ясное доказательство того, что самоформирование находится под контролем Павлова, а не Скиннера, было обнаружено с помощью процедуры пропуска. В этой процедуре [9] еда обычно запланирована для доставки после каждого предъявления стимула (часто вспышки света), за исключением случаев, когда животное фактически выполняет консуматорную реакцию на стимул, в этом случае еда удерживается. Здесь, если бы поведение находилось под инструментальным контролем, животное прекратило бы попытки потребить стимул, поскольку за этим поведением следует удержание пищи. Но животные упорствуют в попытках потребить условный стимул в течение тысяч попыток [10] (явление, известное как отрицательное автоподдержание ), неспособные прекратить свою поведенческую реакцию на условный стимул, даже если это мешает им получить вознаграждение.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка )