Укрепление

В поведенческой психологии подкрепление относится к последствиям , которые увеличивают вероятность будущего поведения организма, как правило, при наличии определенного предшествующего стимула . ^[1] Например, крысу можно обучить нажимать на рычаг, чтобы получать еду всякий раз, когда включается свет. В этом примере свет является предшествующим стимулом, нажатие на рычаг — оперантным поведением, а еда — подкреплением. Аналогично, ученик, который получает внимание и похвалу при ответе на вопрос учителя, с большей вероятностью ответит на будущие вопросы в классе. Вопрос учителя — это предшествующее, ответ ученика — это поведение, а похвала и внимание — подкрепление.

Последствия, которые приводят к аппетитному поведению, такому как субъективное «хотение» и «приязнь» (желание и удовольствие), действуют как награды или положительное подкрепление . ^[2] Существует также отрицательное подкрепление , которое подразумевает устранение нежелательного стимула. Примером отрицательного подкрепления может служить прием аспирина для облегчения головной боли.

Подкрепление является важным компонентом оперантного обусловливания и модификации поведения . Эта концепция применялась в различных практических областях, включая воспитание детей, коучинг, терапию, самопомощь, образование и управление.

Терминология

В поведенческих науках термины «позитивный» и «негативный» при использовании в их строгом техническом смысле относятся к природе действия, выполняемого обусловливателем, а не к оценке этого действия и его последствий реагирующим оперантом. «Позитивные» действия — это те, которые добавляют фактор, будь то приятный или неприятный, в окружающую среду, тогда как «негативные» действия — это те, которые удаляют или утаивают из окружающей среды фактор любого типа. В свою очередь, строгий смысл «подкрепления» относится только к обусловленности, основанной на вознаграждении; введение неприятных факторов и удаление или утаивание приятных факторов вместо этого называются «наказанием», которое при использовании в строгом смысле, таким образом, противопоставляется «подкреплению». Таким образом, «позитивное подкрепление» относится к добавлению приятного фактора, «позитивное наказание» относится к добавлению неприятного фактора, «негативное подкрепление» относится к удалению или утаиванию неприятного фактора, а «негативное наказание» относится к удалению или утаиванию приятного фактора.

Такое использование расходится с некоторыми нетехническими использованиями четырех комбинаций терминов, особенно в случае термина «отрицательное подкрепление», который часто используется для обозначения того, что технический язык описал бы как «положительное наказание», поскольку нетехнический язык интерпретирует «подкрепление» как включение и вознаграждения, и наказания, а «отрицательное» — как ссылку на оценку реагирующим оперантом вводимого фактора. Напротив, технический язык использовал бы термин «отрицательное подкрепление» для описания поощрения определенного поведения путем создания сценария, в котором присутствует или будет присутствовать неприятный фактор, но вовлечение в поведение приводит либо к избавлению от этого фактора, либо к предотвращению его возникновения, как в эксперименте Мартина Селигмана с участием собак, обучающихся избегать ударов током .

Введение

Б. Ф. Скиннер был известным и влиятельным исследователем, который сформулировал многие теоретические конструкции подкрепления и бихевиоризма . Скиннер определял подкрепители в соответствии с изменением силы реакции (скорости реакции), а не с более субъективными критериями, такими как то, что приятно или ценно для кого-то. Соответственно, действия, еда или предметы, которые считаются приятными или приятными, не обязательно могут быть подкрепляющими (потому что они не вызывают увеличения реакции, предшествующей им). Стимулы, обстановка и действия соответствуют определению подкрепителей только в том случае, если поведение, которое непосредственно предшествует потенциальному подкрепителю, увеличивается в аналогичных ситуациях в будущем; например, ребенок, который получает печенье, когда он или она его просит. Если частота «поведения запроса печенья» увеличивается, печенье можно рассматривать как подкрепляющее «поведение запроса печенья». Однако, если «поведение запроса печенья» не увеличивается, печенье не может считаться подкрепляющим.

Единственный критерий, который определяет, является ли стимул подкрепляющим, — это изменение вероятности поведения после применения этого потенциального подкрепителя. Другие теории могут фокусироваться на дополнительных факторах, таких как то, ожидал ли человек, что поведение приведет к заданному результату, но в поведенческой теории подкрепление определяется повышенной вероятностью ответа.

Изучение подкрепления дало огромное количество воспроизводимых экспериментальных результатов. Подкрепление является центральной концепцией и процедурой в специальном образовании , прикладном поведенческом анализе и экспериментальном анализе поведения и является основной концепцией в некоторых медицинских и психофармакологических моделях, в частности, в моделях зависимости , принуждения и компульсии .

История

Лабораторные исследования подкрепления обычно датируются работой Эдварда Торндайка , известного своими экспериментами с кошками, вырывающимися из коробок-головоломок. ^[6] Ряд других продолжили это исследование, в частности, Б. Ф. Скиннер, который опубликовал свою основополагающую работу по этой теме в «Поведении организмов» в 1938 году и развил это исследование во многих последующих публикациях. ^[7] В частности, Скиннер утверждал, что положительное подкрепление превосходит наказание в формировании поведения. ^[8] Хотя наказание может показаться полной противоположностью подкрепления, Скиннер утверждал, что они сильно различаются, говоря, что положительное подкрепление приводит к длительной модификации поведения (долгосрочной), тогда как наказание изменяет поведение только временно (краткосрочно) и имеет множество пагубных побочных эффектов.

Многие исследователи впоследствии расширили наше понимание подкрепления и оспорили некоторые выводы Скиннера. Например, Азрин и Хольц определили наказание как «последствие поведения, которое снижает будущую вероятность этого поведения» ^[9] , а некоторые исследования показали, что положительное подкрепление и наказание одинаково эффективны в изменении поведения. ^{[ необходима цитата ]} Исследования эффектов положительного подкрепления, отрицательного подкрепления и наказания продолжаются и сегодня, поскольку эти концепции являются основополагающими для теории обучения и применимы ко многим практическим приложениям этой теории.

Оперантное обусловливание

Термин оперантное обусловливание был введен Скиннером, чтобы указать, что в его экспериментальной парадигме организм свободен воздействовать на окружающую среду. В этой парадигме экспериментатор не может вызвать желаемую реакцию; экспериментатор ждет, пока реакция произойдет (будет испущена организмом), а затем подается потенциальное подкрепление. В классической парадигме обусловливания экспериментатор вызывает (вызывает) желаемую реакцию, предъявляя стимул, вызывающий рефлекс, безусловный стимул (UCS), который он спаривает (предшествует) с нейтральным стимулом, условным стимулом (CS).

Подкрепление — это базовый термин в оперантном обусловливании. О наказании в оперантном обусловливании см. наказание (психология) .

Положительное подкрепление

Положительное подкрепление происходит, когда желаемое событие или стимул представлены как следствие поведения, и вероятность того, что это поведение проявится в схожих условиях, увеличивается. ^[10]^{: 253} Например, если чтение книги доставляет удовольствие, то переживание удовольствия положительно подкрепляет поведение чтения интересных книг. Человек, который получает положительное подкрепление (т. е. которому нравится читать книгу), будет читать больше книг, чтобы получить больше удовольствия.

Метод высоковероятностного обучения (HPI) — это поведенческий метод лечения, основанный на идее положительного подкрепления.

Отрицательное подкрепление

Отрицательное подкрепление увеличивает частоту поведения, которое избегает или уклоняется от неприятной ситуации или стимула . ^[10]^{: 252–253} То есть, что-то неприятное уже происходит, и поведение помогает человеку избежать или избежать неприятности. В отличие от положительного подкрепления, которое предполагает добавление приятного стимула, при отрицательном подкреплении акцент делается на устранении неприятной ситуации или стимула. Например, если кто-то чувствует себя несчастным, то он может заняться поведением (например, чтением книг), чтобы уйти от неприятной ситуации (например, своих неприятных чувств). ^[10]^{: 253} Успех этого избегающего или эскапистского поведения в устранении неприятной ситуации или стимула подкрепляет поведение.

Совершение чего-либо неприятного для людей с целью предотвратить или устранить повторное проявление поведения является наказанием , а не отрицательным подкреплением. ^[10]^{: 252} Главное отличие заключается в том, что подкрепление всегда увеличивает вероятность поведения (например, переключение каналов во время скуки временно снимает скуку; следовательно, будет больше переключения каналов во время скуки), тогда как наказание снижает ее (например, похмелье является неприятным стимулом, поэтому люди учатся избегать поведения, которое привело к этому неприятному стимулу).

Вымирание

Угасание происходит, когда определенное поведение игнорируется (т. е. продолжается без последствий). Поведение исчезает со временем, когда оно постоянно не получает подкрепления. Во время преднамеренного угасания целевое поведение сначала резко возрастает (в попытке произвести ожидаемые, ранее подкрепленные эффекты), а затем со временем снижается. Ни подкрепление, ни угасание не должны быть преднамеренными, чтобы оказать влияние на поведение субъекта. Например, если ребенок читает книги, потому что это весело, то решение родителей игнорировать чтение книг не устранит положительное подкрепление (т. е. веселье), которое ребенок получает от чтения книг. Однако, если ребенок проявляет поведение, чтобы привлечь внимание родителей, то решение родителей игнорировать поведение приведет к тому, что поведение исчезнет, и ребенок найдет другое поведение, чтобы привлечь внимание родителей.

Подкрепление против наказания

Подкрепления служат для усиления поведения, тогда как наказания служат для его ослабления; таким образом, положительные подкрепления являются стимулами, которые субъект будет стремиться достичь, а отрицательные подкрепления являются стимулами, от которых субъект будет стремиться избавиться или которые необходимо прекратить. ^[11] Таблица ниже иллюстрирует добавление и вычитание стимулов (приятных или отталкивающих) по отношению к подкреплению и наказанию.

Дальнейшие идеи и концепции

Различение положительного и отрицательного подкрепления может быть сложным и не всегда необходимым. Сосредоточение на том, что удаляется или добавляется и как это влияет на поведение, может быть более полезным.
Событие, которое наказывает поведение одних, может подкрепить поведение других.
Некоторые подкрепления могут включать как положительные, так и отрицательные черты, например, наркоман принимает наркотики для дополнительной эйфории (положительное подкрепление), а также для устранения симптомов отмены (отрицательное подкрепление).
Подкрепление в деловом мире имеет важное значение для повышения производительности. Сотрудники постоянно мотивируются возможностью получить положительный стимул, например, повышение по службе или премию. Сотрудники также мотивируются отрицательным подкреплением, например, устранением неприятных задач.
Хотя отрицательное подкрепление имеет положительный эффект в краткосрочной перспективе для рабочего места (т.е. поощряет финансово выгодные действия), чрезмерная зависимость от отрицательного подкрепления препятствует способности работников действовать творчески, заинтересованно, создавая рост в долгосрочной перспективе. ^[12]

Первичные и вторичные подкрепления

Первичный подкрепитель , иногда называемый безусловным подкрепителем , — это стимул, который не требует сопряжения с другим стимулом , чтобы функционировать как подкрепитель, и, скорее всего, получил эту функцию в ходе эволюции и благодаря своей роли в выживании вида. ^[13] Примерами первичных подкрепителей являются еда, вода и секс. Некоторые первичные подкрепители, такие как определенные препараты, могут имитировать эффекты других первичных подкрепителей. Хотя эти первичные подкрепители довольно стабильны на протяжении жизни и у разных людей, подкрепляющая ценность различных первичных подкрепителей варьируется из-за множества факторов (например, генетики, опыта). Таким образом, один человек может предпочитать один тип пищи, а другой ее избегать. Или один человек может есть много еды, а другой — очень мало. Таким образом, даже если еда является первичным подкрепителем для обоих людей, ценность пищи как подкрепителя у них разная.

Вторичный подкрепитель , иногда называемый условным подкрепителем , — это стимул или ситуация, которая приобрела функцию подкрепителя после сопряжения со стимулом , который функционирует как подкрепитель. Этот стимул может быть первичным подкрепителем или другим условным подкрепителем (например, деньгами).

При попытке различить первичные и вторичные подкрепления в человеческих примерах используйте «тест пещерного человека». Если стимул представляет собой что-то, что пещерный человек естественным образом сочтет желанным (например, конфеты), то это первичное подкрепление. Если же, с другой стороны, пещерный человек не отреагирует на него (например, долларовая купюра), то это вторичное подкрепление. Как и в случае с первичными подкреплениями, организм может испытывать удовлетворение и лишение при вторичных подкреплениях.

Другие термины армирования

Обобщенный подкрепитель — это условный подкрепитель, который получил функцию подкрепления, объединившись со многими другими подкрепителями, и функционирует как подкрепитель в самых разных мотивирующих операциях . (Одним из примеров являются деньги, поскольку они объединены со многими другими подкрепителями). ^[14]^{: 83}
При выборке подкрепляющего фактора организму предъявляется потенциально подкрепляющий, но незнакомый стимул без учета какого-либо предшествующего поведения.
Социально-опосредованное подкрепление подразумевает доставку подкрепления, требующего поведения другого организма. Например, другой человек предоставляет подкрепление.
Принцип Премака — это особый случай подкрепления, разработанный Дэвидом Премаком , который утверждает, что высоко предпочитаемая деятельность может эффективно использоваться в качестве подкрепления для менее предпочитаемой деятельности. ^[14]^{: 123}
Иерархия подкрепления — это список действий, ранжирующий наиболее желательные последствия до наименее желательных, которые могут служить подкреплением. Иерархия подкрепления может использоваться для определения относительной частоты и желательности различных видов деятельности и часто применяется при применении принципа Премака. ^{[ необходима цитата ]}
Условные результаты с большей вероятностью подкрепят поведение, чем необусловленные реакции. Условные результаты напрямую связаны с причинным поведением, например, включение света зависит от нажатия переключателя. Обратите внимание, что условные результаты не являются необходимыми для демонстрации подкрепления, но воспринимаемая обусловленность может повысить обучение.
Смежные стимулы — это стимулы, тесно связанные по времени и пространству с определенным поведением. Они сокращают время, необходимое для обучения поведению, одновременно повышая его устойчивость к угасанию . ^{[ требуется цитата ]} Давать собаке кусок еды сразу после того, как она села, более смежно с поведением (и, следовательно, с большей вероятностью подкрепит его), чем задержка в подаче еды на несколько минут после поведения.
Необусловленное подкрепление относится к независимой от реакции доставке стимулов, идентифицированных как подкрепители для некоторых видов поведения данного организма. Однако это обычно влечет за собой основанную на времени доставку стимулов, идентифицированных как поддерживающие аберрантное поведение, что снижает скорость целевого поведения. ^[15] Поскольку никакое измеряемое поведение не идентифицировано как подкрепляемое, существуют разногласия вокруг использования термина необусловленное «подкрепление». ^[16]

Естественное и искусственное армирование

В своей статье 1967 года « Произвольное и естественное подкрепление » Чарльз Ферстер предложил классифицировать подкрепление на события, которые увеличивают частоту оперантного поведения как естественное следствие самого поведения, и события, которые влияют на частоту, требуя человеческого посредничества, например, в экономике жетонов , где субъекты вознаграждаются за определенное поведение терапевтом.

В 1970 году Бэр и Вольф разработали концепцию «поведенческих ловушек». ^[17] Поведенческая ловушка требует только простой реакции, чтобы попасть в нее, однако, попав в нее, ловушке невозможно сопротивляться, создавая общее изменение поведения. Именно использование поведенческой ловушки расширяет репертуар человека, подвергая его естественному подкреплению этого поведения. Поведенческие ловушки имеют четыре характеристики:

Их «приманивают» желаемыми подкреплениями, которые «заманивают» ученика в ловушку.
Для попадания в ловушку достаточно лишь не требующей больших усилий реакции, которая уже есть в репертуаре.
Взаимосвязанные обстоятельства подкрепления внутри ловушки мотивируют человека приобретать, расширять и поддерживать целевые навыки. ^[18]
Они могут оставаться эффективными в течение длительного времени, поскольку у человека наблюдается лишь незначительный эффект насыщения, если он вообще наблюдается.

Таким образом, искусственное подкрепление может использоваться для создания или развития обобщаемых навыков, в конечном итоге переходя к естественному подкреплению для поддержания или усиления поведения. Другим примером является социальная ситуация, которая обычно возникает из определенного поведения, как только оно соответствует определенному критерию.

Прерывистые графики подкрепления

Поведение не всегда подкрепляется каждый раз, когда оно проявляется, и схема подкрепления сильно влияет на то, как быстро усваивается оперантная реакция, какова ее скорость в любой момент времени и как долго она продолжается, когда подкрепление прекращается. Простейшие правила, контролирующие подкрепление, — это непрерывное подкрепление, когда каждая реакция подкрепляется, и угасание, когда никакая реакция не подкрепляется. Между этими крайностями более сложные графики подкрепления определяют правила, которые определяют, как и когда за реакцией последует подкрепление.

Конкретные графики подкрепления надежно вызывают определенные модели реакции, и эти правила применяются ко многим различным видам. Различная последовательность и предсказуемость подкрепления оказывает важное влияние на то, как работают различные графики. Многие простые и сложные графики были подробно исследованы Б. Ф. Скиннером с использованием голубей .

Простые графики

График соотношения – подкрепление зависит только от количества реакций, которые выполнил организм.
Непрерывное подкрепление (НПП) – режим подкрепления, при котором каждое появление инструментальной реакции (желаемой реакции) сопровождается подкреплением. ^[14]^{: 86}

Простые графики имеют единое правило, определяющее, когда для определенной реакции применяется определенный тип подкрепления.

Фиксированное соотношение (FR) – графики предоставляют подкрепление после каждого n- го ответа. ^[14]^{: 88} График FR 1 является синонимом графика CRF.
График переменного соотношения (VR) – подкрепление в среднем на каждый n -й ответ, но не всегда на n -й ответ. ^[14]^{: 88}
Фиксированный интервал (FI) – подкрепление через n-ное количество времени.
Переменный интервал (VI) – подкрепляется в среднем n раз, но не всегда точно n раз. ^[14]^{: 89}
Фиксированное время (FT) – Предоставляет подкрепляющий стимул в фиксированное время с момента последней доставки подкрепления, независимо от того, отреагировал ли субъект или нет. Другими словами, это необусловленный график.
Переменное время (VT) – обеспечивает подкрепление в среднем переменное время с момента последнего подкрепления, независимо от того, отреагировал ли субъект или нет.

Простые графики используются во многих процедурах дифференцированного подкрепления ^[19] :

Дифференциальное подкрепление альтернативного поведения (DRA) - процедура обусловливания, при которой нежелательная реакция уменьшается путем ее угасания или , реже, предоставления условного наказания, одновременно предоставляя подкрепление, обусловленное желательной реакцией. Примером может служить учитель, который обращается к ученику только тогда, когда тот поднимает руку, игнорируя ученика, когда он или она окликает его.
Дифференциальное подкрепление другого поведения (DRO) – также известное как процедуры обучения бездействию, инструментальная процедура обусловливания, в которой положительное подкрепление периодически предоставляется только в том случае, если участник делает что-то, отличное от целевой реакции. Примером может служить подкрепление любого действия рукой, кроме ковыряния в носу. ^[14]^{: 338}
Дифференциальное подкрепление несовместимого поведения (DRI) – используется для снижения частого поведения без наказания за него путем подкрепления несовместимой реакции. Примером может служить подкрепление хлопков для снижения ковыряния в носу
Дифференциальное подкрепление низкой скорости реагирования (DRL) – используется для поощрения низкой скорости реагирования. Это похоже на интервальный график, за исключением того, что преждевременные ответы сбрасывают время, необходимое между поведением.
Дифференциальное подкрепление высокой частоты (DRH) – используется для повышения высоких частот реагирования. Это похоже на интервальный график, за исключением того, что для получения подкрепления требуется минимальное количество ответов в интервале.

Эффекты различных типов простых графиков

Фиксированное соотношение: активность замедляется после подачи подкрепления, затем скорость реакции увеличивается до подачи следующего подкрепления (пауза после подкрепления).
Переменное соотношение: быстрая, устойчивая скорость реагирования; наиболее устойчив к угасанию .
Фиксированный интервал: реакция усиливается к концу интервала; слабая устойчивость к угасанию.
Переменный интервал: стабильные результаты активности, хорошая устойчивость к вымиранию.
Пропорциональные графики обеспечивают более высокие показатели реагирования, чем интервальные графики, когда показатели подкрепления в остальном одинаковы.
Переменные графики дают более высокие показатели и большую устойчивость к вымиранию, чем большинство фиксированных графиков. Это также известно как эффект частичного подкрепления вымирания (PREE).
График переменного соотношения обеспечивает как самую высокую скорость реагирования, так и самую высокую устойчивость к угасанию (например, поведение игроков в игровые автоматы ).
Фиксированные графики создают «паузы после подкрепления» (PRP), когда реакции на короткое время прекращаются сразу после подкрепления, хотя пауза является функцией предстоящего требования к реакции, а не предшествующего подкрепления. ^[20]
- За PRP фиксированного интервального графика часто следует «гребешковая» ускоряющаяся скорость реакции, в то время как графики с фиксированным соотношением вызывают более «угловую» реакцию.
  - Гребешок с фиксированным интервалом: модель реагирования, которая развивается при подкреплении с фиксированным интервалом; выполнение задания с фиксированным интервалом отражает точность субъекта в определении времени.
Организмы, чьи графики подкрепления «истончены» (то есть требуют больше ответов или большего ожидания перед подкреплением), могут испытывать «напряжение соотношения», если их истончить слишком быстро. Это приводит к поведению, похожему на то, что наблюдалось во время вымирания.
- Напряжение соотношения: нарушение реакции, которое происходит, когда требуемое фиксированное соотношение увеличивается слишком быстро.
- Прогон соотношения: высокая и стабильная скорость реагирования, которая завершает каждое требование соотношения. Обычно более высокое требование соотношения приводит к более длительным паузам после подкрепления.
Схемы частичного подкрепления более устойчивы к угасанию, чем схемы непрерывного подкрепления.
- Графики с пропорциями более устойчивы, чем интервальные графики, а переменные графики более устойчивы, чем фиксированные.
- Мгновенные изменения в ценности подкрепления приводят к динамическим изменениям в поведении. ^[21]

Составные графики

Составные расписания объединяют два или более различных простых расписания, используя одно и то же подкрепление для одного и того же поведения. Существует много возможностей; среди наиболее часто используемых:

Альтернативные расписания – тип составного расписания, в котором действуют два или более простых расписания, и тот из них, который выполняется первым, приводит к подкреплению. ^[22]
Конъюнктивные графики – сложный график подкрепления, в котором два или более простых графика действуют независимо друг от друга, и для подкрепления должны быть выполнены требования ко всем простым графикам.
Несколько графиков – Два или более графиков чередуются с течением времени, при этом стимул указывает, какой из них действует. Подкрепление предоставляется, если требование к ответу выполняется, пока действует график.
Смешанные расписания – Любое из двух или более расписаний может иметь место без стимула, указывающего, какое из них действует. Подкрепление предоставляется, если требование к ответу выполняется, пока действует расписание.
Одновременное применение двух графиков подкрепления
Параллельные графики – сложная процедура подкрепления, в которой участник может выбрать любой из двух или более простых графиков подкрепления, которые доступны одновременно. Организмы могут свободно переключаться между альтернативами ответа в любое время.
Concurrent-chain schedule of Armoring' – сложная процедура подкрепления, в которой участнику разрешается выбирать во время первой ссылки, какой из нескольких простых графиков подкрепления будет действовать во второй ссылке. После того, как выбор сделан, отклоненные альтернативы становятся недоступными до начала следующего испытания.
Взаимоблокирующиеся расписания – единое расписание с двумя компонентами, где прогресс в одном компоненте влияет на прогресс в другом компоненте. Например, в взаимоблокирующемся расписании FR 60 FI 120-s каждый ответ вычитает время из интервального компонента, так что каждый ответ «равноценен» удалению двух секунд из расписания FI.
Связанные расписания – подкрепление происходит после завершения двух или более последовательных расписаний, при этом стимул указывает на завершение одного расписания и начало следующего.
Тандемные графики — подкрепление происходит, когда выполнены два или более последовательных требования расписания, при этом отсутствует стимул, указывающий на то, что график был выполнен и начался следующий.
Схемы более высокого порядка — завершение одной схемы подкрепляется в соответствии со второй схемой; например, в FR2 (FI10 секунд) две последовательные схемы с фиксированным интервалом требуют завершения, прежде чем реакция будет подкреплена.

Наложенные графики

Психологический термин « наложенные графики подкрепления» относится к структуре вознаграждений, где два или более простых графика подкрепления действуют одновременно. Подкрепления могут быть положительными, отрицательными или и теми, и другими. Примером может служить человек, который приходит домой после долгого рабочего дня. Поведение, заключающееся в открытии входной двери, вознаграждается крепким поцелуем в губы супругом человека и разрывом штанов от восторженно подпрыгивающей семейной собаки. Еще одним примером наложенных графиков подкрепления является голубь в экспериментальной клетке, клюющий пуговицу. Клевки приносят бункер с зерном каждый 20-й клев и доступ к воде после каждых 200 клевков.

Наложенные графики подкрепления являются типом составного графика, который развился из первоначальной работы над простыми графиками подкрепления Б. Ф. Скиннера и его коллег (Скиннер и Ферстер, 1957). Они продемонстрировали, что подкрепления могут быть предоставлены по расписанию, и далее, что организмы ведут себя по-разному при разных графиках. Вместо того, чтобы подкрепление, такое как еда или вода, предоставлялось каждый раз как следствие некоторого поведения, подкрепление может предоставляться после более чем одного случая поведения. Например, голубю может потребоваться клюнуть кнопку переключателя десять раз, прежде чем появится еда. Это «график соотношения». Кроме того, подкрепление может предоставляться после интервала времени, прошедшего после целевого поведения. Примером является крыса, которой дают пищевую гранулу сразу после первой реакции, которая происходит через две минуты с момента последнего нажатия рычага. Это называется «интервальным графиком».

Кроме того, графики отношений могут предоставлять подкрепление после фиксированного или переменного количества поведений отдельного организма. Аналогично, интервальные графики могут предоставлять подкрепление после фиксированных или переменных интервалов времени после одного ответа организма. Индивидуальное поведение, как правило, генерирует показатели реакции, которые различаются в зависимости от того, как создан график подкрепления. Многие последующие исследования во многих лабораториях изучали влияние на поведение планирования подкреплений.

Если организму предоставляется возможность выбирать между двумя или более простыми графиками подкрепления одновременно, то структура подкрепления называется «конкурентным графиком подкрепления». Брехнер (1974, 1977) ввел концепцию наложенных графиков подкрепления в попытке создать лабораторную аналогию социальных ловушек , например, когда люди перелавливают свои рыбные запасы или вырубают свои тропические леса. Брехнер создал ситуацию, в которой простые графики подкрепления накладывались друг на друга. Другими словами, один ответ или группа ответов организма приводили к множественным последствиям. Конкурентные графики подкрепления можно рассматривать как графики «или», а наложенные графики подкрепления можно рассматривать как графики «и». Брехнер и Линдер (1981) и Брехнер (1987) расширили концепцию, чтобы описать, как наложенные графики и аналогия социальной ловушки могут быть использованы для анализа того, как энергия течет через системы .

Наложенные графики подкрепления имеют множество реальных применений в дополнение к созданию социальных ловушек . Множество различных человеческих индивидуальных и социальных ситуаций можно создать путем наложения простых графиков подкрепления. Например, человек может иметь одновременную табачную и алкогольную зависимость. Еще более сложные ситуации можно создать или смоделировать путем наложения двух или более параллельных графиков. Например, у старшеклассника может быть выбор между поступлением в Стэнфордский университет или Калифорнийский университет в Лос-Анджелесе, и в то же время выбор между службой в армии или ВВС, и одновременно выбор между работой в интернет-компании и работой в компании по разработке программного обеспечения. Это структура подкрепления из трех наложенных параллельных графиков подкрепления.

Наложенные графики подкрепления могут создавать три классические конфликтные ситуации (конфликт приближения-подхода, конфликт приближения-избегания и конфликт избегания-избегания), описанные Куртом Левином (1935), и могут операционализировать другие ситуации Левина, проанализированные его анализом силового поля . Другими примерами использования наложенных графиков подкрепления в качестве аналитического инструмента являются его применение к непредвиденным обстоятельствам контроля арендной платы (Бречнер, 2003) и проблема сброса токсичных отходов в ливневую канализацию округа Лос-Анджелес (Бречнер, 2010).

Одновременные графики

В оперантном обусловливании параллельные графики подкрепления — это графики подкрепления, которые одновременно доступны животному-субъекту или человеку-участнику, так что субъект или участник может реагировать по любому графику. Например, в двухальтернативной задаче принудительного выбора голубь в коробке Скиннера сталкивается с двумя клевками; ответы на клевки могут быть сделаны на любой из них, и пищевое подкрепление может следовать за клевком на любой из них. Графики подкрепления, организованные для клевков на двух клавишах, могут быть разными. Они могут быть независимыми или могут быть связаны так, что поведение на одном ключе влияет на вероятность подкрепления на другом.

Не обязательно, чтобы ответы на двух графиках были физически различимы. В альтернативном способе организации параллельных графиков, введенном Финдли в 1958 году, оба графика организованы на одной клавише или другом устройстве ответа, и субъект может реагировать на вторую клавишу, чтобы переключаться между графиками. В такой «параллельной» процедуре Финдли стимул (например, цвет основного ключа) сигнализирует, какой график действует.

Конкурентные расписания часто вызывают быстрое чередование ключей. Чтобы предотвратить это, обычно вводится «задержка переключения»: каждое расписание деактивируется на короткий период после того, как субъект переключается на него.

Когда оба параллельных графика являются переменными интервалами, между относительными скоростями реагирования в двух графиках и относительными скоростями подкрепления, которые они обеспечивают, обнаруживается количественная связь, известная как закон соответствия ; это впервые заметил Р. Дж. Херрнштейн в 1961 году. Закон соответствия — это правило для инструментального поведения, которое гласит, что относительная скорость реагирования на конкретную альтернативу ответа равна относительной скорости подкрепления для этой реакции (скорость поведения = скорость подкрепления). Животные и люди склонны отдавать предпочтение выбору в графиках. ^[23]

Формирование

Формирование — это подкрепление последовательных приближений к желаемому инструментальному ответу. Например, при обучении крысы нажимать на рычаг сначала подкрепляется простое поворот к рычагу. Затем подкрепляется только поворот и шаг к нему. В конце концов крыса будет подкреплена за нажатие рычага. Успешное достижение одного поведения запускает процесс формирования следующего. По мере обучения реакция становится все более похожей на желаемое поведение, причем каждое последующее поведение становится более близким к конечному поведению. ^[24]

Вмешательство формирования используется во многих ситуациях обучения, а также для людей с аутизмом и другими нарушениями развития. Когда формирование сочетается с другими основанными на фактических данных практиками, такими как Функциональное обучение коммуникации (FCT), ^[25], оно может дать положительные результаты для поведения человека. Формирование обычно использует непрерывное подкрепление, но позже ответ может быть изменен на прерывистый график подкрепления.

Формирование также используется для отказа от еды. ^[26] Отказ от еды — это когда человек испытывает частичное или полное отвращение к еде. Это может быть как минимальным, например, придирчивый едок, так и настолько серьезным, что может повлиять на здоровье человека. Формирование использовалось для достижения высокого уровня успеха в принятии пищи. ^[27]

Цепочка

Цепочка включает в себя связывание отдельных видов поведения в серию, так что последствием каждого вида поведения является как подкрепление предыдущего поведения, так и предшествующий стимул для следующего поведения. Существует много способов обучения цепочке, например, прямая цепочка (начиная с первого вида поведения в цепочке), обратная цепочка (начиная с последнего вида поведения) и полная цепочка задач (обучение каждому виду поведения в цепочке одновременно). Утренние ритуалы людей представляют собой типичную цепочку с серией видов поведения (например, принятие душа, вытирание, одевание), происходящих последовательно как хорошо усвоенная привычка.

Сложное поведение, наблюдаемое у людей с аутизмом и другими связанными с ним нарушениями, успешно контролировалось и поддерживалось в исследованиях с использованием запланированных цепочечных подкреплений. ^[28] Обучение функциональной коммуникации — это вмешательство, которое часто использует цепочечные графики подкрепления для эффективного содействия соответствующей и желаемой функциональной коммуникативной реакции. ^[29]

Математические модели

Были проведены исследования по построению математической модели подкрепления. Эта модель известна как MPR, что является сокращением от математических принципов подкрепления . Питер Киллин сделал ключевые открытия в этой области с помощью своих исследований на голубях. ^[30]

Приложения

Подкрепление и наказание повсеместно распространены в социальных взаимодействиях людей, и было предложено и реализовано множество приложений оперантных принципов. Ниже приведено несколько примеров.

Зависимость и наркомания

Положительное и отрицательное подкрепление играют центральную роль в развитии и поддержании зависимости от наркотиков . Наркотик, вызывающий зависимость , по своей сути является вознаграждающим ; то есть он функционирует как первичный положительный подкрепитель употребления наркотиков. Система вознаграждения мозга присваивает ему стимулирующую значимость (то есть он «желаемый» или «желаемый»), ^[31]^[32]^[33] поэтому по мере развития зависимости лишение наркотика приводит к тяге. Кроме того, стимулы, связанные с употреблением наркотиков, например, вид шприца и место использования, становятся связанными с интенсивным подкреплением, вызванным наркотиком. ^[31]^[32]^[33] Эти ранее нейтральные стимулы приобретают несколько свойств: их внешний вид может вызывать тягу, и они могут стать условными положительными подкрепителями постоянного употребления. ^[31]^[32]^[33] Таким образом, если зависимый человек сталкивается с одним из этих сигналов о наркотиках, тяга к связанному с ними наркотику может возникнуть снова. Например, антинаркотические агентства ранее использовали плакаты с изображениями принадлежностей для употребления наркотиков , чтобы показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффектов стимульной заметности, вызывающих рецидив при виде стимулов, изображенных на плакатах.

У наркозависимых людей отрицательное подкрепление происходит, когда наркотик вводится самостоятельно с целью облегчения или «избежания» симптомов физической зависимости (например, тремора и потливости) и/или психологической зависимости (например, ангедонии , беспокойства, раздражительности и тревожности), которые возникают во время состояния отмены препарата . ^[31]

Дрессировка животных

Курица катается на скейтборде

Дрессировщики и владельцы домашних животных применяли принципы и методы оперантного обусловливания задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ясных и убедительных примеров оперантного контроля. Из концепций и процедур, описанных в этой статье, наиболее яркими являются: доступность немедленного подкрепления (например, постоянно присутствующий пакет собачьих вкусняшек); контингентность, гарантирующая, что подкрепление следует за желаемым поведением, а не за чем-то другим; использование вторичного подкрепления, например, звучание кликера сразу после желаемой реакции; формирование, например, постепенное принуждение собаки прыгать все выше и выше; прерывистое подкрепление, уменьшающее частоту этих вкусняшек, чтобы вызвать устойчивое поведение без насыщения; цепочка, где сложное поведение постепенно формируется. ^[34]

Поведение ребенка – обучение родителей управлению

Предоставление положительного подкрепления для соответствующего поведения ребенка является основным направлением обучения родительского менеджмента. Обычно родители учатся вознаграждать соответствующее поведение с помощью социальных вознаграждений (таких как похвала, улыбки и объятия), а также конкретных вознаграждений (таких как наклейки или баллы в сторону большего вознаграждения как часть системы стимулирования, созданной совместно с ребенком). ^[35] Кроме того, родители учатся выбирать простое поведение в качестве первоначального фокуса и вознаграждать каждый из небольших шагов, которые их ребенок совершает на пути к достижению большей цели (эта концепция называется «последовательные приближения»). ^[35]^[36] Они также могут использовать косвенные вознаграждения, такие как графики прогресса . Предоставление положительного подкрепления в классе может быть полезным для успеваемости учащихся. Применяя положительное подкрепление к учащимся, крайне важно индивидуализировать его в соответствии с потребностями этого учащегося. Таким образом, ученик понимает, за что он получает похвалу, может принять ее и в конечном итоге научиться продолжать действие, которое было заслужено положительным подкреплением. Например, использование поощрений или дополнительного времени на переменах может быть более приемлемым для некоторых учеников, в то время как другие могут принять меры поощрения в виде наклеек или галочек, свидетельствующих о похвале.

Экономика

И психологи, и экономисты заинтересовались применением оперантных концепций и результатов к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексируемого по количеству купленного товара. В экономике степень, в которой цена влияет на потребление, называется «ценовой эластичностью спроса». Некоторые товары более эластичны, чем другие; например, изменение цены на определенные продукты питания может иметь большое влияние на количество купленного товара, в то время как бензин и другие предметы первой необходимости могут быть в меньшей степени затронуты изменениями цен. С точки зрения оперантного анализа такие эффекты могут быть интерпретированы с точки зрения мотивации потребителей и относительной ценности товаров как подкрепителей. ^[37]

Азартные игры – планирование с переменным соотношением

Как уже говорилось ранее в этой статье, график переменного соотношения дает подкрепление после выдачи непредсказуемого количества ответов. Этот график обычно генерирует быструю, настойчивую реакцию. Игровые автоматы окупаются по графику переменного соотношения, и они вызывают именно такое настойчивое поведение дергания рычага у игроков. Поскольку автоматы запрограммированы на выплату меньше денег, чем они принимают, настойчивый пользователь игрового автомата неизменно проигрывает в долгосрочной перспективе. Игровые автоматы, и, таким образом, настойчивое подкрепление переменного соотношения, часто обвинялись в качестве фактора, лежащего в основе игровой зависимости. ^[38]

Хвалить

Концепция похвалы как средства поведенческого подкрепления у людей коренится в модели оперантного обусловливания Б. Ф. Скиннера. С этой точки зрения похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение становится более вероятным путем условной похвалы указанного поведения. ^[39] Сотни исследований продемонстрировали эффективность похвалы в поощрении положительного поведения, в частности, в исследовании использования учителями и родителями похвалы в отношении детей для поощрения улучшенного поведения и успеваемости, ^[40]^[41] , а также в исследовании производительности труда. ^[42] Также было продемонстрировано, что похвала подкрепляет положительное поведение у непохваленных соседних лиц (например, одноклассника получателя похвалы) посредством косвенного подкрепления. ^[43] Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала оказала положительное влияние на изменение поведения, она должна зависеть от положительного поведения (т. е. применяться только после того, как целевое поведение было реализовано), должна указывать особенности поведения, которое должно быть подкреплено, и должна быть произнесена искренне и достоверно. ^[44]

Признавая эффект похвалы как стратегии положительного подкрепления, многочисленные поведенческие и когнитивно-поведенческие вмешательства включили использование похвалы в свои протоколы. ^[45]^[46] Стратегическое использование похвалы признано как основанная на фактических данных практика как в управлении классом ^[45], так и в вмешательствах по обучению родителей, ^[41] хотя похвала часто включается в исследованиях вмешательств в более широкую категорию положительного подкрепления, которая включает такие стратегии, как стратегическое внимание и поведенческие вознаграждения.

Травматическая связь

Травматическая связь возникает в результате постоянных циклов насилия , в которых периодическое подкрепление наградой и наказанием создает сильные эмоциональные связи, устойчивые к изменениям. ^[47]^[48]

Другой источник указал, что ^[49] «Необходимыми условиями для травматической связи являются то, что один человек должен доминировать над другим, и что уровень насилия хронически возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения со стороны доминирующего человека, прерываемыми периодическими эпизодами интенсивного насилия. Чтобы сохранить превосходство, мучитель манипулирует поведением жертвы и ограничивает ее возможности, чтобы увековечить дисбаланс сил. Любая угроза балансу доминирования и подчинения может быть встречена усиливающимся циклом наказания, варьирующимся от бурного запугивания до чрезвычайно жестоких вспышек. Преступник также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, ухудшает способность жертвы получать компенсирующую самореферентную обратную связь и усиливает чувство односторонней зависимости... Травматические последствия этих оскорбительных отношений могут включать нарушение способности жертвы к точной самооценке, что приводит к чувству личной неадекватности и подчиненному чувству зависимости от доминирующего лица. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были объектами агрессии.

Видеоигры

Большинство видеоигр разработаны вокруг некоторого типа цикла принуждения, добавляя тип положительного подкрепления через график переменной скорости, чтобы заставить игрока играть в игру, хотя это также может привести к зависимости от видеоигр . ^[50]

В рамках тенденции монетизации видеоигр в 2010-х годах некоторые игры предлагали «лутбоксы» в качестве наград или возможность покупки за реальные деньги, которые предлагали случайный выбор внутриигровых предметов, распределенных по редкости. Эта практика была связана с теми же методами, с помощью которых игровые автоматы и другие игровые устройства выдают награды, поскольку она следует графику переменной ставки. Хотя общее восприятие лутбоксов как формы азартных игр, эта практика классифицируется как таковая только в нескольких странах как азартная игра и в остальном законна. Однако методы использования этих предметов в качестве виртуальной валюты для онлайн-гемблинга или торговли за реальные деньги создали рынок азартных игр со скинами , который находится на стадии юридической оценки. ^[51]

Критика

Стандартное определение поведенческого подкрепления критиковалось как циклическое , поскольку оно, по-видимому, утверждает, что сила реакции увеличивается подкреплением, и определяет подкрепление как то, что увеличивает силу реакции (т. е. сила реакции увеличивается вещами, которые увеличивают силу реакции). Однако правильное использование ^[52] подкрепления заключается в том, что что-то является подкреплением из-за своего влияния на поведение, а не наоборот. Оно становится циклическим, если кто-то говорит, что определенный стимул усиливает поведение, потому что он является подкреплением, и не объясняет, почему стимул производит этот эффект на поведение. Были предложены и другие определения, такие как «консумматорное поведение, зависящее от ответа» Ф. Д. Шеффилда, но они не получили широкого распространения в психологии. ^[53]

Все большее понимание роли подкрепителей переходит от эффекта «усиления» к эффекту «сигнализации». ^[54] То есть, точка зрения, что подкрепители усиливают реакцию, поскольку они сигнализируют о поведении, которое, вероятно, приведет к подкреплению. Хотя в большинстве практических приложений эффект любого данного подкрепителя будет одинаковым независимо от того, является ли подкрепитель сигнальным или усиливающим, этот подход помогает объяснить ряд поведенческих явлений, включая модели реагирования на прерывистые графики подкрепления (фиксированные интервальные гребешки) и эффект дифференциальных результатов . ^[55]

Смотрите также

Ссылки

^ Определение подкрепления от Американской психологической ассоциации. Получено 30 января 2024 г.
^ Schultz W (июль 2015 г.). «Нейрональное вознаграждение и сигналы принятия решений: от теорий к данным». Physiological Reviews . 95 (3): 853–951. doi :10.1152/physrev.00023.2014. PMC 4491543 . PMID 26109341. Вознаграждения в оперантном обусловливании являются положительными подкрепителями. ... Оперантное поведение дает хорошее определение вознаграждениям. Все, что заставляет человека возвращаться за большим, является положительным подкрепителем и, следовательно, вознаграждением. Хотя оно дает хорошее определение, положительное подкрепление является лишь одной из нескольких функций вознаграждения. ... Вознаграждения привлекательны. Они мотивируют и заставляют нас прилагать усилия. ... Вознаграждения вызывают поведение приближения, также называемое аппетитным или подготовительным поведением и поведением потребления. ... Таким образом, любой стимул, объект, событие, действие или ситуация, которые могут заставить нас приблизиться и потребить их, по определению являются вознаграждением. ... Внутренние вознаграждения — это действия, которые сами по себе приятны и предпринимаются ради них самих, не являясь средством получения внешнего вознаграждения. ... Внутренние вознаграждения сами по себе являются подлинными вознаграждениями, поскольку они побуждают к обучению, приближению и удовольствию, например, к совершенствованию, игре и наслаждению игрой на пианино. Хотя они могут служить для обусловливания вознаграждений более высокого порядка, они не являются обусловленными вознаграждениями более высокого порядка, поскольку достижение их свойств вознаграждения не требует сопряжения с безусловным вознаграждением.
^ Malenka RC, Nestler EJ, Hyman SE (2009). «Глава 15: Подкрепление и аддиктивные расстройства». В Sydor A, Brown RY (ред.). Молекулярная нейрофармакология: основа клинической нейронауки (2-е изд.). Нью-Йорк: McGraw-Hill Medical. стр. 364–375. ISBN 9780071481274.
^ Nestler EJ (декабрь 2013 г.). «Клеточная основа памяти для зависимости». Dialogues in Clinical Neuroscience . 15 (4): 431–443. PMC 3898681. PMID 24459410. Несмотря на важность многочисленных психосоциальных факторов, в своей основе наркотическая зависимость включает биологический процесс: способность многократного воздействия наркотика, вызывающего злоупотребление, вызывать изменения в уязвимом мозге, которые приводят к компульсивному поиску и приему наркотиков, а также к потере контроля над употреблением наркотиков, что определяет состояние зависимости. ... В большом объеме литературы показано, что такая индукция ΔFosB в нейронах типа D1 [nucleus accumbens] повышает чувствительность животного к наркотикам, а также к естественным вознаграждениям и способствует самостоятельному приему наркотиков, предположительно, через процесс положительного подкрепления ... Другой целью ΔFosB является cFos: поскольку ΔFosB накапливается при повторном воздействии наркотиков, он подавляет c-Fos и способствует молекулярному переключению, посредством которого ΔFosB избирательно индуцируется в состоянии хронического лечения наркотиками. ⁴¹ . ... Более того, появляется все больше доказательств того, что, несмотря на ряд генетических рисков развития зависимости среди населения, воздействие достаточно высоких доз наркотика в течение длительных периодов времени может превратить человека с относительно низкой генетической нагрузкой в наркомана.
^ Volkow ND, Koob GF, McLellan AT (январь 2016 г.). "Neurobiologic Advances from the Brain Disease Model of Addiction" (Нейробиологические достижения модели зависимости от заболеваний мозга). New England Journal of Medicine . 374 (4): 363–371. doi :10.1056/NEJMra1511480. PMC 6135257. PMID 26816013. Расстройство , вызванное употреблением психоактивных веществ: диагностический термин в пятом издании Диагностического и статистического руководства по психическим расстройствам (DSM-5), относящийся к рецидивирующему употреблению алкоголя или других наркотиков, которое вызывает клинически и функционально значимые нарушения, такие как проблемы со здоровьем, инвалидность и неспособность выполнять основные обязанности на работе, в школе или дома. В зависимости от степени тяжести это расстройство классифицируется как легкое, умеренное или тяжелое. Зависимость: Термин, используемый для обозначения наиболее тяжелой, хронической стадии расстройства, связанного с употреблением психоактивных веществ, при которой наблюдается существенная потеря самоконтроля, на что указывает компульсивное употребление наркотиков, несмотря на желание прекратить их прием. В DSM-5 термин «зависимость» является синонимом классификации тяжелого расстройства, связанного с употреблением психоактивных веществ.
↑ Thorndike E (июнь 1898 г.). «Некоторые эксперименты по интеллекту животных». Science . 7 (181): 818–24. Bibcode :1898Sci.....7..818T. doi :10.1126/science.7.181.818. PMID 17769765.
^ Скиннер, Б.Ф. «Поведение организмов: экспериментальный анализ», 1938 Нью-Йорк: Appleton-Century-Crofts
^ Скиннер Б. Ф. (1948). Уолден Два . Торонто: The Macmillan Company.
^ Хониг В. (1966). Оперантное поведение: области исследований и применения. Нью-Йорк: Meredith Publishing Company. С. 381.
^ abcd Flora S (2004). Сила подкрепления . Олбани: Издательство Государственного университета Нью-Йорка.
^ D'Amato MR (1969). Marx MH (ред.). Процессы обучения: инструментальное обусловливание . Торонто: The Macmillan Company.
^ Хартер Дж. К. (2002). Кейс К. Л. (ред.). Благополучие на рабочем месте и его связь с результатами бизнеса: обзор исследований Гэллапа (PDF) . Вашингтон, округ Колумбия: Американская психологическая ассоциация.
^ Скиннер, Б. Ф. (1974). О бихевиоризме
^ abcdefg Милтенбергер, RG "Модификация поведения: принципы и процедуры". Томсон/Уодсворт , 2008.
^ Tucker M, Sigafoos J, Bushell H (октябрь 1998 г.). «Использование необусловленного подкрепления при лечении проблемного поведения. Обзор и клиническое руководство». Модификация поведения . 22 (4): 529–47. doi :10.1177/01454455980224005. PMID 9755650. S2CID 21542125.
^ Droleskey RE, Andrews K, Chiarantini L, DeLoach JR (1992). «Использование флуоресцентных зондов для описания процесса инкапсуляции гипотоническим диализом». Использование повторно запечатанных эритроцитов в качестве носителей и биореакторов . Достижения в экспериментальной медицине и биологии. Т. 326. С. 73–80. doi :10.1007/978-1-4615-3030-5_9. ISBN 978-1-4613-6321-7. PMID 1284187.
^ Baer DM, Wolf MM. «Вхождение в естественные сообщества подкрепления». В Ulrich R, Stachnik T, Mabry J (ред.). Управление поведением человека . Том 2. Glenview, IL: Scott Foresman. стр. 319–24.
^ Kohler FW, Greenwood CR (1986). «К технологии обобщения: идентификация естественных обстоятельств подкрепления». The Behavior Analyst . 9 (1): 19–26. doi :10.1007/bf03391926. PMC 2741872. PMID 22478644 .
^ Vollmer TR, Iwata BA (1992). «Дифференциальное подкрепление как лечение расстройств поведения: процедурные и функциональные вариации». Исследования нарушений развития . 13 (4): 393–417. doi :10.1016/0891-4222(92)90013-v. PMID 1509180.
^ Derenne A, Flannery KA (2007). «Пауза в сеансе FR». The Behavior Analyst Today . 8 (2): 175–86. doi :10.1037/h0100611.
^ McSweeney FK, Murphy ES, Kowal BP (2001). «Динамические изменения в ценности подкрепления: некоторые заблуждения и почему вас это должно волновать». The Behavior Analyst Today . 2 (4): 341–349. doi :10.1037/h0099952.
^ Иверсен И.Х., Латтал К.А. (1991). Экспериментальный анализ поведения. Амстердам: Эльзевир. ISBN 9781483291260.
^ Мартин TL, Ю CT, Мартин GL, Фаццио Д (2006). «О выборе, предпочтении и предпочтении выбора». The Behavior Analyst Today . 7 (2): 234–48. doi :10.1037/h0100083. PMC 3558524. PMID 23372459 .
^ Schacter DL, Gilbert DT, Wegner DM (2011). «Глава 7: Обучение». Психология (2-е изд.). Нью-Йорк: Worth Publishers. С. 284–85. ISBN 978-1-4292-3719-2.
^ Ghaemmaghami, Mahshid; Hanley, Gregory P.; Jessel, Joshua; Landa, Robin (14 мая 2018 г.). «Формирование сложных функциональных коммуникационных реакций». Journal of Applied Behavior Analysis . 51 (3): 502–520. doi :10.1002/jaba.468. ISSN 0021-8855. PMID 29761485.
^ Tarbox и Lanagan Bermudez, Jonathan и Taira (2017). Лечение проблем с кормлением при аутизме . Сан-Диего: Academic Press. стр. 1–6. ISBN 978-0-12-813563-1.
^ Тернер, Вирджиния Р. и др. (2020). «Формирование ответа для улучшения принятия пищи детьми с аутизмом: эффекты небольших и больших наборов продуктов». Исследования нарушений развития . 98 : 103574. doi : 10.1016/j.ridd.2020.103574. PMID 31982827. S2CID 210922007.
^ "ИСПРАВЛЕНИЕ к "Дальнейшим оценкам обучения функциональной коммуникации и цепочечным графикам подкрепления для лечения множественных функций сложного поведения"". Модификация поведения . 46 (1): 254. 24 июля 2020 г. doi : 10.1177/0145445520945810 . ISSN 0145-4455. PMID 32706269. S2CID 241136859.
^ Falcomata, Terry S.; Roane, Henry S.; Muething, Colin S.; Stephenson, Kasey M.; Ing, Anna D. (9 февраля 2012 г.). «Обучение функциональной коммуникации и цепочечные графики подкрепления для лечения проблемного поведения, поддерживаемого прекращением прерываний активности». Модификация поведения . 36 (5): 630–649. doi :10.1177/0145445511433821. ISSN 0145-4455. PMID 22327267. S2CID 29108702.
^ Killeen PR (4 февраля 2010 г.). «Математические принципы подкрепления». Behavioral and Brain Sciences . 17 (1): 105–135. doi :10.1017/S0140525X00033628.
^ abcd Edwards S (2016). "Принципы подкрепления для медицины наркомании; от употребления рекреационных наркотиков до психиатрического расстройства". Нейронаука для медицины наркомании: от профилактики до реабилитации - Конструкции и наркотики . Прогресс в исследовании мозга. Том 223. С. 63–76. doi :10.1016/bs.pbr.2015.07.005. ISBN 9780444635457. PMID 26806771. Злоупотребляемые вещества (от алкоголя до психостимуляторов) изначально употребляются регулярно в соответствии с их положительными подкрепляющими свойствами. Важно отметить, что повторное воздействие вознаграждающих веществ запускает цепь вторичных подкрепляющих событий, в результате чего сигналы и контексты, связанные с употреблением наркотиков, сами по себе могут стать подкрепляющими и тем самым способствовать дальнейшему использованию и возможному злоупотреблению выбранным веществом(ами). ...
Важным измерением подкрепления, весьма релевантным для процесса зависимости (и особенно рецидива), является вторичное подкрепление (Stewart, 1992). Вторичные подкрепления (во многих случаях также считающиеся условными подкреплениями), вероятно, управляют большинством процессов подкрепления у людей. В конкретном случае наркотической [зависимости] сигналы и контексты, которые тесно и неоднократно связаны с употреблением наркотиков, часто сами становятся подкрепляющими... Фундаментальная часть теории стимулирующей сенсибилизации наркомании Робинсона и Берриджа утверждает, что стимулирующая ценность или привлекательная природа таких вторичных процессов подкрепления, в дополнение к самим первичным подкрепителям, может сохраняться и даже становиться сенсибилизированной с течением времени в союзе с развитием наркотической зависимости (Робинсон и Берридж, 1993). ...
Отрицательное подкрепление - это особое состояние, связанное с усилением поведенческих реакций, которые прекращают некоторый текущий (предположительно аверсивный) стимул. В этом случае мы можем определить отрицательное подкрепление как мотивационный стимул, который усиливает такую реакцию "избегания". Исторически, в отношении наркотической зависимости, это явление постоянно наблюдалось у людей, когда наркотики, вызывающие злоупотребление, принимались самостоятельно, чтобы утолить мотивационную потребность в состоянии отмены (Виклер, 1952).
^ abc Berridge KC (апрель 2012 г.). «От ошибки прогнозирования к заметности стимула: мезолимбическое вычисление мотивации вознаграждения». The European Journal of Neuroscience . 35 (7): 1124–43. doi :10.1111/j.1460-9568.2012.07990.x. PMC 3325516 . PMID 22487042. Когда павловскому CS+ приписывается заметность стимула, он не только вызывает «желание» его UCS, но часто сам сигнал становится очень привлекательным — даже до иррациональной степени. Это притяжение сигнала является еще одной характерной чертой заметности стимула. На CS становится трудно не смотреть (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). CS даже приобретает некоторые свойства стимула, схожие с его UCS. Привлекательный CS часто вызывает поведенческий мотивированный подход, и иногда человек может даже попытаться «потребить» CS в некоторой степени как его UCS (например, есть, пить, курить, заниматься сексом, принимать в качестве наркотика). «Желание» CS может также превратить ранее нейтральный стимул в инструментальное условное подкрепление, так что человек будет работать над получением сигнала (однако существуют и альтернативные психологические механизмы для условного подкрепления).
^ abc Berridge KC, Kringelbach ML (май 2015). "Системы удовольствия в мозге". Neuron . 86 (3): 646–64. doi :10.1016/j.neuron.2015.02.018. PMC 4425246 . PMID 25950633. Важной целью в будущем для нейробиологии зависимости является понимание того, как интенсивная мотивация становится узконаправленной на конкретной цели. Было высказано предположение, что зависимость отчасти обусловлена чрезмерной стимульной заметностью, производимой сенсибилизированными или гиперреактивными дофаминовыми системами, которые производят интенсивное "желание" (Robinson and Berridge, 1993). Но почему одна цель становится более "желанной", чем все остальные, не было полностью объяснено. У наркоманов или пациентов, стимулированных агонистами, повторение стимуляции дофамином стимулирующей заметности становится приписанным конкретным индивидуальным занятиям, таким как прием наркотического препарата или определенные компульсии. В ситуациях вознаграждения по Павлову некоторые сигналы вознаграждения становятся более «желанными», чем другие, как мощные мотивационные магниты, способами, которые различаются у разных людей (Robinson et al., 2014b; Saunders and Robinson, 2013). ... Однако гедонистические эффекты могут со временем меняться. Поскольку наркотик принимался неоднократно, мезолимбическая дофаминергическая сенсибилизация может впоследствии возникнуть у восприимчивых людей, чтобы усилить «желание» (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонистические механизмы подверглись понижающей регуляции из-за постоянной стимуляции наркотиками, вызывая толерантность к «симпатии». Сенсибилизация к стимулу может вызывать зависимость, избирательно усиливая вызванное стимулом «желание» снова принять наркотик, и таким образом мощно вызывать мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).
^ McGreevy PD, Boakes RA (2007). Кнут и пряник: принципы дрессировки животных . Кембридж: Cambridge University Press. ISBN 978-0-521-68691-4.
^ ab Kazdin AE (2010). Обучение навыкам решения проблем и обучение родительского управления при оппозиционно-вызывающем расстройстве и расстройстве поведения. Психотерапия на основе фактических данных для детей и подростков (2-е изд.), 211–226. Нью-Йорк: Guilford Press.
^ Forgatch MS, Patterson GR (2010). Обучение родительскому менеджменту — модель Орегона: вмешательство в антисоциальное поведение детей и подростков. Психотерапия на основе фактических данных для детей и подростков (2-е изд.), 159–78. Нью-Йорк: Guilford Press.
^ Домжан, М. (2009). Принципы обучения и поведения. Wadsworth Publishing Company. 6-е издание. Страницы 244–249.
^ Lozano Bleda JH, Pérez Nieto MA (ноябрь 2012 г.). «Импульсивность, интеллект и различение обстоятельств подкрепления в фиксированном соотношении 3». Испанский журнал психологии . 15 (3): 922–9. doi :10.5209/rev_sjop.2012.v15.n3.39384. PMID 23156902. S2CID 144193503.
^ Каздин, Алан (1978). История модификации поведения: Экспериментальные основы современных исследований . Балтимор: University Park Press. ISBN 9780839112051.
^ Бейкер GL, Барнс HJ (1992). «Синдром верхней полой вены: этиология, диагностика и лечение». Американский журнал интенсивной терапии . 1 (1): 54–64. doi :10.4037/ajcc1992.1.1.54. PMID 1307879.
^ ab Garland AF, Hawley KM, Brookman-Frazee L, Hurlburt MS (май 2008 г.). «Определение общих элементов научно обоснованных психосоциальных методов лечения проблем с деструктивным поведением у детей». Журнал Американской академии детской и подростковой психиатрии . 47 (5): 505–14. doi :10.1097/CHI.0b013e31816765c2. PMID 18356768.
^ Crowell CR, Anderson DC, Abel DM, Sergio JP (1988). «Прояснение задач, обратная связь по результатам работы и социальная похвала: процедуры улучшения обслуживания клиентов банковскими кассирами». Журнал прикладного поведенческого анализа . 21 (1): 65–71. doi :10.1901/jaba.1988.21-65. PMC 1286094. PMID 16795713 .
^ Goldman NC (1992). «Аденоидно-кистозная карцинома наружного слухового прохода». Отоларингология–Хирургия головы и шеи . 106 (2): 214–5. doi :10.1177/019459989210600211. PMID 1310808. S2CID 23782303.
^ Брофи Дж. (1981). «Об эффективной похвале». The Elementary School Journal . 81 (5): 269–278. doi :10.1086/461229. JSTOR 1001606. S2CID 144444174.
^ ab Simonsen B, Fairbanks S, Briesch A, Myers D, Sugai G (2008). «Практики, основанные на фактических данных, в управлении классом: соображения для исследований в практике». Образование и лечение детей . 31 (1): 351–380. doi :10.1353/etc.0.0007. S2CID 145087451.
^ Weisz JR, Kazdin AE (2010). Психотерапия на основе фактических данных для детей и подростков. Guilford Press. ISBN 9781606235256.
^ Даттон; Пейнтер (1981). «Травматическая связь: развитие эмоциональных привязанностей у женщин, подвергшихся избиениям, и другие отношения периодического насилия». Виктимология (7).
^ Крисси Сандерсон. Консультирование жертв домашнего насилия . Jessica Kingsley Publishers; 15 июня 2008 г. ISBN 978-1-84642-811-1 . стр. 84.
^ «Травматическая привязанность | Encyclopedia.com».
↑ Hopson J (27 апреля 2001 г.). «Поведенческий игровой дизайн». Gamasutra .
↑ Hood V (12 октября 2017 г.). «Являются ли лутбоксы азартными играми?». Eurogamer . Получено 12 октября 2017 г.
^ Скиннер Б.Ф. (1982). Эпштейн Р. (ред.). Скиннер для класса: избранные статьи . Шампейн, Иллинойс: Research Press. ISBN 978-0-87822-261-2.
^ Vaccarino FJ, Schiff BB, Glickman SE (1989). Mowrer RR, Klein SB (ред.). Современные теории обучения . Hillsdale, NJ: Lawrence Erlbaum Associates. ISBN 978-0-89859-915-2.
^ Коуи С., Дэвисон М., Эллифф Д. (июль 2011 г.). «Подкрепление: еда сигнализирует о времени и месте будущей еды». Журнал экспериментального анализа поведения . 96 (1): 63–86. doi :10.1901/jeab.2011.96-63. PMC 3136894. PMID 21765546 .
^ МакКормак Дж., Арнольд-Саритепе А., Эллифф Д. (июнь 2017 г.). «Эффект дифференциальных результатов у детей с аутизмом». Поведенческие вмешательства . 32 (4): 357–369. doi :10.1002/bin.1489.

^[1]

Дальнейшее чтение

Брехнер К. К. (1974). Экспериментальный анализ социальных ловушек (диссертация доктора философии). Университет штата Аризона .
Брехнер К. К. (1977). «Экспериментальный анализ социальных ловушек». Журнал экспериментальной социальной психологии . 13 (6): 552–64. doi :10.1016/0022-1031(77)90054-3.
Брехнер К. С. (1987). Социальные ловушки, индивидуальные ловушки и теория в социальной психологии . Бюллетень № 870001. Пасадена, Калифорния: Лаборатория Time River.
Brechner KC (28 февраля 2003 г.). "Наложенные графики, применяемые для контроля арендной платы". В Levine DK, Pesendorfer W (ред.). Экономическая теория и теория игр .
Brechner KC, Linder DE (1981). "Анализ социальной ловушки в системах распределения энергии". В Baum A, Singer JE (ред.). Advances in Environmental Psychology . Том 3. Hillsdale, NJ: Lawrence Erlbaum & Associates.
Chance P (2003). Обучение и поведение (5-е изд.). Торонто: Thomson-Wadsworth.
Коуи С. (2019). «Некоторые недостатки учета силы реакции применительно к эффектам подкрепления». Европейский журнал поведенческого анализа . 21 (2): 1–16. doi : 10.1080/15021149.2019.1685247. S2CID 210503231.
Dinsmoor JA (ноябрь 2004 г.). «Этимология основных понятий в экспериментальном анализе поведения». Журнал экспериментального анализа поведения . 82 (3): 311–6. doi :10.1901/jeab.2004.82-311. PMC 1285013. PMID 15693525 .
Ferster CB , Skinner BF (1957). Схемы армирования . Нью-Йорк: Appleton-Century-Crofts. ISBN 0-13-792309-0.
Левин К (1935). Динамическая теория личности: Избранные статьи. Нью-Йорк: McGraw-Hill. ISBN 9781447497134.
Скиннер Б.Ф. (1938). Поведение организмов. Нью-Йорк: Appleton-Century-Crofts. ISBN 9780996453905.
Скиннер Б.Ф. (1956). «История случая в научном методе». Американский психолог . 11 (5): 221–33. doi :10.1037/h0047662.
Zeiler MD (июль 1968). «Фиксированные и переменные графики подкрепления, независимого от реакции». Журнал экспериментального анализа поведения . 11 (4): 405–14. doi :10.1901/jeab.1968.11-405. PMC 1338502. PMID 5672249 .
"Глоссарий терминов подкрепления". Университет Айовы. Архивировано из оригинала 13 апреля 2007 г.
Harter JK, Shmidt FL, Keyes CL (2002). «Благополучие на рабочем месте и его связь с результатами бизнеса: обзор исследований Гэллапа». В Keyes CL, Haidt J (ред.). Процветание: позитивный человек и хорошая жизнь . Вашингтон, округ Колумбия: Американская психологическая ассоциация. стр. 205–224.

Внешние ссылки

Онлайн-руководство по позитивному подкреплению
Scholarpedia Укрепление
scienceofbehavior.com Архивировано 2 октября 2011 г. в Wayback Machine

^ Бердон, Уильям М.; Сент-Де-Лор, Джеф; Прендергаст, Майкл Л. (7 сентября 2011 г.). «Разработка и реализация вмешательства с положительным поведенческим подкреплением в тюремном лечении наркомании: проект BRITE». Журнал психоактивных препаратов . 43 (sup1): 40–50. doi :10.1080/02791072.2011.601990. ISSN 0279-1072. PMC 3429341. PMID 22185038 .