В поведенческой психологии подкрепление относится к последствиям , которые увеличивают вероятность будущего поведения организма, как правило, при наличии определенного предшествующего стимула . [1] Например, крысу можно обучить нажимать на рычаг, чтобы получать еду всякий раз, когда включается свет. В этом примере свет является предшествующим стимулом, нажатие на рычаг — оперантным поведением, а еда — подкреплением. Аналогично, ученик, который получает внимание и похвалу при ответе на вопрос учителя, с большей вероятностью ответит на будущие вопросы в классе. Вопрос учителя — это предшествующее, ответ ученика — это поведение, а похвала и внимание — подкрепление.
Последствия, которые приводят к аппетитному поведению, такому как субъективное «хотение» и «приязнь» (желание и удовольствие), действуют как награды или положительное подкрепление . [2] Существует также отрицательное подкрепление , которое подразумевает устранение нежелательного стимула. Примером отрицательного подкрепления может служить прием аспирина для облегчения головной боли.
Подкрепление является важным компонентом оперантного обусловливания и модификации поведения . Эта концепция применялась в различных практических областях, включая воспитание детей, коучинг, терапию, самопомощь, образование и управление.
В поведенческих науках термины «позитивный» и «негативный» при использовании в их строгом техническом смысле относятся к природе действия, выполняемого обусловливателем, а не к оценке этого действия и его последствий реагирующим оперантом. «Положительные» действия — это те, которые добавляют фактор, будь то приятный или неприятный, в окружающую среду, тогда как «негативные» действия — это те, которые удаляют или утаивают из окружающей среды фактор любого типа. В свою очередь, строгое значение «подкрепления» относится только к обусловленности, основанной на вознаграждении; введение неприятных факторов и удаление или утаивание приятных факторов вместо этого называются «наказанием», которое при использовании в строгом смысле, таким образом, противопоставляется «подкреплению». Таким образом, «позитивное подкрепление» относится к добавлению приятного фактора, «позитивное наказание» относится к добавлению неприятного фактора, «негативное подкрепление» относится к удалению или утаиванию неприятного фактора, а «негативное наказание» относится к удалению или утаиванию приятного фактора.
Такое использование расходится с некоторыми нетехническими использованиями четырех комбинаций терминов, особенно в случае термина «отрицательное подкрепление», который часто используется для обозначения того, что технический язык описал бы как «положительное наказание», поскольку нетехнический язык интерпретирует «подкрепление» как включение и вознаграждения, и наказания, а «отрицательное» — как ссылку на оценку реагирующим оперантом вводимого фактора. Напротив, технический язык использовал бы термин «отрицательное подкрепление» для описания поощрения определенного поведения путем создания сценария, в котором присутствует или будет присутствовать неприятный фактор, но вовлечение в поведение приводит либо к избавлению от этого фактора, либо к предотвращению его возникновения, как в эксперименте Мартина Селигмана с участием собак, обучающихся избегать ударов током .
Б. Ф. Скиннер был известным и влиятельным исследователем, который сформулировал многие теоретические конструкции подкрепления и бихевиоризма . Скиннер определял подкрепители в соответствии с изменением силы реакции (скорости реакции), а не с более субъективными критериями, такими как то, что приятно или ценно для кого-то. Соответственно, действия, еда или предметы, которые считаются приятными или приятными, не обязательно могут быть подкрепляющими (потому что они не вызывают увеличения реакции, предшествующей им). Стимулы, обстановка и действия соответствуют определению подкрепителей только в том случае, если поведение, которое непосредственно предшествует потенциальному подкрепителю, увеличивается в аналогичных ситуациях в будущем; например, ребенок, который получает печенье, когда он или она его просит. Если частота «поведения запроса печенья» увеличивается, печенье можно рассматривать как подкрепляющее «поведение запроса печенья». Однако, если «поведение запроса печенья» не увеличивается, печенье не может считаться подкрепляющим.
Единственный критерий, который определяет, является ли стимул подкрепляющим, — это изменение вероятности поведения после применения этого потенциального подкрепителя. Другие теории могут фокусироваться на дополнительных факторах, таких как то, ожидал ли человек, что поведение приведет к заданному результату, но в поведенческой теории подкрепление определяется повышенной вероятностью ответа.
Изучение подкрепления дало огромное количество воспроизводимых экспериментальных результатов. Подкрепление является центральной концепцией и процедурой в специальном образовании , прикладном поведенческом анализе и экспериментальном анализе поведения и является основной концепцией в некоторых медицинских и психофармакологических моделях, в частности, в моделях зависимости , принуждения и компульсии .
Лабораторные исследования подкрепления обычно датируются работой Эдварда Торндайка , известного своими экспериментами с кошками, вырывающимися из коробок-головоломок. [6] Ряд других продолжили это исследование, в частности, Б. Ф. Скиннер, который опубликовал свою основополагающую работу по этой теме в «Поведении организмов» в 1938 году и развил это исследование во многих последующих публикациях. [7] В частности, Скиннер утверждал, что положительное подкрепление превосходит наказание в формировании поведения. [8] Хотя наказание может показаться полной противоположностью подкрепления, Скиннер утверждал, что они сильно различаются, говоря, что положительное подкрепление приводит к длительной модификации поведения (долгосрочной), тогда как наказание изменяет поведение только временно (краткосрочно) и имеет множество пагубных побочных эффектов.
Многие исследователи впоследствии расширили наше понимание подкрепления и оспорили некоторые выводы Скиннера. Например, Азрин и Хольц определили наказание как «последствие поведения, которое снижает будущую вероятность этого поведения» [9] , а некоторые исследования показали, что положительное подкрепление и наказание одинаково эффективны в изменении поведения. [ необходима цитата ] Исследования эффектов положительного подкрепления, отрицательного подкрепления и наказания продолжаются и сегодня, поскольку эти концепции являются основополагающими для теории обучения и применимы ко многим практическим приложениям этой теории.
Термин оперантное обусловливание был введен Скиннером, чтобы указать, что в его экспериментальной парадигме организм свободен воздействовать на окружающую среду. В этой парадигме экспериментатор не может вызвать желаемую реакцию; экспериментатор ждет, пока реакция произойдет (будет испущена организмом), а затем подается потенциальное подкрепление. В классической парадигме обусловливания экспериментатор вызывает (вызывает) желаемую реакцию, предъявляя стимул, вызывающий рефлекс, безусловный стимул (UCS), который он спаривает (предшествует) с нейтральным стимулом, условным стимулом (CS).
Подкрепление — это базовый термин в оперантном обусловливании. О наказании в оперантном обусловливании см. наказание (психология) .
Положительное подкрепление происходит, когда желаемое событие или стимул представлены как следствие поведения, и вероятность того, что это поведение проявится в схожих условиях, увеличивается. [10] : 253 Например, если чтение книги доставляет удовольствие, то переживание удовольствия положительно подкрепляет поведение чтения интересных книг. Человек, который получает положительное подкрепление (т. е. которому нравится читать книгу), будет читать больше книг, чтобы получить больше удовольствия.
Метод высоковероятностного обучения (HPI) — это поведенческий метод лечения, основанный на идее положительного подкрепления.
Отрицательное подкрепление увеличивает частоту поведения, которое избегает или уклоняется от неприятной ситуации или стимула . [10] : 252–253 То есть, что-то неприятное уже происходит, и поведение помогает человеку избежать или избежать неприятности. В отличие от положительного подкрепления, которое предполагает добавление приятного стимула, при отрицательном подкреплении акцент делается на устранении неприятной ситуации или стимула. Например, если кто-то чувствует себя несчастным, то он может заняться поведением (например, чтением книг), чтобы уйти от неприятной ситуации (например, своих неприятных чувств). [10] : 253 Успех этого избегающего или эскапистского поведения в устранении неприятной ситуации или стимула подкрепляет поведение.
Совершение чего-либо неприятного для людей с целью предотвратить или устранить повторное проявление поведения является наказанием , а не отрицательным подкреплением. [10] : 252 Главное отличие заключается в том, что подкрепление всегда увеличивает вероятность поведения (например, переключение каналов во время скуки временно снимает скуку; следовательно, будет больше переключения каналов во время скуки), тогда как наказание снижает ее (например, похмелье является неприятным стимулом, поэтому люди учатся избегать поведения, которое привело к этому неприятному стимулу).
Угасание происходит, когда определенное поведение игнорируется (т. е. продолжается без последствий). Поведение исчезает со временем, когда оно постоянно не получает подкрепления. Во время преднамеренного угасания целевое поведение сначала резко возрастает (в попытке произвести ожидаемые, ранее подкрепленные эффекты), а затем со временем снижается. Ни подкрепление, ни угасание не должны быть преднамеренными, чтобы оказать влияние на поведение субъекта. Например, если ребенок читает книги, потому что это весело, то решение родителей игнорировать чтение книг не устранит положительное подкрепление (т. е. веселье), которое ребенок получает от чтения книг. Однако, если ребенок проявляет поведение, чтобы привлечь внимание родителей, то решение родителей игнорировать поведение приведет к тому, что поведение исчезнет, и ребенок найдет другое поведение, чтобы привлечь внимание родителей.
Подкрепления служат для усиления поведения, тогда как наказания служат для его ослабления; таким образом, положительные подкрепления являются стимулами, которые субъект будет стремиться достичь, а отрицательные подкрепления являются стимулами, от которых субъект будет стремиться избавиться или которые необходимо прекратить. [11] Таблица ниже иллюстрирует добавление и вычитание стимулов (приятных или отталкивающих) по отношению к подкреплению и наказанию.
Первичный подкрепитель , иногда называемый безусловным подкрепителем , — это стимул, который не требует сопряжения с другим стимулом , чтобы функционировать как подкрепитель, и, скорее всего, получил эту функцию в ходе эволюции и благодаря своей роли в выживании вида. [13] Примерами первичных подкрепителей являются еда, вода и секс. Некоторые первичные подкрепители, такие как определенные препараты, могут имитировать эффекты других первичных подкрепителей. Хотя эти первичные подкрепители довольно стабильны на протяжении жизни и у разных людей, подкрепляющая ценность различных первичных подкрепителей варьируется из-за множества факторов (например, генетики, опыта). Таким образом, один человек может предпочитать один тип пищи, а другой ее избегать. Или один человек может есть много еды, а другой — очень мало. Таким образом, даже если еда является первичным подкрепителем для обоих людей, ценность пищи как подкрепителя у них разная.
Вторичный подкрепитель , иногда называемый условным подкрепителем , — это стимул или ситуация, которая приобрела функцию подкрепителя после сопряжения со стимулом , который функционирует как подкрепитель. Этот стимул может быть первичным подкрепителем или другим условным подкрепителем (например, деньгами).
При попытке различить первичные и вторичные подкрепления в человеческих примерах используйте «тест пещерного человека». Если стимул представляет собой что-то, что пещерный человек естественным образом сочтет желанным (например, конфеты), то это первичное подкрепление. Если же, с другой стороны, пещерный человек не отреагирует на него (например, долларовая купюра), то это вторичное подкрепление. Как и в случае с первичными подкреплениями, организм может испытывать удовлетворение и лишение при вторичных подкреплениях.
В своей статье 1967 года « Произвольное и естественное подкрепление » Чарльз Ферстер предложил классифицировать подкрепление на события, которые увеличивают частоту оперантного поведения как естественное следствие самого поведения, и события, которые влияют на частоту, требуя человеческого посредничества, например, в экономике жетонов , где субъекты вознаграждаются за определенное поведение терапевтом.
В 1970 году Бэр и Вольф разработали концепцию «поведенческих ловушек». [17] Поведенческая ловушка требует только простой реакции, чтобы попасть в нее, однако, попав в нее, ловушке невозможно сопротивляться, создавая общее изменение поведения. Именно использование поведенческой ловушки расширяет репертуар человека, подвергая его естественному подкреплению этого поведения. Поведенческие ловушки имеют четыре характеристики:
Таким образом, искусственное подкрепление может использоваться для создания или развития обобщаемых навыков, в конечном итоге переходя к естественному подкреплению для поддержания или усиления поведения. Другим примером является социальная ситуация, которая обычно возникает из определенного поведения, как только оно соответствует определенному критерию.
Поведение не всегда подкрепляется каждый раз, когда оно проявляется, и схема подкрепления сильно влияет на то, как быстро усваивается оперантная реакция, какова ее скорость в любой момент времени и как долго она продолжается, когда подкрепление прекращается. Простейшие правила, контролирующие подкрепление, — это непрерывное подкрепление, когда каждая реакция подкрепляется, и угасание, когда никакая реакция не подкрепляется. Между этими крайностями более сложные графики подкрепления определяют правила, которые определяют, как и когда за реакцией последует подкрепление.
Конкретные графики подкрепления надежно вызывают определенные модели реакции, и эти правила применяются ко многим различным видам. Различная последовательность и предсказуемость подкрепления оказывает важное влияние на то, как работают различные графики. Многие простые и сложные графики были подробно исследованы Б. Ф. Скиннером с использованием голубей .
Простые графики имеют единое правило, определяющее, когда для определенной реакции применяется определенный тип подкрепления.
Простые графики используются во многих процедурах дифференцированного подкрепления [19] :
Составные расписания объединяют два или более различных простых расписания, используя одно и то же подкрепление для одного и того же поведения. Существует много возможностей; среди наиболее часто используемых:
Психологический термин « наложенные графики подкрепления» относится к структуре вознаграждений, где два или более простых графика подкрепления действуют одновременно. Подкрепления могут быть положительными, отрицательными или и теми, и другими. Примером может служить человек, который приходит домой после долгого рабочего дня. Поведение, заключающееся в открытии входной двери, вознаграждается крепким поцелуем в губы супругом человека и разрывом штанов от восторженно подпрыгивающей семейной собаки. Еще одним примером наложенных графиков подкрепления является голубь в экспериментальной клетке, клюющий пуговицу. Клевки приносят бункер с зерном каждый 20-й клев и доступ к воде после каждых 200 клевков.
Наложенные графики подкрепления являются типом составного графика, который развился из первоначальной работы над простыми графиками подкрепления Б. Ф. Скиннера и его коллег (Скиннер и Ферстер, 1957). Они продемонстрировали, что подкрепления могут быть предоставлены по расписанию, и далее, что организмы ведут себя по-разному при разных графиках. Вместо того, чтобы подкрепление, такое как еда или вода, предоставлялось каждый раз как следствие некоторого поведения, подкрепление может предоставляться после более чем одного случая поведения. Например, голубю может потребоваться клюнуть кнопку переключателя десять раз, прежде чем появится еда. Это «график соотношения». Кроме того, подкрепление может предоставляться после интервала времени, прошедшего после целевого поведения. Примером является крыса, которой дают пищевую гранулу сразу после первой реакции, которая происходит через две минуты с момента последнего нажатия рычага. Это называется «интервальным графиком».
Кроме того, графики отношений могут предоставлять подкрепление после фиксированного или переменного количества поведений отдельного организма. Аналогично, интервальные графики могут предоставлять подкрепление после фиксированных или переменных интервалов времени после одного ответа организма. Индивидуальное поведение, как правило, генерирует показатели реакции, которые различаются в зависимости от того, как создан график подкрепления. Многие последующие исследования во многих лабораториях изучали влияние на поведение планирования подкреплений.
Если организму предоставляется возможность выбирать между двумя или более простыми графиками подкрепления одновременно, то структура подкрепления называется «конкурентным графиком подкрепления». Брехнер (1974, 1977) ввел концепцию наложенных графиков подкрепления в попытке создать лабораторную аналогию социальных ловушек , например, когда люди перелавливают свои рыбные запасы или вырубают свои тропические леса. Брехнер создал ситуацию, в которой простые графики подкрепления накладывались друг на друга. Другими словами, один ответ или группа ответов организма приводили к множественным последствиям. Конкурентные графики подкрепления можно рассматривать как графики «или», а наложенные графики подкрепления можно рассматривать как графики «и». Брехнер и Линдер (1981) и Брехнер (1987) расширили концепцию, чтобы описать, как наложенные графики и аналогия социальной ловушки могут быть использованы для анализа того, как энергия течет через системы .
Наложенные графики подкрепления имеют множество реальных применений в дополнение к созданию социальных ловушек . Множество различных человеческих индивидуальных и социальных ситуаций можно создать путем наложения простых графиков подкрепления. Например, человек может иметь одновременную табачную и алкогольную зависимость. Еще более сложные ситуации можно создать или смоделировать путем наложения двух или более параллельных графиков. Например, у старшеклассника может быть выбор между поступлением в Стэнфордский университет или Калифорнийский университет в Лос-Анджелесе, и в то же время выбор между службой в армии или ВВС, и одновременно выбор между работой в интернет-компании и работой в компании по разработке программного обеспечения. Это структура подкрепления из трех наложенных параллельных графиков подкрепления.
Наложенные графики подкрепления могут создавать три классические конфликтные ситуации (конфликт приближения-подхода, конфликт приближения-избегания и конфликт избегания-избегания), описанные Куртом Левином (1935), и могут операционализировать другие ситуации Левина, проанализированные его анализом силового поля . Другими примерами использования наложенных графиков подкрепления в качестве аналитического инструмента являются его применение к непредвиденным обстоятельствам контроля арендной платы (Бречнер, 2003) и проблема сброса токсичных отходов в ливневую канализацию округа Лос-Анджелес (Бречнер, 2010).
В оперантном обусловливании параллельные графики подкрепления — это графики подкрепления, которые одновременно доступны животному-субъекту или человеку-участнику, так что субъект или участник может реагировать по любому графику. Например, в двухальтернативной задаче принудительного выбора голубь в коробке Скиннера сталкивается с двумя клевками; ответы на клевки могут быть сделаны на любой из них, и пищевое подкрепление может следовать за клевком на любой из них. Графики подкрепления, организованные для клевков на двух клавишах, могут быть разными. Они могут быть независимыми или могут быть связаны так, что поведение на одном ключе влияет на вероятность подкрепления на другом.
Не обязательно, чтобы ответы на двух графиках были физически различимы. В альтернативном способе организации параллельных графиков, введенном Финдли в 1958 году, оба графика организованы на одной клавише или другом устройстве ответа, и субъект может реагировать на вторую клавишу, чтобы переключаться между графиками. В такой «параллельной» процедуре Финдли стимул (например, цвет основного ключа) сигнализирует, какой график действует.
Конкурентные расписания часто вызывают быстрое чередование ключей. Чтобы предотвратить это, обычно вводится «задержка переключения»: каждое расписание деактивируется на короткий период после того, как субъект переключается на него.
Когда оба параллельных графика являются переменными интервалами, между относительными скоростями реагирования в двух графиках и относительными скоростями подкрепления, которые они обеспечивают, обнаруживается количественная связь, известная как закон соответствия ; это впервые заметил Р. Дж. Херрнштейн в 1961 году. Закон соответствия — это правило для инструментального поведения, которое гласит, что относительная скорость реагирования на конкретную альтернативу ответа равна относительной скорости подкрепления для этого ответа (скорость поведения = скорость подкрепления). Животные и люди склонны предпочитать выбор в графиках. [23]
Формирование — это подкрепление последовательных приближений к желаемому инструментальному ответу. Например, при обучении крысы нажимать на рычаг сначала подкрепляется простое поворот к рычагу. Затем подкрепляется только поворот и шаг к нему. В конце концов крыса будет подкреплена за нажатие рычага. Успешное достижение одного поведения запускает процесс формирования следующего. По мере обучения реакция становится все более похожей на желаемое поведение, причем каждое последующее поведение становится более близким к конечному поведению. [24]
Вмешательство формирования используется во многих ситуациях обучения, а также для людей с аутизмом и другими нарушениями развития. Когда формирование сочетается с другими основанными на фактических данных практиками, такими как Функциональное обучение коммуникации (FCT), [25], оно может дать положительные результаты для поведения человека. Формирование обычно использует непрерывное подкрепление, но позже ответ может быть изменен на прерывистый график подкрепления.
Формирование также используется для отказа от еды. [26] Отказ от еды — это когда человек испытывает частичное или полное отвращение к еде. Это может быть как минимальным, например, придирчивый едок, так и настолько серьезным, что может повлиять на здоровье человека. Формирование использовалось для достижения высокого уровня успеха в принятии пищи. [27]
Цепочка включает в себя связывание отдельных видов поведения в серию, так что последствием каждого вида поведения является как подкрепление предыдущего поведения, так и предшествующий стимул для следующего поведения. Существует много способов обучения цепочке, например, прямая цепочка (начиная с первого вида поведения в цепочке), обратная цепочка (начиная с последнего вида поведения) и полная цепочка задач (обучение каждому виду поведения в цепочке одновременно). Утренние ритуалы людей представляют собой типичную цепочку с серией видов поведения (например, принятие душа, вытирание, одевание), происходящих последовательно как хорошо усвоенная привычка.
Сложное поведение, наблюдаемое у людей с аутизмом и другими связанными с ним нарушениями, успешно контролировалось и поддерживалось в исследованиях с использованием запланированных цепочечных подкреплений. [28] Обучение функциональной коммуникации — это вмешательство, которое часто использует цепочечные графики подкрепления для эффективного содействия соответствующей и желаемой функциональной коммуникативной реакции. [29]
Были проведены исследования по построению математической модели подкрепления. Эта модель известна как MPR, что является сокращением от математических принципов подкрепления . Питер Киллин сделал ключевые открытия в этой области с помощью своих исследований на голубях. [30]
Подкрепление и наказание повсеместно распространены в социальных взаимодействиях людей, и было предложено и реализовано множество приложений оперантных принципов. Ниже приведено несколько примеров.
Положительное и отрицательное подкрепление играют центральную роль в развитии и поддержании зависимости от наркотиков . Наркотик, вызывающий зависимость , по своей сути является вознаграждающим ; то есть он функционирует как первичный положительный подкрепитель употребления наркотиков. Система вознаграждения мозга присваивает ему стимулирующую значимость (то есть он «желаемый» или «желаемый»), [31] [32] [33] поэтому по мере развития зависимости лишение наркотика приводит к тяге. Кроме того, стимулы, связанные с употреблением наркотиков, например, вид шприца и место использования, становятся связанными с интенсивным подкреплением, вызванным наркотиком. [31] [32] [33] Эти ранее нейтральные стимулы приобретают несколько свойств: их внешний вид может вызывать тягу, и они могут стать условными положительными подкрепителями постоянного употребления. [31] [32] [33] Таким образом, если зависимый человек сталкивается с одним из этих сигналов о наркотиках, тяга к связанному с ними наркотику может возникнуть снова. Например, антинаркотические агентства ранее использовали плакаты с изображениями принадлежностей для употребления наркотиков , чтобы показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффектов стимульной заметности, вызывающих рецидив при виде стимулов, изображенных на плакатах.
У наркозависимых людей отрицательное подкрепление происходит, когда наркотик вводится самостоятельно с целью облегчения или «избежания» симптомов физической зависимости (например, тремора и потливости) и/или психологической зависимости (например, ангедонии , беспокойства, раздражительности и тревожности), которые возникают во время состояния отмены препарата . [31]
Дрессировщики и владельцы домашних животных применяли принципы и методы оперантного обусловливания задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ясных и убедительных примеров оперантного контроля. Из концепций и процедур, описанных в этой статье, наиболее яркими являются: доступность немедленного подкрепления (например, постоянно присутствующий пакет собачьих вкусняшек); контингентность, гарантирующая, что подкрепление следует за желаемым поведением, а не за чем-то другим; использование вторичного подкрепления, например, звучание кликера сразу после желаемой реакции; формирование, например, постепенное принуждение собаки прыгать все выше и выше; прерывистое подкрепление, уменьшающее частоту этих вкусняшек, чтобы вызвать устойчивое поведение без насыщения; цепочка, где сложное поведение постепенно формируется. [34]
Предоставление положительного подкрепления для соответствующего поведения ребенка является основным направлением обучения родительского менеджмента. Обычно родители учатся поощрять соответствующее поведение с помощью социальных вознаграждений (таких как похвала, улыбки и объятия), а также конкретных вознаграждений (таких как наклейки или баллы в сторону большего вознаграждения как часть системы стимулирования, созданной совместно с ребенком). [35] Кроме того, родители учатся выбирать простое поведение в качестве первоначального фокуса и поощрять каждый из небольших шагов, которые их ребенок совершает на пути к достижению более крупной цели (эта концепция называется «последовательные приближения»). [35] [36] Они также могут использовать косвенные вознаграждения, такие как графики прогресса . Предоставление положительного подкрепления в классе может быть полезным для успеваемости учащихся. Применяя положительное подкрепление к учащимся, крайне важно индивидуализировать его в соответствии с потребностями этого учащегося. Таким образом, ученик понимает, за что он получает похвалу, может принять ее и в конечном итоге научиться продолжать действие, которое было заслужено положительным подкреплением. Например, использование поощрений или дополнительного времени на переменах может быть более приемлемым для некоторых учеников, в то время как другие могут принять меры поощрения в виде наклеек или галочек, свидетельствующих о похвале.
И психологи, и экономисты заинтересовались применением оперантных концепций и результатов к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексируемого по количеству купленного товара. В экономике степень, в которой цена влияет на потребление, называется «ценовой эластичностью спроса». Некоторые товары более эластичны, чем другие; например, изменение цены на определенные продукты питания может иметь большое влияние на количество купленного товара, в то время как бензин и другие предметы первой необходимости могут быть в меньшей степени затронуты изменениями цен. С точки зрения оперантного анализа такие эффекты могут быть интерпретированы с точки зрения мотивации потребителей и относительной ценности товаров как подкрепителей. [37]
Как уже говорилось ранее в этой статье, график переменного соотношения дает подкрепление после выдачи непредсказуемого количества ответов. Этот график обычно генерирует быструю, настойчивую реакцию. Игровые автоматы окупаются по графику переменного соотношения, и они вызывают именно такое настойчивое поведение дергания рычага у игроков. Поскольку автоматы запрограммированы на выплату меньше денег, чем они принимают, настойчивый пользователь игрового автомата неизменно проигрывает в долгосрочной перспективе. Игровые автоматы, и, таким образом, настойчивое подкрепление переменного соотношения, часто обвинялись в качестве фактора, лежащего в основе игровой зависимости. [38]
Концепция похвалы как средства поведенческого подкрепления у людей коренится в модели оперантного обусловливания Б. Ф. Скиннера. С этой точки зрения похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение становится более вероятным путем условной похвалы указанного поведения. [39] Сотни исследований продемонстрировали эффективность похвалы в поощрении положительного поведения, в частности, в исследовании использования учителями и родителями похвалы в отношении детей для поощрения улучшенного поведения и успеваемости, [40] [41] , а также в исследовании производительности труда. [42] Также было продемонстрировано, что похвала подкрепляет положительное поведение у непохваленных соседних лиц (например, одноклассника получателя похвалы) посредством косвенного подкрепления. [43] Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала оказала положительное влияние на изменение поведения, она должна зависеть от положительного поведения (т. е. применяться только после того, как целевое поведение было реализовано), должна указывать особенности поведения, которое должно быть подкреплено, и должна быть произнесена искренне и достоверно. [44]
Признавая эффект похвалы как стратегии положительного подкрепления, многочисленные поведенческие и когнитивно-поведенческие вмешательства включили использование похвалы в свои протоколы. [45] [46] Стратегическое использование похвалы признано как основанная на фактических данных практика как в управлении классом [45], так и в вмешательствах по обучению родителей, [41] хотя похвала часто включается в исследованиях вмешательств в более широкую категорию положительного подкрепления, которая включает такие стратегии, как стратегическое внимание и поведенческие вознаграждения.
Травматическая связь возникает в результате постоянных циклов насилия , в которых периодическое подкрепление наградой и наказанием создает сильные эмоциональные связи, устойчивые к изменениям. [47] [48]
Другой источник указал, что [49] «Необходимыми условиями для травматической связи являются то, что один человек должен доминировать над другим, и что уровень насилия хронически возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения со стороны доминирующего человека, прерываемыми периодическими эпизодами интенсивного насилия. Чтобы сохранить превосходство, мучитель манипулирует поведением жертвы и ограничивает ее возможности, чтобы увековечить дисбаланс сил. Любая угроза балансу доминирования и подчинения может быть встречена усиливающимся циклом наказания, варьирующимся от бурного запугивания до чрезвычайно жестоких вспышек. Преступник также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, ухудшает способность жертвы получать компенсирующую самореферентную обратную связь и усиливает чувство односторонней зависимости... Травматические последствия этих оскорбительных отношений могут включать нарушение способности жертвы к точной самооценке, что приводит к чувству личной неадекватности и подчиненному чувству зависимости от доминирующего лица. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были объектами агрессии.
Большинство видеоигр разработаны вокруг некоторого типа цикла принуждения, добавляя тип положительного подкрепления через график переменной скорости, чтобы заставить игрока играть в игру, хотя это также может привести к зависимости от видеоигр . [50]
В рамках тенденции монетизации видеоигр в 2010-х годах некоторые игры предлагали «лутбоксы» в качестве наград или возможность покупки за реальные деньги, которые предлагали случайный выбор внутриигровых предметов, распределенных по редкости. Эта практика была связана с теми же методами, с помощью которых игровые автоматы и другие игровые устройства выдают награды, поскольку она следует графику переменной ставки. Хотя общее восприятие лутбоксов как формы азартных игр, эта практика классифицируется как таковая только в нескольких странах как азартная игра и в остальном законна. Однако методы использования этих предметов в качестве виртуальной валюты для онлайн-гемблинга или торговли за реальные деньги создали рынок азартных игр со скинами , который находится на стадии юридической оценки. [51]
Стандартное определение поведенческого подкрепления критиковалось как циклическое , поскольку оно, по-видимому, утверждает, что сила реакции увеличивается подкреплением, и определяет подкрепление как то, что увеличивает силу реакции (т. е. сила реакции увеличивается вещами, которые увеличивают силу реакции). Однако правильное использование [52] подкрепления заключается в том, что что-то является подкреплением из-за своего влияния на поведение, а не наоборот. Оно становится циклическим, если кто-то говорит, что определенный стимул усиливает поведение, потому что он является подкреплением, и не объясняет, почему стимул производит этот эффект на поведение. Были предложены и другие определения, такие как «консумматорное поведение, зависящее от ответа» Ф. Д. Шеффилда, но они не получили широкого распространения в психологии. [53]
Все большее понимание роли подкрепителей переходит от эффекта «усиления» к эффекту «сигнализации». [54] То есть, точка зрения, что подкрепители усиливают реакцию, поскольку они сигнализируют о поведении, которое, вероятно, приведет к подкреплению. Хотя в большинстве практических приложений эффект любого данного подкрепителя будет одинаковым независимо от того, является ли подкрепитель сигнальным или усиливающим, этот подход помогает объяснить ряд поведенческих явлений, включая модели реагирования на прерывистые графики подкрепления (фиксированные интервальные гребешки) и эффект дифференциальных результатов . [55]
Вознаграждения в оперантном обусловливании являются положительными подкрепителями. ... Оперантное поведение дает хорошее определение вознаграждениям. Все, что заставляет человека возвращаться за большим, является положительным подкрепителем и, следовательно, вознаграждением. Хотя оно дает хорошее определение, положительное подкрепление является лишь одной из нескольких функций вознаграждения. ... Вознаграждения привлекательны. Они мотивируют и заставляют нас прилагать усилия. ... Вознаграждения вызывают поведение приближения, также называемое аппетитным или подготовительным поведением и поведением потребления. ... Таким образом, любой стимул, объект, событие, действие или ситуация, которые могут заставить нас приблизиться и потребить их, по определению являются вознаграждением. ... Внутренние вознаграждения — это действия, которые сами по себе приятны и предпринимаются ради них самих, не являясь средством получения внешнего вознаграждения. ... Внутренние вознаграждения сами по себе являются подлинными вознаграждениями, поскольку они побуждают к обучению, приближению и удовольствию, например, к совершенствованию, игре и наслаждению игрой на пианино. Хотя они могут служить для обусловливания вознаграждений более высокого порядка, они не являются обусловленными вознаграждениями более высокого порядка, поскольку достижение их свойств вознаграждения не требует сопряжения с безусловным вознаграждением.
на важность многочисленных психосоциальных факторов, в своей основе наркотическая зависимость включает биологический процесс: способность многократного воздействия наркотика, вызывающего злоупотребление, вызывать изменения в уязвимом мозге, которые приводят к компульсивному поиску и приему наркотиков, а также к потере контроля над употреблением наркотиков, что определяет состояние зависимости. ... В большом объеме литературы показано, что такая индукция ΔFosB в нейронах типа D1 [nucleus accumbens] повышает чувствительность животного к наркотикам, а также к естественным вознаграждениям и способствует самостоятельному приему наркотиков, предположительно, через процесс положительного подкрепления ... Другой целью ΔFosB является cFos: поскольку ΔFosB накапливается при повторном воздействии наркотиков, он подавляет c-Fos и способствует молекулярному переключению, посредством которого ΔFosB избирательно индуцируется в состоянии хронического лечения наркотиками.
41
. ... Более того, появляется все больше доказательств того, что, несмотря на ряд генетических рисков развития зависимости среди населения, воздействие достаточно высоких доз наркотика в течение длительных периодов времени может превратить человека с относительно низкой генетической нагрузкой в наркомана.
, вызванное употреблением психоактивных веществ: диагностический термин в пятом издании Диагностического и статистического руководства по психическим расстройствам (DSM-5), относящийся к рецидивирующему употреблению алкоголя или других наркотиков, которое вызывает клинически и функционально значимые нарушения, такие как проблемы со здоровьем, инвалидность и неспособность выполнять основные обязанности на работе, в школе или дома. В зависимости от степени тяжести это расстройство классифицируется как легкое, умеренное или тяжелое.
Зависимость: Термин, используемый для обозначения наиболее тяжелой, хронической стадии расстройства, связанного с употреблением психоактивных веществ, при которой наблюдается существенная потеря самоконтроля, на что указывает компульсивное употребление наркотиков, несмотря на желание прекратить их прием. В DSM-5 термин «зависимость» является синонимом классификации тяжелого расстройства, связанного с употреблением психоактивных веществ.
Злоупотребляемые вещества (от алкоголя до психостимуляторов) изначально употребляются регулярно в соответствии с их положительными подкрепляющими свойствами. Важно отметить, что повторное воздействие вознаграждающих веществ запускает цепь вторичных подкрепляющих событий, в результате чего сигналы и контексты, связанные с употреблением наркотиков, сами по себе могут стать подкрепляющими и тем самым способствовать дальнейшему использованию и возможному злоупотреблению выбранным веществом(ами). ...
Важным измерением подкрепления, весьма релевантным для процесса зависимости (и особенно рецидива), является вторичное подкрепление (Stewart, 1992). Вторичные подкрепления (во многих случаях также считающиеся условными подкреплениями), вероятно, управляют большинством процессов подкрепления у людей. В конкретном случае наркотической [зависимости] сигналы и контексты, которые тесно и неоднократно связаны с употреблением наркотиков, часто сами становятся подкрепляющими... Фундаментальная часть теории стимулирующей сенсибилизации наркомании Робинсона и Берриджа утверждает, что стимулирующая ценность или привлекательная природа таких вторичных процессов подкрепления, в дополнение к самим первичным подкрепителям, может сохраняться и даже становиться сенсибилизированной с течением времени в союзе с развитием наркотической зависимости (Робинсон и Берридж, 1993). ...
Отрицательное подкрепление - это особое состояние, связанное с усилением поведенческих реакций, которые прекращают некоторый текущий (предположительно аверсивный) стимул. В этом случае мы можем определить отрицательное подкрепление как мотивационный стимул, который усиливает такую реакцию "избегания". Исторически, в отношении наркотической зависимости, это явление постоянно наблюдалось у людей, когда наркотики, вызывающие злоупотребление, принимались самостоятельно, чтобы утолить мотивационную потребность в состоянии отмены (Виклер, 1952).
Когда павловскому CS+ приписывается заметность стимула, он не только вызывает «желание» его UCS, но часто сам сигнал становится очень привлекательным — даже до иррациональной степени. Это притяжение сигнала является еще одной характерной чертой заметности стимула. На CS становится трудно не смотреть (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). CS даже приобретает некоторые свойства стимула, схожие с его UCS. Привлекательный CS часто вызывает поведенческий мотивированный подход, и иногда человек может даже попытаться «потребить» CS в некоторой степени как его UCS (например, есть, пить, курить, заниматься сексом, принимать в качестве наркотика). «Желание» CS может также превратить ранее нейтральный стимул в инструментальное условное подкрепление, так что человек будет работать над получением сигнала (однако существуют и альтернативные психологические механизмы для условного подкрепления).
Важной целью в будущем для нейробиологии зависимости является понимание того, как интенсивная мотивация становится узконаправленной на конкретной цели. Было высказано предположение, что зависимость частично обусловлена чрезмерной стимульной заметностью, производимой сенсибилизированными или гиперреактивными дофаминовыми системами, которые производят интенсивное "желание" (Robinson and Berridge, 1993). Но почему одна цель становится более "желанной", чем все остальные, не было полностью объяснено. У наркоманов или пациентов, стимулированных агонистами, повторение стимуляции дофамином стимулирующей заметности становится приписанным конкретным индивидуальным занятиям, таким как прием наркотического препарата или определенные компульсии. В ситуациях вознаграждения по Павлову некоторые сигналы вознаграждения становятся более «желанными», чем другие, как мощные мотивационные магниты, способами, которые различаются у разных людей (Robinson et al., 2014b; Saunders and Robinson, 2013). ... Однако гедонистические эффекты могут со временем меняться. Поскольку наркотик принимался неоднократно, мезолимбическая дофаминергическая сенсибилизация может впоследствии возникнуть у восприимчивых людей, чтобы усилить «желание» (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонистические механизмы подверглись понижающей регуляции из-за постоянной стимуляции наркотиками, вызывая толерантность к «симпатии». Сенсибилизация к стимулу может вызывать зависимость, избирательно усиливая вызванное стимулом «желание» снова принять наркотик, и таким образом мощно вызывать мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).
[1]