Дрессировка кликером — это метод дрессировки животных с положительным подкреплением [1], основанный на связующем стимуле ( кликере ) в оперантном обусловливании . В системе используются условные подкрепления, которые тренер может применять быстрее и точнее, чем первичные подкрепления, такие как еда. Термин «кликер» происходит от небольшого металлического шумогенератора сверчка, адаптированного из детской игрушки, который тренер использует, чтобы точно обозначить желаемое поведение. При обучении новому поведению кликер помогает животному быстро определить именно то поведение, которое приводит к угощению. Этот метод популярен среди дрессировщиков собак, но может быть использован для всех видов домашних и диких животных. [2]
Иногда вместо щелчка, обозначающего желаемое поведение, издаются другие отличительные звуки (например, «свист, щелчок языка, щелчок пальцев или даже слово») [3] или зрительные или иные сенсорные сигналы (например, фонарик, жест рукой или вибрирующий ошейник) [4] особенно полезны для глухих животных. [5]
Б. Ф. Скиннер первым определил и описал принципы оперантного обусловливания, которые используются при обучении кликеру. [6] [7] Два студента Скиннера, Мариан Крузе и Келлер Бреланд , работали с ним, исследуя поведение голубей и обучая проекты во время Второй мировой войны, когда голубей учили «играть в мяч» (толкать мяч клювами). [8] Они считали, что традиционному дрессировке животных ненужно препятствовали, потому что методы похвалы и вознаграждения, которые тогда использовались, не сообщали животному об успехе с достаточной быстротой и точностью, чтобы создать необходимые когнитивные связи для быстрого обучения . Они увидели потенциал использования метода операционной подготовки при дрессировке коммерческих животных. [9] Позже они поженились и в 1947 году создали Animal Behavior Enterprises (ABE), «первую коммерческую компанию по дрессировке животных, которая намеренно и систематически внедряла принципы анализа поведения и оперантного кондиционирования в дрессировку животных». [9]
Бреланды придумали термин «перемежающий стимул» в 1940-х годах для обозначения функции вторичного подкрепления, такого как свист или щелчок. [9] ABE продолжала свою деятельность до 1990 года при содействии Боба Бэйли после смерти Келлера Бреланда в 1965 году. [9] Они сообщают, что за время работы обучили более 15 000 животных и более 150 видов. [9] Их позитивные методы контрастировали с традиционным обучением с использованием аверсивных средств, таких как удушающие цепи, зубчатые ошейники, щелканье поводка, защемление ушей, «альфа-перекат», шоковый ошейник , [10] слоновий рожок , [11] кнуты для скота , [12] ] [13] и сокрушение слонов .
Хотя Бреландцы пытались продвигать обучение собак кликером в 1940-х и 1950-х годах, и этот метод успешно использовался в зоопарках и дрессировке морских млекопитающих , этот метод не прижился у собак до конца 1980-х и начала 1990-х годов. [14] В 1992 году дрессировщики животных Карен Прайор и Гэри Уилкс начали проводить семинары по обучению кликеру для владельцев собак. [14] [15] [16] В 1998 году Александра Курланд опубликовала книгу «Тренировка с помощью кликера для вашей лошади», в которой отвергалась дрессировка лошадей , в которой используются отталкивающие средства , такие как ломка лошади и использование шпор , удила (лошади) , обрезки (орудия) , и лонжирование с помощью кнута [14] [17] К 1990-м годам во многих зоопарках для животноводства использовались кликеры, поскольку при этом методе не приходилось применять силу или лекарства. Их можно было бы переместить в другие загоны или пройти ветеринарное лечение с гораздо меньшим стрессом для животных. [18] В 21 веке начали появляться книги по дрессировке других животных-компаньонов, таких как кошки, птицы и кролики (см. «Дальнейшая литература»).
Первым шагом в обучении кликеру является обучение животного ассоциировать звук кликера (или другого выбранного маркера, например свистка) [3] с лакомством. Каждый раз, когда звучит щелчок, сразу же предлагается угощение.
Затем щелчок используется для обозначения того, что произошло желаемое поведение. Некоторые подходы [2] :
После того, как поведение усвоено, последним шагом является добавление сигнала к поведению, например слова или жеста рукой. [2] Животное узнает, что лакомство уже готово, после того, как выполнит желаемое поведение.
Основой эффективного обучения кликеру является точное время подачи условного подкрепления в тот же момент, когда предлагается желаемое поведение. Кликер используется как «мост» между маркировкой поведения и поощрением основного подкрепления, такого как лакомство или игрушка. [19] Такое поведение можно вызвать путем «заманивания», когда, например, жест рукой или угощение используется, чтобы уговорить собаку сесть; или путем «формирования», когда закрепляются все более близкие приближения к желаемому поведению; и путем «захвата», когда спонтанное поведение собаки вознаграждается. [20] Как только поведение усвоено и выполняется по команде (команде), кликер и угощения исчезают. [21]
По словам дрессировщика собак Джонатана Филипа Кляйна , дрессировка с помощью кликера учит желаемому поведению, вознаграждая его, когда оно происходит, а не используя наказания. [22] [23] [24]
Кликер-тренинг почти полностью использует положительное подкрепление. Некоторые тренеры-кликеры используют небольшие исправления, такие как «маркер без вознаграждения»; «Угу» или «Упс», чтобы дать собаке понять, что ее поведение неправильное, или исправления, такие как «Тайм-аут», когда внимание отвлекается от собаки. [25] Александр продолжает:
Значение слова «чисто позитивный» обычно варьируется в зависимости от того, кто его использует. Некоторые тренеры по кликеру используют его как своего рода маркетинговый инструмент, возможно, чтобы показать, что они избегают исправлений и стараются как можно больше придерживаться положительного подкрепления...
...[Т] термин [чисто позитивный] подразумевает, что кликер-тренеры не используют аверсивные средства. Угасание (т.е. игнорирование поведения и отсутствие вознаграждения) и негативное наказание используются дрессировщиками кликеров, и ОБА являются отталкивающими. Вымирание столь же отвратительно, как и наказание, а иногда даже более отвратительно. Не все аверсивы одинаковы. Некоторые из них легкие, а некоторые тяжелые.
Некоторые [тренеры] используют NRM [маркеры, не связанные с вознаграждением]; некоторые нет. Некоторые говорят «Нет» или издают звуки «зуммера»; некоторые нет. Некоторые используют мягкие физические наказания, такие как брызги воды или цитронеллы, или шумовые ловушки; некоторые нет. Некоторые используют негативное подкрепление различными способами; некоторые нет. Некоторые используют что-то из вышеперечисленного в реальной жизни, но не на тренировках. [26]
Некоторые считают, что дрессировщику Гэри Уилксу удалось представить широкой публике дрессировку собак с помощью кликера, но поведенческий психолог Карен Прайор была первой, кто распространил эту идею с помощью своих статей, книг (в том числе « Не стреляйте в собаку ») и семинаров. [ нужна цитата ] Уилкс присоединился к Прайору еще до того, как стал сольным. [ нужна ссылка ] Уилкс пишет [27] , что «ни один метод обучения не является «полностью положительным». По научному определению лишение желаемой награды является «негативным наказанием». Итак, если вы когда-либо отказываете в угощении или используете тайм-аут, по определению вы являетесь «негативным» тренером, который использует «наказание» » [ 28] , где «негатив» означает, что что-то было удалено, а «наказание» просто. указывает на то, что произошло снижение поведения (в отличие от обычного использования этих терминов).
...(обучение, основанное на вознаграждении)... вместо того, чтобы наказывать их... учить их тому, что в поведении, которого мы от них хотим, есть что-то для них...
...Отмеченный наградами дрессировщик собак и признанный на национальном уровне консультант по поведению собак Джонатан Кляйн.... "Дрессировать с применением силы и боли - это просто неправильно", - говорит Кляйн...
...Самая распространенная проблема, с которой мы сталкиваемся, - это то, что питомец капризничает, потому что ему не уделяется того же внимания, к которому он привык", - объясняет Кляйн. ...