В психологии эвристика « выбрать лучшее» [1] — это эвристика (простая стратегия принятия решений ), которая выбирает между двумя альтернативами, выбирая на основе первого сигнала, который их различает, где сигналы упорядочены по их значимости (от самого высокого к самому низкому). В первоначальной формулировке предполагалось, что сигналы имеют бинарные значения (да или нет) или имеют неизвестное значение. Логика эвристики заключается в том, что она основывает свой выбор только на лучшем сигнале (причине) и игнорирует все остальное.
Психологи Герд Гигеренцер и Дэниел Голдштейн обнаружили, что эвристика на удивление хорошо справляется с точным выводом в реальных условиях, например, выводом о том, какой из двух городов больше. С тех пор эвристика была модифицирована и применена в областях медицины , искусственного интеллекта и политического прогнозирования . [2] [3] Эвристика использовалась для точного моделирования того, как эксперты, такие как сотрудники таможни аэропорта [4] и профессиональные грабители, принимают решения; [5] модель часто делает лучшие прогнозы человеческого поведения, чем более сложные модели, которые предполагают, что эксперты интегрируют все доступные сигналы. [6] [7]
Теории принятия решений обычно предполагают, что все соответствующие причины (признаки или сигналы) ищутся и интегрируются в окончательное решение. Однако в условиях неопределенности (в отличие от риска) соответствующие сигналы обычно не все известны, как и их точные веса и корреляции между сигналами. В этих ситуациях опора только на лучший доступный сигнал может быть разумной альтернативой, которая позволяет принимать быстрые, экономные и точные решения. Это логика класса эвристик, известных как «принятие решений по одной причине», которая включает в себя «выбрать лучшее». [8] Рассмотрим сигналы с бинарными значениями (0, 1), где 1 указывает значение сигнала, связанное с более высоким значением критерия. Задача состоит в том, чтобы сделать вывод, какая из двух альтернатив имеет более высокое значение критерия. Примером может служить то, какая из двух команд НБА выиграет игру, на основе таких сигналов, как домашний матч и кто выиграл последний матч. Эвристика «выбрать лучшее» подразумевает три шага для такого вывода: [9]
Правило поиска : просматривайте подсказки в порядке их значимости.
Правило остановки : остановить поиск, когда будет найден первый сигнал, в котором значения двух альтернатив различаются.
Правило принятия решения : прогнозируем, что альтернатива с более высоким значением сигнала имеет более высокое значение переменной результата.
Достоверность v сигнала определяется по формуле v = C/(C+W), где C — количество правильных выводов, когда сигнал распознает, а W — количество неправильных выводов, все из которых оцениваются на основе выборок.
Рассмотрим задачу по выводу, какой объект, A или B, имеет более высокое значение по числовому критерию. В качестве примера представьте, что кто-то должен оценить, имеет ли немецкий город Кельн большее население, чем другой немецкий город Штутгарт. Это суждение или вывод должны быть основаны на информации, предоставленной бинарными сигналами, например, «Является ли город столицей штата?». С формальной точки зрения задача представляет собой категоризацию: пара (A, B) должна быть категоризирована как X A > X B или X B > X A (где X обозначает критерий), на основе информации сигнала.
Сигналы являются бинарными; это означает, что они принимают два значения и могут быть смоделированы, например, как имеющие значения 0 и 1 (для «да» и «нет»). Они ранжируются в соответствии с их валидностью сигнала , определяемой как доля правильных сравнений среди пар A и B, для которых он имеет разные значения, т. е. для которых он различает A и B. Take-the-best анализирует каждый сигнал, один за другим, в соответствии с ранжированием по валидности и останавливается, когда сигнал впервые различает элементы, и приходит к выводу, что элемент с большим значением также имеет большее значение по критерию.
Матрица всех объектов референтного класса, из которой были взяты A и B, и значений сигналов, которые описывают эти объекты, составляет так называемую среду. Гигеренцер и Голдштейн, которые ввели принцип «взять лучшее» (см. Gerd Gigerenzer and Daniel Goldstein , DG (1996) [10] ), рассмотрели в качестве примера сквозного анализа именно пары немецких городов. но только те, в которых проживает более 100 000 жителей. Задача сравнения для заданной пары (A, B) немецких городов в референтном классе состояла в установлении того, какой из них имеет большее население, на основе девяти сигналов. Сигналы имели двоичные значения, например, является ли город столицей штата или есть ли у него футбольная команда в национальной лиге.
Значения сигналов можно смоделировать с помощью единиц (для «да») и нулей (для «нет»), чтобы каждый город можно было идентифицировать по его «профилю сигналов», т. е. вектору единиц и нулей, упорядоченных в соответствии с рейтингом сигналов.
Вопрос был следующим: как можно сделать вывод, какой из двух объектов, например, город A с профилем сигнала (100101010) и город B с профилем сигнала (100010101) , имеет более высокие баллы по установленному критерию, т. е. размеру населения? Эвристика «выбрать лучшее» просто сравнивает профили лексикографически, так же как сравниваются числа, записанные в двоичной системе счисления: первое значение сигнала равно 1 для обоих, что означает, что первый сигнал не различает A и B. Второе значение сигнала равно 0 для обоих, снова без дискриминации. То же самое происходит и для третьего значения сигнала, в то время как четвертое значение сигнала равно 1 для A и 0 для B, что подразумевает, что A оценивается как имеющий более высокое значение по критерию. Другими словами, X A > X B тогда и только тогда, когда (100101010) > (100010101) .
Математически это означает, что найденные для сравнения сигналы допускают квазипорядковый изоморфизм между объектами, сравниваемыми по критерию, в данном случае городами с их населением и их соответствующими бинарными векторами. Здесь «квази» означает, что изоморфизм, в общем, несовершенен, поскольку набор сигналов несовершенен.
Удивительно, что эта простая эвристика имеет большую производительность по сравнению с другими стратегиями. Одна очевидная мера для установления производительности механизма вывода определяется процентом правильных суждений. Более того, самое важное — это не просто производительность эвристики при подгонке известных данных, но и при обобщении известного обучающего набора на новые элементы.
Черлински, Голдштейн и Гигеренцер сравнили несколько стратегий с методом «взять лучшее»: простая модель подсчета или весовой модели (также называемая «правилом Доуса» в этой литературе), взвешенная линейная модель на основе сигналов, взвешенных по их валидности (также называемая «правилом Франклина» в этой литературе), линейная регрессия и минималистский подход. Их результаты показывают надежность метода «взять лучшее» в обобщении.
Например, рассмотрим задачу выбора большего города из двух, когда
Процент правильных ответов составил примерно 74% для регрессии, брать лучшее, линейный вес единицы. А именно, оценки составили 74,3%, 74,2% и 74,1%, так что регрессия победила с небольшим отрывом.
Однако в статье также рассматривалось обобщение (также известное как вневыборочное прогнозирование).
В этом случае, когда использовались 10 000 различных случайных разделений, регрессия имела в среднем 71,9% правильных ответов, Take-the-best имел 72,2% правильных ответов, а единица с линейным ответом имела 71,4% правильных ответов. Эвристика take-the-best была более точной, чем регрессия в этом случае. [13]