stringtranslate.com

Сожаление (теория принятия решений)

В теории принятия решений при принятии решений в условиях неопределенности (если информация о лучшем курсе действий поступает после принятия фиксированного решения) часто возникает эмоциональная реакция человека в виде сожаления , которую можно измерить как величину разницы между принятым решением и оптимальным решением.

Теория неприятия сожаления или ожидаемого сожаления предполагает, что, сталкиваясь с решением, люди могут предвидеть сожаление и, таким образом, включать в свой выбор свое желание устранить или уменьшить эту возможность. Сожаление — это отрицательная эмоция с мощным социальным и репутационным компонентом, и оно играет центральную роль в том, как люди учатся на опыте, и в психологии человека, не склонного к риску . Осознанное ожидание сожаления создает обратную связь , которая выводит сожаление из эмоциональной сферы — часто моделируемой как простое человеческое поведение — в сферу рационального выбора поведения, которое моделируется в теории принятия решений.

Описание

Теория сожаления — это модель в теоретической экономике, одновременно разработанная в 1982 году Грэмом Лумсом и Робертом Сагденом , [1] Дэвидом Э. Беллом, [2] и Питером К. Фишберном . [3] Теория сожаления моделирует выбор в условиях неопределенности, принимая во внимание эффект ожидаемого сожаления. Впоследствии несколько других авторов усовершенствовали ее. [4]

Он включает в себя член сожаления в функцию полезности , который зависит отрицательно от реализованного результата и положительно от наилучшего альтернативного результата с учетом разрешения неопределенности. Этот член сожаления обычно является возрастающей, непрерывной и неотрицательной функцией, вычитаемой из традиционного индекса полезности. Эти типы предпочтений всегда нарушают транзитивность в традиционном смысле, [5] хотя большинство удовлетворяет более слабой версии. [4]

Для независимых лотерей и когда сожаление оценивается по разнице между полезностями, а затем усредняется по всем комбинациям результатов, сожаление все еще может быть транзитивным, но только для определенной формы функционала сожаления. Показано, что только функция гиперболического синуса будет поддерживать это свойство. [6] Эта форма сожаления наследует большинство желаемых характеристик, таких как сохранение правильных предпочтений перед лицом стохастического доминирования первого порядка , неприятие риска для логарифмических полезностей и способность объяснять парадокс Алле .

Неприятие сожалений — это не только теоретическая экономическая модель, но и когнитивное искажение, возникающее, когда принимается решение воздержаться от сожаления об альтернативном решении. Для лучшего вступления, неприятие сожалений можно увидеть через страх либо действия, либо бездействия; перспектива совершить неудачу или упустить возможность, которую мы стремимся избежать. [7] Сожаление, чувство грусти или разочарования из-за чего-то произошедшего, может быть рационализировано для определенного решения, но может направлять предпочтения и может сбивать людей с пути. Это способствует распространению дезинформации, поскольку вещи не рассматриваются как личная ответственность человека.

Доказательство

Несколько экспериментов как с поощренным, так и с гипотетическим выбором подтверждают масштаб этого эффекта.

Эксперименты на аукционах первой цены показывают, что манипулируя обратной связью, которую участники ожидают получить, можно наблюдать существенные различия в средних ставках. [8] В частности, «сожаление проигравшего» можно вызвать, раскрыв выигрышную ставку всем участникам аукциона и, таким образом, показав проигравшим, смогли бы они получить прибыль и какой она могла бы быть (участник, имеющий оценку в 50 долларов, делает ставку в 30 долларов и узнает, что выигрышная ставка была в 35 долларов, также узнает, что он или она могли бы заработать до 15 долларов, сделав ставку выше 35 долларов). Это, в свою очередь, допускает возможность сожаления, и если участники торгов правильно это предвидят, они будут склонны делать более высокие ставки, чем в случае, когда не предоставляется никакой обратной связи по выигрышной ставке, чтобы уменьшить вероятность сожаления.

При принятии решений по лотереям эксперименты также предоставляют подтверждающие доказательства ожидаемого сожаления. [9] [10] [11] Как и в случае аукционов первой цены, различия в обратной связи по разрешению неопределенности могут вызвать возможность сожаления, и если это ожидается, это может вызвать различные предпочтения. Например, при столкновении с выбором между 40 долларами с уверенностью и подбрасыванием монеты, которое приносит 100 долларов, если результат угадан правильно, и 0 долларов в противном случае, не только определенная альтернатива оплаты минимизирует риск, но и возможность сожаления, поскольку обычно монета не будет подброшена (и, таким образом, неопределенность не будет разрешена), в то время как если выбрано подбрасывание монеты, результат, который приносит 0 долларов, вызовет сожаление. Если монета подбрасывается независимо от выбранной альтернативы, то альтернативный выигрыш всегда будет известен, и тогда нет выбора, который исключит возможность сожаления.

Ожидаемое сожаление против пережитого сожаления

Ожидаемое сожаление, как правило, переоценивается как для выборов, так и для действий, за которые люди считают себя ответственными. [12] [13] Люди особенно склонны переоценивать сожаление, которое они почувствуют, когда не получат желаемый результат с небольшим отрывом. В одном исследовании пассажиры предсказывали, что они испытают большее сожаление, если опоздают на поезд на 1 минуту больше, чем если опоздают на поезд на 5 минут, например, но пассажиры, которые на самом деле опоздали на свой поезд на 1 или 5 минут, испытали (равное и) меньшее количество сожаления. Пассажиры, по-видимому, переоценивают сожаление, которое они почувствуют, если опоздают на поезд с небольшим отрывом, потому что они, как правило, недооценивают степень, в которой они приписывают опоздание на поезд внешним причинам (например, потеря кошелька или меньшее время, проведенное в душе). [12]

Приложения

Помимо традиционной установки выбора в лотереях, неприятие сожалений было предложено в качестве объяснения обычно наблюдаемого завышения ставок на аукционах первой цены [14] и эффекта диспозиции [15] среди прочего.

Минимакс сожаление

Подход минимаксного сожаления заключается в минимизации наихудшего сожаления, первоначально представленного Леонардом Сэвиджем в 1951 году. [16] Цель этого состоит в том, чтобы выполнить как можно ближе к оптимальному курсу. Поскольку критерий минимакса, применяемый здесь, относится к сожалению (разнице или отношению выплат), а не к самой выплате, он не такой пессимистичен, как обычный подход минимакса. Похожие подходы использовались в различных областях, таких как:

Одним из преимуществ минимакса (в отличие от ожидаемого сожаления) является то, что он не зависит от вероятностей различных результатов: таким образом, если сожаление можно точно вычислить, можно надежно использовать минимаксное сожаление. Однако вероятности результатов трудно оценить.

Это отличается от стандартного минимаксного подхода тем, что он использует различия или соотношения между результатами и, следовательно, требует интервальных или относительных измерений, а также порядковых измерений (ранжирования), как в стандартном минимаксном подходе.

Пример

Предположим, что инвестор должен выбрать между инвестированием в акции, облигации или денежный рынок, а общая доходность зависит от того, что происходит с процентными ставками. В следующей таблице показаны некоторые возможные доходности:

Грубый выбор максимина , основанный на доходности, будет заключаться в инвестировании в денежный рынок, гарантируя доходность не менее 1. Однако, если процентные ставки упадут, то сожаление, связанное с этим выбором, будет большим. Это будет 11, что является разницей между 12, которые можно было бы получить, если бы результат был известен заранее, и полученной 1. Смешанный портфель из примерно 11,1% в акциях и 88,9% на денежном рынке гарантировал бы доходность не менее 2,22; но, если процентные ставки упадут, сожаление будет около 9,78.

Таблица сожалений для этого примера, составленная путем вычитания фактической доходности из лучшей доходности, выглядит следующим образом:

Таким образом, используя минимаксный выбор на основе сожаления, наилучшим вариантом будет инвестирование в облигации, гарантирующее сожаление не хуже 5. Смешанный инвестиционный портфель будет работать еще лучше: 61,1% инвестировано в акции и 38,9% на денежном рынке, что даст сожаление не хуже примерно 4,28.

Пример: настройка линейной оценки

Далее следует иллюстрация того, как концепция сожаления может быть использована для разработки линейной оценки . В этом примере задача состоит в построении линейной оценки конечномерного вектора параметров из его зашумленного линейного измерения с известной структурой ковариации шума. Потеря реконструкции измеряется с использованием среднеквадратической ошибки (MSE). Известно, что неизвестный вектор параметров лежит в эллипсоиде с центром в нуле. Сожаление определяется как разница между MSE линейной оценки, которая не знает параметр , и MSE линейной оценки, которая знает . Кроме того, поскольку оценка ограничена линейностью, нулевая MSE не может быть достигнута в последнем случае. В этом случае решение задачи выпуклой оптимизации дает оптимальную, минимизирующую сожаление линейную оценку, что можно увидеть с помощью следующего аргумента.

Согласно предположениям, наблюдаемый вектор и неизвестный вектор детерминированных параметров связаны линейной моделью

где — известная матрица с полным рангом столбцов , а — случайный вектор с нулевым средним и известной ковариационной матрицей .

Позволять

быть линейной оценкой из , где - некоторая матрица. Среднеквадратическая ошибка этой оценки определяется как

Поскольку MSE явно зависит от , ее нельзя минимизировать напрямую. Вместо этого можно использовать концепцию сожаления для определения линейной оценки с хорошими характеристиками MSE. Чтобы определить сожаление здесь, рассмотрим линейную оценку, которая знает значение параметра , т. е. матрица может явно зависеть от :

MSE — это

Чтобы найти оптимальное , дифференцируем по и производная приравнивается к 0, получая

Затем, используя лемму об обращении матрицы

Подставляя это обратно , получаем

Это наименьшая MSE, достижимая с линейной оценкой, которая знает . На практике эта MSE не может быть достигнута, но она служит границей оптимальной MSE. Сожаление от использования линейной оценки, заданной , равно

Подход минимаксного сожаления здесь заключается в минимизации наихудшего сожаления, т. е. Это позволит достичь производительности, максимально приближенной к наилучшей достижимой производительности в наихудшем случае параметра . Хотя эта задача кажется сложной, она является примером выпуклой оптимизации , и в частности численное решение может быть эффективно вычислено. [17] Аналогичные идеи можно использовать, когда является случайным с неопределенностью в ковариационной матрице . [18] [19]

Сожаление в проблемах принципала-агента

Камара, Хартлайн и Джонсен [20] изучают проблемы принципала-агента . Это игры с неполной информацией между двумя игроками, называемыми Принципалом и Агентом , чьи выигрыши зависят от состояния природы, известного только Агенту. Принципал обязуется придерживаться политики, затем агент реагирует, и затем состояние природы раскрывается. Они предполагают, что принципал и агент взаимодействуют неоднократно и могут со временем учиться на истории состояний, используя обучение с подкреплением . Они предполагают, что агент движим сожалением-отвращением. В частности, агент минимизирует свое контрфактическое внутреннее сожаление . Основываясь на этом предположении, они разрабатывают механизмы , которые минимизируют сожаление принципала.

Коллина, Рот и Шао [21] усовершенствовали свой механизм как по времени выполнения, так и по границам сожаления (как функции числа различных состояний природы).

Смотрите также

Ссылки

  1. ^ Лумс, Г.; Сагден, Р. (1982). «Теория сожаления: альтернативная теория рационального выбора в условиях неопределенности». Economic Journal . 92 (4): 805–824. doi :10.2307/2232669. JSTOR  2232669.
  2. ^ Белл, Д. Э. (1982). «Сожаление при принятии решений в условиях неопределенности». Исследование операций . 30 (5): 961–981. doi :10.1287/opre.30.5.961.
  3. ^ Фишберн, ПК (1982). Основы ожидаемой полезности . Библиотека теории и принятия решений. ISBN 90-277-1420-7.
  4. ^ ab Diecidue, E.; Somasundaram, J. (2017). «Теория сожаления: новый фундамент». Журнал экономической теории . 172 : 88–119. doi : 10.1016/j.jet.2017.08.006. S2CID  36505167.
  5. ^ Бикхчандани, С.; Сегал, У. (2011). «Транзитивное сожаление». Теоретическая экономика . 6 (1): 95–108. doi : 10.3982/TE738 . hdl : 10419/150148 .
  6. ^ Бардахчян, В.; Аллахвердян, А. (2023). «Теория сожалений, парадокс Алле и омлет Сэваджа». Журнал математической психологии . 117. arXiv : 2301.02447 . doi : 10.1016/j.jmp.2023.102807.
  7. ^ «Почему мы ожидаем сожаления, прежде чем принять решение?». Лаборатория принятия решений .
  8. ^ Филиз-Озбей, Э.; Озбей, Э.Й. (2007). «Аукционы с ожидаемым сожалением: теория и эксперимент». American Economic Review . 97 (4): 1407–1418. doi :10.1257/aer.97.4.1407. S2CID  51815774.
  9. ^ Зееленберг, М.; Битти, Дж.; Ван дер Плигт, Дж.; де Врис, Н.К. (1996). «Последствия неприятия сожалений: влияние ожидаемой обратной связи на принятие рискованных решений». Организационное поведение и процессы принятия решений человеком . 65 (2): 148–158. doi :10.1006/obhd.1996.0013.
  10. ^ Зееленберг, М.; Битти, Дж. (1997). «Последствия неприятия сожалений 2: Дополнительные доказательства влияния обратной связи на принятие решений». Организационное поведение и процессы принятия решений человеком . 72 (1): 63–78. doi :10.1006/obhd.1997.2730.
  11. ^ Сомасундарам, Дж.; Диесидю, Э. (2016). «Теория сожаления и отношение к риску». Журнал риска и неопределенности . 55 (2–3): 1–29. doi :10.1007/s11166-017-9268-9. S2CID  254978441.
  12. ^ ab Gilbert, Daniel T.; Morewedge, Carey K.; Risen, Jane L.; Wilson, Timothy D. (2004-05-01). «Looking Forward to Looking Backward The Misprediction of Regret». Psychological Science . 15 (5): 346–350. CiteSeerX 10.1.1.492.9980 . doi :10.1111/j.0956-7976.2004.00681.x. ISSN  0956-7976. PMID  15102146. S2CID  748553. 
  13. ^ Севдалис, Ник; Харви, Найджел (2007-08-01). «Предвзятое прогнозирование пострешенческого аффекта». Психологическая наука . 18 (8): 678–681. doi :10.1111/j.1467-9280.2007.01958.x. ISSN  0956-7976. PMID  17680936. S2CID  7524552.
  14. ^ Энгельбрехт-Вигганс, Р. (1989). «Влияние сожаления на оптимальные ставки на аукционах». Management Science . 35 (6): 685–692. doi :10.1287/mnsc.35.6.685. hdl : 2142/28707 .
  15. ^ Фогель, SOC; Берри, T. (2006). «Эффект диспозиции и решения индивидуальных инвесторов: роль сожаления и контрфактуальных альтернатив». Журнал поведенческих финансов . 7 (2): 107–116. doi :10.1207/s15427579jpfm0702_5. S2CID  153522835.
  16. ^ Savage, LJ (1951). «Теория статистического решения». Журнал Американской статистической ассоциации . 46 (253): 55–67. doi :10.1080/01621459.1951.10500768.
  17. ^ Eldar, YC; Ben-Tal, A.; Nemirovski, A. (2004). «Линейная минимаксная оценка сожаления детерминированных параметров с ограниченными неопределенностями данных». IEEE Trans. Signal Process . 52 (8): 2177–2188. Bibcode : 2004ITSP...52.2177E. doi : 10.1109/TSP.2004.831144. S2CID  16417895.
  18. ^ Eldar, YC; Merhav, Neri (2004). «Конкурентный минимаксный подход к надежной оценке случайных параметров». IEEE Trans. Signal Process . 52 (7): 1931–1946. Bibcode : 2004ITSP...52.1931E. doi : 10.1109/TSP.2004.828931. S2CID  15596014.
  19. ^ Eldar, YC; Merhav, Neri (2005). «Оценка минимаксного отношения MSE с неопределенностями ковариации сигнала». IEEE Trans. Signal Process . 53 (4): 1335–1347. Bibcode : 2005ITSP...53.1335E. doi : 10.1109/TSP.2005.843701. S2CID  16732469.
  20. ^ Камара, Модибо К.; Хартлайн, Джейсон Д.; Джонсен, Алек (01 ноября 2020 г.). «Механизмы агента без сожалений: за пределами общего приоритета». 61-й ежегодный симпозиум IEEE по основам информатики (FOCS) 2020 г. IEEE. стр. 259–270. arXiv : 2009.05518 . doi : 10.1109/focs46700.2020.00033. ISBN 978-1-7281-9621-3. S2CID  221640554.
  21. ^ Коллина, Натали; Рот, Аарон; Шао, Хан (2023). «Эффективные механизмы без априорных ошибок для агентов без сожалений». arXiv : 2311.07754 [cs.GT].

Внешние ссылки