Равновесие квантового отклика

Квантовое равновесие отклика ( QRE ) — это концепция решения в теории игр . Впервые введенная Ричардом Маккелви и Томасом Палфри , ^[1]^[2] она обеспечивает понятие равновесия с ограниченной рациональностью . QRE не является уточнением равновесия и может давать существенно отличающиеся результаты от равновесия Нэша . QRE определена только для игр с дискретными стратегиями, хотя существуют аналоги с непрерывными стратегиями.

В равновесии квантового ответа предполагается, что игроки совершают ошибки при выборе чистой стратегии. Вероятность выбора любой конкретной стратегии положительно связана с выигрышем от этой стратегии. Другими словами, очень дорогостоящие ошибки маловероятны.

Равновесие возникает из реализации убеждений. Выигрыши игрока вычисляются на основе убеждений о распределении вероятностей других игроков по стратегиям. В равновесии убеждения игрока верны.

Применение к данным

При анализе данных из игры реальных игр, особенно из лабораторных экспериментов , особенно из экспериментов с игрой в соответствующие пенни , равновесие Нэша может быть неумолимым. Любой неравновесный ход может показаться одинаково «неправильным», но реалистично не должен использоваться для отклонения теории. QRE позволяет играть любую стратегию с ненулевой вероятностью, и поэтому любые данные возможны (хотя и не обязательно разумны).

Логит-равновесие

Наиболее распространенной спецификацией для QRE является логит-равновесие ( LQRE ). В логит-равновесии стратегии игроков выбираются в соответствии с распределением вероятностей:

$P_{ij}={\frac {\exp(\lambda EU_{ij}(P_{-i}))}{\sum _{k}{\exp(\lambda EU_{ik}(P_{-i}))}}}$

$P_{ij}$ - вероятность выбора игроком стратегии . - ожидаемая полезность для игрока выбора стратегии при убеждении, что другие игроки играют в соответствии с распределением вероятностей . Обратите внимание, что плотность «убеждений» в ожидаемом выигрыше на правой стороне должна соответствовать плотности выбора на левой стороне. Таким образом, вычисление ожиданий наблюдаемых величин, таких как выигрыш, спрос, выпуск и т. д., требует нахождения фиксированных точек, как в теории среднего поля . ^[3] $я$ $j$ $EU_{ij}(P_{-i})$ $я$ $j$ $P_{-i}$

Особый интерес в логит-модели представляет неотрицательный параметр λ (иногда его записывают как 1/μ). λ можно рассматривать как параметр рациональности. При λ→0 игроки становятся «совершенно нерациональными» и разыгрывают каждую стратегию с равной вероятностью. При λ→∞ игроки становятся «совершенно рациональными» и игра приближается к равновесию Нэша. ^[4]

Для динамичных игр

Для динамических ( расширенной формы ) игр Маккелви и Палфри определили квантовое равновесие реакции агента ( AQRE ). AQRE в некоторой степени аналогично совершенству подигры . В AQRE каждый игрок играет с некоторой ошибкой, как в QRE. В заданном узле принятия решения игрок определяет ожидаемый выигрыш каждого действия, рассматривая свое будущее «я» как независимого игрока с известным распределением вероятностей по действиям. Как и в QRE, в AQRE каждая стратегия используется с ненулевой вероятностью.

Приложения

Подход квантового равновесия отклика применялся в различных условиях. Например, Goeree et al. (2002) изучают переоценку ставок на частных аукционах, ^[5] Yi (2005) исследует поведение в ультимативных играх, ^[6] Hoppe и Schmitz (2013) изучают роль социальных предпочтений в задачах принципала-агента, ^[7] а Kawagoe et al. (2018) исследуют игры с общественными благами на уровне шагов с бинарными решениями. ^[8]

Большинство тестов квантового равновесия реакции основаны на экспериментах, в которых участники не мотивированы или мотивированы только в небольшой степени хорошо выполнять задачу. Однако квантовое равновесие реакции также объясняет поведение в условиях высоких ставок. Например, масштабный анализ американского телевизионного игрового шоу The Price Is Right показывает, что поведение участников в так называемой Showcase Showdown, последовательной игре с идеальной информацией , может быть хорошо объяснено моделью квантового равновесия реакции агента (AQRE). ^[9]

Критика

Нефальсифицируемость

Работа Хайле и др. показала, что QRE не поддается фальсификации в любой нормальной форме игры, даже при наличии существенных априорных ограничений на возмущения выплат. ^[10] Авторы утверждают, что концепция LQRE иногда может ограничивать набор возможных результатов игры, но может оказаться недостаточной для обеспечения мощного теста поведения без априорных ограничений на возмущения выплат.

Потеря информации

Как и в статистической механике, подход среднего поля, в частности ожидание в показателе степени, приводит к потере информации. ^[11] В более общем плане, различия в выплате агента относительно его стратегической переменной приводят к потере информации.

Смотрите также

Ссылки

^ Маккелви, Ричард ; Палфри, Томас (1995). «Равновесия квантового отклика для игр в нормальной форме». Игры и экономическое поведение . 10 : 6–38. CiteSeerX 10.1.1.30.5152 . doi :10.1006/game.1995.1023.
^ Маккелви, Ричард ; Палфри, Томас (1998). «Равновесия квантового отклика для игр в развернутой форме» (PDF) . Экспериментальная экономика . 1 : 9–41. doi :10.1007/BF01426213.
^ Андерсон, Саймон П.; Гури, Джейкоб К.; Холт, Чарльз А. (2004). «Шумное направленное обучение и логарифмическое равновесие». The Scandinavian Journal of Economics . 106 (3): 581–602. CiteSeerX 10.1.1.81.8574 . doi :10.1111/j.0347-0520.2004.00378.x. S2CID 14404020.
^ Goeree, Jacob K.; Holt, Charles A.; Palfrey, Thomas R. (август 2018 г.). «Стохастическая теория игр для социальных наук: практическое руководство по квантовому равновесию откликов» (PDF) . стр. 10–11. Архивировано (PDF) из оригинала 4 августа 2023 г.
^ Goeree, Jacob K.; Holt, Charles A.; Palfrey, Thomas R. (2002). «Quantal Response Equilibrium and Overbidding in Private-Value Auctions» (PDF) . Journal of Economic Theory . 104 (1): 247–272. doi :10.1006/jeth.2001.2914. ISSN 0022-0531.
^ Yi, Kang-Oh (2005). «Модели равновесия квантового отклика в игре ультимативных переговоров». Игры и экономическое поведение . 51 (2): 324–348. doi :10.1016/s0899-8256(03)00051-4. ISSN 0899-8256.
^ Хоппе, Ева И.; Шмитц, Патрик В. (2013). «Заключение контрактов в условиях неполной информации и социальных предпочтений: экспериментальное исследование». Обзор экономических исследований . 80 (4): 1516–1544. doi :10.1093/restud/rdt010.
^ Кавагоэ, Тошиджи; Мацубаэ, Тайсукэ; Такидзава, Хироказу (2018). «Равновесия квантового ответа в обобщенной дилемме добровольца и игры с общественными благами на уровне шагов с бинарным решением». Обзор эволюционной и институциональной экономики . 15 (1): 11–23. doi :10.1007/s40844-017-0081-6. ISSN 1349-4961. S2CID 189937929.
^ Кляйн Тизлинк, Буке; ван Долдер, Денни; ван ден Асем, Мартин Дж.; Дана, Джейсон (29 июня 2022 г.). «Ошибки обратной индукции с высокими ставками: свидетельства правильной цены». ССНН 4130176. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ Хайле, Филип А.; Хортачу, Али ; Косенок, Григорий (2008). «Об эмпирическом содержании квантового равновесия отклика». American Economic Review . 98 (1): 180–200. CiteSeerX 10.1.1.193.7715 . doi :10.1257/aer.98.1.180. S2CID 3083373.
^ Джесси, Дэниел Т.; Саари, Дональд Г. (2016). «От аксиомы выбора Люса к равновесию квантового отклика». Журнал математической психологии . 75 : 3–9. doi :10.1016/j.jmp.2015.10.001.