Matching pennies — это некооперативная игра, изучаемая в теории игр . В нее играют два игрока, Even и Odd. У каждого игрока есть пенни , и он должен тайно перевернуть пенни орлом или решкой. Затем игроки одновременно раскрывают свой выбор. Если пенни совпадают (оба орла или обе решки), то Even выигрывает и оставляет себе оба пенни. Если пенни не совпадают (один орел и одна решка), то Odd выигрывает и оставляет себе оба пенни.
Теория
Matching Pennies — это игра с нулевой суммой , поскольку выигрыш или потеря полезности каждого участника точно уравновешивается потерями или выигрышами полезности других участников. Если суммировать общие выигрыши участников и вычесть их общие потери, то сумма будет равна нулю.
Игру можно записать в виде матрицы выплат (на фото справа - с точки зрения Эвена). Каждая ячейка матрицы показывает выплаты двух игроков, причем выплаты Эвена указаны первыми.
В этой игре нет равновесия Нэша чистой стратегии , поскольку нет чистой стратегии (орел или решка), которая является наилучшим ответом на лучший ответ. Другими словами, нет пары чистых стратегий, таких, что ни один из игроков не захотел бы поменяться, если бы ему сказали, что сделает другой. Вместо этого уникальное равновесие Нэша в этой игре заключается в смешанных стратегиях : каждый игрок выбирает орел или решку с равной вероятностью. [2] Таким образом, каждый игрок делает другого безразличным к выбору орла или решки, поэтому ни у одного из игроков нет стимула пробовать другую стратегию. Функции наилучшего ответа для смешанных стратегий изображены на рисунке 1 ниже:
Когда любой из игроков выбирает равновесие, ожидаемый выигрыш каждого равен нулю.
Варианты
Изменение выплат в матрице может изменить точку равновесия. Например, в таблице, показанной справа, у Even есть шанс выиграть 7, если и он, и Odd сыграют в «Орел». Чтобы вычислить точку равновесия в этой игре, обратите внимание, что игрок, играющий смешанную стратегию, должен быть безразличен между своими двумя действиями (иначе он переключился бы на чистую стратегию). Это дает нам два уравнения:
Для игрока «Чет» ожидаемый выигрыш при игре «Орел» равен , а при игре «Решка» (где — вероятность того, что игрок «Нечет» выпадет «Орел»), и они должны быть равны, поэтому .
Для игрока «Нечет» ожидаемый выигрыш при игре «Орел» равен , а при игре «Решка» (где — вероятность игры «Орел » игроком «Чет»), и они должны быть равны, поэтому .
Обратите внимание, что поскольку — вероятность выпадения орла для нечетного варианта , а — вероятность выпадения орла для четного варианта , изменение выигрыша четного варианта влияет на стратегию равновесия нечетного варианта, а не на собственную стратегию равновесия четного варианта. Сначала это может показаться нелогичным. Рассуждение заключается в том, что в равновесии выборы должны быть одинаково привлекательными. Возможность +7 для четного варианта очень привлекательна по сравнению с +1, поэтому для поддержания равновесия игра нечетного варианта должна снизить вероятность этого результата, чтобы компенсировать и уравнять ожидаемые значения двух вариантов, то есть в равновесии нечетный вариант будет выбирать орел реже, а решку — чаще.
Лабораторные эксперименты
Игроки-люди не всегда играют в стратегию равновесия. Лабораторные эксперименты выявляют несколько факторов, которые заставляют игроков отклоняться от стратегии равновесия, особенно если игра в сопоставление пенни повторяется:
Люди не очень хороши в рандомизации. Они могут попытаться создать «случайные» последовательности, переключая свои действия с орла на решку и наоборот, но они переключают свои действия слишком часто (из-за ошибки игрока ). Это позволяет опытным игрокам предсказывать свои следующие действия с вероятностью успеха более 50%. Таким образом, может быть достигнут положительный ожидаемый выигрыш .
Люди обучены обнаруживать закономерности. Они пытаются обнаружить закономерности в последовательности противника, даже если таковых не существует, и соответствующим образом корректируют свою стратегию. [3]
Поведение людей зависит от эффектов фрейминга . [4] Когда нечетного игрока называют «заблуждающимся», а четного — «угадателем», первый фокусируется на попытках рандомизировать, а последний — на попытках обнаружить закономерность, и это увеличивает шансы на успех угадывающего. Кроме того, тот факт, что четный выигрывает, когда есть совпадение, дает ему преимущество, поскольку люди лучше сопоставляют, чем не сопоставляют (из-за эффекта совместимости стимула и реакции ).
Более того, когда матрица выигрышей асимметрична, на поведение человека влияют и другие факторы, даже если игра не повторяется:
Игроки склонны увеличивать вероятность игры в действие, которое дает им более высокий выигрыш, например, в матрице выигрышей выше, Even будет склонен играть больше орлов. Это интуитивно понятно, но это не равновесие Нэша: как объяснялось выше, вероятность смешивания игрока должна зависеть только от выигрыша другого игрока, а не от его собственного выигрыша. Это отклонение можно объяснить как равновесие квантового ответа . [5] [6] В равновесии квантового ответа кривые наилучшего ответа не острые, как в стандартном равновесии Нэша. Вместо этого они плавно переходят от действия, вероятность которого равна 0, к действию, вероятность которого равна 1 (другими словами, в то время как в равновесии Нэша игрок выбирает наилучший ответ с вероятностью 1 и наихудший ответ с вероятностью 0, в равновесии квантового ответа игрок выбирает наилучший ответ с высокой вероятностью, которая меньше 1, и наихудший ответ с меньшей вероятностью, которая больше 0). Точка равновесия — это точка пересечения сглаженных кривых двух игроков, которая отличается от точки равновесия Нэша.
Эффекты собственной выгоды смягчаются неприятием риска . [7] Игроки склонны недооценивать высокие выигрыши и переоценивать высокие потери; это сдвигает кривые квантового отклика и изменяет точку равновесия квантового отклика. Это, по-видимому, противоречит теоретическим результатам относительно нерелевантности неприятие риска в конечно-повторяющихся играх с нулевой суммой. [8]
Реальные данные
Выводы лабораторных экспериментов подвергались критике по нескольким причинам. [9] [10]
Игры в лабораторных экспериментах являются искусственными и упрощенными и не имитируют реальное поведение.
Выигрыши в лабораторных экспериментах невелики, поэтому у испытуемых нет особого стимула играть оптимально. В реальной жизни рынок может наказывать такую иррациональность и заставлять игроков вести себя более рационально.
У испытуемых есть и другие соображения, помимо максимизации денежной выгоды, например, желание не выглядеть глупо или угодить экспериментатору.
Лабораторные эксперименты длятся недолго, и у испытуемых нет достаточного времени для изучения оптимальной стратегии.
Чтобы преодолеть эти трудности, несколько авторов провели статистический анализ профессиональных спортивных игр. Это игры с нулевой суммой и очень высокими выплатами, и игроки посвятили свою жизнь тому, чтобы стать экспертами. Часто такие игры стратегически похожи на сопоставление пенни:
В футбольных пенальти у бьющего есть два варианта — удар влево или удар вправо, а у вратаря есть два варианта — прыжок влево или прыжок вправо. [11] Вероятность забить гол бьющим выше, когда выборы не совпадают, и ниже, когда выборы совпадают. В целом, выигрыши асимметричны, потому что у каждого бьющего нога сильнее (обычно правая), и его шансы выше при ударе в противоположном направлении (влево). При тщательном изучении действий бьющих и вратарей было обнаружено [9] [10] , что их действия не отклоняются значительно от прогноза равновесия Нэша.
В теннисных играх с подачей и приемом ситуация похожая. Было обнаружено [12] , что коэффициенты выигрышей соответствуют гипотезе минимакса, но выбор игроков не случаен: даже профессиональные теннисисты не очень хороши в рандомизации и слишком часто меняют свои действия.
Смотрите также
Чёт и нечёт — игра с той же стратегической структурой, в которую играют пальцами вместо монет.
Камень, ножницы, бумага — похожая игра, в которой у каждого игрока есть три стратегии вместо двух.
Игра на четность — гораздо более сложная логическая игра для двух игроков, играемая на цветном графе.
Ссылки
^ Гиббонс, Роберт (1992). Теория игр для прикладных экономистов. Princeton University Press. С. 29–33. ISBN 978-0-691-00395-5.
^ "Matching Pennies". GameTheory.net. Архивировано из оригинала 2006-10-01.
^ Мукерджи, Дилип; Софер, Барри (1994). «Обучающее поведение в экспериментальной игре «Соответствие пенни». Игры и экономическое поведение . 7 : 62–91. doi :10.1006/game.1994.1037.
^ Элиаз, Кфир; Рубинштейн, Ариэль (2011). «Загадка Эдгара Аллана По: Эффекты обрамления в повторяющихся играх с сопоставлением пенни». Игры и экономическое поведение . 71 : 88–99. doi :10.1016/j.geb.2009.05.010.
^ Окс, Джек (1995). «Игры с уникальными, смешанными стратегическими равновесиями: экспериментальное исследование». Игры и экономическое поведение . 10 : 202–217. doi :10.1006/game.1995.1030.
^ Маккелви, Ричард ; Палфри, Томас (1995). «Равновесия квантового отклика для игр в нормальной форме». Игры и экономическое поведение . 10 : 6–38. CiteSeerX 10.1.1.30.5152 . doi :10.1006/game.1995.1023.
^ Goeree, Jacob K.; Holt, Charles A.; Palfrey, Thomas R. (2003). «Поведение, не склонное к риску, в обобщенных играх с сопоставлением пенни» (PDF) . Игры и экономическое поведение . 45 : 97–113. doi :10.1016/s0899-8256(03)00052-6.
^ Вудерс, Джон; Шачат, Джейсон М. (2001). «О нерелевантности отношения к риску в повторяющихся играх с двумя исходами». Игры и экономическое поведение . 34 (2): 342. doi :10.1006/game.2000.0808. S2CID 2401322.
^ ab Chiappori, P.; Levitt, S .; Groseclose, T. (2002). «Тестирование равновесий смешанной стратегии, когда игроки неоднородны: случай пенальти в футболе» (PDF) . American Economic Review . 92 (4): 1138–1151. CiteSeerX 10.1.1.178.1646 . doi :10.1257/00028280260344678. JSTOR 3083302.
^ ab Palacios-Huerta, I. (2003). «Профессионалы играют в минимакс». Обзор экономических исследований . 70 (2): 395–415. CiteSeerX 10.1.1.127.9097 . doi :10.1111/1467-937X.00249.
^ Существует также вариант удара ногой/стояния посередине, но он используется реже.
^ Уокер, Марк; Вудерс, Джон (2001). «Минимакс-игра на Уимблдоне». The American Economic Review . 91 (5): 1521–1538. CiteSeerX 10.1.1.614.5372 . doi :10.1257/aer.91.5.1521. JSTOR 2677937.