stringtranslate.com

Теорема очищения

В теории игр теорема об очищении была предложена лауреатом Нобелевской премии Джоном Харсани в 1973 году. [1] Теорема объясняет загадочный аспект равновесия Нэша в смешанной стратегии : каждый игрок совершенно безразличен между каждым из действий, которым он придает ненулевой вес, однако он смешивает их так, чтобы сделать безразличным каждого другого игрока.

Теорема очищения показывает, как такие равновесия смешанной стратегии могут возникнуть, даже если каждый игрок играет чистую стратегию, пока игроки имеют неполную информацию о выигрышах своих противников. Такие стратегии возникают как предел серии равновесий чистой стратегии для нарушенной игры неполной информации , в которой выигрыши каждого игрока известны ему самому, но не его противникам. Идея состоит в том, что предсказанная смешанная стратегия исходной игры возникает из постоянно улучшающихся приближений игры, которая не наблюдается теоретиком, который разработал исходную, идеализированную игру.

Кажущаяся смешанная природа стратегии на самом деле является просто результатом того, что каждый игрок играет чистую стратегию с пороговыми значениями, которые зависят от распределения ex-ante по континууму выплат, которые может иметь игрок. По мере того, как этот континуум сжимается до нуля, стратегии игроков сходятся к предсказанным равновесиям Нэша исходной, невозмущенной, полной информационной игры.

Результат также является важным аспектом современных исследований в эволюционной теории игр , где возмущенные значения интерпретируются как распределения по типам игроков, случайным образом объединенных в пары для игры.

Пример

Рассмотрим игру Ястреб–Голубь, показанную здесь. В игре есть два чистых стратегических равновесия (Предательство, Сотрудничество) и (Сотрудничество, Предательство). Также есть смешанное равновесие, в котором каждый игрок играет Сотрудничество с вероятностью 2/3.

Предположим, что каждый игрок i несет дополнительные издержки a i от игры в Cooperate, которые равномерно распределены на [− AA ]. Игроки знают только свою собственную стоимость этих издержек. Таким образом, это игра с неполной информацией , которую мы можем решить, используя байесовское равновесие Нэша . Вероятность того, что a ia*, равна ( a* + A )/2 A . Если игрок 2 сотрудничает, когда a 2a* , то ожидаемая полезность игрока 1 от Cooperate равна a 1 + 3( a* + A )/2 A + 2(1 − ( a* + A )/2 A ) ; его ожидаемая полезность от Defective равна 4( a* + A )/2 A . Следовательно, он сам должен Cooperate, когда a 1 ≤ 2 - 3( a* + A )/2 A . Ища симметричное равновесие, где оба игрока сотрудничают, если a ia* , мы решаем это для a* = 1/(2 + 3/ A ). Теперь, когда мы вычислили a* , мы можем вычислить вероятность того, что каждый игрок играет в Cooperate, как

При A → 0 эта вероятность приближается к 2/3 — та же самая вероятность, что и в смешанной стратегии в игре с полной информацией.

Таким образом, мы можем рассматривать равновесие смешанной стратегии как результат чистых стратегий, применяемых игроками, имеющими небольшой объем частной информации о своих выигрышах.

Технические подробности

Доказательство Харсаньи включает в себя сильное предположение, что возмущения для каждого игрока независимы от других игроков. Однако были предприняты дальнейшие уточнения, чтобы сделать теорему более общей. [2] [3]

Главный результат теоремы заключается в том, что все равновесия смешанных стратегий данной игры могут быть очищены с использованием той же последовательности возмущенных игр. Однако, в дополнение к независимости возмущений, она опирается на то, что множество выигрышей для этой последовательности игр является полномерным. Существуют игры патологического характера, для которых это условие не выполняется.

Основная проблема с этими играми попадает в одну из двух категорий: (1) различные смешанные стратегии игры очищаются различными последовательностями возмущенных игр и (2) некоторые смешанные стратегии игры включают слабо доминируемые стратегии. Никакая смешанная стратегия, включающая слабо доминируемую стратегию, не может быть очищена с помощью этого метода, потому что если когда-либо есть какая-либо неотрицательная вероятность того, что противник будет играть стратегию, для которой слабо доминируемая стратегия не является лучшим ответом, то никто никогда не захочет играть слабо доминируемую стратегию. Следовательно, предел не выполняется, потому что он включает разрыв. [4]

Ссылки

  1. ^ Харсани, Джон К. (1973). «Игры со случайно нарушенными выплатами: новое обоснование точек равновесия в смешанных стратегиях». Международный журнал теории игр . 2 : 1–23. doi : 10.1007/BF01737554. S2CID  154484458.
  2. ^ Ауманн, Р. Дж .; Кацнельсон, И .; Раднер, Р .; Розенталь, Р. Вайс, Б. ( 1983). «Приблизительная очистка смешанных стратегий». Математика исследования операций . 8 (3): 327–341. CiteSeerX 10.1.1.422.3903 . doi :10.1287/moor.8.3.327. 
  3. ^ Говиндан, Шрихари; Рени, Филип Дж.; Робсон, Артур Дж. (2003). «Краткое доказательство теоремы очищения Харсаньи». Игры и экономическое поведение . 45 (2): 369–374. doi :10.1016/S0899-8256(03)00149-0.
  4. ^ Фьюденберг, Дрю ; Тироль, Жан (1991). Теория игр . MIT Press. стр. 233–234. ISBN 9780262061414.