Доминирование риска

Доминирование риска и доминирование выигрыша — это два связанных уточнения концепции решения равновесия Нэша (NE) в теории игр , определенных Джоном Харсани и Рейнхардом Селтеном . Равновесие Нэша считается доминирующим по выигрышу, если оно превосходит по Парето все другие равновесия Нэша в игре. ¹ При выборе между равновесиями все игроки согласятся на равновесие с доминирующим по выигрышу, поскольку оно предлагает каждому игроку по крайней мере столько же выигрыша, сколько и другие равновесия Нэша. И наоборот, равновесие Нэша считается доминирующим по риску, если оно имеет наибольшую область притяжения (т. е. менее рискованно). Это означает, что чем больше у игроков неопределенности относительно действий другого игрока(ов), тем более вероятно, что они выберут соответствующую ему стратегию.

Матрица выплат на рисунке 1 представляет собой простой пример игры с двумя игроками и двумя стратегиями с двумя чистыми равновесиями Нэша. Пара стратегий (Охота, Охота) доминирует по выплатам, поскольку выплаты выше для обоих игроков по сравнению с другим чистым NE (Сбор, Сбор). С другой стороны, риск (Сбор, Сбор) доминирует над (Охота, Охота), поскольку если существует неопределенность относительно действий другого игрока, сбор обеспечит более высокий ожидаемый выигрыш. Игра на рисунке 1 представляет собой известную дилемму теории игр, называемую охотой на оленя . Обоснование этого заключается в том, что коллективное действие (охота) дает более высокую отдачу, если все игроки объединяют свои навыки, но если неизвестно, помогает ли другой игрок в охоте, сбор может оказаться лучшей индивидуальной стратегией для обеспечения продовольствием, поскольку он не зависит от координации с другим игроком. Кроме того, сбор в одиночку предпочтительнее сбора в соревновании с другими. Как и дилемма заключенного , она объясняет, почему коллективные действия могут потерпеть неудачу при отсутствии надежных обязательств .

Формальное определение

Игра, представленная на рисунке 2, является координационной игрой , если для игрока 1 (строки): A > B, D > C, а для игрока 2 (столбцы): a > b, d > c. Тогда пары стратегий (H, H) и (G, G) являются единственными чистыми равновесиями Нэша. Кроме того, существует смешанное равновесие Нэша, где игрок 1 играет H с вероятностью p = (dc)/(ab-c+d) и G с вероятностью 1–p; игрок 2 играет H с вероятностью q = (DC)/(AB-C+D) и G с вероятностью 1–q.

Выигрыш пары стратегий (H, H) доминирует над (G, G), если A ≥ D, a ≥ d и хотя бы одно из двух является строгим неравенством: A > D или a > d.

Риск пары стратегий (G, G) доминирует над (H, H), если произведение потерь от отклонения выше для (G, G) (Harsanyi и Selten, 1988, Lemma 5.4.4). Другими словами, если выполняется следующее неравенство: (C – D)(c – d)≥(B – A)(b – a) . Если неравенство строгое, то (G, G) строго доминирует над (H, H). ² (То есть у игроков больше стимулов отклоняться).

Если игра симметрична, то есть если A = a, B = b и т. д., неравенство допускает простую интерпретацию: мы предполагаем, что игроки не уверены в том, какую стратегию выберет противник, и назначаем вероятности для каждой стратегии. Если каждый игрок назначает вероятности ½ для H и G каждому, то риск (G, G) доминирует над (H, H), если ожидаемый выигрыш от игры G превышает ожидаемый выигрыш от игры H: ½ B + ½ D ≥ ½ A + ½ C , или просто B + D ≥ A + C .

Другой способ расчета равновесия с доминирующим риском — это расчет фактора риска для всех равновесий и нахождение равновесия с наименьшим фактором риска. Чтобы рассчитать фактор риска в нашей игре 2x2, рассмотрим ожидаемый выигрыш игрока, если он сыграет H: (где p — вероятность того, что другой игрок сыграет H), и сравните его с ожидаемым выигрышем, если он сыграет G: . Значение p , которое делает эти два ожидаемых значения равными, является фактором риска для равновесия (H, H) с фактором риска для игры (G, G). Вы также можете рассчитать фактор риска для игры (G, G), выполнив тот же расчет, но установив p как вероятность того, что другой игрок сыграет G. Интерпретация для p заключается в том, что это наименьшая вероятность того, что противник должен сыграть эту стратегию, так что собственный выигрыш человека от копирования стратегии противника больше, чем если бы была сыграна другая стратегия. $E[\pi _{H}]=pA+(1-p)C$ $E[\pi _{G}]=pB+(1-p)D$ $1-п$

Выбор равновесия

Ряд эволюционных подходов установили, что при игре в большой популяции игроки могут не использовать стратегию равновесия с доминированием выплат и вместо этого оказаться в равновесии с доминированием выплат и доминированием рисков. Две отдельные эволюционные модели поддерживают идею о том, что равновесие с доминированием рисков более вероятно. Первая модель, основанная на динамике репликатора , предсказывает, что популяция с большей вероятностью примет равновесие с доминированием рисков, чем равновесие с доминированием выплат. Вторая модель, основанная на пересмотре и мутации наилучшей стратегии реагирования , предсказывает, что состояние с доминированием рисков является единственным стохастически устойчивым равновесием. Обе модели предполагают, что в популяции из N игроков разыгрываются несколько игр с двумя игроками. Игроки случайным образом подбираются к соперникам, причем каждый игрок имеет равные вероятности вытянуть любого из N−1 других игроков. Игроки начинают с чистой стратегии, G или H, и разыгрывают эту стратегию против своего противника. В динамике репликатора игра с популяцией повторяется в последовательных поколениях, где субпопуляции изменяются в зависимости от успеха выбранных ими стратегий. В лучшем ответе игроки обновляют свои стратегии, чтобы улучшить ожидаемые выигрыши в последующих поколениях. Признание Кандори, Майлата и Роба (1993) и Янга (1993) состояло в том, что если правило обновления стратегии допускает мутацию ⁴ , и вероятность мутации исчезает, т.е. асимптотически достигает нуля с течением времени, вероятность того, что будет достигнуто равновесие с доминированием риска, стремится к единице, даже если это доминирование выигрыша. ³

Примечания

^1 Единственное равновесие Нэша тривиально доминирует по выплатам и риску, если это единственное равновесие Нэша в игре.
^2 Аналогичные различия между строгим и слабым существуют для большинства определений здесь, но они не обозначены явно, если в этом нет необходимости.
^3 Харсани и Селтен (1988) предполагают, что равновесие с доминированием выигрыша является рациональным выбором в игре «Охота на оленя», однако Харсани (1995) отказался от этого вывода, приняв доминирование риска в качестве соответствующего критерия выбора.

Ссылки

Сэмюэл Боулз: Микроэкономика: поведение, институты и эволюция , Princeton University Press, стр. 45–46 (2004) ISBN 0-691-09163-3
Дрю Фьюденберг и Дэвид К. Левин: Теория обучения в играх , MIT Press, стр. 27 (1999) ISBN 0-262-06194-5
Джон К. Харсани: «Новая теория выбора равновесия для игр с полной информацией», Игры и экономическое поведение 8, стр. 91–122 (1995)
Джон К. Харсани и Рейнхард Селтен: Общая теория равновесного выбора в играх , MIT Press (1988) ISBN 0-262-08173-3
Мичихиро Кандори , Джордж Дж. Майлат и Рафаэль Роб : «Обучение, мутация и долгосрочное равновесие в играх», Econometrica 61, стр. 29–56 (1993) Аннотация
Роджер Б. Майерсон: Теория игр, анализ конфликта , Издательство Гарвардского университета, стр. 118–119 (1991) ISBN 0-674-34115-5
Ларри Самуэльсон : Эволюционные игры и равновесный отбор , MIT Press (1997) ISBN 0-262-19382-5
Х. Пейтон Янг: «Эволюция соглашений», Econometrica , 61, стр. 57–84 (1993) Аннотация
Х. Пейтон Янг: Индивидуальная стратегия и социальная структура , Princeton University Press (1998) ISBN 0-691-08687-7