Доминирование риска и доминирование выигрыша — это два связанных уточнения концепции решения равновесия Нэша (NE) в теории игр , определенных Джоном Харсани и Рейнхардом Селтеном . Равновесие Нэша считается доминирующим по выигрышу, если оно превосходит по Парето все другие равновесия Нэша в игре. 1 При выборе между равновесиями все игроки согласятся на равновесие с доминирующим по выигрышу, поскольку оно предлагает каждому игроку по крайней мере столько же выигрыша, сколько и другие равновесия Нэша. И наоборот, равновесие Нэша считается доминирующим по риску, если оно имеет наибольшую область притяжения (т. е. менее рискованно). Это означает, что чем больше у игроков неопределенности относительно действий другого игрока(ов), тем более вероятно, что они выберут соответствующую ему стратегию.
Матрица выплат на рисунке 1 представляет собой простой пример игры с двумя игроками и двумя стратегиями с двумя чистыми равновесиями Нэша. Пара стратегий (Охота, Охота) доминирует по выплатам, поскольку выплаты выше для обоих игроков по сравнению с другим чистым NE (Сбор, Сбор). С другой стороны, риск (Сбор, Сбор) доминирует над (Охота, Охота), поскольку если существует неопределенность относительно действий другого игрока, сбор обеспечит более высокий ожидаемый выигрыш. Игра на рисунке 1 представляет собой известную дилемму теории игр, называемую охотой на оленя . Обоснование этого заключается в том, что коллективное действие (охота) дает более высокую отдачу, если все игроки объединяют свои навыки, но если неизвестно, помогает ли другой игрок в охоте, сбор может оказаться лучшей индивидуальной стратегией для обеспечения продовольствием, поскольку он не зависит от координации с другим игроком. Кроме того, сбор в одиночку предпочтительнее сбора в соревновании с другими. Как и дилемма заключенного , она объясняет, почему коллективные действия могут потерпеть неудачу при отсутствии надежных обязательств .
Игра, представленная на рисунке 2, является координационной игрой , если для игрока 1 (строки): A > B, D > C, а для игрока 2 (столбцы): a > b, d > c. Тогда пары стратегий (H, H) и (G, G) являются единственными чистыми равновесиями Нэша. Кроме того, существует смешанное равновесие Нэша, где игрок 1 играет H с вероятностью p = (dc)/(ab-c+d) и G с вероятностью 1–p; игрок 2 играет H с вероятностью q = (DC)/(AB-C+D) и G с вероятностью 1–q.
Выигрыш пары стратегий (H, H) доминирует над (G, G), если A ≥ D, a ≥ d и хотя бы одно из двух является строгим неравенством: A > D или a > d.
Риск пары стратегий (G, G) доминирует над (H, H), если произведение потерь от отклонения выше для (G, G) (Harsanyi и Selten, 1988, Lemma 5.4.4). Другими словами, если выполняется следующее неравенство: (C – D)(c – d)≥(B – A)(b – a) . Если неравенство строгое, то (G, G) строго доминирует над (H, H). 2 (То есть у игроков больше стимулов отклоняться).
Если игра симметрична, то есть если A = a, B = b и т. д., неравенство допускает простую интерпретацию: мы предполагаем, что игроки не уверены в том, какую стратегию выберет противник, и назначаем вероятности для каждой стратегии. Если каждый игрок назначает вероятности ½ для H и G каждому, то риск (G, G) доминирует над (H, H), если ожидаемый выигрыш от игры G превышает ожидаемый выигрыш от игры H: ½ B + ½ D ≥ ½ A + ½ C , или просто B + D ≥ A + C .
Другой способ расчета равновесия с доминирующим риском — это расчет фактора риска для всех равновесий и нахождение равновесия с наименьшим фактором риска. Чтобы рассчитать фактор риска в нашей игре 2x2, рассмотрим ожидаемый выигрыш игрока, если он сыграет H: (где p — вероятность того, что другой игрок сыграет H), и сравните его с ожидаемым выигрышем, если он сыграет G: . Значение p , которое делает эти два ожидаемых значения равными, является фактором риска для равновесия (H, H) с фактором риска для игры (G, G). Вы также можете рассчитать фактор риска для игры (G, G), выполнив тот же расчет, но установив p как вероятность того, что другой игрок сыграет G. Интерпретация для p заключается в том, что это наименьшая вероятность того, что противник должен сыграть эту стратегию, так что собственный выигрыш человека от копирования стратегии противника больше, чем если бы была сыграна другая стратегия.
Ряд эволюционных подходов установили, что при игре в большой популяции игроки могут не использовать стратегию равновесия с доминированием выплат и вместо этого оказаться в равновесии с доминированием выплат и доминированием рисков. Две отдельные эволюционные модели поддерживают идею о том, что равновесие с доминированием рисков более вероятно. Первая модель, основанная на динамике репликатора , предсказывает, что популяция с большей вероятностью примет равновесие с доминированием рисков, чем равновесие с доминированием выплат. Вторая модель, основанная на пересмотре и мутации наилучшей стратегии реагирования , предсказывает, что состояние с доминированием рисков является единственным стохастически устойчивым равновесием. Обе модели предполагают, что в популяции из N игроков разыгрываются несколько игр с двумя игроками. Игроки случайным образом подбираются к соперникам, причем каждый игрок имеет равные вероятности вытянуть любого из N−1 других игроков. Игроки начинают с чистой стратегии, G или H, и разыгрывают эту стратегию против своего противника. В динамике репликатора игра с популяцией повторяется в последовательных поколениях, где субпопуляции изменяются в зависимости от успеха выбранных ими стратегий. В лучшем ответе игроки обновляют свои стратегии, чтобы улучшить ожидаемые выигрыши в последующих поколениях. Признание Кандори, Майлата и Роба (1993) и Янга (1993) состояло в том, что если правило обновления стратегии допускает мутацию 4 , и вероятность мутации исчезает, т.е. асимптотически достигает нуля с течением времени, вероятность того, что будет достигнуто равновесие с доминированием риска, стремится к единице, даже если это доминирование выигрыша. 3