Игра в курицу , также известная как игра в ястреб-голубя или игра в снежный сугроб , [1] является моделью конфликта для двух игроков в теории игр . Принцип игры заключается в том, что в то время как идеальный результат для одного игрока — уступить (чтобы избежать худшего результата, если ни один из них не уступит), люди пытаются избежать этого из гордости, не желая выглядеть «цыплятами». Каждый игрок насмехается над другим, чтобы увеличить риск позора за уступку. Однако, когда один игрок уступает, конфликт избегается, и игра по сути заканчивается.
Название «курица» берет свое начало в игре, в которой два водителя едут навстречу друг другу по встречному курсу: один должен свернуть, или оба могут погибнуть в столкновении, но если один водитель свернёт, а другой нет, тот, кто свернул, будет назван «курица», что означает трус; эта терминология наиболее распространена в политологии и экономике . Название «ястреб–голубь» относится к ситуации, в которой происходит конкуренция за общий ресурс, и участники могут выбрать либо примирение, либо конфликт; эта терминология наиболее распространена в биологии и эволюционной теории игр . С точки зрения теории игр «курица» и «ястреб–голубь» идентичны. [1] Игра также использовалась для описания взаимного гарантированного уничтожения ядерной войны , особенно своего рода балансирования на грани войны , связанного с Карибским кризисом . [2]
Игра «цыпленок» моделирует двух водителей, направляющихся к однополосному мосту с противоположных направлений. Первый, кто свернет, уступает мост другому. Если ни один из игроков не свернет, результатом станет дорогостоящий тупик посреди моста или потенциально фатальное лобовое столкновение. Предполагается, что лучшее для каждого водителя — оставаться прямо, пока другой свернет (поскольку другой — «цыпленок», а столкновения можно избежать). Кроме того, столкновение считается наихудшим исходом для обоих игроков. Это приводит к ситуации, когда каждый игрок, пытаясь обеспечить себе лучший результат, рискует худшим.
Фраза « игра в курицу» также используется как метафора для ситуации, когда две стороны вступают в схватку, где им нечего выиграть, и только гордость удерживает их от отступления. Бертран Рассел сравнил игру в курицу с балансированием на грани ядерной войны :
С тех пор, как ядерный тупик стал очевидным, правительства Востока и Запада приняли политику, которую г-н Даллес называет «балансированием на грани». Это политика, адаптированная из спорта, которым, как мне сказали, занимаются некоторые молодые дегенераты. Этот спорт называется «Цыпленок!». В него играют, выбирая длинную прямую дорогу с белой линией посередине и запуская две очень быстрые машины навстречу друг другу с противоположных концов. Ожидается, что каждая машина будет держать колеса по одну сторону белой линии. По мере того, как они приближаются друг к другу, взаимное уничтожение становится все более и более неизбежным. Если один из них съезжает с белой линии раньше другого, другой, проезжая, кричит «Цыпленок!», и тот, кто съехал, становится объектом презрения. Поскольку в эту игру играют безответственные мальчишки, эта игра считается декадентской и безнравственной, хотя рискуют только жизнью игроков. Но когда в игру играют выдающиеся государственные деятели, которые рискуют не только своими жизнями, но и жизнями многих сотен миллионов людей, то с обеих сторон считается, что государственные деятели одной стороны проявляют высокую степень мудрости и мужества, и только государственные деятели другой стороны достойны порицания. Это, конечно, абсурд. Оба виноваты в том, что играют в такую невероятно опасную игру. Игра может быть сыграна без неудач несколько раз, но рано или поздно станет ясно, что потеря лица страшнее ядерного уничтожения. Настанет момент, когда ни одна из сторон не сможет выдержать насмешливый крик «Цыпленок!» с другой стороны. Когда наступит этот момент, государственные деятели обеих сторон ввергнут мир в пучину разрушения. [2]
Балансирование на грани фола подразумевает введение элемента неконтролируемого риска: даже если все игроки действуют рационально перед лицом риска, неконтролируемые события все равно могут спровоцировать катастрофический исход. [3] В сцене «chickie run» из фильма «Rebel Without a Cause» это происходит, когда Базз не может выбраться из машины и погибает в аварии. Противоположный сценарий происходит в Footloose , где Рен МакКормак застревает в своем тракторе и, следовательно, выигрывает игру, поскольку они не могут играть в «chicken». Похожее событие происходит в двух разных играх в фильме « The Heavenly Kid» , когда сначала Бобби, а затем Ленни застревают в своих машинах и съезжают со скалы. Базовая теоретико-игровая формулировка Chicken не содержит элемента переменного, потенциально катастрофического риска, а также является сжатием динамической ситуации в одноразовое взаимодействие.
Версия игры «ястреб–голубь» представляет двух игроков (животных), борющихся за неделимый ресурс, которые могут выбирать между двумя стратегиями, одна из которых более эскалирована, чем другая. [4] Они могут использовать демонстрацию угрозы (играть «Голубя») или физически атаковать друг друга (играть «Ястреба»). Если оба игрока выбирают стратегию «Ястреб», то они сражаются до тех пор, пока один из них не получит травму, а другой не победит. Если только один игрок выбирает «Ястреб», то этот игрок побеждает игрока «Голубь». Если оба игрока играют «Голубя», то происходит ничья, и каждый игрок получает выигрыш ниже, чем прибыль от победы ястреба над голубем.
Формальная версия игры Chicken стала предметом серьезных исследований в теории игр . [5] Здесь представлены две версии матрицы выплат для этой игры (рисунки 1 и 2). На рисунке 1 результаты представлены словами, где каждый игрок предпочел бы выиграть, чем сыграть вничью, предпочел бы сыграть вничью, чем проиграть, и предпочел бы проиграть, чем разбиться. На рисунке 2 представлены произвольно заданные числовые выплаты, которые теоретически соответствуют этой ситуации. Здесь выгода от победы равна 1, стоимость проигрыша равна -1, а стоимость разбиения равна -1000.
И Chicken, и Hawk–Dove являются антикоординационными играми , в которых игрокам выгодно играть по разным стратегиям. Таким образом, их можно рассматривать как противоположность координационной игре , где игра по одной и той же стратегии Парето доминирует над игрой по разным стратегиям. Основная концепция заключается в том, что игроки используют общий ресурс. В координационных играх совместное использование ресурса создает выгоду для всех: ресурс не является конкурентным , а совместное использование создает положительные внешние эффекты . В антикоординационных играх ресурс является конкурентным, но неисключаемым , и совместное использование имеет свою цену (или отрицательный внешний эффект).
Поскольку потеря от отклонения настолько незначительна по сравнению с аварией, которая происходит, если никто не отклоняется, разумной стратегией, по-видимому, будет отклонение до того, как столкновение станет вероятным. Тем не менее, зная это, если кто-то считает своего противника разумным, он вполне может решить не отклоняться вообще, полагая, что противник будет разумным и решит отклониться, оставив первого игрока победителем. Эту нестабильную ситуацию можно формализовать, сказав, что существует более одного равновесия Нэша , которое представляет собой пару стратегий, при которых ни один из игроков не выигрывает, изменяя свою собственную стратегию, в то время как другой остается прежним. (В этом случае чистые стратегические равновесия — это две ситуации, в которых один игрок отклоняется, а другой нет.)
В биологической литературе эта игра известна как Ястреб–Голубь. Самое раннее представление формы игры Ястреб–Голубь было сделано Джоном Мейнардом Смитом и Джорджем Прайсом в их статье «Логика конфликта животных». [6] Традиционная [4] [7] матрица выигрышей для игры Ястреб–Голубь приведена на рисунке 3, где V — стоимость оспариваемого ресурса, а C — стоимость эскалации драки. Предполагается (почти всегда), что стоимость ресурса меньше стоимости драки, т. е. C > V > 0. Если C ≤ V, то полученная игра не является игрой «Цыпленок», а представляет собой дилемму заключенного .
Точное значение выигрыша Dove против Dove варьируется в зависимости от формулировки модели. Иногда предполагается, что игроки разделят выигрыш поровну (V/2 каждый), в других случаях выигрыш предполагается равным нулю (поскольку это ожидаемый выигрыш в игре « война на истощение» , которая является предполагаемой моделью для состязания, решаемого продолжительностью показа).
Хотя игра «Ястреб–Голубь» обычно преподается и обсуждается с выплатами в терминах V и C, решения остаются верными для любой матрицы с выплатами, представленными на рисунке 4, где W > T > L > X. [7]
Биологи исследовали модифицированные версии классической игры Ястреб–Голубь, чтобы исследовать ряд биологически значимых факторов. Они включают добавление вариации в потенциале удержания ресурсов и различия в ценности выигрыша для разных игроков, [8] позволяя игрокам угрожать друг другу перед выбором ходов в игре, [9] и расширение взаимодействия на две партии игры. [10]
Одна из тактик в игре заключается в том, чтобы одна из сторон убедительно сигнализировала о своих намерениях до начала игры. Например, если одна из сторон демонстративно отключит руль прямо перед матчем, другая сторона будет вынуждена свернуть. [11] Это показывает, что в некоторых обстоятельствах сокращение собственных возможностей может быть хорошей стратегией. Одним из реальных примеров является протестующий, который приковывает себя наручниками к объекту, так что никакая угроза не может заставить его двигаться (поскольку он не может двигаться). Другой пример, взятый из художественной литературы, можно найти в фильме Стэнли Кубрика « Доктор Стрейнджлав » . В этом фильме русские пытались сдержать американское нападение, построив «машину судного дня», устройство, которое вызвало бы уничтожение мира, если бы Россия была поражена ядерным оружием или была бы предпринята какая-либо попытка разоружить ее. Однако русские планировали подать сигнал о развертывании машины через несколько дней после ее установки, но из-за неудачного хода событий это оказалось слишком поздно.
Игроки также могут делать необязательные угрозы не отклоняться. Это было явно смоделировано в игре Hawk–Dove. Такие угрозы работают, но должны быть расточительно затратными, если угроза представляет собой один из двух возможных сигналов («Я не отклонюсь» или «Я отклонюсь»), или они будут бесплатными, если есть три или более сигналов (в этом случае сигналы будут функционировать как игра « камень, ножницы, бумага »). [9]
Все антикоординационные игры имеют три равновесия Нэша . Два из них являются чистыми условными профилями стратегий, в которых каждый игрок играет одну из пары стратегий, а другой игрок выбирает противоположную стратегию. Третье — смешанное равновесие, в котором каждый игрок вероятностно выбирает между двумя чистыми стратегиями. Либо чистое, либо смешанное равновесие Нэша будет эволюционно стабильными стратегиями в зависимости от того, существуют ли некоррелированные асимметрии .
Наилучшее отображение ответа для всех игр 2x2 антикоординации показано на рисунке 5. Переменные x и y на рисунке 5 являются вероятностями игры эскалированной стратегии («Ястреб» или «Не отклоняйся») для игроков X и Y соответственно. Линия на графике слева показывает оптимальную вероятность игры эскалированной стратегии для игрока Y как функцию x . Линия на втором графике показывает оптимальную вероятность игры эскалированной стратегии для игрока X как функцию y (оси не были повернуты, поэтому зависимая переменная нанесена на абсциссу , а независимая переменная нанесена на ординату ). Равновесия Нэша находятся там, где соответствия игроков совпадают, т. е. пересекаются. Они показаны точками на правом графике. Наилучшие отображения ответа совпадают (т. е. пересекаются) в трех точках. Первые два равновесия Нэша находятся в верхнем левом и нижнем правом углах, где один игрок выбирает одну стратегию, другой игрок выбирает противоположную стратегию. Третье равновесие Нэша — это смешанная стратегия, которая лежит по диагонали от нижнего левого до верхнего правого угла. Если игроки не знают, кто из них кто, то смешанное равновесие Нэша является эволюционно стабильной стратегией (ESS), поскольку игра ограничена диагональной линией от нижнего левого до верхнего правого угла. В противном случае говорят, что существует некоррелированная асимметрия, и угловые равновесия Нэша являются ESS.
ESS для игры Ястреб–Голубь представляет собой смешанную стратегию. Формальная теория игр безразлична к тому, является ли эта смесь результатом того, что все игроки в популяции выбирают случайным образом между двумя чистыми стратегиями (диапазон возможных инстинктивных реакций для одной ситуации) или популяция представляет собой полиморфную смесь игроков, нацеленных на выбор определенной чистой стратегии (одной реакции, отличающейся от особи к особи). Биологически эти два варианта являются поразительно разными идеями. Игра Ястреб–Голубь использовалась в качестве основы для эволюционного моделирования, чтобы исследовать, какой из этих двух режимов смешивания должен преобладать в реальности. [12]
В обоих вариантах «Chicken» и «Hawk–Dove» единственным симметричным равновесием Нэша является равновесие Нэша смешанной стратегии , где оба человека случайным образом выбирают между игрой Hawk/Straight или Dove/Swerve. Это равновесие смешанной стратегии часто не является оптимальным — оба игрока добились бы большего успеха, если бы могли каким-то образом координировать свои действия. Это наблюдение было сделано независимо в двух разных контекстах с почти идентичными результатами. [13]
Рассмотрим версию «Цыпленка», изображенную на рисунке 6. Как и все формы игры, существует три равновесия Нэша . Два равновесия Нэша в чистой стратегии — это ( D , C ) и ( C , D ). Существует также равновесие в смешанной стратегии , где каждый игрок делает риск с вероятностью 1/3. Это приводит к ожидаемым выплатам 14/3 = 4,667 для каждого игрока.
Теперь рассмотрим третью сторону (или некоторое естественное событие), которая вытягивает одну из трех карт, помеченных как ( C , C ), ( D , C ) и ( C , D ). Предполагается, что это экзогенное событие вытягивания равномерно случайно по 3 результатам. После вытягивания карты третья сторона сообщает игрокам о стратегии, назначенной им на карте (но не о стратегии, назначенной их противнику). Предположим, что игроку назначено D , он не хотел бы отклоняться, предполагая, что другой игрок сыграл назначенную ему стратегию, поскольку он получит 7 (наивысший возможный выигрыш). Предположим, что игроку назначено C . Тогда другому игроку назначено C с вероятностью 1/2 и D с вероятностью 1/2 (из-за природы экзогенного вытягивания). Ожидаемая полезность Смелости составляет 0(1/2) + 7(1/2) = 3,5, а ожидаемая полезность трусости составляет 2(1/2) + 6(1/2) = 4. Таким образом, игрок предпочтет трусить.
Поскольку ни один из игроков не имеет стимула отклоняться от выпавших назначений, это распределение вероятностей по стратегиям известно как коррелированное равновесие игры. Примечательно, что ожидаемый выигрыш для этого равновесия составляет 7(1/3) + 2(1/3) + 6(1/3) = 5, что выше ожидаемого выигрыша для равновесия Нэша смешанной стратегии.
Хотя в игре Ястреб–Голубь есть три равновесия Нэша, то, которое возникает как эволюционно стабильная стратегия (ESS), зависит от существования любой некоррелированной асимметрии в игре (в смысле антикоординационных игр ). Для того чтобы игроки по строкам могли выбрать одну стратегию, а игроки по столбцам — другую, игроки должны иметь возможность различать, какая у них роль (игрок по столбцам или по строкам). Если такой некоррелированной асимметрии нет, то оба игрока должны выбрать одну и ту же стратегию, и ESS будет смешивающим равновесием Нэша. Если есть некоррелированная асимметрия, то смешивающее равновесие Нэша не является ESS, но два чистых, ролевых, обусловленных равновесия Нэша являются.
Стандартная биологическая интерпретация этой некоррелированной асимметрии заключается в том, что один игрок является владельцем территории, а другой — нарушителем на этой территории. В большинстве случаев владелец территории играет Ястреба, а нарушитель — Голубя. В этом смысле эволюцию стратегий в Ястребе–Голубе можно рассматривать как эволюцию своего рода прототипической версии собственности. Однако с точки зрения теории игр в этом решении нет ничего особенного. Противоположное решение — где владелец играет Голубя, а нарушитель играет Ястреба — столь же стабильно. Фактически, это решение присутствует у определенного вида пауков; когда появляется захватчик, занимающий территорию паук уходит. Чтобы объяснить преобладание прав собственности над «антиправами собственности», нужно найти способ нарушить эту дополнительную симметрию. [13]
Динамика репликатора — это простая модель изменения стратегии, обычно используемая в эволюционной теории игр . В этой модели стратегия, которая работает лучше среднего, увеличивается в частоте за счет стратегий, которые работают хуже среднего. Существует две версии динамики репликатора. В одной версии есть одна популяция, которая играет сама против себя. В другой есть две модели популяции, где каждая популяция играет только против другой популяции (а не против себя).
В модели с одной популяцией единственным стабильным состоянием является равновесие Нэша со смешанной стратегией. Каждая начальная пропорция популяции (за исключением всех Ястребов и всех Голубей ) сходится к равновесию Нэша со смешанной стратегией, где часть популяции играет за Ястребов , а часть популяции играет за Голубей . (Это происходит потому, что единственным ESS является равновесие со смешанной стратегией.) В модели с двумя популяциями эта смешанная точка становится нестабильной. Фактически, единственные стабильные состояния в модели с двумя популяциями соответствуют чистым равновесиям стратегий, где одна популяция состоит из всех Ястребов , а другая из всех Голубей . В этой модели одна популяция становится агрессивной, а другая становится пассивной. Эта модель проиллюстрирована векторным полем, изображенным на рисунке 7a. Одномерное векторное поле модели с одной популяцией (рисунок 7b) соответствует диагонали от нижнего левого угла до верхнего правого угла модели с двумя популяциями.
Модель с одной популяцией представляет ситуацию, в которой не существует некоррелированных асимметрий, и поэтому лучшее, что могут сделать игроки, — это рандомизировать свои стратегии. Две модели популяций обеспечивают такую асимметрию, и члены каждой популяции затем будут использовать ее для корреляции своих стратегий. В модели с двумя популяциями одна популяция выигрывает за счет другой. Таким образом, Ястреб–Голубь и Цыпленок иллюстрируют интересный случай, когда качественные результаты для двух разных версий динамики репликатора сильно различаются. [14]
«Chicken» и « Brinkbalance » часто используются как синонимы в контексте конфликта, но в строгом смысле теории игр «brinkbalance» относится к стратегическому ходу, призванному предотвратить возможность перехода противника к агрессивному поведению. Ход подразумевает реальную угрозу риска иррационального поведения перед лицом агрессии. Если игрок 1 в одностороннем порядке делает ход в A, рациональный игрок 2 не может ответить, поскольку (A, C) предпочтительнее (A, A). Только если у игрока 1 есть основания полагать, что существует достаточный риск того, что игрок 2 ответит иррационально (обычно путем отказа от контроля над ответом, так что существует достаточный риск того, что игрок 2 ответит A), игрок 1 отступит и согласится на компромисс.
Как и «Chicken», игра «War of attrition» моделирует эскалацию конфликта, но они различаются по форме, в которой конфликт может обостриться. Chicken моделирует ситуацию, в которой катастрофический исход отличается по своей сути от приемлемого исхода, например, если конфликт идет не на жизнь, а на смерть. War of attrition моделирует ситуацию, в которой результаты различаются только по степени, например, боксерский поединок, в котором участники должны решить, стоит ли конечный приз победы постоянных затрат на ухудшение здоровья и выносливости.
Игра «Ястреб–Голубь» является наиболее часто используемой теоретической игровой моделью агрессивных взаимодействий в биологии. [15] Война на истощение является еще одной очень влиятельной моделью агрессии в биологии. Эти две модели исследуют немного разные вопросы. Игра «Ястреб–Голубь» является моделью эскалации и рассматривает вопрос о том, когда индивидуум должен переходить к опасно дорогостоящему физическому бою. Война на истощение стремится ответить на вопрос о том, как могут быть разрешены состязания, когда нет возможности физического боя. Война на истощение является аукционом, в котором оба игрока платят более низкую ставку (аукцион второй цены со всеми выплатами). Предполагается, что ставки представляют собой продолжительность, в течение которой игрок готов упорствовать в демонстрации дорогостоящей угрозы . Оба игрока накапливают издержки, демонстрируя друг другу, состязание заканчивается, когда индивидуум, сделавший более низкую ставку, выходит из игры. Тогда оба игрока заплатят более низкую ставку.
Chicken — симметричная игра 2x2 с конфликтующими интересами, предпочтительный результат — сыграть Straight, в то время как противник играет Swerve . Аналогично, дилемма заключенного — симметричная игра 2x2 с конфликтующими интересами: предпочтительный результат — Defect , в то время как противник играет Cooperate . PD — о невозможности сотрудничества, в то время как Chicken — о неизбежности конфликта. Повторяющаяся игра может решить PD, но не Chicken. [16]
Обе игры имеют желаемый кооперативный результат, в котором оба игрока выбирают менее обостренную стратегию, Swerve-Swerve в игре Chicken и Cooperate-Cooperate в дилемме заключенного, так что игроки получают выигрыш за координацию C (см. таблицы ниже). Искушение от этого разумного результата заключается в прямом ходе в Chicken и в ходе Defect в дилемме заключенного (генерируя выигрыш T emptation, если другой игрок использует менее обостренный ход). Существенное различие между этими двумя играми заключается в том, что в дилемме заключенного стратегия Cooperate доминируется, тогда как в Chicken эквивалентный ход не доминируется, поскольку выигрыши результатов, когда противник делает более обостренный ход ( Straight вместо Defect ), меняются местами.
Термин « schedule chicken » [17] используется в кругах управления проектами и разработки программного обеспечения . Это состояние возникает, когда две или более частей команды по продукту заявляют, что могут предоставить функции в нереалистично ранние сроки, поскольку каждая предполагает, что другие команды завышают прогнозы еще больше, чем они есть на самом деле. Это притворство постоянно движется вперед от одной контрольной точки проекта к другой, пока не начнется интеграция функций или непосредственно перед тем, как функциональность действительно должна быть готова.
Практика «schedule chicken» [18] часто приводит к заразным сбоям в расписании из-за межкомандных зависимостей и ее трудно определить и устранить, поскольку в интересах каждой команды не быть первым носителем плохих новостей. Психологические драйверы, лежащие в основе поведения «schedule chicken», во многом имитируют модель конфликта «ястреб-голубь» или «снежный сугроб». [19]