Мрачный триггер

В теории игр мрачный триггер (также называемый мрачной стратегией или просто мрачным ) — это стратегия триггера для повторяющейся игры.

Изначально игрок, использующий grim trigger, будет сотрудничать, но как только противник предаст (тем самым удовлетворяя условию триггера), игрок, использующий grim trigger, предаст на оставшуюся часть итерируемой игры. Поскольку одиночный дезертирство противника вызывает дезертирство навсегда, grim trigger является самой строго беспощадной из стратегий в итерируемой игре.

В книге Роберта Аксельрода «Эволюция сотрудничества » мрачный триггер назван «Фридманом» ^[1] по названию статьи Джеймса У. Фридмана 1971 года , в которой используется эта концепция. ^[2]^[3]

Бесконечно повторяющаяся дилемма заключенных

Бесконечно повторяющаяся дилемма заключенных — известный пример стратегии «мрачного триггера». Обычная игра для двух заключенных выглядит следующим образом:

В дилемме заключенных у каждого игрока есть два выбора на каждом этапе:

Сотрудничать
Дефект ради немедленной выгоды

Если игрок предает, он будет наказан до конца игры. Фактически, обоим игрокам лучше молчать (сотрудничать), чем предавать друг друга, поэтому игра (C, C) является кооперативным профилем, в то время как игра (D, D), также уникальное равновесие Нэша в этой игре, является профилем наказания.

В стратегии grim trigger игрок сотрудничает в первом раунде и в последующих раундах до тех пор, пока его противник не отступит от соглашения. Как только игрок обнаруживает, что противник предал в предыдущей игре, он отступает навсегда.

Чтобы оценить идеальное равновесие подигры (SPE) для следующей мрачной стратегии триггера игры, стратегия S* для игроков i и j выглядит следующим образом:

Играйте C в каждом периоде, если только кто-то не играл D в прошлом.
Играть D вечно, если кто-то играл D в прошлом ^[4]

Тогда стратегия является SPE только в том случае, если фактор дисконтирования равен . Другими словами, ни Игрок 1, ни Игрок 2 не мотивированы отказываться от профиля сотрудничества, если фактор дисконтирования больше половины. ^[5] ${\textstyle \delta \geq {\frac {1}{2}}}$

Чтобы доказать, что стратегия является SPE, сотрудничество должно быть наилучшим ответом на сотрудничество другого игрока, а предательство должно быть наилучшим ответом на предательство другого игрока. ^[4]

Шаг 1: Предположим, что нота D до сих пор не сыграна.

Выигрыш игрока i из C: $(1-\delta)[1+\delta +\delta ^{2}+...]=(1-\delta )\times {\frac {1}{1-\delta }}=1$
Выигрыш игрока i из D: $(1-\delta)[2+0+0+...]=2(1-\delta)$

Тогда C лучше, чем D, если . $1\geq 2 (1-\delta)$

Шаг 2: Предположим, что кто-то уже играл D, тогда игрок j сыграет D, несмотря ни на что.

Выигрыш игрока i из C: $(1-\delta )[-1+\delta \times 0+\delta ^{2}\times 0+...]=(1-\delta )\times -1=\delta -1$
Выигрыш игрока i из D: $(1-\delta)[0+\delta \times 0+\delta ^{2}\times 0+...]=0$

Так как , то ход D является оптимальным. $0\leq \delta \leq 1$

Предыдущий аргумент подчеркивает, что нет стимула отклоняться (нет выгодного отклонения) от профиля сотрудничества, если , и это верно для каждой подигры. Таким образом, стратегия для бесконечно повторяющейся игры дилеммы заключенных является подигровым идеальным равновесием Нэша. $\delta \geq {\frac {1}{2}}$

В повторяющихся соревнованиях по стратегии дилеммы заключенного, grim trigger работает плохо даже без шума , а добавление ошибок сигнала делает его еще хуже. Его способность угрожать постоянным дезертирством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимой природы и неспособности сообщить об этой угрозе заранее, он работает плохо. ^[6]

Мрачный триггер в международных отношениях

В мрачной перспективе международных отношений страна сотрудничает только в том случае, если ее партнер никогда не эксплуатировал ее в прошлом. Поскольку страна откажется сотрудничать во всех будущих периодах, как только ее партнер однажды предаст, бессрочное прекращение сотрудничества становится угрозой, которая делает такую стратегию ограничивающим случаем. ^[7]

Мрачный триггер во взаимодействии пользователя с сетью

Теория игр недавно использовалась при разработке будущих систем связи , и пользователь в игре взаимодействия пользователя с сетью, использующий стратегию мрачного триггера, является одним из таких примеров. ^[8] Если решено использовать мрачный триггер в игре взаимодействия пользователя с сетью, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, прекращая взаимодействие и покидая сеть, как только пользователь узнает, что противник дезертирует. ^[9] Антониу и др. объясняют, что «при такой стратегии сеть имеет более сильный стимул сдержать обещание, данное для определенного качества, поскольку она сталкивается с угрозой потерять своего клиента навсегда». ^[8]

Сравнение с другими стратегиями

Стратегии «око за око» и «зловещий триггер» схожи по своей природе, поскольку обе являются стратегиями триггеров, в которых игрок отказывается дезертировать первым, если у него есть возможность наказать противника за дезертирство. Однако разница в том, что «зловещий триггер» стремится к максимальному наказанию за единичное дезертирство, тогда как «око за око» более снисходительна, предлагая одно наказание за каждое дезертирство. ^[10]

Смотрите также

Балансирование на грани войны – Политическая и военная тактика
Народная теорема (теория игр) – Класс теорем о равновесных профилях выигрышей по Нэшу в повторяющихся играх.
Взаимно гарантированное уничтожение – Доктрина военной стратегии
Повторяющаяся игра – игра, которая повторяет базовую игру.
Стратегия триггера – класс стратегий, используемых в повторяющейся некооперативной игре.
Tit for tat – английская поговорка, означающая «равноценное возмездие».

Ссылки

^ Аксельрод, Роберт (2006). Эволюция сотрудничества (пересмотренное издание). Basic Books. стр. 36. ISBN 0-465-00564-0.
^ Фридман, Джеймс У. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. doi :10.2307/2296617. JSTOR 2296617.
^ Статья на JSTOR
^ ab Acemoglu, Daron (2 ноября 2009 г.). «Повторяющиеся игры и сотрудничество».
^ Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: Идеальный мониторинг» (PDF) .
^ Аксельрод, Роберт (2000). "О шести достижениях в теории сотрудничества" (PDF) . Архивировано из оригинала (PDF) 2007-06-22 . Получено 2007-11-02 .(страница 13)
^ Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество посредством наказаний, специфичных для агентов». Международная организация . 54 (4): 809–824. doi :10.1162/002081800551370. S2CID 22744046.
^ ab Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместное взаимодействие пользователя и сети в сетях связи следующего поколения». Компьютерные сети . 54 (13): 2239–2255. doi :10.1016/j.comnet.2010.03.013.
^ Антониу, Жозефина; Петрос А, Иоанну (2016). Теория игр в сетях связи: кооперативное разрешение сценариев интерактивных сетей . CRC Press. ISBN 9781138199385.
^ Баурманн, Михаэль; Лейст, Антон (май 2016 г.). «О шести достижениях в теории сотрудничества». Журнал философии и социальной теории . 22 (1): 130–151.