В теории игр мрачный триггер (также называемый мрачной стратегией или просто мрачным ) — это стратегия триггера для повторяющейся игры.
Изначально игрок, использующий grim trigger, будет сотрудничать, но как только противник предаст (тем самым удовлетворяя условию триггера), игрок, использующий grim trigger, предаст на оставшуюся часть итерируемой игры. Поскольку одиночный дезертирство противника вызывает дезертирство навсегда, grim trigger является самой строго беспощадной из стратегий в итерируемой игре.
В книге Роберта Аксельрода «Эволюция сотрудничества » мрачный триггер назван «Фридманом» [1] по названию статьи Джеймса У. Фридмана 1971 года , в которой используется эта концепция. [2] [3]
Бесконечно повторяющаяся дилемма заключенных — известный пример стратегии «мрачного триггера». Обычная игра для двух заключенных выглядит следующим образом:
В дилемме заключенных у каждого игрока есть два выбора на каждом этапе:
Если игрок предает, он будет наказан до конца игры. Фактически, обоим игрокам лучше молчать (сотрудничать), чем предавать друг друга, поэтому игра (C, C) является кооперативным профилем, в то время как игра (D, D), также уникальное равновесие Нэша в этой игре, является профилем наказания.
В стратегии grim trigger игрок сотрудничает в первом раунде и в последующих раундах до тех пор, пока его противник не отступит от соглашения. Как только игрок обнаруживает, что противник предал в предыдущей игре, он отступает навсегда.
Чтобы оценить идеальное равновесие подигры (SPE) для следующей мрачной стратегии триггера игры, стратегия S* для игроков i и j выглядит следующим образом:
Тогда стратегия является SPE только в том случае, если фактор дисконтирования равен . Другими словами, ни Игрок 1, ни Игрок 2 не мотивированы отказываться от профиля сотрудничества, если фактор дисконтирования больше половины. [5]
Чтобы доказать, что стратегия является SPE, сотрудничество должно быть наилучшим ответом на сотрудничество другого игрока, а предательство должно быть наилучшим ответом на предательство другого игрока. [4]
Шаг 1: Предположим, что нота D до сих пор не сыграна.
Тогда C лучше, чем D, если .
Шаг 2: Предположим, что кто-то уже играл D, тогда игрок j сыграет D, несмотря ни на что.
Так как , то ход D является оптимальным.
Предыдущий аргумент подчеркивает, что нет стимула отклоняться (нет выгодного отклонения) от профиля сотрудничества, если , и это верно для каждой подигры. Таким образом, стратегия для бесконечно повторяющейся игры дилеммы заключенных является подигровым идеальным равновесием Нэша.
В повторяющихся соревнованиях по стратегии дилеммы заключенного, grim trigger работает плохо даже без шума , а добавление ошибок сигнала делает его еще хуже. Его способность угрожать постоянным дезертирством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимой природы и неспособности сообщить об этой угрозе заранее, он работает плохо. [6]
В мрачной перспективе международных отношений страна сотрудничает только в том случае, если ее партнер никогда не эксплуатировал ее в прошлом. Поскольку страна откажется сотрудничать во всех будущих периодах, как только ее партнер однажды предаст, бессрочное прекращение сотрудничества становится угрозой, которая делает такую стратегию ограничивающим случаем. [7]
Теория игр недавно использовалась при разработке будущих систем связи , и пользователь в игре взаимодействия пользователя с сетью, использующий стратегию мрачного триггера, является одним из таких примеров. [8] Если решено использовать мрачный триггер в игре взаимодействия пользователя с сетью, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, прекращая взаимодействие и покидая сеть, как только пользователь узнает, что противник дезертирует. [9] Антониу и др. объясняют, что «при такой стратегии сеть имеет более сильный стимул сдержать обещание, данное для определенного качества, поскольку она сталкивается с угрозой потерять своего клиента навсегда». [8]
Стратегии «око за око» и «зловещий триггер» схожи по своей природе, поскольку обе являются стратегиями триггеров, в которых игрок отказывается дезертировать первым, если у него есть возможность наказать противника за дезертирство. Однако разница в том, что «зловещий триггер» стремится к максимальному наказанию за единичное дезертирство, тогда как «око за око» более снисходительна, предлагая одно наказание за каждое дезертирство. [10]