stringtranslate.com

Дилемма заключенного

Дилемма заключенного — это мысленный эксперимент теории игр , в котором участвуют два рациональных агента , каждый из которых может сотрудничать ради взаимной выгоды или предать своего партнера («дефект») за индивидуальное вознаграждение. Эта дилемма была первоначально сформулирована Меррилом Флудом и Мелвином Дрешером в 1950 году, когда они работали в корпорации RAND . [ нужна цитация ] Альберт В. Такер позже формализовал игру, структурировав награды в виде тюремного заключения, и назвал ее «дилеммой заключенного». [1]

Дилемма заключенного моделирует множество реальных ситуаций, связанных со стратегическим поведением. В повседневном использовании термин «дилемма заключенного» можно применять к любой ситуации, в которой две организации могут получить важные выгоды от сотрудничества или пострадать от неспособности сделать это, но считают, что координировать свою деятельность сложно или дорого.

Помещение

Пример матрицы выигрышей дилеммы заключенного

Уильям Паундстоун описал эту «типичную современную версию» игры в своей книге « Дилемма узника» 1993 года :

Двое членов преступной группировки арестованы и заключены в тюрьму. Каждый заключенный находится в одиночной камере без возможности разговаривать или обмениваться сообщениями с другим. Полиция признает, что у нее недостаточно доказательств, чтобы осудить пару по основному обвинению. Оба планируют приговорить к году тюремного заключения по менее строгому обвинению. Одновременно полиция предлагает каждому заключенному фаустовскую сделку . Если он даст показания против своего партнера, он выйдет на свободу, а партнер получит три года лишения свободы по основному обвинению. Ах да, есть подвох... Если оба заключенных дадут показания друг против друга, оба будут приговорены к двум годам лишения свободы. Заключенным дается немного времени на обдумывание, но ни в коем случае нельзя узнать, что решил другой, пока он не примет окончательно своего решения. Каждому сообщают, что другому заключенному предлагают ту же самую сделку. Каждый заключенный заботится только о своем благополучии — о минимизации своего тюремного срока. [2]

Это приводит к четырем различным возможным последствиям для заключенных А и Б:

  1. Если А и Б промолчат, каждый из них будет приговорен к одному году тюремного заключения.
  2. Если А дает показания против Б, но Б хранит молчание, А будет освобожден, а Б отсидит три года в тюрьме.
  3. Если А будет хранить молчание, а Б даст показания против А, то А отсидит три года в тюрьме, а Б будет освобожден.
  4. Если А и Б дадут показания друг против друга, каждый из них будет отбывать наказание по два года.

Стратегия решения дилеммы заключенного

Двое заключенных помещены в отдельные комнаты и не могут общаться друг с другом. Предполагается, что оба заключенных понимают суть игры, не лояльны друг к другу и не имеют возможности возмездия или вознаграждения вне игры. Обычная игра показана ниже: [3]

Независимо от того, что решит другой, каждый заключенный получает более высокую награду, предав другого («дезертирство»). Рассуждения включают в себя анализ лучших ответов обоих игроков : B либо будет сотрудничать, либо откажется. Если B будет сотрудничать, A должен уйти, потому что выйти на свободу лучше, чем отсидеть один год. Если B дезертирует, A тоже должен дезертировать, потому что отсидеть 2 года лучше, чем отсидеть 3. Таким образом, в любом случае A должен дезертировать, поскольку дезертирство — лучший ответ для A, независимо от стратегии B. Параллельные рассуждения покажут, что B должен отказаться.

Бегство всегда приводит к более выгодному результату, чем сотрудничество, поэтому это строго доминирующая стратегия для обоих игроков. Взаимное отступничество — единственное сильное равновесие Нэша в игре. Поскольку коллективный идеальный результат взаимного сотрудничества иррационален с точки зрения корысти, это равновесие Нэша не является эффективным по Парето .

Обобщенная форма

Структуру традиционной дилеммы заключенного можно обобщить, исходя из ее исходной ситуации с заключенным. Предположим, что два игрока представлены красным и синим цветами, и каждый игрок выбирает либо «сотрудничать», либо «отступать».

Если оба игрока сотрудничают, они оба получают награду за сотрудничество. Если оба игрока отказываются от участия, они оба получают вознаграждение за наказание . Если Синий откажется, а Красный сотрудничает, то Синий получит выигрыш за искушение , а Красный получит выигрыш «лоха» . Аналогично, если Синий сотрудничает, а Красный отказывается, то Синий получает выигрыш лоха , а Красный получает выигрыш искушения .

Это можно выразить в нормальной форме :

и чтобы игра была «дилеммой заключенного» в строгом смысле этого слова, для выигрышей должно выполняться следующее условие:

Отношения выигрыша подразумевают, что взаимное сотрудничество превосходит взаимное бегство, тогда как отношения выигрыша и предполагают, что бегство является доминирующей стратегией для обоих агентов.

Повторяющаяся дилемма заключенного

Если два игрока разыгрывают дилемму заключенного более одного раза подряд, помнят предыдущие действия своего противника и могут соответствующим образом изменить свою стратегию, игра называется повторяющейся дилеммой заключенного.

В дополнение к приведенной выше общей форме итеративная версия также требует , чтобы чередование сотрудничества и предательства не приносило большего вознаграждения, чем взаимное сотрудничество.

Повторяющаяся дилемма заключенного является фундаментальной для некоторых теорий человеческого сотрудничества и доверия. Если предположить, что игра эффективно моделирует транзакции между двумя людьми, требующие доверия, совместное поведение в популяциях можно смоделировать с помощью многопользовательской итерированной версии игры. В 1975 году Грофман и Пул оценили количество посвященных ему научных статей более чем в 2000. Повторяющуюся дилемму заключенного также называют « игрой мир-война ». [4] [5]

Общая стратегия

Если повторяющаяся дилемма заключенного разыгрывается конечное число раз и оба игрока знают об этом, то доминирующая стратегия и равновесие Нэша заключаются в отказе от игры во всех раундах. Доказательство носит индуктивный характер : с таким же успехом можно отступить на последнем ходу, поскольку у противника не будет возможности позже нанести ответный удар. Следовательно, оба откажутся в последнюю очередь. Таким образом, игрок может с таким же успехом сбежать на предпоследнем ходу, поскольку противник сбежит на последнем, независимо от того, что будет сделано, и так далее. То же самое применимо, если продолжительность игры неизвестна, но имеет известный верхний предел. [ нужна цитата ]

Чтобы между рациональными игроками возникло сотрудничество , количество раундов должно быть неизвестным или бесконечным. В этом случае стратегия «всегда отказываться» может больше не быть строго доминирующей стратегией, а всего лишь равновесием Нэша. Как показал Роберт Ауманн в статье 1959 года, рациональные игроки , неоднократно взаимодействующие в течение неопределенно долгих игр, могут поддерживать сотрудничество. В частности, игрок может быть менее склонен к сотрудничеству, если его коллега не сотрудничал много раз, что вызывает разочарование. И наоборот, с течением времени вероятность сотрудничества имеет тенденцию возрастать благодаря установлению «молчаливого соглашения» между участвующими игроками. Другой аспект повторяющейся дилеммы заключенного заключается в том, что это молчаливое соглашение между игроками всегда успешно устанавливалось, даже когда количество итераций объявлялось обеим сторонам.

Согласно экспериментальному исследованию 2019 года, опубликованному в American Economic Review , в котором проверялось, какие стратегии реальные испытуемые использовали в повторяющихся ситуациях «дилеммы заключенного» с идеальным мониторингом, большинство выбранных стратегий всегда заключались в отступничестве, ответных действиях и мрачном триггере . Какую стратегию выбирали испытуемые, зависело от параметров игры. [6]

Конкурс Аксельрода и условия успешной стратегии.

Интерес к повторяющейся дилемме заключенного был разожжен Робертом Аксельродом в его книге 1984 года « Эволюция сотрудничества» , в которой он сообщает об организованном им турнире по N -шаговой дилемме заключенного (с фиксированным N ), в котором участники должны выбрать свою стратегию. неоднократно и вспоминать свои предыдущие встречи. Аксельрод пригласил коллег-ученых со всего мира разработать компьютерные стратегии для участия в повторяющемся турнире по дилемме заключенного. Введенные программы сильно различались по алгоритмической сложности, начальной враждебности, способности к прощению и т. д.

Аксельрод обнаружил, что когда эти встречи повторялись в течение длительного периода времени со многими игроками, каждый из которых использовал разные стратегии, жадные стратегии имели тенденцию приносить очень плохие результаты в долгосрочной перспективе, в то время как более альтруистические стратегии давали лучшие результаты, если судить исключительно по личным интересам. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из изначально чисто эгоистичных механизмов путем естественного отбора .

Победившая детерминистская стратегия была разработана и введена в турнир Анатолем Рапопортом . Это была самая простая из всех представленных программ, содержащая всего четыре строки BASIC , и она выиграла конкурс. Стратегия состоит в том, чтобы просто сотрудничать на первой итерации игры; после этого игрок делает то же, что его противник сделал на предыдущем ходу. В зависимости от ситуации, чуть лучшей стратегией может быть «око за око с прощением»: когда противник отступает, на следующем ходу игрок иногда все равно сотрудничает с небольшой вероятностью (около 1–5%, в зависимости от состава). противников). Это позволяет время от времени восстанавливаться после попадания в цикл дезертирства.

Проанализировав наиболее результативные стратегии, Аксельрод сформулировал несколько условий, необходимых для успеха стратегии:

В отличие от игры с дилеммой бывшего заключенного, оптимальная стратегия в повторяющейся дилемме заключенного зависит от стратегий вероятных противников и от того, как они будут реагировать на дезертирство и сотрудничество. Например, если популяция полностью состоит из игроков, которые всегда отказываются от игры, за исключением того, кто следует стратегии «око за око», этот человек находится в небольшом невыгодном положении из-за поражения на первом ходу. В такой популяции оптимальная стратегия — каждый раз дезертировать. В более общем плане, учитывая популяцию с определенным процентом всегда перебежчиков, а остальные — игроками, играющими «око за око», оптимальная стратегия зависит от процента и количества сыгранных итераций.

Другие стратегии

Выработка оптимальной стратегии обычно осуществляется двумя способами:

В стратегии, называемой «выигрыш-останье-проигрыш-переключение» , столкнувшись с неспособностью сотрудничать, игрок меняет стратегию на следующем ходу. [9] В определенных обстоятельствах [ уточнить ] Павлов превосходит все другие стратегии, предоставляя преимущество партнерам, использующим аналогичную стратегию.

Хотя принцип «око за око» считается самой надежной базовой стратегией, команда из Саутгемптонского университета в Англии представила более успешную стратегию на конкурсе повторяющихся дилемм заключенного, посвященном 20-летнему юбилею. Он полагался на сговор между программами для получения наибольшего количества баллов за одну программу. Университет представил на конкурс 60 программ, которые были рассчитаны на узнавание друг друга через серию из пяти-десяти ходов на старте. [10] Как только это признание было сделано, одна программа всегда будет сотрудничать, а другая всегда отказываться, гарантируя максимальное количество баллов перебежчику. Если бы программа поняла, что она играет с игроком, не принадлежащим Саутгемптону, она бы постоянно отступала, пытаясь минимизировать счет конкурирующей программы. В результате результаты турнира «Дилемма заключенных» 2004 года показывают, что стратегии Университета Саутгемптона занимают первые три места (и ряд позиций ближе к концу), несмотря на то, что у них меньше побед и гораздо больше поражений, чем у стратегии GRIM. Стратегия Саутгемптона использует тот факт, что в этом конкретном соревновании было разрешено несколько заявок и что результативность команды измерялась по результатам игрока, набравшего наибольшее количество очков (это означает, что использование самоотверженных игроков было формой минмаксинга ) .

Из-за этого нового правила это соревнование также не имеет теоретического значения при анализе стратегий одного агента по сравнению с плодотворным турниром Аксельрода. Но это обеспечило основу для анализа того, как реализовать стратегии сотрудничества в многоагентных структурах, особенно в присутствии шума.

Задолго до того, как был сыгран этот турнир по новым правилам, Докинз в своей книге « Эгоистичный ген » указал на возможность победы таких стратегий, если было разрешено несколько заявок, но заметил, что Аксельрод, скорее всего, не допустил бы их, если бы они были поданы. Он также основан на обходе правила, запрещающего общение между игроками, что, возможно, и сделали программы «Саутгемптона» с заранее запрограммированным «танцем из десяти движений», чтобы узнавать друг друга, что еще раз подчеркивает, насколько ценным может быть общение для изменения баланса в игре.

Даже без неявного сговора между программными стратегиями , игра «око за око» не всегда является абсолютным победителем любого турнира; точнее, ее долгосрочные результаты по серии турниров превосходят конкурентов, но это не значит, что она самая успешная в краткосрочной перспективе. То же самое относится и к взаимодействию с прощением и другими оптимальными стратегиями.

Это также можно проиллюстрировать с помощью дарвиновского моделирования ESS . В таком моделировании принцип «око за око» почти всегда будет доминировать, хотя неприятные стратегии будут проникать в популяцию и исчезать из нее, потому что в популяцию «око за око» можно проникнуть с помощью нерепрессивных хороших стратегий, которые, в свою очередь, легко жертва неприятных стратегий. Докинз показал, что здесь никакое статическое сочетание стратегий не образует устойчивого равновесия, и система всегда будет колебаться между границами. [ нужна цитата ]

Стохастическая повторяющаяся дилемма заключенного

В стохастической повторяющейся игре «Дилемма заключенного» стратегии определяются с точки зрения «вероятностей сотрудничества». [11] В столкновении между игроком X и игроком Y стратегия X определяется набором вероятностей P сотрудничества с Y. P является функцией результатов их предыдущих встреч или некоторого их подмножества. Если P является функцией только их последних n встреч, это называется стратегией «память-n». Стратегия памяти-1 затем определяется четырьмя вероятностями сотрудничества: , где P cd — вероятность того, что X будет сотрудничать в нынешней встрече, учитывая, что предыдущая встреча характеризовалась сотрудничеством X и отказом Y. Если каждая из вероятностей равна 1 или 0, стратегия называется детерминированной. Примером детерминированной стратегии является стратегия «око за око», записанная как , в которой X реагирует так же, как Y в предыдущей встрече. Другой вариант — стратегия переключения «выиграл-остался-проиграл», записанную как . Было показано, что для любой стратегии памяти n существует соответствующая стратегия памяти 1, которая дает те же статистические результаты, так что необходимо рассматривать только стратегии памяти 1. [11]

Если он определен как указанный выше вектор стратегии из 4 элементов для X и как вектор стратегии из 4 элементов для Y (где индексы находятся с точки зрения Y ), матрица перехода M может быть определена для X , чей ij -th вход — это вероятность того, что результатом конкретной встречи между X и Y будет j , учитывая, что предыдущая встреча была i , где i и j — один из четырех индексов результата: cc , cd , dc или dd . Например, с точки зрения X , вероятность того, что исход текущего столкновения будет cd , учитывая, что предыдущее столкновение было cd , равна . Согласно этим определениям, повторяющаяся дилемма заключенного квалифицируется как случайный процесс , а M является стохастической матрицей , позволяющей применять всю теорию случайных процессов. [11]

Одним из результатов стохастической теории является то, что существует стационарный вектор v для матрицы v такой, что . Без ограничения общности можно указать, что v нормировано так, что сумма его четырех компонентов равна единице. ij - я запись даст вероятность того, что исход встречи между X и Y будет j , учитывая, что встреча на n предыдущих шагах равна i . В пределе, когда n приближается к бесконечности, M будет сходиться к матрице с фиксированными значениями, давая долгосрочные вероятности встречи, производящей j, независимо от i . Другими словами, строки будут идентичны, что дает долгосрочные равновесные вероятности результата повторяющейся дилеммы заключенного без необходимости явно оценивать большое количество взаимодействий. Видно, что v является стационарным вектором для и, в частности , так что каждая строка будет равна v . Таким образом , стационарный вектор определяет вероятности равновесного результата для X. Определив и как векторы краткосрочных выигрышей для результатов { cc,cd,dc,dd } (с точки зрения X), равновесные выигрыши для X и Y теперь можно указать как и , что позволяет использовать две стратегии P и Q, которые необходимо сравнить на предмет их долгосрочных выигрышей.

Стратегии нулевого детерминанта

Взаимосвязь между нулевой детерминантой (ZD), стратегиями сотрудничества и отказа в повторяющейся дилемме заключённого (повторяемая дилемма заключённого)

В 2012 году Уильям Х. Пресс и Фримен Дайсон опубликовали новый класс стратегий для стохастической повторяющейся дилеммы заключенного, названный стратегиями «нулевой детерминант» (ZD). [11] Долгосрочные выигрыши от встреч между X и Y могут быть выражены как определитель матрицы, которая является функцией двух стратегий и векторов краткосрочных выигрышей: и , которые не включают стационарный вектор v . Поскольку определительная функция линейна по , отсюда следует, что (где ). Любые стратегии, для которых по определению являются стратегией ZD, а долгосрочные выигрыши подчиняются соотношению .

«Око за око» — это стратегия ZD, которая является «справедливой» в том смысле, что не дает преимущества над другим игроком. Но пространство ZD также содержит стратегии, которые в случае двух игроков могут позволить одному игроку в одностороннем порядке установить счет другого игрока или, альтернативно, заставить эволюционного игрока получить выигрыш, на несколько процентов меньший, чем его собственный. Игрок, у которого вымогают деньги, может отказаться от участия, но тем самым нанесет себе вред, получив меньший выигрыш. Таким образом, решения, связанные с вымогательством, превращают повторяющуюся дилемму заключенного в своего рода игру-ультиматум . В частности, X может выбрать стратегию, для которой , в одностороннем порядке устанавливая y определенное значение в определенном диапазоне значений, независимо от стратегии Y , предлагая X возможность «вымогать» у игрока Y (и наоборот) . Но если X попытается присвоить s x определенное значение, диапазон возможностей будет намного меньше и состоит только из полного сотрудничества или полного предательства. [11]

Расширением повторяющейся дилеммы заключённого является эволюционная стохастическая повторяющаяся дилемма заключённого, в которой относительное изобилие конкретных стратегий может меняться, при этом более успешные стратегии относительно увеличиваются. Этот процесс можно осуществить, заставив менее успешных игроков подражать более успешным стратегиям или исключив из игры менее успешных игроков, одновременно умножая более успешных. Было показано, что несправедливые стратегии ZD не являются эволюционно стабильными . Ключевая интуиция заключается в том, что эволюционно стабильная стратегия должна не только иметь возможность вторгнуться в другую популяцию (что могут сделать грабительские стратегии ZD), но также должна хорошо работать против других игроков того же типа (что вымогательские игроки ZD делают плохо, потому что они уменьшают влияние друг друга). излишек). [12]

Теория и моделирование подтверждают, что за пределами критического размера популяции вымогательство ZD проигрывает в эволюционной конкуренции более кооперативным стратегиям, и в результате средний выигрыш в популяции увеличивается, когда популяция больше. Кроме того, в некоторых случаях вымогатели могут даже стимулировать сотрудничество, помогая вырваться из противостояния между перебежчиками в униформе и агентами «выиграл-остался-проиграл-поменялся» . [13]

Хотя вымогательские стратегии ZD не стабильны в больших группах населения, другой класс ZD, называемый «щедрыми» стратегиями, является одновременно стабильным и надежным. Когда популяция не слишком мала, эти стратегии могут заменить любую другую стратегию ZD и даже хорошо работать против широкого спектра общих стратегий для повторяющейся дилеммы заключенного, включая «выиграть-остаться», проиграть-переключиться. Это было специально доказано на примере игры с пожертвованиями Александром Стюартом и Джошуа Плоткиным в 2013 году. [14] Щедрые стратегии будут сотрудничать с другими кооперативными игроками, и в случае предательства щедрый игрок теряет больше полезности, чем его соперник. Щедрые стратегии представляют собой пересечение стратегий ZD и так называемых «хороших» стратегий, которые Итан Акин определил как те, в которых игрок реагирует на прошлое взаимное сотрудничество будущим сотрудничеством и распределяет ожидаемые выигрыши поровну, если он получает хотя бы кооперативную сумму. ожидаемая выплата. [15] Среди хороших стратегий щедрая (ZD) подгруппа хорошо работает, когда население не слишком мало. Если население очень мало, стратегии дезертирства имеют тенденцию доминировать. [14]

Непрерывная повторяющаяся дилемма заключенного

Большая часть работ по повторной дилемме заключенного сосредоточена на дискретном случае, когда игроки либо сотрудничают, либо отступают, поскольку эту модель относительно легко анализировать. Однако некоторые исследователи рассмотрели модели непрерывно повторяющейся дилеммы заключенного, в которой игроки могут вносить переменный вклад в жизнь другого игрока. Ле и Бойд [16] обнаружили, что в таких ситуациях развивать сотрудничество гораздо труднее, чем в дискретно повторяющейся дилемме заключенного. В постоянной дилемме заключённого, если население изначально находится в некооперативном равновесии, игроки, которые лишь незначительно более склонны к сотрудничеству, чем те, кто не сотрудничает, получают мало пользы от сортировки друг с другом. Напротив, в дилемме дискретного заключенного сотрудничающие по принципу «око за око» получают большую выгоду от сортировки друг с другом в некооперативном равновесии по сравнению с несотрудничающими. Поскольку природа, возможно, предлагает больше возможностей для разнообразного сотрудничества, а не строгой дихотомии сотрудничества или предательства, дилемма постоянного заключенного может помочь объяснить, почему реальные примеры сотрудничества по принципу «око за око» крайне редки [ 17] , хотя for-tat кажется надежным в теоретических моделях.

Примеры из реальной жизни

Многие примеры человеческого взаимодействия и естественных процессов имеют матрицы выигрышей, подобные дилемме заключенного. Поэтому он представляет интерес для социальных наук , таких как экономика , политика и социология , а также для биологических наук, таких как этология и эволюционная биология . Многие естественные процессы были абстрагированы в модели, в которых живые существа участвуют в бесконечных играх с дилеммой заключенного.

Экологические исследования

В экологических исследованиях дилемма очевидна в таких кризисах, как глобальное изменение климата . Утверждается, что все страны выиграют от стабильного климата, но каждая отдельная страна часто не решается ограничить выбросы CO 2 . Непосредственная выгода для любой страны от сохранения нынешнего поведения воспринимается как более значительная, чем предполагаемая конечная выгода для этой страны в случае изменения поведения всех стран, что объясняет тупиковую ситуацию с изменением климата в 2007 году. [18]

Важным различием между политикой изменения климата и дилеммой заключенного является неопределенность; степень и скорость, с которой загрязнение может изменить климат, неизвестны. Таким образом, дилемма, с которой сталкиваются правительства, отличается от дилеммы заключенного тем, что выгоды от сотрудничества неизвестны. Эта разница предполагает, что государства будут сотрудничать гораздо меньше, чем в реальной повторяющейся дилемме заключённого, так что вероятность избежать возможной климатической катастрофы намного меньше, чем предполагает теоретико-игровой анализ ситуации с использованием реальной повторяющейся дилеммы заключённого. [19]

Томас Осанг и Арундати Нэнди дают теоретическое объяснение с доказательствами беспроигрышной ситуации, основанной на регулировании, в соответствии с гипотезой Майкла Портера , в которой государственное регулирование конкурирующих фирм является существенным. [20]

Животные

Кооперативное поведение многих животных можно рассматривать как пример повторяющейся дилеммы заключенного. Часто животные вступают в долгосрочные партнерские отношения; например, гуппи совместно осматривают хищников группами и, как полагают, наказывают инспекторов, отказывающихся сотрудничать. [21]

Летучие мыши-вампиры — социальные животные, которые участвуют во взаимном обмене пищей. Применение выигрышей от дилеммы заключенного может помочь объяснить такое поведение. [22]

Психология

В исследованиях зависимости и поведенческой экономике Джордж Эйнсли указывает , что зависимость можно рассматривать как межвременную дилемму заключенного между настоящим и будущим «я» наркомана. В данном случае «дезертирство» означает рецидив, а отсутствие рецидива ни сегодня, ни в будущем, безусловно, является лучшим результатом. Случай, когда человек воздерживается сегодня, но в будущем у него случается рецидив, является наихудшим исходом: в каком-то смысле дисциплина и самопожертвование, необходимые для воздержания сегодня, были «растрачены впустую», потому что будущий рецидив означает, что наркоман возвращается к тому, с чего начал, и придется начинать заново. Рецидив сегодня и завтра — это немного «лучший» результат, потому что, хотя наркоман все еще является зависимым, он не приложил усилий, чтобы попытаться остановиться. В последнем случае, когда сегодня кто-то участвует в аддиктивном поведении, а завтра воздерживается от него, возникает проблема: (как и в других дилеммах заключенного) существует очевидная польза от побега «сегодня», но завтра он столкнется с той же дилеммой заключенного, и Тогда будет присутствовать та же очевидная выгода, что в конечном итоге приведет к бесконечной череде дезертирств. [23]

В «Науке доверия» Джон Готтман определяет хорошие отношения как отношения, в которых партнеры знают, что им не следует вступать в поведение взаимного предательства или, по крайней мере, не застревать в этом цикле. В когнитивной нейробиологии быстрая передача сигналов мозгом, связанная с обработкой различных раундов, может указывать на выбор в следующем раунде. Результаты взаимного сотрудничества влекут за собой изменения в активности мозга, предсказывающие, насколько быстро человек будет сотрудничать в натуральной форме при следующей возможности; [24] эта деятельность может быть связана с основными гомеостатическими и мотивационными процессами, что, возможно, увеличивает вероятность перехода к взаимному сотрудничеству.

Экономика

Дилемму заключенного назвали кишечной палочкой социальной психологии, и она широко использовалась для исследования различных тем, таких как олигополистическая конкуренция и коллективные действия для производства коллективного блага. [25]

Рекламу иногда называют реальным примером дилеммы заключенного. Когда реклама сигарет была легальной в Соединенных Штатах, конкурирующим производителям сигарет приходилось решать, сколько денег тратить на рекламу. Эффективность рекламы фирмы А частично определялась рекламой, проводимой фирмой Б. Аналогично, на прибыль, полученную от рекламы фирмы Б, влияет реклама, проводимая фирмой А. Если и фирма А, и фирма Б решили размещать рекламу в течение определенного периода времени, период, то реклама каждой фирмы сводит на нет рекламу другой, поступления остаются постоянными, а расходы увеличиваются за счет затрат на рекламу. Обе фирмы выиграют от сокращения рекламы. Однако если фирма Б решит не заниматься рекламой, фирма А может получить от рекламы большую выгоду. Тем не менее оптимальный объем рекламы одной фирмы зависит от того, какой объем рекламы берет на себя другая. Поскольку лучшая стратегия зависит от того, что выберет другая фирма, доминирующей стратегии не существует, что несколько отличает ее от дилеммы заключенного. Однако результат аналогичен: обеим фирмам было бы лучше, если бы они рекламировали меньше, чем в равновесии.

Иногда кооперативное поведение действительно возникает в деловых ситуациях. Например, производители сигарет поддержали принятие законов, запрещающих рекламу сигарет, понимая, что это позволит снизить затраты и увеличить прибыль во всей отрасли. [26] [б]

Без соглашений, имеющих обязательную силу, члены картеля также оказываются перед (многопользовательской) дилеммой заключенного. [27] «Сотрудничество» обычно означает согласие на минимальную цену , а «отказ» означает продажу ниже этого минимального уровня, мгновенно отбирая бизнес у других членов картеля. Антимонопольные органы хотят, чтобы потенциальные члены картеля перешли на сторону друг друга, обеспечивая потребителям максимально низкие цены.

Спорт

Допинг в спорте приводится в качестве примера дилеммы заключенного. Два соревнующихся спортсмена имеют возможность использовать запрещенный и/или опасный препарат для повышения своих результатов. Если ни один из спортсменов не принимает препарат, то ни один из спортсменов не получает преимущества. Если это сделает только один, то этот спортсмен получает значительное преимущество перед конкурентом, уменьшенное юридическими и/или медицинскими опасностями, связанными с приемом препарата. Но если оба спортсмена принимают препарат, польза сводится на нет, и остается только опасность, что ставит их обоих в худшее положение, чем если бы ни один из них не принимал допинг. [28]

Международная политика

В теории международных отношений дилемма заключенного часто используется, чтобы продемонстрировать, почему сотрудничество терпит неудачу в ситуациях, когда сотрудничество между государствами коллективно оптимально, но индивидуально неоптимально. [29] [30] Классическим примером является дилемма безопасности , при которой повышение безопасности одного государства (например, увеличение его военной мощи) приводит к тому, что другие государства опасаются за свою собственную безопасность из-за страха перед наступательными действиями. [31] Следовательно, меры по повышению безопасности могут привести к напряженности, эскалации или конфликту с одной или несколькими другими сторонами, приводя к результату, которого на самом деле не желает ни одна из сторон. [32] [31] [33] [34] [35] Дилемма безопасности особенно остро стоит в ситуациях, когда трудно отличить наступательное оружие от оборонительного, а нападение имеет преимущество в любом конфликте над обороной. [31]

Дилемма заключенного часто использовалась реалистическими теоретиками международных отношений, чтобы продемонстрировать, почему всем государствам (независимо от их внутренней политики или исповедуемой идеологии) в условиях международной анархии будет трудно сотрудничать друг с другом, даже если все выигрывают от такого сотрудничества.

Критики реализма утверждают, что итерация и расширение тени будущего являются решением дилеммы заключенного. Когда актеры разыгрывают дилемму заключенного один раз, у них появляются стимулы к отказу, но когда они рассчитывают повторить ее неоднократно, у них появляется больше стимулов к сотрудничеству. [36]

Многопользовательские дилеммы

Многие дилеммы реальной жизни требуют участия нескольких игроков. [37] Хотя это и метафорично, трагедия общин Хардина может рассматриваться как пример многопользовательского обобщения дилеммы заключенного: каждый сельский житель делает выбор в пользу личной выгоды или ограничения. Коллективной наградой за единодушное или частое отступничество являются очень низкие выплаты и разрушение общественного достояния.

Общественное достояние не всегда эксплуатируется: Уильям Паундстоун в книге о дилемме заключенного описывает ситуацию в Новой Зеландии, когда ящики с газетами остаются незапертыми. Люди могут взять бумагу, не заплатив (перебежав), но очень немногие это делают, чувствуя, что если они не заплатят, то и другие не заплатят, что разрушает систему. [38] Последующее исследование Элинор Остром , лауреата Нобелевской премии по экономике в 2009 году , выдвинуло гипотезу, что трагедия общего достояния слишком упрощена, а на негативный результат влияют внешние влияния. Не усложняя давление, группы общаются и управляют общими ресурсами между собой ради взаимной выгоды, обеспечивая соблюдение социальных норм для сохранения ресурсов и достижения максимального блага для группы, что является примером достижения наилучшего результата для дилеммы заключенного. [39] [40]

Похожие игры

Обмен закрытых сумок

Дилемма заключенного как обмен портфеля

Дуглас Хофштадтер [41] предположил, что людям часто легче понять такие проблемы, как дилемма заключенного, когда они проиллюстрированы в форме простой игры или компромисса. Одним из нескольких примеров, которые он использовал, был «закрытый обмен сумками»:

Два человека встречаются и обмениваются закрытыми сумками, понимая, что в одном из них деньги, а в другом покупка. Любой игрок может выполнить сделку, положив в свою сумку то, о чем он договорился, или он или она может отказаться, отдав пустую сумку.

Друг или враг?

Друг или враг? — игровое шоу, которое транслировалось с 2002 по 2003 год на Game Show Network в США. В игровом шоу соревнуются три пары людей. Когда пара выбывает, они играют в игру, похожую на дилемму заключенного, чтобы определить, как будет разделен выигрыш. Если они оба сотрудничают (Друг), они делят выигрыш 50 на 50. Если один сотрудничает, а другой отказывается (Враг), перебежчик получает весь выигрыш, а сотрудничающий не получает ничего. Если оба откажутся, оба уйдут ни с чем. Обратите внимание, что матрица вознаграждений немного отличается от стандартной, приведенной выше, поскольку награды для случаев «оба дезертируют» и «сотрудничать, пока противник дезертирует» идентичны. Это делает случай «оба дефекта» слабым равновесием по сравнению со строгим равновесием в стандартной дилемме заключенного. Если участник знает, что его оппонент проголосует за «Противника», то его собственный выбор не повлияет на его собственный выигрыш. В определенном смысле в «Друге или враге» есть модель вознаграждения между дилеммой заключенного и игрой «Цыпленок» .

Матрица вознаграждений

Эта матрица выигрышей также использовалась в британских телевизионных программах «Доверься мне» , « Shafted» , «Ограбление в банке » и «Золотые шары» , а также в американских игровых шоу «Take It All» , а также для пары-победителя в реалити-шоу «Холостяк Pad» и «Остров любви». . Данные игр серии Golden Balls были проанализированы командой экономистов, которые обнаружили, что сотрудничество было «на удивление высоким» для сумм денег, которые могли бы показаться значимыми в реальном мире, но были сравнительно низкими в контексте игры. [42]

Итерированный сугроб

Исследователи из Университета Лозанны и Эдинбургского университета предположили, что «Итерированная игра в сугроб» может более точно отражать реальные социальные ситуации, хотя на самом деле эта модель представляет собой игру с курицей . В этой модели риск эксплуатации из-за дезертирства ниже, и люди всегда выигрывают, делая совместный выбор. В игре «Сугроб» представлены два водителя, застрявшие по разные стороны сугроба , каждому из которых предоставляется возможность расчищать снег, чтобы расчистить путь, или оставаться в своей машине. Наивысшая выгода игрока получается в том случае, если он позволяет противнику самостоятельно расчищать весь снег, но противник по-прежнему номинально вознаграждается за свою работу.

Это может лучше отражать реальные сценарии: исследователи приводят пример двух ученых, сотрудничающих над отчетом, оба из которых выиграют, если другой будет работать усерднее. «Но когда ваш коллега не выполняет никакой работы, вам, вероятно, лучше сделать всю работу самому. В конечном итоге вы все равно получите завершенный проект». [43]

Координационные игры

В координационных играх игроки должны координировать свои стратегии для достижения хорошего результата. Пример — две машины, внезапно встретившиеся в метель; каждый должен выбрать, повернуть ли ему влево или вправо. Если оба свернут налево или оба направо, автомобили не столкнутся. Местные правила лево- и правостороннего движения помогают скоординировать их действия.

К симметричным координационным играм относятся «Охота на оленя» , «Бах» или «Стравинский» .

Асимметричные дилеммы заключенного

Более общий набор игр асимметричен. Как и в дилемме заключенного, лучшим результатом является сотрудничество, и существуют мотивы для дезертирства. Однако, в отличие от симметричной дилеммы заключенного, один игрок может больше потерять и/или больше получить, чем другой. Некоторые такие игры были описаны как дилемма заключенного, в которой у одного заключенного есть алиби , отсюда и термин «игра-алиби». [44]

В экспериментах игроки, получающие неравные выигрыши в повторяющихся играх, могут стремиться максимизировать прибыль, но только при условии, что оба игрока получают равные выигрыши; это может привести к устойчивой равновесной стратегии, в которой игрок, находящийся в невыгодном положении, отказывается от каждой игры X, в то время как другой игрок всегда сотрудничает. Такое поведение может зависеть от социальных норм эксперимента, касающихся справедливости. [45]

Программное обеспечение

Было создано несколько пакетов программного обеспечения для проведения симуляций и турниров по дилемме заключенного, исходный код некоторых из которых доступен:

В фантастике

Ханну Раджаниеми поместил первую сцену своей трилогии «Квантовый вор » в «тюрьму дилемм». Основная тема сериала была описана как «неадекватность бинарной вселенной», а главным антагонистом является персонаж по имени Всеперебежчик. Первая книга серии была опубликована в 2010 году, а два продолжения, « Фрактальный принц» и «Причинный ангел» , были опубликованы в 2012 и 2014 годах соответственно.

Игра, созданная по образцу повторяющейся дилеммы заключенного, занимает центральное место в видеоигре 2012 года Zero Escape: Virtue's Last Reward и второстепенную роль в ее продолжении 2016 года Zero Escape: Zero Time Dilemma .

В книге Трентона Ли Стюарта « Таинственное общество Бенедикта и дилемма узника» главные герои начинают с того, что играют в версию игры и вообще сбегают из «тюрьмы». Позже они становятся настоящими пленниками и снова сбегают.

В подарке «Зона приключений : Баланс во время игры Страдания» персонажи игроков дважды сталкиваются с дилеммой заключенного во время их пребывания в владениях двух личей: один раз они сотрудничают, а другой - дезертируют.

В восьмом романе автора Джеймса С.А. Кори Тиамата «Гнев Тиамата» Уинстон Дуарте объясняет дилемму заключенного своей 14-летней дочери Терезе, чтобы научить ее стратегическому мышлению. [ нужна цитата ]

В фильме 2008 года «Темный рыцарь» есть сцена, в общих чертах основанная на проблеме, в которой Джокер монтирует два парома, один с заключенными, а другой с гражданскими лицами, вооружая обе группы средствами для взрыва бомбы на паромах друг друга, угрожая взорвать их. оба, если они колеблются. [46] [47]

Смотрите также

Примечания

  1. ^ Например, см. исследование 2003 года [7] , где обсуждается эта концепция и может ли она применяться в реальных экономических или стратегических ситуациях.
  2. ^ Этот аргумент в пользу развития сотрудничества посредством доверия приведен в « Мудрости толпы» , где утверждается, что капитализм на больших расстояниях смог сформироваться вокруг ядра квакеров , которые всегда честно обращались со своими деловыми партнерами. (Вместо того, чтобы отступить и нарушить свои обещания – явление, которое препятствовало заключению ранее долгосрочных и неисполнимых зарубежных контрактов). Утверждается, что отношения с надежными торговцами позволили мему о сотрудничестве распространиться среди других торговцев, которые распространяли его дальше, пока высокая степень сотрудничества не стала прибыльной стратегией в общей торговле.

Рекомендации

  1. ^ Паундстоун 1993, стр. 8, 117.
  2. ^ Паундстоун 1993, с. 118: «Типичная современная версия этой истории звучит так: два члена преступной группировки арестованы и заключены в тюрьму. Каждый заключенный находится в одиночной камере без возможности разговаривать или обмениваться сообщениями с другим. Полиция признает, что не делает этого. У них недостаточно доказательств, чтобы осудить пару по основному обвинению. Они планируют приговорить обоих к году тюремного заключения по менее серьезному обвинению. Одновременно полиция предлагает каждому заключенному фаустовскую сделку. Если он даст показания против своего партнера, он выйдет на свободу а напарник получит три года тюрьмы по основному обвинению.Ах да,есть подвох...Если оба заключенных дадут показания друг против друга,то оба будут приговорены к двум годам лишения свободы.Заключенным дается небольшой срок обдумать это, но ни в коем случае не может узнать, что решил другой, пока он не примет окончательного решения. Каждому сообщается, что другому заключенному предлагается та же самая сделка. Каждый заключенный заботится только о своем собственном благополучии — с минимизацией собственного тюремного заключения».
  3. ^ Паундстоун 1993, с. 118.
  4. ^ Грофман, Бернард; Пул, Джонатан (январь 1977 г.). «Как сделать сотрудничество оптимизирующей стратегией в игре двоих». Журнал математической социологии . 5 (2): 173–186. дои : 10.1080/0022250x.1977.9989871. ISSN  0022-250X.
  5. ^ Застенчивый, Оз (1995). Промышленная организация: теория и приложения. Издательство Массачусетского технологического института. ISBN 978-0262193665. Проверено 27 февраля 2013 г.
  6. ^ Даль Бо, Педро; Фрешетт, Гийом Р. (2019). «Выбор стратегии в бесконечно повторяющейся дилемме узника». Американский экономический обзор . 109 (11): 3929–3952. doi : 10.1257/aer.20181480. ISSN  0002-8282. S2CID  216726890.
  7. ^ «Байесовское равновесие Нэша; статистическая проверка гипотезы» (PDF) . Тель-Авивский университет . Архивировано из оригинала (PDF) 2 октября 2005 г.
  8. ^ У, Цзядун; Чжао, Ченгье (2019), Сунь, Сяомин; Он, Кун; Чен, Сяоюнь (ред.), «Сотрудничество по правилу Монте-Карло: игра с дилеммой заключенного в сети», Теоретическая информатика , Коммуникации в компьютерных и информационных науках, Springer Singapore, vol. 1069, стр. 3–15, номер документа : 10.1007/978-981-15-0105-0_1, ISBN. 978-981-15-0104-3, S2CID  118687103
  9. ^ Ведекинд, К.; Милински, М. (2 апреля 1996 г.). «Человеческое сотрудничество в одновременной и попеременной дилемме узника: Павлов против щедрого око за око». Труды Национальной академии наук . 93 (7): 2686–2689. Бибкод : 1996PNAS...93.2686W. дои : 10.1073/pnas.93.7.2686 . ПМК 39691 . ПМИД  11607644. 
  10. ^ «Команда Университета Саутгемптона выигрывает соревнование по дилемме заключенного» (пресс-релиз). Университет Саутгемптона. 7 октября 2004 г. Архивировано из оригинала 21 апреля 2014 г.
  11. ^ abcde Press, WH; Дайсон, Ф.Дж. (26 июня 2012 г.). «Итерированная дилемма узника содержит стратегии, которые доминируют над любым эволюционным противником». Труды Национальной академии наук Соединенных Штатов Америки . 109 (26): 10409–13. Бибкод : 2012PNAS..10910409P. дои : 10.1073/pnas.1206569109 . ПМК 3387070 . ПМИД  22615375. 
  12. ^ Адами, Кристоф; Аренд Хинтце (2013). «Эволюционная нестабильность стратегий нулевого детерминанта показывает, что победа – это еще не все». Природные коммуникации . 4 : 3.arXiv : 1208.2666 . Бибкод : 2013NatCo...4.2193A. doi : 10.1038/ncomms3193. ПМЦ 3741637 . ПМИД  23903782. 
  13. ^ Хильбе, Кристиан; Мартин А. Новак; Карл Зигмунд (апрель 2013 г.). «Эволюция вымогательства в играх «Итерированная дилемма заключенного». ПНАС . 110 (17): 6913–18. arXiv : 1212.1067 . Бибкод : 2013PNAS..110.6913H. дои : 10.1073/pnas.1214834110 . ПМЦ 3637695 . ПМИД  23572576. 
  14. ^ аб Стюарт, Александр Дж.; Джошуа Б. Плоткин (2013). «От вымогательства к щедрости: эволюция повторяющейся дилеммы заключенного». Труды Национальной академии наук Соединенных Штатов Америки . 110 (38): 15348–53. Бибкод : 2013PNAS..11015348S. дои : 10.1073/pnas.1306246110 . ПМЦ 3780848 . ПМИД  24003115. 
  15. ^ Акин, Итан (2013). «Стабильные совместные решения повторяющейся дилеммы заключенного». п. 9. arXiv : 1211.0969 [math.DS]. Бибкод : 2012arXiv1211.0969A
  16. ^ Ле С., Бойд Р. (2007). «Эволюционная динамика непрерывно повторяющейся дилеммы заключенного». Журнал теоретической биологии . 245 (2): 258–67. Бибкод : 2007JThBi.245..258L. дои : 10.1016/j.jtbi.2006.09.016. ПМИД  17125798.
  17. ^ Хаммерштейн, П. (2003). Почему взаимность так редко встречается у социальных животных? Протестантский призыв. В: П. Хаммерштейн, редактор журнала «Генетическая и культурная эволюция сотрудничества», MIT Press. стр. 83–94.
  18. ^ «Рынки и данные». Экономист . 27 сентября 2007 г.
  19. ^ Ремейер, Джули (29 октября 2012 г.). «Теория игр предполагает, что нынешние переговоры по климату не предотвратят катастрофу». Новости науки . Общество науки и общественности.
  20. ^ Осанг, Томас; Нандииз, Арундати (август 2003 г.). Экологическое регулирование компаний, загрязняющих окружающую среду: пересмотр гипотезы Портера (PDF) (бумага). Архивировано (PDF) из оригинала 02 июля 2010 г.
  21. ^ Броснан, Сара Ф.; Эрли, Райан Л.; Дугаткин, Ли А. (октябрь 2003 г.). «Наблюдательное обучение и осмотр хищников у гуппи (Poecilia reticulata): социальное обучение у гуппи». Этология . 109 (10): 823–833. дои : 10.1046/j.0179-1613.2003.00928.x .
  22. ^ Докинз, Ричард (1976). Эгоистичный ген . Издательство Оксфордского университета.
  23. ^ Эйнсли, Джордж (2001). Распад Воли . Издательство Кембриджского университета. ISBN 978-0-521-59694-7.
  24. ^ Сервантес Константино, Гарат, Николаисен, Пас, Мартинес-Монтес, Кессель, Кабана и Градин (2020). «Нейронная обработка повторяющихся результатов дилеммы заключенного указывает на выбор следующего раунда и скорость взаимного сотрудничества». Социальная нейронаука . 16 (2): 103–120. дои : 10.1080/17470919.2020.1859410. PMID  33297873. S2CID  228087900.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  25. ^ Аксельрод, Роберт (1980). «Эффективный выбор в дилемме узника». Журнал разрешения конфликтов . 24 (1): 3–25. дои : 10.1177/002200278002400101. ISSN  0022-0027. JSTOR  173932. S2CID  143112198.
  26. ^ Хенриксен, Лиза (март 2012 г.). «Комплексные ограничения на маркетинг табачных изделий: продвижение, упаковка, цена и место». Контроль над табаком . 21 (2): 147–153. doi : 10.1136/tobaccocontrol-2011-050416. ПМЦ 4256379 . ПМИД  22345238. 
  27. ^ Николсон, Уолтер (2000). Промежуточная микроэкономика и ее применение (8-е изд.). Форт-Уэрт, Техас: Dryden Press: Издательство Harcourt College. ISBN 978-0-030-25916-6.
  28. ^ Шнайер, Брюс (26 октября 2012 г.). «Лэнс Армстронг и дилемма заключенных, связанная с допингом в профессиональном спорте | Wired Opinion». Проводной . Wired.com . Проверено 29 октября 2012 г.
  29. ^ Снайдер, Гленн Х. (1971). «Дилемма заключенного» и «куриные» модели в международной политике». Ежеквартальный журнал международных исследований . 15 (1): 66–103. дои : 10.2307/3013593. ISSN  0020-8833. JSTOR  3013593.
  30. ^ Джервис, Роберт (1978). «Сотрудничество в условиях дилеммы безопасности». Мировая политика . 30 (2): 167–214. дои : 10.2307/2009958. hdl : 2027/uc1.31158011478350 . ISSN  1086-3338. JSTOR  2009958. S2CID  154923423.
  31. ^ abc Джервис, Роберт (1978). «Сотрудничество в условиях дилеммы безопасности». Мировая политика . 30 (2): 167–214. дои : 10.2307/2009958. hdl : 2027/uc1.31158011478350 . ISSN  0043-8871. JSTOR  2009958. S2CID  154923423.
  32. ^ Герц, Джон Х. (1950). Идеалистический интернационализм и дилемма безопасности . стр. 157–180.
  33. ^ Снайдер, Гленн Х. (1984). «Дилемма безопасности в политике альянса». Мировая политика . 36 (4): 461–495. дои : 10.2307/2010183. ISSN  0043-8871. JSTOR  2010183. S2CID  154759602.
  34. ^ Джервис, Роберт (1976). Восприятие и заблуждение в международной политике. Издательство Принстонского университета. стр. 58–113. ISBN 978-0-691-10049-4.
  35. ^ Глейзер, Чарльз Л. (2010). Рациональная теория международной политики. Издательство Принстонского университета. ISBN 9780691143729.
  36. ^ Аксельрод, Роберт; Гамильтон, Уильям Д. (1981). «Эволюция сотрудничества». Наука . 211 (4489): 1390–1396. Бибкод : 1981Sci...211.1390A. дои : 10.1126/science.7466396. ISSN  0036-8075. ПМИД  7466396.
  37. ^ Гохале К.С., Траулсен А. Эволюционные игры в мультивселенной. Труды Национальной академии наук. 23 марта 2010 г. 107 (12): 5500–04.
  38. ^ Паундстоун 1993, стр. 126–127.
  39. ^ «Заговор Волохов «Элинор Остром и трагедия общин». Volokh.com. 12 октября 2009 г. Проверено 17 декабря 2011 г.
  40. ^ Остром, Элинор (2015) [1990]. Управление общинами: эволюция институтов коллективных действий . Издательство Кембриджского университета. дои : 10.1017/CBO9781316423936. ISBN 978-1-107-56978-2.
  41. ^ Хофштадтер, Дуглас Р. (1985). «Глава 29. Компьютерные турниры «Дилемма узника» и эволюция сотрудничества .». Метамагические темы: поиск сущности разума и закономерностей . Группа пабов Bantam Dell. ISBN 978-0-465-04566-2.
  42. ^ Ван ден Асем, Мартейн Дж. (январь 2012 г.). «Разделить или украсть? Совместное поведение, когда ставки велики». Наука управления . 58 (1): 2–20. дои : 10.1287/mnsc.1110.1413. hdl : 1765/31292 . S2CID  1371739. SSRN  1592456.
  43. ^ Кюммерли, Рольф. «Игра «Сугроб» превосходит «Дилемму заключенного» в объяснении сотрудничества» . Проверено 11 апреля 2012 г.
  44. ^ Робинсон, доктор медицинских наук; Гофорт, диджей (5 мая 2004 г.). Игры Алиби: дилеммы асимметричного заключенного (PDF) . Заседания Канадской экономической ассоциации, Торонто, 4–6 июня 2004 г. Архивировано (PDF) из оригинала 06 декабря 2004 г.
  45. ^ Беккенкамп, Мартин; Хенниг-Шмидт, Хайке; Майер-Риго, Фрэнк П. (4 марта 2007 г.). «Сотрудничество в играх с симметричными и асимметричными дилеммами заключенного» (PDF) . Институт Макса Планка по исследованию коллективных благ . Архивировано (PDF) из оригинала 02 сентября 2019 г.
  46. ^ Ромен, Линдси (18 июля 2018 г.). «Единственный персонаж Темного рыцаря, которого можно искупить, - это преступник, спасающий паромы». Полигон . Проверено 6 января 2024 г.
  47. ^ «Темный рыцарь: Теория игр: Блог курса по сетям для INFO 2040/CS 2850/Econ 2040/SOC 2090» . Проверено 6 января 2024 г.

Библиография

дальнейшее чтение

Внешние ссылки