Око за око

Tit for tat — английская поговорка, означающая «равное возмездие ». Это переделка tip for tap — «удар за удар», ^[1] впервые зафиксированная в 1558 году. ^[2]

Это также высокоэффективная стратегия в теории игр . Агент, использующий эту стратегию, сначала будет сотрудничать, а затем впоследствии повторит предыдущее действие противника. Если противник ранее был кооперативным, агент кооперативен. Если нет, агент не кооперативен. Это похоже на взаимный альтруизм в биологии.

Теория игр

«Око за око» очень успешно использовалось в качестве стратегии для итерированной дилеммы заключенного . Стратегия была впервые представлена Анатолем Рапопортом в двух турнирах Роберта Аксельрода , ^[3] проведенных около 1980 года. Примечательно, что это была (в обоих случаях) и самая простая стратегия, и самая успешная в прямом соревновании. Немногие распространили игровой теоретический подход на другие приложения, такие как финансы. В этом контексте было показано, что стратегия «око за око» связана со стратегией следования тренду. ^[4]

Подразумеваемое

Успех стратегии «зуб за зуб», которая в значительной степени является кооперативной, несмотря на то, что ее название подчеркивает состязательную природу, застал многих врасплох. Выстроенная против стратегий, разработанных различными командами, она победила в двух соревнованиях. После первого соревнования новые стратегии, разработанные специально для борьбы с «зуб за зуб», потерпели неудачу из-за их негативного взаимодействия друг с другом; успешная стратегия, отличная от «зуб за зуб», должна была бы быть сформулирована с учетом как «зуб за зуб», так и самой себя.

Этот результат может дать представление о том, как группы животных (и особенно человеческие общества) пришли к жизни в основном (или полностью) кооперативных обществах, а не индивидуалистическим образом " с окровавленными зубами и когтями ", который можно было бы ожидать от индивидов, находящихся в естественном состоянии Гоббса . Это, и в частности его применение к человеческому обществу и политике, является темой книги Роберта Аксельрода "Эволюция сотрудничества" .

Более того, стратегия «зуб за зуб» оказалась полезной для социальных психологов и социологов при изучении эффективных методов снижения конфликта. Исследования показали, что когда люди, которые конкурировали в течение определенного периода времени, больше не доверяют друг другу, наиболее эффективным средством обращения конкуренции является использование стратегии «зуб за зуб». Люди обычно занимаются поведенческой ассимиляцией, процессом, в котором они стремятся сопоставить свое собственное поведение с поведением, демонстрируемым сотрудничающими или конкурирующими членами группы. Поэтому, если стратегия «зуб за зуб» начинается с сотрудничества, то за этим следует сотрудничество. С другой стороны, если другая сторона конкурирует, то стратегия «зуб за зуб» приведет к тому, что альтернативная сторона также будет конкурировать. В конечном итоге, каждое действие другого члена противостоит соответствующему ответу, соревнование с соревнованием и сотрудничество с сотрудничеством.

В случае разрешения конфликта стратегия «око за око» эффективна по нескольким причинам: техника признана ясной , приятной , провокационной и прощающей . Во-первых, это ясная и узнаваемая стратегия. Те, кто ее использует, быстро распознают ее непредвиденные обстоятельства и соответствующим образом корректируют свое поведение. Более того, она считается приятной , поскольку начинается с сотрудничества и допускает дефекты только в ответ на конкуренцию. Стратегия также провокационная , поскольку обеспечивает немедленное возмездие тем, кто конкурирует. Наконец, она прощающая , поскольку немедленно порождает сотрудничество, если конкурент делает кооперативный шаг.

Последствия стратегии «око за око» имеют отношение к исследованию конфликтов, их разрешению и многим аспектам прикладной социальной науки. ^[5]

Математика

Возьмем в качестве примера следующую бесконечно повторяющуюся игру «Дилемма заключенных»:

Стратегия «око за око» копирует то, что другой игрок выбрал ранее. Если игроки сотрудничают, играя в стратегию (C,C), они сотрудничают вечно.

Сотрудничество дает следующий выигрыш (где — коэффициент дисконтирования): $\дельта$

6+6\delta +6\delta ^{2}+6\delta ^{3}...,

геометрическая прогрессия, в сумме дающая

{\frac {6}{1-\delta }}

Если игрок отклоняется к предательству (D), то в следующем раунде он будет наказан. Поочередно между результатами, где p1 сотрудничает, а p2 отклоняется, и наоборот.

Отклонение дает следующий выигрыш:

9+2\delta +9\delta ^{2}+2\delta ^{3}+9\delta ^{4}+2\delta ^{5}...,

сумма двух геометрических прогрессий, которая приходит к

{\frac {9}{1-\delta ^{2}}}+{\frac {2\delta }{1-\delta ^{2}}}

Ожидайте сотрудничества, если отклонение не приносит большей пользы, чем сотрудничество.

{\begin{aligned}{\frac {6}{1-\delta }}&\geq {\frac {9}{1-\delta ^{2}}}+{\frac {2\delta }{1-\delta ^{2}}}\\{\frac {6}{1-\delta }}&\geq {\frac {9+2\delta }{1-\delta ^{2}}}\\{\frac {1-\delta ^{2}}{1}}\cdot {\frac {6}{1-\delta }}&\geq {\frac {9+2\delta }{\cancel {1-\delta ^{2}}}}\cdot {\frac {\cancel {1-\delta ^{2}}}{1}}\\{\frac {(1+\delta ){\cancel {(1-\delta )}}}{1}}\cdot {\frac {6}{\cancel {1-\delta }}}&\geq 9+2\delta \\6+6\delta &\geq 9+2\delta \\4\delta &\geq 3\\\delta &\geq {\frac {3}{4}}\end{aligned}}

Продолжайте сотрудничать, если, $\delta \geq {\frac {3}{4}}$

Продолжайте дезертировать, если, $\delta <{\frac {3}{4}}$

Проблемы

Хотя Аксельрод эмпирически показал, что стратегия оптимальна в некоторых случаях прямой конкуренции, два агента, играющие в игру «око за око», остаются уязвимыми. Однократная ошибка в интерпретации событий любым из игроков может привести к бесконечной «спирали смерти»: если один агент предает, а противник сотрудничает, то оба агента в конечном итоге будут попеременно сотрудничать и предать, что даст более низкий выигрыш, чем если бы оба агента постоянно сотрудничали. Такая ситуация часто возникает в реальных конфликтах, начиная от школьных драк и заканчивая гражданскими и региональными войнами. Причина этих проблем в том, что игра «око за око» не является идеальным равновесием подигры , за исключением случаев, когда ставка дисконтирования находится на грани лезвия ножа . ^[6] Хотя эта подигра напрямую не достижима двумя агентами, играющими в стратегии «око за око», стратегия должна быть равновесием Нэша во всех подиграх, чтобы быть идеальной подигрой. Кроме того, эта подигра может быть достигнута, если в сигналах агентов допускается любой шум. Идеальный вариант подигры «око за око», известный как «кающийся око за око», может быть создан путем использования базового механизма репутации. ^[7]

«Острие ножа» — это «равновесие, которое существует только для точных значений экзогенных переменных. Если вы измените переменные даже в малейшей степени, равновесие «острие ножа» исчезнет». ^[8]

Может быть как равновесием Нэша, так и равновесием на острие ножа. Известно как равновесие на острие ножа, потому что равновесие «непрочно покоится» на точном значении.

Пример:

Предположим, что X = 0. Нет никакого прибыльного отклонения от (Вниз, Влево) или от (Вверх, Вправо). Однако, если значение X отклоняется на любую величину, неважно насколько малую, то равновесие больше не сохраняется. Становится выгодным отклонение вверх, например, если X имеет значение 0,000001 вместо 0. Таким образом, равновесие очень шаткое. В своем использовании в статье Википедии, условия «лезвия ножа» относятся к тому факту, что очень редко, только когда выполняется определенное условие и, например, X равно определенному значению, существует равновесие.

Око за два ока можно использовать для смягчения этой проблемы; см. описание ниже. ^[9] «Око за око с прощением» — это похожая попытка избежать смертельной спирали. Когда противник предает, игрок, использующий эту стратегию, будет время от времени сотрудничать на следующем ходу в любом случае. Точная вероятность того, что игрок ответит сотрудничеством, зависит от состава противников.

Более того, стратегия «зуб за зуб» не является оптимальной в ситуациях, не связанных с тотальной конкуренцией. Например, когда стороны являются друзьями, для дружбы может быть лучше, если игрок сотрудничает на каждом шагу, несмотря на случайные отклонения другого игрока. Большинство ситуаций в реальном мире менее конкурентны, чем тотальная конкуренция, в которой стратегия «зуб за зуб» выиграла свое соревнование.

Tit for tat сильно отличается от grim trigger тем, что он прощающий по своей природе, так как он немедленно производит сотрудничество, если конкурент выбирает сотрудничество. Grim trigger, с другой стороны, является самой беспощадной стратегией, в том смысле, что даже один дефект заставит игрока, играющего с grim trigger, дефолтовать до конца игры. ^[10]

Ось за две татуировки

Око за два ока похоже на око за око, но позволяет противнику дважды отказаться от согласованной стратегии, прежде чем игрок нанесет ответный удар. Этот аспект заставляет игрока, использующего стратегию око за око, казаться более «снисходительным» к противнику.

В стратегии «зуб за зуб», как только противник предает, игрок «зуб за зуб» немедленно отвечает предательством на следующем ходу. Это имеет неприятные последствия, вызывая две ответные стратегии, которые постоянно предают друг друга, что приводит к плохому результату для обоих игроков. Игрок «зуб за два зуба» позволит первому предательству остаться без ответа, чтобы избежать «спирали смерти» предыдущего примера. Если противник предает дважды подряд, игрок «зуб за два зуба» ответит предательством.

Эта стратегия была предложена Робертом Аксельродом во время его второго раунда компьютерного моделирования в RAND . Проанализировав результаты первого эксперимента, он определил, что если бы участник ввел стратегию tit for two tats, она бы вышла с более высоким совокупным счетом, чем любая другая программа. В результате он сам ввел ее с высокими ожиданиями во втором турнире. К сожалению, из-за более агрессивной природы программ, введенных во второй раунд, которые смогли воспользоваться ее весьма снисходительной природой, tit for two tats показала себя значительно хуже (в смысле теории игр), чем tit for tat. ^[11]

Реальное использование

Обмен файлами по принципу «равный-равному»

Пиры BitTorrent используют стратегию «око за око» для оптимизации скорости загрузки. ^[12] Более конкретно, большинство пиров BitTorrent используют вариант «око за око», который в терминологии BitTorrent называется регулярным разблокированием . Пиры BitTorrent имеют ограниченное количество слотов загрузки для выделения другим пирам. Следовательно, когда полоса пропускания загрузки пира заполнена, он будет использовать стратегию «око за око». Сотрудничество достигается, когда полоса пропускания загрузки обменивается на полосу пропускания загрузки. Поэтому, когда пир не загружает в ответ на загрузку нашего пира, программа BitTorrent заблокирует соединение с несотрудничающим пиром и выделит этот слот загрузки, как мы надеемся, более сотрудничающему пиру. Регулярное разблокирование коррелирует с постоянным сотрудничеством на первом ходу в дилемме заключенного. Периодически пир выделяет слот загрузки случайно выбранному несотрудничающему пиру ( разблокирование ). Это называется оптимистичным разблокированием . Такое поведение позволяет искать более сотрудничающих пиров и дает второй шанс ранее несотрудничающим пирам. Оптимальные пороговые значения этой стратегии все еще являются предметом исследования.

Объяснение взаимного альтруизма в сообществах животных

Исследования просоциального поведения животных привели многих этологов и эволюционных психологов к применению стратегий «око за око» для объяснения того, почему альтруизм развивается во многих сообществах животных. Эволюционная теория игр, выведенная из математических теорий, формализованных фон Нейманом и Моргенштерном (1953), была впервые разработана Мейнардом Смитом (1972) и исследована далее на примере поведения птиц Робертом Хайндом . Их применение теории игр к эволюции стратегий животных положило начало совершенно новому способу анализа поведения животных.

Взаимный альтруизм работает в сообществах животных, где стоимость для благодетеля в любой сделке с едой, правами на спаривание, гнездованием или территорией меньше, чем выгода для бенефициара. Теория также утверждает, что акт альтруизма должен быть взаимным, если баланс потребностей обратный. Механизмы выявления и наказания «обманщиков», которые не отвечают взаимностью, по сути, форма «око за око», важны для регулирования взаимного альтруизма. Например, «око за око» предлагается рассматривать как механизм кооперативного поведения инспекции хищников у гуппи .

Война

Неспособность любой из сторон отказаться от конфликта из-за страха показаться слабой или сотрудничающей с врагом была причиной многих затяжных конфликтов на протяжении всей истории.

Однако стратегия «око за око» также была обнаружена аналитиками в спонтанном ненасильственном поведении, называемом « живи и дай жить другим », которое возникло во время траншейной войны в Первую мировую войну . Войска, окопанные всего в нескольких сотнях футов друг от друга, развивали негласное понимание. Если снайпер убивал солдата с одной стороны, другая ожидала равного возмездия. И наоборот, если никто не был убит в течение некоторого времени, другая сторона признавала это подразумеваемое «перемирие» и действовала соответственно. Это создавало «сепаратный мир» между траншеями. ^[13]

Смута

Во время Смуты этот термин использовался для описания растущего поведения «око за око» между ирландскими республиканцами и ольстерскими юнионистами . ^[14] Это можно увидеть в бомбардировке паба Red Lion , совершенной ИРА, за которой последовала бомбардировка бара McGurk's , обе цели были направлены на мирных жителей. В частности, атаки массовых убийств были структурированы вокруг взаимных убийств общин юнионистов и республиканцев , обе общины в целом не были заинтересованы в насилии. ^[15] Этот сектантский менталитет привел к тому , что термин «Tit for tat bombings» вошел в общий лексикон североирландского общества. ^[16]^[17]

Смотрите также

Поляризация отношения
Курица (дичь)
Рождественское перемирие
Теория сдерживания
Око за око
Золотое правило
Взаимное гарантированное уничтожение
«Славные парни приходят первыми» — документальный фильм Ричарда Докинза , в котором обсуждается принцип «око за око».
Игра «Мир и война»
Услуга за услугу
Стратегия триггера — набор стратегий, членом которого является «око за око».
Добродетельный круг и порочный круг
Игра с нулевой суммой

Ссылки

^ "око за око". Etymology Online . Архивировано из оригинала 2023-07-26.
^ Хип, Шон Харгривз; Варуфакис, Янис (2004). Теория игр: критический текст. Routledge. стр. 191. ISBN 978-0-415-25094-8.
^ "Турниры Аксельрода". 5 сентября 2011 г.
^ Махдави-Дамгани, Бабак и Робертс, Стивен (2023). «Руководство по созданию реалистичного алгоритмического торгового рыночного симулятора для бэктестинга с учетом влияния на рынок: основанные на агентах стратегии в формате нейронной сети, динамика экосистемы и обнаружение». Алгоритмические финансы . Допечатная подготовка (1): 1–25. doi :10.3233/AF-220356.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Форсайт, DR (2010) Групповая динамика
^ Гинтис, Герберт (2000). Развитие теории игр . Princeton University Press . ISBN 978-0-691-00943-8.
^ Бойд, Роберт (1989). «Ошибки допускают эволюционную стабильность в повторяющейся игре «Дилемма заключенного». Журнал теоретической биологии . 136 (1): 47–56. Bibcode : 1989JThBi.136...47B. CiteSeerX 10.1.1.405.507 . doi : 10.1016/S0022-5193(89)80188-2. PMID 2779259.
^ "Равновесие на острие ножа – Теория игр 101" . Получено 10 декабря 2018 г. .
^ Докинз, Ричард (1989). Эгоистичный ген . Oxford University Press . ISBN 978-0-19-929115-1.
^ Аксельрод, Роберт (01.01.2000). «О шести достижениях в теории сотрудничества». Анализ и критика . 22 (1): 130–151. CiteSeerX 10.1.1.5.6149 . doi :10.1515/auk-2000-0107. ISSN 2365-9858. S2CID 17399009.
^ Аксельрод, Роберт (1984). Эволюция кооперации . Базовые книги. ISBN 978-0-465-02121-5.
^ Коэн, Брэм (2003-05-22). "Стимулы создают надежность в BitTorrent" (PDF) . BitTorrent.org . Получено 2011-02-05 .
↑ Хорошие парни приходят первыми . Ричард Докинз. BBC. 1986.
^ Хьюм, Джон (1986). «Новая Ирландия: принятие разнообразия». Исследования: Ирландский ежеквартальный обзор . 75 (300): 378–383. JSTOR 30090790.
^ Саварик, Мишель (11 октября 2014 г.). Гарбай, Ромен; Шнаппер, Полин (ред.). Политика этнического разнообразия на Британских островах. Palgrave Macmillan UK. стр. 174–188. doi :10.1057/9781137351548_10 – через Springer Link.
^ Убийства в рамках борьбы с терроризмом и временные бомбардировки ИРА, 1970-1998 Пол Гилл, Университетский колледж Лондона Джеймс Пьяцца, Университет штата Пенсильвания Джон Хорган, Университет штата Джорджия
^ Мэни, Грегори, Майкл Маккарти и Грейс Юкич. «Объяснение политического насилия в отношении гражданских лиц в Северной Ирландии: подход, ориентированный на спор». Мобилизация: Международный ежеквартальный журнал 17, № 1 (2012): 27-48.

Внешние ссылки

Найдите фразу «око за око» в Викисловаре, бесплатном словаре.

Статья в журнале Wired о том, как программа «око за око» была «побеждена» группой сотрудничающих программ
Объяснение «Око за око» на Australian Broadcasting Corporation. Архивировано 29 августа 2006 г. на Wayback Machine.