stringtranslate.com

Эволюция сотрудничества

«Эволюция сотрудничества» — книга 1984 года, написанная политологом Робертом Аксельродом [1] , которая развивает одноименную работу, написанную Аксельродом и эволюционным биологом У. Д. Гамильтоном . [2] В резюме статьи рассматривается вопрос с точки зрения «сотрудничества в организмах, будь то бактерии или приматы». [2]

В книге подробно излагается теория возникновения сотрудничества между индивидуумами, опирающаяся на теорию игр и эволюционную биологию . С 2006 года переиздания книги включали предисловие Ричарда Докинза и продавались как переработанное издание.

В книге представлено исследование того, как может возникнуть и сохраниться сотрудничество , как объясняется применением теории игр . [2] В книге дается подробное объяснение эволюции сотрудничества за пределами традиционной теории игр. Академическая литература, посвященная формам сотрудничества, которые нелегко объяснить в традиционной теории игр, особенно при рассмотрении эволюционной биологии , в значительной степени приняла свою современную форму в результате влиятельной статьи Аксельрода и Гамильтона 1981 года [2] и последующей книги.

Предыстория: турниры Аксельрода

Аксельрод изначально запросил стратегии у других теоретиков игр, чтобы принять участие в первом турнире. Каждая стратегия была сопряжена с каждой другой стратегией для 200 итераций игры «Дилемма заключенного » и оценивалась по общему количеству очков, накопленных в ходе турнира. Победителем стала очень простая стратегия, представленная Анатолем Рапопортом под названием « око за око » (TFT), которая сотрудничает на первом ходу, а затем повторяет (отвечает взаимностью) то, что другой игрок сделал на предыдущем ходу. Результаты первого турнира были проанализированы и опубликованы, и был проведен второй турнир, чтобы посмотреть, сможет ли кто-нибудь найти лучшую стратегию. TFT снова победила. Аксельрод проанализировал результаты и сделал несколько интересных открытий о природе сотрудничества, которые он описывает в своей книге. [3]

И в реальных турнирах, и в различных повторах, наиболее эффективными стратегиями были хорошие: [4] то есть они никогда не были первыми, кто сдавался. Многие из участников приложили немало усилий, чтобы получить преимущество над «хорошими» (и обычно более простыми) стратегиями, но безуспешно: хитрые стратегии, борющиеся за несколько очков, как правило, не могли сравниться с хорошими стратегиями, работающими вместе. TFT (и другие «хорошие» стратегии в целом) «выиграли не тем, что сыграли лучше, чем другой игрок, а тем, что вызвали сотрудничество [и] продвигая взаимный интерес, а не эксплуатируя слабость другого». [5]

Быть «хорошим» может быть выгодно, но это также может привести к тому, что вас обманут. Чтобы получить выгоду — или избежать эксплуатации — необходимо быть провокационным и прощающим. Когда другой игрок предает, хорошая стратегия должна быть немедленно спровоцирована на ответное предательство. [6] То же самое касается прощения: вернуться к сотрудничеству, как только это сделает другой игрок. Чрезмерное наказание рискует эскалацией и может привести к «бесконечному эху чередующихся предательств», что снижает баллы обоих игроков. [7]

Большинство игр, которые теория игр до сих пор исследовала, являются играми с « нулевой суммой » — то есть, общие вознаграждения фиксированы, и игрок преуспевает только за счет других игроков. Но в реальной жизни нет игр с нулевой суммой. Наши лучшие перспективы обычно заключаются в совместных усилиях. Фактически, TFT не может набрать больше очков, чем его партнер; в лучшем случае он может сделать только «так же хорошо, как». Тем не менее, он выиграл турниры, последовательно занимая прочное второе место с различными партнерами. [8] Аксельрод резюмирует это как «не завидуйте»; [9] другими словами, не стремитесь к выигрышу, большему, чем у другого игрока. [10]

В любой игре IPD существует определенный максимальный счет, который каждый игрок может получить, всегда сотрудничая. Но некоторые стратегии пытаются найти способы получить немного больше с помощью случайного предательства (эксплуатации). Это может работать против некоторых стратегий, которые менее провокационные или более снисходительные, чем TFT, но в целом они работают плохо. «Общая проблема с этими правилами заключается в том, что они использовали сложные методы вывода выводов о другом игроке [стратегии] – и эти выводы были неверными». [11] Против TFT нельзя сделать ничего лучше, чем просто сотрудничать. [12] Аксельрод называет это «ясностью». Или: «не будьте слишком умными». [13]

Успех любой стратегии зависит от характера конкретных стратегий, с которыми она сталкивается, что зависит от состава общей популяции. Чтобы лучше смоделировать эффекты репродуктивного успеха, Аксельрод также провел «экологический» турнир, где распространенность каждого типа стратегии в каждом раунде определялась успехом этой стратегии в предыдущем раунде. Конкуренция в каждом раунде становится сильнее, поскольку более слабые исполнители сокращаются и устраняются. Результаты были поразительными: горстка стратегий — все «хорошие» — стали доминировать на поле. [14] В море нехороших стратегий «хорошие» стратегии — при условии, что они также были провокационными — достаточно хорошо справлялись друг с другом, чтобы компенсировать случайную эксплуатацию. По мере того, как сотрудничество становилось всеобщим, непровокационные стратегии эксплуатировались и в конечном итоге устранялись, после чего эксплуататорские (некооперативные) стратегии были превзойдены кооперативными стратегиями.

Подводя итог, можно сказать, что успех в эволюционной «игре» коррелирует со следующими характеристиками:

Фонд взаимного сотрудничества

Описанные выше уроки применимы в средах, которые поддерживают сотрудничество, но поддерживается ли сотрудничество вообще, в решающей степени зависит от вероятности (называемой ω [омега]) того, что игроки встретятся снова [15], также называемой параметром дисконтирования или, образно говоря, тенью будущего. Когда ω низок — то есть у игроков ничтожно мал шанс встретиться снова — каждое взаимодействие фактически является однократной игрой «Дилемма заключенного», и можно также предать во всех случаях (стратегия, называемая «ВСЕ D»), потому что даже если один сотрудничает, нет способа удержать другого игрока от эксплуатации этого. Но в итеративном PD ценность повторяющихся кооперативных взаимодействий может стать больше, чем выгода/риск единичной эксплуатации (а это все, что допускает такая стратегия, как TFT).

Любопытно, что рациональность и осознанный выбор не являются необходимыми, как и доверие, или даже сознание, [16] пока есть шаблон, который приносит пользу обоим игрокам (например, повышает приспособленность), и некоторая вероятность будущего взаимодействия. Часто первоначальное взаимное сотрудничество даже не является намеренным, но, «открыв» выгодный шаблон, обе стороны реагируют на него, продолжая условия, которые его поддерживают.

Это подразумевает два требования к игрокам, помимо любой стратегии, которую они могут принять. Во-первых, они должны уметь распознавать других игроков, чтобы избежать эксплуатации со стороны мошенников. Во-вторых, они должны уметь отслеживать свою предыдущую историю с любым данным игроком, чтобы реагировать на стратегию этого игрока. [17]

Даже когда дисконтный параметр ω достаточно высок, чтобы разрешить взаимное сотрудничество, все еще остается вопрос о том, может ли и как начаться сотрудничество. Одно из открытий Аксельрода заключается в том, что когда существующая популяция никогда не предлагает сотрудничества и не отвечает на него взаимностью — случай ALL D — то никакая хорошая стратегия не может быть установлена ​​изолированными индивидуумами; сотрудничество — это строго ставка на неудачу . («Тщетность изолированного восстания». [18] ) Но еще одно открытие большой важности заключается в том, что могут быть установлены кластеры хороших стратегий. Даже небольшая группа индивидуумов с хорошими стратегиями с редкими взаимодействиями может все же преуспеть в этих взаимодействиях, чтобы компенсировать низкий уровень эксплуатации со стороны нехороших стратегий. [19]

Однако сотрудничество становится более сложным, как только принимаются более реалистичные модели, которые, например, предлагают более двух вариантов действий, обеспечивают возможность постепенного сотрудничества, заставляют действия ограничивать будущие действия ( зависимость от пути ) или в которых интерпретация действий партнеров становится нетривиальной (например, распознавание степени продемонстрированного сотрудничества) [20].

Последующие работы

В 1984 году Аксельрод подсчитал, что «в Psychological Abstracts цитируются сотни статей по теме «Дилемма заключенного » [21] , и подсчитал, что количество ссылок только на «Эволюцию сотрудничества» «растет со скоростью более 300 в год». [22] Полный обзор этой литературы невозможен. Поэтому ниже приведены лишь некоторые избранные выдержки.

Аксельрод считает свою последующую книгу «Сложность сотрудничества » [23] продолжением «Эволюции сотрудничества» . Другие работы по эволюции сотрудничества расширились, чтобы охватить просоциальное поведение в целом [24] и в религии [25] , другие механизмы для создания сотрудничества [26] , ИДП при различных условиях и предположениях [27] и использование других игр, таких как игры «Общественные блага » и «Ультиматум» , для исследования глубоко укоренившихся представлений о справедливости и честной игре. [28] Она также использовалась для того, чтобы бросить вызов рациональной и эгоистичной модели « экономического человека » в экономике [29] и в качестве основы для замены дарвиновской теории полового отбора теорией социального отбора [30] .

Хорошие стратегии лучше способны к вторжению, если у них есть социальные структуры или другие средства увеличения их взаимодействий. Аксельрод обсуждает это в главе 8; в более поздней статье он, Рик Риоло и Майкл Коэн [31] используют компьютерное моделирование, чтобы показать рост сотрудничества среди агентов, которые имеют незначительный шанс будущих встреч, но могут распознавать сходство произвольной характеристики (например, зеленую бороду ); тогда как другие исследования [32] показали, что единственными стратегиями Итерированной дилеммы заключенного, которые сопротивляются вторжению в хорошо смешанную развивающуюся популяцию, являются щедрые стратегии.

Когда турнир IPD вносит шум (ошибки или недопонимание), стратегии TFT могут попасть в ловушку длинной цепочки ответных дезертирств, тем самым снижая их счет. TFT также терпит стратегии «ALL C» (всегда сотрудничать), которые затем открывают возможности для эксплуататоров. [33] В 1992 году Мартин Новак и Карл Зигмунд продемонстрировали стратегию под названием «Павлов» (или «выиграть–остаться, проиграть–сменить»), которая лучше работает в этих обстоятельствах. [34] Павлов смотрит на свой собственный предыдущий ход, а также на ход другого игрока. Если выигрыш был R или P (см. «Дилемму заключенного» выше), он сотрудничает; если S или T, он дезертирует.

В статье 2006 года Новак перечислил пять механизмов, посредством которых естественный отбор может привести к сотрудничеству. [35] В дополнение к родственному отбору и прямой взаимности он показывает, что:

Выплаты в игре «Дилемма заключенного» фиксированы, но в реальной жизни перебежчики часто наказываются сотрудничающими. Когда наказание обходится дорого, среди сотрудничающих возникает дилемма второго порядка между теми, кто платит за принуждение, и теми, кто этого не делает. [37] Другие работы показали, что хотя людям и предоставляется выбор между присоединением к группе, которая наказывает безбилетников, и той, которая изначально не предпочитает группу без санкций, тем не менее после нескольких раундов они присоединятся к группе, применяющей санкции, поскольку считают, что санкции обеспечивают лучшую выплату. [38]

В небольших популяциях или группах существует вероятность того, что косвенная взаимность (репутация) может взаимодействовать с прямой взаимностью (например, «око за око»), при этом ни одна из стратегий не доминирует над другой. [39] Взаимодействие между этими стратегиями может привести к возникновению динамических социальных сетей , которые демонстрируют некоторые свойства, наблюдаемые в эмпирических сетях. [40] Если сетевая структура и выбор в дилемме заключенного развиваются совместно, то сотрудничество может выжить. В полученных сетях кооператоры будут располагаться более центрально, чем перебежчики, которые будут стремиться находиться на периферии сети. [41]

В "Коэволюции парохиального альтруизма и войны" Чон-Кю Чхве и Сэмюэля Боулза. Из их резюме:

Альтруизм — принесение пользы членам группы за счет себя — и парохиализм — враждебность по отношению к людям, не принадлежащим к вашей этнической, расовой или другой группе — являются обычными человеческими формами поведения. Пересечение этих двух форм — которое мы называем «патрохиальным альтруизмом» — озадачивает с эволюционной точки зрения, поскольку альтруистическое или парохиальное поведение снижает выгоды человека по сравнению с тем, что он мог бы получить, избегая этих форм поведения. Но парохиальный альтруизм мог бы развиться, если бы парохиализм способствовал межгрупповой враждебности, а сочетание альтруизма и парохиализма способствовало успеху в этих конфликтах... [Ни один из них] не был бы жизнеспособным по отдельности, но, способствуя групповому конфликту, они могли бы развиться совместно. [42]

Рассмотрение механизмов, посредством которых происходит обучение в социальной среде, является ключевым в исследованиях эволюции. В контексте этого обсуждения правила обучения, в частности конформизм и имитация, зависящая от вознаграждения, не предопределены произвольно, а биологически выбраны. Поведенческие стратегии, которые включают сотрудничество, предательство и сотрудничество в сочетании с наказанием, выбираются в соответствии с преобладающим правилом обучения агента. Моделирование модели в условиях, приближающихся к тем, которые испытывали ранние гоминиды, показывает, что конформизм может развиваться даже тогда, когда индивиды сталкиваются исключительно с кооперативной дилеммой, вопреки предыдущим утверждениям. Более того, включение конформистов значительно увеличивает размер группы, в которой может поддерживаться сотрудничество. Эти результаты модели демонстрируют надежность, сохраняя валидность даже в условиях высоких показателей миграции и нечастых межгрупповых конфликтов. [43]

Ни Чой и Боулз, ни Гусман, Родригес-Сиккет и Роуторн не утверждают, что люди на самом деле эволюционировали таким образом, но что компьютерное моделирование показывает, как война может быть вызвана взаимодействием этих видов поведения. Таким образом, важнейший открытый вопрос исследования заключается в том, насколько реалистичны предположения, на которых основаны эти модели моделирования. [44]

Программное обеспечение

Для проведения симуляций и турниров по «дилемме заключенного» создано несколько программных пакетов, некоторые из которых имеют доступный исходный код.

Рекомендуемая литература

Смотрите также

Ссылки

  1. Книга Аксельрода была кратко изложена в колонке Дугласа Хофштадтера «Метамагические темы» в журнале Scientific American за май 1983 г. (Хофштадтер, 1983) (перепечатана в его книге (Хофштадтер, 1985); см. также краткое изложение Ричарда Докинза во втором издании « Эгоистичного гена» (Докинз, 1989, гл. 12).
  2. ^ abcd Аксельрод и Гамильтон 1981.
  3. ^ Аксельрод 1984.
  4. ^ Аксельрод 1984, стр. 113.
  5. ^ Аксельрод 1984, стр. 130.
  6. Аксельрод 1984, стр. 62, 211.
  7. ^ Аксельрод 1984, стр. 186.
  8. ^ Аксельрод 1984, стр. 112.
  9. Аксельрод 1984, стр. 110–113.
  10. ^ Аксельрод 1984, стр. 25.
  11. ^ Аксельрод 1984, стр. 120.
  12. Аксельрод 1984, стр. 47, 118.
  13. ^ Аксельрод 1984, стр. 120+.
  14. Аксельрод 1984, стр. 48–53.
  15. ^ Аксельрод 1984, стр. 13.
  16. Аксельрод 1984, стр. 18, 174.
  17. ^ Аксельрод 1984, стр. 174.
  18. ^ Аксельрод 1984, стр. 150.
  19. ^ Аксельрод 1984, стр. 63–68, 99
  20. ^ Прешельт, Лутц (1996). «INCA: многовариантная модель сотрудничества при ограниченной коммуникации». Биосистемы . 37 (1–2): 127–134. Bibcode : 1996BiSys..37..127P. doi : 10.1016/0303-2647(95)01549-3.
  21. Аксельрод 1984, стр. 28.
  22. ^ Аксельрод 1984, стр. 3.
  23. ^ Аксельрод 1997.
  24. ^ Бойд 2006; Боулз 2006.
  25. ^ Норензаян и Шариф 2008.
  26. ^ Новак 2006.
  27. ^ Аксельрод и Дион 1988; Хоффман 2000 классифицирует и обобщает более 50 исследований.
  28. ^ Новак, Пейдж и Зигмунд 2000; Зигмунд, Фер и Новак 2002.
  29. ^ Камерер и Фер 2006.
  30. ^ Рафгарден, Оиши и Акчай 2006.
  31. ^ Риоло, Коэн и Аксельрод 2001.
  32. ^ Стюарт и Плоткин (2013)
  33. ^ Аксельрод (1984, стр. 136–138) имеет несколько интересных комментариев о необходимости подавления универсальных кооператоров. См. также похожую тему в романе Пирса Энтони «Макроскоп» .
  34. Новак и Зигмунд 1992; см. также Милински 1993.
  35. ^ Новак 2006;
  36. ^ Здесь групповой отбор не является формой эволюции, что проблематично (см. Докинз (1989), гл. 7), а механизмом развития сотрудничества.
  37. ^ Хауэрт и др. 2007.
  38. ^ Гюрерк, Ирленбуш и Рокенбах, 2006 г.
  39. ^ Фелпс, С., Неварес, Г. и Хоус, А., 2009. Влияние размера группы и частоты встреч на эволюцию сотрудничества. В LNCS, том 5778, ECAL 2009, Достижения в области искусственной жизни: Дарвин встречает фон Неймана. Будапешт: Springer, стр. 37–44. [1].
  40. ^ Фелпс, С. (2012). «Возникновение социальных сетей посредством прямой и косвенной взаимности» (PDF) . Автономные агенты и многоагентные системы . doi :10.1007/s10458-012-9207-8. S2CID  1337854.
  41. ^ Фоско и Менгель 2011.
  42. ^ Чой и Боулз 2007, стр. 636.
  43. ^ Гусман, РА; Родригес-Сикерт, К.; Роуторн, Р. (2007). «Когда в Риме, поступай как римляне: коэволюция альтруистического наказания, конформистского обучения и сотрудничества» (PDF) . Эволюция и поведение человека . 28 (2): 112–117. Bibcode :2007EHumB..28..112A. doi :10.1016/j.evolhumbehav.2006.08.002.
  44. ^ Раш 2014.
  45. ^ http://www-personal.umich.edu/~axe/research/Software/CC/CC2.html
  46. ^ https://web.archive.org/web/19991010053242/http://www.lifl.fr/IPD/ipd.frame.html .
  47. ^ https://github.com/Axelrod-Python/Axelrod

Библиография

Большинство этих ссылок относятся к научной литературе, чтобы установить авторитетность различных пунктов в статье. Несколько ссылок с меньшим авторитетом, но большей доступностью также включены.

Внешние ссылки