stringtranslate.com

Эволюционно стабильная стратегия

Эволюционно стабильная стратегия ( ESS ) — это стратегия (или набор стратегий), которая непроницаема при принятии ее популяцией в процессе адаптации к определенной среде, то есть она не может быть заменена альтернативной стратегией (или набором стратегий), которая может быть новой или изначально редкой. Введенная Джоном Мейнардом Смитом и Джорджем Р. Прайсом в 1972/3, [1] [2] это важная концепция в поведенческой экологии , эволюционной психологии , математической теории игр и экономике , с приложениями в других областях, таких как антропология , философия и политология .

В терминах теории игр, ESS является равновесным уточнением равновесия Нэша , являясь равновесием Нэша, которое также является «эволюционно стабильным ». Таким образом, после того как оно зафиксировано в популяции, одного естественного отбора достаточно, чтобы предотвратить замену его альтернативными ( мутантными ) стратегиями (хотя это не исключает возможности того, что лучшая стратегия или набор стратегий возникнут в ответ на селективное давление, вызванное изменением окружающей среды).

История

Эволюционно стабильные стратегии были определены и представлены Джоном Мейнардом Смитом и Джорджем Р. Прайсом в статье в журнале Nature 1973 года . [2] Так много времени ушло на рецензирование статьи для журнала Nature , что этому предшествовало эссе Мейнарда Смита 1972 года в книге эссе под названием « Об эволюции» . [1] Эссе 1972 года иногда цитируется вместо статьи 1973 года, но в университетских библиотеках гораздо больше шансов найти копии Nature . Статьи в журнале Nature обычно короткие; в 1974 году Мейнард Смит опубликовал более длинную статью в журнале Journal of Theoretical Biology . [3] Мейнард Смит объясняет подробнее в своей книге 1982 года «Эволюция и теория игр» . [4] Иногда вместо этого цитируются именно они. Фактически, ESS стала настолько важной для теории игр, что часто не приводится никакой ссылки, поскольку предполагается, что читатель с ней знаком.

Мейнард Смит математически формализовал вербальный аргумент, сделанный Прайсом, который он прочитал во время рецензирования статьи Прайса. Когда Мейнард Смит понял, что несколько неорганизованный Прайс не готов пересмотреть свою статью для публикации, он предложил добавить Прайса в качестве соавтора.

Концепция была получена из работы Р. Х. Макартура [5] и У. Д. Гамильтона [ 6] о соотношении полов , выведенной из принципа Фишера , особенно из концепции Гамильтона (1967) о непобедимой стратегии . Мейнард Смит был совместно награжден премией Крафорда 1999 года за разработку концепции эволюционно стабильных стратегий и применение теории игр к эволюции поведения. [7]

Использование ESS:

Мотивация

Равновесие Нэша — это традиционная концепция решения в теории игр . Она зависит от когнитивных способностей игроков. Предполагается, что игроки знают структуру игры и сознательно пытаются предсказать ходы своих противников и максимизировать свои собственные выигрыши. Кроме того, предполагается, что все игроки знают это (см. общие знания ). Эти предположения затем используются для объяснения того, почему игроки выбирают стратегии равновесия Нэша.

Эволюционно стабильные стратегии мотивированы совершенно иначе. Здесь предполагается, что стратегии игроков биологически закодированы и наследуются . Индивиды не контролируют свою стратегию и не должны знать об игре. Они размножаются и подчиняются силам естественного отбора , а выигрыши игры представляют собой репродуктивный успех (биологическую приспособленность ). Предполагается, что альтернативные стратегии игры иногда возникают посредством процесса, подобного мутации . Чтобы быть ESS, стратегия должна быть устойчивой к этим альтернативам.

Учитывая радикально разные мотивирующие предположения, может показаться удивительным, что ESS и равновесия Нэша часто совпадают. Фактически, каждое ESS соответствует равновесию Нэша, но некоторые равновесия Нэша не являются ESS.

Равновесие Нэша

ESS — это улучшенная или модифицированная форма равновесия Нэша . (См. следующий раздел для примеров, которые противопоставляют эти два.) В равновесии Нэша, если все игроки принимают свои соответствующие части, ни один игрок не может выиграть , переключившись на любую альтернативную стратегию. В игре с двумя игроками это пара стратегий. Пусть E( S , T ) представляет собой выигрыш за игру стратегии S против стратегии T . Пара стратегий ( S , S ) является равновесием Нэша в игре с двумя игроками тогда и только тогда, когда для обоих игроков для любой стратегии T :

E( S , S ) ≥ E( T , S )

В этом определении стратегия TS может быть нейтральной альтернативой S (приносящей одинаковые результаты, но не лучшие). Равновесие Нэша считается стабильным, даже если T набирает одинаковые результаты, исходя из предположения, что у игроков нет долгосрочного стимула использовать T вместо S. Этот факт представляет собой отправную точку ESS.

Мейнард Смит и Прайс [2] определяют два условия для того, чтобы стратегия S была ESS. Для всех TS , либо

  1. E( S , S ) > E( T , S ), или
  2. E( S , S ) = E( T , S ) и E( S , T ) > E( T , T )

Первое условие иногда называют строгим равновесием Нэша. [9] Второе условие иногда называют «вторым условием Мейнарда Смита». Второе условие означает, что хотя стратегия T нейтральна по отношению к выигрышу против стратегии S , популяция игроков, которые продолжают играть в стратегию S, имеет преимущество при игре против T.

Существует также альтернативное, более сильное определение ESS, данное Томасом. [10] Это делает другой акцент на роли концепции равновесия Нэша в концепции ESS. Следуя терминологии, данной в первом определении выше, это определение требует, чтобы для всех TS

  1. E( S , S ) ≥ E( T , S ), и
  2. Е( С , Т ) > Е( Т , Т )

В этой формулировке первое условие указывает, что стратегия является равновесием Нэша, а второе указывает, что выполняется второе условие Мейнарда Смита. Обратите внимание, что два определения не являются точно эквивалентными: например, каждая чистая стратегия в координационной игре ниже является ESS по первому определению, но не по второму.

На словах это определение выглядит так: выигрыш первого игрока, когда оба игрока используют стратегию S, выше (или равен) выигрышу первого игрока, когда он меняет стратегию на T, а второй игрок сохраняет свою стратегию S, а выигрыш первого игрока, когда только его противник меняет стратегию на T, выше его выигрыша в случае, если оба игрока меняют свои стратегии на T.

Эта формулировка более четко подчеркивает роль условия равновесия Нэша в ESS. Она также допускает естественное определение связанных понятий, таких как слабая ESS или эволюционно стабильное множество . [10]

Примеры различий между равновесиями Нэша и ESS

В большинстве простых игр ESS и равновесия Нэша полностью совпадают. Например, в дилемме заключенного есть только одно равновесие Нэша, и его стратегия ( Defect ) также является ESS.

В некоторых играх могут быть равновесия Нэша, которые не являются ESS. Например, в игре «навреди соседу» (матрица выигрышей которой показана здесь) и ( A , A ), и ( B , B ) являются равновесиями Нэша, поскольку игроки не могут добиться большего, отказавшись от любого из них. Однако только B является ESS (и сильным Нэшем). A не является ESS, поэтому B может нейтрально вторгнуться в популяцию стратегов A и доминировать, поскольку B набирает больше очков против B, чем A против B. Эта динамика отражается во втором условии Мейнарда Смита, поскольку E( A , A ) = E( B , A ), но это не тот случай, когда E( A , B ) > E( B , B ).

Равновесия Нэша с альтернативами с одинаковым количеством очков могут быть ESS. Например, в игре Harm everyone , C является ESS, поскольку она удовлетворяет второму условию Мейнарда Смита. Стратеги D могут временно вторгнуться в популяцию стратегов C , набирая одинаково много очков против C , но они платят цену, когда начинают играть друг против друга; C набирает больше очков против D , чем D . Таким образом, хотя здесь E( C , C ) = E( D , C ), также имеет место, что E( C , D ) > E( D , D ). В результате C является ESS.

Даже если в игре есть чистые стратегические равновесия Нэша, может оказаться, что ни одна из этих чистых стратегий не является ESS. Рассмотрим игру «Курица» . В этой игре есть два чистых стратегических равновесия Нэша ( Swerve , Stay ) и ( Stay , Swerve ). Однако при отсутствии некоррелированной асимметрии ни Swerve , ни Stay не являются ESS. Существует третье равновесие Нэша, смешанная стратегия , которая является ESS для этой игры (см. игру «Ястреб-голубь» и «Лучший ответ» для объяснения).

Этот последний пример указывает на важное различие между равновесиями Нэша и ESS. Равновесия Нэша определяются на наборах стратегий (спецификация стратегии для каждого игрока), тогда как ESS определяются в терминах самих стратегий. Равновесия, определяемые ESS, всегда должны быть симметричными и, таким образом, иметь меньше точек равновесия.

Против эволюционно стабильного состояния

В популяционной биологии два понятия — эволюционно стабильная стратегия (ЭСС) и эволюционно стабильное состояние — тесно связаны, но описывают разные ситуации.

В эволюционно стабильной стратегии, если все члены популяции ее принимают, никакая мутантная стратегия не может вторгнуться. [4] Как только практически все члены популяции используют эту стратегию, «рациональной» альтернативы не остается. ESS является частью классической теории игр .

В эволюционно стабильном состоянии генетический состав популяции восстанавливается путем отбора после нарушения, если нарушение не слишком велико. Эволюционно стабильное состояние — это динамическое свойство популяции, которая возвращается к использованию стратегии или смеси стратегий, если она нарушена из этого начального состояния. Это часть популяционной генетики , динамической системы или эволюционной теории игр . Теперь это называется конвергентной устойчивостью. [11]

Б. Томас (1984) применяет термин ЭСС к индивидуальной стратегии, которая может быть смешанной, а эволюционно стабильное состояние популяции — к популяционной смеси чистых стратегий, которая может быть формально эквивалентна смешанной ЭСС. [12]

Эволюционная стабильность популяции не связана с ее генетическим разнообразием: она может быть генетически мономорфной или полиморфной . [4]

Стохастический ESS

В классическом определении ESS ни одна стратегия мутанта не может вторгнуться. В конечных популяциях любой мутант в принципе может вторгнуться, хотя и с низкой вероятностью, что подразумевает, что не может существовать ни одна ESS. В бесконечной популяции ESS вместо этого может быть определена как стратегия, которая, если она подвергнется вторжению новой стратегии мутанта с вероятностью p, сможет контрвторгнуть от единственной стартовой особи с вероятностью >p, как показано на примере эволюции хеджирования ставок . [13]

Дилемма заключенного

Распространенной моделью альтруизма и социального сотрудничества является дилемма заключенного . Здесь группа игроков коллективно выиграла бы, если бы они могли играть в Cooperate , но поскольку Defect оказывается более выигрышным вариантом, у каждого отдельного игрока есть стимул играть в Defect . Одним из решений этой проблемы является введение возможности возмездия, когда отдельные лица играют в игру неоднократно против одного и того же игрока. В так называемой итерированной дилемме заключенного одни и те же два лица играют в дилемму заключенного снова и снова. В то время как дилемма заключенного имеет только две стратегии ( Cooperate и Defect ), итерированная дилемма заключенного имеет огромное количество возможных стратегий. Поскольку у отдельного лица может быть разный план действий на случай непредвиденных обстоятельств для каждой истории, а игра может повторяться неограниченное количество раз, на самом деле может быть бесконечное количество таких планов действий на случай непредвиденных обстоятельств.

Три простых плана действий на случай непредвиденных обстоятельств, которые получили существенное внимание, это Always Defect , Always Cooperate и Tit for Tat . Первые две стратегии делают одно и то же независимо от действий другого игрока, в то время как последняя отвечает на следующем раунде, делая то же, что было сделано с ней в предыдущем раунде — она отвечает на Cooperate с помощью Cooperate и Defect с помощью Defect .

Если вся популяция играет в Tit-for-Tat и появляется мутант, который играет Always Defect , Tit-for-Tat превзойдет Always Defect . Если популяция мутанта станет слишком большой — процент мутанта будет оставаться небольшим. Tit for Tat , следовательно, является ESS, по отношению только к этим двум стратегиям . С другой стороны, остров игроков Always Defect будет устойчив к вторжению нескольких игроков Tit-for-Tat , но не против большого их количества. [14] Если мы введем Always Cooperate , популяция Tit-for-Tat больше не будет ESS. Поскольку популяция игроков Tit-for-Tat всегда сотрудничает, стратегия Always Cooperate ведет себя идентично в этой популяции. В результате мутант, который играет Always Cooperate, не будет устранен. Однако, даже если популяция Always Cooperate и Tit-for-Tat может сосуществовать, если есть небольшой процент популяции, которая Always Defect , селективное давление против Always Cooperate и в пользу Tit-for-Tat . Это связано с более низкими выплатами за сотрудничество, чем за дезертирство в случае, если противник дезертирует.

Это демонстрирует трудности применения формального определения ESS к играм с большими стратегическими пространствами и побудило некоторых рассмотреть альтернативы.

Поведение человека

Области социобиологии и эволюционной психологии пытаются объяснить поведение животных и людей, а также социальные структуры, в основном с точки зрения эволюционно стабильных стратегий. Социопатия (хроническое антисоциальное или криминальное поведение) может быть результатом комбинации двух таких стратегий. [15]

Эволюционно стабильные стратегии изначально рассматривались для биологической эволюции, но они могут применяться и в других контекстах. Фактически, существуют стабильные состояния для большого класса адаптивной динамики . В результате их можно использовать для объяснения человеческого поведения, которое не имеет никаких генетических влияний.

Смотрите также

Ссылки

  1. ^ ab Maynard Smith, J. (1972). "Теория игр и эволюция боевых действий". On Evolution . Edinburgh University Press. ISBN 0-85224-223-9.
  2. ^ abc Maynard Smith, J. ; Price, GR (1973). «Логика конфликта животных». Nature . 246 (5427): 15–8. Bibcode :1973Natur.246...15S. doi :10.1038/246015a0.
  3. ^ Мейнард Смит, Дж. (1974). «Теория игр и эволюция конфликтов животных» (PDF) . Журнал теоретической биологии . 47 (1): 209–21. Bibcode : 1974JThBi..47..209M. doi : 10.1016/0022-5193(74)90110-6. PMID  4459582.
  4. ^ abc Мейнард Смит, Джон (1982). Эволюция и теория игр . Cambridge University Press. ISBN 0-521-28884-3.
  5. ^ MacArthur, RH (1965). Waterman T.; Horowitz H. (ред.). Теоретическая и математическая биология . Нью-Йорк: Blaisdell.
  6. ^ Гамильтон, У. Д. (1967). «Необычайные соотношения полов». Science . 156 (3774): 477–88. Bibcode :1967Sci...156..477H. doi :10.1126/science.156.3774.477. JSTOR  1721222. PMID  6021675.
  7. Пресс-релиз Архивировано 03.03.2016 в Wayback Machine для премии Крафорда 1999 года
  8. Alexander, Jason McKenzie (23 мая 2003 г.). «Эволюционная теория игр». Стэнфордская энциклопедия философии . Получено 31 августа 2007 г.
  9. ^ Харсани, Дж. (1973). «Нечетность числа точек равновесия: новое доказательство». Int. J. Game Theory . 2 (1): 235–50. doi :10.1007/BF01737572.
  10. ^ ab Thomas, B. (1985). «Об эволюционно стабильных множествах». J. Math. Biology . 22 : 105–115. doi :10.1007/bf00276549.
  11. ^ Apaloo, J.; Brown, JS; Vincent, TL (2009). «Эволюционная теория игр: ESS, стабильность сходимости и NIS». Evolutionary Ecology Research . 11 : 489–515. Архивировано из оригинала 2017-08-09 . Получено 2018-01-10 .
  12. ^ Томас, Б. (1984). «Эволюционная стабильность: состояния и стратегии». Theor. Popul. Biol . 26 (1): 49–67. Bibcode :1984TPBio..26...49T. doi :10.1016/0040-5809(84)90023-6.
  13. ^ Кинг, Оливер Д.; Масел, Джоанна (1 декабря 2007 г.). «Эволюция адаптаций хеджирования ставок к редким сценариям». Теоретическая популяционная биология . 72 (4): 560–575. Bibcode :2007TPBio..72..560K. doi :10.1016/j.tpb.2007.08.006. PMC 2118055 . PMID  17915273. 
  14. ^ Аксельрод, Роберт (1984). Эволюция кооперации . Базовые книги. ISBN 0-465-02121-2.
  15. ^ Мили, Л. (1995). «Социобиология социопатии: интегрированная эволюционная модель». Поведенческие и мозговые науки . 18 (3): 523–99. doi :10.1017/S0140525X00039595.

Дальнейшее чтение

Внешние ссылки