stringtranslate.com

Сигнальная игра

Представление сигнальной игры в развернутой форме

В теории игр сигнальная игра — это простой тип динамической байесовской игры . [1]

Суть сигнальной игры заключается в том, что один игрок совершает действие, сигнал, чтобы передать информацию другому игроку, где отправка сигнала обходится дороже, если он передает ложную информацию. Например, производитель может предоставить гарантию на свой продукт, чтобы дать понять потребителям, что его продукт вряд ли сломается. Классический пример — работник, который получает высшее образование не потому, что это повышает его навыки, а потому, что это передает его способности работодателям.

В простой игре с сигналами будут два игрока: отправитель и получатель. У отправителя есть один из двух типов, которые можно назвать «желательными» и «нежелательными» с различными функциями выигрыша, где получатель знает вероятность каждого типа, но не знает, какой из них есть у этого конкретного отправителя. У получателя есть только один возможный тип.

Отправитель ходит первым, выбирая действие, называемое «сигналом» или «сообщением» (хотя термин «сообщение» чаще используется в играх без сигналов « дешевых разговоров », где отправка сообщений бесплатна). Получатель ходит вторым, после того, как увидит сигнал.

Оба игрока получают выигрыши в зависимости от типа отправителя, сообщения, выбранного отправителем, и действия, выбранного получателем. [2] [3]

Напряжение в игре заключается в том, что отправитель хочет убедить получателя, что у него есть желаемый тип, и он попытается выбрать сигнал, чтобы сделать это. Удастся ли это, зависит от того, отправит ли нежелательный тип тот же сигнал, и как получатель интерпретирует сигнал.

Идеальное байесовское равновесие

Концепция равновесия , которая актуальна для сигнальных игр, — это идеальное байесовское равновесие , уточнение байесовского равновесия Нэша .

Природа выбирает отправителя, чтобы иметь тип с вероятностью . Затем отправитель выбирает вероятность, с которой предпринять сигнальное действие , которое можно записать как для каждого возможного Получатель наблюдает сигнал, но не , и выбирает вероятность, с которой предпринять ответное действие , которое можно записать как для каждого возможного Выигрыш отправителя равен , а получателя равен

Идеальное байесовское равновесие — это комбинация убеждений и стратегий для каждого игрока. Оба игрока верят, что другой будет следовать стратегиям, указанным в равновесии, как в простом равновесии Нэша, если только они не наблюдают что-то, что имеет нулевую вероятность в равновесии. Убеждения получателя также включают распределение вероятностей, представляющее вероятность, приписываемую отправителю, имеющему тип, если получатель наблюдает сигнал . Стратегия получателя — это выбор Стратегия отправителя — это выбор . Эти убеждения и стратегии должны удовлетворять определенным условиям:

Виды идеальных байесовских равновесий, которые могут возникнуть, можно разделить на три различные категории: объединяющие равновесия , разделяющие равновесия и полуразделяющие. В данной игре может быть или не быть более одного равновесия.

Если типов отправителей больше, чем сообщений, равновесие никогда не может быть разделяющим равновесием (но может быть полуразделяющим). Существуют также гибридные равновесия , в которых отправитель рандомизирует между объединением и разделением.

Примеры

Игра на репутацию

В этой игре [1] : 326–329  [4] отправитель и получатель — фирмы. Отправитель — действующая фирма, а получатель — фирма-новичок.

Выплаты указаны в таблице справа. Предполагается, что:

Теперь мы ищем идеальные байесовские равновесия. Удобно различать разделяющие равновесия и объединяющие равновесия.

Краткое содержание:

Образовательная игра

Работа Майкла Спенса 1973 года об образовании как сигнале способностей является началом экономического анализа сигнализации. [5] [1] : 329–331  [6] В этой игре отправителями являются работники, а получателями — работодатели. В примере ниже есть два типа работников и непрерывный уровень сигнала. [7]

Игроки — рабочий и две фирмы. Рабочий выбирает уровень образования по сигналу, после чего фирмы одновременно предлагают ему заработную плату , и он соглашается на одну или другую. Тип рабочего, известный только ему самому, — это либо высокая способность с , либо низкая способность, причем вероятность каждого типа составляет 1/2. Выигрыш рабочего с высокой способностью составляет , а с низкой способностью — Фирма, которая нанимает рабочего по заработной плате, получает выигрыш , а другая фирма получает выигрыш 0.

В этой игре фирмы конкурируют за заработную плату до тех пор, пока она не станет равна ожидаемой способности, поэтому, если сигнал невозможен, результат будет Таким же будет заработная плата в объединяющем равновесии, где оба типа работников выбирают один и тот же сигнал, поэтому фирмам остается использовать свое априорное убеждение 0,5 для вероятности того, что у него высокие способности. В разделяющем равновесии заработная плата будет равна 0 для уровня сигнала, который выбирает тип Low, и 10 для сигнала типа High. Существует много равновесий, как объединяющих, так и разделяющих, в зависимости от ожиданий.

В разделяющем равновесии низкий тип выбирает Заработная плата будет и для некоторого критического уровня , который сигнализирует о высокой способности. Для выбора низкого типа требуется, чтобы так и мы можем заключить, что Для выбора высокого типа требуется, чтобы так и мы можем заключить, что Таким образом, любое значение от 5 до 10 может поддерживать равновесие. Идеальное байесовское равновесие требует, чтобы было указано также неравновесное убеждение для всех других возможных уровней, кроме 0 и уровней, которые «невозможны» в равновесии, поскольку ни один из типов не играет на них. Эти убеждения должны быть такими, чтобы ни один игрок не хотел отклоняться от своей стратегии равновесия 0 или к другой Удобное убеждение заключается в том, что если другое, более реалистичное убеждение, которое поддерживало бы равновесие, равно , если и если . Существует континуум равновесий, для каждого возможного уровня Одно равновесие, например, равно

В объединяющем равновесии оба типа выбирают одно и то же. Одно объединяющее равновесие заключается в том, что оба типа выбирают отсутствие образования с убеждением о неравновесии. В этом случае заработная плата будет равна ожидаемой способности 5, и ни один из типов работников не будет отклоняться в сторону более высокого уровня образования, поскольку фирмы не посчитают, что это что-то говорит им о типе работника.

Самым удивительным результатом является то, что существуют также объединяющие равновесия с Предположим, мы определяем убеждение вне равновесия как Тогда заработная плата будет 5 для работника с , но 0 для работника с заработной платой Низкий тип сравнивает выплаты с и если он готов следовать своей стратегии равновесия Высокий тип выберет a fortiori. Таким образом, существует другой континуум равновесий со значениями в [0, 2.5].

В сигнальной модели образования ожидания имеют решающее значение. Если, как в разделяющем равновесии, работодатели ожидают, что люди с высокими способностями получат определенный уровень образования, а люди с низкими способностями — нет, мы получаем главное понимание: если люди не могут напрямую сообщать о своих способностях, они будут получать образование, даже если это не повышает производительность, просто чтобы продемонстрировать способности. Или, в объединяющем равновесии, когда работодатели не считают, что образование что-то сигнализирует, мы можем получить результат, что никто не станет образованным. Или, в объединяющем равновесии, когда все получают образование, которое совершенно бесполезно, даже не показывая, у кого высокие способности, из страха, что если они отклонятся и не получат образование, работодатели подумают, что у них низкие способности.

Игра «Пиво-Киш»

Игра «Пиво-киш» Чо и Крепса [8] опирается на стереотип о том, что поедатели киша менее мужественны . В этой игре индивидуум B размышляет, стоит ли ему вступать в дуэль с другим индивидуумом A. B знает, что A либо слабак , либо угрюмый , но не знает, какой именно. B предпочел бы дуэль, если A слабак , но не предпочел бы, если A угрюмый . Игрок A, независимо от типа, хочет избежать дуэли. Перед принятием решения у B есть возможность посмотреть, выберет ли A пиво или киш на завтрак. Оба игрока знают, что слабаки предпочитают киш, а угрюмые — пиво. Смысл игры — проанализировать выбор завтрака каждым видом A. Это стало стандартным примером сигнальной игры. Подробнее см. [9] : 14–18  .

Применение сигнальных игр

Сигнальные игры описывают ситуации, когда у одного игрока есть информация, которой нет у другого игрока. Такие ситуации асимметричной информации очень распространены в экономике и поведенческой биологии.

Философия

Первой сигнальной игрой была сигнальная игра Льюиса , которая появилась в докторской диссертации Дэвида К. Льюиса (и более поздней книге) Convention . См. [10] Replying to WVO Quine , [11] [12] Льюис пытается разработать теорию конвенции и смысла с помощью сигнальных игр. В своих самых крайних комментариях он предполагает, что понимание равновесных свойств соответствующей сигнальной игры охватывает все, что нужно знать о смысле:

Я описал характер случая сигнализации, не упомянув значения сигналов: два фонаря означали, что красные мундиры прибывают морем, или что-то в этом роде. Но, похоже, ничего важного не осталось недосказанным, так что сказанное должно каким-то образом подразумевать, что сигналы имеют свое значение. [13]

Использование сигнальных игр продолжилось в философской литературе. Другие использовали эволюционные модели сигнальных игр для описания возникновения языка. Работа по возникновению языка в простых сигнальных играх включает модели Хуттеггера [14] , Грима и др. , [15] , Скирмса [16] [17] и Цоллмана. [18] Хармс [19] [20] и Хуттеггер [21] попытались расширить исследование, включив в него различие между нормативным и описательным языком.

Экономика

Первым применением сигнальных игр к экономическим проблемам была игра «Образование» Майкла Спенса . Вторым применением была игра «Репутация».

Биология

Ценные достижения были достигнуты путем применения сигнальных игр к ряду биологических вопросов. Наиболее примечательна модель гандикапа Алана Графена (1990) проявлений влечения к партнеру. [22] Рога оленей, сложное оперение павлинов и райских птиц , а также песня соловья — все это такие сигналы. Анализ Графена биологической сигнализации формально похож на классическую монографию Майкла Спенса об экономической рыночной сигнализации . [23] Совсем недавно серия статей Гетти [24] [25] [26] [27] показала, что анализ Графена, как и анализ Спенса, основан на критическом упрощающем предположении, что сигнализаторы обменивают издержки на выгоды аддитивным образом, так же, как люди вкладывают деньги, чтобы увеличить доход в той же валюте. Это предположение о том, что затраты и выгоды компенсируются аддитивным образом, может быть справедливым для некоторых биологических сигнальных систем, но не справедливо для мультипликативных компромиссов, таких как компромисс между затратами на выживание и выгодами для воспроизводства, который, как предполагается, опосредует эволюцию сигналов, отбираемых половым путем.

Чарльз Годфрей (1991) смоделировал попрошайничество птенцов как сигнальную игру. [28] Попрошайничество птенцов не только информирует родителей о том, что птенец голоден, но и привлекает хищников к гнезду. Родители и птенцы находятся в конфликте. Птенцы получают выгоду, если родители прилагают больше усилий, чтобы прокормить их, чем конечный уровень выгоды родителей от инвестиций. Родители обменивают инвестиции в нынешних птенцов на инвестиции в будущее потомство.

Сигналы устрашения преследования были смоделированы как сигнальные игры. [29] Известно, что газели Томпсона иногда выполняют « стотт », прыжок в воздух на несколько футов с открытым белым хвостом, когда они обнаруживают хищника. Олкок и другие предположили, что это действие является сигналом скорости газели для хищника. Это действие успешно различает типы, потому что для больного существа было бы невозможно или слишком дорого выполнить его, и, следовательно, хищник удерживается от преследования стоттирующей газели, потому что она, очевидно, очень проворна и ее будет трудно поймать.

Концепция информационной асимметрии в молекулярной биологии давно очевидна. [30] Хотя молекулы не являются рациональными агентами, моделирование показало, что посредством репликации, отбора и генетического дрейфа молекулы могут вести себя в соответствии с динамикой сигнальной игры. Такие модели были предложены для объяснения, например, возникновения генетического кода из мира РНК и аминокислот. [31]

Дорогостоящая и бесплатная сигнализация

Одним из основных применений сигнальных игр как в экономике , так и в биологии было определение того, при каких условиях честная сигнализация может быть равновесием игры. То есть, при каких условиях мы можем ожидать, что рациональные люди или животные, подверженные естественному отбору, раскроют информацию о своих типах?

Если интересы обеих сторон совпадают, то есть они обе предпочитают одни и те же результаты во всех ситуациях, то честность является равновесием. (Хотя в большинстве этих случаев существуют и некоммуникативные равновесия.) Однако если интересы сторон не полностью совпадают, то поддержание информативных сигнальных систем поднимает важную проблему.

Рассмотрим обстоятельство, описанное Джоном Мейнардом Смитом относительно передачи между связанными особями. Предположим, что сигнализатор может быть либо голодным, либо просто голодным, и он может подать сигнал об этом факте другому особи, у которой есть еда. Предположим, что они хотели бы больше еды независимо от своего состояния, но что особь с едой хочет дать им еду только в том случае, если они голодают. В то время как у обоих игроков одинаковые интересы, когда сигнализатор голодает, у них противоположные интересы, когда сигнализатор только голоден. Когда они только голодны, у них есть стимул лгать о своей потребности, чтобы получить еду. И если сигнализатор регулярно лжет, то получатель должен игнорировать сигнал и делать то, что он считает лучшим.

Определение того, насколько стабильна сигнализация в этих ситуациях, волновало как экономистов, так и биологов, и оба независимо друг от друга предположили, что стоимость сигнала может играть роль. Если отправка одного сигнала является дорогостоящей, то она может стоить только стоимости сигнала для голодающего человека. Анализ того, когда необходимы затраты для поддержания честности, был важной областью исследований в обеих этих областях.

Смотрите также

Ссылки

  1. ^ abc Подраздел 8.2.2 в Fudenberg Trole 1991, стр. 326–331.
  2. ^ Гиббонс, Роберт (1992). Учебник теории игр . Нью-Йорк: Harvester Wheatsheaf. ISBN 978-0-7450-1159-2.
  3. ^ Осборн, М. Дж. и Рубинштейн, А. (1994). Курс теории игр . Кембридж: MIT Press. ISBN 978-0-262-65040-3.
  4. ^ которая является упрощенной версией модели репутации, предложенной в 1982 году Крепсом, Уилсоном, Милгромом и Робертсом.
  5. ^ Спенс, AM (1973). «Сигналы рынка труда». Quarterly Journal of Economics . 87 (3): 355–374. doi :10.2307/1882010. JSTOR  1882010.
  6. ^ Обзор эмпирических данных о важности сигнализации в образовании см. в Andrew Weiss. 1995. "Human Capital vs. Signalling Explanations of Wages". Journal of Economic Perspectives , 9 (4): 133-154. DOI: 10.1257/jep.9.4.133.
  7. ^ Это упрощенная версия модели из статьи Йоханнеса Хорнера «Сигнализация и скрининг», The New Palgrave Dictionary of Economics , 2-е издание, 2008 г., под редакцией Стивена Н. Дурлауфа и Лоуренса Э. Блюма, http://najecon.com/econ504/signallingb.pdf.
  8. ^ Чо, Ин-Ку; Крепс, Дэвид М. (май 1987 г.). «Сигнальные игры и устойчивые равновесия». The Quarterly Journal of Economics . 102 (2): 179–222. CiteSeerX 10.1.1.407.5013 . doi :10.2307/1885060. JSTOR  1885060. 
  9. ^ Джеймс Пек. «Идеальное байесовское равновесие» (PDF) . Университет штата Огайо . Получено 2 сентября 2016 г. .
  10. ^ Льюис, Д. (1969). Конвенция. Философское исследование . Кембридж: Издательство Гарвардского университета.
  11. ^ Куайн, WVO (1936). «Истина по соглашению». Философские эссе для Альфреда Норта Уайтхеда . Лондон: Longmans, Green & Co. стр. 90–124. ISBN 978-0-8462-0970-6.(Перепечатка)
  12. ^ Куайн, WVO (1960). «Карнап и логическая истина». Synthese . 12 (4): 350–374. doi :10.1007/BF00485423.
  13. ^ Льюис (1969), стр. 124.
  14. ^ Хюттеггер, SM (2007). «Эволюция и объяснение смысла». Философия науки . 74 (1): 1–24. doi :10.1086/519477.
  15. ^ Grim, P.; Kokalis, T.; Alai-Tafti, A.; Kilb, N.; St. Denis, Paul (2001). «Making Meaning Happen». Технический отчет № 01-02 . Стоуни-Брук: Группа по логике и формальной семантике SUNY, Стоуни-Брук.
  16. ^ Skyrms, B. (1996). Эволюция общественного договора . Кембридж: Cambridge University Press. ISBN 978-0-521-55471-8.
  17. ^ Skyrms, B. (2010). Эволюция сигналов, обучение и информация . Нью-Йорк: Oxford University Press. ISBN 978-0-19-958082-8.
  18. ^ Zollman, KJS (2005). «Разговор с соседями: эволюция регионального значения». Философия науки . 72 (1): 69–85. doi :10.1086/428390.
  19. ^ Хармс, У. Ф. (2000). «Адаптация и моральный реализм». Биология и философия . 15 (5): 699–712. doi :10.1023/A:1006661726993.
  20. ^ Хармс, У. Ф. (2004). Информация и значение в эволюционных процессах . Кембридж: Издательство Кембриджского университета. ISBN 978-0-521-81514-7.
  21. ^ Хюттеггер, SM (2005). «Эволюционные объяснения изъявительных и императивных наклонений». Erkenntnis . 66 (3): 409–436. doi :10.1007/s10670-006-9022-1.
  22. ^ Графен, А. (1990). «Биологические сигналы как помехи». Журнал теоретической биологии . 144 (4): 517–546. Bibcode : 1990JThBi.144..517G. doi : 10.1016/S0022-5193(05)80088-8. PMID  2402153.
  23. ^ Спенс, А. М. (1974). Сигнализация рынка: передача информации при найме и связанных с этим процессах . Кембридж: Издательство Гарвардского университета. ISBN 978-0-674-54990-6.
  24. ^ Гетти, Т. (1998). «Сигнализация гандикапа: когда плодовитость и жизнеспособность не складываются». Animal Behaviour . 56 (1): 127–130. doi :10.1006/anbe.1998.0744. PMID  9710469.
  25. ^ Гетти, Т. (1998). «Надежная сигнализация не обязательно должна быть помехой». Animal Behaviour . 56 (1): 253–255. doi :10.1006/anbe.1998.0748. PMID  9710484.
  26. ^ Гетти, Т. (2002). «Сигналы здоровья против паразитов». The American Naturalist . 159 (4): 363–371. doi :10.1086/338992. PMID  18707421.
  27. ^ Getty, T. (2006). «Сигналы, выбранные половым путем, не похожи на спортивные гандикапы». Trends in Ecology & Evolution . 21 (2): 83–88. doi :10.1016/j.tree.2005.10.016. PMID  16701479.
  28. ^ Godfray, HCJ (1991). «Сигнализация родителями потребностей потомства». Nature . 352 (6333): 328–330. Bibcode :1991Natur.352..328G. doi :10.1038/352328a0.
  29. ^ Ячи, С. (1995). «Как может развиваться честная сигнализация? Роль принципа гандикапа». Труды Королевского общества Лондона B. 262 ( 1365): 283–288. doi :10.1098/rspb.1995.0207.
  30. ^ Джон Мейнард Смит. (2000) Концепция информации в биологии. Философия науки. 67(2):177-194
  31. ^ Jee, J.; Sundstrom, A.; Massey, SE; Mishra, B. (2013). «Что информационно-асимметричные игры могут рассказать нам о контексте «Замороженной аварии» Крика?». Journal of the Royal Society Interface . 10 (88): 20130614. doi :10.1098/rsif.2013.0614. PMC 3785830. PMID  23985735 .