В теории игр сигнальная игра — это простой тип динамической байесовской игры . [1]
Суть сигнальной игры заключается в том, что один игрок совершает действие, сигнал, чтобы передать информацию другому игроку, где отправка сигнала обходится дороже, если он передает ложную информацию. Например, производитель может предоставить гарантию на свой продукт, чтобы дать понять потребителям, что его продукт вряд ли сломается. Классический пример — работник, который получает высшее образование не потому, что это повышает его навыки, а потому, что это передает его способности работодателям.
В простой игре с сигналами будут два игрока: отправитель и получатель. У отправителя есть один из двух типов, которые можно назвать «желательными» и «нежелательными» с различными функциями выигрыша, где получатель знает вероятность каждого типа, но не знает, какой из них есть у этого конкретного отправителя. У получателя есть только один возможный тип.
Отправитель ходит первым, выбирая действие, называемое «сигналом» или «сообщением» (хотя термин «сообщение» чаще используется в играх без сигналов « дешевых разговоров », где отправка сообщений бесплатна). Получатель ходит вторым, после того, как увидит сигнал.
Оба игрока получают выигрыши в зависимости от типа отправителя, сообщения, выбранного отправителем, и действия, выбранного получателем. [2] [3]
Напряжение в игре заключается в том, что отправитель хочет убедить получателя, что у него есть желаемый тип, и он попытается выбрать сигнал, чтобы сделать это. Удастся ли это, зависит от того, отправит ли нежелательный тип тот же сигнал, и как получатель интерпретирует сигнал.
Концепция равновесия , которая актуальна для сигнальных игр, — это идеальное байесовское равновесие , уточнение байесовского равновесия Нэша .
Природа выбирает отправителя, чтобы иметь тип с вероятностью . Затем отправитель выбирает вероятность, с которой предпринять сигнальное действие , которое можно записать как для каждого возможного Получатель наблюдает сигнал, но не , и выбирает вероятность, с которой предпринять ответное действие , которое можно записать как для каждого возможного Выигрыш отправителя равен , а получателя равен
Идеальное байесовское равновесие — это комбинация убеждений и стратегий для каждого игрока. Оба игрока верят, что другой будет следовать стратегиям, указанным в равновесии, как в простом равновесии Нэша, если только они не наблюдают что-то, что имеет нулевую вероятность в равновесии. Убеждения получателя также включают распределение вероятностей, представляющее вероятность, приписываемую отправителю, имеющему тип, если получатель наблюдает сигнал . Стратегия получателя — это выбор Стратегия отправителя — это выбор . Эти убеждения и стратегии должны удовлетворять определенным условиям:
Виды идеальных байесовских равновесий, которые могут возникнуть, можно разделить на три различные категории: объединяющие равновесия , разделяющие равновесия и полуразделяющие. В данной игре может быть или не быть более одного равновесия.
Если типов отправителей больше, чем сообщений, равновесие никогда не может быть разделяющим равновесием (но может быть полуразделяющим). Существуют также гибридные равновесия , в которых отправитель рандомизирует между объединением и разделением.
В этой игре [1] : 326–329 [4] отправитель и получатель — фирмы. Отправитель — действующая фирма, а получатель — фирма-новичок.
Выплаты указаны в таблице справа. Предполагается, что:
Теперь мы ищем идеальные байесовские равновесия. Удобно различать разделяющие равновесия и объединяющие равновесия.
Краткое содержание:
Работа Майкла Спенса 1973 года об образовании как сигнале способностей является началом экономического анализа сигнализации. [5] [1] : 329–331 [6] В этой игре отправителями являются работники, а получателями — работодатели. В примере ниже есть два типа работников и непрерывный уровень сигнала. [7]
Игроки — рабочий и две фирмы. Рабочий выбирает уровень образования по сигналу, после чего фирмы одновременно предлагают ему заработную плату , и он соглашается на одну или другую. Тип рабочего, известный только ему самому, — это либо высокая способность с , либо низкая способность, причем вероятность каждого типа составляет 1/2. Выигрыш рабочего с высокой способностью составляет , а с низкой способностью — Фирма, которая нанимает рабочего по заработной плате, получает выигрыш , а другая фирма получает выигрыш 0.
В этой игре фирмы конкурируют за заработную плату до тех пор, пока она не станет равна ожидаемой способности, поэтому, если сигнал невозможен, результат будет Таким же будет заработная плата в объединяющем равновесии, где оба типа работников выбирают один и тот же сигнал, поэтому фирмам остается использовать свое априорное убеждение 0,5 для вероятности того, что у него высокие способности. В разделяющем равновесии заработная плата будет равна 0 для уровня сигнала, который выбирает тип Low, и 10 для сигнала типа High. Существует много равновесий, как объединяющих, так и разделяющих, в зависимости от ожиданий.
В разделяющем равновесии низкий тип выбирает Заработная плата будет и для некоторого критического уровня , который сигнализирует о высокой способности. Для выбора низкого типа требуется, чтобы так и мы можем заключить, что Для выбора высокого типа требуется, чтобы так и мы можем заключить, что Таким образом, любое значение от 5 до 10 может поддерживать равновесие. Идеальное байесовское равновесие требует, чтобы было указано также неравновесное убеждение для всех других возможных уровней, кроме 0 и уровней, которые «невозможны» в равновесии, поскольку ни один из типов не играет на них. Эти убеждения должны быть такими, чтобы ни один игрок не хотел отклоняться от своей стратегии равновесия 0 или к другой Удобное убеждение заключается в том, что если другое, более реалистичное убеждение, которое поддерживало бы равновесие, равно , если и если . Существует континуум равновесий, для каждого возможного уровня Одно равновесие, например, равно
В объединяющем равновесии оба типа выбирают одно и то же. Одно объединяющее равновесие заключается в том, что оба типа выбирают отсутствие образования с убеждением о неравновесии. В этом случае заработная плата будет равна ожидаемой способности 5, и ни один из типов работников не будет отклоняться в сторону более высокого уровня образования, поскольку фирмы не посчитают, что это что-то говорит им о типе работника.
Самым удивительным результатом является то, что существуют также объединяющие равновесия с Предположим, мы определяем убеждение вне равновесия как Тогда заработная плата будет 5 для работника с , но 0 для работника с заработной платой Низкий тип сравнивает выплаты с и если он готов следовать своей стратегии равновесия Высокий тип выберет a fortiori. Таким образом, существует другой континуум равновесий со значениями в [0, 2.5].
В сигнальной модели образования ожидания имеют решающее значение. Если, как в разделяющем равновесии, работодатели ожидают, что люди с высокими способностями получат определенный уровень образования, а люди с низкими способностями — нет, мы получаем главное понимание: если люди не могут напрямую сообщать о своих способностях, они будут получать образование, даже если это не повышает производительность, просто чтобы продемонстрировать способности. Или, в объединяющем равновесии, когда работодатели не считают, что образование что-то сигнализирует, мы можем получить результат, что никто не станет образованным. Или, в объединяющем равновесии, когда все получают образование, которое совершенно бесполезно, даже не показывая, у кого высокие способности, из страха, что если они отклонятся и не получат образование, работодатели подумают, что у них низкие способности.
Игра «Пиво-киш» Чо и Крепса [8] опирается на стереотип о том, что поедатели киша менее мужественны . В этой игре индивидуум B размышляет, стоит ли ему вступать в дуэль с другим индивидуумом A. B знает, что A либо слабак , либо угрюмый , но не знает, какой именно. B предпочел бы дуэль, если A слабак , но не предпочел бы, если A угрюмый . Игрок A, независимо от типа, хочет избежать дуэли. Перед принятием решения у B есть возможность посмотреть, выберет ли A пиво или киш на завтрак. Оба игрока знают, что слабаки предпочитают киш, а угрюмые — пиво. Смысл игры — проанализировать выбор завтрака каждым видом A. Это стало стандартным примером сигнальной игры. Подробнее см. [9] : 14–18 .
Сигнальные игры описывают ситуации, когда у одного игрока есть информация, которой нет у другого игрока. Такие ситуации асимметричной информации очень распространены в экономике и поведенческой биологии.
Первой сигнальной игрой была сигнальная игра Льюиса , которая появилась в докторской диссертации Дэвида К. Льюиса (и более поздней книге) Convention . См. [10] Replying to WVO Quine , [11] [12] Льюис пытается разработать теорию конвенции и смысла с помощью сигнальных игр. В своих самых крайних комментариях он предполагает, что понимание равновесных свойств соответствующей сигнальной игры охватывает все, что нужно знать о смысле:
Использование сигнальных игр продолжилось в философской литературе. Другие использовали эволюционные модели сигнальных игр для описания возникновения языка. Работа по возникновению языка в простых сигнальных играх включает модели Хуттеггера [14] , Грима и др. , [15] , Скирмса [16] [17] и Цоллмана. [18] Хармс [19] [20] и Хуттеггер [21] попытались расширить исследование, включив в него различие между нормативным и описательным языком.
Первым применением сигнальных игр к экономическим проблемам была игра «Образование» Майкла Спенса . Вторым применением была игра «Репутация».
Ценные достижения были достигнуты путем применения сигнальных игр к ряду биологических вопросов. Наиболее примечательна модель гандикапа Алана Графена (1990) проявлений влечения к партнеру. [22] Рога оленей, сложное оперение павлинов и райских птиц , а также песня соловья — все это такие сигналы. Анализ Графена биологической сигнализации формально похож на классическую монографию Майкла Спенса об экономической рыночной сигнализации . [23] Совсем недавно серия статей Гетти [24] [25] [26] [27] показала, что анализ Графена, как и анализ Спенса, основан на критическом упрощающем предположении, что сигнализаторы обменивают издержки на выгоды аддитивным образом, так же, как люди вкладывают деньги, чтобы увеличить доход в той же валюте. Это предположение о том, что затраты и выгоды компенсируются аддитивным образом, может быть справедливым для некоторых биологических сигнальных систем, но не справедливо для мультипликативных компромиссов, таких как компромисс между затратами на выживание и выгодами для воспроизводства, который, как предполагается, опосредует эволюцию сигналов, отбираемых половым путем.
Чарльз Годфрей (1991) смоделировал попрошайничество птенцов как сигнальную игру. [28] Попрошайничество птенцов не только информирует родителей о том, что птенец голоден, но и привлекает хищников к гнезду. Родители и птенцы находятся в конфликте. Птенцы получают выгоду, если родители прилагают больше усилий, чтобы прокормить их, чем конечный уровень выгоды родителей от инвестиций. Родители обменивают инвестиции в нынешних птенцов на инвестиции в будущее потомство.
Сигналы устрашения преследования были смоделированы как сигнальные игры. [29] Известно, что газели Томпсона иногда выполняют « стотт », прыжок в воздух на несколько футов с открытым белым хвостом, когда они обнаруживают хищника. Олкок и другие предположили, что это действие является сигналом скорости газели для хищника. Это действие успешно различает типы, потому что для больного существа было бы невозможно или слишком дорого выполнить его, и, следовательно, хищник удерживается от преследования стоттирующей газели, потому что она, очевидно, очень проворна и ее будет трудно поймать.
Концепция информационной асимметрии в молекулярной биологии давно очевидна. [30] Хотя молекулы не являются рациональными агентами, моделирование показало, что посредством репликации, отбора и генетического дрейфа молекулы могут вести себя в соответствии с динамикой сигнальной игры. Такие модели были предложены для объяснения, например, возникновения генетического кода из мира РНК и аминокислот. [31]
Одним из основных применений сигнальных игр как в экономике , так и в биологии было определение того, при каких условиях честная сигнализация может быть равновесием игры. То есть, при каких условиях мы можем ожидать, что рациональные люди или животные, подверженные естественному отбору, раскроют информацию о своих типах?
Если интересы обеих сторон совпадают, то есть они обе предпочитают одни и те же результаты во всех ситуациях, то честность является равновесием. (Хотя в большинстве этих случаев существуют и некоммуникативные равновесия.) Однако если интересы сторон не полностью совпадают, то поддержание информативных сигнальных систем поднимает важную проблему.
Рассмотрим обстоятельство, описанное Джоном Мейнардом Смитом относительно передачи между связанными особями. Предположим, что сигнализатор может быть либо голодным, либо просто голодным, и он может подать сигнал об этом факте другому особи, у которой есть еда. Предположим, что они хотели бы больше еды независимо от своего состояния, но что особь с едой хочет дать им еду только в том случае, если они голодают. В то время как у обоих игроков одинаковые интересы, когда сигнализатор голодает, у них противоположные интересы, когда сигнализатор только голоден. Когда они только голодны, у них есть стимул лгать о своей потребности, чтобы получить еду. И если сигнализатор регулярно лжет, то получатель должен игнорировать сигнал и делать то, что он считает лучшим.
Определение того, насколько стабильна сигнализация в этих ситуациях, волновало как экономистов, так и биологов, и оба независимо друг от друга предположили, что стоимость сигнала может играть роль. Если отправка одного сигнала является дорогостоящей, то она может стоить только стоимости сигнала для голодающего человека. Анализ того, когда необходимы затраты для поддержания честности, был важной областью исследований в обеих этих областях.