Дешёвые разговоры

В теории игр дешевые разговоры — это общение между игроками, которое напрямую не влияет на выигрыши в игре. Предоставление и получение информации бесплатны. Это контрастирует с сигнализацией , в которой отправка определенных сообщений может быть дорогостоящей для отправителя в зависимости от состояния мира.

Эта базовая установка, заданная Винсентом Кроуфордом и Джоэлом Собелем ^[1], дала начало множеству вариантов.

Если дать формальное определение, то пустая болтовня — это общение, которое: ^[2]

бесплатно передавать и получать
не является обязательным (т.е. не ограничивает стратегический выбор ни одной из сторон)
непроверяемый (т.е. не может быть проверен третьей стороной, например судом)

Таким образом, агент, занимающийся пустыми разговорами, может лгать безнаказанно, но в равновесии может решить этого не делать.

Приложения

Теория игр

В общем, дешевые разговоры могут быть добавлены к любой игре и имеют потенциал для улучшения набора возможных результатов равновесия. Например, можно добавить раунд дешевых разговоров в начале Битвы полов . Каждый игрок объявляет, собирается ли он пойти на футбольный матч или в оперу. Поскольку Битва полов является координационной игрой , этот начальный раунд общения может позволить игрокам выбирать среди нескольких равновесий, тем самым достигая более высоких выплат, чем в нескоординированном случае. Сообщения и стратегии, которые приводят к этому результату, симметричны для каждого игрока. Они таковы: 1) объявлять оперу или футбол с равной вероятностью 2) если человек объявляет оперу (или футбол), то, услышав это сообщение, другой человек также скажет оперу (или футбол) (Фаррелл и Рабин , 1996). Если они оба объявляют разные варианты, то никакой координации не достигается. В случае сообщения только одного игрока это также может дать этому игроку преимущество первого хода.

Однако не гарантируется, что дешевые разговоры окажут влияние на равновесные выплаты. Другая игра, «Дилемма заключенного» , — это игра, в которой единственное равновесие находится в доминирующих стратегиях. Любые предварительные дешевые разговоры будут игнорироваться, и игроки будут играть в свои доминирующие стратегии (Предать, Предать) независимо от отправленных сообщений.

Биологическое применение

Обычно утверждается, что дешевые разговоры не окажут никакого влияния на базовую структуру игры. В биологии авторы часто утверждали, что дорогостоящая сигнализация лучше всего объясняет сигнализацию между животными (см. Принцип гандикапа , Теория сигнализации ). Это общее убеждение подвергается некоторым сомнениям (см. работу Карла Бергстрома ^[3] и Брайана Скирмса 2002, 2004). В частности, несколько моделей, использующих эволюционную теорию игр, указывают на то, что дешевые разговоры могут оказывать влияние на эволюционную динамику конкретных игр.

Определение Кроуфорда и Собеля

Параметр

В базовой форме игры общаются два игрока: отправитель S и получатель R.

Тип

Отправитель S получает знания о состоянии мира или его «типе» t . Получатель R не знает t ; у него есть только предполагаемые убеждения об этом, и он полагается на сообщение от S, чтобы, возможно, улучшить точность своих убеждений.

Сообщение

S решает отправить сообщение m . Сообщение m может раскрывать полную информацию, но может также давать ограниченную, размытую информацию: обычно оно говорит: «Состояние мира находится между t ₁ и t ₂ ». Оно может вообще не давать никакой информации.

Форма сообщения не имеет значения, пока есть взаимопонимание, общая интерпретация. Это может быть общее заявление председателя центрального банка, политическая речь на любом языке и т. д. Какова бы ни была форма, в конечном итоге она означает «Состояние мира находится между t ₁ и t ₂ ».

Действие

Получатель R получает сообщение m . R обновляет свои убеждения о состоянии мира с учетом новой информации, которую он может получить, используя правило Байеса . R решает предпринять действие a . Это действие влияет как на его собственную полезность, так и на полезность отправителя.

Утилита

Решение S относительно содержания m основано на максимизации его полезности, учитывая то, что он ожидает от R. Полезность — это способ количественной оценки удовлетворения или желаний. Это может быть финансовая прибыль или нефинансовое удовлетворение, например, степень защиты окружающей среды. → Квадратичные полезности: Соответствующие полезности S и R могут быть определены следующим образом: $U^{S}(a,t)=-(atb)^{2}$ $U^{R}(a,t)=-(at)^{2}$

Теория применима к более общим формам полезности, но квадратичные предпочтения облегчают изложение. Таким образом, S и R имеют разные цели, если b ≠ 0. Параметр b интерпретируется как конфликт интересов между двумя игроками или, альтернативно, как смещение. U ^R максимизируется, когда a = t , что означает, что получатель хочет предпринять действие, которое соответствует состоянию мира, которое он в общем случае не знает. U ^S максимизируется, когда a = t + b , что означает, что S хочет, чтобы было предпринято немного более высокое действие, если b > 0. Поскольку S не контролирует действие, S должен получить желаемое действие, выбрав, какую информацию раскрыть. Полезность каждого игрока зависит от состояния мира и от решений обоих игроков, которые в конечном итоге приводят к действию a .

Равновесие Нэша

Мы ищем равновесие, в котором каждый игрок принимает оптимальное решение, предполагая, что другой игрок также принимает оптимальное решение. Игроки рациональны, хотя у R есть только ограниченная информация. Ожидания реализуются, и нет стимула отклоняться от этой ситуации.

Теорема

Кроуфорд и Собель характеризуют возможные равновесия Нэша .

Обычно существует несколько равновесий , но их конечное число.
Разделение , означающее полное раскрытие информации, не является равновесием Нэша.
Лепетание , означающее отсутствие передачи информации, всегда является результатом равновесия.

Когда интересы совпадают, информация полностью раскрывается. Когда конфликт интересов очень большой, вся информация скрывается. Это крайние случаи. Модель, допускающая более тонкие случаи, когда интересы близки, но различны, и в этих случаях оптимальное поведение приводит к раскрытию некоторой, но не всей информации, что приводит к различным видам тщательно сформулированных предложений, которые мы можем наблюдать.

В более общем плане:

Существует N ^* > 0 такое, что для всех N с 1 ≤ N ≤ N ^* ,
существует по крайней мере равновесие, в котором набор индуцированных действий имеет мощность N ; и, более того,
не существует равновесия, которое вызывает более N ^* действий.

Сообщения

Хотя сообщения могут заранее предполагать бесконечное число возможных значений μ(t) для бесконечного числа возможных состояний мира t , на самом деле они могут принимать только конечное число значений (m ₁ , m ₂ , . . . , m _N ) .

Таким образом, равновесие можно охарактеризовать разбиением (t ₀ (N), t ₁ (N). . . t _N (N)) множества типов [0, 1], где 0 = t ₀ (N) < t ₁ (N) < . . . < t _N (N) = 1. Это разбиение показано в правом верхнем сегменте рисунка 1.

t i (N) — это границы интервалов, в которых сообщения постоянны: для t _i-1 (N) < t < t _i₍ N), μ(t) = m _i .

Действия

Поскольку действия являются функциями сообщений, действия также постоянны на этих интервалах: для t _i-1 (N) < t < t _i (N) , α(t) = α(mi ₎ = a _i .

Функция действия теперь косвенно характеризуется тем фактом, что каждое значение a _i оптимизирует возврат для R , зная, что t находится между t ₁ и t ₂ . Математически (предполагая, что t равномерно распределено по [0, 1]),

$a_{i}={\bar {a}}(t_{i-1},t_{i})=\mathrm {arg} \max _{a}\int _{t_{i-1}}^{t_{i}}U^{R}(a,t)dt$

→ Квадратичные полезности:

Учитывая, что R знает, что t находится между t _i-1 и t _i , и в частном случае квадратичной полезности, где R хочет, чтобы действие a было как можно ближе к t , мы можем интуитивно показать, что оптимальным действием является середина интервала: $a_{i}={\frac {t_{i-1}+t_{i}}{2}}$

Состояние безразличия

При $t = t i$ отправителю должно быть безразлично, отправлять ли сообщение $m i-1$ или $m i$ . 1 ≤ i≤ N-1 $U^{S}(a_{i},t_{i})=U^{S}(a_{i+1},t_{i})$

Это дает информацию о N и t _i .

→ Практически: Рассмотрим разбиение размера N. Можно показать, что $t_{i}=t_{1}i+2bi(i-1)\qquad t_{1}={\frac {1-2bN(N-1)}{N}}$

N должно быть достаточно малым, чтобы числитель был положительным. Это определяет максимально допустимое значение , где — потолок , т.е. наименьшее положительное целое число, большее или равное . Пример: Предположим, что b = 1/20 . Тогда N ^* = 3 . Теперь опишем все равновесия для N=1 , 2 или 3 (см. рисунок 2). $N^{*}=\langle -{\frac {1}{2}}+{\frac {1}{2}}{\sqrt {1+{\frac {2}{b}}}}\rangle$ $\langle Z\rangle$ $Z$ $Z$

N = 1: Это равновесие лепета. t ₀ = 0, t ₁ = 1 ; a ₁ = 1/2 = 0,5 .

N = 2: t ₀ = 0, t ₁ = 2/5 = 0,4, t ₂ = 1 ; a ₁ = 1/5 = 0,2, a ₂ = 7/10 = 0,7 .

N = N ^* = 3: t ₀ = 0, t ₁ = 2/15, t ₂ = 7/15, t ₃ = 1 ; a ₁ = 1/15, a ₂ = 3/10 = 0,3, a ₃ = 11/15 .

При N = 1 мы получаем максимально грубое сообщение, которое не несет никакой информации. Поэтому на верхней левой панели все красное. При N = 3 сообщение становится тоньше . Однако оно остается довольно грубым по сравнению с полным раскрытием, которое было бы линией 45°, но которое не является равновесием Нэша.

При большем N и более тонком сообщении синяя область важнее. Это подразумевает большую полезность. Раскрытие большего количества информации выгодно обеим сторонам.

Смотрите также

Примечания

^ Кроуфорд, Винсент П.; Собель, Джоэл (ноябрь 1982 г.). «Стратегическая передача информации». Econometrica . 50 (6): 1431–1451. CiteSeerX 10.1.1.295.3462 . doi :10.2307/1913390. JSTOR 1913390.
^ Фаррелл, Джозеф (1987). «Дешевые разговоры, координация и вход». Журнал экономики RAND . 18 (1): 34–39. JSTOR 2555533.
^ "Биология информации". Архивировано из оригинала 2005-03-04 . Получено 2005-03-17 .

Ссылки

Crawford, VP; Sobel, J. (1982). «Стратегическая передача информации». Econometrica . 50 (6): 1431–1451. CiteSeerX 10.1.1.461.9770 . doi :10.2307/1913390. JSTOR 1913390.
Фаррелл, Дж.; Рабин, М. (1996). «Дешевые разговоры». Журнал экономических перспектив . 10 (3): 103–118. doi : 10.1257/jep.10.3.103 . JSTOR 2138522.
Робсон, А. Дж. (1990). «Эффективность в эволюционных играх: Дарвин, Нэш и секретное рукопожатие» (PDF) . Журнал теоретической биологии . 144 (3): 379–396. Bibcode :1990JThBi.144..379R. doi :10.1016/S0022-5193(05)80082-7. PMID 2395377.
Skyrms, B. (2002). «Сигналы, эволюция и объяснительная сила транзитной информации» (PDF) . Философия науки . 69 (3): 407–428. doi :10.1086/342451. S2CID 15843361.
Скирмс, Б. (2004). Охота на оленя и эволюция социальной структуры . Нью-Йорк: Cambridge University Press. ISBN 0-521-82651-9.