В теории игр дешевые разговоры — это общение между игроками, которое напрямую не влияет на выигрыши в игре. Предоставление и получение информации бесплатны. Это контрастирует с сигнализацией , в которой отправка определенных сообщений может быть дорогостоящей для отправителя в зависимости от состояния мира.
Эта базовая установка, заданная Винсентом Кроуфордом и Джоэлом Собелем [1], дала начало множеству вариантов.
Если дать формальное определение, то пустая болтовня — это общение, которое: [2]
Таким образом, агент, занимающийся пустыми разговорами, может лгать безнаказанно, но в равновесии может решить этого не делать.
В общем, дешевые разговоры могут быть добавлены к любой игре и имеют потенциал для улучшения набора возможных результатов равновесия. Например, можно добавить раунд дешевых разговоров в начале Битвы полов . Каждый игрок объявляет, собирается ли он пойти на футбольный матч или в оперу. Поскольку Битва полов является координационной игрой , этот начальный раунд общения может позволить игрокам выбирать среди нескольких равновесий, тем самым достигая более высоких выплат, чем в нескоординированном случае. Сообщения и стратегии, которые приводят к этому результату, симметричны для каждого игрока. Они таковы: 1) объявлять оперу или футбол с равной вероятностью 2) если человек объявляет оперу (или футбол), то, услышав это сообщение, другой человек также скажет оперу (или футбол) (Фаррелл и Рабин , 1996). Если они оба объявляют разные варианты, то никакой координации не достигается. В случае сообщения только одного игрока это также может дать этому игроку преимущество первого хода.
Однако не гарантируется, что дешевые разговоры окажут влияние на равновесные выплаты. Другая игра, «Дилемма заключенного» , — это игра, в которой единственное равновесие находится в доминирующих стратегиях. Любые предварительные дешевые разговоры будут игнорироваться, и игроки будут играть в свои доминирующие стратегии (Предать, Предать) независимо от отправленных сообщений.
Обычно утверждается, что дешевые разговоры не окажут никакого влияния на базовую структуру игры. В биологии авторы часто утверждали, что дорогостоящая сигнализация лучше всего объясняет сигнализацию между животными (см. Принцип гандикапа , Теория сигнализации ). Это общее убеждение подвергается некоторым сомнениям (см. работу Карла Бергстрома [3] и Брайана Скирмса 2002, 2004). В частности, несколько моделей, использующих эволюционную теорию игр, указывают на то, что дешевые разговоры могут оказывать влияние на эволюционную динамику конкретных игр.
В базовой форме игры общаются два игрока: отправитель S и получатель R.
Отправитель S получает знания о состоянии мира или его «типе» t . Получатель R не знает t ; у него есть только предполагаемые убеждения об этом, и он полагается на сообщение от S, чтобы, возможно, улучшить точность своих убеждений.
S решает отправить сообщение m . Сообщение m может раскрывать полную информацию, но может также давать ограниченную, размытую информацию: обычно оно говорит: «Состояние мира находится между t 1 и t 2 ». Оно может вообще не давать никакой информации.
Форма сообщения не имеет значения, пока есть взаимопонимание, общая интерпретация. Это может быть общее заявление председателя центрального банка, политическая речь на любом языке и т. д. Какова бы ни была форма, в конечном итоге она означает «Состояние мира находится между t 1 и t 2 ».
Получатель R получает сообщение m . R обновляет свои убеждения о состоянии мира с учетом новой информации, которую он может получить, используя правило Байеса . R решает предпринять действие a . Это действие влияет как на его собственную полезность, так и на полезность отправителя.
Решение S относительно содержания m основано на максимизации его полезности, учитывая то, что он ожидает от R. Полезность — это способ количественной оценки удовлетворения или желаний. Это может быть финансовая прибыль или нефинансовое удовлетворение, например, степень защиты окружающей среды. → Квадратичные полезности: Соответствующие полезности S и R могут быть определены следующим образом:
Теория применима к более общим формам полезности, но квадратичные предпочтения облегчают изложение. Таким образом, S и R имеют разные цели, если b ≠ 0. Параметр b интерпретируется как конфликт интересов между двумя игроками или, альтернативно, как смещение. U R максимизируется, когда a = t , что означает, что получатель хочет предпринять действие, которое соответствует состоянию мира, которое он в общем случае не знает. U S максимизируется, когда a = t + b , что означает, что S хочет, чтобы было предпринято немного более высокое действие, если b > 0. Поскольку S не контролирует действие, S должен получить желаемое действие, выбрав, какую информацию раскрыть. Полезность каждого игрока зависит от состояния мира и от решений обоих игроков, которые в конечном итоге приводят к действию a .
Мы ищем равновесие, в котором каждый игрок принимает оптимальное решение, предполагая, что другой игрок также принимает оптимальное решение. Игроки рациональны, хотя у R есть только ограниченная информация. Ожидания реализуются, и нет стимула отклоняться от этой ситуации.
Кроуфорд и Собель характеризуют возможные равновесия Нэша .
Когда интересы совпадают, информация полностью раскрывается. Когда конфликт интересов очень большой, вся информация скрывается. Это крайние случаи. Модель, допускающая более тонкие случаи, когда интересы близки, но различны, и в этих случаях оптимальное поведение приводит к раскрытию некоторой, но не всей информации, что приводит к различным видам тщательно сформулированных предложений, которые мы можем наблюдать.
В более общем плане:
Хотя сообщения могут заранее предполагать бесконечное число возможных значений μ(t) для бесконечного числа возможных состояний мира t , на самом деле они могут принимать только конечное число значений (m 1 , m 2 , . . . , m N ) .
Таким образом, равновесие можно охарактеризовать разбиением (t 0 (N), t 1 (N). . . t N (N)) множества типов [0, 1], где 0 = t 0 (N) < t 1 (N) < . . . < t N (N) = 1. Это разбиение показано в правом верхнем сегменте рисунка 1.
t i (N) — это границы интервалов, в которых сообщения постоянны: для t i-1 (N) < t < t i ( N), μ(t) = m i .
Поскольку действия являются функциями сообщений, действия также постоянны на этих интервалах: для t i-1 (N) < t < t i (N) , α(t) = α(mi ) = a i .
Функция действия теперь косвенно характеризуется тем фактом, что каждое значение a i оптимизирует возврат для R , зная, что t находится между t 1 и t 2 . Математически (предполагая, что t равномерно распределено по [0, 1]),
→ Квадратичные полезности:
Учитывая, что R знает, что t находится между t i-1 и t i , и в частном случае квадратичной полезности, где R хочет, чтобы действие a было как можно ближе к t , мы можем интуитивно показать, что оптимальным действием является середина интервала:
При t = t i отправителю должно быть безразлично, отправлять ли сообщение m i-1 или m i . 1 ≤ i≤ N-1
Это дает информацию о N и t i .
→ Практически: Рассмотрим разбиение размера N. Можно показать, что
N должно быть достаточно малым, чтобы числитель был положительным. Это определяет максимально допустимое значение , где — потолок , т.е. наименьшее положительное целое число, большее или равное . Пример: Предположим, что b = 1/20 . Тогда N * = 3 . Теперь опишем все равновесия для N=1 , 2 или 3 (см. рисунок 2).
N = 1: Это равновесие лепета. t 0 = 0, t 1 = 1 ; a 1 = 1/2 = 0,5 .
N = 2: t 0 = 0, t 1 = 2/5 = 0,4, t 2 = 1 ; a 1 = 1/5 = 0,2, a 2 = 7/10 = 0,7 .
N = N * = 3: t 0 = 0, t 1 = 2/15, t 2 = 7/15, t 3 = 1 ; a 1 = 1/15, a 2 = 3/10 = 0,3, a 3 = 11/15 .
При N = 1 мы получаем максимально грубое сообщение, которое не несет никакой информации. Поэтому на верхней левой панели все красное. При N = 3 сообщение становится тоньше . Однако оно остается довольно грубым по сравнению с полным раскрытием, которое было бы линией 45°, но которое не является равновесием Нэша.
При большем N и более тонком сообщении синяя область важнее. Это подразумевает большую полезность. Раскрытие большего количества информации выгодно обеим сторонам.