Обобщение игр, используемых в теории игр
Непрерывная игра — это математическое понятие, используемое в теории игр , которое обобщает идею обычной игры, такой как крестики-нолики (крестики-нолики) или шашки (шашки). Другими словами, оно расширяет понятие дискретной игры, в которой игроки выбирают из конечного набора чистых стратегий. Концепции непрерывной игры позволяют играм включать более общие наборы чистых стратегий, которые могут быть несчетно бесконечными .
В общем случае игра с несчетно бесконечными наборами стратегий не обязательно будет иметь решение равновесия Нэша . Однако, если наборы стратегий должны быть компактными , а функции полезности непрерывными , то равновесие Нэша будет гарантировано; это является обобщением Гликсберга теоремы Какутани о неподвижной точке . По этой причине класс непрерывных игр обычно определяется и изучается как подмножество большего класса бесконечных игр (т. е. игр с бесконечными наборами стратегий), в которых наборы стратегий компактны, а функции полезности непрерывны.
Формальное определение
Определите непрерывную игру с n игроками , где
- это набор игроков,
- где каждый из них представляет собой компактное множество в метрическом пространстве , соответствующее набору чистых стратегий игрока ,
- где функция полезности игрока
- Мы определяем как множество мер вероятности Бореля на , что дает нам смешанное пространство стратегий игрока i .
- Определите профиль стратегии , где
Пусть будет профилем стратегии всех игроков, за исключением игрока . Как и в дискретных играх, мы можем определить соответствие наилучшего ответа для игрока , . — это отношение из набора всех распределений вероятностей по профилям игроков-оппонентов к набору стратегий игрока , такое, что каждый элемент
является лучшим ответом на . Определить
- .
Профиль стратегии является равновесием Нэша тогда и только тогда, когда
Существование равновесия Нэша для любой непрерывной игры с непрерывными функциями полезности можно доказать с помощью обобщения Ирвинга Гликсберга теоремы Какутани о неподвижной точке . [1] В общем случае решения может не быть, если мы допускаем пространства стратегий, которые не являются компактными, или если мы допускаем прерывные функции полезности.
Разделимые игры
Разделимая игра — это непрерывная игра, в которой для любого i функция полезности может быть выражена в виде суммы произведений:
- , где , , , и функции непрерывны.
Полиномиальная игра — это разделимая игра, в которой каждый представляет собой компактный интервал на , а каждая функция полезности может быть записана как многомерный полином.
В общем случае смешанные равновесия Нэша разделимых игр вычислить проще, чем неразделимых игр, как следует из следующей теоремы:
- Для любой разделимой игры существует по крайней мере одно равновесие Нэша, в котором игрок i смешивает не более чистых стратегий. [2]
В то время как равновесная стратегия для неразделимой игры может потребовать несчетно бесконечной поддержки , разделимая игра гарантированно имеет по крайней мере одно равновесие Нэша со смешанными стратегиями с конечной поддержкой.
Примеры
Разделимые игры
Полиномиальная игра
Рассмотрим игру с нулевой суммой для двух игроков между игроками X и Y , где . Обозначим элементы и как и соответственно. Определим функции полезности , где
- .
Соотношения наилучшего ответа в чистой стратегии следующие:
и не пересекаются, поэтому нет равновесия Нэша в чистой стратегии. Однако должно быть равновесие в смешанной стратегии. Чтобы найти его, выразите ожидаемое значение как линейную комбинацию первого и второго моментов распределений вероятностей X и Y :
(где и аналогично для Y ).
Ограничения на и (с аналогичными ограничениями для y ,) задаются Хаусдорфом как:
Каждая пара ограничений определяет компактное выпуклое подмножество на плоскости. Поскольку является линейным, любые экстремумы относительно первых двух моментов игрока будут лежать на границе этого подмножества. Равновесная стратегия игрока i будет лежать на
Обратите внимание, что первое уравнение допускает только смеси 0 и 1, тогда как второе уравнение допускает только чистые стратегии. Более того, если наилучший ответ в определенной точке игроку i лежит на , он будет лежать на всей линии, так что и 0, и 1 являются наилучшим ответом. просто дает чистую стратегию , поэтому никогда не даст и 0, и 1. Однако дает и 0, и 1, когда y = 1/2. Равновесие Нэша существует, когда:
Это определяет одно уникальное равновесие, где Игрок X играет случайную смесь 0 в течение 1/2 времени и 1 в течение оставшейся 1/2 времени. Игрок Y играет чистую стратегию 1/2. Ценность игры составляет 1/4.
Неразделимые игры
Рациональная функция выигрыша
Рассмотрим игру с нулевой суммой для двух игроков между игроками X и Y , где . Обозначим элементы и как и соответственно. Определим функции полезности , где
Эта игра не имеет чистого стратегического равновесия Нэша. Можно показать [3] , что существует уникальное смешанное стратегическое равновесие Нэша со следующей парой кумулятивных функций распределения :
Или, что эквивалентно, следующая пара функций плотности вероятности :
Стоимость игры составляет .
Требование распределения Кантора
Рассмотрим игру с нулевой суммой для двух игроков между игроками X и Y , где . Обозначим элементы и как и соответственно. Определим функции полезности , где
- .
Эта игра имеет уникальное равновесие смешанной стратегии, где каждый игрок играет смешанную стратегию с сингулярной функцией Кантора в качестве кумулятивной функции распределения . [4]
Дальнейшее чтение
- HW Kuhn и AW Tucker, ред. (1950). Вклад в теорию игр: т. II. Annals of Mathematics Studies 28 . Princeton University Press. ISBN 0-691-07935-8 .
Смотрите также
Ссылки
- ^ IL Glicksberg. Дальнейшее обобщение теоремы Какутани о неподвижной точке с применением к точкам равновесия Нэша. Труды Американского математического общества, 3(1):170–174, февраль 1952 г.
- ^ Н. Стайн, А. Оздаглар и П. А. Паррило. «Разделимые и низкоранговые непрерывные игры». Международный журнал теории игр , 37(4):475–504, декабрь 2008 г. https://arxiv.org/abs/0707.3462
- ^ Ирвинг Леонард Гликсберг и Оливер Альфред Гросс (1950). «Заметки об играх над квадратом». Кун, Х. У. и Такер, А. В. ред. Вклад в теорию игр: том II. Анналы математических исследований 28 , стр. 173–183. Издательство Принстонского университета.
- ^ Гросс, О. (1952). «Рациональная характеристика выигрыша распределения Кантора». Технический отчет D-1349, Корпорация RAND.