В теории игр цена стабильности (PoS) игры — это отношение между наилучшим значением целевой функции одного из ее равновесий и значением оптимального результата. PoS имеет значение для игр, в которых есть некий объективный авторитет, который может немного влиять на игроков и, возможно, помогать им прийти к хорошему равновесию Нэша . При измерении того, насколько эффективно равновесие Нэша в конкретной игре, мы часто также говорим о цене анархии (PoA), которая является отношением между наихудшим значением целевой функции одного из ее равновесий и значением оптимального результата.
Примеры
Другой способ выражения PoS:
В частности, если оптимальным решением является равновесие Нэша, то PoS равен 1.
В следующей игре «дилемма заключенного» , поскольку существует единственное равновесие, мы имеем PoS = PoA = 1/2.
В этом примере, который является версией игры «Битва полов» , есть две точки равновесия и со значениями 3 и 15 соответственно. Оптимальное значение равно 15. Таким образом, PoS = 1, а PoA = 1/5.
Предыстория и основные этапы
Цена стабильности была впервые изучена А. Шульцем и Н. Штир-Мозесом, в то время как этот термин был придуман Э. Аншелевичем и др. Шульц и Штир-Мозес сосредоточились на равновесиях в игре эгоистичной маршрутизации, в которой ребра имеют пропускную способность. Аншелевич и др. изучали игры проектирования сетей и показали, что чистое стратегическое равновесие Нэша всегда существует, а цена стабильности этой игры не превышает n-го гармонического числа в ориентированных графах. Для неориентированных графов Аншелевич и др. представили жесткую границу цены стабильности 4/3 для случая с одним источником и двумя игроками. Цзянь Ли доказал, что для неориентированных графов с выделенным пунктом назначения, к которому должны подключиться все игроки, цена стабильности игры проектирования сетей Shapely равна , где — количество игроков. С другой стороны, цена анархии составляет около в этой игре.
Сетевые игры проектирования
Настраивать
Игры сетевого дизайна имеют очень естественную мотивацию для Цены стабильности. В этих играх Цена анархии может быть намного хуже, чем Цена стабильности.
Рассмотрим следующую игру.
игроки;
Каждый игрок стремится подключиться к ориентированному графу ;
Стратегии для игрока — это все пути из в ;
Каждое ребро имеет стоимость ;
«Справедливое распределение затрат»: когда игроки выбирают преимущество , затраты делятся между ними поровну;
Стоимость игрока составляет
Социальная стоимость представляет собой сумму затрат игрока: .
Цена анархии
Цена анархии может быть . Рассмотрим следующую игру по проектированию сети.
Рассмотрим два различных равновесия в этой игре. Если все разделяют преимущество , то общественные издержки составляют . Это равновесие действительно оптимально. Обратите внимание, однако, что все, кто разделяет преимущество, также являются равновесием Нэша. Каждый агент имеет издержки в равновесии, и переключение на другое преимущество увеличивает его издержки до .
Нижняя граница цены стабильности
Вот патологическая игра в том же духе для Цены стабильности, вместо этого. Рассмотрим игроков, каждый из которых исходит из и пытается подключиться к . Стоимость немаркированных ребер принимается равной 0.
Оптимальная стратегия для всех — разделить преимущество, что даст общую социальную стоимость . Однако для этой игры существует уникальный Нэш. Обратите внимание, что при оптимуме каждый игрок платит , и игрок 1 может уменьшить свою стоимость, переключившись на преимущество. Как только это произойдет, в интересах игрока 2 будет переключиться на преимущество и так далее. В конце концов, агенты достигнут равновесия Нэша, оплачивая свое собственное преимущество. Это распределение имеет социальную стоимость , где — th гармоническое число , которое равно . Несмотря на то, что оно не ограничено, цена стабильности экспоненциально лучше цены анархии в этой игре.
Верхняя граница цены стабильности
Обратите внимание, что по замыслу игры проектирования сетей являются играми перегрузки. Поэтому они допускают потенциальную функцию .
Теорема. [Теорема 19.13 из Ссылки 1] Предположим, что существуют константы и
такие, что для каждой стратегии ,
Тогда цена стабильности меньше, чем
Доказательство. Глобальный минимум является равновесием Нэша, поэтому
Теперь вспомним, что социальные издержки определялись как сумма издержек по ребрам, поэтому
Мы тривиально имеем , и приведенное выше вычисление дает , поэтому мы можем применить теорему для верхней границы цены устойчивости.
AS Schulz, NE Stier-Moses. О производительности пользовательских равновесий в транспортных сетях . Труды 14-го ежегодного симпозиума ACM-SIAM по дискретным алгоритмам (SODA), 2003.
E. Anshelevich, E. Dasgupta, J. Kleinberg, E. Tardos, T. Wexler, T. Roughgarden. Цена стабильности для проектирования сетей со справедливым распределением затрат . SIAM Journal on Computing, 38:4, 1602-1623, 2008. Версия конференции появилась в FOCS 2004.