stringtranslate.com

Цена стабильности

В теории игр цена стабильности (PoS) игры — это отношение между наилучшим значением целевой функции одного из ее равновесий и значением оптимального результата. PoS имеет значение для игр, в которых есть некий объективный авторитет, который может немного влиять на игроков и, возможно, помогать им прийти к хорошему равновесию Нэша . При измерении того, насколько эффективно равновесие Нэша в конкретной игре, мы часто также говорим о цене анархии (PoA), которая является отношением между наихудшим значением целевой функции одного из ее равновесий и значением оптимального результата.

Примеры

Другой способ выражения PoS:

В частности, если оптимальным решением является равновесие Нэша, то PoS равен 1.

В следующей игре «дилемма заключенного» , поскольку существует единственное равновесие, мы имеем PoS = PoA = 1/2.

В этом примере, который является версией игры «Битва полов» , есть две точки равновесия и со значениями 3 и 15 соответственно. Оптимальное значение равно 15. Таким образом, PoS = 1, а PoA = 1/5.

Предыстория и основные этапы

Цена стабильности была впервые изучена А. Шульцем и Н. Штир-Мозесом, в то время как этот термин был придуман Э. Аншелевичем и др. Шульц и Штир-Мозес сосредоточились на равновесиях в игре эгоистичной маршрутизации, в которой ребра имеют пропускную способность. Аншелевич и др. изучали игры проектирования сетей и показали, что чистое стратегическое равновесие Нэша всегда существует, а цена стабильности этой игры не превышает n-го гармонического числа в ориентированных графах. Для неориентированных графов Аншелевич и др. представили жесткую границу цены стабильности 4/3 для случая с одним источником и двумя игроками. Цзянь Ли доказал, что для неориентированных графов с выделенным пунктом назначения, к которому должны подключиться все игроки, цена стабильности игры проектирования сетей Shapely равна , где — количество игроков. С другой стороны, цена анархии составляет около в этой игре.

Сетевые игры проектирования

Настраивать

Игры сетевого дизайна имеют очень естественную мотивацию для Цены стабильности. В этих играх Цена анархии может быть намного хуже, чем Цена стабильности.

Рассмотрим следующую игру.

Сетевая игра с ценой анархии

Цена анархии

Цена анархии может быть . Рассмотрим следующую игру по проектированию сети.

Игра «Патологическая цена стабильности»

Рассмотрим два различных равновесия в этой игре. Если все разделяют преимущество , то общественные издержки составляют . Это равновесие действительно оптимально. Обратите внимание, однако, что все, кто разделяет преимущество, также являются равновесием Нэша. Каждый агент имеет издержки в равновесии, и переключение на другое преимущество увеличивает его издержки до .

Нижняя граница цены стабильности

Вот патологическая игра в том же духе для Цены стабильности, вместо этого. Рассмотрим игроков, каждый из которых исходит из и пытается подключиться к . Стоимость немаркированных ребер принимается равной 0.

Оптимальная стратегия для всех — разделить преимущество, что даст общую социальную стоимость . Однако для этой игры существует уникальный Нэш. Обратите внимание, что при оптимуме каждый игрок платит , и игрок 1 может уменьшить свою стоимость, переключившись на преимущество. Как только это произойдет, в интересах игрока 2 будет переключиться на преимущество и так далее. В конце концов, агенты достигнут равновесия Нэша, оплачивая свое собственное преимущество. Это распределение имеет социальную стоимость , где — th гармоническое число , которое равно . Несмотря на то, что оно не ограничено, цена стабильности экспоненциально лучше цены анархии в этой игре.

Верхняя граница цены стабильности

Обратите внимание, что по замыслу игры проектирования сетей являются играми перегрузки. Поэтому они допускают потенциальную функцию .

Теорема. [Теорема 19.13 из Ссылки 1] Предположим, что существуют константы и такие, что для каждой стратегии ,

Тогда цена стабильности меньше, чем

Доказательство. Глобальный минимум является равновесием Нэша, поэтому

Теперь вспомним, что социальные издержки определялись как сумма издержек по ребрам, поэтому

Мы тривиально имеем , и приведенное выше вычисление дает , поэтому мы можем применить теорему для верхней границы цены устойчивости.

Смотрите также

Ссылки

  1. AS Schulz, NE Stier-Moses. О производительности пользовательских равновесий в транспортных сетях . Труды 14-го ежегодного симпозиума ACM-SIAM по дискретным алгоритмам (SODA), 2003.
  2. E. Anshelevich, E. Dasgupta, J. Kleinberg, E. Tardos, T. Wexler, T. Roughgarden. Цена стабильности для проектирования сетей со справедливым распределением затрат . SIAM Journal on Computing, 38:4, 1602-1623, 2008. Версия конференции появилась в FOCS 2004.
  3. Вазирани, Виджай В .; Нисан, Ноам ; Рафгарден, Тим ; Тардос, Ева (2007). Алгоритмическая теория игр (PDF) . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 0-521-87282-0.
  4. Л. Агуссурья и Х. К. Лау. Цена стабильности в играх с эгоистичным планированием . Веб-аналитика и агентские системы: Международный журнал, 9:4, 2009.
  5. Цзянь Ли. Верхняя граница цены стабильности для ненаправленных сетевых игр Shapely. Information Processing Letters 109 (15), 876-878, 2009.