В дизайне механизмов механизм strategyproof (SP) — это форма игры , в которой у каждого игрока есть слабо- доминирующая стратегия , так что ни один игрок не может выиграть, «шпионя» за другими игроками, чтобы узнать, что они собираются играть. Когда у игроков есть частная информация (например, их тип или их значение для некоторого элемента), а пространство стратегий каждого игрока состоит из возможных значений информации (например, возможных типов или значений), правдивый механизм — это игра, в которой раскрытие истинной информации является слабо-доминирующей стратегией для каждого игрока. [1] : 244 Механизм SP также называется совместимым с доминирующей стратегией и стимулом (DSIC) , [1] : 415, чтобы отличить его от других видов совместимости стимулов .
Механизм SP невосприимчив к манипуляциям со стороны отдельных игроков (но не коалиций). Напротив, в механизме, защищенном от групповой стратегии , ни одна группа людей не может сговориться, чтобы неверно сообщить о своих предпочтениях таким образом, чтобы это принесло пользу каждому члену. В сильном механизме, защищенном от групповой стратегии, ни одна группа людей не может сговориться, чтобы неверно сообщить о своих предпочтениях таким образом, чтобы это принесло пользу хотя бы одному члену группы, не ухудшив положение остальных членов. [2]
Типичными примерами механизмов SP являются:
Типичными примерами механизмов, не являющихся SP, являются:
SP также применим в сетевой маршрутизации . [ требуется цитата ] Рассмотрим сеть как граф , где каждое ребро (т. е. ссылка) имеет связанную стоимость передачи , которая известна только владельцу ссылки. Владелец ссылки хочет получить компенсацию за ретрансляцию сообщений. Как отправитель сообщения в сети, он хочет найти путь с наименьшей стоимостью. Существуют эффективные методы для этого, даже в больших сетях. Однако есть одна проблема: стоимость каждой ссылки неизвестна. Наивный подход состоял бы в том, чтобы спросить владельца каждой ссылки о стоимости, использовать эти заявленные стоимости, чтобы найти путь с наименьшей стоимостью, и заплатить всем ссылкам на пути их заявленные стоимости. Однако можно показать, что эта схема оплаты не является SP, то есть владельцы некоторых ссылок могут получить выгоду, солгав о стоимости. Мы можем в конечном итоге заплатить гораздо больше, чем фактическая стоимость. Можно показать, что с учетом определенных предположений о сети и игроках (владельцах ссылок), вариантом механизма VCG является SP. [ требуется цитата ]
Существует ряд возможных результатов.
Существуют агенты, которые имеют разные оценки для каждого результата. Оценка агента представлена в виде функции:
который выражает ценность, которую он имеет для каждой альтернативы, в денежном выражении.
Предполагается, что агенты имеют квазилинейные функции полезности; это означает, что если результат равен и, кроме того, агент получает платеж (положительный или отрицательный), то общая полезность агента равна:
Вектор всех функций-стоимостей обозначается как .
Для каждого агента вектор всех функций стоимости других агентов обозначается как . Таким образом .
Механизм — это пара функций:
Механизм называется стратегически устойчивым , если для каждого игрока и для каждого вектора ценности других игроков :
Полезно иметь простые условия для проверки того, является ли данный механизм SP или нет. В этом подразделе показаны два простых условия, которые являются как необходимыми, так и достаточными.
Если механизм с денежными переводами является SP, то он должен удовлетворять следующим двум условиям для каждого агента : [1] : 226
1. Плата агенту является функцией выбранного результата и оценок других агентов , но не прямой функцией собственной оценки агента . Формально существует функция цены , которая принимает в качестве входных данных результат и вектор оценки для других агентов и возвращает платеж агенту , такой что для каждого , если:
затем:
ДОКАЗАТЕЛЬСТВО: Если то агент с оценкой предпочитает сообщить , так как это дает ему тот же результат и большую выплату; аналогично, если то агент с оценкой предпочитает сообщить .
Как следствие, существует функция «ценника», которая принимает в качестве входных данных результат и вектор оценки для других агентов и возвращает платеж для агента для каждого , если:
затем:
2. Выбранный результат является оптимальным для агента , учитывая оценки других агентов. Формально:
где максимизация осуществляется по всем результатам в диапазоне .
ДОКАЗАТЕЛЬСТВО: Если есть другой результат, такой что , то агент с оценкой предпочитает сообщить , так как это дает ему большую общую полезность.
Условия 1 и 2 не только необходимы, но и достаточны: любой механизм, удовлетворяющий условиям 1 и 2, является СП.
ДОКАЗАТЕЛЬСТВО: Зафиксируйте агента и оценки . Обозначим:
Согласно свойству 1, полезность агента при честной игре составляет:
и полезность агента при игре нечестно составляет:
По свойству 2:
поэтому доминирующей стратегией для агента является честные действия.
Фактическая цель механизма — его функция; функция оплаты — это всего лишь инструмент, побуждающий игроков быть честными. Следовательно, полезно знать, учитывая определенную функцию результата, можно ли ее реализовать с помощью механизма SP или нет (это свойство также называется реализуемостью ). [ необходима цитата ]
Свойство монотонности необходимо для стратегической устойчивости. [ необходима цитата ]
Однопараметрический домен — это игра, в которой каждый игрок получает определенное положительное значение за «выигрыш» и значение 0 за «проигрыш». Простым примером является аукцион с одним предметом, в котором — это значение, которое игрок назначает предмету.
Для этой настройки легко охарактеризовать правдивые механизмы. Начнем с некоторых определений.
Механизм называется нормализованным , если каждая проигрышная ставка приносит 0.
Механизм называется монотонным , если при повышении ставки игроком его шансы на победу (слабо) увеличиваются.
Для монотонного механизма для каждого игрока i и каждой комбинации ставок других игроков существует критическое значение , при котором игрок переходит от проигрыша к выигрышу.
Нормализованный механизм в однопараметрической области является истинным, если выполняются следующие два условия: [1] : 229–230
Существуют различные способы распространить понятие правдивости на рандомизированные механизмы. Они перечислены от самых сильных к самым слабым: [3] : 6–8
Универсальный подразумевает сильное SD, Lex подразумевает слабое SD, и все импликации строгие. [3] : Теория 3.4
Для каждой константы рандомизированный механизм называется правдивым с вероятностью, если для каждого агента и для каждого вектора ставок вероятность того, что агент получит выгоду от неправдивой ставки, не превышает , где вероятность берется поверх случайности механизма. [1] : 349
Если константа стремится к 0, когда число участников растет, то механизм называется правдивым с высокой вероятностью . Это понятие слабее, чем полная правдивость, но оно все еще полезно в некоторых случаях; см., например, оценку консенсуса .
Новый вид мошенничества, который стал распространенным в связи с обилием интернет-аукционов, — это ставки под вымышленным именем , когда ставки подаются одним участником с использованием нескольких идентификаторов, например, нескольких адресов электронной почты.
False-name-proofness означает, что нет стимула для любого из игроков делать ставки с ложным именем. Это более сильное понятие, чем strategyproofness. В частности, аукцион Vickrey–Clarke–Groves (VCG) не является false-name-proof. [4]
Защита от ложного имени существенно отличается от защиты от групповой стратегии, поскольку она предполагает, что отдельный человек может имитировать определенное поведение, которое обычно требует согласованной координации нескольких человек. [ необходима цитата ] [ требуется дополнительное объяснение ]