stringtranslate.com

Алгоритмическая теория игр

Алгоритмическая теория игр ( AGT ) — это область на стыке теории игр и компьютерных наук , целью которой является понимание и разработка алгоритмов в стратегических средах.

Обычно в задачах Алгоритмической теории игр входные данные для данного алгоритма распределяются между многими игроками, которые имеют личный интерес в выходных данных. В таких ситуациях агенты могут не сообщать о входных данных правдиво из-за своих личных интересов. Мы можем рассматривать Алгоритмическую теорию игр с двух точек зрения:

Помимо обычных требований при проектировании классических алгоритмов (например, полиномиальное время выполнения , хороший коэффициент аппроксимации), разработчик также должен заботиться об ограничениях стимулов.

История

Нисан-Ронен: новая структура для изучения алгоритмов

В 1999 году основополагающая работа Ноама Нисана и Амира Ронена [1] привлекла внимание сообщества теоретической информатики к разработке алгоритмов для эгоистичных (стратегических) пользователей. Как они утверждают в аннотации:

Мы рассматриваем алгоритмические проблемы в распределенной среде, где участники не могут предполагать, что будут следовать алгоритму, а скорее их собственным интересам. Поскольку такие участники, называемые агентами, способны манипулировать алгоритмом, разработчик алгоритма должен заранее убедиться, что интересы агентов наилучшим образом удовлетворяются путем правильного поведения. Следуя понятиям из области проектирования механизмов, мы предлагаем структуру для изучения таких алгоритмов. В этой модели алгоритмическое решение украшено выплатами участникам и называется механизмом. Выплаты должны быть тщательно подобраны, чтобы мотивировать всех участников действовать так, как желает разработчик алгоритма. Мы применяем стандартные инструменты проектирования механизмов к алгоритмическим проблемам и, в частности, к задаче о кратчайшем пути.

В этой статье впервые был введен термин « проектирование алгоритмических механизмов» , и комитет по присуждению премии Гёделя 2012 года признал ее одной из «трех статей, заложивших основу развития алгоритмической теории игр» [2] .

Цена анархии

Другие две статьи, цитируемые в премии Гёделя 2012 года за фундаментальный вклад в алгоритмическую теорию игр, ввели и развили концепцию «Цены анархии». В своей статье 1999 года «Равновесия в худшем случае» [3] Куцупиас и Пападимитриу предложили новую меру деградации эффективности системы из-за эгоистичного поведения ее агентов: соотношение между эффективностью системы в оптимальной конфигурации и ее эффективностью в наихудшем равновесии Нэша. (Термин «Цена анархии» появился только пару лет спустя. [4] )

Интернет как катализатор

Интернет создал новую экономику — как основу для обмена и коммерции, так и сам по себе. Вычислительная природа Интернета позволила использовать вычислительные инструменты в этой новой развивающейся экономике. С другой стороны, сам Интернет является результатом действий многих. Это было новым для классического подхода к вычислениям «сверху вниз», который существовал до того времени. Таким образом, теория игр — это естественный способ рассматривать Интернет и взаимодействия в нем, как человеческие, так и механические.

Теория игр изучает равновесия (например, равновесие Нэша ). Равновесие обычно определяется как состояние, в котором ни один игрок не имеет стимула менять свою стратегию. Равновесия встречаются в нескольких областях, связанных с Интернетом, например, в финансовых взаимодействиях и балансировке нагрузки связи [ требуется ссылка ] . Теория игр предоставляет инструменты для анализа равновесий, и общий подход заключается в том, чтобы «найти игру», то есть формализовать определенные интернет-взаимодействия как игру и вывести связанные с ними равновесия.

Перефразирование проблем в терминах игр позволяет анализировать интернет-взаимодействия и строить механизмы для удовлетворения определенных требований. Если можно показать, что равновесия существуют, необходимо ответить на следующий вопрос: можно ли найти равновесие, причем за разумное время? Это приводит к анализу алгоритмов поиска равновесий. Особое значение имеет класс сложности PPAD , который включает в себя множество задач в алгоритмической теории игр.

Области исследований

Разработка алгоритмического механизма

Проектирование механизмов — это подраздел экономики, который занимается оптимизацией в условиях ограничений стимулирования. Проектирование алгоритмических механизмов рассматривает оптимизацию экономических систем в условиях требований вычислительной эффективности. Типичные изучаемые цели включают максимизацию доходов и максимизацию общественного благосостояния.

Неэффективность равновесий

Понятия цены анархии и цены стабильности были введены для того, чтобы охватить потерю производительности системы из-за эгоистичного поведения ее участников. Цена анархии охватывает наихудшую производительность системы в равновесии относительно оптимальной возможной производительности. [5] Цена стабильности , с другой стороны, охватывает относительную производительность наилучшего равновесия системы. [6] Эти концепции являются аналогами понятия коэффициента аппроксимации в разработке алгоритмов.

Сложность нахождения равновесий

Существование равновесия в игре обычно устанавливается с помощью неконструктивных теорем о неподвижной точке . Эффективных алгоритмов для вычисления равновесий Нэша не известно . Задача является полной для класса сложности PPAD даже в играх с двумя игроками. [7] Напротив, коррелированные равновесия могут быть эффективно вычислены с помощью линейного программирования, [8] а также изучены с помощью беспроигрышных стратегий. [9]

Вычислительный социальный выбор

Вычислительный социальный выбор изучает вычислительные аспекты социального выбора , агрегацию предпочтений отдельных агентов. Примерами служат алгоритмы и вычислительная сложность правил голосования и формирования коалиций. [10]

Другие темы включают:

И площадь имеет разнообразное практическое применение: [11] [12]

Журналы и информационные бюллетени

Статьи по алгоритмической теории игр часто публикуются в журналах по теории игр, таких как GEB , [15] в экономических журналах, таких как Econometrica , и в журналах по компьютерным наукам, таких как SICOMP . [16]

Смотрите также

Ссылки

  1. ^ Нисан, Ноам ; Ронен, Амир (1999), «Проектирование алгоритмических механизмов», Труды 31-го симпозиума ACM по теории вычислений (STOC '99) , стр. 129–140, doi : 10.1145/301250.301287 , ISBN 978-1581130676, S2CID  8316937
  2. ^ "ACM SIGACT представляет премию Гёделя за исследования, которые пролили свет на эффекты эгоистичного использования Интернета" (пресс-релиз). Нью-Йорк. Ассоциация вычислительной техники. 2012-05-16. Архивировано из оригинала 2013-07-18 . Получено 2018-01-08 .
  3. ^ Кутсупия, Элиас; Пападимитриу, Христос (май 2009 г.). «Worst-case Equilibria». Computer Science Review . 3 (2): 65–69. doi :10.1016/j.cosrev.2009.04.003. Архивировано из оригинала 2016-03-13 . Получено 2018-01-08 .
  4. ^ Пападимитриу, Христос (2001), «Алгоритмы, игры и Интернет», Труды 33-го симпозиума ACM по теории вычислений (STOC '01) , стр. 749–753, CiteSeerX 10.1.1.70.8836 , doi :10.1145/380752.380883, ISBN  978-1581133493, S2CID  207594967
  5. ^ Тим Рафгарден (2005). Эгоистичная маршрутизация и цена анархии . MIT Press . ISBN 0-262-18243-2.
  6. ^ * Аншелевич, Эллиот; Дасгупта, Анирбан; Клейнберг, Джон; Тардос, Эва; Векслер, Том; Рафгарден, Тим (2008). «Цена стабильности для проектирования сетей со справедливым распределением затрат». SIAM J. Comput . 38 (4): 1602–1623. doi :10.1137/070680096. S2CID  2839399.
  7. ^ * Чэнь, Си; Дэн, Сяоте (2006). Урегулирование сложности равновесия Нэша для двух игроков . Труды 47-го симпозиума. Основы компьютерной науки. С. 261–271. doi :10.1109/FOCS.2006.69. ECCC  TR05-140..
  8. ^ Пападимитриу, Христос Х.; Рафгарден, Тим (2008). «Вычисление коррелированных равновесий в многопользовательских играх». J. ACM . 55 (3): 14:1–14:29. CiteSeerX 10.1.1.335.2634 . doi :10.1145/1379759.1379762. S2CID  53224027. 
  9. ^ Фостер, Дин П.; Вохра, Ракеш В. (1996). «Калиброванное обучение и коррелированное равновесие». Игры и экономическое поведение .
  10. ^ Феликс Брандт; Винсент Конитцер; Улле Эндрисс; Жером Ланг; Ариэль Д. Прокачча, ред. (2016), Справочник по вычислительному социальному выбору (PDF)
  11. ^ Тим Рафгарден (2016). Двадцать лекций по алгоритмической теории игр . Cambridge University Press . ISBN 9781316624791.
  12. ^ "EC'19 || 20-я конференция ACM по экономике и вычислениям".
  13. ^ TEAC
  14. ^ Биржи SIGEcom
  15. ^ Чавла, Шучи ; Флейшер, Лиза; Хартлайн, Джейсон; Тим Рафгарден (2015), «Введение в специальный выпуск – Алгоритмическая теория игр – STOC/FOCS/SODA 2011», Игры и экономическое поведение , 92 : 228–231, doi :10.1016/j.geb.2015.02.011
  16. ^ СИКОМП

Внешние ссылки