Алгоритмическая теория игр

Алгоритмическая теория игр ( AGT ) — это область на стыке теории игр и компьютерных наук , целью которой является понимание и разработка алгоритмов в стратегических средах.

Обычно в задачах Алгоритмической теории игр входные данные для данного алгоритма распределяются между многими игроками, которые имеют личный интерес в выходных данных. В таких ситуациях агенты могут не сообщать о входных данных правдиво из-за своих личных интересов. Мы можем рассматривать Алгоритмическую теорию игр с двух точек зрения:

Анализ : учитывая реализованные в настоящее время алгоритмы, проанализируйте их с помощью инструментов теории игр (например, вычислите и докажите свойства их равновесий Нэша , цены анархии и динамики наилучшего ответа).
Проектирование : проектирование игр, которые имеют как хорошие игровые теоретические, так и алгоритмические свойства. Эта область называется проектированием алгоритмических механизмов .

Помимо обычных требований при проектировании классических алгоритмов (например, полиномиальное время выполнения , хороший коэффициент аппроксимации), разработчик также должен заботиться об ограничениях стимулов.

История

Нисан-Ронен: новая структура для изучения алгоритмов

В 1999 году основополагающая работа Ноама Нисана и Амира Ронена ^[1] привлекла внимание сообщества теоретической информатики к разработке алгоритмов для эгоистичных (стратегических) пользователей. Как они утверждают в аннотации:

Мы рассматриваем алгоритмические проблемы в распределенной среде, где участники не могут предполагать, что будут следовать алгоритму, а скорее их собственным интересам. Поскольку такие участники, называемые агентами, способны манипулировать алгоритмом, разработчик алгоритма должен заранее убедиться, что интересы агентов наилучшим образом удовлетворяются путем правильного поведения. Следуя понятиям из области проектирования механизмов, мы предлагаем структуру для изучения таких алгоритмов. В этой модели алгоритмическое решение украшено выплатами участникам и называется механизмом. Выплаты должны быть тщательно подобраны, чтобы мотивировать всех участников действовать так, как желает разработчик алгоритма. Мы применяем стандартные инструменты проектирования механизмов к алгоритмическим проблемам и, в частности, к задаче о кратчайшем пути.

В этой статье впервые был введен термин « проектирование алгоритмических механизмов» , и комитет по присуждению премии Гёделя 2012 года признал ее одной из «трех статей, заложивших основу развития алгоритмической теории игр» ^{[2] .}

Цена анархии

Другие две статьи, цитируемые в премии Гёделя 2012 года за фундаментальный вклад в алгоритмическую теорию игр, ввели и развили концепцию «Цены анархии». В своей статье 1999 года «Равновесия в худшем случае» ^[3] Куцупиас и Пападимитриу предложили новую меру деградации эффективности системы из-за эгоистичного поведения ее агентов: соотношение между эффективностью системы в оптимальной конфигурации и ее эффективностью в наихудшем равновесии Нэша. (Термин «Цена анархии» появился только пару лет спустя. ^[4] )

Интернет как катализатор

Интернет создал новую экономику — как основу для обмена и коммерции, так и сам по себе. Вычислительная природа Интернета позволила использовать вычислительные инструменты в этой новой развивающейся экономике. С другой стороны, сам Интернет является результатом действий многих. Это было новым для классического подхода к вычислениям «сверху вниз», который существовал до того времени. Таким образом, теория игр — это естественный способ рассматривать Интернет и взаимодействия в нем, как человеческие, так и механические.

Теория игр изучает равновесия (например, равновесие Нэша ). Равновесие обычно определяется как состояние, в котором ни один игрок не имеет стимула менять свою стратегию. Равновесия встречаются в нескольких областях, связанных с Интернетом, например, в финансовых взаимодействиях и балансировке нагрузки связи ^{[ требуется ссылка ]} . Теория игр предоставляет инструменты для анализа равновесий, и общий подход заключается в том, чтобы «найти игру», то есть формализовать определенные интернет-взаимодействия как игру и вывести связанные с ними равновесия.

Перефразирование проблем в терминах игр позволяет анализировать интернет-взаимодействия и строить механизмы для удовлетворения определенных требований. Если можно показать, что равновесия существуют, необходимо ответить на следующий вопрос: можно ли найти равновесие, причем за разумное время? Это приводит к анализу алгоритмов поиска равновесий. Особое значение имеет класс сложности PPAD , который включает в себя множество задач в алгоритмической теории игр.

Области исследований

Разработка алгоритмического механизма

Проектирование механизмов — это подраздел экономики, который занимается оптимизацией в условиях ограничений стимулирования. Проектирование алгоритмических механизмов рассматривает оптимизацию экономических систем в условиях требований вычислительной эффективности. Типичные изучаемые цели включают максимизацию доходов и максимизацию общественного благосостояния.

Неэффективность равновесий

Понятия цены анархии и цены стабильности были введены для того, чтобы охватить потерю производительности системы из-за эгоистичного поведения ее участников. Цена анархии охватывает наихудшую производительность системы в равновесии относительно оптимальной возможной производительности. ^[5] Цена стабильности , с другой стороны, охватывает относительную производительность наилучшего равновесия системы. ^[6] Эти концепции являются аналогами понятия коэффициента аппроксимации в разработке алгоритмов.

Сложность нахождения равновесий

Существование равновесия в игре обычно устанавливается с помощью неконструктивных теорем о неподвижной точке . Эффективных алгоритмов для вычисления равновесий Нэша не известно . Задача является полной для класса сложности PPAD даже в играх с двумя игроками. ^[7] Напротив, коррелированные равновесия могут быть эффективно вычислены с помощью линейного программирования, ^[8] а также изучены с помощью беспроигрышных стратегий. ^[9]

Вычислительный социальный выбор

Вычислительный социальный выбор изучает вычислительные аспекты социального выбора , агрегацию предпочтений отдельных агентов. Примерами служат алгоритмы и вычислительная сложность правил голосования и формирования коалиций. ^[10]

Другие темы включают:

Алгоритмы для вычисления рыночного равновесия
Справедливое разделение
Многоагентные системы

И площадь имеет разнообразное практическое применение: ^[11]^[12]

Спонсируемые поисковые аукционы
Спектральные аукционы
Криптовалюты
Рынки прогнозов
Системы репутации
Совместная экономика
Сопоставление рынков, таких как обмен почками и выбор школы
Краудсорсинг и коллегиальная оценка
Экономика облака

Журналы и информационные бюллетени

Труды ACM по экономике и вычислениям (TEAC) ^[13]
Биржи SIGEcom ^[14]

Статьи по алгоритмической теории игр часто публикуются в журналах по теории игр, таких как GEB , ^[15] в экономических журналах, таких как Econometrica , и в журналах по компьютерным наукам, таких как SICOMP . ^[16]

Смотрите также

Ссылки

^ Нисан, Ноам ; Ронен, Амир (1999), «Проектирование алгоритмических механизмов», Труды 31-го симпозиума ACM по теории вычислений (STOC '99) , стр. 129–140, doi : 10.1145/301250.301287 , ISBN 978-1581130676, S2CID 8316937
^ "ACM SIGACT представляет премию Гёделя за исследования, которые пролили свет на эффекты эгоистичного использования Интернета" (пресс-релиз). Нью-Йорк. Ассоциация вычислительной техники. 2012-05-16. Архивировано из оригинала 2013-07-18 . Получено 2018-01-08 .
^ Кутсупия, Элиас; Пападимитриу, Христос (май 2009 г.). «Worst-case Equilibria». Computer Science Review . 3 (2): 65–69. doi :10.1016/j.cosrev.2009.04.003. Архивировано из оригинала 2016-03-13 . Получено 2018-01-08 .
^ Пападимитриу, Христос (2001), «Алгоритмы, игры и Интернет», Труды 33-го симпозиума ACM по теории вычислений (STOC '01) , стр. 749–753, CiteSeerX 10.1.1.70.8836 , doi :10.1145/380752.380883, ISBN 978-1581133493, S2CID 207594967
^ Тим Рафгарден (2005). Эгоистичная маршрутизация и цена анархии . MIT Press . ISBN 0-262-18243-2.
^ * Аншелевич, Эллиот; Дасгупта, Анирбан; Клейнберг, Джон; Тардос, Эва; Векслер, Том; Рафгарден, Тим (2008). «Цена стабильности для проектирования сетей со справедливым распределением затрат». SIAM J. Comput . 38 (4): 1602–1623. doi :10.1137/070680096. S2CID 2839399.
^ * Чэнь, Си; Дэн, Сяоте (2006). Урегулирование сложности равновесия Нэша для двух игроков . Труды 47-го симпозиума. Основы компьютерной науки. С. 261–271. doi :10.1109/FOCS.2006.69. ECCC TR05-140..
^ Пападимитриу, Христос Х.; Рафгарден, Тим (2008). «Вычисление коррелированных равновесий в многопользовательских играх». J. ACM . 55 (3): 14:1–14:29. CiteSeerX 10.1.1.335.2634 . doi :10.1145/1379759.1379762. S2CID 53224027.
^ Фостер, Дин П.; Вохра, Ракеш В. (1996). «Калиброванное обучение и коррелированное равновесие». Игры и экономическое поведение .
^ Феликс Брандт; Винсент Конитцер; Улле Эндрисс; Жером Ланг; Ариэль Д. Прокачча, ред. (2016), Справочник по вычислительному социальному выбору (PDF)
^ Тим Рафгарден (2016). Двадцать лекций по алгоритмической теории игр . Cambridge University Press . ISBN 9781316624791.
^ "EC'19 || 20-я конференция ACM по экономике и вычислениям".
^ TEAC
^ Биржи SIGEcom
^ Чавла, Шучи ; Флейшер, Лиза; Хартлайн, Джейсон; Тим Рафгарден (2015), «Введение в специальный выпуск – Алгоритмическая теория игр – STOC/FOCS/SODA 2011», Игры и экономическое поведение , 92 : 228–231, doi :10.1016/j.geb.2015.02.011
^ СИКОМП

Джон фон Нейман , Оскар Моргенштерн (1944) Теория игр и экономическое поведение . Princeton Univ. Press. Издание 2007 г.: ISBN 978-0-691-13061-3
Вазирани, Виджай В .; Нисан, Ноам ; Рафгарден, Тим ; Тардос, Ева (2007), Алгоритмическая теория игр (PDF) , Кембридж, Великобритания: Издательство Кембриджского университета, ISBN 978-0-521-87282-9.

Внешние ссылки

gambit.sourceforge.net — библиотека программного обеспечения и инструментов теории игр для построения и анализа конечных экстенсивных и стратегических игр.
gamut.stanford.edu — набор игровых генераторов, предназначенных для тестирования алгоритмов теории игр.