Комбинаторная теория игр

Комбинаторная теория игр — это раздел математики и теоретической информатики , который обычно изучает последовательные игры с полной информацией . Исследования в основном ограничивались играми двух игроков , в которых есть позиция , которую игроки по очереди меняют определенными способами или ходами для достижения определенного условия выигрыша. Комбинаторная теория игр традиционно не изучала азартные игры или те, которые используют несовершенную или неполную информацию, отдавая предпочтение играм, которые предлагают полную информацию, в которых состояние игры и набор доступных ходов всегда известны обоим игрокам. ^[1] Однако по мере развития математических методов типы игр, которые можно математически проанализировать, расширяются, поэтому границы области постоянно меняются. ^[2] Ученые обычно определяют, что они подразумевают под «игрой» в начале статьи, и эти определения часто различаются, поскольку они специфичны для анализируемой игры и не предназначены для представления всего объема области.

Комбинаторные игры включают в себя такие известные игры, как шахматы , шашки и го , которые считаются нетривиальными, и крестики-нолики , которые считаются тривиальными в том смысле, что их «легко решить». Некоторые комбинаторные игры также могут иметь неограниченную игровую область, например бесконечные шахматы . В теории комбинаторных игр ходы в этих и других играх представлены в виде игрового дерева .

Комбинаторные игры также включают в себя однопользовательские комбинаторные головоломки, такие как судоку , и автоматы без игроков, такие как игра Конвея «Жизнь » (хотя в самом строгом определении можно сказать, что «игры» требуют более одного участника, отсюда и обозначения «головоломка» и «автоматы». ^[3] )

Теория игр в целом включает азартные игры, игры с несовершенным знанием и игры, в которых игроки могут ходить одновременно, и они, как правило, представляют собой реальные ситуации принятия решений.

Комбинаторная теория игр имеет иной акцент, чем «традиционная» или «экономическая» теория игр, которая изначально была разработана для изучения игр с простой комбинаторной структурой, но с элементами случайности (хотя она также рассматривает последовательные ходы, см. игру в развернутой форме ). По сути, комбинаторная теория игр внесла новые методы для анализа игровых деревьев, например, с использованием сюрреалистических чисел , которые являются подклассом всех игр с полной информацией для двух игроков. ^[3] Тип игр, изучаемых комбинаторной теорией игр, также представляет интерес для искусственного интеллекта , особенно для автоматизированного планирования и составления расписаний . В комбинаторной теории игр меньше внимания уделяется уточнению практических алгоритмов поиска (таких как эвристика альфа-бета-отсечения, включенная в большинство учебников по искусственному интеллекту), но больше внимания уделяется описательным теоретическим результатам (таким как меры сложности игры или доказательства существования оптимального решения без обязательного указания алгоритма, такие как аргумент о краже стратегии ).

Важным понятием в комбинаторной теории игр является понятие решенной игры . Например, крестики-нолики считаются решенной игрой, так как можно доказать, что любая игра приведет к ничьей, если оба игрока играют оптимально. Вывести аналогичные результаты для игр с богатыми комбинаторными структурами сложно. Например, в 2007 году было объявлено, что шашки были слабо решены — оптимальная игра обеих сторон также приводит к ничьей — но этот результат был доказательством с помощью компьютера . ^[4] Другие игры реального мира в основном слишком сложны, чтобы позволить полный анализ сегодня, хотя теория имела некоторые недавние успехи в анализе эндшпилей Го. Применение комбинаторной теории игр к позиции пытается определить оптимальную последовательность ходов для обоих игроков до конца игры, и тем самым обнаружить оптимальный ход в любой позиции. На практике этот процесс мучительно сложен, если только игра не очень проста.

Может быть полезно различать комбинаторные «математические игры», представляющие интерес в первую очередь для математиков и ученых для размышлений и решения, и комбинаторные «игры», представляющие интерес для широких слоев населения как форма развлечения и соревнования. ^[5] Однако ряд игр попадают в обе категории. Например, Nim — это игра, которая легла в основу комбинаторной теории игр, и одна из первых компьютерных игр. ^[6] Крестики-нолики до сих пор используются для обучения студентов -компьютерщиков основным принципам проектирования игрового ИИ . ^[7]

История

Теория комбинаторных игр возникла в связи с теорией беспристрастных игр , в которой любая игра, доступная одному игроку, должна быть доступна и другому. Одной из таких игр является Ним , которая может быть решена полностью. Ним — беспристрастная игра для двух игроков, и подчиняется условию нормальной игры , что означает, что игрок, который не может сделать ход, проигрывает. В 1930-х годах теорема Спрага–Гранди показала, что все беспристрастные игры эквивалентны кучам в Ниме, тем самым показав, что в играх, рассматриваемых на комбинаторном уровне, в которых важны подробные стратегии, а не только выигрыши, возможны крупные объединения.

В 1960-х годах Элвин Р. Берлекамп , Джон Х. Конвей и Ричард К. Гай совместно представили теорию партизанской игры , в которой требование, чтобы игра, доступная одному игроку, была доступна обоим, смягчено. Их результаты были опубликованы в их книге Winning Ways for your Mathematical Plays в 1982 году. Однако первой работой, опубликованной на эту тему, была книга Конвея 1976 года On Numbers and Games , также известная как ONAG, в которой была введена концепция сюрреалистических чисел и обобщение на игры. On Numbers and Games также была плодом сотрудничества Берлекампа, Конвея и Гая.

Комбинаторные игры обычно, по соглашению, приводятся в форму, в которой один игрок выигрывает, когда у другого не остается ходов. Легко преобразовать любую конечную игру только с двумя возможными результатами в эквивалентную, где применяется это соглашение. Одной из важнейших концепций в теории комбинаторных игр является концепция суммы двух игр, которая представляет собой игру, в которой каждый игрок может выбрать ход либо в одной игре, либо в другой в любой момент игры, и игрок выигрывает, когда у его противника не остается ходов ни в одной из игр. Такой способ объединения игр приводит к богатой и мощной математической структуре.

В своей книге «О числах и играх» Конвей утверждал , что источником вдохновения для теории партийных игр послужили его наблюдения за игрой в окончаниях го , которые часто можно разложить на суммы более простых окончаний, изолированных друг от друга в разных частях доски.

Примеры

Вводный текст « Пути победы» знакомит нас с большим количеством игр, но в качестве мотивирующих примеров для вводной теории использовались следующие:

Blue–Red Hackenbush - На конечном уровне эта партийная комбинаторная игра позволяет строить игры, значения которых являются двоичными рациональными числами . На бесконечном уровне она позволяет строить все действительные значения, а также множество бесконечных, которые попадают в класс сюрреалистических чисел .
Синий–красный–зеленый Хакенбуш — позволяет использовать дополнительные игровые значения, которые не являются числами в традиционном смысле, например, звезда .
Жабы и лягушки - Позволяет использовать различные игровые значения. В отличие от большинства других игр, позиция легко представлена короткой строкой символов.
Доминирование - Различные интересные игры, такие как горячие игры , появляются как позиции в Доминировании, потому что иногда есть стимул двигаться, а иногда нет. Это позволяет обсуждать температуру игры .
Ним - беспристрастная игра . Это позволяет строить нимберы . (Его также можно рассматривать как частный случай сине-красно-зеленого хакенбуша, предназначенный только для зеленых.)

Классическая игра Го оказала влияние на раннюю комбинаторную теорию игр, и Берлекамп и Вольф впоследствии разработали теорию эндшпиля и температуры для нее (см. ссылки). Вооружившись этим, они смогли построить правдоподобные позиции эндшпиля Го, из которых они могли дать опытным игрокам Го выбор сторон, а затем победить их в любом случае.

Другая игра, изучаемая в контексте комбинаторной теории игр, — это шахматы . В 1953 году Алан Тьюринг писал об игре: «Если можно совершенно недвусмысленно объяснить на английском языке, при необходимости с помощью математических символов, как следует выполнять вычисления, то всегда можно запрограммировать любой цифровой компьютер для выполнения этих вычислений, при условии достаточной емкости памяти». ^[8] В статье 1950 года Клод Шеннон оценил нижнюю границу сложности дерева игры в шахматы как 10 ¹²⁰ , и сегодня это называется числом Шеннона . ^[9] Шахматы остаются нерешенными, хотя обширные исследования, включая работу с использованием суперкомпьютеров, создали шахматные таблицы окончаний , которые показывают результат идеальной игры для всех окончаний с семью фигурами или меньше. Бесконечные шахматы имеют даже большую комбинаторную сложность, чем шахматы (если только не изучаются только ограниченные окончания или составные позиции с небольшим количеством фигур).

Обзор

Игра, в простейшем смысле, представляет собой список возможных «ходов», которые могут сделать два игрока, называемые левым и правым . Позиция игры, полученная в результате любого хода, может считаться другой игрой. Эта идея рассмотрения игр с точки зрения их возможных ходов в другие игры приводит к рекурсивному математическому определению игр, которое является стандартным в комбинаторной теории игр. В этом определении каждая игра имеет обозначение {L|R} . L — это множество игровых позиций, в которые может переместиться левый игрок, а R — это множество игровых позиций, в которые может переместиться правый игрок; каждая позиция в L и R определяется как игра с использованием той же нотации.

Используя в качестве примера Доминирование , обозначьте каждую из шестнадцати ячеек доски четыре на четыре буквой A1 для самого верхнего левого квадрата, C2 для третьей ячейки слева во втором ряду сверху и т. д. Мы используем, например, (D3, D4) для обозначения игровой позиции, в которой вертикальное домино было помещено в нижний правый угол. Затем начальную позицию можно описать в нотации комбинаторной теории игр как

\{(\mathrm {A} 1,\mathrm {A} 2),(\mathrm {B} 1,\mathrm {B} 2),\dots |(\mathrm {A} 1,\mathrm {B} 1),(\mathrm {A} 2,\mathrm {B} 2),\dots \}.

В стандартной игре Cross-Cram игроки поочередно ходят, но это чередование неявно регулируется определениями комбинаторной теории игр, а не кодируется в игровых состояниях.

\{(\mathrm {A} 1,\mathrm {A} 2)|(\mathrm {A} 1,\mathrm {B} 1)\}=\{\{|\}|\{|\}\}.

Вышеуказанная игра описывает сценарий, в котором у любого игрока остается только один ход, и если любой из игроков делает этот ход, этот игрок выигрывает. (Нерелевантный открытый квадрат C3 был опущен на схеме.) {|} в списке ходов каждого игрока (соответствующий единственному оставшемуся квадрату после хода) называется нулевой игрой и фактически может быть сокращенно обозначен как 0. В нулевой игре ни у одного из игроков нет допустимых ходов; таким образом, игрок, чья очередь наступает, когда наступает нулевая игра, автоматически проигрывает.

Тип игры на диаграмме выше также имеет простое название; он называется звездная игра , что также может быть сокращено ∗. В звездной игре единственный допустимый ход приводит к нулевой игре, что означает, что тот, чья очередь доходит до звездной игры, автоматически выигрывает.

Дополнительный тип игры, не встречающийся в Domineering, — это петлевая игра, в которой допустимый ход влево или вправо — это игра, которая затем может вернуться к первой игре. Checkers , например, становится петлевой, когда одна из фигур продвигается, так как тогда она может бесконечно циклически перемещаться между двумя или более полями. Игра, в которой нет таких ходов, называется loopfree .

Существуют также трансфинитные игры, в которых имеется бесконечно много позиций, то есть слева и справа имеются списки ходов, которые являются бесконечными, а не конечными.

Сокращения игр

Числа

Числа представляют количество свободных ходов или преимущество хода конкретного игрока. По соглашению положительные числа представляют преимущество для Left, а отрицательные числа представляют преимущество для Right. Они определяются рекурсивно, причем 0 является базовым случаем.

0 = {|}

1 = {0|}, 2 = {1|}, 3 = {2|}

−1 = {|0}, −2 = {|−1}, −3 = {|−2}

Нулевая игра — проигрыш для первого игрока.

Сумма числовых игр ведет себя как целые числа, например, 3 + −2 = 1.

Любое игровое число относится к классу сюрреалистических чисел .

Звезда

Звезда , записанная как ∗ или {0|0}, означает победу первого игрока, поскольку любой из игроков должен (если он первый ходит в игре) сделать ход в нулевую игру и, следовательно, выиграть.

∗ + ∗ = 0, потому что первый игрок должен превратить одну копию ∗ в 0, а затем другой игрок должен будет превратить другую копию ∗ также в 0; в этот момент первый игрок проиграет, поскольку 0 + 0 не допускает никаких ходов.

Игра ∗ не является ни положительной, ни отрицательной; она и все другие игры, в которых выигрывает первый игрок (независимо от того , на какой стороне он находится), называются нечеткими или смешанными с 0; символически мы записываем ∗ || 0.

Вверх

Up , обозначаемый как ↑, — это позиция в комбинаторной теории игр. ^[10] В стандартной нотации ↑ = {0|∗}.

−↑ = ↓ ( вниз )

Up строго положительно (↑ > 0), но бесконечно мало . Up определено в разделе « Выигрышные способы для ваших математических игр» .

Вниз

Down , обозначаемая как ↓, — это позиция в комбинаторной теории игр. ^[10] В стандартной нотации ↓ = {∗|0}.

−↓ = ↑ ( вверх )

Down строго отрицателен (↓ < 0), но бесконечно мал . Down определен в разделе « Выигрышные способы для ваших математических игр» .

«Горячие» игры

Рассмотрим игру {1|−1}. Оба хода в этой игре являются преимуществом для игрока, который их делает; поэтому игра называется «горячей»; она больше любого числа, меньшего −1, меньше любого числа, большего 1, и нечеткой с любым числом между ними. Она записывается как ±1. Ее можно прибавлять к числам или умножать на положительные числа ожидаемым образом; например, 4 ± 1 = {5|3}.

Нимберс

Беспристрастная игра — это игра, в которой на каждой позиции игры оба игрока могут делать одни и те же ходы. Например, Ним беспристрастен, так как любой набор объектов, который может убрать один игрок, может убрать и другой. Однако доминирование не беспристрастно, так как один игрок размещает горизонтальные домино, а другой — вертикальные. Аналогично, Шашки не беспристрастны, так как игроки владеют разноцветными фишками. Для любого порядкового числа можно определить беспристрастную игру, обобщающую Ним, в которой на каждом ходу любой игрок может заменить число любым меньшим порядковым числом; игры, определенные таким образом, известны как нимберы . Теорема Спрага–Гранди утверждает, что каждая беспристрастная игра при нормальных правилах игры эквивалентна нимберу.

«Наименьшие» числа — самые простые и наименее соответствующие обычному порядку ординалов — это 0 и ∗.

Смотрите также

Альфа-бета-обрезка , оптимизированный алгоритм поиска в игровом дереве
Обратная индукция , рассуждение в обратном направлении от конечной ситуации.
Охлаждение и нагревание (комбинаторная теория игр) , различные преобразования игр, делающие их более податливыми к теории
Игра на установление связей — тип игры, в которой игроки пытаются установить связи.
Endgame tablebase , база данных, в которой говорится, как играть в эндшпиле
Дерево Expectiminimax , адаптация дерева игры minimax к играм с элементом случайности
Игра в развернутой форме , игровое дерево, обогащенное выигрышами и информацией, доступной игрокам.
Классификация игр , статья, в которой обсуждаются способы классификации игр.
Сложность игры , статья, описывающая способы измерения сложности игр.
Игра Гранди , математическая игра, в которой кучи предметов делятся
Многоагентная система , тип компьютерной системы для решения сложных задач.
Позиционная игра — тип игры, в которой игроки занимают ранее не занятые позиции.
Решение шахмат
Серебряные монеты — математическая игра, в которой нужно выбирать положительные целые числа, которые не являются суммой неотрицательных кратных ранее выбранных целых чисел.
Игра Витхоффа , математическая игра, в которой нужно брать предметы из одной или двух кучек.
Топологическая игра — тип математической игры, разыгрываемой в топологическом пространстве.
Цугцванг , обязанность играть, когда это невыгодно

Примечания

^ Уроки в игре, стр. 3
^ Анализ покера Томасом С. Фергюссоном является примером расширения комбинаторной теории игр на игры, включающие элементы случайности. Исследование игры в ним из трех игроков является примером расширения исследований за пределы игр с двумя игроками. Анализ партийных игр Конвея, Гая и Берлекампа является, пожалуй, самым известным расширением сферы применения комбинаторной теории игр, выходящим за рамки изучения беспристрастных игр.
^ ab Demaine, Erik D. ; Hearn, Robert A. (2009). «Игры с алгоритмами: алгоритмическая комбинаторная теория игр». В Albert, Michael H.; Nowakowski, Richard J. (ред.). Игры без шансов 3 . Издательства научно-исследовательского института математических наук. Том 56. Cambridge University Press. С. 3–56. arXiv : cs.CC/0106019 .
^ Шеффер, Дж.; Берч, Н.; Бьёрнссон, Ю.; Кишимото, А.; Мюллер, М.; Лейк, Р.; Лу, П.; Сатфен, С. (2007). «Проблема шашек решена». Science . 317 (5844): 1518–1522. Bibcode :2007Sci...317.1518S. CiteSeerX 10.1.1.95.5393 . doi :10.1126/science.1144079. PMID 17641166. S2CID 10274228.
^ Френкель, Авиезри (2009). «Комбинаторные игры: избранная библиография с кратким введением для гурманов». Игры без шансов 3. 56 : 492.
↑ Грант, Юджин Ф.; Ларднер, Рекс (2 августа 1952 г.). «The Talk of the Town - It». The New Yorker .
^ Рассел, Стюарт ; Норвиг, Питер (2021). «Глава 5: Состязательный поиск и игры». Искусственный интеллект: современный подход . Серия Пирсона по искусственному интеллекту (4-е изд.). Pearson Education, Inc. стр. 146–179. ISBN 978-0-13-461099-3.
^ Алан Тьюринг. «Цифровые компьютеры, применяемые в играх». Университет Саутгемптона и Королевский колледж Кембриджа. С. 2.
^ Клод Шеннон (1950). «Программирование компьютера для игры в шахматы» (PDF) . Philosophical Magazine . 41 (314): 4. Архивировано из оригинала (PDF) 2010-07-06.
^ ab E. Berlekamp; JH Conway; R. Guy (1982). Выигрышные пути для ваших математических игр . Том I. Academic Press. ISBN 0-12-091101-9.
E. Berlekamp; JH Conway; R. Guy (1982). Выигрышные пути для ваших математических игр . Том II. Academic Press. ISBN 0-12-091102-7.

Ссылки

Альберт, Майкл Х.; Новаковски, Ричард Дж.; Вулф, Дэвид (2007). Уроки в игре: Введение в комбинаторную теорию игр . AK Peters Ltd. ISBN 978-1-56881-277-9.
Бек, Йожеф (2008). Комбинаторные игры: теория крестиков-ноликов . Cambridge University Press. ISBN 978-0-521-46100-9.
Берлекамп, Э .; Конвей, Дж. Х .; Гай, Р. (1982). Выигрышные пути для ваших математических игр : игры в целом . Academic Press. ISBN 0-12-091101-9.2-е изд., AK Peters Ltd (2001–2004), ISBN 1-56881-130-6 , ISBN 1-56881-142-X
Берлекамп, Э.; Конвей, Дж. Х.; Гай, Р. (1982). Выигрышные пути для ваших математических игр: игры в частности . Academic Press. ISBN 0-12-091102-7.2-е изд., AK Peters Ltd (2001–2004), ISBN 1-56881-143-8 , ISBN 1-56881-144-6 .
Берлекэмп, Элвин ; Вулф, Дэвид (1997). Математическое го: Охлаждение получает последнюю точку . AK Peters Ltd. ISBN 1-56881-032-6.
Беверсдорф, Йорг (2021). Удача, логика и невинная ложь: математика игр (2-е изд.). AK Peters/CRC Press. doi : 10.1201/9781003092872. ISBN 978-1-003-09287-2.См. особенно разделы 21–26.
Конвей, Джон Хортон (1976). О числах и играх . Academic Press. ISBN 0-12-186350-6.2-е изд., AK Peters Ltd (2001), ISBN 1-56881-127-6 .
Роберт А. Хирн ; Эрик Д. Демейн (2009). Игры, головоломки и вычисления . AK Peters, Ltd. ISBN 978-1-56881-322-6.

Внешние ссылки

Список ссылок по комбинаторной теории игр на домашней странице Дэвида Эппштейна
Введение в игры и числа Конвея Дирка Шлейхера и Михаэля Штолля
Краткое изложение терминов теории комбинационных игр Билла Спайта
Семинар по комбинаторной теории игр, Международная исследовательская станция Банф, июнь 2005 г.