В теории игр , эпсилон-равновесие , или равновесие, близкое к Нэшу, представляет собой профиль стратегии , который приблизительно удовлетворяет условию равновесия Нэша . В равновесии Нэша ни один игрок не имеет стимула менять свое поведение. В приблизительном равновесии Нэша это требование ослабляется, чтобы допустить возможность того, что у игрока может быть небольшой стимул сделать что-то другое. Это все еще может считаться адекватной концепцией решения, предполагая, например, смещение статус-кво . Эта концепция решения может быть предпочтительнее равновесия Нэша из-за того, что ее легче вычислить, или, альтернативно, из-за возможности того, что в играх более чем с 2 игроками вероятности, вовлеченные в точное равновесие Нэша, не обязательно должны быть рациональными числами . [1]
Существует более одного альтернативного определения.
При заданной игре и действительном неотрицательном параметре профиль стратегии называется -равновесием, если ни один игрок не может получить выигрыш больше ожидаемого, односторонне отклонившись от своей стратегии . [2] : 45 Каждое равновесие Нэша эквивалентно -равновесию, где .
Формально, пусть будет -игрой с наборами действий для каждого игрока и функцией полезности . Пусть обозначает выигрыш игрока при игре в профиль стратегии . Пусть будет пространством распределений вероятностей по . Вектор стратегий является -равновесием Нэша для , если
Следующее определение [3] налагает более строгое требование, что игрок может назначать положительную вероятность только чистой стратегии , если выигрыш имеет ожидаемый выигрыш не более, чем выигрыш наилучшего ответа. Пусть будет вероятностью того, что профиль стратегии будет сыгран. Для игрока пусть будут профили стратегий игроков, отличных от ; для и чистой стратегии пусть будет профиль стратегии, где играет и другие игроки играют . Пусть будет выигрыш в , когда используется профиль стратегии . Требование можно выразить формулой
Существование полиномиальной по времени аппроксимационной схемы (PTAS) для равновесий ε-Нэша эквивалентно вопросу о том, существует ли схема для ε-хорошо поддерживаемых приближенных равновесий Нэша, [4] но существование PTAS остается открытой проблемой. Для постоянных значений ε известны полиномиальные по времени алгоритмы для приближенных равновесий для более низких значений ε, чем для хорошо поддерживаемых приближенных равновесий. Для игр с выигрышами в диапазоне [0,1] и ε=0,3393, ε-равновесия Нэша могут быть вычислены за полиномиальное время. [5] Для игр с выигрышами в диапазоне [0,1] и ε=2/3, ε-хорошо поддерживаемые равновесия могут быть вычислены за полиномиальное время. [6]
Понятие ε-равновесий важно в теории стохастических игр потенциально бесконечной продолжительности. Существуют простые примеры стохастических игр без равновесия Нэша , но с ε-равновесием для любого ε, строго большего 0.
Возможно, самым простым примером такого рода является следующий вариант Matching Pennies , предложенный Эвереттом. Игрок 1 прячет пенни, а Игрок 2 должен угадать, лежит ли он орлом вверх или решкой вверх. Если Игрок 2 угадает правильно, он выигрывает пенни у Игрока 1, и игра заканчивается. Если Игрок 2 неправильно угадает, что пенни лежит орлом вверх, игра заканчивается с нулевым выигрышем для обоих игроков. Если он неправильно угадает, что лежит решкой вверх, игра повторяется . Если игра продолжается вечно, выигрыш для обоих игроков равен нулю.
При заданном параметре ε > 0 любой профиль стратегии , где Игрок 2 угадывает орла с вероятностью ε и решки с вероятностью 1 − ε (на каждом этапе игры и независимо от предыдущих этапов), является ε -равновесием для игры. Ожидаемый выигрыш Игрока 2 в таком профиле стратегии составляет по крайней мере 1 − ε . Однако легко видеть, что не существует стратегии для Игрока 2, которая может гарантировать ожидаемый выигрыш ровно 1. Следовательно, в игре нет равновесия Нэша .
Другим простым примером является конечно повторяющаяся дилемма заключенного для T периодов, где выигрыш усредняется по T периодам. Единственное равновесие Нэша этой игры — выбрать Defect в каждом периоде. Теперь рассмотрим две стратегии tie-for-tat и grim trigger . Хотя ни tie-for-tat, ни grim trigger не являются равновесиями Нэша для игры, обе они являются -равновесиями для некоторого положительного . Допустимые значения зависят от выигрышей составляющей игры и от количества T периодов.
В экономике понятие чистой стратегии эпсилон-равновесия используется, когда подход смешанной стратегии рассматривается как нереалистичный. В чистой стратегии эпсилон-равновесия каждый игрок выбирает чистую стратегию, которая находится в пределах эпсилона его лучшей чистой стратегии. Например, в модели Бертрана-Эджворта , где не существует равновесия чистой стратегии, может существовать равновесие чистой стратегии эпсилон.