stringtranslate.com

Принцип ограниченного выбора

Принцип ограниченного выбора — это руководство, используемое в карточных играх, таких как контрактный бридж, для интуитивного понимания скрытой информации. Его можно сформулировать так: «Игра карты, которая могла быть выбрана как выбор равных ходов, увеличивает вероятность того, что игрок начал с картой, в которой его выбор был ограничен». [1] Что особенно важно, он помогает играть «в ситуациях, которые раньше считались догадками».

Например, Юг ходит с низкой пикой, Запад играет с низкой, Север играет дамой, Восток выигрывает с королем. Туз и король являются эквивалентными картами; игра Востока королем уменьшает вероятность того, что у Востока есть туз, и увеличивает вероятность того, что у Запада есть туз. Принцип помогает другим игрокам вывести местоположение ненаблюдаемых эквивалентных карт, таких как этот пиковый туз, после наблюдения за королем. Увеличение или уменьшение вероятности является примером байесовского обновления по мере накопления доказательств, а конкретные приложения ограниченного выбора аналогичны задаче Монти Холла .

Во многих из этих ситуаций правило, выведенное из принципа, заключается в том, чтобы играть за разделенные почести . После наблюдения за одной равнозначной картой, то есть, следует продолжать игру так, как если бы две равнозначные карты были разделены между игроками-соперниками, так, чтобы не было выбора, какую из них играть. Тот, кто сыграл первым, не имеет другой.

Когда количество эквивалентных карт больше двух, принцип усложняется, поскольку их эквивалентность может не быть явной. Когда у одного партнера , скажем, Q и 10, а у другого J, обычно верно, что эти три карты эквивалентны, но тот, у кого две из них, не знает об этом. Ограниченный выбор всегда вводится в терминах двух соприкасающихся карт — последовательных рангов в одной масти, таких как QJ или KQ — где эквивалентность очевидна.

Если нет причин предпочесть определенную карту (например, чтобы подать сигнал партнеру), игрок, имеющий две или более эквивалентных карт, должен иногда рандомизировать свой порядок игры (см. примечание о равновесии Нэша). Расчеты вероятности в покрытии ограниченного выбора часто принимают равномерную рандомизацию как должное, но это проблематично.

Принцип ограниченного выбора применим даже к выбору противником начального хода из эквивалентных мастей. См. Kelsey & Glauert (1980).

Пример

Рассмотрим комбинацию мастей, представленную слева. На Юге (закрытая рука) четыре пиковые карты 8754 и на Севере (фиктивная, видимая всем игрокам) пять ♠ AJ1096. Запад и Восток держат оставшиеся четыре пиковые карты KQ32 в своих двух закрытых руках.

Перед игрой возможны 16 различных западных и восточных пиковых владений или "ложей" с точки зрения Юга. Они перечислены в Таблице 1, упорядоченной сначала по "разделению" от равного до неравного количества карт, затем по владению Запада от самого сильного до самого слабого.

Юг ходит с малой пикой, Запад играет 2 (или 3), фиктивный Север играет J, а Восток выигрывает с K. Позже, выиграв взятку с побочной мастью, Юг ходит с еще одной малой пикой, а Запад следует за младшей с 3 (или 2). На данный момент, когда Север и Восток еще не сделали ход, местоположение только ♠ Q не установлено. Юг находится в точке принятия решения и знает, что из первоначальных 16 лож остаются возможными только две (выделены жирным шрифтом в Таблице 1), поскольку Запад сыграл обе низкие карты, а Восток — короля. На первый взгляд может показаться, что шансы теперь равны, 1:1, так что Юг должен ожидать одинакового успеха с любым из двух возможных продолжений. Однако принцип ограниченного выбора говорит нам, что, хотя оба ложа карт возможны, вероятности составляют 2:1 в пользу предположения, что у Запада Q32, и, следовательно, сыграть десятку.

Если бы у Востока были KQ, он мог бы с тем же успехом сыграть ферзя вместо короля. Таким образом, некоторые сделки с изначальной ложью 32 и KQ не достигли бы этой стадии; некоторые вместо этого достигли бы параллельной стадии с отсутствующим K, поскольку Юг наблюдал 32 и Q. Напротив, каждая сделка с изначальной ложью Q32 и K достигла бы этой стадии, поскольку Восток сыграл короля поневоле (без выбора или по «ограниченному выбору»).

Если Восток выиграет первую взятку с королем или королевой равномерно наугад из KQ, то эта первоначальная ложь 32 и KQ достигнет этой стадии в половине случаев и выберет другую развилку на дороге в половине случаев. Таким образом, в фактической последовательности игры шансы не равны, а составляют половину к одному, или 1:2. Восток сохранит королеву из первоначальной KQ примерно в одной трети случаев и не сохранит пик из первоначальной K примерно в двух третях случаев. Принцип ограниченного выбора утверждает, что хитрость, сыграв 10, почти в два раза вероятнее приведет к успеху.

Важно, что это предполагает, что у защитников нет системы сигнализации, так что игра запада (скажем) 3, за которой следует 2, не сигнализирует о даблтоне. В ходе многих эквивалентных сделок Восток с KQ должен теоретически выиграть первую взятку с королем или королевой равномерно наугад; то есть, по половине каждого без какой-либо закономерности. [2]

Дальнейшая точность

Априори , четыре выпавшие карты "разделяются", как показано в первых двух столбцах Таблицы 2 ниже. Например, три карты вместе, а четвертая одна, "разделение 3-1" с вероятностью 49,74%. Чтобы понять "количество конкретных лжей", обратитесь к предыдущему списку всех лжей в Таблице 1.

В последнем столбце дана априорная вероятность любого исходного набора карт, например, 32 и KQ; этот набор представлен первой строкой, охватывающей сплит 2–2. Другая ложь, представленная в нашем примере игры пиковой масти, Q32 и K, представлена ​​второй строкой, охватывающей сплит 3–1.

Таким образом, таблица показывает, что априорные шансы на эти два конкретных варианта лжи не были равными, а были немного в пользу первого, около 6,78 к 6,22 для KQ против K.

Каковы шансы апостериори , в момент истины в нашем примере игры пиковой масти? Если Восток с KQ выигрывает первую взятку равномерно наугад с королем или дамой — и с K выигрывает первую взятку с королем, не имея выбора — апостериорные шансы составляют 3,39 к 6,22, немного больше, чем 1:2, в процентном отношении немного больше, чем 35% для KQ. Игра туза A с Севера во втором раунде должна выиграть около 35%, в то время как повторная фишка с десяткой 10 выигрывает около 65%.

Принцип ограниченного выбора является общим, но этот конкретный расчет вероятности предполагает, что Восток выиграет с королем из KQ ровно в половине случаев (что лучше всего). Если Восток выиграет с королем из KQ больше или меньше, чем в половине случаев, то Юг выиграет больше или меньше, чем в 35%, играя тузом. Действительно, если Восток выиграет с королем в 92% случаев (=6,22/6,78), то Юг выиграет 50%, играя тузом, и 50%, повторяя изящество. Однако, если это правда, то Юг выиграет почти на 100%, повторяя изящество после того, как Восток выиграет с ферзем – поскольку ферзь от этого восточного игрока почти отрицает короля.

Математическая теория

Принцип ограниченного выбора — это применение теоремы Байеса об условной вероятности. В следующем: Kp представляет условие, что король разыгрывается Востоком в первой взятке; KQ представляет условие, что Восток держит KQ и; K представляет условие, что Восток держит K.

Эти два условия следующие:

Мы предполагаем, что когда у Востока KQ, он играет в 50% случаев, а когда у него только K, он должен играть K. Это представлено следующим образом:

Кроме того, основываясь на трюке 1, только два из первоначальных 16 (т.е. априорных ) возможных вариантов, показанных в Таблице 1 выше, остаются доступными для Востока, каждый из которых в равной степени возможен.

Решая, находим ( апостериори ), что...

В заключение можно сказать, что «после того, как Ист сыграл K в первом раунде, вероятность того, что Ист начал с синглтона K, в два раза выше, чем вероятность того, что он начал с KQ».

Первые два уравнения — теорема Байеса , остальное — простая алгебра.

Увеличение и уменьшение вероятности изначальной лжи карт противника по мере продолжения розыгрыша руки является примером байесовского обновления по мере накопления доказательств.

Смотрите также

Примечания

  1. ^ Фрей, Ричард Л.; Траскотт, Алан Ф. , ред. (1964). Официальная энциклопедия бриджа (1-е изд.). Нью-Йорк: Crown Publishers. стр. 457. LCCN  64023817.Все последующие издания Энциклопедии (вплоть до 7-го в 2011 году) сохраняют это определение. Оригинальная статья была написана Джеффом Рубенсом , на что указывают его инициалы в конце статьи в 1-м издании; вся статья остается той же во всех семи изданиях Энциклопедии.
  2. ^ Это должно в смысле равновесия Нэша . Теория Нэша подразумевает, что противники способны наблюдать любые закономерности и извлекать из них выгоду. Этот урок хорошо известен среди экспертов по бриджу, и его применение к таким играм, как эта, принято. Относительно примера туз-король в ведущем абзаце Рубенс (1964, 457) предполагает, что «Восток будет играть свои равные почести с равной частотой... Можно продемонстрировать, что это, по сути, лучшая стратегия Востока». См. также смешанную стратегию в комбинациях мастей

Дальнейшее чтение

Внешние ссылки