Игрок в компьютерный покер

Компьютерный игрок в покер — это компьютерная программа, предназначенная для игры в покер (обычно в версию Техасского Холдема ) против людей или других компьютерных противников. Обычно ее называют покерботом или просто ботом . По состоянию на 2019 год компьютеры могут победить любого человека в покере. ^[1]^[2]^[3]

В Интернете

Эти боты или компьютерные программы часто используются в ситуациях онлайн-покера как законные противники для игроков-людей или как форма мошенничества . По состоянию на 2020 год любое использование Real-Time Assistance (RTA) или автоматизированных ботов считается мошенничеством на всех сайтах онлайн-покера, хотя уровень принуждения со стороны операторов сайтов значительно различается. ^{[ необходима цитата ]}

Боты игроков

Использование ботов игроков или компьютерной помощи во время игры в онлайн-покер запрещено большинством, если не всеми, онлайн-сайтами. Меры, принимаемые за нарушения, включают постоянный бан и конфискацию выигрышей. ^{[ требуется ссылка ]} Один из видов ботов может взаимодействовать с покерным клиентом (другими словами, играть самостоятельно как автоматический игрок) без помощи своего оператора-человека. Помощь в реальном времени (RTA) — это еще один метод использования компьютерных программ. RTA — это когда игрок-человек использует программу, называемую «решателем», например PioSOLVER или PokerSnowie, ^[4] работающую на другом компьютере, ^[5] для принятия своих решений.

Проблема несправедливого преимущества двояка. Во-первых, боты могут играть много часов подряд без человеческих слабостей, таких как усталость , и могут выдерживать естественные отклонения игры, не подвергаясь влиянию человеческих эмоций (или « тильта »). Во-вторых, с 2019 года компьютерная программа Pluribus (бот для покера) достаточно успешно читает блефы, рассчитывает шансы и подстраивается под стратегию, что позволяет ей постоянно побеждать профессиональных игроков в покер в безлимитном холдеме на 6 игроков. ^[6]^[7]^[8]

Дом исполнения

Хотя положения и условия покерных сайтов обычно запрещают использование ботов, уровень соблюдения зависит от оператора сайта. Некоторые будут искать и банить пользователей ботов с помощью различных программных инструментов. Покерный клиент может быть запрограммирован на попытку обнаружения ботов, хотя это само по себе спорно, поскольку может рассматриваться как равносильное внедрению шпионского ПО в клиентское программное обеспечение. ^{[ необходима цитата ]} Другой метод заключается в использовании CAPTCHA в случайных интервалах во время игры для поимки автоматизированных ботов, хотя это неэффективно против Real-Time Assistance.

Домашние боты

«Домашние боты» могут представлять собой конфликт интересов. Согласно самому строгому определению, домашний бот — это автоматизированный игрок, которым управляет сама онлайн-покерная комната. Такого рода боты были бы эквивалентны подставным лицам из реальной жизни .

Ни подставные лица из реальных казино, ни боты онлайн-казино не должны иметь доступа к информации, которая не доступна ни одному другому игроку в игре. Проблема в том, что в онлайн-обстановке казино не может доказать, что его боты не получают конфиденциальную информацию с сервера карт. Это еще больше усугубляется легкостью, с которой тайный обмен информацией может осуществляться в цифровой среде. По сути, даже казино не может доказать, что они не контролируют некоторых игроков.

Искусственный интеллект

Как и в шахматах , го (игра) и многих других играх, системы искусственного интеллекта побеждают даже лучших людей в покере. ^[9]^[10] Покер — это игра с несовершенной информацией ( потому что некоторые карты в игре скрыты), что затрудняет для кого-либо (включая компьютер) вывод окончательного результата руки. Из-за этого недостатка информации программистам компьютеров приходилось реализовывать системы, основанные на теореме Байеса , равновесии Нэша , моделировании Монте-Карло или нейронных сетях , все из которых являются несовершенными методами. Однако Pluribus усовершенствовал покер, заглядывая вперед только на несколько ходов, чтобы определить, какое действие предпринять, вместо того, чтобы пытаться оценить все ходы до конца игры.

Старые ИИ, такие как PokerSnowie и Claudico, были созданы путем предоставления компьютеру возможности определять наилучшую возможную стратегию, позволяя ему играть с самим собой огромное количество раз. В течение многих лет это был подход к покерному ИИ, в отличие от попыток создать компьютер, который играет как человек. Это привело к странным размерам ставок и совершенно иной стратегии, чем та, которую люди привыкли видеть.

Методы были впервые разработаны для приближения идеальной стратегии покера с точки зрения теории игр в игре один на один (два игрока), а затем для многопользовательской игры. Идеальная стратегия имеет несколько значений в этом контексте. С точки зрения оптимальной теории игр, идеальная стратегия — это та, которая не может ожидать проигрыша стратегии любого другого игрока; однако оптимальная стратегия может меняться в присутствии неоптимальных игроков, у которых есть слабости, которые можно использовать. В этом случае идеальная стратегия — это та, которая правильно или близко моделирует эти слабости и использует их для получения прибыли, например, те, которые описаны выше.

ИИ прорвался к сверхчеловеческим показателям в покере в 2010-х годах, со следующей временной шкалой. В 2015 году компьютеры решили хедз-ап лимитный холдем с помощью Cepheus . Около 2018 года Libratus продемонстрировал сверхчеловеческие способности в хедз-ап безлимитный холдем. В 2019 году Pluribus (новая версия Libratus) ^[11] продемонстрировал сверхчеловеческие способности в безлимитном холдеме на шесть игроков, самой популярной разновидности покера в мире. ^[12] В 2021 году Microsoft выпустила старую программу для игры в покер Libratus на коммерческой основе, которая затем победила четырех профессиональных игроков в покер в 20-дневном покерном соревновании в казино Rivers. ^[13]

Исследовательские группы

Лаборатория Нео Покера

Neo Poker Lab была устоявшейся научной группой, сосредоточенной на исследовании искусственного интеллекта в покере. В течение нескольких лет она разрабатывала и применяла самые современные алгоритмы и процедуры, такие как минимизация сожалений и аппроксимация равновесия градиентного поиска, деревья решений, методы рекурсивного поиска, а также экспертные алгоритмы для решения различных проблем, связанных с игрой в покер. Сайт Neo Poker Lab, https://www.neopokerlab.com, больше не работает.

Группа игрового ИИ Оклендского университета

До 2017 года команда из Оклендского университета состояла из небольшого числа ученых, которые использовали рассуждения на основе прецедентов для создания и улучшения агентов покера Техасский Холдем. Группа применяла различные методы ИИ к ряду игр, включая участие в коммерческих проектах Small Worlds и Civilization (видеоигра) .

Исследовательская группа компьютерного покера (Университет Альберты, Канада)

До 2019 года большая часть исследований компьютерных игроков в покер проводилась в Университете Альберты группой компьютерных исследований покера под руководством доктора Майкла Боулинга. Группа разработала агентов Poki , PsOpti , Hyperborean и Polaris . Poki был лицензирован для развлекательной игры STACKED с участием канадского игрока в покер Даниэля Негреану . PsOpti был доступен под названием «SparBot» в программе обучения покеру «Poker Academy». Серия программ Hyperborean соревновалась в ежегодном соревновании по компьютерному покеру, совсем недавно взяв три золотые медали из шести событий в соревновании 2012 года. Та же линия исследований также создала Polaris , которая играла против профессионалов-людей в 2007 и 2008 годах и стала первой компьютерной программой покера, выигравшей значимое соревнование по покеру.

В январе 2015 года в статье в журнале Science^[14] Майкла Боулинга, Нила Берча, Майкла Йохансона и Оскари Таммелина утверждалось, что их покерный бот Cepheus «по сути слабо решил» игру в лимитный техасский холдем один на один. ^[15]^[16]^[17]

Факультет компьютерных наук Университета Карнеги-Меллона

T. Sandholm и A. Gilpin из Университета Карнеги-Меллона начали исследования ИИ для покера в 2004 году, начав с непобедимого агента для игры в 3 карты под названием Rhode-Island Hold 'em. Следующим шагом стал GS1, который превзошел лучших коммерчески доступных покерных ботов. В 2006 году покерные агенты из этой группы начали участвовать в ежегодных компьютерных соревнованиях. «В какой-то момент у нас будет программа, которая будет лучше лучших игроков-людей», — заявил Sandholm, чей бот, Claudico , сразился с четырьмя противниками-людьми в 2015 году.

В 2017 году программное обеспечение программы Libratus столкнулось с четырьмя профессиональными игроками в покер. К концу эксперимента четыре игрока-человека проиграли Libratus в общей сложности $1,8 млн. симулированных денег. ^[18]

В 2019 году Libratus был заменен финальной версией под названием Pluribus (покерный бот) .

Исторические состязания

ICCM 2004 Соревнование PokerBot

Одно из самых первых соревнований по безлимитному покеру среди ботов было организовано в 2004 году Международной конференцией по когнитивному моделированию. ^[19] В турнире приняли участие пять ботов из разных университетов со всего мира. Победителем стал Эйс Грубер из Университета Торонто . ^[20]

Соревнования ACM

Ассоциация вычислительной техники (ACM) раньше проводила соревнования, где участники представляли часть программного обеспечения, способного играть в покер на их конкретной платформе. Организаторы мероприятия проводили соревнования, управляя программным обеспечением и сообщая результаты. ^{[ необходима цитата ]}

Мировая серия покерных роботов 2005 года

Летом 2005 года онлайн-покер-рум Golden Palace провел рекламный турнир в Лас-Вегасе, в старом Binions, с призовым фондом в 100 тыс. долларов. Он был объявлен как Мировая серия покерных роботов 2005 года. Турнир проводился только с ботами без вступительного взноса. Разработчиками ботов были компьютерные ученые из шести стран, которые путешествовали за свой счет. Принимающей площадкой была Poker Academy. На мероприятии также был проведен показательный хедз-ап с Филом Лааком.

Эксперименты «Человек против машины» в Университете Альберты

Летом 2007 года Альбертский университет провел высокоспециализированный турнир один на один между людьми и их ботом Polaris на конференции AAAI в Ванкувере, Британская Колумбия, Канада. Платформа хоста была написана Альбертским университетом . Был максимальный призовой фонд в 50 тыс. долларов со специальными правилами, чтобы мотивировать людей играть хорошо. Люди не платили вступительный взнос. Уникальный турнир состоял из четырех сессий в дублирующем стиле по 500 рук каждая. Люди победили с небольшим отрывом.

Летом 2008 года Альбертский университет и сайт покерных тренеров Stoxpoker провели второй турнир во время Мировой серии покера в Лас-Вегасе. Турнир состоял из шести дублирующих сессий по 500 рук каждая, а игроки-люди были специалистами по лимиту Heads-Up. Polaris выиграл турнир с 3 победами, 2 поражениями и ничьей. Результаты турнира, включая истории рук из матчей, доступны на сайте соревнования.

Конкурс «Мозги против ИИ» 2015 года от Rivers Casino, CMU и Microsoft

С апреля по май 2015 года бот Университета Карнеги-Меллона в Сандхолме, Claudico , сражался с четырьмя противниками-людьми в серии матчей по безлимитному техасскому холдему. ^[21]^[22] Наконец, сыграв 80 000 рук, люди выиграли в общей сложности $732 713. Но даже несмотря на то, что технически победили люди, ученые посчитали победу статистически незначительной (скорее статистической ничьей), когда эти $732 713 сравниваются с общей суммой ставок в $170 000 000 ($170 миллионов). Однако некоторые определили это утверждение как неискреннее. ^[23] Статистически незначительное здесь означает, что программисты Claudico не могут сказать с 95% уверенностью (95% доверительный интервал), что люди лучше компьютерной программы. Однако это статистически значимая победа на 90% доверительном интервале. Это означает, что шансы игроков-людей на победу составляют от 10 к 1 до 20 к 1. ^[24]

Турнир был структурирован в два сета по два игрока в каждом. В каждом из двух сетов игроки получали противоположные карты. Это означает, что если у компьютера As9c (туз пик и девятка треф), а у человека Jh8d на одном компьютере, у другого из двух игроков в сете будет As9c против Jh8d компьютера. Однако даже при том, что игроки-люди выигрывали больше, чем компьютер, не все игроки были в плюсе в своих личных встречах.

Итоги выигрышей каждого из игроков были следующими:

Дуглас Полк: +$213,671
Донг Ким: +$70,491
Бьорн Ли: +$529,033
Джейсон Лес: -$80,482 ^[25]

Ежегодный конкурс компьютерного покера

С 2006 по 2018 год Ежегодный конкурс компьютерного покера проводил серию соревнований для покерных программ. С 2010 года играли в три вида покера: лимитный техасский холдем один на один, безлимитный техасский холдем один на один и лимитный техасский холдем на 3 игрока. В каждом мероприятии определяются два победителя: агент, который выигрывает больше всего матчей (Bankroll Instant Run-off), и агент, который выигрывает больше всего денег (Total Bankroll). Эти победители часто не являются одним и тем же агентом, поскольку Bankroll Instant Run-off вознаграждает сильных игроков, а Total Bankroll вознаграждает игроков, которые умеют использовать ошибки других агентов. Соревнование было мотивировано научными исследованиями, и особое внимание уделялось обеспечению статистической значимости всех результатов путем проведения миллионов раздач в покер. Соревнование 2012 года имело те же форматы с более чем 70 миллионами сыгранных раздач, чтобы исключить фактор удачи.

Некоторые исследователи разработали веб-приложение, в котором люди могли играть и оценивать качество ИИ. Так, по состоянию на декабрь 2012 года можно было найти следующие основные группы и агентов отдельных исследователей:

Гиперборейский (9 золотых, 5 серебряных и 3 бронзовых)
Bluffbot (1 золотая, 3 серебряные и 2 бронзовые медали)
Сартр (1 золотая, 5 серебряных и 3 бронзовых медали)
Neo Poker Bot (1 золотая, 5 бронзовых медалей)

Результаты

Pluribus

Финальный покерный конкурс не был публичным. Когда программа Pluribus (покерный бот) последовательно обыгрывала профессионалов в 6-хендовом безлимитном холдеме, результат был тихо объявлен в посте на Facebook. ^[29]

Смотрите также

Ссылки

^ Nature. «ИИ DeepMind побеждает экспертов в сложной игре Stratego». Анил Анантасвами. НОВОСТИ 01 декабря 2022 г., Разъяснение 05 декабря 2022 г.
^ Heaven, Douglas (2019-07-11). «Без ограничений: ИИ-бот для покера первым победил профессионалов в многопользовательской игре». Nature . 571 (7765): 307–308. Bibcode :2019Natur.571..307H. doi : 10.1038/d41586-019-02156-9 . PMID 31312056.
^ Смит, Дэна Г. «ИИ узнает, что младенец знает о физическом мире». Scientific American . Получено 17 мая 2023 г.
↑ Семь игр: история человечества. Глава 5. Оливер Редер, 2022. Издатель: WW Norton and Co.
^ https://docs.house.gov/meetings/IF/IF17/20131210/101570/HHRG-113-IF17-Wstate-EggertK-20131210.pdf Показания профессора права Курта Эггерта, юридического факультета им. Дейла Э. Фаулера в Университете Чепмена, перед подкомитетом по торговле, производству и производству Комитета по энергетике и торговле Палаты представителей на слушании под названием «Состояние онлайн-игр» в здании офиса Rayburn House, Вашингтон, округ Колумбия, 10 декабря 2013 г.
^ Браун, Ноам; Сандхолм, Туомас (30 августа 2019 г.). «Сверхчеловеческий ИИ для многопользовательского покера». Science . 365 (6456): 885–890. Bibcode :2019Sci...365..885B. doi : 10.1126/science.aay2400 . PMID 31296650. S2CID 195892791.
^ "Carnegie Mellon и Facebook AI побеждают профессионалов в покере на шесть игроков - Новости - Carnegie Mellon University". www.cmu.edu . Получено 2023-05-17 .
^ Марр, Бернард. «Искусственный интеллект овладевает игрой в покер — что это значит для людей?». Forbes . Получено 17 мая 2023 г.
^ Интальята, Кристофер. «Этот искусственный интеллект учится как младенец». Scientific American . Получено 17 мая 2023 г.
^ Meta Fundamental AI Research Diplomacy Team (FAIR)†; Бахтин, Антон; Браун, Ноам; Динан, Эмили; Фарина, Габриэль; Флаэрти, Колин; Фрид, Дэниел; Гофф, Эндрю; Грей, Джонатан; Ху, Хэнъюань; Джейкоб, Атул Пол; Комейли, Моджтаба; Конат, Картик; Квон, Минае; Лерер, Адам (2022-12-09). «Игра на человеческом уровне в игру дипломатии путем объединения языковых моделей со стратегическим мышлением». Science . 378 (6624): 1067–1074. Bibcode :2022Sci...378.1067M. doi :10.1126/science.ade9097. ISSN 0036-8075. PMID 36413172. S2CID 253759631.
↑ Журнал, Смитсоновский институт; Солли, Мейлан. «Этот ИИ, играющий в покер, знает, когда держать карты, а когда сбрасывать их». Журнал Смитсоновского института . Получено 17 мая 2023 г.
^ "Ставка на бота: ИИ побеждает профессионалов в техасском холдеме на 6 игроков". NPR . Получено 17.05.2023 .
^ «Нарушение искусственного интеллекта в сфере стратегических игр доказывает, что машины становятся умнее». Forbes. Энни Браун. 10 ноября 2021 г., 16:42 по восточноевропейскому времени.
^ Боулинг, Майкл; Берч, Нил; Йохансон, Майкл; Таммелин, Оскари (январь 2015 г.). «Покер с лимитным холдемом один на один решен». Science . 347 (6218): 145–9. Bibcode :2015Sci...347..145B. CiteSeerX 10.1.1.697.72 . doi :10.1126/science.1259433. PMID 25574016. S2CID 3796371.
^ Филип Болл (2015-01-08). «Game Theorists Crack Poker». Nature . doi : 10.1038/nature.2015.16683 . S2CID 155710390 . Получено 2015-01-13 – через Nature.
^ Роберт Ли Хотц (2015-01-08). «Компьютер побеждает в Техасском Холдеме, говорят исследователи». Wall Street Journal .
^ Боб Макдональд (2015-01-10). «Покерный компьютер берет банк [аудиоинтервью]». Quirks & Quarks (подкаст).
↑ Джошуа Брустайн (31 января 2017 г.). «Онлайн-игры Daftar Situs Poker PKV». Bloomberg.com . Блумберг . Проверено 2 февраля 2017 г.
^ "ICCM 2004".
^ https://www.era.lib.ed.ac.uk/bitstream/1842/2392/2/Carter%20RG%20thesis%2007.pdf ^{[ пустой URL-адрес PDF ]}
↑ Мэрилин Малара (25 апреля 2015 г.). «Мозги против ИИ: компьютеры сражаются с профессионалами покера в безлимитном техасском холдеме». UPI . Получено 26 апреля 2015 г.
^ "Rivers Casino's Brains vs AI". Архивировано из оригинала 2016-02-03 . Получено 2015-10-23 .
^ "Мозги против ИИ | Школа компьютерных наук Карнеги-Меллона". www.cs.cmu.edu . Получено 10 февраля 2016 г.
^ "Мозги против ИИ | Школа компьютерных наук Карнеги-Меллона". www.cs.cmu.edu . Получено 10 февраля 2016 г.
^ "Мозги против искусственного интеллекта". www.riverscasino.com . Архивировано из оригинала 2016-02-03 . Получено 2016-02-10 .
^ "КПРГ".
^ "КПРГ".
^ «Эволюция покерных ботов – от истории к будущему». 8 июля 2020 г.
^ Солли, Мейлан. «Этот ИИ, играющий в покер, знает, когда держать карты, а когда сбрасывать их». Смитсоновский институт .

Внешние ссылки

Ежегодный турнир по компьютерному покеру (последний раз проводился в 2018 году)
Программирование ИИ для покера Статья программиста ИИ для Мировой серии покера. Ноябрь 2005 г.
Кэролайн Сю. «Могут ли «покерботы» победить людей?». USnews.com. Архивировано из оригинала 27 марта 2009 г.
Статья MSNBC - 2004-сентябрь
Новости науки: The Ultimate Poker Face. (Архивная ссылка.) Июнь 2008 г.
NYTimes.com: Покерные боты вторгаются в онлайн-гемблинг. 13 марта 2011 г.
NYTimes.com (архивная статья), «Как ИИ победил покер», 18 января 2022 г.
NYTimes.com (архивная статья), «Чат-боты не могут вас перехитрить. Пока». 20 января 2023 г.
CMU раздает выигрышную комбинацию для Техасского Холдема Статья о группе по исследованию искусственного интеллекта в покере в Университете Карнеги-Меллона