Разное/Спорт и мотивация/Трудно выиграть в покер против соперника, у которого нет жестов

Трудно выиграть в покер против соперника, у которого нет жестов

В знойный летний день две недели назад я сидел в похожей на пещеру комнате в пустыне Мохаве вместе с примерно 2000 другими людьми, никого из которых я никогда раньше не встречал. В надежном месте где-то в помещении хранилось более 8 миллионов долларов наличными, которые мы и другие подобные нам в соседних комнатах коллективно заплатили за эту привилегию. В тот день мы просидели 14 часов. Время от времени кто-нибудь из нас тихо вставал и уходил, чтобы никогда не возвращаться. Последний оставшийся в живых из нас мгновенно станет миллионером.


Мы играли в покер. И в то время я не знал, что пара процессоров Intel на другом конце страны недавно подверглась аналогичному испытанию. На пике Мировой серии покера в Лас—Вегасе пара компьютерных ученых объявила, что они создали игрока в покер с искусственным интеллектом, который сильнее, чем полный стол лучших профессионалов-людей в самой популярной форме игры - безлимитном Техасском холдеме.


Ноам Браун, научный сотрудник Facebook AI Research, и Туомас Сандхольм, специалист по информатике из Carnegie Mellon, описывают свои результаты в новой статье под названием “Сверхчеловеческий ИИ для многопользовательского покера”, опубликованной сегодня в журнале Science.


За последние несколько десятилетий искусственный интеллект превзошел лучших людей во многих любимых играх нашего вида: шашки и их долгосрочное планирование, шахматы и их культовая стратегия, Го и его сложность, нарды и элемент случайности, а теперь и покер с его несовершенной информацией. Спросите исследователей, которые работали над этими проектами, почему они это делают, и они скажут вам одно: игры - это испытательный стенд. Именно в играх проверяются методы, измеряются результаты и сравниваются машины с людьми. И с каждой игрой появляется дополнительный слой, который более точно моделирует реальный мир. Реальный мир требует планирования, он требует стратегии, он сложен, он случаен и — возможно, что самое неприятное — он содержит неисчислимые моря скрытой информации.


“Ни одна другая популярная развлекательная игра не решает проблемы скрытой информации так эффективно и элегантно, как покер”, - пишут Браун и Сандхолм.


Последние девять месяцев или около того я работал над книгой о столкновении игр и искусственного интеллекта — и я все еще работаю над ней, к сожалению, не став мгновенным миллионером на World Series of Poker. По мере того, как люди уступали доминирование в игре за игрой, я стал рассматривать искусственный интеллект сверхчеловеческих игр как предзнаменование и наглядный урок: он дает представление о потенциальном будущем сверхразумных систем и учит нас, как мы, люди, могли бы и могли бы реагировать.


Покер, благодаря своей глубокой сложности и тому факту, что игроки скрывают друг от друга важную информацию, стал одним из последних рубежей этих популярных игр, и этот рубеж быстро преодолевается. Покорение покера компьютерами происходило постепенно, и большая часть работы на сегодняшний день была сосредоточена на относительно простой версии игры “хедз-ап”, или для двух игроков.


К 2007 и 2008 годам компьютеры, управляемые программой под названием Polaris, показали многообещающие результаты в первых матчах человек против машины, сражаясь на равных с профессионалами-людьми и даже побеждая их в хедз-ап лимитном холдеме, в котором два игрока ограничены определенными фиксированными размерами ставок.


В 2015 году хедз-ап лимитный холдем был “по сути решен” благодаря игроку с искусственным интеллектом по имени Цефей. Это означало, что вы не могли отличить игру Цефея от совершенства, даже наблюдая за ней всю жизнь.


В 2017 году в казино в Питтсбурге четверка профессионалов-людей сразилась с программой под названием Libratus в невероятно сложном хедз-апе безлимитный холдем. Человеческие профессионалы были безжалостно уничтожены. Примерно в то же время другая программа, DeepStack, также заявила о своем превосходстве над профессионалами-людьми в безлимитном хедз-апе.


А в 2019 году Wired сообщила, что теоретико-игровая технология, лежащая в основе Libratus, используется на вооружении вооруженных сил США в форме двухлетнего контракта на сумму до 10 миллионов долларов с агентством Пентагона под названием Defense Innovation Unit.


Последнее творение Брауна и Сандхолма, получившее название Pluribus, - это сверхчеловеческий вид безлимитного покера с участием более двух игроков, точнее, шести, который идентичен одной из самых популярных форм игры, в которую играют онлайн, и очень похож на игру, в которую я играл в той комнате в пустыне.


В важной ранней статье по теории игр 1951 года один из отцов этой области, Джон Нэш, рассмотрел ультра-упрощенную версию покера, назвав игру “наиболее очевидной целью” для применения его теории. “Анализ более реалистичной игры в покер, чем наша очень простая модель, должен быть довольно интересным делом”, - писал он. Он предсказал, что анализ будет сложным и что потребуются вычислительные методы. Он был прав.


Pluribus, как и другие игроки в игры с искусственным интеллектом superhuman, научился играть в покер исключительно, играя против самого себя в течение восьми дней и 12 400 часов работы процессора. Она начинается с игры в случайном порядке. Он наблюдает, что работает, а что нет. И по пути он меняет свой подход, используя алгоритм, который нацеливает его на одноименные равновесия Нэша. Этот процесс создал свой план атаки для всей игры, названный “стратегией blueprint”, который был рассчитан в автономном режиме перед соревнованием за то, что, по оценкам авторов, составит всего 144 доллара при текущих затратах на облачные вычисления. Во время своих соревновательных игр Pluribus в режиме реального времени ищет улучшения в своем грубом проекте.


Готовая программа, работавшая всего на паре процессоров Intel, была протестирована против лучших игроков—людей, каждый из которых выиграл не менее 1 миллиона долларов, играя как профессионал, в двух экспериментах с тысячами раздач: один с одной копией Pluribus и пятью людьми, а другой с одним человеком и пятью копии Pluribus. Людям платили за раздачу, и их дополнительно стимулировали играть как можно лучше с помощью наличных, предоставленных Facebook. Было установлено, что Pluribus является прибыльным как в экспериментах, так и на уровнях статистической значимости, достойных публикации в Science.


“Я думаю, что это была последняя веха в покере”, - сказал мне Браун. “Я думаю, что покер сослужил свою службу в качестве эталона и сложной задачи для искусственного интеллекта”.


“У меня, вероятно, больше опыта борьбы с лучшими в своем классе покерными системами искусственного интеллекта, чем у любого другого покерного профессионала в мире”, - сказал Джейсон Лес, один из оппонентов Pluribus. “Я знаю все места, где нужно искать слабые места, все уловки, чтобы попытаться воспользоваться недостатками компьютера. В этом соревновании ИИ использовал надежную оптимальную стратегию, основанную на теории игр, которую на самом деле можно увидеть только у лучших профессионалов-людей, и, несмотря на все мои усилия, мне не удалось найти способ ее использовать. Я бы не хотел играть в покер, где за столом сидел этот искусственный интеллект-покерный бот”.


Сандхолм и Браун сказали мне, что они ожидают, что технология Pluribus будет иметь еще более широкое применение, чем боты, которые были раньше. Они считают Pluribus первым мультиплеером, как и более чем в двух играх с искусственным интеллектом, и что он может повлиять на целый список многопользовательских “игр” в реальном мире: аукционные торги, многосторонние переговоры, ценообразование онлайн-магазинов, реклама кандидатов в президенты, кибербезопасность и даже самоуправляемые автомобили..


В той похожей на пещеру комнате в пустыне на Всемирной серии покера в Вегасе люди не думали о политической рекламе или самоуправляемых автомобилях, но многие из них думали о теории игр. Все чаще лучшие профессионалы игр черпают вдохновение из академической литературы по искусственному интеллекту, коммерчески доступных программ, таких как PokerSnowie и PioSOLVER, и даже тех, у кого есть докторские степени в области компьютерных наук, которых они нанимают в качестве консультантов для оттачивания своих игр. В результате качество человеческой игры в покер никогда не было таким высоким, и Pluribus может повысить его еще больше.


Но я разговаривал как с профессионалами, так и с учеными, которые считают, что ИИ в покере могут убить саму игру, которую они пытаются завоевать. Действительно, можно было бы уже убить лимит хедз-апа. С одной стороны, утверждают эти скептики, современный элитный покер может казаться стерильным, когда молодые профессионалы делают лучшие игры за солнцезащитными очками и в наушниках, а игре не хватает привлекательных человеческих персонажей, необходимых для хорошего шоу и привлечения нового поколения. С другой стороны, покер похож на финансовую пирамиду: для поддержки профессионалов, играющих на большие деньги на вершине, требуется широкий диапазон уровней мастерства. Поскольку люди быстро учатся у ботов, все становятся хорошими, уровни навыков выравниваются, пирамида рушится вниз, и игра умирает.


”К сожалению, в этом может быть какая-то заслуга", “ сказал Сандхольм. “Это было бы очень печально. Я полюбил эту игру”.

Ниже Вы можете высказаться по теме или оставить свои вопросы - узнайте больше информации!
Когда мамы не будет, дети будут играть в покер на раздевание?

Когда мамы не будет, дети будут играть в покер на раздевание?
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

Вы когда-нибудь замечали, что независимо от того, как поздно вы звоните домой или возвращаетесь домой, когда вы оставили...
Ом
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
Психология и покер

Психология и покер
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

Барбара КоннорсБарбара живет в долине Коачелла в Южной Калифорнии и стала ерьезно изучать покер в 2001 году. Ей осо...
Мудрая Сова
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
Почему Вы проигрываете в покере и как выиграть

Почему Вы проигрываете в покере и как выиграть
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

Если вы поймали себя на вопросе: «Почему я не могу выиграть в покер?» - вы попали по адресу. Мы дадим вам краткий с...
Ом
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
10 ошибок мышления в покере, которых следует избегать

10 ошибок мышления в покере, которых следует избегать
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

Стоят ли вам психологические ошибки в игре денег?В этой статье я собираюсь обсудить самые распространенные ошибки в поке...
Ом
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
person Опубликовал(а): Ом
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
Оцените статью:
person group filter_1
Ширина охвата темы
0
0
0
Глубина
0
0
0
Оценка автору
0
0
0

Чтобы увидеть комментарии, или написать свой, авторизуйтесь.

ВНИМАНИЕ: факты и мнения, высказанные в этой статье, являются личным мнением автора. BeText.ru не несет никакой ответственности за точность, полноту, пригодность или достоверность любой информации в этой статье.