Покерный бот: «Ядерное оружие для покера», часть вторая

Туомас Сандхольм Профессор Университета Карнеги-Меллона на факультете компьютерных наук, более 450 опубликованных работ Туомас Сандхольм Профессор Университета Карнеги-Меллона на факультете компьютерных наук, более 450 опубликованных работ. За последнее десятилетие он применил свои знания и алгоритмы оптимизации теории компьютерных игр для разработки компьютерной программы, или «бота». В 2014 году бот, которого он разработал, Tartanian7, выиграл обе категории, которые он ввел в Ассоциацию по развитию искусственного интеллекта. (AAAI) Ежегодный конкурс компьютерного покера, побеждающий каждого оппонента по пути статистической значимости.

Во второй части интервью Card Player с профессором Сандхольмом он обсуждает возможность состязания человека с машиной с тартанцем 7, как можно использовать бота в качестве учебного пособия и многое другое. Первая часть истории может быть найдена здесь.

Человек против Бота

С начала работы над проектом в 2005 году, который в конечном итоге произвел Tartanian7 в 2014 году, четыре доктора наук. студенты помогли Сандхольм. В прошлом году они работали полный рабочий день, а время суперкомпьютеров, потраченное на программу, составляло от 1 до 2 миллионов часов ядра.

Сандхольм ожидает, что подход, использованный его командой для создания этого бота, сделает его доминирующим в хедз-апе по безлимитному холдему против любого возможного противника.

Это уже подтвердилось в отношении других топ-ботов, но как бы это повлияло на профессионалов-людей, которые специализируются на формате хедз-ап и зарабатывают на жизнь, играя в игру?

«В настоящее время неизвестно, является ли лучшая наша программа лучше, чем лучшие люди-профессионалы. Я бы предположил, что это так, но пока еще не было контролируемого матча «человек против машины».

За последние несколько десятилетий ученые-компьютерщики проверили способность своей игры играть против ведущих игроков-людей, с такими известными матчами, как Гарри Каспаров и суперкомпьютер IBM Deep Blue в шахматах и покерных профи. Фил Лаак и Али Эслами берут на себя ограничения Университета Альберты. -холд-хедс-ап бот Polaris. Сначала люди могли соревноваться, но в конечном итоге программы получили преимущество.

Сандхольм надеется создать аналогичный тест для Tartanian7 в будущем. «Самое сложное в матче состоит в том, что вам нужно сыграть много рук. Я бы сказал, как минимум, 10 000 раздач, прежде чем вы сможете сказать, кто лучше », - сказал Сандхольм. «Равновесие по Нэшу непобедимо. У нас есть приблизительное значение равновесия Нэша, поэтому наш бот все еще может быть побежден, но я думаю, что будет очень трудно обнаружить его утечки ».

Учебная машина

Подход к изучению покера с начала нового тысячелетия во многом изменился. В то время как большинство людей просто играли в игры с низкими ставками, чтобы изучать или читать книги по покерной стратегии, современные игроки имеют доступ к гораздо более сложным инструментам. Они включали в себя видео-инструкции от ведущих профессионалов и инструменты, которые анализируют игру в онлайн-покер и выкладывают точные статистические данные, такие как процент рейза на префлопе (PFR%) и процент времени, когда вы добровольно вкладываете деньги в банк (VPIP%) ,

Хотя эти инструменты, наряду с анализом человеческой профессиональной игры, важны, Сандхольм считает, что все лучшие игроки изучат игру, играя в будущем против таких ботов, как Tartanian7.

«Этот бот так много рассказывает людям о том, как играть в покер, что это нелепо», - сказал Сандхольм, почти затаив дыхание. «Он играет в покер совсем иначе, чем люди играют в покер. Люди учатся друг у друга тому, как люди играют в игру, а не как в нее играют оптимально. Этот бот, напротив, никогда не видел человека, играющего в покер. Вместо этого он исходил из первых принципов, как следует играть в покер, и выводы отличаются от того, чего достигли люди ».

Сандхольм объяснил, что, исходя из первых принципов, он просто подразумевает, что бот определил свою стратегию исключительно из правил игры, используя теоретико-игровую концепцию решения равновесия Нэша. Он не основывает свою игру на каком-либо историческом опыте против людей или других ботов. Это действительно понять, как лучше всего играть в игру, исходя только из правил.

С этим другим подходом бот, как считает Сандхольм, нашел другой способ игры, который может быть очень поучительным для людей.

«Люди могут играть против бота и учиться на наблюдениях и на практике, или даже играть против него и иметь возможность спросить у него совета относительно того, что он будет делать, если он находится на их месте, поэтому мы сможем сделать очень крутой учебный инструмент из этого бота ».

Когда его спросили о том, как бот подходит к безлимитному холдему в хедз-апе по-другому, чем у большинства игроков-людей, Сандхольм впервые заметил, что у него гораздо более разнообразный подход к определению размера ставок, один из наиболее важных и умелых аспектов игра.

«Люди обычно используют небольшое количество размеров ставок в любой конкретной ситуации. Наш бот этого не делает, он использует большой диапазон размеров ставок в данной ситуации, причем ставки иногда меньше или намного больше, чем обычно используют люди », - сказал Сандхольм.

«Я думаю, что, используя одну или две ставки, люди могут избежать слишком сильных сигналов о силе своей руки», - продолжил Сандхольм. «Но компьютер может использовать большее количество размеров ставок, потому что он знает, что он не выдает слишком много, потому что он уравновешивает свои ставки. Кстати, еще один пример хромает. Начинать безлимитный хедз-ап кнопками люди часто считают новичком, но бот сделает это ».

Сандхольм убежден, что то, как они разработали стратегию бота, делает его лучшим хедз-апом по безлимитному холдему в мире и, следовательно, лучшим для начинающих игроков.

«Теперь, как говорится, игрок, обученный нашим ботом с точки зрения стратегии, все еще может выдавать подсказки, но откладывая это в сторону», - сказал Сандхольм с легким смехом.

Жду с нетерпением

Имея показательные победы в двух категориях на ежегодном конкурсе компьютерного покера AAAI, Сандхольм и его бот заложили основу для многих интересных событий в будущем. С надеждами на матч между Tartanian7 и лучшим игроком-человеком в будущем, а также с разработкой средства обучения с использованием бота и его стратегии, есть много чего ожидать в небольшом кусочке мира компьютерных наук, который пересекается с покер. Кто знает, как это пересечение может изменить облик игры в ближайшие годы.

Красота

Мода

Здоровье

Стиль

Авторизация:

Покерный бот: «Ядерное оружие для покера», часть вторая

Похожие