Математический разбор покерной задачи Даниэля Негреану

Yannic Kilcher 7,1 тыс. 27 мин 3 мин 13.12.2020
Главное

Искусство блефа и логики: Даниэль Негреану и покерный вызов алгоритмам 0:00

Видео, опубликованное на канале Yannic Kilcher, посвящено анализу сложной покерной задачи, которую профессиональный игрок Даниэль Негреану предложил своей аудитории в социальных сетях. В основе обсуждения лежит ситуация в безлимитном техасском холдеме (No-Limit Hold'em), где в банк размером $5 поступает ставка «олл-ин» в размере $2 млн. Автор видео использует этот пример как демонстрацию того, почему игры с неполной информацией, такие как покер, представляют собой гораздо более сложную вычислительную задачу для искусственного интеллекта, чем шахматы или го.

Сценарий №1: Игра против «предсказуемого» соперника 6:40

В первой части разбора заданы условия: у игрока на руках пара тузов, а на столе — A-K-8-4-4. Это дает вторую по силе комбинацию — фулл-хаус на тузах и четверках. Единственная рука, которая может победить в этой ситуации — это пара четверок у противника.

Основной вопрос: следует ли уравнивать (коллировать) ставку, если известно, что оппонент всегда идет «олл-ин» на ривере?

Сценарий №2: Неизвестный оппонент и теория игр 13:10

Во втором случае вводные меняются: об оппоненте нет никакой информации, а его стиль игры неизвестен. В такой ситуации, по мнению автора, наиболее рациональным подходом является расчет стратегии равновесия Нэша. Это позволяет минимизировать ожидаемые потери, даже если противник действует неоптимально.

Сценарий №3: Что лучше иметь на руках — тузы или король-четверка? 20:47

Последний вопрос касается выбора руки для колла: пара тузов (A-A) или король-четверка (K-4).

  1. Аргумент за K-4: Владение четверкой блокирует возможность оппонента собрать комбинацию из двух четверок («натс»), так как общее количество четверок в колоде ограничено.
  2. Аргумент за A-A: Пара тузов остается более сильной комбинацией в вакууме. Однако, если оппонент достаточно умен, чтобы понять, что у вас может быть четверка (и вы, следовательно, «блокируете» его лучший расклад), он может попытаться выбить вас из игры блефом с парами королей или восьмерок, которые бьют вашу K-4, но проигрывают тузам.

Сложность алгоритмического решения 26:03

Автор подчеркивает, что вычисление равновесия Нэша в реальном времени требует от игрока постоянного анализа того, что он не знает, и присвоения вероятностей различным сценариям. В отличие от шахмат, где алгоритмы уровня AlphaGo работают с полной информацией, покер требует от ИИ (например, алгоритма Rebel) постоянной корректировки стратегии, исходя из того, как каждый игрок интерпретирует наблюдаемые действия оппонента.

💬 Цитаты

«Это не просто вопрос того, какие у вас карты, это вопрос того, сколько денег вы вкладываете.»

Янник Килчер 05:06

«Вы предполагаете, что ваш оппонент умен, ваш оппонент предполагает, что вы умны.»

Янник Килчер 12:06
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Zero-sum game
Игра, в которой выигрыш одного участника равен проигрышу другого.
Nash equilibrium
Состояние в игре, когда ни один игрок не может увеличить свой выигрыш, изменив свою стратегию в одностороннем порядке.
Nuts
Самая сильная возможная комбинация карт в конкретной ситуации в покере.
Heads-up
Покерная партия, в которой участвуют только два игрока.
Bluff
Ставка или повышение с целью заставить оппонента сбросить более сильные карты.
📊 Цифры
⚖️ Другая сторона
Наука Daniel Negreanu Yannic Kilcher No-Limit Hold'em Rebel algorithm Nash equilibrium