
你的对手要是用ChatGPT打牌,那你就偷着乐吧
最近扑克圈炸了一个大瓜:GTO Wizard 搞了个大动作,拿自己的AI模型和20多个主流大语言模型(LLM)玩了一场单挑无限注德州扑克大赛。
参赛选手都是谁?GPT全系(包括最新的GPT-5.3、5.4)、Gemini、Claude Opus、Kimi、Grok……一个个如雷贯耳,写诗、编程、解数学题样样精通。
结果呢?被GTO Wizard AI按在地上摩擦。
最惨的GPT-5.4 Nano(无推理模式),运气调整后输率达到了惊人的 -189.7 BB/100。
什么概念?顶尖职业牌手能稳定盈利4 BB/100就已经是神一样的存在了。这帮AI大佬输的速度,是顶级人类赢钱速度的47倍
连表现最好的GPT-5.3(超高推理模式),也输了 -16 BB/100——相当于每100手牌稳定送出去16个大盲注。
GTO Wizard自己都忍不住吐槽:“每一个模型在单挑扑克面前,都烂得一塌糊涂。”
等等,GTO Wizard AI到底什么来头?
你可能想问:这个GTO Wizard AI凭啥这么狂?
故事要从2023年说起。那一年,GTO Wizard收购了一家名叫 Ruse AI 的公司。这家公司由两个加拿大小伙 Philippe Beardsell 和 Marc-Antoine Provost 在一年前创立,专门做扑克求解器。
Ruse AI之所以能入GTO Wizard的法眼,是因为它干了一件大事——打爆了当年的计算机扑克冠军Slumbot。
那场比赛有多残暴?双方打了15万手牌,每手牌平均思考时间不超过7秒,每手牌后记分牌重置为200BB。结果Ruse AI以 19.4 BB/100 的赢率碾压对手,创下纪录。
关键是打法上的区别。Slumbot也在试图接近纳什均衡,但它不会主动调整策略,也不会利用对手的错误。而Ruse AI会实时分析每一手牌的具体情境,动态求解。
说白了,一个死背公式,一个活学活用。
GTO Wizard拿到这个技术之后,如虎添翼,这才有了后来单挑20多个大语言模型的底气。
为什么LLM打牌这么烂?
这就让人纳闷了:这些大语言模型不是能写代码、能考律师证、能通过图灵测试吗?怎么打个扑克就集体翻车了?
GTO Wizard总结了四个核心原因:
1. 隐藏信息 —— 你看不到对手的牌。这对LLM来说是降维打击。它们擅长处理显性信息,但扑克本质是个不完全信息博弈。你永远不知道对手是在诈唬还是真有坚果。
2. 范围平衡 —— 几千个决策点上,你的每一个动作都要保持范围的一致性。这需要极强的记忆和计算能力,LLM的逻辑连贯性在这里直接崩盘。
3. 长期规划 —— 翻牌圈的一个小动作,会影响转牌、河牌乃至整个对局的走向。LLM擅长单步推理,但很难构建一个跨越多条街的长期策略。
4. 深度不确定性下的对手建模 —— 你要在几乎没信息的情况下,猜测对手是什么类型的人、他在想什么、他会怎么反应。这对没有“心智”的LLM来说,基本属于超纲题。
更搞笑的是,实验发现,这些大模型大约有2%的概率会读错自己的手牌——把同花和不同花搞混,把顺子听牌当成成牌……
你能想象吗?一个能解偏微分方程的AI,竟然分不清自己手里是不是同花?
负责审计Gemini和Grok的Cesar Enrique Aponte Rivas 在X上说了句大实话:
“它们在逻辑完整性上始终失败,远未达到专业GTO的水平。扑克是大语言模型的终极现实检验。”
那GTO Wizard AI到底有没有“攻克”扑克?
开发者自己放话说:“GTO Wizard AI执行的是近乎完美的纳什均衡策略”,“没有人类能在有意义的样本量下击败它。”
这话听起来挺吓人的。但你先别急着卖记分牌。
冷静分析一下,有几个关键限制:
第一,目前只测试了单挑无限注德州。 扑克还有六人桌、九人桌、奥马哈、混合游戏……每种游戏的复杂度都不一样。单挑被攻克,不代表其他形式也被攻克。
第二,它还没和真正的顶级职业牌手公开较量过。 虐一虐大语言模型是一回事,和Phil Ivey、Fedor Holz这种级别的选手过招是另一回事。人类有直觉、有心理战、有情绪波动——这些是AI难以模拟的。
第三,GTO Wizard AI不是公开工具。 它只是GTO Wizard求解器背后的引擎,普通玩家用不了。开发团队之外的人,连摸都摸不到。
第四,所有线上扑克室都禁止使用求解器。 安全团队不光监控你的桌面,连后台进程都不放过。用AI辅助打牌,封号是分分钟的事。
给普通玩家的启发:你应该慌吗?
说实话,这篇文章读到这里,你应该松一口气。
为什么?
因为实验还揭示了一个被很多人忽略的事实:目前所有面向公众开放的大语言模型,打牌都烂到了令人发指的程度。
这意味着什么?
你在线上扑克室遇到的那些“可疑”对手,但凡他敢说自己用ChatGPT、Gemini或者任何LLM来辅助决策,你就偷着乐吧——他基本上是来送钱的。
-16 BB/100的输率,在低级别都能把他打破产。
所以别听风就是雨。AI在扑克领域的进步是事实,但它离“普通玩家随手可得的作弊工具”还差着十万八千里。
真正的高手,从来不是靠背GTO表格赢钱的。读人、调整、情绪控制、资金管理——这些才是普通玩家可以建立优势的地方。
扑克没有被AI解决,你的对手也没有外挂。
安安心心打你的牌,该咋呼咋呼,该弃牌弃牌。下次再看到有人吹嘘“我用AI打牌赢了多少钱”,你就把这个文章甩给他,然后笑着把他记分牌收了。















评论 ( 0 )