当前位置：首页 » 发现

大模型集体扑克翻车：GTO Wizard一穿二十，人类玩家暂时安全

你的对手要是用ChatGPT打牌，那你就偷着乐吧

最近扑克圈炸了一个大瓜：GTO Wizard 搞了个大动作，拿自己的AI模型和20多个主流大语言模型（LLM）玩了一场单挑无限注德州扑克大赛。

参赛选手都是谁？GPT全系（包括最新的GPT-5.3、5.4）、Gemini、Claude Opus、Kimi、Grok……一个个如雷贯耳，写诗、编程、解数学题样样精通。

结果呢？被GTO Wizard AI按在地上摩擦。

最惨的GPT-5.4 Nano（无推理模式），运气调整后输率达到了惊人的 -189.7 BB/100。

什么概念？顶尖职业牌手能稳定盈利4 BB/100就已经是神一样的存在了。这帮AI大佬输的速度，是顶级人类赢钱速度的47倍

连表现最好的GPT-5.3（超高推理模式），也输了 -16 BB/100——相当于每100手牌稳定送出去16个大盲注。

GTO Wizard自己都忍不住吐槽：“每一个模型在单挑扑克面前，都烂得一塌糊涂。”

等等，GTO Wizard AI到底什么来头？

你可能想问：这个GTO Wizard AI凭啥这么狂？

故事要从2023年说起。那一年，GTO Wizard收购了一家名叫 Ruse AI 的公司。这家公司由两个加拿大小伙 Philippe Beardsell 和 Marc-Antoine Provost 在一年前创立，专门做扑克求解器。

Ruse AI之所以能入GTO Wizard的法眼，是因为它干了一件大事——打爆了当年的计算机扑克冠军Slumbot。

那场比赛有多残暴？双方打了15万手牌，每手牌平均思考时间不超过7秒，每手牌后记分牌重置为200BB。结果Ruse AI以 19.4 BB/100 的赢率碾压对手，创下纪录。

关键是打法上的区别。Slumbot也在试图接近纳什均衡，但它不会主动调整策略，也不会利用对手的错误。而Ruse AI会实时分析每一手牌的具体情境，动态求解。

说白了，一个死背公式，一个活学活用。

GTO Wizard拿到这个技术之后，如虎添翼，这才有了后来单挑20多个大语言模型的底气。

为什么LLM打牌这么烂？

这就让人纳闷了：这些大语言模型不是能写代码、能考律师证、能通过图灵测试吗？怎么打个扑克就集体翻车了？

GTO Wizard总结了四个核心原因：

1. 隐藏信息 —— 你看不到对手的牌。这对LLM来说是降维打击。它们擅长处理显性信息，但扑克本质是个不完全信息博弈。你永远不知道对手是在诈唬还是真有坚果。

2. 范围平衡 —— 几千个决策点上，你的每一个动作都要保持范围的一致性。这需要极强的记忆和计算能力，LLM的逻辑连贯性在这里直接崩盘。

3. 长期规划 —— 翻牌圈的一个小动作，会影响转牌、河牌乃至整个对局的走向。LLM擅长单步推理，但很难构建一个跨越多条街的长期策略。

4. 深度不确定性下的对手建模 —— 你要在几乎没信息的情况下，猜测对手是什么类型的人、他在想什么、他会怎么反应。这对没有“心智”的LLM来说，基本属于超纲题。

更搞笑的是，实验发现，这些大模型大约有2%的概率会读错自己的手牌——把同花和不同花搞混，把顺子听牌当成成牌……

你能想象吗？一个能解偏微分方程的AI，竟然分不清自己手里是不是同花？

负责审计Gemini和Grok的Cesar Enrique Aponte Rivas 在X上说了句大实话：

“它们在逻辑完整性上始终失败，远未达到专业GTO的水平。扑克是大语言模型的终极现实检验。”

那GTO Wizard AI到底有没有“攻克”扑克？

开发者自己放话说：“GTO Wizard AI执行的是近乎完美的纳什均衡策略”，“没有人类能在有意义的样本量下击败它。”

这话听起来挺吓人的。但你先别急着卖记分牌。

冷静分析一下，有几个关键限制：

第一，目前只测试了单挑无限注德州。扑克还有六人桌、九人桌、奥马哈、混合游戏……每种游戏的复杂度都不一样。单挑被攻克，不代表其他形式也被攻克。

第二，它还没和真正的顶级职业牌手公开较量过。虐一虐大语言模型是一回事，和Phil Ivey、Fedor Holz这种级别的选手过招是另一回事。人类有直觉、有心理战、有情绪波动——这些是AI难以模拟的。

第三，GTO Wizard AI不是公开工具。它只是GTO Wizard求解器背后的引擎，普通玩家用不了。开发团队之外的人，连摸都摸不到。

第四，所有线上扑克室都禁止使用求解器。安全团队不光监控你的桌面，连后台进程都不放过。用AI辅助打牌，封号是分分钟的事。

给普通玩家的启发：你应该慌吗？

说实话，这篇文章读到这里，你应该松一口气。

为什么？

因为实验还揭示了一个被很多人忽略的事实：目前所有面向公众开放的大语言模型，打牌都烂到了令人发指的程度。

这意味着什么？

你在线上扑克室遇到的那些“可疑”对手，但凡他敢说自己用ChatGPT、Gemini或者任何LLM来辅助决策，你就偷着乐吧——他基本上是来送钱的。

-16 BB/100的输率，在低级别都能把他打破产。

所以别听风就是雨。AI在扑克领域的进步是事实，但它离“普通玩家随手可得的作弊工具”还差着十万八千里。

真正的高手，从来不是靠背GTO表格赢钱的。读人、调整、情绪控制、资金管理——这些才是普通玩家可以建立优势的地方。

扑克没有被AI解决，你的对手也没有外挂。

安安心心打你的牌，该咋呼咋呼，该弃牌弃牌。下次再看到有人吹嘘“我用AI打牌赢了多少钱”，你就把这个文章甩给他，然后笑着把他记分牌收了。

未经允许不得转载：德扑荟 » 大模型集体扑克翻车：GTO Wizard一穿二十，人类玩家暂时安全

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

大模型集体扑克翻车：GTO Wizard一穿二十，人类玩家暂时安全

相关推荐

评论 ( 0 )

取消回复

在德扑荟，我们重视您的安全和隐私.

只使用安全服务器和支付处理器，并制定了严格的隐私政策来保护您的信息和订单详情。

大模型集体扑克翻车：GTO Wizard一穿二十，人类玩家暂时安全

相关推荐

评论 ( 0 )

取消回复

在德扑荟，我们重视您的安全和隐私.

只使用安全服务器和支付处理器，并制定了严格的隐私政策来保护您的信息和订单详情。

中文国际扑克专业聚合平台