自由 开放 发现 分享 专业 助力
注册
Ctrl + D 收藏本站
当前位置:首页 » 发现

大模型集体扑克翻车:GTO Wizard一穿二十,人类玩家暂时安全

你的对手要是用ChatGPT打牌,那你就偷着乐吧

最近扑克圈炸了一个大瓜:GTO Wizard 搞了个大动作,拿自己的AI模型和20多个主流大语言模型(LLM)玩了一场单挑无限注德州扑克大赛。

参赛选手都是谁?GPT全系(包括最新的GPT-5.3、5.4)、Gemini、Claude Opus、Kimi、Grok……一个个如雷贯耳,写诗、编程、解数学题样样精通。

结果呢?被GTO Wizard AI按在地上摩擦。

最惨的GPT-5.4 Nano(无推理模式),运气调整后输率达到了惊人的 -189.7 BB/100。

什么概念?顶尖职业牌手能稳定盈利4 BB/100就已经是神一样的存在了。这帮AI大佬输的速度,是顶级人类赢钱速度的47倍

 

连表现最好的GPT-5.3(超高推理模式),也输了 -16 BB/100——相当于每100手牌稳定送出去16个大盲注。

GTO Wizard自己都忍不住吐槽:“每一个模型在单挑扑克面前,都烂得一塌糊涂。”

 

等等,GTO Wizard AI到底什么来头?

你可能想问:这个GTO Wizard AI凭啥这么狂?

故事要从2023年说起。那一年,GTO Wizard收购了一家名叫 Ruse AI 的公司。这家公司由两个加拿大小伙 Philippe Beardsell 和 Marc-Antoine Provost 在一年前创立,专门做扑克求解器。

Ruse AI之所以能入GTO Wizard的法眼,是因为它干了一件大事——打爆了当年的计算机扑克冠军Slumbot。

那场比赛有多残暴?双方打了15万手牌,每手牌平均思考时间不超过7秒,每手牌后记分牌重置为200BB。结果Ruse AI以 19.4 BB/100 的赢率碾压对手,创下纪录。

关键是打法上的区别。Slumbot也在试图接近纳什均衡,但它不会主动调整策略,也不会利用对手的错误。而Ruse AI会实时分析每一手牌的具体情境,动态求解。

说白了,一个死背公式,一个活学活用。

GTO Wizard拿到这个技术之后,如虎添翼,这才有了后来单挑20多个大语言模型的底气。

为什么LLM打牌这么烂?

这就让人纳闷了:这些大语言模型不是能写代码、能考律师证、能通过图灵测试吗?怎么打个扑克就集体翻车了?

 

GTO Wizard总结了四个核心原因:

1. 隐藏信息 —— 你看不到对手的牌。这对LLM来说是降维打击。它们擅长处理显性信息,但扑克本质是个不完全信息博弈。你永远不知道对手是在诈唬还是真有坚果。

2. 范围平衡 —— 几千个决策点上,你的每一个动作都要保持范围的一致性。这需要极强的记忆和计算能力,LLM的逻辑连贯性在这里直接崩盘。

3. 长期规划 —— 翻牌圈的一个小动作,会影响转牌、河牌乃至整个对局的走向。LLM擅长单步推理,但很难构建一个跨越多条街的长期策略。

4. 深度不确定性下的对手建模 —— 你要在几乎没信息的情况下,猜测对手是什么类型的人、他在想什么、他会怎么反应。这对没有“心智”的LLM来说,基本属于超纲题。

更搞笑的是,实验发现,这些大模型大约有2%的概率会读错自己的手牌——把同花和不同花搞混,把顺子听牌当成成牌……

你能想象吗?一个能解偏微分方程的AI,竟然分不清自己手里是不是同花?

负责审计Gemini和Grok的Cesar Enrique Aponte Rivas 在X上说了句大实话:

“它们在逻辑完整性上始终失败,远未达到专业GTO的水平。扑克是大语言模型的终极现实检验。”

 

那GTO Wizard AI到底有没有“攻克”扑克?

开发者自己放话说:“GTO Wizard AI执行的是近乎完美的纳什均衡策略”,“没有人类能在有意义的样本量下击败它。”

这话听起来挺吓人的。但你先别急着卖记分牌。

 

冷静分析一下,有几个关键限制:

第一,目前只测试了单挑无限注德州。 扑克还有六人桌、九人桌、奥马哈、混合游戏……每种游戏的复杂度都不一样。单挑被攻克,不代表其他形式也被攻克。

第二,它还没和真正的顶级职业牌手公开较量过。 虐一虐大语言模型是一回事,和Phil Ivey、Fedor Holz这种级别的选手过招是另一回事。人类有直觉、有心理战、有情绪波动——这些是AI难以模拟的。

第三,GTO Wizard AI不是公开工具。 它只是GTO Wizard求解器背后的引擎,普通玩家用不了。开发团队之外的人,连摸都摸不到。

第四,所有线上扑克室都禁止使用求解器。 安全团队不光监控你的桌面,连后台进程都不放过。用AI辅助打牌,封号是分分钟的事。

 

给普通玩家的启发:你应该慌吗?

说实话,这篇文章读到这里,你应该松一口气。

为什么?

因为实验还揭示了一个被很多人忽略的事实:目前所有面向公众开放的大语言模型,打牌都烂到了令人发指的程度。

 

这意味着什么?

你在线上扑克室遇到的那些“可疑”对手,但凡他敢说自己用ChatGPT、Gemini或者任何LLM来辅助决策,你就偷着乐吧——他基本上是来送钱的。

-16 BB/100的输率,在低级别都能把他打破产。

所以别听风就是雨。AI在扑克领域的进步是事实,但它离“普通玩家随手可得的作弊工具”还差着十万八千里。

真正的高手,从来不是靠背GTO表格赢钱的。读人、调整、情绪控制、资金管理——这些才是普通玩家可以建立优势的地方。

 

扑克没有被AI解决,你的对手也没有外挂。

安安心心打你的牌,该咋呼咋呼,该弃牌弃牌。下次再看到有人吹嘘“我用AI打牌赢了多少钱”,你就把这个文章甩给他,然后笑着把他记分牌收了。

相关推荐

评论 ( 0 )

在德扑荟,我们重视您的安全和隐私.
只使用安全服务器和支付处理器,并制定了严格的隐私政策来保护您的信息和订单详情。

2026 年 4 月
 123456
78910111213
14151617181920
21222324252627
28293031  
  签 到
请登录后签到
每日签到得1积分,每连续签到7日将额外得10积分

我的

回顶部