自由 开放 发现 分享 专业 助力
注册
Ctrl + D 收藏本站
当前位置:首页 » 资源

《GTO精粹》扑克的一个解决方案(2)

扑克GTO的相关性
如果游戏扑克GTO是我们根本就实现不了的事,那么我们也许就会问自己为什么要大费周章地探索扑克GTO。简而言之,为了在牌场赢牌,我们其实不需要游戏完美的扑克GTO。我们只需要在牌桌上比普通对手更懂扑克就可以了。

探索GTO概念能够大幅度地提升我们对于扑克策略的思考,同样也使得我们在和对手的博弈中占主导地位。

一个核心的出发点就是要意识到下面这句话:

学习扑克GTO的目的并不是一定为了要游戏扑克GTO。

学习扑克GTO的目的更大程度上是为了可以更好地理解对手所犯的错误以及我们该如何剥削这些错误。剥削对手的错误比坚持GTO打法更能让我们获利。

到底为什么会这样?我们可以通过分析一个知名小游戏的简单决策树来找出这个问题。这个游戏通常被大家叫作“剪刀石头布”。

GTO与剥削:RPS
很有可能大家已经知道了这个游戏的玩法。但假设你还不知道,让我们来简单回顾一下。

“剪刀石头布”是一项两人之间的游戏,大家在没有事先告知对方的前提下可以任意选择出石头、布或剪刀。

一旦两人公布自己的选择,结果就是:

l 石头击败剪刀

l 剪刀击败布

l 布击败石头

l 如果两人的结果一致,那么就是平局。

RPS碰巧只是一个解决博弈的例子。

RPS的最佳博弈论就是每个选择都是三分之一的概率。凭借着这个策略,我们的赢率就是三分之一,并且从长远来看获得平局的概率也是三分之一。

对手如何改变他们的策略并不重要。因为我们在这个游戏中三分之一的赢率是他们根本无法动摇的。

对于RPS而言完美的GTO策略就是在长期上双方玩家都不赢。结果就是打成平手。

扑克也类似这种。当两名完美的GTO扑克玩家进入一对一环节时,从长远来看两名玩家最终谁也无法获利。

设想我们的RPS对手不是很有经验并且决定100%出“石头”。如果我们继续采取GTO RPS策略,那么从长远来看结果仍然会是平局。

知道为什么吗?

用博弈论语言来说,RPS被视为一种强解游戏,因为游戏的每一种情况都已被彻底的解析过。具体来说就是,这个游戏的完整解决方案已被知晓。这没什么好惊讶的,因为这个游戏本身就是个简单的游戏。另一方面,扑克是无法被解析的。一对一的解析可以说是个例外,但也是一种弱解。

这是我们在这个情况中的最佳策略回应吗?

实际上,如果我们知道对手会一直选择“石头”,那么我们的最佳回应对策就应该是一直选择“布”。那么我们的赢率就是100%。我们将不再采取最佳博弈论策略,我们转而执行的是剥削策略。

剥削打法
一种非最佳博弈论策略,被用来对抗对手所犯的错误。(“错误”就是偏离对手完美GTO打法的行动)。牌桌上剥削打法往往比最佳博弈论策略能够赢到更多的钱。我们同样能够通过剥削打法赢到更多的钱,而非使用GTO策略。

扑克GTO的知识是极其具有价值的,因为它让我们认知到对手何时犯错。另外,当我们偏离剥削打法时GTO策略提供了一条基线。

在牌场保持成绩
在RPS中,赢家就是赢得最多回合的人,因为每一回合的价值都是一样的。在牌场并非如此。

赢得最多手牌胜利的玩家不一定会成为比赛最后的赢家,因为每一手牌中所博弈的筹码量都是不同的。

牌场中用期望值(EV)来衡量不同决策的收益性。

这是一个非常重要的GTO扑克概念,我们全书都会使用。

期望值(EV)

衡量一个扑克决策的平均收益情况,一般以大盲注或货币为单位(比如美元)。

大家需要牢记以下扑克玩家使用的常用术语。

知道为什么吗?

不同于RPS的GTO策略,扑克GTO在对抗每位玩家时不会打成平手。虽然扑克GTO在与另一名完美GTO对手对抗时会出现不输不赢的局面,但在对抗犯策略错误的对手时会产生一个正赢率。

知识点
l 虽然针对像NLHE和PLO等复杂游戏可能存在一套完整的GTO解决方案,但是人类想要精确地执行它是不可能的。l 为了赢牌,你不一定需要完美游戏扑克GTO。

l 剥削对手的错误比死守GTO打法更有利可图。

l 像RPS这样的简单游戏,对偏离GTO解决方案提供了一个清晰可视化的模板。

l 赢得更多手牌的玩家不一定要赢得整场比赛的胜利,因为每一手牌博弈的筹码量都是不同的。

相关推荐

评论 ( 0 )

在德扑荟,我们重视您的安全和隐私.
只使用安全服务器和支付处理器,并制定了严格的隐私政策来保护您的信息和订单详情。

2025 年 10 月
 123456
78910111213
14151617181920
21222324252627
282930  
  签 到
请登录后签到
每日签到得1积分,每连续签到7日将额外得10积分

我的

回顶部