前言
我在另一种孤独中完成了最佳扑克策略2的写作。本来我应该在准备世界扑克系列赛(WSOP)赛事#15,但是却因为新冠疫情被隔离 在家。在全世界都被疫情所苦的时候,我却花这么多精力去写一本关于扑克的书,有时候我会感到很徒劳,但是随着扑克室被关闭, 我很庆幸可以用我的时间来赚钱。
在我最膨胀的梦中,我想象这个我们热爱的游戏中还有更大的价 值,并且还能培养一些有用的思维模式。学习如何作出更好的决策 在一定程度上有助于建设更美好的世界,让这个世界可以去应对各 种无法预知的挑战。
博弈论教会我们在不确定的情况下如何做决策,而这个世界从来没 有像现在这样让我觉得不确定。用博弈论的说法,我的报酬不仅取 决于我的行动,也取决于别人的行动,这一点也从来没有如此清 晰。
跟扑克不一样,这个不是零和游戏,我们也不是在互相竞争。而我 最大的愿望就是我们能找到一个合适的方式去追求正和双赢结果。在我一生之中,我从未像现在这样意识到我们是紧密联系的。
希望我们都能做出最佳决策!
引言
在河牌圈之前,范围并不会像我们在卷一中讨论的那样是简单两极 化或者被压缩的。在制定转牌圈策略时,你和对手都必须为河牌圈 做计划。手牌价值会改变,所以即使你在转牌圈诈唬,你也可能会 在河牌圈价值下注,反之亦然。
现在牌面上已经有三张草花,用草花A下注是很有吸引力的,因为你知道对手并没有坚果牌。即使你被跟注了,你的听牌会让你有足 够的胜率并且可以期望在草花河牌圈中价值下注。预期潜在的价值 能增加在转牌圈诈唬的盈利。
事实上,把这个下注称为诈唬不是很准确。根据情况不同,A高有可能是最佳牌型。你的转牌圈下注甚至可能会被更差的牌型跟注, 例如更弱的同花听牌(对抗这种牌型时你胜算很大!)。
这也不是直截了当的价值下注。你并不希望被跟注。你可能会使得 对手弃掉比你强的牌型,而即使对手弃掉更弱的牌型你也能获利(不给它们在河牌圈成牌的机会)。
不管怎么说,这个听起来都像是很有吸引力的下注。但是,我们要考虑过牌的价值之后才能知道这个下注好不好。只知道下注是否盈利是不够的;如果下注是最佳策略(optimal),那么下注一定要比过牌更有利可图。
不管是过牌还是下注,第四张草花出现的概率都是一样的。假设你 的对手知道你拿着草花A时一定会在转牌圈下注。他会怎么利用这一点?
如果你过牌,然后河牌发出第四张草花,他就很确定你没有坚果 牌。这样他就可以用两极化范围下注去对抗你被压缩的范围,我们在最佳扑克策略中说过,这个情形对你来说很艰难。这个两极化范围也很宽,因为他会把A高同花和K高同花都当成坚果牌,用这些牌 型进行大下注,并且用很多诈唬牌去平衡。
你的下注范围也会很危险。如果你的对手知道你一定会在转牌圈用 草花A下注,那么河牌圈发出草花时他就不会那么有动机给你扔 钱。这也会减小你在转牌圈下注的动机,因为你这个下注的部分价 值来自于期望可以在草花河牌圈中进行价值下注。
如果你总在转牌圈用草花A过牌,你也会遇到类似的问题。如果你在转牌圈下注,对手可以在草花河牌圈用两极化(polarized)范围下注;如果你在转牌圈过牌,对手会拒绝在草花河牌圈给你扔钱。
你知道这是怎么回事吗?我们正在往你在转牌圈拿着草花A时对于 下注和过牌不偏不倚(indifferent)的平衡(equilibrium)发展。
要使得你不偏不倚,你的对手得采用更复杂的策略,而不是只调整 诈唬和抓诈唬频率。你在转牌圈下注或者过牌之后,他要去平衡诈 唬频率,以及在草花河牌圈的价值下注频率有多薄。如果河牌发出 的是非草花,他也要做出相应的诈唬和抓诈唬调整,尤其是发出A 的时候。这个时候甚至要求调整转牌圈的跟注和加注频率,因为对 你来说在用坚果同花听牌半诈唬之后被过牌-加注是很不爽的。
这些区域出现的所有不平衡都有可能给你创造剥削的机会,但是也可能会创造潜在的不利因素。如果你的对手在转牌圈太被动,你可能会严格倾向于用坚果同花听牌下注。但是,如果他在转牌圈太激进,那么下注就是个错误。同样,对于过牌-加注进行下注和全压是 最好的剥削(exploit)!
像平衡和无偏倚这样的概念在前面回合要复杂得多。在最佳扑克策略卷一中,我经常在解释每个细微的动机和尽可能保持简单的想法之间左右为难。就算没有那些不断的提醒,例外情况以及复杂性, 博弈论都已经够吓人了。所以,那本书重点关注了两极化范围 vs 被压缩的范围的动态,并且把各种牌型清楚地分类为价值牌型,抓诈唬牌型和诈唬牌型。
但是扑克游戏基本不会这么简单。在河牌圈之前,大部分牌型都或 多或少能从对手的跟注和弃牌中获利。我们一般把能从跟注中获得 最大价值的牌型称为“价值下注”,把能从弃牌中获得最大价值的 牌型称为“诈唬”,但是它们之间的界限可能会很模糊。
因为每个回合中牌面结构和牌型价值都会改变,玩家不仅要考虑牌 型当前的牌力,还要考虑在不同的牌面中这些牌型的牌力。在后面 回合用两极化范围下注的价值会让玩家有用更多不同牌型在前面回 合下注,跟注和加注的动机。
最佳扑克策略卷一提及了很多复杂的决策,卷二则是更加深入地探 讨这些决策。我们还是会用场景的形式分开讨论每个概念,但是这 些场景基本都是实际的扑克情形,而不是玩具游戏。
随着决策变得越来越复杂,人类大脑要理解解决方案的细节就会变 得越来越困难。对于简单的情形,例如翻前全压或者弃牌决策,我 们可以记住相对不可剥削策略。
但是,如果筹码量很深,而且有很 多下注机会,那我们就要依赖启发法:哪个玩家更可能会下注,为 什么?她应该采用大尺度下注,小尺度下注还是两者的混合策略?哪手牌最适合用来跟注,加注和弃牌?
这就需要去理解和平衡各个战略目标。大部分扑克玩家会把重点放 在错误的目标上:例如避免做艰难的决策,或者最大化赢得当前底 池的几率。事实上,你应该考虑的是在前面回合马上实现胜率和否 定胜率,为建立在后面回合实现(realize)胜率和否定胜率(deny equity)的范围打下基础。
最佳扑克策略的主要经验是坚果牌(nut hands)——不只是字面意义上的坚果牌,还包括强到可以用来价值下注的牌型——可以超额实现胜率,平均来说能赢到的底池份额比不下注的时候赢得的多。
相反,中等牌力的牌型不太能如期实现胜率,因为它们经常会面临 双输的命题。面对下注的时候,这些牌型要么会弃掉胜率——而且 是很高的胜率(如果你的对手在诈唬的话)——要么往不太可能胜 出的底池投更多钱。
即使是遇上过牌,中等牌力的牌型也必须在下 注的时候会遇上更强的牌型和允许更弱的牌型实现胜率这两者之间 做权衡。
最棘手的部分是“坚果牌”和“中等牌力牌型”只是相对的概念。这并不是说一对的牌型是中等牌力牌型,更强的牌型是坚果牌那么 简单。在一些情形中,第三大对子都足以用于价值下注了。而在一 些情形中,葫芦只是中等牌力牌型。
扑克的大部分技巧在于作出这些判断。本书不能使你拿到A或者在翻牌圈击中暗三的几率得到提高。但是它可以提供工具,让你可以 识别甚至创造出用更强的牌型进行薄价值下注的机会。它还会教你 如何识别和创造给对手施加压力的机会,从而否定他们的胜率,甚 至让他们把一些高胜率牌型变为中等牌力牌型。
在大型下注游戏(例如无限注德州扑克)中,前面回合在于操纵游戏往你可以用两 极化范围去下注的方向发展,同时避免你自己容易被这些下注攻击 的情形。
两极化范围 vs 被压缩的范围的动态依然是最基本的。河牌圈游戏是两极化范围 vs 被压缩的范围,而前面回合则是努力构建可盈利的河牌圈情形,同时避免不盈利的情形。
你可以把前面回合的策略当作是为后面回合的策略建立基础。当你 在翻牌圈下注或跟注,你不只是在玩当前回合;你也是在选择用什 么方法进入转牌圈。你是否在翻牌圈往底池投钱以及如何投钱都会 影响转牌圈的底池大小和对手的范围。在明确的战略目标下慎重地 作出选择可以确保你有正确的工具去充分利用下一轮的下注机会。
这就是为什么我们要使用范围构建(range construction)的比喻。你在构建一个东西,给一个队伍挑选队员,或者给工具箱挑选工 具。你的成功取决于能否预测未来的挑战和机会并用正确的技能组 合去武装这个队伍。你需要队员不仅单挑能力出色,还能相辅相 成,可以放大队友的优点,弥补彼此的不足。
要达到完美的平衡是不可能的。幸运的是,你的对手也不可能达到 完美平衡。不过,你不需要做到完美;你只要比对手好就可以了。
本书会指导你如何建立更好的范围。它会教你问出正确的问题,设立正确的目标,并且用正确的启发法去指导你的思维过程。
在深入研究范围构建之前,我们会简单回顾一下最佳扑克策略的主 要概念。如果你对平衡,可剥削性以及两极化范围和被压缩范围这 些概念还不熟悉,那我建议你先阅读卷一。即使你没有看过卷一, 你也能从这本书中获得很多有价值且可操作的信息,但如果你读过 卷一,你能从中学到更多。
本书结束的时候,你应该可以:
♠ 在前面回合做决策时把后面回合的下注考虑在内。
♠ 用杠杆原理在前面回合作出更好的诈唬决策。
♠ 权衡否定胜率的价值 vs 保持小底池的价值。
♠ 用强牌建立更大的底池。
♠ 保存边缘牌型的胜率。
♠ 作出更多微妙的连续下注决策。
♠ 知道什么时候可以划分你的范围,以及如何划分。
♠ 即时构建合理的平衡范围。
♠ 根据位置,底池大小和牌面结构的改变去调整策略。
♠ 在博弈论分析中加入特定的锦标赛分析。
递归假设
本书就遵循这样的模型。当我们研究假想情形的解决方案时,目的 不是去学习怎么解这个具体的情形。相反,通过把这个解决方案跟 其他研究过的解决方案做比较,我们可以更好地从整体理解游戏。
每个情形的很多细节都是相同的。除了在一个情形中,我们特意研究了在不利位置的翻前加注,其他的场景一般包括第一个位置(枪口位,或UTG)的加注者Ivan vs 大盲位置(BB)跟注者Opal。Ivan 的名字首字母是‘I’,因为他一直在有利位置。Opal的名字首字母是‘O’,因为她一直在不利位置。
使用这本书的时候你不需要做任何解算工作。我们会在需要的时候 附上解算截图,并且教你们怎么去分析。我给希望自己重现场景的 人提供了必要的细节,不过重现场景不是必选的。
从这些场景中得出的经验的应用场景比这些例子本身要多得多。这 些场景只是假设,用来帮助检验杠杆作用,位置优势和胜率实现这 些概念。事实上,我们学的很多知识甚至可以用在无限注德州扑克 以外的情形,尽管我们是从无限注德州扑克的例子中得出的结论。
下面是我们的情形中默认的起始范围和游戏参数(筹码量,允许的 下注尺度等)。如果某个情形的参数不是默认值,那么我们会在讨 论中标明。这些参数跟最佳扑克策略第四章中的面对现实!(Get Real!)场景很像,所以我们可以跟这个场景的结果做比较。
大部分例子都是假设九人桌的$1/$2无限注德州扑克现金桌。枪口位 置玩家加注到$6(3 BB),只有大盲位置玩家跟注。在翻牌圈,底池是$13(6.5 BB),玩家还有$197(98.5 BB)有效筹码量,筹码底池比(SPR)大概为15。
我努力把玩家的起始范围设置得比较简单,这样你会更容易理解它们之间的不同。我不是说UTG加注范围或者BB跟注范围就应该是这 样;我使用这些范围主要是因为它们有助于突出我们要研究的战略概念。
下面的PioSolver表格表示了玩家的默认起始范围。高亮的格子表示 的是玩家的起始范围内的牌型,玩家会用这些牌型构建接下来的过 牌,下注,跟注和加注范围。
格子右下角的 “1”表示玩家玩这手牌的频率是100%。例如,如果拿到AA,Ivan会从枪口位置100%加注。如果他的加注被跟注了,那么他起始范围内的AA就100%会出现在翻牌圈。
为了简单起见,我没有在这些起始范围中使用混合策略。如果Ivan 在枪口位置用A9s加注的频率是1/2,格子会被阴影遮住一部分,格 子右下角写着 “.5


对PioSolver熟悉的读者可能想要看到具体的参数,我会在下面复制 出来。如果这个图对你来说没什么意义,也不需要担心,你并没有 错过任何信息。

卷一的主要概念
不偏不倚(无偏倚)在博弈论中有特殊的含义。意思是玩家在两个或者多个选择之间不会偏向于某一个选择。在扑克术语中,它意味 着这些选择的期望值(Expected Value (EV))是相等的。
如果下注者的范围中价值下注和诈唬比例是正确的,那么拿着被压缩范围的玩家对于跟注和弃牌不偏不倚。这个平衡是底池赔率的函数。底池大小下注带来的赔率是2:1,所以下注范围应该是每一次诈 唬就有两次价值下注。这样的话,跟注的EV是$0,跟弃牌一样,玩 家面对下注时对这两个选择不偏不倚。
拿着被压缩范围的玩家没有动机下注。她不能期望对手弃掉更好的 牌型并用更差的牌型跟注。她的最佳策略是过牌,并在面对下注的时候用一定的频率跟注,使得对手对于诈唬不偏不倚。
这个频率也是底池赔率的函数。一个底池大小下注用一个单位冒险 去赢得一个单位,这里的“单位”指底池大小。拿着被压缩范围的 玩家必须用1/2的频率跟注以使得对手对于用这个尺度诈唬不偏不 倚。如果她这么做,那他输的几率跟胜出的频率一样大,所以诈唬 期望值是$0。因为用一手摊牌时一定不会赢的牌过牌的期望值也是$0,所以他对这些选择都不偏不倚。
如果一个玩家用最优频率诈唬,另一位玩家用最优频率跟注,就会 形成平衡,两位玩家都不能单方面提高期望值。给定对手策略的情况下,每位玩家都取得了尽可能高的期望值。如果一个玩家偏离平衡,例如用高于最佳频率的频率跟注,那么她的对手可以通过偏离平衡策略来剥削她——在这个例子中是不诈唬。
平衡不代表两位玩家都有优势;它只意味着两位玩家都在有所限制 的情况下能做到最好。事实上,比起两极化范围,被压缩范围有着 固有劣势。对于两极化范围玩家来说,下注的机会是有价值的;他可以通过下注提高期望值。因为扑克是零和游戏,这就意味着拿着被压缩范围的玩家面对下注时会损失期望值。
在这些简单的例子中,无偏倚和平衡这样的概念是最容易概念化 的,但是它们是博弈论应用于扑克的核心。如果在一个给定的情形 中你可以预料到对手的行动,那么最佳策略就是去剥削他的策略。如果你知道他在河牌圈会弃掉抓诈唬牌,那么你就要偏离平衡,去 用所有弱牌下注。
如果你不能预测(可能是因为对手很强或者你不知道他在某个特定 情形会怎么做),那么你就没什么可剥削的。你能做的就是努力使 他不偏不倚,不给他实行可盈利策略的机会。
一个尺度合适的翻牌圈连续下注会使得对手对于用很多牌型跟注和/ 或加注不偏不倚,但是期望值方程没有比较诈唬频率和底池赔率那么简单。很多因素都会影响翻牌圈决策:牌力会在后面回合提升 吗?如果可以,它能赢下额外的价值下注吗?如果不可以,它用于诈唬可能盈利吗?下一个回合对手会再次加注吗?等等。
像PioSolver这样的博弈论求解软件可以精确地把这些因素考虑进 去。而我们人脑做不到。相反,我们必须依靠启发式和其他心理捷 径去理清这些复杂的因素。
一个有用的捷径是确定目标。你下注的时候,应该很清楚要用哪手牌去呈现艰难的决策。你对手的很多决定都是无关紧要的:他肯定 不会弃掉最强的牌型,但可能会弃掉最弱的牌型。中间牌型就是你 的目标,搞清楚这些牌型有助于你选择正确的下注尺度,找出最佳 诈唬牌型,并知道你的价值价值应该多薄。
在采取剥削型策略时确定目标尤其有用。最佳扑克策略中列出了识 别和最大化利用剥削机会的步骤:

在实战中,范围通常不是严格两极化或者被压缩的。即使你更有可 能拿到坚果牌,你的对手也可能拿着强牌。遇上他的强牌的风险会 限制你超池下注和薄价值下注的能力,不过处于有利位置的信息价 值让我们可以更容易不需要为这些行动付出代价。
而加注的风险会使得事情更为复杂。严格两极化的范围不用担心被 加注。强牌可以跟注,弱牌可以弃牌,都无关紧要。薄价值下注最 害怕被加注,这样的话它们就会变成抓诈唬牌。如果弃牌,它们可 能会拱手把底池让给更弱的牌型。但是如果跟注,它们可能会遇上 更强的牌型并输掉额外的下注。
明白下注和加注的功能有助于你设定合适的目标并制定利益最大化剥削型策略。如果你知道加注主要会惩罚薄价值下注,那么你就会知道对抗不进行薄价值下注的玩家时要降低加注频率。
这是最佳扑克策略的隐含信息,也是在本续集中会继续指导我们的 信息:理解平衡策略是采取剥削型策略的关键。要找到对手的错误,你必须要先知道他的策略是什么。要找到利益最大化剥削型策略,你就要明白你自己的平衡策略是什么,要怎么去偏离平衡策略。
如何使用本书
从这些场景中学习的最好方法是慢慢解决它们。不要像读小说那样被动地 阅读这本书。要把它当成教科书;在阅读解释之前,停下来好好地思考每 个场景的细节,并且自己试着去回答问题,这样你可以获得更多信息。
这些场景大部分是独立的例子,可以单独拿出来讨论。不过,最有趣的地 方还是每个场景之间的不同,凸显了每个场景之间的不同点的重要之处。出于这个原因,尤其是在第一次阅读的时候,你应该按顺序进行阅读。
我们获得这些细节的过程比这些细节本身更重要。换句话说,玩家跟注或 者加注一个连续下注的具体频率取决于具体的情况和牌型;不要浪费你的 精力去记这些数字。相反,你要注意的是什么因素导致一个玩家提高或者 降低了加注频率,以及什么原因使得某手牌变得更适合或更不适合加注。这些知识有助于你凭感觉作出更好的决策。















评论 ( 0 )