扑克策略是一组描述玩家在扑克中的行为的选择。它概述了在扑克游戏中最大化利润的计划。扑克策略的特点受扑克的博弈论性质的影响,例如不完全信息和机会因素。因此,混合策略、欺骗方法和概率考虑是有效扑克策略的共同特征。
一个深思熟虑的扑克策略的复杂性的一个例子是单手牌决策的复杂性,这反映在要考虑的众多因素中,例如对手的数量,在桌上的位置,对手的打法以及他们对玩家自己打法的看法、之前的行动、底池大小、筹码量以及其他一些情况,如锦标赛的阶段。
从长远来看,某些策略被证明更为成功。这证明了技能在扑克中起着重要作用的观点是正确的,这也是美国在线扑克合法性争论的对象。
2015 年宣布,单挑限制德州扑克(德州扑克的一种变体,对两名玩家的下注结构有限制)已基本解决,这意味着计算了一个足够近似的纳什均衡,使得这是人类玩的第一个不平凡的不完全信息游戏,基本上由计算机解决。
扑克基本定理
扑克的基本定理制定了一个标准,用于确定是否做出了最有利可图的决定,该标准适用于几乎所有考虑因素,只有少数例外。尽管它为大多数扑克技术提供了理论基础,但由于我们永远无法 100% 确定地了解其他玩家的手牌,因此其原始形式在实践中的应用有限。
与其将对手放在特定的牌上,更适用的方法是尝试确定对抗范围的最佳打法——在这种情况下他可能持有的一组牌。这种方法消除了在实践中使用扑克基本定理时出现的一些误解:
例如,弃牌次优手
你拿着 6♡7♡ 6\heartsuit 7\heartsuit 6♡7♡ 棋盘是 8♡9♡J♢T♡A♢ 8\heartsuit 9 \heartsuit J\diamondsuit T\heartsuit A\diamondsuit 8♡9♡J ♢T♡A♢。根据之前的行动,你无法对对手的牌做出任何准确的估计。你的对手用与底池大小相等的筹码全押,你跟注他的下注。对手显示 J♡Q♡ J\heartsuit Q\heartsuitJ♡Q♡。你的call正确吗?
虽然扑克的基本定理暗示跟注是错误的打法(如果你知道对手有更高的同花顺,你就会弃牌),但在这种情况下弃掉同花顺从长远来看是无利可图的,因为对手范围内只有一只手(假定包含更多手)击败你的
赔率
扑克游戏的盈利能力取决于风险与回报的概念。这个概念在各种赔率的定义和它们之间的关系中采用简单的数学形式。赔率最常见的用途是比较平局赔率和底池赔率。
抽牌是指在当前情况下价值不大但可以通过某些未来的牌(出牌)显着改善的牌,据说这些牌可以完成抽牌。平局几率定义为一手牌无法完成平局的概率与一手牌完成平局的概率之比,计算方式为 1−pp\frac{1-p}{p}p1−p,其中ppp 等于完成抽签的概率。它们通常以分数的形式表示 (1p−1):1\left(\frac{1}{p} – 1\right):1(p1−1):1。
同花顺抽奖
2♣6♢8♢T♣2\clubsuit 6\diamondsuit 8\diamondsuit T\clubsuit 2♣6♢8♢T♣板上的手A♢J♢A\diamondsuit J\diamondsuit A♢J♢没有即时价值。但是,如果出现一张钻石牌,手牌就会变成同花。下一张牌是方块的概率,忽略对手可能持有的牌,p=946≈19.6%p=\frac{9}{46}\大约 19.6\% p=469≈19.6%(有 9 46 张看不见的卡片中的钻石)。在这种情况下完成同花的抽签几率约为 4.11:14.11:14.11:1。
底池赔率定义为当前底池大小 (P)(P)(P) 与跟注 CCC 成本的比率 PC\frac{P}{C}CP。
底池赔率
您正在与一个在 $20\$20$20 的底池中下注 $10\$10$10 的对手比赛。当前底池大小为 $30\$30$30。如果您跟注,您将支付 $10\$10$10 来赢得 $30\$30$30,因此您的底池赔率是 3:13:13:1。
在未来不可能采取任何行动的情况下,用听牌跟注的预期值由听牌赔率与底池赔率的关系决定:
没有未来行动的听牌的预期值:
假设玩家拿着一手有概率 p∈(0,1)p\in (0,1) p∈(0,1) 完成平局的手,因此成为获胜手,玩家必须跟注一个大小为 bbb 的下注赢得一个大小为 PPP 的底池。调用的期望值计算为 E=p×P−b×(1−p)E = p\times P – b\times (1-p)E=p×P−b×(1−p) ((((如果这手牌完成平局,则赢是 PPP,否则损失等于跟注的成本 b).b).b)。调用具有正期望值 E>0E>0E>0 当且仅当
p×P−b×(1−p)>0 ⟺ 1−pp<Pb, p\times P – b\times (1-p)>0 \iff \frac{1-p}{p} < \frac {P}{b}, p×P−b×(1−p)>0⟺p1−p<bP,
也就是说,如果底池赔率在数值上大于开奖赔率。
用平局打.
你拿着 9♢6♡9\diamondsuit 6\heartsuit 9♢6♡,翻牌是 A♢7♠8♡A\diamondsuit 7\spadesuit 8\heartsuitA♢7♠8♡。你的对手有一半的底池筹码并全押。他巧合地把牌翻了过来,露出 J♢J♣J\diamondsuit J\clubsuitJ♢J♣。你有合适的底池赔率来跟注他的全压吗?
如果你跟注他的全押,你赢得这手牌的概率大约是 33%,或者用赔率表示,大约是 2:1。如果你跟注他的半个底池大小,你的底池赔率是 3:1。因为你得到的底池赔率比获胜赔率更好,所以跟注有一个正的期望值。 □_\方□
成手(没有显着提升机会的手)和听牌的对抗说明了赔率概念的最常见应用。持有一手牌的玩家比较赔率以确定跟注是否有利可图,而持有一手牌的玩家可以调整赌注的大小以拒绝对一手有利的赔率,从而使跟注无利可图。
当未来可能采取行动时,应该考虑更多因素,例如潜在赔率和诈唬的可能性。
平衡与剥削
扑克策略的重要特征是其利用对手的潜力和被利用的潜力。如果我们观察到对手频繁弃牌,我们可以开始更频繁地诈唬,以利用他的打法增加我们的利润。然而,对手可以通过更频繁地跟注来适应我们的新策略,从而利用我们的策略。通过增加利用对手的潜力,我们打开了被反利用的潜力。剥削策略的主要缺陷是它们可以被反剥削。更难利用的策略被称为平衡策略。一般来说,建议对不善于观察的玩家使用剥削策略,否则选择平衡的策略。
反剥削问题需要博弈论考虑,例如使用混合策略来开发最佳的诈唬/跟注频率:
平衡策略
考虑以下两个玩家 A 和 B 之间的简化游戏:
翻牌、转牌和河牌发牌,玩家 B 的手牌击败玩家 A 可能拥有的所有可能手牌的 40%40 \% 40%。
玩家 B 无法对玩家 A 的手牌得出任何结论(除了移除牌)——他假设玩家 A 有一手随机牌。
玩家 A 可以看到玩家 B 的手牌。
底池大小为 P.P.P。
玩家 A 可以选择下注等于底池的金额或过牌,玩家 B 只能过牌(如果玩家 A 过牌)、弃牌或跟注(如果玩家 A 下注)。
如果双方都过牌,最好的手牌赢得底池;如果 A 下注,B 跟注,最好的手赢得底池加下注;如果 A 下注而 B 弃牌,则 A 赢得底池。
既然 A 知道 B 的手,为了优化他的期望值,他应该总是在他的牌击败 B 的手时下注。问题是确定如果 A 有一手失败的牌应该怎么玩。玩家 A 可以选择诈唬或过牌下注。只考虑 A 的两个选项——下注所有获胜的牌并总是虚张声势或在输了手时总是过牌——而 B 只考虑两个选项——总是过牌/跟注或过牌/弃牌——代表这些纯策略的收益矩阵如下:
如下:
(B, 总是过牌/弃牌) (B, 总是过牌/跟注)
(A, 只下注获胜手) (A:0.6P,B:0.4P) (A: 0.6P, B: 0.4P )(A:0.6P,B:0.4P) (A:1.2P,B:− 0.2P)(A: 1.2P, B: -0.2P) (A:1.2P,B:−0.2P)
(A, 总是下注) (A:P,B:0) (A: P, B: 0)(A:P,B:0) (A:0.8P,B:0.2P) (A: 0.8P, B: 0.2P)(A:0.8P,B:0.2P)
收益计算如下:对于策略对 ((((A, 只下注获胜手) 和 (B, 总是过牌/弃牌)):):):如果 A 有获胜手 (((概率 0.6),0.6),0.6),他将获得底池 PPP,因为 B 将弃牌;如果 A 有一手失败的牌 (((probability 0.4),0.4),0.4),则行动将是 check-check,B 将赢得底池 P; P;P;因此,A 的收益为 0.6P0.6P0.6P,B 的收益为 0.4P0.4P0.4P。
对于策略对 ((((A, 只下注获胜手) 和 (B, 总是过牌/跟注)):):):如果 A 有获胜手 (((概率 0.6),0.6),0.6),他将获得 2P2P2P(底池加下注),B 将失去 PPP;如果 A 有一手失败的手 (((概率 0.4),0.4),0.4),他将得到 0,B 将得到 PPP——因此收益为 0.6(2P)=1.2P0.6(2P)=1.2P0。 6(2P)=1.2P 对于 A 和 -0.6P+0.4P=-0.2P-0.6P + 0.4P = -0.2P-0.6P+0.4P=-0.2P 对于 B,
其他两个策略对的收益计算类似。
没有一个策略对是纳什均衡:
对子 ((((A, 只下注获胜手) 和 (B, 总是过牌/弃牌)))) 不是纳什均衡,因为如果 B 保持,A 可以切换到策略 (A, 总是下注) 以增加他的收益他的策略。
对子 ((((A, 只下注获胜手) 和 (B, 总是过牌/跟注)))) 不是纳什均衡,因为 B 可以切换到策略 (B, 总是过牌/弃牌) 以增加他的收益,如果A 保持他的策略。
类似的推理适用于其他两对策略。
换句话说,每个玩家 A 的纯策略都可以被利用。为了保护自己不被利用,玩家 A 应该随机地虚张声势;也就是说,他应该用 b∈(0,1)b\in (0,1)b∈(0,1) 来虚张声势。选择 bbb 的值是为了让玩家 B 在最佳响应混合策略中组合的纯策略之间无动于衷,在这种情况下,B 应该与策略(B,check/fold always)和(B,check/总是Call)。
如果 A 下注他所有的赢手和他输的 bbb,则 B 使用该策略(B,总是过牌/弃牌)的收益为
(1−b)⋅0.4P, (1-b)\cdot 0.4 P, (1−b)⋅0.4P,
因为 B 总是对一个下注弃牌,只有当 A 过牌 ((1−b)⋅0.4\big((1-b)\cdot 0.4((1−b)⋅0.4 次,因为他下注所有他的获胜手牌 (0.60.60.6) 和部分失败的手牌 (b⋅0.4)).b\cdot 0.4)\big).b⋅0.4))。
使用策略(B,总是过牌/跟注)B 的收益是
0.6(−P)+b⋅0.4(2P)+(1−b)0.4P, 0.6(-P) + b\cdot 0.4(2P) + (1-b) 0.4 P, 0.6(−P)+b ⋅0.4(2P)+(1−b)0.4P,
因为当 A 下注他的获胜手 (0.6),(0.6),(0.6) 时 B 将输掉一个下注 PPP,当 A 下注时获得 2P2P2P 虚张声势 (b⋅0.4),(b\cdot 0.4),(b⋅0.4 ),并在过牌时赢得 PPP ((1−b)⋅0.4).\big((1-b)\cdot 0.4\big).((1−b)⋅0.4)。
由于 B 必须在这两种策略之间无差异,因此收益必须相等:
(1−b)⋅0.4P=0.6(−P)+b⋅0.4(2P)+(1−b)⋅0.4P。
求解 b,b,b,我们得到 b=0.75,b=0.75,b=0.75,所以为了保护自己不被 B 剥削,A 应该用 75%75 \%75% 的失手牌诈唬。
类似地,如果 B 使用纯策略(B,总是检查/弃牌)resp。 (B,总是过牌/跟注),A 可以一直开始虚张声势,或者只下注他的获胜手牌以最大化利润。为了防止这种情况发生,B 不得不使用混合策略,即调用 A 的赌注的 γ∈(0,1)\gamma\in (0,1)γ∈(0,1)。使用无差异原则,必须选择 γ\gammaγ 以使 A 在他的两个纯策略之间无差异。如果 B 跟注 A 的赌注的 γ\gammaγ,如果他只下注他的获胜手牌,A 的收益是
0.6⋅γ 2P+0.6⋅(1−γ)P, 0.6\cdot \gamma \ 2P + 0.6\cdot (1-\gamma) P,0.6⋅γ 2P+0.6⋅(1−γ)P,
和
0.6⋅γ 2P+0.6⋅(1−γ)P+0.4⋅γ(−P)+0.4⋅(1−γ)P 0.6\cdot \gamma \ 2P + 0.6\cdot (1-\gamma) P + 0.4 \cdot \gamma (-P) + 0.4\cdot (1-\gamma) P 0.6⋅γ 2P+0.6⋅(1−γ)P+0.4⋅γ(−P)+0.4⋅(1−γ)P
如果他总是下注。将这些收益相等,我们得到 γ=12\gamma = \frac{1}{2}γ=21,因此 B 应该跟注 A 的一半。混合策略对((((A,用 75% 的失败手下注所有获胜手牌和 75% 的失败手牌),(B,过牌/跟注 A 的 50% 下注)))是博弈的纳什均衡——没有玩家可以单方面改变自己的策略来利用对手。
注意:这个游戏可以近似模拟的情况是 B 持有 3♣2♡3\clubsuit 2\heartsuit3♣2♡ Q♡A♠5♠8♠2♣Q\heartsuit A\spadesuit 5 \spadesuit 8\spadesuit 2\clubsuitQ♡A♠5♠8♠2♣ 并且不能根据之前的行动得出任何关于A的手的结论。
该示例展示了如何应用博弈论来寻找非剥削性策略。然而,平衡策略并不一定会在实践中实现利润最大化——对手不一定会利用潜力来反击剥削策略。
数学应用实例
条件概率经常被用于在扑克中获取信息。标准示例包括计算与翻牌和完成听牌相关的概率,以及根据对手之前的行动获取有关对手范围的信息。条件概率的正确应用有助于实施我们的观察以做出正确的决定,并且可以用于设计基于常识水平概念的欺骗性游戏。
你的对手在虚张声势吗?
您面临在河牌圈跟注的决定。根据您的估计,您可以确定您的对手要么错过了他的听牌(您估计其概率为 70%),要么有一手击败了您的牌(30%)。你的手击败了错过的平局。假设你知道你的对手总是会下注赢的手,并且会在 20% 的情况下用错过的听牌来诈唬。你的对手下注。如果这就是你掌握的所有信息,你如何估计对手诈唬的概率?
令 P(C)P(C)P(C) 和 P(M)P(M)P(M) 分别表示您对对手获胜或错过平局的概率的估计,并表示由 P(B∣C)P(B|C)P(B∣C) 和 P(B∣M),P(B|M),P(B∣M) 分别表示对手下注的概率赢一手或下注错过的平局。那么我们有 P(C)=0.3,P(M)=0.7,P(B∣C)=1,P(B∣M)=0.2.P(C) = 0.3, P(M) = 0.7, P (B|C) = 1, P(B|M) = 0.2.P(C)=0.3,P(M)=0.7,P(B∣C)=1,P(B∣M)=0.2。使用贝叶斯定理和 P(B)=P(C)P(B∣C)+P(M)P(B∣M),P(B) = P(C)P(B|C) + P(M )P(B|M),P(B)=P(C)P(B∣C)+P(M)P(B∣M),其中 P(B)P(B)P(B) 是对手下注的概率,我们求P(M∣B),P(M|B),P(M∣B),即对手诈唬的概率,如下:
P(M∣B)=P(M)P(B∣M)P(B)=P(M)P(B∣M)P(C)P(B∣C)+P(M)P(B ∣M)≈0.32。 P(M|B) = \frac{P(M)P(B|M)}{P(B)} = \frac{P(M)P(B|M)}{P(C)P(B |C) + P(M)P(B|M)} \约 0.32。 P(M∣B)=P(B)P(M)P(B∣M)=P(C)P(B∣C)+P(M)P(B∣M)P(M)P( B∣M)≈0.32。
出于计算的实际目的,可以使用科学和数学中的贝叶斯理论中描述的自然频率表示形式。
在对手可能持有的 100 手牌中,有 30 手牌击败了我们的手。对手将下注所有 30 手获胜的手牌,0.2×70=14 0.2 \times 70 = 14 0.2×70=14 手未平局。在他下注的 44 手牌中,有 14 手牌是诈唬牌。因此他诈唬的概率是 1444≈0.32\frac{14}{44}\大约 0.324414≈0.32。
例如,欺骗对手
假设你想通过伪装告诉来增加你对观察敏锐的对手进行诈唬的机会。你假设你的对手有一些关于告诉的基本知识,并认为紧张是一手强牌的标志。为了影响他的决定,你假装你的手在颤抖。你的对手注意到你的手在颤抖,并根据新信息修改他对你诈唬概率的估计。
在某些情况下,例如小筹码的单挑,基于纳什均衡图的战略建议经常在实践中应用。
通过翻牌后游戏改善您的扑克游戏
四分之一到半盲
每手牌中第一个行动的玩家以小盲注和大盲注开始行动。大盲注相当于小注,由玩家下注到庄家按钮的左侧。盲注总是相对于正在玩的特定类型游戏的下注限制。在无限注德州扑克中,投注规则很简单。如果玩家没有一手好牌,则行动从大盲注左侧的第一个玩家开始。这个播放器被称为按钮。
当按钮围绕桌子旋转时,每个玩家都有机会下注、加注或弃牌。在有足够多的玩家参与第一轮投注后,庄家将移除分隔内外投注的塑料材料。这个障碍允许玩家用手下注并阅读其他玩家。
庄家按钮还可以帮助玩家下注。下注回合结束后,三张公共牌面朝上摊开,让玩家更好地了解自己的相对手牌强度。这三张牌称为翻牌。第二轮投注紧随其后。当翻牌圈下注结束时,另一张牌被庄家烧掉。这样做是为了防止作弊或二次交易。
第三张也是最后一张公共牌称为转牌。刻录卡重新回到桌面上,游戏按照与以前类似的格式进行。最后一轮下注,玩家必须出示他们的手,包括底牌。拥有最好牌或牌组合最高的玩家赢得游戏。
盲注会在每场新游戏开始时发布。在 5 美元/10 美元的盲注级别,第一个赌注是 5 美元,第二个赌注是 10 美元。在 10 美元/20 美元的水平上,第一个赌注是 10 美元,第二个赌注是 20 美元。
翻牌
庄家将烧掉桌子中间的第四张牌,称为翻牌。翻牌由三张面朝上的牌组成。卡片排列在垂直列中,并被方格旗包围。前三张公共牌面朝上放在桌子中央。
转弯
庄家将在桌子中间烧掉另一张第四张牌,并将第四张正面朝上的牌放在桌子中央。第四张牌也称为转牌。转牌之后是第二轮下注。
河流 River
庄家将烧掉第 5 张牌,并将最后一张正面朝上的牌放在桌子中央。接下来是最后一轮投注。下注后,所有玩家都必须举手。手牌最好的玩家赢得游戏。
第二次机会抽奖
因为最后一张牌总是面朝上打出,所以手牌最低的玩家(如有必要,倒数第二)可以选择在底池中出手。如果玩家决定跟注,则将牌洗牌,放置在桌子中央的牌一次翻一张,然后选择最好的手牌。
因为最后一张牌总是面朝上打出,所以玩家可以在数牌期间选择过牌、下注、加注或弃牌。
数牌
计数过程如下:
假设最好的手是黑桃 6 和黑桃 4。请记住,我们是在数牌中的牌,而不是单张牌。这意味着 A 算作 1 或 11,中间的牌算作 10。
如果牌面朝下,您必须按原样计算它们,包括三点和十一点。
面朝上发牌比面朝下发牌容易。
算牌的工作原理
该过程从跟踪低牌与高牌的比率开始。每个算牌级别都要求玩家将赌注增加两倍。第一个玩家,第一个玩家,有 0% 的优势。第二个玩家,第二个玩家有1%的优势。
第一次下注,(0-1%),第二名玩家的筹码是第二名玩家的两倍。第二次下注(1-2%),第二次下注的费用是第一次下注的三倍。
随着第二位玩家继续下注,第二位玩家很可能会输。在某些时候,他将别无选择,只能弃牌。
第 3 级(2-3%)是玩家拥有近 10% 优势的时间。