扑克策略

扑克策略是否有一套选择能够描述玩家的行动扑克．它概述了在扑克游戏中最大化利润的计划。扑克牌策略的特点受博弈论的扑克的属性，例如不完全信息还有机会的因素。因此,混合策略，欺骗的方法，概率因素是有效的扑克策略的共同特征。

一个深思熟虑的扑克策略的精细性的例子是一手牌的决策的复杂性，这反映在需要考虑的众多因素中，如对手的数量，在桌子上的位置，对手的打法和他们对玩家自己打法的看法，以前的动作，锅大小，堆栈大小和一些其他情况，如比赛的阶段。

从长远来看，某些策略被证明是更成功的。这证明了技巧在扑克中发挥重要作用的观点是正确的，这是美国在线扑克合法性辩论的对象

2015年，有人宣布人头限制扑克(德州扑克的一种变体，对两名玩家的投注结构进行了限制)基本上得到了解决，这意味着计算出了纳什均衡的充分近似，使其成为第一个由计算机基本上解决的人类玩的不完全信息的非简单游戏。

扑克基本定理

的扑克基本定理为决定是否做出了最有利的决定制定了一个标准，该标准适用于几乎所有的考虑，只有少数例外。虽然它为大多数扑克技术提供了理论基础，但由于我们永远无法100%确定其他玩家的手牌，它最初的形式在实践中应用有限。

与其将对手放在特定的手牌上，一个更适用的方法是尝试确定针对一个范围的最佳打法——在这种情况下他可能持有的一组手牌。这种方法消除了在实践中使用扑克基本定理时产生的一些误解:

叠次手牌

你持有 $6 \ \ heartsuit heartsuit 7$ 黑板是 $8\心形套装9 \心形套装J\钻石套装T\心形套装A\钻石套装$ ．基于之前的动作，你不能对对手的牌做出任何准确的估计。你的对手带着与锅大小相等的一叠牌全部进场，你叫他下注。对手显示 $J \ heartsuit Q \ heartsuit$ ．你的判断正确吗?

虽然扑克的基本定理意味着叫牌是错误的玩法(如果你知道对手有更高的同花顺，你就会叠牌)，但在这种情况下叠一张同花顺从长远来看是没有好处的，因为在对手的范围内只有一手牌(假设有更多的手牌)能打败你。 $_ \广场$

几率

在扑克游戏中，一个玩法的盈利能力是基于风险与回报的概念。这一概念以简单的数学形式定义了各种概率及其之间的关系。概率最常见的用法是比较抽签的概率和锅的几率．

抽牌手在当前情况下没有什么价值，但可以通过未来的某些牌得到显著提高(出局)，这被称为完成一个平局。抽签几率定义为一手牌不完成抽签的概率与一手牌完成抽签的概率之比，计算方法为 $p \压裂{1 - p} {}$ ,在那里 $p$ 等于完成抽签的概率。它们通常以分数的形式表示 $\左(\frac{1}{p} - 1\右):1$ ．

冲洗画

手 $一个\ diamondsuit J \ diamondsuit$ 在董事会上 $2\俱乐部套装6\钻石套装8\钻石套装T\俱乐部套装$ 没有即时价值。然而，如果出的是菱形牌，手牌将变成同花。忽略对手可能持有的牌，下一张牌是方块的概率为 $P =\frac{9}{46}\约19.6%$ (在46张看不见的卡片中有9张钻石)。在这种情况下，抽完同花顺的概率大约是 $4.11: 1$ ．

赔率被定义为比例 $C \压裂{P} {}$ 对象的当前大小锅 $(P)$ 到电话的费用 $C$ ．

锅的几率

你要和一个下注的对手比赛 $\ 10美元$ 在一壶 $\ 20美元$ ．目前锅的大小是 $\ 30美元$ ．如果你打电话，你就得付钱 $\ 10美元$ 为了赢得 $\ 30美元$ 所以你的胜算是 $3:1$ ．

的期望值抽牌手在未来没有动作的情况下的叫牌是由抽牌概率和壶概率的关系决定的:

在没有未来动作的情况下，用抽牌手调用的期望值:

假设一个玩家手里的牌有概率 $p \ (0, 1)$ 为了完成一场平局，从而成为赢家，玩家必须叫一个大小的赌注 $b$ 赢得一壶大壶 $P$ ．调用的期望值计算为 $E = p\乘p - b\乘(1-p)$ $（$ 如果这一手牌抽完，就是赢 $P$ ，否则损失等于通话的成本 $b)。$ 看涨期权的期望值为正 $E > 0$ 当且仅当

$p \ * p - b \ * (1 - p) > 0 \ iff \压裂{1 - p} {p} < \压裂p {} {b},$

也就是说，如果开奖的概率比开奖的概率大。

用平局打电话

你持有 $9 \ \ heartsuit diamondsuit 6$ 翻牌是 $一套\钻石套装7\铲子套装8\心形套装$ ．你的对手有一堆一半的锅大小和移动全部。他碰巧把牌翻过来，露出来了 $J \ diamondsuit \ clubsuit$ ．你有合适的赔率来下注吗?

如果你把他的全部押上，你赢这把牌的概率大约是33%，或者用赔率表示，大约是2:1。如果你把他的半罐大小全部下注，你的赔率是3:1。因为你得到的赔率比中奖赔率高，所以这个看涨期权的期望值为正。 $_ \广场$

制成品手(没有明显改善机会的手)和绘图手的对峙说明了几率概念的最常见应用。有抽牌手的玩家通过比较赔率来确定是否有利可图，而有抽牌手的玩家可以调整赌注的大小来拒绝对抽牌手有利的赔率，使呼叫无利可图。

当未来的行动是可能的，一个人应该考虑更多的因素，如隐含赔率以及潜在的虚张声势。

平衡与利用

扑克策略的重要特征是利用对手的潜力和被对手利用的潜力。如果我们观察到我们的对手经常折牌，我们可以开始更频繁地虚张声势，通过利用他的玩法来增加我们的利润。然而，对手可以通过更频繁地呼叫来适应我们的新策略，从而利用我们的策略。通过增加利用对手的潜力，我们也打开了被反利用的潜力。的主要缺陷剥削的策略它们可以被反利用。更难以利用的策略被称为平衡策略．一般来说，我们建议对非观察性玩家使用剥削策略，否则选择平衡策略。

反剥削问题需要博弈论的考虑，例如使用混合策略来发展最佳虚张声势/呼叫频率：

平衡策略

考虑以下两个玩家A和B之间的简化游戏:

翻牌，转牌和河牌已经发好，玩家B有一张牌 $40 \ %$ 玩家A所有可能的手牌。

玩家B不能对玩家A的手牌得出任何结论(除了移牌)——他假设玩家A的手牌是随机的。

玩家A可以看到玩家B的手牌。

锅的大小是 $P。$

玩家A可以选择下注与赌注相等的金额或检查，而玩家B只能检查(如果玩家A检查)，折叠或呼叫(如果玩家A下注)。

如果两个玩家都检查，最好的手赢得壶;如果A下注，B叫牌，最好的那一手赢得赌注和赌注;如果A下注而B放弃，A就赢了。

既然A知道B的手牌，为了优化他的期望值，如果他的手牌胜过B的手牌，他就应该总是下注。问题是，如果A输了，他应该怎么下。玩家A可以选择以虚张声势或牵制的方式下注。考虑A只有两种选择——把所有赢牌都押下，总是虚张声势，或者在输牌时总是检查——B只有两种选择——总是检查/打牌，或者总是检查/叠牌支付矩阵它代表了这些纯策略如下:

(B，总是检查/折叠) (B，经常检查/打电话)

(A、只赌赢手) $(a: 0.6p, b: 0.4p)$ $(a: 1.2 2p, b: -0.2 2p)$

(A，总是打赌) $(a: p, b: 0)$ $(a: 0.8p, b: 0.2p)$

收益计算如下:

对于策略对 $（$ (A，只赌赢手牌)和(B，总是检查/叠牌) $)：$ 如果A赢了 $（$ 概率 $0.6),$ 他会得到这个罐子 $P$ 因为B会下注;如果A输了 $（$ 概率 $0.4),$ 动作将是对打，B将赢得奖金 $P;$ 因此收益是 $0.6便士$ 对于A和 $0.4便士$ 为B。

对于策略对 $（$ (A，只打赌赢的手牌)和(B，总是检查/打电话) $)：$ 如果A赢了 $（$ 概率 $0.6),$ 他会得到 $2 p$ (奖金加赌注)B输了 $P$ ；如果A输了 $（$ 概率 $0.4),$ 他将得到0，而B将得到 $P$ ——因此回报是 $0.6 (2 p) = 1.2便士$ 对于A和 $-0.6p + 0.4p = -0.2p$ 对于B,

其他两个策略对的收益计算方法类似。

没有一个策略对是纳什均衡:

这一对 $（$ (A，只赌赢手牌)和(B，总是检查/叠牌) $）$ 不是纳什均衡，因为如果B保持他的策略，a可以切换到策略(a，总是打赌)来增加他的收益。

这一对 $（$ (A，只打赌赢的手牌)和(B，总是检查/打电话) $）$ 不是纳什均衡，因为B可以切换策略(B，总是检查/折叠)来增加他的收益，如果a保持他的策略。

类似的推理也适用于其他两对策略。

换句话说，玩家A的每一个纯策略都可以被利用。为了保护自己不被利用，玩家A应该随机虚张声势;也就是说，他应该虚张声势，说， $b \ (0, 1)$ 他失去了双手。的价值 $b$ 那么玩家B是他的纯策略组合在一个最佳反应混合策略之间，在这种情况下，B的策略(B，总是检查/折叠)和(B，总是检查/调用)的收益应该是相同的。

如果A把他所有的赢牌都下了 $b$ B使用策略(B，总是检查/折叠)的收益是

$(1-b)\cdot 0.4 P，$

因为B总是会下注并赢得奖金 $P$ 只有当A检查时 $大(0.4 (1 b) \ cdot \$ 自从他把所有的赢牌都押上以来( $0.6$ )和他失去的手的一部分( $b \ cdot 0.4) \大)。$

使用策略(B，总是检查/调用)B的收益是

$0.6(-P) + b\cdot 0.4(2P) + (1-b) 0.4 P，$

因为B会输掉赌注 $P$ 当A下注他的赢牌时 $(0.6),$ 获得 $2 p$ 当A在虚张声势时下注 $(0.4 b \ cdot),$ 并赢得 $P$ 当手被检查时 $0.4 \大((1 b) \ cdot \大)。$

因为B在这两种策略中是无差异的，所以收益必须相等:

$(1 b) \ cdot 0.4 P = 0.6 (- P) + b \ cdot 0.4 (2 P) + (1 b) \ cdot 0.4便士。$

解 $b,$ 我们得到了 $b = 0.75,$ 所以为了保护自己不被B利用，A应该虚张声势 $75 \ %$ 他失去了双手。

类似地，如果B使用纯策略(B，总是检查/折叠)响应。(B，总是检查/呼叫)，A可以开始一直虚张声势或只赌他的赢手来最大化利润。为了防止这种情况发生，B必须使用混合策略，即调用 $在(0,1)\伽马\$ A的赌注。利用无差异原则， $\γ$ 必须让A在两种纯策略之间无差异。如果B调用 $\γ$ A的赌注，如果他只赌他的赢手，A的收益是

$0.6\cdot \gamma \ 2P + 0.6\cdot (1-\gamma) P，$

而且

$0.6\cdot \gamma \ 2P + 0.6\cdot (1-\gamma) P + 0.4\cdot \gamma (-P) + 0.4\cdot (1-\gamma) P$

如果他总是打赌。让我们得到的这些收益相等 $\gamma = \frac{1}{2}$ ，所以B应该赎回A的一半赌注。

混合策略对 $（$ (A，下注所有赢牌，以75%的输牌虚张声势)，(B，检查/呼叫A 50%的赌注) $）$ 是博弈的纳什均衡——没有玩家可以单方面改变自己的策略来利用对手。

注意:可以用这个博弈近似模拟的情况是B保持不变 $3 \ \ heartsuit clubsuit 2$ 在黑板上 $Q\心装A\心装5\心装8\心装2\俱乐部装$ 并且无法根据之前的动作对A的手牌做出任何结论。

这个例子展示了如何应用博弈论来寻找非剥削性策略。然而，在实践中，平衡策略并不一定会带来利润最大化——对手不一定会利用潜力来对抗剥削策略。

数学应用实例

条件概率在扑克游戏中经常用于获取信息。标准的例子包括计算翻牌和完成平局的概率，以及根据对手之前的动作获得关于他的范围的信息。适当应用条件概率有助于实现我们的观察，以达成正确的决定，并可以设计一个基于水平概念的欺骗性游戏常识．

你的对手在虚张声势吗?

你面临着在河上下注的决定。根据你的估计，你确定你的对手要么错过了他的牌(你估计的概率是70%)，要么有一手牌胜过你(30%)。你的手打败了没抽到的牌。假设你知道你的对手总是会以赢牌下注，并且在20%的情况下会以失败的平局来虚张声势。你的对手下注。如果这是你拥有的所有信息，你如何估计对手在虚张声势的概率?

让 $P (C)$ 而且 $P (M)$ 分别表示你对对手赢牌或错过平局概率的估计，并表示为 $P (B | C)$ 而且 $| B P (M),$ 分别是，你的对手将下注赢手或下注错过平局的概率。然后我们有 $P(c) = 0.3, P(m) = 0.7, P(b | c) = 1, P(b | m) = 0.2。$ 利用贝叶斯定理 $P(b) = P(c)P(b | c) + P(m)P(b | m)，$ 在哪里 $P (B)$ 对手下注的概率是多少 $P (M | B),$ 对手虚张声势的概率，如下:

$P (M | B) = \压裂{P (M) P (B | M)} {P (B)} = \压裂{P (M) P (B | M)} {P (C) (B | C) + P (M) P (B | M)} \约0.32。$

为了计算的实际目的，可以使用中描述的自然频率表示的版本科学和数学中的贝叶斯理论．

在对手的100手牌中，有30手牌打败了我们。对手将全部30张赢牌下注 $0.2 \ × 70 = 14$ 错过抽签的手。在他下注的44张牌中，有14张是虚张声势的。因此他虚张声势的可能性是 $\frac{14}{44} \约0.32$ ．

欺骗对手

假设你想通过作假来增加你吓唬一个敏锐的对手的机会。你假设你的对手对泄密有一些基本的了解，并认为紧张是一手好牌的表现。为了影响他的决定，你假装你的手在颤抖。你的对手注意到你的手在颤抖，并根据新的信息修改了他对你在虚张声势的可能性的估计。

在某些情况下，例如单挑与小栈，战略建议基于纳什均衡图表在实践中经常得到应用。

	(B，总是检查/折叠)	(B，经常检查/打电话)
(A、只赌赢手)	$(a: 0.6p, b: 0.4p)$	$(a: 1.2 2p, b: -0.2 2p)$
(A，总是打赌)	$(a: p, b: 0)$	$(a: 0.8p, b: 0.2p)$