扑克策略
扑克策略是描述玩家行动的一系列选择吗扑克.它概述了在扑克游戏中最大化利润的计划。扑克策略的特点受博弈论的扑克的属性,如不完全信息还有机缘因素。因此,混合策略,欺骗的方法,概率因素是有效扑克策略的共同特征。
关于精心设计的扑克策略的一个例子便是单手扑克决策的复杂性,这反映在许多需要考虑的因素中,如对手的数量,牌位,对手的游戏风格以及他们对玩家自己游戏风格的看法,之前的行动,壶的大小,叠牌的大小以及其他一些环境,如比赛的阶段。
事实证明,从长远来看,某些策略更为成功。这证明了技能在扑克游戏中扮演重要角色的观点是正确的,这是美国在线扑克合法性辩论的对象
2015年,有消息称,heads-up limit Hold'em(德州Hold'em的变体,限制两名玩家的赌博结构)基本解决了,这意味着计算出了纳什均衡的充分逼近,使其成为第一个由人类玩的不完全信息的非简单游戏,最终由计算机解决。
扑克基本定理
的扑克基本定理制定一个标准,以决定是否作出了最有利可图的决定,这适用于几乎所有的考虑,只有少数例外。尽管它为大多数扑克技巧提供了理论基础,但由于我们永远无法百分百确定其他牌手的牌局,它最初的形式在实践中应用有限。
比起将对手置于特定的手牌上,更可行的方法是尝试着去确定针对一个范围的最佳玩法—-即他在这种情况下可能持有的手牌。这种方法消除了在实践中使用扑克基本定理时产生的一些误解:
叠次好牌
你持有 黑板是 .基于之前的行动,你不能对对手的牌做出任何准确的估计。你的对手带着一堆和他的赌局大小相等的筹码全部进场,你叫他的赌注。对手显示 .你的判断正确吗?
虽然扑克的基本定理暗示,叫牌是错误的玩法(如果你知道对手有更高的同花顺,你就会叠牌),但在这种情况下叠一张同花顺从长远来看是没有好处的,因为在对手的范围内(假设有更多的手牌)只有一只手牌能打败你。
几率
在扑克比赛中,一场比赛的盈利能力是根据风险与回报的概念。这一概念以简单的数学形式体现在各种概率的定义和它们之间的关系上。odds最常见的用法是比较抽签的概率和锅的几率.
抽牌手指的是在当前情况下没有什么价值,但可以通过某些未来牌显著提高的手牌(出局),据说这是平局。抽牌概率定义为一手牌不完成抽牌的概率与一手牌完成抽牌的概率之比,计算方法为 ,在那里 等于完成抽到的概率。它们通常用分数的形式表示 .
冲洗画
手 在董事会中 没有立即的价值。然而,如果一张是菱形的牌来了,手牌将变成同花顺。下一张牌是方块的概率,忽略对手可能持有的牌,是 (46张看不见的卡片中有9张方块)。在这种情况下完成同花顺的抽奖几率大约是 .
赔率被定义为比例 的当前大小锅 打电话的费用 .
锅的几率
你和一个下注的对手比赛 在一锅 .当前锅的大小为 .如果你打电话,你就是在付钱 为了赢得 所以你的赔率是 .
的期望值抽牌手叫牌时,未来没有可能的动作是由抽牌赔率与下注赔率的关系决定的:
没有未来动作的绘图手调用的期望值:
假设一个牌手握的牌概率是 为了完成平局,从而成为获胜的手牌,玩家必须叫一个赌注的大小 为了赢得一个大罐子 .调用的期望值计算为 如果手牌完成抽牌,则获胜 ,否则损失等于通话费用 看涨期权的期望值为正 当且仅当
也就是说,如果中奖的概率在数字上大于中奖的概率。
用抽签的方式调用
你持有 失败是 .你的对手有一堆半罐大小的,然后全部移进去。他碰巧把牌翻了过来,露出了真面目 .你有合适的赔率把他全部押上吗?
如果你叫他全押,你赢这一手牌的概率大约是33%,或者用赔率表示,大约是2:1。如果你把他的半罐大小全部押在赌注里,你的赔率是3:1。因为你得到的赔率比中奖赔率高,所以看涨的期望值是正的。
制成品手(没有明显改进机会的手)和绘图手的对比说明了概率概念的最常见应用。一手抽牌的玩家通过比较赔率来决定是否押注获利,而一手抽牌的玩家可以调整赌注的大小,拒绝对一手抽牌有利的赔率,使押注无利可图。
当未来有可能采取行动时,一个人应该考虑更多的因素,例如隐含赔率还有虚张声势的可能性。
平衡和剥削
扑克策略的重要特征是利用对手的潜力和被对手利用的潜力。如果我们观察到对手过于频繁地折叠,我们就可以开始更频繁地虚张声势,通过利用他的玩法来增加我们的收益。然而,对手可以通过更频繁的呼叫来适应我们的新策略,从而利用我们的策略。通过增加利用对手的潜力,我们也打开了被对手反利用的潜力。的主要缺陷剥削的策略就是它们可以被反利用。更难以利用的策略被称为平衡策略.通常情况下,我们建议使用剥削策略去对付那些不听话的玩家,并选择平衡策略。
反剥削问题需要博弈论的考虑,例如使用混合策略来发展最优虚张声势/调用频率:
平衡策略
考虑以下两个参与人A和B之间的简化博弈:
- 出牌,转牌和河牌,玩家B有一手牌打 玩家A所有可能的手牌。
- 参与人B不能对参与人A的手牌做出任何结论(除了除牌)——他假设参与人A的手牌是随机的。
- 玩家A可以看到玩家B的牌。
- 锅的大小是
- 参与人A可以选择与下注金额相等的金额,也可以选择对赌,参与人B只能对赌(如果参与人A对赌)、叠牌或叫牌(如果参与人A下注)。
- 如果两个玩家都检查,最好的手赢得壶;如果A下注,B叫,最好的手赢得赌注和所有赌注;如果A下注,B叠牌,A赢。
既然A知道B的手牌,为了优化他的期望值,他应该一直下注如果他的手牌打败了B的手牌。问题是确定如果A输了他应该怎么打。玩家A可以选择以虚张声势或支票的方式下注。考虑A只有两种选择——把所有赢的手牌都押上,总是虚张声势,或在输的手牌时总是检查——B只有两种选择——总是检查/叫牌,或总是检查/叠牌支付矩阵代表这些纯策略如下:
(B,检查/褶皱总是) (B,检查/调用总是) (一、赌只赢手) (一个赌注总是) 收益计算如下:
对于策略对 (A,只赌赢牌)和(B,总是对子/叠牌) 如果A赢了 概率 他将得到罐子 因为B会对一个赌局认输;如果A输了 概率 行动将是检查,B将赢得奖金 因此收益是 一个和 为B。
对于策略对 (A,只赌赢的手)和(B,总是核对/打电话) 如果A赢了 概率 他将得到 (钱加赌注)B输 ;如果A输了 概率 他得到0,B得到 ——因此回报是 一个和 对于B,
另外两个策略对的收益计算方法类似。
没有一个策略对是纳什均衡:
这一对 (A,只赌赢牌)和(B,总是对子/叠牌) 不是纳什均衡,因为如果B保持策略,a可以切换策略(a,一直下注)来增加他的收益。
这一对 (A,只赌赢的手)和(B,总是核对/打电话) 不是纳什均衡,因为如果a保持自己的策略,B可以切换到策略(B,检查/总是折叠)来增加他的收益。
类似的推理也适用于其他两对策略。
换句话说,玩家A的每一个纯策略都可以被利用。为了保护自己不被利用,玩家A应该随机地虚张声势;也就是说,他应该虚张声势地说, 他失去的双手。的价值 那么参与人B是他将纯策略组合成最佳对策混合策略,在这种情况下,B应该具有相同的策略(B,总是检查/折叠)和(B,总是检查/调用)的收益。
如果A把他所有的赢牌都下了注 如果他的手牌输了,那么B使用策略(B,总是对子/叠)的收益是
因为B总是会下注并赢得奖金 只有当A检查 自从他把所有获胜的手都押上之后( )和部分失去的双手(
使用策略(B,检查/呼叫)B的收益是
因为B赌输了 当A下了赢牌时 获得 当A把赌注当作虚张声势时 并赢得 当检查手牌时
由于B在这两种策略之间必须是无关的,因此收益必须相等:
解 我们得到了 所以为了保护自己不被B利用,A应该虚张声势 他失去的双手。
类似地,如果B使用纯策略(B,检查/总是折叠)。(B,检查/呼叫总是),A可以开始一直虚张声势,或只赌他赢的手,以最大化利润。为了防止这种情况发生,B必须使用混合策略,即调用 的一个赌注。利用无差异原理, 必须让A对他的两个纯策略无动于衷。如果B调用 如果A只赌赢一手,那么A的收益是
而且
如果他总是下注。让我们得到的收益相等 ,所以B应该对A的一半下注。
混合策略对 (A,下注所有的赢牌,以75%的输牌虚张声势),(B,检查/叫牌50%的A的赌注) 是博弈的纳什均衡——任何玩家都不能单方面改变自己的策略来利用对手。
注意:这个博弈可以近似模拟的情况是B保持不变 在黑板上 不能根据之前的行动对A的手牌做出任何结论。
这个例子展示了如何应用博弈论来寻找非剥削性策略。然而,平衡的策略并不一定会在实践中导致利润最大化——对手不一定会使用潜力来反利用剥削策略。
数学应用实例
条件概率在扑克游戏中经常被用来获取信息。标准的例子包括计算与翻牌和完全平局相联系的概率,以及根据对手之前的行动获得关于其范围的信息。适当应用条件概率有助于实现我们的观察,以达成正确的决策,并可以设计一个欺骗性的玩法,基于的水平的概念常识.
你的对手在虚张声势吗?
你要做的决定是在河上下注。根据你的估计,你确定你的对手要么输掉了他的牌(你估计的概率是70%),要么赢了你的牌(30%)。你的手牌比没有抽到的好。假设你知道你的对手总是会赌赢一手,并且会在20%的情况下以输掉平局来虚张声势。你的对手下注。如果这是你所有的信息,你怎么估计你的对手在虚张声势的概率呢?
让 而且 分别表示你对对手赢牌或错过抽牌的概率的估计,并表示 而且 分别是你的对手将会赢一手或输掉平局的概率。然后我们有 使用贝叶斯定理 在哪里 我们发现对手下注的概率是多少 对手虚张声势的概率为:
为了计算的实际目的,可以使用在科学和数学中的贝叶斯理论.
在对手的100只手牌中,有30只手牌击败了我们。对手将下注所有30只获胜的手牌 没有抽到的手。在他的44手牌中,有14手是虚张声势的。因此他虚张声势的概率是 .
欺骗对方
假设你想通过假装告密来增加你唬住观察敏锐的对手的机会。你假设你的对手有一些基本的泄密知识,并认为紧张是一个强大的手牌的迹象。为了影响他的决定,你假装你的手在发抖。你的对手注意到你的手在颤抖,并根据新的信息修改了他对你在虚张声势概率的估计。