K-level思考

K-level思考指的是一类逻辑问题，其中所有参与者都是完全理性的，具有无限的智力。换句话说，所有参与者都能够完美地推理他们的处境，并且知道其他人都有同样的能力。没有进一步的限定，术语“逻辑难题”或“逻辑问题”通常指的是这种情况。

k级思维在分析纳什均衡游戏和情境。

但这很简单。我所要做的就是根据我对你的了解来推测一下:你是那种会把毒药放进自己或敌人的酒杯里的人吗?现在，一个聪明的人会把毒药放进自己的酒杯里，因为他知道只有大傻瓜才会伸手去拿给他的东西。我不是大傻瓜，所以我可以明明不选你面前的酒。但你一定知道我不是一个大傻瓜，你会指望它，所以我显然不能选择我面前的酒。——维兹尼《公主新娘》(1987)

正式的定义

定义了k级思维递归地，以非理性的水平- $0$ 为特定情境而设计的玩家(通常是演员)均匀随机)，以及一个水平- $k$ 玩家(或深度 $k$ 玩家)基于所有其他参与者都处于同等水平的假设而采取行动 $(k - 1)$ 思想家。例如，一个二级玩家认为其他人都是一级玩家，而一级玩家又认为其他人都是随机的。

无限智能被定义为具有无限的深度，在k级思维问题中，所有参与者都具有无限的深度是常识。

例子

设想一个游戏，参与者在0到100之间选择一个数字，目标是猜得越接近越好 $\压裂{2}{3}$ 尽可能取平均值。例如，如果5个玩家选择56 66 39 60 47， $\压裂{2}{3}$ 平均值是 $35.7 \眉题{3}$ ，第三个玩家获胜。

在这种情况下，0级玩家会像往常一样随机选择。1级玩家会假设其他所有玩家都是0级，所以他们会猜测平均值在50左右，从而做出选择 $33。\眉题{3}$ 因为他们的数量。2级玩家会假设其他玩家都是1级玩家，他们会做出选择 $33。\眉题{3}$ ，所以他们选择 $22。\眉题{2}$ 因为他们的数量。三级玩家选择对二级玩家的最佳对策，依此类推，每一级的最佳猜测都在减少。因此，当假设有完全理性的常识时，最优猜测(与直觉相反)为零。

另一个例子是关于一个双人游戏，其中有两堆硬币，最初分别包含4个硬币和1个硬币。在游戏的每一个回合中，玩家可以选择取较大的一堆硬币来结束游戏，或者把每一堆硬币的数量增加一倍。如果玩家都没有选择结束游戏，游戏也会在固定的回合数后结束。

在这种情况下，0级玩家总是选择将牌堆加倍。1级玩家会假设他的对手是0级玩家，因此除了最后一个回合之外，他会选择在每个回合都将牌堆翻倍。2级玩家会选择在除了倒数第二个回合之外的每个回合都将钱币翻倍，因为他知道如果他在该回合将钱币翻倍，他的1级对手就会选择结束游戏，从而导致2级玩家获得更少的钱币。再一次地，这是一种归纳性的继续，所以一个无限聪明的玩家会选择在第一个回合就结束游戏。

逆向归纳法

上面的两个例子都说明了背后的想法逆向归纳法，这是通过逆向工作来确定最优开始行动的过程:通过确定游戏最后一个可能点的最优行动，可以确定游戏倒数第二个可能点的最优行动，以此类推，直到发现开始时间的最佳玩法。

逆向归纳法的主要优势在于，所有玩家都拥有完美的理性，所以游戏可以通过确定任何玩家的最佳行动而不断简化。例如，在上面的加倍游戏中，在分析的每一步中，可能的回合数都有效地减少了，因为玩家会选择在最后几个可能的回合中结束游戏(因此，在任何时候)。

海盗游戏:

三个海盗发现了100枚金币，他们必须决定如何分配这些宝藏。他们决定由年龄最大的海盗提出分配方案，所有海盗(包括提议者)将投票决定是否接受分配方案，还是将提议者扔到海里，在这种情况下，年龄次之的海盗将提出分配方案，继续游戏。领带产生一个可接受的分布。

假设所有海盗都是完全理性的、极其贪婪的、嗜血的(所以他们会投票把提议者扔到海里，除非他们能赚到更多的硬币)，最老的海盗能赚多少硬币?

假设游戏只剩下两个最年轻的海盗。显然，年长的人会提议给自己“分配”100枚硬币;因为领带是给提议者的，所以这个分配是保证被接受的。

因此，提议者知道最年轻的海盗会投票给任何他能得到硬币的分配，因为如果他投反对票，他就不会得到硬币。所以，最老的海盗可以给最年轻的海盗一枚硬币，赢得2比1的投票，从而为自己赢得99个硬币。

这是海盗游戏的扩展:

战略主导地位

另一种类型的分析是战略主导地位在该理论中，严格来说比另一种更糟糕的策略被视为可能的行动而抛弃，直到只剩下“合理的”策略。例如，分析“2/3平均值”游戏的另一种方法是:在 $66年。\眉题{6}$ 而100则完全由其他猜测决定，因为最终平均值的2/3不可能这么大。这有效地将最大可能的猜测减少到 $66年。\眉题{6}$ ．然后，按照同样的逻辑，在 $44。\眉题{4}$ 而且 $66年。\眉题{6}$ 完全取决于其他的猜测。这种逻辑继续下去，所以0严格优于其他任何猜测，因此是最佳玩法。

同样的原则也适用于从额外的证据中进行推论，即行为者在整个场景过程中从他们得到的信息中排除不可能的起始情况。

囚犯和帽子:

一个监狱长召集三个囚犯，让他们排成一排，蒙住他们的眼睛。他说:“我有两顶黑帽子和三顶白帽子，我要给你们每人戴上一顶。如果你们谁能猜出自己帽子的颜色，就都可以自由了。但如果你猜错了，你就会被处死。如果你不猜，什么也不会发生。”

典狱长取下后面犯人的眼罩，他可以看到前面两个犯人的帽子。他说:“我不知道我帽子的颜色。”

监狱长取下了第二个囚犯的眼罩，他只能看到前面那个囚犯的帽子。他说:“我不知道我帽子的颜色。”

最后，监狱长取下了最后一个囚犯的眼罩，他说:“我知道我帽子的颜色。”它是什么颜色的?囚犯是怎么知道的?

他戴着一顶白帽子。

后面的囚犯不知道自己帽子的颜色，所以另外两个囚犯都知道自己戴的不是黑帽子(否则，后面的囚犯就会知道自己的帽子是白的)。如果第二个囚犯看到前面的囚犯戴着一顶黑帽子，他就可以说他的帽子是白色的，因为他已经知道他们不是都戴着黑帽子。但是第二个囚犯不知道他帽子的颜色，所以他一定看到前面的囚犯戴着一顶白色的帽子。第一个囚犯就知道他戴着一顶白帽子。

人口普查问题:

一名人口普查人员到达一位逻辑学家的家。

人口普查员:“你有几个孩子，他们多大了?”
逻辑学家:“我有3个孩子。他们年龄的乘积是36岁。”
C:“什么?你就不能告诉我他们的年龄吗?”
L:“他们的年龄和我的门牌号一样。”
C:“那真的帮不了我。”
L:“我的大儿子正在学小提琴。”
C:“啊，我明白了。祝你今天过得愉快!”

这三个孩子的年龄是多少?

孩子们的年龄分别是2岁、2岁和9岁。

因为在被告知孩子们年龄的总和后，人口普查人员没有足够的信息，所以这个总和和产品36必须有不止一个三倍的数字。我们可以列出这些可能性:

年龄总和年龄总和

1,1,36 38 1 6 6 13

1 2 18 21 2 2 9 13

1 3 12 16 2 3 6 11

1 4 9 14 3 3 4 10

因此，逻辑学家的门牌号必须是13，因为任何其他数字都可以让人口普查人员计算出他们的年龄。

最后一条信息，最大的孩子正在学习小提琴，告诉人口调查员是年龄最大的孩子，因此排除了孩子分别为1岁、6岁和6岁的可能性。唯一的可能是孩子们的年龄分别是2岁、2岁和9岁。

实际应用

在经典原则下，假设所有参与者都拥有常识完全理性，意味着每个玩家都知道其他玩家是完全理性的(他们也知道其他玩家也知道其他玩家是理性的，等等)。然而，在实际环境中通常不是这样，因为在实际游戏中很少出现平衡。

事实上，完全理性的行为人通常处于缺点因为他们高估了其他球员的深度。例如，在前一节中描述的“平均值的2/3”博弈中，经典原则表明，完全理性的智能体会选择数字0。然而，实际中奖数字通常要高得多。例如，在一场有19000多名参与者参加的竞赛中，21.6是获胜的答案，这略低于二级思考者会选择的数字。有趣的是，尽管0级思维通常被认为只存在于更高深度策略的计算中，但该实验中出现了接近100次的猜测(尽管获胜者肯定是最多的) $\frac{2}{3} \cdot 100=66.\overline{6}$ 这表明一些玩家表现出了0级思维。

类似地，在硬币游戏中，经典的原则建议人们应该选择在游戏的第一回合就结束游戏。然而，在加州理工学院进行的一项最多玩四轮游戏的实验中，94%的参与者在第一轮就翻了两倍，只有不到一半的人表现出三级或更高的思维。当实验重复进行6轮时，只有2%的游戏在第一轮就结束了。[２]

有趣的是，当国际象棋大师玩双人游戏时，他们通常在与学生比赛时选择双人，但在与其他大师比赛时选择结束游戏。这表明玩家会考虑特定的对手，而不是做一般性的假设。

尽管如此，玩家在多次玩同一款游戏后倾向于趋于平衡。例如，在加州理工学院的实验中，在前两轮的游戏中，40%的游戏表现出了0级或1级思维，但在随后的8轮中，只有19%的游戏表现出了同样的思维，并且在第一轮结束的游戏比例从0上升到8%，这表明“学习”发生了。这表明，如果有足够的时间，游戏最终会达到均衡状态。在这个意义上，k级思维可以被视为经典原理的推广，不仅分析平衡状态，而且分析达到平衡状态的过程。

参考文献

阿斯特丽德·肖。Gæt-et-tal konkurrence afslører at vi er irrationelle(翻译:猜一猜——数字竞赛揭示了我们是非理性的)．检索自http://politiken.dk/oekonomi/ECE123939/gaet-et-tal-konkurrence-afsloerer-at-vi-er-irrationelle/， 2016年1月19日。

[2]何德华、苏宣明。Centipede游戏中的动态Level-k模型．检索自http://rady.ucsd.edu/faculty/seminars/2011/papers/hua-ho.pdf, 2016年1月19日。

[3] Levitt, S. D.， J. A. List和S. E. Sadoff(2009)，《将军:探索国际象棋玩家的逆向归纳法》，工作论文，芝加哥大学经济系。

年龄	总和	年龄	总和
1,1,36	38	1 6 6	13
1 2 18	21	2 2 9	13
1 3 12	16	2 3 6	11
1 4 9	14	3 3 4	10

测试

有关……

内容

一名人口普查人员到达一位逻辑学家的家。