K-level思考
K-level思考指的是一类逻辑问题,其中所有参与者都是完全理性的,具有无限的智力。换句话说,所有参与者都能够完美地推理他们的处境,并且知道其他人都有同样的能力。没有进一步的限定,术语“逻辑难题”或“逻辑问题”通常指的是这种情况。
k级思维在分析纳什均衡游戏和情境。
但这很简单。我所要做的就是根据我对你的了解来推测一下:你是那种会把毒药放进自己或敌人的酒杯里的人吗?现在,一个聪明的人会把毒药放进自己的酒杯里,因为他知道只有大傻瓜才会伸手去拿给他的东西。我不是大傻瓜,所以我可以明明不选你面前的酒。但你一定知道我不是一个大傻瓜,你会指望它,所以我显然不能选择我面前的酒。——维兹尼《公主新娘》(1987)
正式的定义
例子
设想一个游戏,参与者在0到100之间选择一个数字,目标是猜得越接近越好 尽可能取平均值。例如,如果5个玩家选择56 66 39 60 47, 平均值是 ,第三个玩家获胜。
在这种情况下,0级玩家会像往常一样随机选择。1级玩家会假设其他所有玩家都是0级,所以他们会猜测平均值在50左右,从而做出选择 因为他们的数量。2级玩家会假设其他玩家都是1级玩家,他们会做出选择 ,所以他们选择 因为他们的数量。三级玩家选择对二级玩家的最佳对策,依此类推,每一级的最佳猜测都在减少。因此,当假设有完全理性的常识时,最优猜测(与直觉相反)为零。
另一个例子是关于一个双人游戏,其中有两堆硬币,最初分别包含4个硬币和1个硬币。在游戏的每一个回合中,玩家可以选择取较大的一堆硬币来结束游戏,或者把每一堆硬币的数量增加一倍。如果玩家都没有选择结束游戏,游戏也会在固定的回合数后结束。
在这种情况下,0级玩家总是选择将牌堆加倍。1级玩家会假设他的对手是0级玩家,因此除了最后一个回合之外,他会选择在每个回合都将牌堆翻倍。2级玩家会选择在除了倒数第二个回合之外的每个回合都将钱币翻倍,因为他知道如果他在该回合将钱币翻倍,他的1级对手就会选择结束游戏,从而导致2级玩家获得更少的钱币。再一次地,这是一种归纳性的继续,所以一个无限聪明的玩家会选择在第一个回合就结束游戏。
逆向归纳法
上面的两个例子都说明了背后的想法逆向归纳法,这是通过逆向工作来确定最优开始行动的过程:通过确定游戏最后一个可能点的最优行动,可以确定游戏倒数第二个可能点的最优行动,以此类推,直到发现开始时间的最佳玩法。
逆向归纳法的主要优势在于,所有玩家都拥有完美的理性,所以游戏可以通过确定任何玩家的最佳行动而不断简化。例如,在上面的加倍游戏中,在分析的每一步中,可能的回合数都有效地减少了,因为玩家会选择在最后几个可能的回合中结束游戏(因此,在任何时候)。
海盗游戏:
三个海盗发现了100枚金币,他们必须决定如何分配这些宝藏。他们决定由年龄最大的海盗提出分配方案,所有海盗(包括提议者)将投票决定是否接受分配方案,还是将提议者扔到海里,在这种情况下,年龄次之的海盗将提出分配方案,继续游戏。领带产生一个可接受的分布。
假设所有海盗都是完全理性的、极其贪婪的、嗜血的(所以他们会投票把提议者扔到海里,除非他们能赚到更多的硬币),最老的海盗能赚多少硬币?
假设游戏只剩下两个最年轻的海盗。显然,年长的人会提议给自己“分配”100枚硬币;因为领带是给提议者的,所以这个分配是保证被接受的。
因此,提议者知道最年轻的海盗会投票给任何他能得到硬币的分配,因为如果他投反对票,他就不会得到硬币。所以,最老的海盗可以给最年轻的海盗一枚硬币,赢得2比1的投票,从而为自己赢得99个硬币。
这是海盗游戏的扩展:
你在火车上遇到了一个魔术师,聊了一会儿之后,他就 不同大小的正方形,如下图所示。(此图可能未按比例绘制。)
魔术师:“这些正方形的边长是截然不同的数字(从 来 包括在内),其最大公因数为 ."
他的手一挥,这些正方形就变成了一个长方形。
魔术师:“现在这个矩形的面积等于这两个矩形的面积之和
方格。矩形的宽度等于两个矩形的宽度之和
正方形的边长,而矩形的高度是另一个截然不同的数字。”
你:“太令人惊讶了!你能告诉我那个高度吗?”
魔术师:“没有。即使你知道它,你仍然无法计算出矩形的面积。”
你:“那你能至少告诉我这些正方形的边长吗?”
魔术师:“没有。即使你知道任意一个正方形的长度,你仍然无法计算出矩形的面积。”
你:“谢谢!现在我知道这个矩形的面积了"
魔术师被人无意中骗出了一条大线索,他感到很困惑。
这个矩形的面积是多少?
灵感来自Digitalize This。
歇洛克·福尔摩斯和我被叫去调查几天前发生在酒吧的两个帮派之间的残酷冲突。据传,这一切都源于盗窃,准确地说,是为了抢金币。有报道称,一些身材魁梧的男子在匆忙逃跑之前,把许多装有等量金币的袋子装进了车里。就在刚才,福尔摩斯带着他的线人回来了,他的线人一直在监视小偷的行踪。
福尔摩斯:我的人正好在那里偷听了小偷们在外面分金币的谈话。不幸的是,他们的声音很低沉,所以他得到的最好的线索就是这三个数字,我敢肯定它们指的是袋子的数量,每个袋子里的金币数量,当然还有小偷的数量。你可以看到,最高和最低的数字之差小于最低的数字本身。
令人困惑的是,我们不知道哪个数字代表哪个数字,但确实有 这些神秘数字的可能组合。尽管如此,我的人从偷窥孔里看到了剩下的 桌上的金币分好了。
I:那么,有了这些数字,难道我们不能通过尝试所有可能的除法来区分它们吗?
福尔摩斯:不,我的朋友,华生。即使我们知道所有这些数字,我们仍然不能排除任何组合。
在这个事件中最少可能有多少小偷?
灵感来自于里德尔兄弟
战略主导地位
另一种类型的分析是战略主导地位在该理论中,严格来说比另一种更糟糕的策略被视为可能的行动而抛弃,直到只剩下“合理的”策略。例如,分析“2/3平均值”游戏的另一种方法是:在 而100则完全由其他猜测决定,因为最终平均值的2/3不可能这么大。这有效地将最大可能的猜测减少到 .然后,按照同样的逻辑,在 而且 完全取决于其他的猜测。这种逻辑继续下去,所以0严格优于其他任何猜测,因此是最佳玩法。
同样的原则也适用于从额外的证据中进行推论,即行为者在整个场景过程中从他们得到的信息中排除不可能的起始情况。
囚犯和帽子:
一个监狱长召集三个囚犯,让他们排成一排,蒙住他们的眼睛。他说:“我有两顶黑帽子和三顶白帽子,我要给你们每人戴上一顶。如果你们谁能猜出自己帽子的颜色,就都可以自由了。但如果你猜错了,你就会被处死。如果你不猜,什么也不会发生。”
典狱长取下后面犯人的眼罩,他可以看到前面两个犯人的帽子。他说:“我不知道我帽子的颜色。”
监狱长取下了第二个囚犯的眼罩,他只能看到前面那个囚犯的帽子。他说:“我不知道我帽子的颜色。”
最后,监狱长取下了最后一个囚犯的眼罩,他说:“我知道我帽子的颜色。”它是什么颜色的?囚犯是怎么知道的?
他戴着一顶白帽子。
后面的囚犯不知道自己帽子的颜色,所以另外两个囚犯都知道自己戴的不是黑帽子(否则,后面的囚犯就会知道自己的帽子是白的)。如果第二个囚犯看到前面的囚犯戴着一顶黑帽子,他就可以说他的帽子是白色的,因为他已经知道他们不是都戴着黑帽子。但是第二个囚犯不知道他帽子的颜色,所以他一定看到前面的囚犯戴着一顶白色的帽子。第一个囚犯就知道他戴着一顶白帽子。
人口普查问题:
一名人口普查人员到达一位逻辑学家的家。
人口普查员:“你有几个孩子,他们多大了?”
逻辑学家:“我有3个孩子。他们年龄的乘积是36岁。”
C:“什么?你就不能告诉我他们的年龄吗?”
L:“他们的年龄和我的门牌号一样。”
C:“那真的帮不了我。”
L:“我的大儿子正在学小提琴。”
C:“啊,我明白了。祝你今天过得愉快!”这三个孩子的年龄是多少?
孩子们的年龄分别是2岁、2岁和9岁。
因为在被告知孩子们年龄的总和后,人口普查人员没有足够的信息,所以这个总和和产品36必须有不止一个三倍的数字。我们可以列出这些可能性:
年龄 总和 年龄 总和 1,1,36 38 1 6 6 13 1 2 18 21 2 2 9 13 1 3 12 16 2 3 6 11 1 4 9 14 3 3 4 10 因此,逻辑学家的门牌号必须是13,因为任何其他数字都可以让人口普查人员计算出他们的年龄。
最后一条信息,最大的孩子正在学习小提琴,告诉人口调查员是年龄最大的孩子,因此排除了孩子分别为1岁、6岁和6岁的可能性。唯一的可能是孩子们的年龄分别是2岁、2岁和9岁。
四个名叫A、B、C、D的朋友接受挑战,玩一个奇怪的“猜字”游戏。4名选手将被分在4个不同的房间里,除非得到允许,否则他们不能看到或听到对方,条件如下:
- 其中一个参赛者会被蒙上眼睛,这样他什么都看不见,但仍然可以很好地听和说。(盲人)
- 一个人会戴上耳塞,听不见别人说话,但还能看见别人,并跟别人说话。(聋哑人)
- 一个人会被封住嘴巴,不能说话,但能很好地看和听。(静音)
- 剩下的人将完全不受任何手段的约束,可以感知所有的感官。(正常)
起初,他们谁也不知道谁是谁。然后游戏就会这样进行。
首先,秘密地向A展示文本中的一个单词。然后他们需要用声音告诉B。(只有B的墙能听到这个。B看不见A,即使B不是盲人,所以A不能用手语或其他任何语言交流,尽管A是聋子,B是盲人,B仍然能听到A的话。)然后B必须大声说出这个词来得到一分。
接下来,轮到B告诉C一个新单词,规则和上面一样。然后轮到C告诉D,最后轮到D告诉A。
比赛结束后,四个朋友没有得到任何分数。然后他们讨论了游戏:
B这是一场艰苦的比赛!
一个:确实!我想知道你有什么词,C?
C:不可能。我只知道这个游戏里的一个词。我会保守秘密的。
D:真遗憾。我希望我能知道你的承诺,C。
在游戏中A, B, C, D是什么身份?假设1 =盲人,2 =聋子,3 =哑巴,4 =正常人;按顺序输入A、B、C和D的身份。例如,如果你认为A是盲人,B是聋子,C是哑巴,D是正常人,那么你应该进入 正如你的回答。
实际应用
在经典原则下,假设所有参与者都拥有常识完全理性,意味着每个玩家都知道其他玩家是完全理性的(他们也知道其他玩家也知道其他玩家是理性的,等等)。然而,在实际环境中通常不是这样,因为在实际游戏中很少出现平衡。
事实上,完全理性的行为人通常处于缺点因为他们高估了其他球员的深度。例如,在前一节中描述的“平均值的2/3”博弈中,经典原则表明,完全理性的智能体会选择数字0。然而,实际中奖数字通常要高得多。例如,在一场有19000多名参与者参加的竞赛中,21.6是获胜的答案,这略低于二级思考者会选择的数字。有趣的是,尽管0级思维通常被认为只存在于更高深度策略的计算中,但该实验中出现了接近100次的猜测(尽管获胜者肯定是最多的) 这表明一些玩家表现出了0级思维。
类似地,在硬币游戏中,经典的原则建议人们应该选择在游戏的第一回合就结束游戏。然而,在加州理工学院进行的一项最多玩四轮游戏的实验中,94%的参与者在第一轮就翻了两倍,只有不到一半的人表现出三级或更高的思维。当实验重复进行6轮时,只有2%的游戏在第一轮就结束了。[2]
有趣的是,当国际象棋大师玩双人游戏时,他们通常在与学生比赛时选择双人,但在与其他大师比赛时选择结束游戏。这表明玩家会考虑特定的对手,而不是做一般性的假设。
尽管如此,玩家在多次玩同一款游戏后倾向于趋于平衡。例如,在加州理工学院的实验中,在前两轮的游戏中,40%的游戏表现出了0级或1级思维,但在随后的8轮中,只有19%的游戏表现出了同样的思维,并且在第一轮结束的游戏比例从0上升到8%,这表明“学习”发生了。这表明,如果有足够的时间,游戏最终会达到均衡状态。在这个意义上,k级思维可以被视为经典原理的推广,不仅分析平衡状态,而且分析达到平衡状态的过程。
参考文献
阿斯特丽德·肖。Gæt-et-tal konkurrence afslører at vi er irrationelle(翻译:猜一猜——数字竞赛揭示了我们是非理性的).检索自http://politiken.dk/oekonomi/ECE123939/gaet-et-tal-konkurrence-afsloerer-at-vi-er-irrationelle/, 2016年1月19日。
[2]何德华、苏宣明。Centipede游戏中的动态Level-k模型.检索自http://rady.ucsd.edu/faculty/seminars/2011/papers/hua-ho.pdf, 2016年1月19日。
[3] Levitt, S. D., J. A. List和S. E. Sadoff(2009),《将军:探索国际象棋玩家的逆向归纳法》,工作论文,芝加哥大学经济系。