纽科姆的悖论
纽科姆的悖论(或纽科姆问题)是决策理论中的一个问题,在这个问题中,看似理性的决策最终会比看似非理性的决策产生更糟糕的结果。这个悖论围绕着一个特殊的例子展开,在这个例子中,一个代理人会根据它预测你的行为方式给你奖励。在某种程度上,它类似于囚徒困境.它与预测、因果关系、决策和自由意志的问题密切相关。纽科姆的问题是由威廉·纽科姆发明的,最先由罗伯特·诺齐克发表[1],由马丁·加德纳推广开来[2].
纽科姆悖论的核心问题是想象一个超级智能体。假设这个代理叫做。欧米茄是一个生活在太空中的机器人,它通过火箭降落到地球上给人类解决难题来自娱自乐。今天,欧米茄选择了你作为它的目标。Omega出现在你面前,带着两个盒子,标着 而且 ,然后把它们放在你面前的地上。它告诉你它在每个盒子里都放了一定数量的钱。具体地说,盒子 是不透明的,其中有$1,000,000或$0(您不知道哪个),和盒子 是透明的,里面有1000美元。欧米茄说你可以选择打开盒子 或两个盒子 而且 .
更多关于一个盒子还是两个盒子?
如果这个问题稍有改变呢?
这些都是简单的问题。现在,欧米茄放下方框,告诉你它目前所说的是准确的,但有一个转折;决定在盒子里放什么是基于它预测你将如何处理盒子。如果欧米茄预测你只会打开盒子 ,它把100万美元放进盒子里 盒子里还有1000美元 .然而,如果Omega预测您将打开两个盒子,它将0美元放入盒子 盒子里还有1000美元 .
你知道每次欧米加对任何人的行为做出的预测都是正确的。事实上,你知道总是能完美地预测你会做什么。(显然这个假设是不现实的——欧米茄不完美的情况将在后面处理。)
在向你解释完情况后,欧米茄火箭返回它的太空巢穴,留下你和两个盒子。问题是,你应该打开盒子吗 还是两个箱子?
有两种相互矛盾的推论:
一旦欧米茄放下盒子,要么就是钱在里面 否则就没有钱了 .如果有钱的话 ,那么拿走两个盒子就能得到更多的钱,如果里面没有钱 ,拿走两个盒子就能赚更多的钱。因此,您应该拿走两个盒子。
如果你把两个盒子都拿走,那么根据这个问题的假设,里面就没有钱了 ,所以你最终会得到1000美元。如果你只取 然后里面会有钱,所以你最终会得到100万美元。因此,你应该只拿 .
收益矩阵
在博弈理论,两个玩家可能采取的不同行动及其相应的奖励集合表示为支付矩阵.以下是Newcomb悖论的收益矩阵:
矩阵的对角线元素(左上和右下)表示Omega正确预测你的行为的情况。非对角线元素(左下和右上)表示Omega预测错误的情况。然而,根据问题的表述,ω不能预测不正确,所以真正的决策矩阵是这样的:
以这种方式分解收益矩阵可以将问题一般化到ω不是一个完美预测器的情况下。如果用概率预测你的行动 ,那么合并后的情况是这样的:
注意,这包含了Omega在预测你的行为时比chance更糟糕的情况 .它还考虑了选择一个和两个盒子之间的奖励差异有多大。在标准设置中,欧米茄不需要在任何地方接近一个完美的预测只取盒子 是正确的选择,因为有如此大的差异的回报。
同样的,如果问题被改变,那么收益 大于或等于两倍的收益 ,那么选择两个盒子总是正确的策略。
透明的纽科姆的问题
想象一下,而不是原来的情况 是透明的, 是不透明的,这两个盒子是透明的。在这种情况下,你会确切地知道盒子里装的是什么 有一次欧米茄飞走了。同样,有两种推理方法。
很明显如果你已经知道盒子里装的是什么,那么你应该把两个盒子都拿走。钱要么在,要么不在。
这个设置与前面的设置相同。如果欧米茄预测你是那种会拿两个盒子的人,盒子里就不会有钱 .不应该存在一个盒子里装着钱的世界 ,但你两个都拿。因此,承诺只取 会让你生活在盒子里有钱的世界里吗 ,你将得到1,000,000美元。
帕菲特的《银河系漫游指南》
纽科姆的问题似乎涉及因果推理的奇怪概念,即现在的决定会影响过去发生的事情。因此,许多人认为这个问题只是一个奇怪的哲学思维实验,与日常生活中的决定无关。然而,类似的问题,称为Newcomblike问题,一直都在发生[3].考虑一个更现实的例子,称为帕菲特的《银河系漫游指南》[4].一个搭便车的人被困在一条炎热的沙漠公路上,希望能到达下一个城镇。一个司机把车停在搭车者旁边,说她愿意搭车,但前提是当他们到镇上时,搭车者要给她100美元。
搭便车的人想了想,意识到他最好的选择是承诺他们到镇上时支付100美元,但之后就不这么做了。毕竟,一旦他到了城里,付了钱并不会直接影响他是否在那里。在那个时候付钱是不理智的。
司机意识到搭便车的人使用了上面的逻辑,开车离开了。不幸的是,在这种情况下,理性的行为选择导致搭便车者的结果比搭便车者承诺支付100美元的情况更糟糕,即使他可以从不支付中获益。
帕菲特的搭便车问题和透明的纽科姆问题在结构上是一样的。选择在城镇中骑行并支付100美元对应于选择一个方框,而选择在城镇中不支付的骑行对应于选择两个方框。只有当司机预测搭车者会遵守承诺支付100美元时,司机才会提供搭车的可能性。在纽科姆的问题中,对单框的建议映射出搭便车者实际上是一个诚实的人,这样司机就足够信任他,让他搭车。给搭便车的人的建议是用两盒地图欺骗司机,让他以为自己是诚实的,然后不遵守他的承诺。
参考文献
- 诺齐克,r(1969)。纽科姆问题与两个选择原则。纪念卡尔·G·亨佩尔的散文.
- 加德纳m(1974)。数学游戏。科学美国人.
- 苏亚雷斯,N。新梳子一样的问题是常态.2014年9月24日,从http://mindingourway.com/newcomblike-problems-are-the-norm/
- 帕菲特,d .(1984)。原因和人.