科学与数学中的贝叶斯理论
频率论的概率
从历史上看,基本频率概率论主导统计分析。这个概率给出了这样的结论:“在一个正常的、两面的、未加重量的硬币中,翻转一面的几率是50%,翻转另一面的几率是50%”,但这变得更加复杂。例如,一项研究发现,家庭收入在2万美元或以下的人,其收入“大约是家庭收入的两倍”发病率与收入在2万美元以上的家庭相比。[1]
这些可能性并没有错。然而,它们被误用了。在整个 而且 20世纪以来,许多数学家、科学家和统计学家抵制使用贝叶斯理论。例如,苏格兰数学家乔治·克里斯托(George Chrystal)就力主如此贝叶斯定理,以及拉普拉斯对它的复兴,“应该体面地埋葬在人们的视线之外,而不是在教科书和考卷中防腐……大人物的轻率行为应该被悄然遗忘。”[2]
这种误用在已发表的科学和统计研究中很普遍。哥伦比亚大学的统计学教授安德鲁·格尔曼博士说:“即使科学家总是做正确的计算——他认为他们没有——接受一切带有偏见的东西 - 5%的值意味着每20个“统计意义上重要的”结果中就有一个是随机噪声。他说,发表在知名期刊上的错误结果的比例可能更高,因为这样的发现通常是令人惊讶的,具有吸引力的反直觉。”[3]
证明频率论方法的失败,或至少适用性较差的一种方法是蒙蒂霍尔问题.在这个问题中,Monty Hall是一个游戏节目的主持人,他给了一个参赛者一个机会,在不知道后面是什么的情况下从三扇门中选择一扇。其中一扇门有一个像汽车一样的奖品,另外两扇门有山羊。在选手选了一扇门后,Monty打开了其中一扇选手没有选的门,并告诉他这扇门后面有一只山羊。在最后的揭晓之前,蒙蒂给了参赛者换门的机会。用频率-概率指导的方法来看待这个选择是这样的:因为现在只剩下两扇门了,其中一扇门上有一辆车,另一扇门上有一只山羊,所以选择正确的几率是五五开,不管参赛者是否换了门。
然而,这是不正确的,贝叶斯思维有助于说明原因。贝叶斯概率主义者会意识到蒙蒂打开一扇门是提供给竞争者的额外证据。贝叶斯会意识到参赛者最初的猜测有1 / 3的机会是正确的,有2 / 3的机会是错误的。现在Monty故意(而非随机)排除了一个错误的门,2 / 3的机会分配给了未选择和未打开的门,保留他们的门仍然有1 / 3的机会是正确的,但切换有2 / 3的机会。蒙提霍尔的问题并不是受过教育的人唯一感到困惑的地方。医生和科学家在应该使用贝叶斯定理报告结果和分析临床试验时,错误地使用了频率概率。
生物医学检测结果
许多医学测试都声称“这个测试是99%的准确率”(通常准确率低于99%),通常被称为灵敏度出错率(在本例中为1%)导致假阳性或假阴性.由于测试的高成功率,一些医生看到一个测试结果就会得出结论,认为它和测试本身一样准确——例如,一个病人的结果是99%的正确率。这里的差和后验概率和先验概率在贝叶斯定理.许多内科医生和科学家把某些特定情况下的先验概率合并在一起, 根据后验概率, 的可能性 给出一些证据。
事实上,正式和非正式的测试都表明,大多数医生自己都误解了临床数据。在1982年一篇关于临床医学中概率推理的著名论文中,大卫·埃迪([4]David Eddy)探索了患病率引导医生做出错误推理的临床语言。例如,在乳腺癌筛查中,“乳房x光检查的准确性约为90%,”[4]“乳房x光检查正确诊断乳腺恶性病变的准确性平均为80%至85%,”[4]详细报告了结果,“结果显示,475个恶性病变中79.2%被正确诊断,1105个良性病变中90.4%被正确诊断,平均为87%。”埃迪继续提到他做过的一个非正式调查(关于一个即将出现的问题),在100名医生中有95人将这些先验概率误认为是判断一个病人的阳性结果是否意味着他们患了癌症的正确概率这已在许多其他测试中得到证实,例如1986年的Windeler和Köbberling,以及2012年Wegwarth、Schwartz、Woloshin和Gaissmaier最近的调查,[6]表明许多医生不将贝叶斯统计应用于他们对临床结果的解释。
测试两次
判断患者是假阳性还是真阳性的关键是对患者进行两次检测。维基百科底部的问题是通过这里的数学。
此外,医学领域经常说“乳房x光检查减少了风险死于乳腺癌的几率降低了25%!”然而,与这种相对增长相反,实际的绝对增长往往是很小的。例如,如果一组1000名妇女接受乳腺癌筛查,10年后其中3人可能死于乳腺癌。如果另一组1000名女性不接受筛查,10年后其中4人可能死于乳腺癌。相对而言,这是25%的改善,但对普通女性来说是一种误导,她们可能认为接受筛查会使患癌症的可能性降低25%。[7]
作为一种选择的自然频率
针对这一常见误解的一种解决方案是用固有频率表示结果。包括Hoffrage、Krauss、Martignon和Gigerenzer在内的多项研究表明,这极大地改善了贝叶斯推理
在许多实验室研究中,自然频率已被证明是诱导贝叶斯推理的积极工具,法庭上DNA证据的解释,以及教孩子贝叶斯思维
问题不在于贝叶斯定理太难理解,而在于风险和概率是如何呈现的。上述问题的固有频率表示如下所示:
在每1000名参加乳腺癌筛查的40岁女性中,有10人会患乳腺癌。每10名乳腺癌患者中有8人的乳房x光检查呈阳性(80%)。每990名未患乳腺癌的女性中,有95人的乳房x光检查结果为阳性(990人中的9.6%)。如果你有一组40岁的女性观察那些在筛查中得到阳性结果的女性,你认为这些阳性结果中有多少百分比实际上表明这个女性患有乳腺癌?
在这种情况下,因为它和之前的问题是一样的,只是表示不同,答案是一样的。然而,在调查中,医生用这种方法提供的数据比以前的方法更有可能得出正确的结果。
进一步的问题
参考文献
[1] Evertiart, J. E., Byrd-Holt D., Sonnenberg A.(1998)美国自我报告的消化性溃疡疾病的发生率和危险因素。美国流行病学杂志.2016年3月3日访问:http://aje.oxfordjournals.org/content/147/6/529.full.pdf
贝叶斯定理的历史。更少的错误。2011年8月29日。2016年3月3日访问:http://lesswrong.com/lw/774/a历史的贝叶斯定理/
[3] Flam, fd .赔率,不断更新。《纽约时报》2014年9月29日科学访问2016年3月3日http://www.nytimes.com/2014/09/30/science/the-odds-continually-updated.html?
[4]艾迪·DM(1982)。“临床医学中的概率推理:问题与机遇”。剑桥大学出版社。2016年2月24日访问:http://personal.lse.ac.uk/robert49/teaching/mm/articles/Eddy1982ProbReasoningInClinicalMedicine.pdf
[5]温德勒和Köbberling, J.(1986)。经验论Untersuchung zur Einschätzung diagnostics Verfahren am Beispiel des haemoccult测试。Klinische Wochenschrift, 64(21), 1106-1112。
Wegwarth O, Schwartz LM, Woloshin S, Gaissmaier W, Gigerenzer G.医生了解癌症筛查统计数据吗?美国初级保健医师全国调查。安,实习医生。于2016年2月24日访问http://annals.org/article.aspx?articleid=1090696
h h;Gigerenzer G.(2004)《如何提高医学专家的诊断推理能力》。在E. Kurz-Milcke & G. Gigerenzer (Eds.)中,科学和社会的专家(页249 - 268)。于2016年2月24日访问http://library.mpib-berlin.mpg.de/ft/gg/GG如何2004. pdf
[8] Hoffrage, U., Krauss, S., Martignon, L.和Gigerenzer, G.(2015)。在简单和复杂的推理任务中,自然频率改进了贝叶斯推理。心理学前沿6,1473。http://doi.org/10.3389/fpsyg.2015.01473
[9]科斯米德斯,L.和图比,J.(1996)。人类到底是优秀的直觉统计学家吗?对文献中关于不确定性下判断的一些结论的反思。认知, 58(1), 1-73。访问于2016年2月24日,从http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.131.8290&rep=rep1&type=pdf
Lindsey, S., Hertwig, R., & Gigerenzer, G.(2003)。交流统计DNA证据。判决法理学, 147 - 163。访问于2016年2月24日,从http://pubman.mpdl.mpg.de/pubman/item/escidoc:2101705/component/escidoc:2101704/SL沟通2003. pdf
朱磊,Gigerenzer, G.(2006)。儿童可以解决贝叶斯问题:表征在心算中的作用。认知, 98(3), 287-308。访问于2016年2月24日,从http://pubman.mpdl.mpg.de/pubman/item/escidoc:2100734/component/escidoc:2100733/GG孩子2006. pdf
参考文献
- 吉尔斯,D.(2000)。概率论的哲学理论(科学中的哲学问题)(页88)。伦敦,英国:劳特利奇。