科学与数学中的贝叶斯理论
频率论的概率
从历史上看,基本频率概率论统计分析为主。这种概率状态的结论是:“在一个正常的、双面的、未加权的硬币中,有50%的机会掷出一面,也有50%的机会掷出另一面”,但情况变得更加复杂。例如,一项研究发现,家庭收入在2万美元或以下的人“大约有两倍的收入”发病率与收入超过2万美元的家庭相比。[1]
这些可能性并没有错。然而,它们被误用了。在整个 和 本世纪以来,许多数学家、科学家和统计学家抵制使用贝叶斯理论。例如,苏格兰数学家乔治·克里斯托(George Chrystal)就极力主张贝叶斯定理,以及拉普拉斯对它的复兴,“应该体面地埋葬在人们看不到的地方,而不是保存在教科书和试卷中……伟大人物的轻率行为应该被悄悄遗忘。”[2]
这种误用在已发表的科学和统计研究中很普遍。哥伦比亚大学的统计学教授安德鲁·格尔曼博士说:“即使科学家们的计算总是正确的——他认为他们并不是这样——他们接受所有的 - 5%的值意味着20个“具有统计学意义”的结果中有一个只是随机噪声。他说,发表在知名期刊上的错误研究结果的比例可能更高,因为这些发现往往出人意料,而且有违直觉。[3]
有一种方法可以证明频率论者的概率方法的失败,或者至少是适用性差蒙提霍尔问题.在这个问题中,蒙蒂·霍尔是一个游戏节目的主持人,他让参赛者在不知道后面是什么的情况下从三扇门中选择一扇。问题是,其中一扇门上有一个奖品,像一辆汽车,而另外两扇门上有山羊。在选手选好一扇门后,蒙蒂打开了选手没有选的一扇门,发现这扇门后面有一只山羊。在最后揭晓之前,蒙蒂给了参赛者一个机会来改变他们选择的门。frequency-probability-guided看这个方法的选择是认为,因为现在只剩下两扇门,其中一个有一辆车和另一只山羊,选择正确的几率是一半对一半,不管选手更改他们的门。
然而,这是不正确的,贝叶斯思维有助于说明原因。贝叶斯概率论者会意识到蒙蒂打开一扇门是给参赛者提供的额外证据。贝叶斯会意识到参赛者最初的猜测有三分之一的机会是对的,有三分之二的机会是错的。现在Monty已经故意(而不是随机)消除了一扇错误的门,3分之2的机会将自己分配给未选择和未打开的门,留在他们的门仍然有1 / 3的机会是正确的,但切换有2 / 3的机会。蒙蒂·霍尔问题并不是唯一一个让受过教育的人感到困惑的地方。当医生和科学家应该使用贝叶斯定理来报告结果和分析临床试验时,他们错误地使用了频率概率。
生物医学测试结果
许多医学测试包括像“该测试是99%的准确性”(通常准确性低于99%),通常被称为灵敏度错误率(在本例中为1%)导致假阳性或假阴性.由于测试的成功率很高,一些医生只看一个测试结果,就认为它和测试本身一样准确——例如,一个病人的结果是99%的正确。这里的区别在于后验概率和先验概率在贝叶斯定理.许多医生和科学家在某些情况下把先验概率混为一谈, 根据后验概率, 的可能性 给出一些证据。
事实上,无论是正式的还是非正式的测试都表明,大多数医生自己对临床数据有误解。在1982年一篇关于临床医学中的概率推理的著名论文中,[4]David Eddy探索了患病率指导医生进行错误推理的临床语言。例如,在乳腺癌筛查中,“乳房x线照相术的准确率约为90%”,[4]“乳房x线照相术正确诊断乳腺恶性病变的准确率平均为80%至85%”,[4]有具体结果报告,“结果显示,475个恶性病变中79.2%被正确诊断,1105个良性病变中90.4%被正确诊断,平均为87%。”埃迪继续提到他做过的一项非正式调查(关于接下来的一个问题),在调查中,100名医生中有95名将这些先验概率错误地当成了一个病人的阳性结果是否意味着他们患有癌症的正确概率这已经在许多其他测试中得到证实,例如,Windeler和Köbberling在1986年,[5]和最近Wegwarth, Schwartz, Woloshin和Gaissmaier在2012年的调查中,[6]显示,许多医生没有将贝叶斯统计应用于他们对临床结果的解释。
测试两次
确定患者是否出现假阳性或真阳性的关键是对患者进行两次检测。这个wiki底部的问题在这里进行了计算。
此外,医学领域经常说“乳房x光检查可以减少。风险25%的人死于乳腺癌!”然而,实际的绝对增长,相对于这个相对增长,可能往往很小。例如,如果一组1000名女性接受乳腺癌筛查,10年后其中3人可能死于乳腺癌。如果另一组1000名妇女不接受筛查,10年后其中4人可能会死于乳腺癌。相对而言,这是25%的改善,但对普通女性来说是一种误导,她们可能会认为接受筛查可以降低25%患癌症的可能性
自然频率作为一种选择
针对这一常见误解的一个建议解决方案是用固有频率表示结果。包括Hoffrage、Krauss、Martignon和Gigerenzer在内的多项研究表明,这极大地提高了贝叶斯推理能力
在大量的实验室研究中,自然频率被证明是诱导贝叶斯推理的积极工具,[9]在法庭上解释DNA证据,[10]和教导孩子贝叶斯思维
问题不在于贝叶斯定理太难理解,而在于风险和概率是如何呈现的。上述问题的固有频率表示如下所示:
每1000名参加乳腺癌筛查的40岁女性中,就有10人患有乳腺癌。每10名患有乳腺癌的女性中有8人的乳房x光检查结果呈阳性(10人中的80%)。每990名未患乳腺癌的女性中,95人的乳房x光检查结果呈阳性(990人中的9.6%)。如果你有一组40岁的女性观察那些在筛查中得到阳性结果的女性,你认为这些阳性结果中有多大比例表明这名女性患有乳腺癌?
在这种情况下,因为它和之前的问题是一样的,只是表示方式不同,答案是一样的。然而,在调查中,医生用这种方法提供的数据比以前的方法更有可能得出正确的结果。
进一步的问题
参考文献
美国消化性溃疡病的发病率和危险因素。美国流行病学杂志.第147卷第6期于2016年3月3日通过http://aje.oxfordjournals.org/content/147/6/529.full.pdf
贝叶斯定理的历史。更少的错误。2011年,8月29日。于2016年3月3日从:http://lesswrong.com/lw/774/a历史的贝叶斯定理/
弗拉姆,F.D.,几率,不断更新。纽约时报2014年9月29日http://www.nytimes.com/2014/09/30/science/the-odds-continually-updated.html?
[4] Eddy DM(1982)。《临床医学中的概率推理:问题与机遇》。剑桥大学出版社。于2016年2月24日从:http://personal.lse.ac.uk/robert49/teaching/mm/articles/Eddy1982ProbReasoningInClinicalMedicine.pdf
[5] Windeler, J., & Köbberling, J.(1986)。恩台苏钟zur Einschätzung diagnostics scher Verfahren am ispiel des Haemoccult-Tests。Klinische Wochenschrift64(21) 1106 - 1112。
Wegwarth O, Schwartz LM, Woloshin S, Gaissmaier W, Gigerenzer G.医生了解癌症筛查统计数据吗?美国初级保健医师的全国调查。安实习生地中海。于2016年2月24日从http://annals.org/article.aspx?articleid=1090696
[7] Hoffrage美国;以及Gigerenzer G.(2004)如何改进医学专家的诊断推理。在E. Kurz-Milcke和G. Gigerenzer (Eds.)中,科学和社会专家(页249 - 268)。于2016年2月24日从http://library.mpib-berlin.mpg.de/ft/gg/GG如何2004. pdf
Hoffrage,美国,Krauss, S., Martignon, L., & Gigerenzer, G.(2015)。固有频率改善了简单和复杂推理任务中的贝叶斯推理。心理学领域6 1473。http://doi.org/10.3389/fpsyg.2015.01473
[9] Cosmides, L., & Tooby, J.(1996)。人类毕竟是优秀的直觉统计学家吗?反思文献中关于不确定性判断的一些结论。认知58(1) 1 - 73。于2016年2月24日通过http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.131.8290&rep=rep1&type=pdf
[10] Lindsey, S., Hertwig, R., & Gigerenzer, G.(2003)。交流统计DNA证据。判决法理学, 147 - 163。于2016年2月24日通过http://pubman.mpdl.mpg.de/pubman/item/escidoc:2101705/component/escidoc:2101704/SL沟通2003. pdf
朱亮,&吉吉仁泽,(2006)。儿童可以解决贝叶斯问题:表象在心理计算中的作用。认知98(3), 287 - 308。于2016年2月24日通过http://pubman.mpdl.mpg.de/pubman/item/escidoc:2100734/component/escidoc:2100733/GG孩子2006. pdf
参考文献
- Gilles, d .(2000)。概率论的哲学理论(科学哲学问题)(页88)。英国伦敦:劳特利奇。