Berkson的悖论据/h1>
Berkson的悖论据/strong>结果是统计数据,非常密切相关据一种href="//www.parkandroid.com/wiki/simpsons-paradox/" class="wiki_link" title="辛普森的悖论" target="_blank">辛普森的悖论据/a>,这表明即使在群体中看起来呈正相关,两个值也可以统计地呈统计相关。在高中,与数学擅长良好时,更高的似乎可能似乎是正相关的。然而,统计上,学生的身高和数学技能并不相关,更高,并且在数学时更高或更差。简单的情况是,较高的学生往往更老的情况并研究了更多数学。Berkson悖论的许多应用不太明显。据/p>
Berkson的悖论是一种特殊的据一种href="//www.parkandroid.com/wiki/selection-bias/" class="wiki_link" title="选择偏见" target="_blank">选择偏见据/a>或通过系统地观察一些比其他事件更加引起的统计结果。在该悖论中,观察范围仅限于两个变量总和在一起的那些。如果你知道据S.pan class="katex">
大学录取据/h2>
大学基于许多属性选择学生。在美国,两个常见的属性是高中GPA和SAT分数。这些是正相关的[1],所以人们会期望在给定的学校内,他们也会积极相关。但是,这不必如此。据/p>
招生委员会接受具有足够高GPA的学生,足够高的SAT得分或两者的某种组合。但是,既有高GPA和高六个分数的申请人都会进入一个更高级别的学校而不是参加,即使他们被接受。实际上参加学校的学生范围是在引言中的情节中的蓝色点给出。即使整体人口(红色和蓝色点)显示出上升趋势,这些点表示下降趋势。这种趋势逆转是“悖论”,虽然没有什么真正的矛盾。这是GPA与审查人民的SAT分数之间的权衡结果。据/p>
Berkson的悖论也被称为Berkson的偏见,因为这种选择形式并不一定会导致趋势逆转。在示例情节中,两条线是坚固的截止值 - 下线下面的没有人被录取,并且上线上没有人决定参加。但是,如果他们是概率主义,那么整体GPAS + SAT分数的人或多或少可能参加,那么效果就会不那么激烈。线路也相对靠近在一起。如果他们分开足够遥远,所以只有很多分数的学生被拒绝,只有非常高分的学生才会产生,仍然会在学校的学生之间存在正相关;它不会与所有学生的相关性一样大。据/p>
例子据/h2>
医院据/strong>
Berkson的悖论最初在流行病学研究的背景下发现 - 追踪疾病与潜在危险因素之间关系的研究。例如,肺癌与危险因素吸烟的关系是一个很好的例子。在医院开展这些研究非常方便,因为在一个患有疾病的一个地方有大量患者。(此外,进行研究的研究人员经常是医生。)据/p>
然而,与大学在基于积极特征的组合接受学生的情况下,医院接受基于症状的组合接受患者。例如,如果一项研究要知道,如果怀孕增加或减少的时间为HIV阳性的妇女制定全面的艾滋病,并研究在产前检查诊所进行的,这项研究可能会有所偏差。妇女将被视为怀孕或看见艾滋病风险[2]。所以,一个临到诊所的女性并没有怀孕的人比一般人群中的某人更有可能有艾滋病,因为他们可能因某种原因来到诊所,而且它没有怀孕。即使没有一个,似乎也可能是一个相关性。据/p>
在基于医院的研究中确定是否相关胰腺癌和咖啡使用,对照组从胃肠学家的患者中拉出。然而,由于其胃肠道窘迫,胃肠道窘迫的患者不太可能喝咖啡。因此,该研究在测试组中饮用的饮用速率与放气对照组相反[3]。据/p>
约会据/strong>
人们根据物理特征和人格特质的组合选择合作伙伴。可以绘制类似于大学的图表,在两个轴上具有物理和个性特征,具有一个人的区域。这可能会占常见(虽然未经证实的)观察,但英俊的男人是混蛋[4]。据/p>
书推荐据/strong>
研究人员发现,赢得了文学奖项的书籍的质量评级据em>下据/em>本书赢得了奖项[4]。这似乎是矛盾的,因为如果他们知道其他人喜欢他们,那么人们通常就像书籍一样。然而,人们选择基于书籍是否受欢迎的组合以及是否有趣的内容。如果一本书更受欢迎(例如,通过获得奖项),那么更多读它的人会这样做,因为它直接吸引他们。如果您想阅读最好的书籍,请避免您只想阅读的书籍,因为您的朋友正在阅读它。据/p>
概率据/h2>
虽然Berkson的偏置可以适用于任何两个随机变量,但它是以两个独立变量的最佳表达据S.pan class="katex"> 和据S.pan class="katex"> 。如果据S.pan class="katex"> 和据S.pan class="katex"> 是独立的,然后是据一种href="//www.parkandroid.com/wiki/conditional-probability-distribution/" class="wiki_link" title="有条件的概率" target="_blank">有条件的概率据/a>的据S.pan class="katex"> 给予据S.pan class="katex"> 或者据S.pan class="katex"> 大于条件概率据S.pan class="katex"> 给予两者据S.pan class="katex"> 或者据S.pan class="katex"> 和价值据S.pan class="katex"> :据/p>
撞机据/h2>
Berkson的悖论和辛普森的悖论都是调理的例子据S.trong>因果侵占者据/strong>。当代表事件是有因果关系的时,统计员将绘制据一种href="//www.parkandroid.com/wiki/graphs/" class="wiki_link" title="定向图形" target="_blank">定向图形据/a>,来自活动的边缘据S.pan class="katex"> 事件据S.pan class="katex"> 代表据S.pan class="katex"> 造成据S.pan class="katex"> 。当多个节点指向同一节点时,它被称为“碰撞器”,因为该节点的传入箭头“碰撞”。在大学的例子中,撞机是大学出席,这是由GPA和SAT分数引起的。据/p>
悖论可以被重申,说明对撞机的控制引入了先前没有的相关性。在开发科学研究协议时,这是一个问题,因为通常对控制变量是件好事,以便在两个人群之间尽可能少的差异。据/p>
这里的所有例子都依赖于撞机,以某种方式涉及两个选项总结。然而,煤机通常可以是涉及另外两个事件的任何功能。在SIMPSON的CALTECH入学率的悖论之下,据S.pan class="katex"> 和据S.pan class="katex"> 是申请人性别和部门,撞机是入学率。据/p>
引用据/h2>
[1] Paulos,John Allen。SAT得分真的预测成功吗?据em>ABC新闻据/em>。从2016年3月4日从http://abcnews.go.com/technology/whoscounting/story?id = 98373&page=1据/p>
[2] Westreich D. Berkson的偏见,选择偏见和缺少数据。流行病学(剑桥,质量)。2012; 23(1):159-164。DOI:10.1097 / EDE.0B013E31823B6296。据/p>
[3]伊利诺伊大学在芝加哥。偏见研究设计。从2016年3月7日检索http://www.uic.edu/classes/epid/epid401/lectures/lecture4.pdf据/p>
[4]埃莱恩伯格,约旦。为什么英俊的男人这样的混蛋?据em>大西洋组织。据/em>从2016年3月5日从http://www.slate.com/blogs/how检索据em>不是据/em>到据em>是据/em>错误/ 2014/06 / 03 / Berkson据em>S.据/em>谬论据em>为什么据/em>是据em>英俊据/em>男子据em>这样的据/em>jerks.html.据/p>
[5]贝茨,蒂姆。从2016年3月5日从https://en.wikipedia.org/wiki/collider_(epidemiiology)pailedia painture :collider(statistics).png据/p>