贝叶斯定理和条件概率
解释违反直觉的结果
概率问题对于产生令人惊讶和违反直觉的结果是臭名昭着的。一个着名的例子 - 或者一对示例 - 是以下内容:
一对夫妇有2个孩子,老儿是一个男孩。如果有一个男孩或女孩的概率均为50%,那对夫妻有两个男孩的可能性是什么?
我们已经知道老年人是一个男孩。两个男孩的概率相当于年轻孩子是一个男孩的概率,这是 .一对夫妇有两个孩子,其中至少一个是男孩。如果生男孩或女孩的概率都是 ,这对夫妇有两个男孩的概率是多少?
乍一看,这似乎是问同样的问题。我们不妨推理如下:“我们知道,一个是男孩,所以唯一的问题是另外一个是男孩,和的机会,既然如此有 .也是,答案是 .”
这是完美的感觉。这也恰好是不正确的。
推导贝叶斯的定理
贝叶斯定理的中心是关联不同条件概率.条件概率是一个事件发生的概率的表达式考虑到发生某些其他事件(一个固定值)。举例来说,“那是什么人行道是湿的概率是多少?”都会有不同的答案不是“是什么,该人行道是湿的概率考虑到早些时候下雨了?”
为一个联合概率分布在事件 和 那 的条件概率 给予 被定义为
在人行道例如,当 是“人行道是湿”的 “雨下得早”,这个表达的意思是“如果雨下得早,人行道湿的概率等于人行道湿的概率和下雨的概率。”
注意 两者的概率是多少 和 发生的概率,也就是 发生的次数 发生鉴于 发生: 使用相同的推理, 是也的概率 发生概率的倍数 发生鉴于 发生: .这两个表达式相等的事实引出了贝叶斯定理。用数学方法表示,这是:
注意,当事件是独立的时,我们对相关事件和贝叶斯定理的结果都是有效的。在这些情况下, 和 ,所以表达式简化了。
贝叶斯的定理
虽然这是一个等式,适用于事件的任何概率分布 和 ,它的情况下特别好的解释 代表一个假设 和 代表了一些观察到的证据 .在这种情况下,该公式可写成
这与在得到证据之前假设的概率有关 ,在假设获得证据后的概率, .由于这个原因, 被称为之前的概率, 尽管 被称为后验概率.这涉及两个因素, ,称为似然比.使用这些术语,贝叶斯定理可以为‘的后验概率等于先验概率倍似然比。’改写
如果从扑克牌的标准甲板中汲取单张卡,则卡是国王的概率是4/52,因为标准甲板的52张卡片有4个国王。重写这个,如果 事件是“这张卡是国王”的现有概率
如果提供了证据(例如,有人看卡),单张卡是面部卡,然后是后验概率 可使用贝叶斯定理来计算:
因为每个国王也是一张脸卡, .由于每副牌中有3张面牌(杰克、王后、国王),所以出现面牌的概率为 .组合这些给出的似然比 .
使用贝叶斯定理给出 .
贝叶斯定理从第一部分澄清了双子问题:
1.一对夫妇有两个孩子,其中较大的是个男孩。他们有两个男孩的可能性是什么?
一对夫妇有两个孩子,其中一个是一个男孩。他们有两个男孩的可能性是什么?
定义三个事件, 那 , , 如下:
问题1是要求 和问题2要求 .第一个是用贝叶斯定理的简化版本计算的:
找到 ,我们必须确定 ,这对夫妇至少有一个男孩的概率。这是等于的 .因此所期望的概率
有关类似的矛盾问题,请参阅蒙蒂大厅问题.
可视化贝叶斯定理
Venn图表对于可视化贝叶斯定理特别有用,因为图表和定理都是关于查看不同空间的不同事件的交叉点。
在100人中5人中有5个疾病,并进行了90%的测试(意味着测试产生90%的病例的正确结果)给予100人。如果小组中的一个人测试阳性,那么这个人有疾病的可能性是什么?
直觉的答案是,一个人有90%的可能患有这种疾病。但我们可以想象一下,这是不准确的。首先,绘制人口总数和患病的5人:
圆圈A表示5超过100,或100人的较大宇宙的5%。
接下来,覆盖一个圆圈代表谁得到的试验阳性结果的人。我们知道,90%的人与疾病会得到一个积极的结果,因此需要支付90%的圆A的,但我们也知道人口的10%谁没有这种疾病会得到一个积极的结果,所以我们需要以覆盖非疾病携带人口的10%(100更少圆A的总宇宙)。
圆形B覆盖总人口的大部分。它实际上涵盖了比患有疾病的人口的总部更多的区域。这是因为100人口中的14个(患有5人的90%的疾病+ 95人没有这种疾病的10%)将获得积极的结果。即使这是一个具有90%的准确度的测试,这种可视化也表明,任何测试疾病的阳性(圆B)的患者只有32.14%(4.5英寸)的实际疾病的可能性。
诊断疾病
主要文章:在科学和数学贝叶斯理论
贝叶斯定理可以显示在科学研究得到误报的可能性。在深入看看这款可以发现在科学和数学贝叶斯理论.
据说很多医学诊断测试 %准确,例如99%准确,具体指的是在你的情况下测试结果正确(或不正确)的概率。这与根据测试结果得出的患此病的后验概率不同。要了解实际情况,请考虑以下问题。
更多例子
编号为1至20的球被放置在一个袋中。三个球被拉出袋子无需更换。什么是所有的球对他们奇数的概率是多少?
在这种情况下,事件不是独立的。会有一个 的机会,任何特定的球是奇数。然而,所有的球都是奇数的概率不大 .我们确实有第一球是奇数的概率是 对于第二个球,鉴于第一球是奇数的,只有9个奇数球,可以从总共19个球中汲取,因此概率是 .对于第三个球,因为前两个球都是奇数,所以剩下的18个球中有8个是奇数。所以概率是 .
所以3个球都是奇数的概率是 注意 , 然而
一个家庭有两个孩子。假设其中一个孩子是男孩,两个孩子都是男孩的概率是多少?
我们假设一个孩子的概率是男孩还是女孩 .我们使用贝叶斯定理来解决这个问题。我们让我们 当这个家庭有一个男孩的时候。我们让我们 因为两个孩子都是男孩。我们想要找到 .我们可以很容易地看到, .我们还注意到, 和 .所以 .
一个家庭有两个孩子。假设其中一个孩子是男孩,他出生在周二,那么两个孩子都是男孩的概率是多少?
你对这个问题的第一反应可能是回答 ,因为这显然和前一个问题是同一个问题。知道孩子出生的日期不可能给你额外的信息,对吧?
我们假设出生在一周中某一天的概率是 与孩子是男孩还是女孩无关。我们让我们 是家里有一个孩子谁是出生在周二和一个男孩事件 是事件,这两个孩子都是男孩,并运用贝叶斯定理。我们注意到立刻意识到 不再等于一个。鉴于本周7天,两个男孩出生的一周中有49个可能的组合,其中13个有一个男孩在星期二出生,所以 . 仍然保持不变 .计算 ,我们注意到有 选择孩子的性别和出生日期的可能方法。其中,有 没有在星期二生下男孩的方法,还有 该做的,所以 .这给出了这一点 .
笔记:这个答案肯定不是 ,实际上更接近于 .