贝叶斯的定理和条件概率
解释违反直觉的结果
概率问题对于产生令人惊讶和违反直觉的结果是臭名昭着的。一个着名的例子 - 或者一对示例 - 是以下内容:
一对夫妇有2个孩子,老儿是一个男孩。如果有一个男孩或女孩的概率均为50%,那对夫妻有两个男孩的可能性是什么?
我们已经知道老年人是一个男孩。两个男孩的概率相当于年轻孩子是一个男孩的概率,这是 。一对夫妇有两个孩子,其中至少一个是男孩。如果生男孩或女孩的概率都是 ,这对夫妇生两个男孩的概率是多少?
乍一看,这似乎询问了同样的问题。我们可能是如下所示:“我们知道一个是一个男孩,所以唯一的问题是是否是一个男孩,而且是这种情况的机会 . 所以一种gain, the answer is .”
这是完美的感觉。它也发生了不正确。
推导贝叶斯的定理
Bayes定理的中心是关联不同的条件概率. 条件概率是一个事件发生概率的表达式鉴于此发生了一些其他事件(固定值)。例如,“人行道湿湿的可能性是什么?”将具有不同的答案而不是“人行道湿的概率是什么?鉴于此下雨早了?”
为一个联合概率分布过度活动 和 那 的条件概率 给予 被定义为
在人行道示例中,在哪里 是“人行道是湿”的 是“下雨早了”,这句话的意思是“考虑到下雨早了,人行道湿的概率等于人行道湿的概率和下雨的概率。”
注意 两者的概率是多少 和 发生的概率,与发生的概率相同 发生的次数 考虑到 发生了: 使用相同的推理, 是也可能性 发生概率的倍数 考虑到 发生: . 这两个表达式相等的事实导致了贝叶斯定理。用数学表示,这是:
注意,当事件独立时,我们对相依事件和Bayes定理的结果都是有效的。在这些情况下, 和 ,因此表达式简化。
贝叶斯的定理
虽然这是一个等式,适用于事件的任何概率分布 和 ,它在案例中具有特别好的解释 代表一个假设 和 代表一些观察到的证据 。在这种情况下,可以写入公式
这与获得证据之前假设的概率有关 在获得证据后假设的概率, . 因此,, 被称为之前的概率, 尽管 被称为后验概率。与之相关的因素, ,称为似然比。使用这些术语,贝叶斯定理可以被重建为“后验概率等于概率比例比例”。
如果从扑克牌的标准甲板中汲取单张卡,则卡是国王的概率是4/52,因为标准甲板的52张卡片有4个国王。重写这个,如果 事件是“这张卡是国王”的现有概率
如果提供了证据(例如,有人看卡),单张卡是面部卡,然后是后验概率 可以使用贝叶斯定理来计算:
因为每个国王也是一张脸卡, . 因为每件衣服有3张脸牌(杰克、王后、国王),所以脸牌的概率是 。结合这些给出了似然比 。
使用贝叶斯定理给予 。
贝叶斯定理从第一部分澄清了双子问题:
1.一对夫妇有两个孩子,其中较大的是一个男孩。他们有两个男孩的概率是多少?
一对夫妇有两个孩子,其中一个是一个男孩。他们有两个男孩的可能性是什么?
定义三个事件, 那 ,及 , 如下:
问题1正在要求 和问题2要求 . 第一个是使用更简单的Bayes定理计算的:
找到 ,我们必须确定 ,这对夫妇至少有一个男孩的概率。这是等于的 。因此所需的概率是
对于类似的矛盾问题,请参见蒙蒂大厅问题。
可视化贝叶斯定理
Venn图表对于可视化贝叶斯定理特别有用,因为图表和定理都是关于查看不同空间的不同事件的交叉点。
在100人中5人中有5个疾病,并进行了90%的测试(意味着测试产生90%的病例的正确结果)给予100人。如果小组中的一个人测试阳性,那么这个人有疾病的可能性是什么?
直观的答案是,一个人有90%的可能患有这种疾病。但是我们可以想象这是不准确的。首先,画出总人口和5名患病者:
圆圈A代表100岁的5,或5%的100人宇宙的5%。
接下来,覆盖一个圆圈来表示在测试上获得积极结果的人。我们知道90%的疾病将获得积极的结果,因此需要覆盖90%的圈子,但我们也知道10%的人口没有疾病会得到积极的结果,所以我们需要覆盖10%的非疾病携带人口(100岁的宇宙的总宇宙a)。
圆形B覆盖总人口的大部分。它实际上涵盖了比患有疾病的人口的总部更多的区域。这是因为100人口中的14个(患有5人的90%的疾病+ 95人没有这种疾病的10%)将获得积极的结果。即使这是一个具有90%的准确度的测试,这种可视化也表明,任何测试疾病的阳性(圆B)的患者只有32.14%(4.5英寸)的实际疾病的可能性。
诊断疾病
主要文章:贝叶斯理论科学与数学理论
贝叶斯的定理可以表现出在科学研究中获得误报的可能性。可以在深入的视图中找到贝叶斯理论科学与数学理论。
据说许多医学诊断测试都是无效的 特别是准确,例如99%准确,具体参考测试结果对您的条件(或缺乏)进行测试结果。这与鉴于测试结果的疾病的后验概率不同。要在行动中看到这一点,请考虑以下问题。
更多例子
标记为1到20的球放置在袋子中。在没有替代的情况下从袋子中抽出三个球。所有球在它们上有奇数的可能性是什么?
在这种情况下,事件不是独立的。会有 任何特定球是奇怪的机会。但是,所有球都是奇数的概率不是 。我们确实有第一球是奇数的概率是 对于第二个球,鉴于第一球是奇数的,只有9个奇数球,可以从总共19个球中汲取,因此概率是 。对于第三球,由于前两个都是奇数,因此存在8个奇数球,可以从总共18个球中汲取8个奇数球。所以概率是 。
所以所有3个球都是奇数的概率是 注意 , 然而
一个家庭有两个孩子。假设其中一个孩子是男孩,那么两个孩子都是男孩的概率是多少?
我们假设孩子是男孩或女孩的概率是 。我们使用贝叶斯定理来解决这个问题。我们让我们 如果一个家庭有一个男孩。我们让 这两个孩子都是男孩。我们想找到 。我们很容易看到 。我们还注意到了 和 . 所以 。
一个家庭有两个孩子。考虑到其中一个孩子是男孩,而且他出生在星期二,那么两个孩子都是男孩的可能性有多大?
你对这个问题的第一反应可能是回答 ,因为这显然是与前一个问题相同的问题。知道孩子出生的日期不可能给你更多的信息,对吗?
让我们假设一周中某一天出生的概率为 而且与孩子是男孩还是女孩无关。我们让 是这个家庭有一个孩子的活动,是一个男孩星期二出生的男孩 这是一个孩子都是男孩,并申请贝叶斯定理。我们马上注意到 不再等于一个。鉴于本周7天,两个男孩出生的一周中有49个可能的组合,其中13个有一个男孩在星期二出生,所以 。 仍然保持不变 。计算 ,我们注意到 选择性别和孩子出生日期的可能方法。其中有 没有男孩在周二出生的方式,以及 哪个,所以 。这给出了这一点 。
笔记:这个答案肯定不是 ,实际上更接近 。