迭代期望定律
的迭代期望定律表示a的期望值随机变量等于随机变量期望值的和吗条件第二个随机变量。直观地说,该定律表明,事件的预期结果可以用生活环境调查它取决于事件的可能结果;例如,如果明天下雨的概率取决于今天下雨的概率,并且以下所有的情况都是已知的:
- 今天下雨的可能性
- 明天下雨的可能性鉴于今天下雨了
- 明天下雨的可能性鉴于它做的不今天下雨
把今天下雨/今天没下雨这两种情况依次考虑,就可以计算出明天下雨的概率。为了使用具体的数字,假设
- 今天下雨的概率是70%
- 如果今天下雨,明天就会下雨,概率为30%
- 今天不下雨,明天下雨的概率是90%
在这种情况下,明天下雨的概率是
迭代期望定律适用于概率分布两者都是随机变量 还有一个条件随机变量 的概率分布 是理想的。这种情况在实践中极为常见,尤其是在经济学而且扑克.
内容
正式的定义
例子
例如,考虑一个篮球明星,他在没有防守的情况下得分(2分)的比例是80%,但在防守的情况下只有40%。面对团队当前的对手,玩家70%的时间会被防守。然后,当玩家射击时,迭代期望定律表示:
因此,球员每次获得控球权平均得分为1.04分。
这条定律对对方有实际的应用:对于每一个防守方案,只要对方知道,他们就可以计算出对方会得多少分(平均)
- 每个球员被防守的频率是多少
- 每个球员在被防守时的投篮能力如何,以及他们在无人防守时的投篮能力如何
这让对手可以选择最好的防御方案。
贝叶斯定理和联合分布
一个可以简化推理的重要定理是联合分布定律:
这个定理有逻辑意义:事件发生的概率 而且 两者发生的概率是一样的 发生,那么 发生。的概率 仅仅是发生 的概率 随后发生的是 .同样地,顺序可以颠倒,得到第二个等式。
注意,当 是独立的,这条定律变得更熟悉了吗 .
这个定理很重要,因为它允许计算 鉴于 而且 ,这是有用的 在迭代期望法则中使用。
这个规律也可以重新排列成贝叶斯定理,声明:
这允许与上面相同的计算。