超距离分布
这超几何分布直观地,从一套红色和蓝色大理石绘制的红色大理石的数量的概率分布,而不替代大理石。相比之下,二项分布测量红色弹珠的数量的概率分布替换弹珠。它适用于观察到的信息不能重复发生的情况,如扑克(和其他纸牌游戏),在这种情况下,遵守一张牌意味着它不会在手中再次被抽出。它也适用于二项分布有用的许多相同的情况,包括风险管理和统计意义。
正式的定义
考虑A.人口和属性,该属性采用两个互斥国家之一,并且人口的每个成员都是这两个州之一。例如,属性可能是“超过/下方30岁,”“是/不是律师,”“通过/失败一个测试”等。此外,人口将被取样没有更换,意味着绘制不是独立的:每次抽签都会影响下一个,因为每次抽取都会降低人口的大小。
鉴于人口的规模 和人数 具有期望的属性,超细分布测量完全绘制的概率 患有所需属性的人 试用
例如,如果已知一袋大理石包含10个红色和6个蓝色大理石,则可以使用超细分布来找到3个绘制的大理石的概率是红色的。
找到HyperGeometic分布
如果人口大小是 ,所需属性的人数是 ,有 绘制,绘制的可能性 具有所需属性的人是
这个公式可以通过选择得到 的 可能成功 方式,然后选择 的 可能的失败 ,最后算出总数 可能的 人吸引。
一袋大理石包含13个红色大理石和8个蓝色大理石。如果从袋中汲取五个大理石,那么由此产生的长度分布是什么?
这里的人口规模是 , 有 具有所需属性(发红)的对象,有5个绘图。然后上述公式直接适用:
这可以被图案表示:
超高度分布的属性
有几个重要的值,提供有关特定概率分布的信息。最重要的是:
- 这的意思是, 或者期望值这一分布给出了关于人们从大量重复试验中预期的平均水平的有用信息。
- 这中位数分布是另一个中央趋势的衡量标准,当分布含量时有用离群值(例如,特别大/小的值)使得平均值具有误导性。
- 这模式一个分布的值是最有可能出现的值。
- 这方差的分布衡量的是数据是如何“散布”的。相关的是标准偏差,方差的平方根,由于与数据相同的单位有用。
这些值中的三个 - 平均值,模式和方差 - 通常是可计算的超高度分布。然而,中位数通常不确定。
均值很直观,和a的均值一样二项分布:
意思是 是
该模式明显更复杂:
的模式 是
方差更涉及:
方差 是
同样值得注意的是,正如预期的那样,这两种情况的概率 总结1:
结果是什么范德蒙的身份。
此外,问题的对称性给出了以下身份:
实际应用
正如在介绍中所提到的,纸牌游戏是超几何分布使用的绝佳例证。下面是一个例子:
在德州扑克(Texas Hold'em)游戏中,玩家每人拿到两张私人牌,五张社区牌面朝上放在桌上。每个玩家用自己的两张私人牌和五张社区牌做出最好的5张牌。某一特定玩家得到黑桃同花顺(即5个黑桃)的概率是多少?
这种情况可以通过超几何分布来建模,其中总体大小为52(纸牌的数量),具有所需属性(黑桃)的对象数量为13,有7次平局。玩家至少需要5次成功,所以概率是
在已经观察到某些信息,也可以使用它。这是另一个例子:
鲍勃正在玩Texas Hold'em,他的两张私人牌都是黑桃。他用黑桃红叶的概率是什么?
这种情况可以通过长度测量分布来建模,其中人口大小为50(剩余卡的数量),具有所需属性(SHADES)的剩余物体的数量为11,并且有5个绘图。玩家需要至少3个成功,因此概率是
超距离测试
这超几何检验用于确定统计学意义画画 具有尺寸群体的所需属性的物体 和 具有所需属性的对象的总数。换句话说,它测试一个样本是否真的是随机的,或者它是否代表了一个特定的人口统计。