几何分布G.ydF4y2Ba
当G.ydF4y2Ba几何分布G.ydF4y2Ba,直观地讲,是尾部使用加权硬币第一头之前必须翻转的数量的概率分布。这是模拟在有必要知道多少次尝试是成功的必要可能情况下非常有用,因而具有应用到人口模型,计量经济学研究的投资回报(ROI),等等。G.ydF4y2Ba
正式定义G.ydF4y2Ba
不幸的是,两个广泛使用的几何分布的定义,以及使用它的选择是语境和公约的问题。幸运的是,它们的精神相当,正如暂时显示的那样。G.ydF4y2Ba
一种G.ydF4y2Ba伯努利试用G.ydF4y2Ba或者G.ydF4y2Ba伯努利实验G.ydF4y2Ba,是满足两个关键特性的实验:G.ydF4y2Ba
- 究竟有两个补充结果,成功和失败。G.ydF4y2Ba
- 每次重复实验时,成功的概率就是相同的。G.ydF4y2Ba
不幸的是,几何分布有两个不同的定义,没有明确的共识将使用它。因此,定义的选择是语境和当地会议的问题。幸运的是,他们非常相似。一系列伯努利试验,直到成功发生,而且G.ydF4y2Ba随机变量G.ydF4y2Ba 被定义为G.ydF4y2Ba
- 试验系列中的数量,或者G.ydF4y2Ba
- 系列中的故障次数。G.ydF4y2Ba
在这两种情况下,G.ydF4y2Ba几何分布G.ydF4y2Ba被定义为概率分布G.ydF4y2Ba .G.ydF4y2Ba
幸运的是,这些定义基本上是等同的,因为它们只是移动彼此的改变版本。出于这个原因,前者有时被称为G.ydF4y2Ba移位几何分布G.ydF4y2Ba.按照这种约定,本文将使用的几何分布后者定义;特别是,G.ydF4y2Ba 表示在一系列试验中失败的次数。G.ydF4y2Ba
例如,考虑滚动一个公平的骰子,直到滚动到1。掷一次骰子是伯努利试验,因为只有两种可能的结果(掷出1或不掷出1),它们的概率保持不变G.ydF4y2Ba 和G.ydF4y2Ba .将得到的次数a 1是G.ydF4y2Ba不是G.ydF4y2Ba滚动用随机变量表示G.ydF4y2Ba ,几何分布是概率分布G.ydF4y2Ba .G.ydF4y2Ba
寻找几何分布G.ydF4y2Ba
几何分布的概率G.ydF4y2Ba 成功,精确的概率G.ydF4y2Ba 之前第一次成功是在故障发生G.ydF4y2Ba
这被写成G.ydF4y2Ba ,表示随机变量的概率G.ydF4y2Ba 等于G.ydF4y2Ba 或者G.ydF4y2Ba ,表示与参数的几何分布G.ydF4y2Ba 和G.ydF4y2Ba .G.ydF4y2Ba
需要注意的是几何分布满足作为重要财产G.ydF4y2Ba记忆G.ydF4y2Ba,这意味着,如果还未在某个特定点发生了成功,另外的失败次数的概率分布并不依赖于已经观察到失败的次数。例如,假设模具被卷起,直到1是观察。如果附加信息被提供的模已经轧制三次未经1个被观察,还辊的数目的概率分布是相同的,因为这将是没有附加信息。G.ydF4y2Ba
这个事实也可以从上面的公式中看出,作为开始G.ydF4y2Ba 来自任何特定值不会影响的相对概率G.ydF4y2Ba .这是由于一个事实,即连续概率形成G.ydF4y2Ba几何系列G.ydF4y2Ba,这也将其名称借给分发。G.ydF4y2Ba
滚动骰子直至发生1。由此产生的几何分布是什么?G.ydF4y2Ba
单项试验成功的概率是G.ydF4y2Ba ,因此上述公式可直接使用:G.ydF4y2Ba
这也可以以图形表示,如下面的图:G.ydF4y2Ba
几何分布的属性G.ydF4y2Ba
有几个重要的值,提供有关特定概率分布的信息。最重要的是如下:G.ydF4y2Ba
- 当G.ydF4y2Ba的意思是G.ydF4y2Ba或G.ydF4y2Ba预期价值G.ydF4y2Ba分发提供了有关从大量重复试验期望的平均视线的有用信息。G.ydF4y2Ba
- 当G.ydF4y2Ba中位数G.ydF4y2Ba分布的是集中趋势的另一项措施,有用当分配包含G.ydF4y2Ba离群值G.ydF4y2Ba(即特别大/小的值)使平均值具有误导性。G.ydF4y2Ba
- 当G.ydF4y2Ba模式G.ydF4y2Ba一个分布的值是具有最高发生概率的值。G.ydF4y2Ba
- 当G.ydF4y2Ba方差G.ydF4y2Ba分配措施如何“展开”数据是如何。相关是G.ydF4y2Ba标准偏差G.ydF4y2Ba-方差的平方根-很有用,因为和数据的单位相同。G.ydF4y2Ba
平均值,模式,和方差 - - 这些值中的三个是通常可计算为几何分布。中位数,但是,是不是一概而论。G.ydF4y2Ba
最简单的计算是模式,因为它在所有情况下都是等于0的,除了琐碎的情况G.ydF4y2Ba 其中每个值都是模式。这是由于这一事实G.ydF4y2Ba 什么时候G.ydF4y2Ba .G.ydF4y2Ba
平均值略微难以计算,但它相当直观:G.ydF4y2Ba
用参数的几何分布的平均值G.ydF4y2Ba 是G.ydF4y2Ba 或者G.ydF4y2Ba .G.ydF4y2Ba
最简单的证明包括计算移位几何分布的均值,并将其应用于正态几何分布。在移位的几何分布中,假设试验的期望次数为G.ydF4y2Ba .有一个概率G.ydF4y2Ba 只有一个试验是必要的,并且概率G.ydF4y2Ba 达到了相同的场景,在这种情况下,预期的试验次数也是如此G.ydF4y2Ba (这是分布无记忆的事实的结果。因此,等式G.ydF4y2Ba
持有,所以G.ydF4y2Ba .G.ydF4y2Ba
其结果是,数量的预期值G.ydF4y2Ba失败G.ydF4y2Ba在达到成功之前,比试验总数少,这意味着预期的失败次数是G.ydF4y2Ba .G.ydF4y2Ba
请注意,这使得直观感:例如,如果事件有一个G.ydF4y2Ba 每天发生的概率,这是很自然的期望的事件会发生在5天。G.ydF4y2Ba
类似的策略可用于方差:G.ydF4y2Ba
具有参数的几何分布的方差G.ydF4y2Ba 是G.ydF4y2Ba .G.ydF4y2Ba
注意,几何分布的方差和移位几何分布的方差是相同的,因为方差是一种量度G.ydF4y2Ba分散G.ydF4y2Ba,这不受移位的影响。G.ydF4y2Ba
几何分布有被记忆的有趣的属性。让我们G.ydF4y2Ba 是几何分布的随机变量,并且G.ydF4y2Ba 和G.ydF4y2Ba 两个正实数。然后,通过这个属性G.ydF4y2Ba
实际应用G.ydF4y2Ba
几何分布对于确定有限数量的试验的成功的可能性是有用的,这是对现实世界的高度适用,其中无限制(和不受限制)试验罕见。因此,它不成富的是,各种场景被几何分布更好地建模:G.ydF4y2Ba
- 在运动中,特别是在棒球中,几何分布可用于分析票据在收到三次罢工之前击中的可能性;在这里,目标是在3次试验中取得成功。G.ydF4y2Ba
- 在成本效益分析中,如公司决定是否资助研究试验,如果成功,将获得公司一些估计利润,目标是在成本超过潜在收益之前取得成功。G.ydF4y2Ba
- 在时间管理中,目标是在一定程度的时间之前完成任务。G.ydF4y2Ba
其它应用中,与上述类似的,很容易构成为好;事实上,几何分布适用于日常生活中定期直观的水平。G.ydF4y2Ba
棒球运动员有得到命中在任何给定的间距的30%的机会。忽略球,什么是概率,他触击(这需要三个罢工)之前,玩家赢得一击?G.ydF4y2Ba
在这种情况下,成功是一个打击,失败是罢工。玩家需要有0,1或2个故障,以便在突出之前得到一个击中,所以击中的可能性是G.ydF4y2Ba
例如,对这种概率的了解是有用的,例如,在决定是否有意地走出击球手(希望下一个击球率较低的击球率较低的击球手来罢工)。G.ydF4y2Ba
一个程序员来说找到一个bug都被他自己的编译代码时,90%的机会,这需要他两小时内每他发现一个错误的时间重新编写一行代码。那是什么,他将他的工作结束时把他的节目的概率是多少?G.ydF4y2Ba
假设一个工作日是8小时,程序员在一天的开始立即编译他的代码。G.ydF4y2Ba
在这种情况下,成功是没有bug的编译和失败是一个错误的发现。程序员需要有0,1,2,或3的故障,以便他完成他的节目的概率是G.ydF4y2Ba
此信息对于确定程序员是否应该在此期间撰写计划或执行其他一些任务的程序。G.ydF4y2Ba