几何分布gydF4y2Ba

的gydF4y2Ba几何分布gydF4y2Ba直观地说，是一个人在使用一枚加重的硬币掷第一个正面之前必须抛背面的次数的概率分布。它对于需要知道成功可能需要多少次尝试的情形建模是有用的，因此在人口建模、计量经济学、研究的投资回报率(ROI)等方面都有应用。gydF4y2Ba

内容gydF4y2Ba

正式的定义gydF4y2Ba
求几何分布gydF4y2Ba
几何分布的性质gydF4y2Ba
实际应用gydF4y2Ba
另请参阅gydF4y2Ba

正式的定义gydF4y2Ba

不幸的是，几何分布有两种广泛使用的定义，选择使用哪一种是上下文和惯例的问题。幸运的是，它们在精神上是等价的，稍后将会说明这一点。gydF4y2Ba

一个gydF4y2Ba伯努利试验gydF4y2Ba,或gydF4y2Ba伯努利实验gydF4y2Ba，是一个满足两个关键性质的实验:gydF4y2Ba

成功和失败恰好是两种互补的结果。gydF4y2Ba
每次重复实验成功的概率都是相同的。gydF4y2Ba

不幸的是，几何分布有两种截然不同的定义，对于使用哪一种定义没有明确的共识。因此，定义的选择是一个上下文和当地习俗的问题。幸运的是，它们非常相似。进行一系列伯努利试验，直到取得成功gydF4y2Ba随机变量gydF4y2Ba $XgydF4y2Ba$ 被定义为gydF4y2Ba

一系列试验的次数，或者gydF4y2Ba
系列中失败的次数。gydF4y2Ba

在这两种情况下gydF4y2Ba几何分布gydF4y2Ba的概率分布gydF4y2Ba $XgydF4y2Ba$ ．gydF4y2Ba

幸运的是，这些定义在本质上是等价的，因为它们只是彼此的移位版本。由于这个原因，前者有时被称为thegydF4y2Ba将几何分布gydF4y2Ba．根据这一惯例，本文将对几何分布使用后一种定义;特别是,gydF4y2Ba $XgydF4y2Ba$ 表示一系列试验中失败的次数。gydF4y2Ba

例如，考虑滚动一个均匀骰子，直到滚动到1。掷一次骰子是伯努利试验，因为正好有两种可能的结果(要么掷出1，要么不掷1)，它们的概率保持恒定gydF4y2Ba $\压裂{1}{6}gydF4y2Ba$ 而且gydF4y2Ba $\压裂{5}{6}gydF4y2Ba$ ．结果乘以1的次数是gydF4y2Ba不gydF4y2Baroll用随机变量表示gydF4y2Ba $XgydF4y2Ba$ 的几何分布为的概率分布gydF4y2Ba $XgydF4y2Ba$ ．gydF4y2Ba

求几何分布gydF4y2Ba

有概率的几何分布gydF4y2Ba $pgydF4y2Ba$ 成功的概率恰好gydF4y2Ba $kgydF4y2Ba$ 失败总是发生在第一次成功之前gydF4y2Ba

$(1 - p) ^ kp。gydF4y2Ba$

这被写成gydF4y2Ba ${公关}\文本(X = k)gydF4y2Ba$ ，表示随机变量gydF4y2Ba $XgydF4y2Ba$ 等于gydF4y2Ba $kgydF4y2Ba$ ,或者gydF4y2Ba $g (k, p)gydF4y2Ba$ ，表示带参数的几何分布gydF4y2Ba $kgydF4y2Ba$ 而且gydF4y2Ba $pgydF4y2Ba$ ．gydF4y2Ba

注意，几何分布满足存在的重要性质gydF4y2Ba无记忆gydF4y2Ba这意味着，如果在某一给定点尚未发生成功，则附加失败数量的概率分布不依赖于已经观察到的失败数量。例如，假设一个骰子正在滚动，直到观察到1。如果提供了附加信息，即骰子已经掷了三次而没有观察到1，则进一步掷的次数的概率分布与没有附加信息时相同。gydF4y2Ba

这个事实也可以从上面的公式观察到，作为开始gydF4y2Ba $kgydF4y2Ba$ 的相对概率不受任何特定值的影响gydF4y2Ba $X = kgydF4y2Ba$ ．这是因为连续的概率形成了agydF4y2Ba几何级数gydF4y2Ba这也是该发行版的名称。gydF4y2Ba

掷骰子直到出现1。由此产生的几何分布是什么?gydF4y2Ba

一次试验成功的概率是gydF4y2Ba $\压裂{1}{6}gydF4y2Ba$ ，所以可以直接使用上面的公式:gydF4y2Ba

${公关}\开始{对齐}\文本(X = 0) & = \境(\压裂{5}{6}\境)^ 0 \压裂{1}{6}\大约.166 \ \ \文字{公关}(X = 1) & = \境(\压裂{5}{6}\境)^ 1 \压裂{1}{6}\大约.139 \ \ \文字{公关}(X = 2) & = \境(\压裂{5}{6}\境)^ 2 \压裂{1}{6}\大约.116 \ \ \文字{公关}(X = 3) & = \境(\压裂{5}{6}\境)^ 3 \压裂{1}{6}\大约.096 \ \ & \ vdots \{对齐}结束gydF4y2Ba$

这也可以用图片来表示，如下图所示:gydF4y2Ba $带$p=\frac{1}{6}$的几何分布gydF4y2Ba$ 的几何分布gydF4y2Ba $p = \压裂{1}{6}gydF4y2Ba$

有一天你很无聊，决定继续抛一枚不公平的硬币，直到它背面朝上。它有一个gydF4y2Ba $60 \ %gydF4y2Ba$ 正面朝上的概率。如果有人跟踪你gydF4y2Ba $N ^ \文本{th}gydF4y2Ba$ 翻转，概率gydF4y2Ba $NgydF4y2Ba$ 3的整数倍数是否可以表示为gydF4y2Ba $\压裂{一}{b}gydF4y2Ba$ ,在那里gydF4y2Ba $一个gydF4y2Ba$ 而且gydF4y2Ba $bgydF4y2Ba$ 是互素正整数。找到gydF4y2Ba $a + b。gydF4y2Ba$

几何分布的性质gydF4y2Ba

有几个重要的值可以提供关于特定概率分布的信息。最重要的是:gydF4y2Ba

的gydF4y2Ba的意思是gydF4y2Ba或gydF4y2Ba期望值gydF4y2Ba的分布提供了有用的信息关于从大量重复试验中期望的平均值。gydF4y2Ba
的gydF4y2Ba中位数gydF4y2Ba的值是集中趋势的另一种度量方法，当分布包含gydF4y2Ba离群值gydF4y2Ba(即特别大/小的值)，使平均值具有误导性。gydF4y2Ba
的gydF4y2Ba模式gydF4y2Ba的值是发生概率最大的值。gydF4y2Ba
的gydF4y2Ba方差gydF4y2Ba分布度量数据的“分布程度”。相关的是gydF4y2Ba标准偏差gydF4y2Ba——方差的平方根——因为与数据的单位相同而有用。gydF4y2Ba

其中的三个值——均值、众数和方差——通常可以对几何分布进行计算。然而，一般不确定中位数。gydF4y2Ba

最容易计算的是众数，因为它在所有情况下都等于0，除了一些琐碎的情况gydF4y2Ba $p = 0gydF4y2Ba$ 其中每个值都是模式。这是因为gydF4y2Ba $p > (1 - p) ^ kpgydF4y2Ba$ 当gydF4y2Ba $p > 0gydF4y2Ba$ ．gydF4y2Ba

平均值有点难以计算，但它是相当直观的:gydF4y2Ba

有参数的几何分布的均值gydF4y2Ba $pgydF4y2Ba$ 是gydF4y2Ba $p \压裂{1 - p} {}gydF4y2Ba$ ,或gydF4y2Ba $\压裂{1}{p} 1gydF4y2Ba$ ．gydF4y2Ba

最简单的证明包括计算移位几何分布的平均值，并将其应用于正态几何分布。在移位的几何分布中，假设试验的期望次数为gydF4y2Ba $EgydF4y2Ba$ ．有一种可能性gydF4y2Ba $pgydF4y2Ba$ 只有一次试验是必要的，而且有可能gydF4y2Ba $1 - pgydF4y2Ba$ 达到相同的情况，在这种情况下，试验的预期次数再次gydF4y2Ba $EgydF4y2Ba$ (这是无记忆分布这一事实的结果)。因此，方程gydF4y2Ba

$E = p(1)+(1-p)(E+1) \隐含E = (1-p)E+1gydF4y2Ba$

持有,所以gydF4y2Ba $E = \压裂{1}{p}gydF4y2Ba$ ．gydF4y2Ba

因此，期望值的个数gydF4y2Ba失败gydF4y2Ba在达到成功之前比总试验次数少一次，这意味着预期失败的次数是gydF4y2Ba $\压裂{1}{p} 1 = \压裂{1 - p} {p}gydF4y2Ba$ ．gydF4y2Ba $_ \广场gydF4y2Ba$

注意，这具有直观意义:例如，如果事件具有gydF4y2Ba $\压裂{1}{5}gydF4y2Ba$ 每天发生的概率，很自然地期望事件会在5天内发生。gydF4y2Ba

类似的策略可以用于方差:gydF4y2Ba

有参数的几何分布的方差gydF4y2Ba $pgydF4y2Ba$ 是gydF4y2Ba $p ^ \压裂{1 - p} {2}gydF4y2Ba$ ．gydF4y2Ba

注意，几何分布的方差和移位几何分布的方差是相同的，因为方差是度量gydF4y2Ba分散gydF4y2Ba，它不受移动的影响。gydF4y2Ba

几何分布有一个有趣的特性，即不易记忆。让gydF4y2Ba $XgydF4y2Ba$ 是几何分布的随机变量，并且gydF4y2Ba $rgydF4y2Ba$ 而且gydF4y2Ba $年代gydF4y2Ba$ 两个正实数。根据这个性质gydF4y2Ba

$\text{P}(X>r+s | X>r) = {P}(X>s)。gydF4y2Ba$

实际应用gydF4y2Ba

几何分布对于确定在有限次数的试验下成功的可能性是有用的，它高度适用于无限(和无限制)试验非常罕见的现实世界。因此，用几何分布很好地模拟各种场景也就不足为奇了:gydF4y2Ba

在体育运动中，特别是在棒球运动中，几何分布有助于分析击球手在三振出局前打出安打的概率;这里的目标是在3次试验中获得成功。gydF4y2Ba
在成本效益分析中，例如一家公司决定是否资助试验研究，如果试验成功，将为公司带来一些估计利润，其目标是在成本超过潜在收益之前取得成功。gydF4y2Ba
在时间管理中，目标是在规定的时间内完成任务。gydF4y2Ba

与上述应用程序类似的其他应用程序也很容易构建;事实上，几何分布是在日常生活中规律地应用在直观层面上的。gydF4y2Ba

棒球运动员在任何投球中都有30%的机会被击中。忽略球，球员在三振出局(三振出局)前打出一个安打的概率是多少?gydF4y2Ba

在这个例子中，成功是击中，失败是击中。玩家需要有0次，1次或2次失败才能在三振出局前获得击中，所以击中的概率是gydF4y2Ba

$\{公关}{对齐}\文本(X = 0) +文本\{公关}(X = 1) +文本\{公关}(X = 2) & =(0.7)(0.3) +(0.7) ^ ^ 0 1(0.3) +(0.7) ^ 2(0.3) \ \ \ \ & = 0.657。\ \ _ \广场结束{对齐}gydF4y2Ba$

这种概率的知识是有用的，例如，在决定是否有意让击球手保送(希望下一个击球率较低的击球手将三振出局)。gydF4y2Ba

程序员每次编译代码都有90%的机会发现错误，而每次发现错误都需要花费两个小时来重写代码。他在一天工作结束前完成项目的概率是多少?gydF4y2Ba

假设一个工作日是8小时，程序员在一天的开始立即编译他的代码。gydF4y2Ba

在本例中，成功是没有bug的编译，而失败是发现bug。程序员需要有0、1、2或3次失败，所以他完成程序的概率为gydF4y2Ba

$\{公关}{对齐}\文本(X = 0) +文本\{公关}(X = 1) +文本\{公关}(X = 2) +文本\{公关}(X = 3) & =(0.9)(0.1) +(0.9) ^ ^ 0 1(0.1) +(0.9) ^ 2(0.1) + 3(0.1)(0.9) ^ \ \ \ \ & \约0.344。\ \ _ \广场结束{对齐}gydF4y2Ba$

这些信息有助于确定程序员是否应该在这段时间内编写程序或执行其他任务。gydF4y2Ba

测试gydF4y2Ba

有关……gydF4y2Ba

内容gydF4y2Ba