连续随机变量-概率密度函数(PDF)
的概率密度函数或PDF格式<一个href="//www.parkandroid.com/wiki/continuous-random-variables-definition/" class="wiki_link" title="连续随机变量" target="_blank">连续随机变量给出连续体中任何结果发生的相对可能性。不像<一个href="//www.parkandroid.com/wiki/discrete-random-variables-definition/" class="wiki_link" title="离散随机变量" target="_blank">离散随机变量,对于连续随机变量,任何单一结果发生的概率为零。概率密度函数给出a中任意值的概率连续集的值。因此,它的大小编码了在某一点附近找到连续随机变量的可能性。
启发式地说,概率密度函数就是连续随机变量的分布,比如<一个href="//www.parkandroid.com/wiki/normal-distribution/" class="wiki_link" title="正态分布" target="_blank">正态分布,它是一个正态分布连续随机变量的PDF。
概率密度函数的定义
随机变量的概率 接受(开或闭)区间内的值 是由函数的积分给出的概率密度函数 :
如果随机变量可以是任意实数,则将概率密度函数归一化,则:
这是因为 取之间的值 和 是1:X确实有值!
与离散情况相比,这些公式可能更有意义,在离散情况下,给出事件发生概率的函数称为概率质量函数 .在离散情况下,结果的概率 发生的是 本身。的概率 在离散情况下由:
概率质量函数归一为1,所以:
求和的所有可能值 .我们可以看到,连续随机变量的类似公式与推广为积分的和是相同的。
某连续随机变量的非归一化概率密度函数 是:
求出 大于1, .
解决方案:
首先,概率密度函数必须归一化。这是通过乘以一个常数来完成的,使总积分为1。计算的积分:
标准化的PDF是:
计算概率 大于1,
需要注意的是,连续随机变量的概率密度函数本身不一定是连续的。
与离散随机变量的情况相反,概率密度函数 连续随机变量的不满足条件 .在区间上均匀分布的连续随机变量 概率密度函数是常数 在 .另一个例子是无界概率密度函数 连续随机变量的值 .
连续随机变量的均值和方差
回想一下,在离散的情况下期望值 一个离散随机变量的可能值的加权平均值 随机变量的:
这个公式很直观。假设有 结果的概率相等 每一个。期望值就是<一个href="//www.parkandroid.com/wiki/arithmetic-mean/" class="wiki_link" title="算术平均值" target="_blank">算术平均值, .在某些结果比其他结果更可能出现的情况下,这些结果应该对预期值贡献更大。
在连续的情况下,同样可以通过用积分和代替和来得到泛化 PDF格式:
假设可能的值 是整条实线。如果 被限制为 或者其他连续区间,积分的极限应该相应地改变。
方差的定义与离散情况相同:
计算 只需要插入 而不是一个 在上述公式中:
连续随机变量的均值和方差不一定是有限的或存在的。<一个href="//www.parkandroid.com/wiki/cauchy-distribution/" class="wiki_link" title="柯西分布" target="_blank">柯西分布连续随机变量是一个均值和方差都未定义的连续随机变量的例子。
表明,<一个href="//www.parkandroid.com/wiki/exponential-distribution/" class="wiki_link" title="指数分布随机变量" target="_blank">指数分布随机变量由标准化PDF格式给出:
也意味着 和方差 .
解决方案:
注意,指数随机变量定义为 范围内 (如果原因不明显,请考虑PDF只对这个范围进行规范化)。用分部积分法分别计算定义均值和方差的期望值:
所以均值确实是 .
方差是: