正态分布
当正常分布也被称为高斯分布,是A.概率分布通常用于模拟现象,如物理特征(例如高度,重量等)和测试分数。由于其形状,它通常被称为钟形曲线:
很大程度上中央限制定理,正态分布是即使当底层分布已知是不正常的适当近似。这是方便,因为正态分布是容易获得的估计有;当经验规则状态,通过正态分布建模的数据的68%的平均值的1度标准差,在2点标准差95%以上,并在3个标准偏差为99.7%之内。由于显而易见的原因,经验规则也偶尔被称为68-95-99.7规则。
此外,正常的分布具有许多很好的特性简化,其中许多可从上面的曲线图中观察到。它是对称的,单峰,这意味着其平均数,中位数和众数都是平等的。另外,它还具有“骨感尾巴”,直觉这意味着它“逐渐减少”快速,正式意味着它有一个久星病0。
常态和中心极限定理
许多物理现象,如身高和体重,紧跟正态分布。这是乍一看有点有悖常理,因为正态分布是正无处不在,但它显然是不可能有一个负的高度,但正态分布有够瘦的尾巴,这些概率可以忽略不计。
直观地看,正态分布是“好”,以至于我们预计除非有充足的理由不相信它自然发生。这种直觉是由形式化中央限制定理,哪些说明:
平均的概率分布 独立,相同分布(IID)随机变量会聚到大型的正态分布
事实上, 通常足够观察收敛。直观地,这意味着,可以被表示为独立的因子的组合特性由正态分布良好表示。举例来说,如果我们抛硬币多次,磁头数可以被看作是许多独立同分布的总和随机变量因此,由钟曲线表示良好:
许多自然现象也可以以这种方式进行建模。例如,测量仪器的精确度(例如望远镜)可以被看作是许多独立的部件的制造功效的组合,并且因此是用于经由正态分布建模的良好候选者。
正态分布是在采样特别有用,因为中心极限定理也暗示的平均值,所述分配简单随机样本是正常的。举例来说,如果我们对他们是否喜欢(值为1)或不喜欢(0值)政治家调查的许多选民,只要选民是独立的,政治家的支持率将正态分布无论选民对他们的意见(他们的意见会影响分布的平均值和方差,但不是其形状)。这对Pollssers有用,因为可以使用下一节中的经验规则来相对容易地完成“错误的边缘”。
值得注意的是,并非所有的现象是正常的分布以及建模。即使一种现象可以被表示为许多因素的组合,如果这些因素一个胜过其他人,则分配往往会不正常。
历史测验的学生分数可能是非正常的,因为他们的表现是他们在课堂前读取材料的主导。分布可能是左偏移的。
同样,如果因素不是独立的-e.g。如果上述示例中的选民可以在回答之前听到彼此的回答,那么正常通常也会分解。
2008年的金融危机是可谓的,这些金融危机是由长期遵守股票价格正常的假设造成的,其实仍有畜群心理促使迅速升起/降价。贡献因素之间的依赖性导致分布,尾部的分布比正常分布在一起。
一般来说,这些是粗略的拇指规则,以确定正常性假设是否合适:
拥有 | 失败 |
类似的分布的融合 | 由一个(或少数)特定分布主导 |
贡献因素是独立的 | 贡献因素之间的依赖性 |
样本选择是随机均匀 | 样本选择与先前的选择相关 |
更正式,有几个统计检验,最显着Pearson卡方检验,确定正态性假设是否有效。
经验法则
当经验规则或68-95-99.7规则,阐明,通过正态分布建模的数据的68%的平均值,95%之内2个标准偏差1个标准偏差,并在3个标准偏差为99.7%之内。例如,智商被设计成具有100的平均值和15的标准偏差,这意味着68%的人有智商之间 和 ,95%的人有智商70和130之间,以及人99.7%的有55和145之间的智商。
这使得正态分布容易获得快速估计从,这是错误的余量可以简单地被报告为对查询的目的特别有用 标准偏差(所以,举例来说,候选人的支持率可能是70% 3%)。为了更准确和通用计算,我们利用 -core.:
当 的观察-score是标准偏差的数远离意味着它是。形式上,如果 是分布的标准偏差, 是分布的平均值,和 是数值,然后
例如, -score的121的IQ分数 。该值在许多统计测试中使用,最常见的是 -test。通过计算钟曲线下的区域,a -score提供一个随机变量的概率与该分布具有值小于所述 -core。
A. -score表通常采取以下形式,其中该列决定的所述数字百分之 -score和行确定第十个和单位数字。
.00 | .01 | .02 | .03 | .04 | .05 | .06 | 0.07 | .08 | .09 | |
-3.4 | .0003 | .0003 | .0003 | .0003 | .0003 | .0003 | .0003 | .0003 | .0003 | .0002 |
-3.3. | .0005 | .0005 | .0005 | .0004 | .0004 | .0004 | .0004 | .0004 | .0004 | .0003 |
-3.2 | .0007 | .0007 | .0006 | .0006 | .0006 | .0006 | .0006 | .0005 | .0005 | .0005 |
-3.1. | .0010 | .0009 | .0009 | .0009 | .0008 | .0008 | .0008 | .0008 | .0007 | .0007 |
-3.0 | .0013 | .0013 | .0013 | .0012 | .0012 | .0011 | .0011 | .0011 | .0010 | .0010 |
-2.9 | .0019 | .0018 | .0018 | .0017 | .0016 | .0016 | .0015 | .0015 | .0014 | .0014 |
-2.8 | .0026 | .0025 | .0024 | .0023 | .0023 | .0022 | .0021 | .0021 | .0020 | .0019 |
-2.7 | .0035 | .0034 | .0033 | .0032 | .0031 | .0030 | .0029 | .0028 | .0027 | .0026 |
-2.6 | .0047 | .0045 | .0044 | .0043 | .0041 | .0040 | .0039 | .0038 | .0037 | .0036 |
-2.5 | .0062 | .0060 | .0059 | .0057 | .0055 | .0054 | .0052 | .0051 | .0049 | .0048 |
-2.4 | .0082 | .0080 | 0.0078 | 0.0075 | 0.0073 | 0.0071 | .0069 | .0068 | .0066 | .0064 |
-2.3 | 0.0107 | 0.0104 | 0.0102 | .0099 | .0096 | .0094 | .0091 | .0089 | .0087 | .0084 |
-2.2 | 0.0139 | 0.0136 | 0.0132 | 0.0129 | 0.0125 | 0.0122 | 0.0119 | 0.0116 | 0.0113 | 0.0110 |
-2.1 | 0.0179 | 0.0174 | 0.0170 | 0.0166 | 0.0162 | 0.0158 | 0.0154 | 0.0150 | 0.0146 | 0.0143 |
-2.0 | .0228 | .0222 | .0217 | .0212 | .0207 | .0202 | .0197 | 0.0192 | 0.0188 | 0.0183 |
-1.9 | .0287 | .0281 | .0274 | .0268 | .0262 | .0256 | .0250 | .0244 | .0239 | .0233 |
-1.8. | 0.0359 | 0.0351 | 0.0344 | 0.0336 | .0329 | 0.0322 | .0314 | 0.0307 | 0.0301 | .0294 |
-1.7 | .0446 | .0436 | .0427 | .0418 | .0409 | .0401 | 0.0392 | 0.0384 | 0.0375 | 0.0367 |
-1.6. | 0.0548 | 0.0537 | 0.0526 | 0.0516 | .0505 | .0495 | .0485 | .0475 | .0465 | .0455 |
-1.5. | .0668 | .0655 | .0643 | .0630 | 0.0618 | 0.0606 | 0.0594 | 0.0582 | 0.0571 | 0.0559 |
-1.4 | .0808 | 0.0793 | 0.0778 | 0.0764 | .0749 | .0735 | .0721 | .0708 | .0694 | .0681 |
-1.3. | .0968 | .0951 | .0934 | .0918 | 0.0901 | .0885 | 0.0869 | .0853 | 0.0838 | 0.0823 |
-1.2 | .1151 | .1131 | .1112 | 0.1093 | 0.1075 | 0.1056 | 0.1038 | 0.1020 | 0.1003 | .0985 |
-1.1 | .1357 | .1335 | .1314 | 0.1292 | 0.1271 | 0.1251 | 1230 | 0.1210 | .1190 | .1170 |
-1.0 | .1587 | .1562 | .1539 | .1515 | 0.1492 | 0.1469 | 0.1446 | 0.1423 | 0.1401 | .1379 |
-0.9 | 0.1841 | .1814 | .1788 | .1762 | .1736 | 0.1711 | 0.1685 | 0.1660 | 0.1635 | 0.1611 |
-0.8 | 0.2119 | .2090 | 0.2061 | .2033 | .2005 | .1977 | 0.1949 | 0.1922 | 0.1894 | 0.1867 |
-0.7 | .2420 | 0.2389 | 0.2358 | 0.2327 | 0.2296 | .2266 | .2236 | .2206 | 0.2177 | 0.2148 |
-0.6 | 0.2743 | 0.2709 | .2676 | .2643 | .2611 | 0.2578 | 0.2546 | 0.2514 | .2483 | .2451 |
-0.5 | .3085 | 0.3050 | 0.3015 | 0.2981 | 0.2946 | .2912 | .2877 | .2843 | .2810 | 0.2776 |
-0.4 | 0.3446 | 0.3409 | .3372 | .3336 | .3300 | 0.3264 | 0.3228 | .3192 | 0.3156 | .3121 |
-0.3 | 0.3821 | .3783 | .3745 | .3707 | 0.3669 | 0.3632 | 0.3594 | .3557 | .3520 | 0.3483 |
-0.2 | 0.4207 | 0.4168 | 0.4129 | .4090 | .4052 | 0.4013 | .3974 | .3936 | 0.3897 | 0.3859 |
-0.1 | .4602 | 0.4562 | 0.4522 | 0.4483 | 0.4443 | .4404 | 0.4364 | .4325 | .4286 | 0.4247 |
-0.0 | .5000 | 0.4960 | .4920 | .4880 | .4840 | .4801 | 0.4761 | 0.4721 | 0.4681 | .4641 |
0.1 | .5398 | 0.5438 | 0.5478 | .5517 | .5557 | 0.5596 | 0.5636 | 0.5675 | .5714 | .5753 |
0.2 | .5793 | 0.5832 | 0.5871 | .5910 | .5948 | .5987 | .6026 | 0.6064 | 0.6103 | 0.6141 |
0.3 | .6179 | .6217 | .6255 | 0.6293 | 0.6331 | 0.6368 | .6406 | 0.6443 | .6480 | 0.6517 |
0.4 | 0.6554 | 0.6591 | 0.6628 | 0.6664 | .6700 | 0.6736 | .6772 | .6808 | .6844 | .6879 |
0.5 | 0.6915 | 0.6950 | 0.6985 | 0.7019 | .7054 | .7088 | .7123 | 0.7157 | .7190 | 0.7224 |
0.6 | 0.7257 | .7291 | .7324 | .7357 | 0.7389 | 0.7422 | 0.7454 | 0.7486 | 0.7517 | .7549 |
0.7 | .7580 | 0.7611 | 0.7642 | 0.7673 | .7704 | .7734 | 0.7764 | .7794 | 0.7823 | 0.7852 |
0.8 | 0.7881 | .7910 | .7939 | .7967 | 0.7995 | 0.8023 | 0.8051 | 0.8078 | 0.8106 | .8133 |
0.9 | .8159 | .8186 | .8212 | 0.8238 | 0.8264 | 0.8289 | 0.8315 | 0.8340 | .8365 | .8389 |
1.0 | .8413 | .8438 | .8461 | 0.8485 | 0.8508 | 0.8531 | 0.8554 | 0.8577 | .8599 | 0.8621 |
请注意 - 与经验规则对齐。读桌子,关于 数据低于-1标准偏差,与平均值和约为 数据的低于1个标准偏差与平均值。其结果是,大约 数据的落入-1和1之间的标准偏差。
考虑人口与具有均值的正态分布 和标准偏差 。随机选择的值是否定的概率是多少?阳性怎么样?
负数是任何数目小于 ,所以第一步就是要找到 -score关联 。就是说 。通过与前两位找到行 当 - 使用下一位数字选择并选择列 我们发现与值相关的表中的值 是 ,所以有一个 价值是消极的概率。有一个 或者它77.34%的概率为正。
需要注意的是,曲线下面积可以使用计算积分微积分,只要概率密度函数是已知的。特别是,如果此功能 我们来看一个“标准”的正态分布(即,均值为0,标准偏差为1),则 - 它的条目 -score的 可以表示为 。例如,经验规则可以概括
我们将看到如何确定 之后。
属性
正常分布有两个重要属性,使其成为概率分布。
平均值 正态分布是正常的,而不管 。
如前所述,存在具有这种性质等分布,他们被称为稳定的分布。但是,正常分布是对称的唯一稳定分布,并且具有有限的方差。这些总和被称为多变量正态分布。
给出了从正常分布的随机变量的简单随机样本,样本均值和样本方差是独立的。
此属性是唯一的(在所有概率分布中)到正常分布。它强调了钟曲线的总体对称性和“平衡”。
直方图显示通常分布式随机可变变量的样本如何在样本大小增加时钟曲线。以下图表是随机变量的采样,具有正常分布的平均值 和标准偏差 。
注意图如何变得越来越对称的 增加。号码在特定区域中的比例也开始具有固定的比率。例如,作为经验规则表明, 在上图的数字之间出现 和 。实际上,所有正态分布都具有这些比例和表格 -Scores用于确定确切的比例。
一个新产品发布和调查询问顾客得到产品1和100在第一之间的分数,当主体的数量 仍相对较低,该公司无法从调查拉多的信息。例如,在四人采取了问卷调查,一个人的评分是92,一个将其评为72,一个将其评为63,最后一个额定它34.然而,随着越来越多的客户采取的调查,该公司能够创造出结果的柱状图。一旦采取了5000周的调查,该公司发现,评为一般人该产品的67出100,和分数的其余部分呈正态分布的钟形曲线从那里出来(与9标准偏差)。在此基础上,该公司决定,其产品不能满足客户的愿望。
形式定义和推导
正常分布与平均值 和方差 记 。它的概率密度函数是
累积密度函数没有闭合表达式表达式。
如果 和 是独立的正常随机变量,与 和 那么 。
钟曲线是二元系统的概率密度曲线。然后从介质中的一些位移处的概率是
使用斯特林的近似和治疗 ,我们有
对于 那 ;因此,对于大
取对数收益率
对于小 那 ;随后,
或者
自从 比速度更快地消失 对于非常大 ,我们得出的结果