置信区间
一个<年代trong>置信区间一个区域是用什么构造的<一个href="//www.parkandroid.com/wiki/sampling/" class="wiki_link" title="采样" target="_blank">采样来自人口(<一个t一个rget="_blank" rel="nofollow" href="//www.parkandroid.com/wiki/uniform-probability/">样本空间跟随某一<一个href="//www.parkandroid.com/wiki/probability-distribution/?wiki_title=probability distribution" class="wiki_link new" title="概率分布" target="_blank" rel="nofollow">概率分布.的<一个href="//www.parkandroid.com/wiki/interval/" class="wiki_link" title="时间间隔" target="_blank">时间间隔构造为包含具有指定概率的选定总体统计量。简而言之,置信区间就是某个值位于某个范围内的概率。
例如值<年代p一个nclass="katex"> ,如在声明中所说:“给定大小的样本<年代p一个nclass="katex"> ,假设95%置信区间<年代p一个nclass="katex"> 构造为包含<年代p一个nclass="katex"> 这意味着如果所有可能的样本,大小<年代p一个nclass="katex"> ,则由每个样本构建的95%置信区间将包含<年代p一个nclass="katex"> .构造了具有一定概率的置信区间,这一事实并不保证所构造的区间将包含总体的真实统计量。就是这样,如果样本是在<一个href="//www.parkandroid.com/wiki/discrete-random-variables-definition/" class="wiki_link" title="随机" target="_blank">随机,则有95%的信心(可能)<年代p一个nclass="katex"> 包含<年代p一个nclass="katex"> .对于随机样本的置信区间,包含总体均值的所有置信区间的比例通常不叫置信区间,而叫<年代trong>置信水平(<年代p一个nclass="katex"> 在这种情况下)。
假设我们想知道Brilliant.org上用户的智商。我们随机抽取<年代p一个nclass="katex"> 用户从人口<年代p一个nclass="katex"> (编出这个数字)并得出结论<年代p一个nclass="katex"> 整个人口的平均智商是115。这对整个人口意味着什么?
但这并不意味着<年代p一个nclass="katex"> 的<年代p一个nclass="katex"> 人们的智商是115
这意味着如果我们从总体中随机抽取很多样本,然后测试所有的样本<年代p一个nclass="katex"> 这些样本的平均智商为115。另一种表述方式是<年代p一个nclass="katex"> 总人数的百分比,正负置信区间的智商是<年代p一个nclass="katex"> .下面我们将研究如何找到它<年代p一个nclass="katex"> .
内容
定义
估计量和标准误差
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从一个有平均值的群体<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>样本均值是<年代p一个nclass="katex"> 也就是总体均值<一个t一个rget="_blank" rel="nofollow" href="//www.parkandroid.com/wiki/statistics/">估计量.的<年代trong>样本方差是<年代p一个nclass="katex"> .抽样分布的标准差<年代p一个nclass="katex"> 被称为<年代trong>标准错误.
回到上面的例子。我们有一个样品<年代p一个nclass="katex"> 从人口中<年代p一个nclass="katex"> .而不是将<年代p一个nclass="katex"> 数据点,假设他们给了我们平均智商,<年代p一个nclass="katex"> ,题目告诉我们<年代p一个nclass="katex"> 在抽样的学生中,智商在115以上的有400人智商在115以下。最终我们要找到置信区间。
在这个样本中,我们可以给每个智商在115或以上的学生分配1分,给智商在115或以上的学生分配0分。只有二进制的是/不是他们是115还是更高?这意味着我们的样本均值是:<年代p一个nclass="katex-display"> 这被称为总体均值(估计值),因为它是样本估计的部分人口(60%)的智商115或更高。这个挑战会用95%的信心告诉我们60%的人的置信区间都是115或更高的智商。样本方差为<年代p一个nclass="katex-display"> 因此标准误差为:<年代p一个nclass="katex-display">
z分数的<一个href="//www.parkandroid.com/wiki/z-score/" class="wiki_link" title="z分数" target="_blank">z分数(也叫标准分数)是多少<一个href="//www.parkandroid.com/wiki/standard-deviation/" class="wiki_link" title="标准差" target="_blank">标准差一个数据点离均值很远。在置信区间的情况下,z分数显示了一个答案与均值之间的多少个标准差才能落入期望的置信区间。例如,如果一个问题要求<年代p一个nclass="katex"> 置信区间,查z-score就会发现标准差<年代p一个nclass="katex"> 在均值的两边上面的图表显示离均值2个标准差是a<年代p一个nclass="katex"> 置信区间。
%总体均值置信区间(已知方差)
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从一个有平均值的群体<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>置信区间总体均值的置信水平<年代p一个nclass="katex"> 与样本相关联的是<年代p一个nclass="katex"> .
%总体均值置信区间(方差未知)
对于大样本,<年代p一个nclass="katex"> 值:
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从一个有平均值的群体<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>置信区间总体均值的置信水平<年代p一个nclass="katex"> 与样本相关联的是<年代p一个nclass="katex"> ,这样<年代p一个nclass="katex"> 是否为样本标准差,即的平方根<年代p一个nclass="katex"> .
对于小样本,<年代p一个nclass="katex"> 值与<年代p一个nclass="katex"> 自由度:
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从一个有平均值的群体<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>置信区间总体均值的置信水平<年代p一个nclass="katex"> 与样本相关联的是<年代p一个nclass="katex"> ,这样<年代p一个nclass="katex"> 是否为样本标准差,即的平方根<年代p一个nclass="katex"> .
再来看看这个例子。我们知道我们想要a<年代p一个nclass="katex"> 置信区间。这意味着我们需要查找对应于95%的z分数。与直觉相反,我们并不往上看<年代p一个nclass="katex"> 相反,我们向上看<年代p一个nclass="katex"> .要了解更多原因,请查看关于标准偏差和z分数的维基。查找<年代p一个nclass="katex"> 我们需要一个标准的z分数表,就像这个<一个t一个rget="_blank" rel="nofollow" href="//www.parkandroid.com/wiki/z-score/">在这里.我们找到最接近我们想要的答案的数字,然后添加它们的行和列标题。在这个例子中,它揭示了z分数是<年代p一个nclass="katex"> .也可以推导z分数,但对于所有标准分布,它们总是相同的。
也就是置信区间。我们现在可以说,with<年代p一个nclass="katex"> 确定的,<年代p一个nclass="katex"> 我们所有人的智商都在115或更高!这意味着如果我们从1000个Brilliant用户中随机抽取100个样本,其中95个样本中的Brilliant用户总数,<年代p一个nclass="katex"> IQ达到115或更高的人<年代p一个nclass="katex"> .
抽样分布与中心极限定理
如引言中所述,如果从总体中重复随机样本(有替换且大小相同),则可以从每一个样本中计算出不同的统计量。对于给定的统计量,例如均值,所有大小样本的均值的概率分布<年代p一个nclass="katex"> 被称为<一个href="//www.parkandroid.com/wiki/sampling-distribution/" class="wiki_link" title="抽样分布" target="_blank">抽样分布的意思。如果总体有均值<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,则为较大的值<年代p一个nclass="katex"> 的<一个href="//www.parkandroid.com/wiki/central-limit-theorem/" class="wiki_link" title="中心极限定理" target="_blank">中心极限定理表示大小的抽样分布<年代p一个nclass="katex"> ,大约是<一个href="//www.parkandroid.com/wiki/normal-distribution/" class="wiki_link" title="正态分布" target="_blank">正态分布与的意思<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> .
附加的符号简化了计算(使用正态分布)。一个随机变量的一组值最多为一个固定值所对应的概率<年代p一个nclass="katex"> 是表示<年代p一个nclass="katex"> .如果随机变量<年代p一个nclass="katex"> 表示感兴趣的分布,使用一个简单的转换<年代p一个nclass="katex"> 转换随机变量<年代p一个nclass="katex"> 成<年代p一个nclass="katex"> .对于一个固定的实数<年代p一个nclass="katex"> ,<年代p一个nclass="katex"> 为方程的解<年代p一个nclass="katex"> .对于t分布<年代p一个nclass="katex"> 自由度,<年代p一个nclass="katex"> 为方程的解<年代p一个nclass="katex"> .
例子和问题
如何衡量一个人的身高<年代p一个nclass="katex"> 午夜过后几秒,他们21岁生日的第二天?
在理论背景下,处理这类问题是可能的。但是,在实践中,精确的测量变得困难。既然放弃不是一种选择,那么下一个最好的方法就是进行近似,使测量过程中的误差最小化。假设这些误差是按照已知的概率分布分布的。
Construction-Known方差
给定一个样本大小<年代p一个nclass="katex"> 服从均值概率分布<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> .因为样本均值<年代p一个nclass="katex"> 是总体均值的估计值吗<年代p一个nclass="katex"> ,近似为具有均值的正态分布<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,我们感兴趣的是估计值接近总体均值的概率。
我们必须确定价值<年代p一个nclass="katex"> 这符合我们的假设。自<年代p一个nclass="katex"> 近似正态分布的方差<年代p一个nclass="katex"> 时,随机变量可变换为跟随a<年代p一个nclass="katex"> .
根据之前定义的符号,
这意味着,
因此,为了得到一个具有置信水平的区间<年代p一个nclass="katex"> 我们必须有,
下表显示了最常见的置信水平及其对应的z值,用于构建置信区间。
置信水平<年代p一个nclass="katex"> | |||
带有自由度的t值表更复杂。
一名兽医正在研究一种新的狗心脏蠕虫药物的特殊副作用,副作用包括受试者的头发脱落。制造商提供了1000名受试者中50人的样本数据。根据对50名受试者的95%置信区间,如果有效成分的剂量超过330 mcg,副作用就会流行,如果有效成分的剂量低于260 mcg,药物就会无效。总体方差是多少?
解决方案
根据问题,区间<年代p一个nclass="katex"> 是药物有效性总体均值的95%置信区间。由于置信区间是以样本均值为中心构造的,那么<年代p一个nclass="katex"> .而且,我们必须<年代p一个nclass="katex"> ,这意味着<年代p一个nclass="katex"> .因此总体方差为<年代p一个nclass="katex"> .