置信区间
一个<年代trong>置信区间一个区域是用<一个href="//www.parkandroid.com/wiki/sampling/" class="wiki_link" title="采样" target="_blank">采样人口的固定大小的数据(<一个t一个rget="_blank" rel="nofollow" href="//www.parkandroid.com/wiki/uniform-probability/">样本空间)跟随某<一个href="//www.parkandroid.com/wiki/probability-distribution/?wiki_title=probability distribution" class="wiki_link new" title="概率分布" target="_blank" rel="nofollow">概率分布.的<一个href="//www.parkandroid.com/wiki/interval/" class="wiki_link" title="时间间隔" target="_blank">时间间隔构造为包含具有规定概率的选定的总体统计量。简化地说,置信区间是某个值位于某个范围内的概率。
例如,值<年代p一个nclass="katex"> 例如:"given a sample of size .<年代p一个nclass="katex"> ,假设95%置信区间<年代p一个nclass="katex"> 被构造为包含<年代p一个nclass="katex"> 这意味着,如果所有可能的样本,大小<年代p一个nclass="katex"> ,则由每个样本构造的95%的置信区间将包含<年代p一个nclass="katex"> .建立了具有一定概率的置信区间的事实,并不保证所建立的区间将包含人口的真实统计量。如果样本是在<一个href="//www.parkandroid.com/wiki/discrete-random-variables-definition/" class="wiki_link" title="随机" target="_blank">随机,则有95%的信心(几率)<年代p一个nclass="katex"> 包含<年代p一个nclass="katex"> .对于与随机样本相关的置信区间,通常称为包含总体均值的所有此类区间的比例,而不是置信区间,而是<年代trong>置信水平(<年代p一个nclass="katex"> 在这种情况下)。
假设我们想知道Brilliant.org上用户的智商。我们随机抽取一个样本<年代p一个nclass="katex"> 用户来自于<年代p一个nclass="katex"> (编造这个数字)并以一个<年代p一个nclass="katex"> 相信整个人口的平均智商是115。这对整个人口意味着什么?
这并不意味着<年代p一个nclass="katex"> 的<年代p一个nclass="katex"> 人们的智商是115。
它的意思是如果我们从总体中随机抽取很多样本,然后测试所有这些样本,在<年代p一个nclass="katex"> 这些样本的平均智商是115。另一种表达方式是some<年代p一个nclass="katex"> 的人,加上或减去我们的置信区间智商为<年代p一个nclass="katex"> .下面我们将研究如何找到它<年代p一个nclass="katex"> .
内容
定义
估计量和标准误差
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从均值的人群中<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>样本均值是<年代p一个nclass="katex"> 也就是总体均值<一个t一个rget="_blank" rel="nofollow" href="//www.parkandroid.com/wiki/statistics/">估计量.的<年代trong>样本方差是<年代p一个nclass="katex"> .抽样分布的标准差<年代p一个nclass="katex"> 被称为<年代trong>标准错误.
回到上面的例子。我们有一个样品<年代p一个nclass="katex"> 从<年代p一个nclass="katex"> .而不是将<年代p一个nclass="katex"> 数据点,假设他们给了我们平均智商,<年代p一个nclass="katex"> 他们告诉我们的<年代p一个nclass="katex"> 抽样的学生中有一半的人的智商在115或更高,有400人的智商低于115。最终我们要找到置信区间。
在这个样本中,我们可以给每个智商在115或115以上的学生分配1分,给低于115的学生分配0分。只是一个二进制是/否他们的血压是115或更高吗?这意味着我们的样本均值为:<年代p一个nclass="katex-display"> 这被称为总体均值(估计量),因为它是样本对智商在115或更高的人群部分(60%)的估计。这个挑战会有95%的可信度60%的人的智商在115或更高。样本方差是<年代p一个nclass="katex-display"> 因此标准误差为:<年代p一个nclass="katex-display">
z分数的<一个href="//www.parkandroid.com/wiki/z-score/" class="wiki_link" title="z分数" target="_blank">z分数(也叫标准分数)是指<一个href="//www.parkandroid.com/wiki/standard-deviation/" class="wiki_link" title="标准差" target="_blank">标准差一个数据点远离平均值。在置信区间的情况下,z分数显示了一个答案应该与平均值相差多少个标准差才能落入所需的置信区间。例如,如果一个问题要求一个<年代p一个nclass="katex"> 置信区间,查z分数会发现标准差是<年代p一个nclass="katex"> 均值的两边,也就是上面的图表,距离均值2个标准差是a<年代p一个nclass="katex"> 置信区间。
总体均值的%置信区间(已知方差)
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从均值的人群中<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>置信区间对于置信水平的总体均值<年代p一个nclass="katex"> 与样本相关联的是<年代p一个nclass="katex"> .
总体均值的%置信区间(未知方差)
对于大样本,<年代p一个nclass="katex"> 值:
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从均值的人群中<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>置信区间对于置信水平的总体均值<年代p一个nclass="katex"> 与样本相关联的是<年代p一个nclass="katex"> ,这样<年代p一个nclass="katex"> 样本标准差,即的平方根<年代p一个nclass="katex"> .
对于小样本,<年代p一个nclass="katex"> 值与<年代p一个nclass="katex"> 自由度:
给定一个样本<年代p一个nclass="katex"> 的大小<年代p一个nclass="katex"> 从均值的人群中<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,<年代trong>置信区间对于置信水平的总体均值<年代p一个nclass="katex"> 与样本相关联的是<年代p一个nclass="katex"> ,这样<年代p一个nclass="katex"> 样本标准差,即的平方根<年代p一个nclass="katex"> .
我们再来看一下这个例子。我们知道我们想要一个<年代p一个nclass="katex"> 置信区间。这意味着我们需要查找对应于95%的z分数。与直觉相反的是,我们没有抬头<年代p一个nclass="katex"> 相反,我们向上看<年代p一个nclass="katex"> .要了解更多原因,请查看关于标准差和z分数的维基。查找<年代p一个nclass="katex"> 我们需要一个标准的z分数表,就像这个<一个t一个rget="_blank" rel="nofollow" href="//www.parkandroid.com/wiki/z-score/">在这里.我们找到最接近我们想要的答案的数字,然后添加它们的行标题和列标题。在这个例子中,它揭示了z分数是<年代p一个nclass="katex"> .也可以推导出z分数,但对于所有标准分布,它们都是一样的。
这就是我们的置信区间。我们现在可以说,with<年代p一个nclass="katex"> 确定的,<年代p一个nclass="katex"> 我们总人口中有一半的人智商在115或更高!这意味着如果我们从1000个Brilliant用户中随机抽取100个样本,在95个样本中我们的Brilliant用户总数,<年代p一个nclass="katex"> 智商在115或更高的人应该是<年代p一个nclass="katex"> .
抽样分布与中心极限定理
正如引言中提到的,如果从一个总体中提取重复的随机样本(有替换且大小相同),可以从这些样本中计算出不同的统计度量。对于一个给定的统计量,例如均值,所有大小样本均值的概率分布<年代p一个nclass="katex"> 被称为<一个href="//www.parkandroid.com/wiki/sampling-distribution/" class="wiki_link" title="抽样分布" target="_blank">抽样分布的意思。如果总体有均值<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,则对于较大的值<年代p一个nclass="katex"> 的<一个href="//www.parkandroid.com/wiki/central-limit-theorem/" class="wiki_link" title="中心极限定理" target="_blank">中心极限定理意味着大小的抽样分布<年代p一个nclass="katex"> ,大约是<一个href="//www.parkandroid.com/wiki/normal-distribution/" class="wiki_link" title="正态分布" target="_blank">正态分布与的意思<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> .
附加的符号简化了计算(使用正态分布)。最多是一个固定值的随机变量的一组值所对应的概率<年代p一个nclass="katex"> 是表示<年代p一个nclass="katex"> .如果随机变量<年代p一个nclass="katex"> 使用简单的转换表示感兴趣的分布<年代p一个nclass="katex"> 翻译随机变量<年代p一个nclass="katex"> 成<年代p一个nclass="katex"> .对于一个固定的实数<年代p一个nclass="katex"> ,<年代p一个nclass="katex"> 表示方程的解<年代p一个nclass="katex"> .对于t分布<年代p一个nclass="katex"> 自由度,<年代p一个nclass="katex"> 表示方程的解<年代p一个nclass="katex"> .
例子和问题
如何衡量一个人的生长,在身高上<年代p一个nclass="katex"> 午夜过后几秒,他们21岁生日的第二天?
在理论上,有可能处理这类问题。但是,在实践中,精确测量变得很困难。既然放弃不是一个选项,那么退而求其次的方法就是近似,尽量减少测量过程中的误差。假设这些误差的分布遵循已知的概率分布。
Construction-Known方差
给定一个样本的大小<年代p一个nclass="katex"> 遵循有均值的概率分布<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> .因为样本均值<年代p一个nclass="katex"> 是总体均值的估计量吗<年代p一个nclass="katex"> ,近似为带均值的正态分布<年代p一个nclass="katex"> 和方差<年代p一个nclass="katex"> ,我们感兴趣的是估计量接近总体均值的概率。
我们必须确定价值<年代p一个nclass="katex"> 这在我们的假设中成立。自<年代p一个nclass="katex"> 是否与方差近似正态分布<年代p一个nclass="katex"> ,将随机变量变换为a<年代p一个nclass="katex"> .
根据之前定义的符号,
这意味着,
因此,为了得到一个具有置信水平的区间<年代p一个nclass="katex"> 我们必须有,
下表显示了最常见的置信水平及其对应的z值,用于构建置信区间。
置信水平<年代p一个nclass="katex"> | |||
有自由度的t值的表格更加复杂。
一名兽医正在研究一种新的狗心虫药物的一种特殊的副作用,副作用包括被试者的脱发斑块。制造商提供的数据来自1000名受试者中大小为50的样本。如果剂量超过330微克的有效成分,副作用就会普遍存在,如果剂量低于260微克的有效成分,药物就会失效,这是来自50名受试者样本的95%置信区间。总体方差是多少?
解决方案
根据问题,取区间<年代p一个nclass="katex"> 是药物有效性总体均值的95%置信区间。由于置信区间是以样本均值为中心构造的,因此<年代p一个nclass="katex"> .而且,我们必须有<年代p一个nclass="katex"> ,这意味着<年代p一个nclass="katex"> .因此总体方差为<年代p一个nclass="katex"> .