假设检验
一个假设检验是一个统计推断用于检验所提出的(假设的)种群间关系的显著性的方法统计数据(参数)及其对应的样品估计.换句话说,假设检验用于确定样本中是否有足够的证据证明假设对整个总体是正确的。
该测试考虑了两种假设零假设,这是一种用于测试的语句,通常是“没有影响”之类的语句,目的是证明这是错误的替代假说,这是在执行测试后仍然有效的语句。这两个假设肯定是互相排斥的;此外,在大多数应用中,两者是互补的(一个是另一个的否定)。该测试通过比较 价值达到重要程度(选定的目标)。如果 -value小于或等于显著性水平,则拒绝原假设。
在分析数据时,只有一定大小的样本才能作为有效的计算来管理。在某些情况下,误差项遵循连续或无限分布,因此使用样本来表明所选检验统计量的准确性。假设检验的方法比猜测数据遵循的分布或参数更有优势。
定义和方法
在统计推理中,通过抽样数据集来分析总体的属性(参数)。给定分布的假设,即a统计模型对于这些数据,可以从模型的已知行为中推断出某些假设。这些假设必须用来自总体的抽样数据进行检验。
的零假设 表示 是一种假设为真的陈述。如果零假设被拒绝,那么就有足够的证据(统计显著性)来接受替代假说 表示 在进行任何显著性测试之前,两个假设必须清楚地陈述,并且不冲突,即相互排斥的陈述。
拒绝零假设,假设它为真,称为a第一类误差它被表示出来了 ,这也是它发生的概率。没有拒绝零假设,假设它是假的,被称为第二类误差它被表示出来了 ,这也是它发生的概率。同时, 被称为显著性水平, 被称为权力测试。
第一类错误 正确的决定 正确的决定 第二类错误 的检验统计量是在零假设为真的假设下,抽样数据之后的标准化值,以及选定的特定检验。这些检验取决于要研究的统计量及其所遵循的假设分布,例如,总体均值服从正态分布。的 价值是在原假设为真的情况下,在备用假设的方向观察到极端检验统计量的概率。的临界值是检验统计量的假设分布的值,使得发生第一类错误的概率很小。
方法:
给定一个估计量 人口统计数据 ,遵循概率分布 ,从样本中计算 已知显著性水平 检验统计量
- 定义 而且
- 计算测试统计量
-value方法(最流行):
- 找到 值使用 (right-tailed)。
- 如果 -value为最大值 拒绝 .否则,拒绝 .
临界值法:
- 求解方程的临界值 (right-tailed)。
- 如果 ,拒绝 .否则,拒绝 .
注:拒绝失败 只意味着无法接受 ,这并不意味着接受 .
例子
假设一个正态分布的人群记录了胆固醇水平,并计算了各种统计数据。从100名受试者的样本中,样本平均值为214.12 mg/dL(毫克每分升),样本标准差为45.71 mg/dL。
进行显著性水平0.05的假设检验,以检验是否有足够的证据得出总体平均值大于200 mg/dL的结论。
假设检验
我们将使用 具有显著性水平的-值方法
- 定义 : .
- 定义 : .
- 由于我们的值是正态分布的,检验统计量为 .
- 使用标准正态分布,我们发现我们的 -value近似为 .
- 自 -value为最大值 我们拒绝 .
因此,我们可以得出结论,该测试显示了足够的证据来支持的说法 大于 mg / dL。
如果样本量较小,正常和 -分布的行为不同。此外,问题本身必须由双尾测试来管理。
假设一个人群的胆固醇水平被记录下来,各种统计数据被计算出来。从25名受试者的样本中,样本平均值为214.12 mg/dL(毫克每分升),样本标准差为45.71 mg/dL。
进行显著性水平0.05的假设检验,以检验是否有足够的证据得出总体平均值不等于200 mg/dL的结论。
假设检验
我们将使用 具有显著性水平的-值方法 和 - 24自由度分布:
- 定义 : .
- 定义 : .
- 使用 -分布,检验统计量为 .
- 使用一个 - 24自由度分布,我们发现我们的 -value近似为 .我们已经乘以了2,因为这是一个双尾论证,即平均值可以小于或大于。
- 自 -value大于 我们没有拒绝 .
因此,该测试并没有显示出足够的证据来支持这种说法 不等于 mg / dL。
假设检验和置信区间
双尾假设检验的拒绝补足(具有显著性水平 )表示总体参数 等价于找到置信区间 要有自信 对于总体参数 .如果对参数进行假设 落在置信区间内,则检验未能拒绝原假设 与 -value大于 否则,如果 不落在置信区间内,那么零假设被拒绝,而支持备用假设 与 -value最大值