假设检验
一个假设检验是一个统计推断用来检验种群间所提议的(假设的)关系的显著性的方法统计数据(参数)及其对应样品估计.换句话说,假设检验用于确定样本中是否有足够的证据来证明一个假设对整个人群是正确的。
该测试考虑两个假设:零假设,这是一个需要测试的陈述,通常是像“没有效果”这样的句子,目的是证明这是错误的替代假说,这是在测试执行后应该存在的语句。这两个假设肯定是正确的互相排斥的;此外,在大多数应用中,两者是互补的(一个是另一个的否定)。这个测试是通过比较 价值达到显著性水平(选定的目标)。如果 -value小于或等于显著性水平,则null假设被拒绝。
在分析数据时,只有特定大小的样本可以作为有效计算进行管理。在某些情况下,误差项遵循连续或无限分布,因此使用样本来建议所选检验统计量的准确性。假设检验方法比猜测数据遵循的分布或参数更有优势。
定义和方法
在统计推理中,总体的性质(参数)是通过抽样数据集来分析的。给定分布假设,即a统计模型在这些数据中,某些假设可以从模型的已知行为中推断出来。这些假设必须用来自总体的抽样数据来检验。
的零假设 表示 是一个被假定为正确的陈述。如果无效假设被拒绝,那么就有足够的证据(统计显著性)来接受替代假说 表示 在进行任何显著性检验之前,两个假设必须清楚地陈述,并且是非冲突的,即相互排斥的陈述。
拒绝零假设,假设它是真的,称为a第一类误差它被表示出来了 ,这也是它发生的概率。如果不拒绝零假设(假设为假),则称为aII型错误它被表示出来了 ,这也是它发生的概率。同时, 被称为显著性水平, 被称为权力的测试。
第一类误差 正确的决定 正确的决定 II型错误 的检验统计量是在原假设为真的假设下抽样数据的标准化值,并经过选定的特定检验。这些检验依赖于要研究的统计量及其所遵循的假设分布,例如总体均值服从正态分布。的 价值是在零假设为真的情况下,在备选假设方向上观察到一个极端检验统计量的概率。的临界值是检验统计量的假设分布的值,使得犯第一类错误的概率很小。
方法:
给出一个估计量 总体统计量的 ,遵循概率分布 ,从样本中计算 并给出显著性水平 和测试数据
- 定义 和
- 计算检验统计量
-value方法(最普遍):
- 找到 值使用 (right-tailed)。
- 如果 -value为最大值 拒绝 .否则,拒绝 .
临界值的方法:
- 求解这个方程的临界值 (right-tailed)。
- 如果 ,拒绝 .否则,拒绝 .
注:拒绝失败 只意味着无法接受 ,这并不意味着接受 .
例子
假设一个正态分布的人群记录了各种统计数据。人群中100名受试者的样本均值为214.12 mg/dL(毫克/分升),样本标准差为45.71 mg/dL。
进行显著性水平0.05的假设检验,以检验是否有足够的证据得出总体均值大于200 mg/dL的结论。
假设检验
我们将使用 -value方法具有显著性水平
- 定义 : .
- 定义 : .
- 由于我们的值是正态分布的,所以检验统计量是 .
- 利用标准正态分布,我们发现 价值大约是 .
- 自 -value为最大值 我们拒绝 .
因此,我们可以得出结论,测试显示了足够的证据来支持这一主张 大于 mg / dL。
如果样本量较小,则正常和 的行为分布有所不同。此外,这个问题本身必须通过“双尾测试”来解决。
假设一个人口的胆固醇水平被记录下来并计算出各种统计数据。25名受试者样本均值为214.12 mg/dL(毫克/分升),样本标准差为45.71 mg/dL。
进行显著性水平0.05的假设检验,以检验是否有足够的证据得出总体均值不等于200 mg/dL的结论。
假设检验
我们将使用 -value方法具有显著性水平 和 - 24自由度分布:
- 定义 : .
- 定义 : .
- 使用 -分布,则检验统计量为 .
- 使用一个 24自由度的分布,我们发现 价值大约是 .我们乘以了2,因为这是一个双尾参数,也就是说,均值可以小于或大于。
- 自 -value大于 我们没有拒绝 .
因此,测试并没有显示出足够的证据来支持这一说法 不等于 mg / dL。
假设检验和置信区间
用双尾假设检验(具有显著性水平)对拒绝的补充 )为总体参数 等于找到置信区间吗 有信心水平 对于总体参数 .若对参数作假设 落在置信区间内,则检验未能拒绝原假设 与 值大于 否则,如果 不落在置信区间内,那么零假设就会被拒绝,而会被替代 与 价值最多