抽样(统计)

抽样是一个统计使用总数的一部分的方法人口代表全部人口。作为一门学科，抽样调查考虑的是人们可以用来调查一部分人口的不同方法，并试图找到最能代表整个人口的样本。样本的“代表性”也被称为“泛化性”，即如何将一个特定的群体成员集合推广到整个群体。为了获得高度可泛化的结果，抽样可以重不同的因素或特定的受访者，试图更好地代表整个人群。例如，一个高度一般化的小学样本不仅包括一年级学生的回答，还包括所有年级学生的回答，以及整个学校适当比例的学生的回答。如果有 $One hundred.$ 一所小学的学生，和 $15$ 都是在一年级，那么样品应该包括不超过 $15 \ %$ 一年级学生的回答。

要抽样的人口可以是任何数量的东西。它可以是抽样调查政治观点的人口;可以从一种植物中取样以确定害虫的流行程度;人口可以是一个工厂的整个服装生产的质量进行检查;或者它可以检查给定的输出计算机模拟来确定模拟是否与现实相当接近。包括整个人口的研究被称为人口调查研究，而不是样本。这种全面的研究很少进行，因为成本(时间或金钱)可能太高，或者可行性可能太低。例如，收集美国每个公民详细的宗教观点的数据将是非常昂贵的，也许是不可行的，或者确定西伯利亚熊的平均年龄可能是不可能的(因为这需要确定每只熊在广阔的地理位置)。

抽样是一个关键的工具科学的方法，使研究人员能够提供证据，证明仅从特定事实的样本中归纳出的理论是正确的。抽样还允许数学家解决复杂的悖论，例如圣彼得堡悖论，通常用于政治民意调查，以了解当前的社会、哲学和道德趋势。

概率抽样与非概率抽样

抽样方法分为a类概率或者一个非概率样本。在概率样本中，总体中的每个成员都有一个已知的非零被纳入样本的几率。这使得研究人员可以计算和报告抽样误差，或者样本可能偏离总体的程度。而在非概率样本中，一些成员被包含的概率为零或未知的百分比。

想象一下，一个民意调查员每周四晚上7点去一家超市，对购物者的职业进行调查。就其本质而言，这次投票将排除在某种未知的概率下，那些正在工作的人。这可能是调酒师，夜间电视新闻主播，夜班护士等。或者，它可能会把某个种族的人排除在外，因为他们更喜欢在自己的民族杂货店购物。如果目标是代表当时从这类商店购买食品杂货的人群，它可能具有低样本偏差。但如果它的目的是代表该地理区域的全部人口，那么它将是一个具有未知(可能是高)样本偏差的非概率样本。

选择一种抽样方法而不是另一种的部分原因是成本。作为一般规则，样本的总体越大，样本的总体就必须越大(以确保它具有代表性)，也就越难消除偏见。如果一个研究人员试图选择 $5$ 从一个教室里随机选出的人 $20.$ 朋友们，有很多简单的方法来确保样本是随机的和有代表性的。如果同一个研究人员试图从一个群体中选择 $200$ 一百万，他们不太可能选择 $\压裂{1}{4}$ 任何规模的样本在时间和金钱上都要昂贵得多。

有一件事很少被提及，那就是样本通常不是随机的。也就是说，样本是在研究人员收集数据的任何时间采集的。早十年或晚十年，人口可能会发生变化。

概率抽样

随机抽样^[1]

随机抽样最基本的抽样类型是真正随机的吗 $x \ %$ 研究人员想要研究的人群。挑战在于真正的随机性很难实现:确保它实际上是随机的，也就是说，人口中的每一个成员都有相等的概率被选中。理论上，随机样本应该是这样的总体中每个成员都有一个单一样本抽奖活动票，然后从可用的抽奖券中挑选样品。然而，人口越大，就越难确保人口中的每个成员都有与其他成员相同的被选中的机会。也就是说，很难给每个成员分配一张奖券，并以相等的概率从所有奖券中挑选。

通过将样本与被测总体的已知数据进行比较(如果这些数据可用)，可以相对容易地检查样本是否真的是随机的。例如，澳大利亚人口的一个样本应该是 $50 \ %$ 男性和 $50 \ %$ 女性占总人口的比例是50比50。

系统抽样^[２]

系统抽样一种实现随机抽样的方法，本质上是一种选择每一个 $n ^ \文本{th}$ 样本中的元素，其中 $n$ 是某个整数或者某个随机整数，或者某个随机生成的数字。例如，面包店可以选择每一个 $99 ^ \文本{th}$ 蛋糕进行测试和质量控制，或者它可以挑选每一个 $n ^ \文本{th}$ 蛋糕在哪里 $n$ 是一个随机生成的数字之间 $50$ 而且 $200$ ．请注意:只有当总体本身是随机顺序时，或者当计数从中间的某个数字随机开始时，这才有效 $1$ 而且 $n$ ．如果总体是有序的，那么选择每一个 $99 ^ \文本{th}$ 一个人不会是随机的。

分层抽样^[3]

分层抽样是一种帮助确保在较大人群中随机的方法。根据某些特定的标准，整个人口被划分为不同的阶层或不同的群体。例如，如果一个测量员想要对整个城市人口进行抽样，他可能会将城市划分为地理层次、职业层次、教育层次、财富层次等。从地层中选择的样本成员的数量与整个种群成正比。例如，如果A区代表 $10 \ %$ 一个研究人员想要一个城市人口的总样本 $1000$ ，然后他们会选择 $One hundred.$ 在分层中，样本成员是随机选择的。例如，可以随机选择一所房子，并从家庭中随机选择一名成员进行抽样。

整群抽样^[4]

整群抽样一种研究人员随机选择的方法吗集群为了便于抽样。例如，对一个学区学生的研究可能会对20所学校中的每一所学生进行研究。这与随机抽样相反，随机抽样可能最终会从每所学校抽取一些学生。研究人员可能会为了便于实施而选择研究集群(例如，让20个学校校长同意一些小的学校日中断可能比让所有校长都同意更容易)。

多级抽样是其他抽样技术的一种形式，研究人员从越来越大的样本中筛选出最终样本。例如，在上面对一个学区的学生进行研究的例子中，研究人员使用了聚类抽样进行选择 $20.$ 学校。然后他们可以进行第二阶段，再次使用聚类抽样进行选择 $15$ 每所学校的教室，然后是第三个阶段，他们使用随机抽样进行选择 $10$ 每个班的学生。同样，这有助于降低成本，但在每个阶段，研究人员都有机会偏离真正随机或具有代表性的总体样本。例如，如果他们在研究学生的表现，他们碰巧选择了两所表现最好或最差的学校，那么 $10 \ %$ 在他们的样本中，有总体中最大的异常值。

Non-probability抽样

便利抽样，也称为机会抽样，是指研究人员使用非随机样本来接近真相的方法。这通常用于一项研究的开始，或作为测试一项研究是否值得的一种手段方便样本;例如，研究人员在街上找到的前五个人可能比进行真正随机的抽样要便宜得多。

判断抽样是便利抽样的一种形式，研究人员在选择方便样本时应用了一些判断。例如，一名研究咖啡店顾客的研究人员可以合理地得出结论，他们最近的咖啡店的人口可以代表他们研究的地区所有咖啡店的人口，因为那家咖啡店位于中心位置，交通繁忙的通勤区，在这家咖啡店中代表了广泛的教育水平、性别、职业、财富、种族和性取向。

滚雪球抽样是一种非概率抽样，发生在难以找到期望群体成员的情况下，例如患有罕见疾病的患者，持有很少人愿意公开表达的观点的人，或稀有物种。研究人员可能会要求样本成员推荐其他被调查的物种，或者跟踪一个稀有物种以寻找其他近亲。这种方法可能会引入偏差，因为样本可能并不代表整个人口的真正随机部分，但它这样做的好处是显著降低成本。

抽样误差

抽样中的错误通常表现为选择性偏差或随机抽样偏差．这样的错误可能会发生

当进行抽样的研究人员意外地或故意地构建了研究，使其不代表总人口，或者
因为研究人员使用了一种真正随机的方法，而这个随机样本恰好不能代表整个人口。

这里的关键是有一个错误，因为样本不代表总体。

其他类型的错误不是设计的产物，而是执行的产物。其中包括一点在接受调查的人口中，数据输入和处理错误,测量误差当向受访者提出的问题被误解或对样本成员进行的测试没有测量他们打算测量的内容时发生。例如，“你有多喜欢这个产品?”这样的问题似乎是一个很好的问题，但实际上可能收集不到调查员想要的数据。这可能表明受访者是多么不愿意说任何负面的东西，或者可能夸大他们对产品的小问题。更好的问题应该是，“你有多大可能向朋友或家人推荐这个产品?”这是调查中常用的问题，被称为净评分．这些错误的关键在于，即使样本是随机的，所处理的数据也可能不能准确地反映样本或总体。

在这两种情况下，很难确定样本在统计上是否有效。一种解决方案是对结果进行逆向工程，以查看它们是否与预期的方法匹配(不一定是它们是否与任何特定的结果匹配)。例如，有人可能会看到一个75%的女性样本，并认为这是一个错误(应该接近50%)。然后他们可以测试他们的抽样方法产生这个结果的概率是多少。

计算采样误差

抽样误差也可以指在一个样本中计算的误差，也称为误差误差范围．例如，大多数已发表的实验科学研究都包含误差范围。他们可能会说 $95 \ %$ 置信区间误差范围是 $5 \ %$ ，意思是他们可以用 $95 \ %$ 确定他们的结果 $5下午\ \ %$ 准确的。

样本误差的基本公式为 $z \√6 \压裂{p (1 - p)} {n},$ 在哪里 $z$ 是z分数对于研究的置信区间，有时表示为 $z ^ *$ ，或临界值。 $p$ 样本中含有你要测试的因子的部分，和 $n$ 是总样本总体。有时这个公式表示为 $1.96 \√6 \压裂{p (1 - p)} {n},$ 假设置信区间为95%

假设你是一名研究人员，对1000名受访者进行了抽样调查。你在评估他们，以确定他们是否支持他们的国会议员。你有一个95%的置信区间，700个受访者说他们不赞成他们的国会议员。你的误差范围是多少?

我们有 $z \√6 \压裂{p (1 - p)} {n} = 1.96 \√6 \压裂{(0.700)(0.300)}{1000}= 2.84 \ %,$ 这意味着你可以说，有95%的信心，1000个美国人中有700人不赞成他们的国会议员，正负2.84%。 $_ \广场$

一个 $z$ -其他置信区间的得分表如下:

置信区间	$z$ 分数
80％	1.28
90％	1.645
95％	2.33
99％	2.58
99.9%	3.29

当您减少样本量并试图增加置信区间时，误差幅度会显著增加。

参考文献

Kernier D。简单随机抽样．检索2016年6月1日，从https://en.wikipedia.org/wiki/File:Simple_random_sampling.PNG
Kernier D。系统抽样．检索2016年6月1日，从https://en.wikipedia.org/wiki/File:Systematic_sampling.PNG
Kernier D。分层抽样．检索2016年6月1日，从https://en.wikipedia.org/wiki/File:Stratified_sampling.PNG
Kernier D。整群抽样．检索2016年6月1日，从https://en.wikipedia.org/wiki/File:Cluster_sampling.PNG

有关……

内容