在统计学中,样本是人口的一部分。样本是经过精心挑选的。它应该公平地代表整个人口,没有偏见。需要抽样的原因是,人口可能非常庞大,对所有个人进行统计可能不可能或不实际。
因此,解决统计学中的问题通常是从抽样开始的。抽样就是选择取哪些数据用于以后的分析。举个例子,假设要对一个湖泊的污染情况进行分析研究。根据水样的采集地点不同,研究的结果也会不同。一般来说,样本需要是随机的。这意味着选择一个人的机会或概率与选择任何其他个人的机会相同。
在实践中,随机抽样总是通过一个明确的程序来进行。程序是一套规则,是写在纸上并严格遵守的一系列步骤。即使如此,样本中也可能存在一些偏差。考慮設計一個樣本來預測選舉投票結果的問題。所有已知的方法都有其问题,选举的结果往往与基于样本的预测不同。如果你通过电话或在街上与人见面来收集意见,样本总是有偏差的。因此,在这种情况下,一个完全中立的样本是不可能的。在这种情况下,统计学家会考虑如何测量偏差的数量,有一些方法可以估计。
当科学家测量一个物理属性时,例如一块金属的重量或光速,也会出现类似的情况。如果我们用敏感的设备称量一个物体的重量,我们会得到微小的不同结果。没有一个测量系统是完美的。我们得到一系列的估计,每一个估计都是一种测量。这些都是样本,有一定程度的误差。统计学的目的是描述误差,并对这种数据进行分析。
样品有不同的种类。

