标准误差
标准误差是一个统计数字的抽样分布的标准偏差。该术语也可用于对该标准差的估计(很好的猜测),该标准差取自整个群体的样本。
一组中某一部分的平均数(称为样本)是估计整个组的平均数的通常方法。测量整个群体往往太难或花费太多资金。但是如果测量一个不同的样本,它的平均数就会与第一个样本有一点不同。平均数的标准误差是一种了解样本的平均数与整个组的平均数有多接近的方法。它是一种知道你对样本的平均数有多大把握的方法。
在实际测量中,通常不知道整个组的平均值的标准差的真实值。因此,标准误差一词通常被用来指对整个组的真实数字的接近猜测。样本中的测量值越多,猜测值就越接近整组的真实数字。
对于一个以无偏正态分布误差取样的数值,上面描述的是高于和低于实际值的0、1、2、3个标准差的样本比例。
如何找到平均数的标准误差
找到平均数的标准误差的一个方法是有很多样本。首先,找到每个样本的平均数。然后找到这些样本平均数的平均数和标准差。所有样本平均数的标准差就是平均值的标准误差。这可能是一项大量的工作。有时,拥有大量的样本太困难或花费太多资金。
另一种寻找平均数标准误差的方法是使用一个只需要一个样本的方程式。平均数的标准误差通常是由整个组的样本的标准差(样本标准差)除以样本量的平方根来估计的。
S E x¯ = s n {displaystyle SE_{bar {x}} ={frac {s}{sqrt {n}}}}
其中
s是样本标准差(即基于样本的人口标准差的估计值),和
n是样品中的测量数量。
需要多大的样本才能使平均数的标准误差的估计值接近整个组的实际标准误差?样本中至少要有六个测量值。那么样本的平均数标准误差将在整组测量的平均数标准误差的5%以内。
对某些情况的纠正
如果测量的数量是整个小组的5%或更多,则可以使用另一个方程式。
如果一个样品的测量值少于20个,有特殊的方程式可以使用。
有时一个样本来自一个地方,尽管整个小组可能是分散的。另外,有时一个样本可能是在一个很短的时间内完成的,而整个群体覆盖的时间较长。在这种情况下,样本中的数字是不独立的。那么就需要使用特殊的方程来试图纠正这一点。
有用性
一个实际的结果。通过在一个样本中进行更多的测量,人们可以对一个平均值更加肯定。那么平均值的标准误差就会变小,因为标准偏差被更大的数字所除。然而,要使平均值的不确定性(平均数的标准误差)达到一半大,样本量(n)需要大四倍。这是因为标准偏差要除以样本量的平方根。要使不确定性达到十分之一大,样本量(n)需要大一百倍!这就是所谓的不确定性。
标准误差很容易计算,并被大量使用,因为。
相对标准误差
相对标准误差(RSE)是标准误差除以平均值。这个数字比1要小。用它乘以100%,就得到了它占平均值的百分比。这有助于显示不确定性是否重要。例如,考虑两项家庭收入的调查,其结果都是50,000美元的样本平均值。如果一项调查的标准误差为10,000美元,另一项调查的标准误差为5,000美元,那么,相对标准误差分别为20%和10%。相对标准误差较小的调查更好,因为它的测量更精确(不确定性更小)。
事实上,需要了解平均值的人经常在决定使用信息之前决定不确定性应该有多小。例如,美国国家卫生统计中心在相对标准误差超过30%时不报告平均值。NCHS还要求至少有30个观测值才能报告一个估计值。[]
例子
例如,在墨西哥湾的水中有许多红鱼。要知道一条42厘米长的红鱼的平均重量,不可能测量所有42厘米长的红鱼。相反,它可以测量其中的一些。实际测量的鱼被称为样本。该表显示了两个红鱼样本的重量,所有42厘米长的红鱼。第一个样本的平均(平均)重量是0.741公斤。第二个样品的平均(平均)重量是0.735公斤,与第一个样品有一点不同。这些平均数中的每一个都与测量每条42厘米长的红鱼所得到的平均数有一点不同(无论如何这是不可能的)。
平均数的不确定性可用于了解样本的平均数与测量整个组的平均数的接近程度。平均数的不确定性被估计为样本的标准偏差,除以样本数的平方根减去1。该表显示,两个样本的平均值的不确定度非常接近。另外,相对不确定度是平均值的不确定度除以平均值,乘以100%。在这个例子中,两个样品的相对不确定性是2.38%和2.50%。
知道了平均数的不确定性,就可以知道样本的平均数与测量整个群体的平均数有多接近。整个群体的平均数介于a)样本的平均数加上平均值的不确定性,和b)样本的平均数减去平均值的不确定性。在这个例子中,根据第一个样本,墨西哥湾所有42厘米长的红鱼的平均重量预计为0.723-0.759公斤,而根据第二个样本,则为0.717-0.753公斤。
例子中使用的红鱼(又称红鼓,Sciaenops ocellatus)。
问题和答案
问:什么是标准误差?答:标准误差是指一个统计量的抽样分布的标准偏差。
问:标准误差一词能否用于标准差的估计?
答:是的,标准误差一词可以用于对该标准差的估计(很好的猜测),该标准差取自整个群体的样本。
问:如何估计整个群体的平均数?
答:对一个群体的某些部分(称为样本)进行平均,是估计整个群体平均数的通常方法。
问:为什么难以测量整个群体?
答:测量整个群体往往太难,或者成本太高。
问:什么是平均数的标准误差,它能决定什么?
答:平均数的标准误差是一种了解样本的平均数与整个群体的平均数有多接近的方法。它是一种了解人们对样本中的平均数有多大把握的方法。
问:在实际测量中,平均值的标准差的真实值通常是已知的吗?
答:不,在实际测量中,通常不知道整个组的平均数标准差的真实值。
问:样本中的测量次数如何影响估计的准确性?
答:样本中的测量值越多,猜测值就越接近整组的真实数字。