置信区间

统计学中,置信区间是估计某个参数的一种特殊形式。通过这种方法,给出了参数的整个可接受值的区间,而不是一个单一的值,同时还给出了参数的真实(未知)值在区间内的概率。置信区间是基于样本的观察结果,因此在不同的样本中是不同的。参数在区间内的可能性被称为置信度。通常,它以百分比的形式给出。置信区间总是与置信度一起给出。人们可能会说到 "95%的置信区间"。置信区间的端点被称为置信度。对于一个特定情况下的估计程序,置信度越高,置信区间就越宽。

计算置信区间通常需要对估计过程的性质进行假设--它主要是一种参数化的方法。一个常见的假设是,样本所来自的人群的分布是正常的。因此,下面讨论的置信区间不是稳健的统计数据,尽管可以通过改变来增加稳健性。

"信心 "一词的含义

信心这个词在统计学中有着类似的含义,就像在普通的使用中一样。在通常的用法中,对某一事物声称有95%的信心,通常被认为是表示实际的确定性。在统计学中,声称95%的置信度仅仅意味着研究者从大量可能的区间中看到了一个可能的区间,其中20个区间中的19个包含了参数的真实值。

实例

A factory assembly line fills margarine cups to a desired 250g +/- 5g

一台机器将人造黄油装入杯中。在这个例子中,机器被调整为杯子里的人造黄油含量为250克。由于机器不能准确地将250克的人造黄油装入每一个杯子,因此添加到各个杯子中的内容显示出一些变化,并被认为是一个随机变量X。这种变化被假定为围绕所需的平均250克的正态分布标准差为2.5克。为了确定机器是否被充分校准,随机选择n=25杯人造黄油的样本,并对这些杯子进行称重。人造黄油的重量为X1,...,X25,是X的随机样本。

为了获得对期望值μ的印象,只需给出一个估计值。适当的估计值是样本平均数。

μ ^ = X ¯ = n 1∑ i = n 1X i 。{displaystyle {hat {mu }}={bar {X}}={frac {1}{n}}sum _{i=1}^{n}X_{i}.} {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

样本显示实际权重x1,...,x25,有平均值。

x ¯ = 125∑ i = x125 i = grams250.2 。{displaystyle {bar {x}}={{frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{text{grams}}。} {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

如果我们再取25个杯子的样本,我们很容易就会发现250.4或251.1克这样的数值。然而,如果杯子的平均含量实际上接近250克,那么280克的样本平均值将是极其罕见的。在样本平均值的观察值250.2周围有一个完整的区间,在这个区间内,如果整个人群的平均值确实在这个范围内,观察到的数据就不会被认为是特别不寻常的。这样一个区间被称为参数μ的置信区间。我们如何计算这样一个区间?区间的端点必须从样本中计算出来,所以它们是统计数据,是样本X1,...,X的函数25,因此是随机变量本身。

在我们的案例中,我们可以通过考虑正态分布样本的样本平均值X也是正态分布,具有相同的期望值μ,但标准误差σ/√n=0.5(克)来确定端点。通过标准化,我们得到一个随机变量

Z = X ¯ - μ σ / n = X ¯ - μ {0.5displaystyle Z={frac {{bar {X}-mu }{sigma /{sqrt {n}}}}={frac {{bar {X}-mu }{0.5}}] {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

因此,有可能找到独立于μ的数字-zz,其中Z位于两者之间,概率为1-α,这是衡量我们希望有多大信心的标准。我们取1-α=0.95。所以我们有。

P ( - z ≤ Z ≤ z ) = 1- α = 0.95。 {displaystyle P(-z\leq Z\leq z)=1-α =0.95.\,}。 {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

数字z由累积分布函数得出。

Φ ( z ) = P ( Z ≤ z ) = 1- α = 2,0.975z = Φ -1 ( Φ ( z ) ) = Φ -1 ( )0.975 = ,{1.96displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{tfrac {alpha }{2}}=0.975,[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}. {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

而我们得到的是。

0.95= 1- α = P ( - z ≤ Z ≤ z ) = P ( -1.96 ≤ X ¯ - μ σ / n ≤ )1.96 = P ( X ¯ -1.96 σ n ≤ μ ≤ X ¯ + 1.96σ n ) = P ( X ¯ - 1.96× ≤ 0.5μ ≤ X ¯ + ×1.96 ) 0.5= P ( X ¯ -0.98 ≤ μ ≤ X ¯ + ) 0.98。{displaystyle {begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\leq {\frac {{bar {X}}-mu }{sigma /{\sqrt {n}}}}\leq 1.96\right)\[6pt]&=P\left({\bar {X}}-1.96{frac {sigma }{sqrt {n}}\leq mu\leq {\bar {X}}+1.96{frac {sigma }{sqrt {n}}\right)\[6pt]&=Pleft({bar {X}}-1.96\times 0.5\leq mu \leq {bar {X}}+1.96times 0.5right)&=Pleft({bar {X}-0.98leq `mu {bar {X}+0.98right).end{aligned}}. {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

这可以解释为:以0.95的概率,我们将找到一个置信区间,在这个区间内,我们将在随机端点之间遇到参数μ。

X ¯ -0 . 98 {displaystyle {bar {X}}-0{.}98\,}。 {\displaystyle {\bar {X}}-0{.}98\,}

X¯+0.98. {displaystyle {bar {X}}+0.98.}。 {\displaystyle {\bar {X}}+0.98.\,}

这并不意味着在计算的区间内遇到参数μ的概率是0.95。每次重复测量,都会有另一个样本的平均值X的值。在95%的情况下,μ会在由这个平均值计算出来的端点之间,但在5%的情况下,它不会。实际的置信区间是通过在公式中输入测量的权重来计算的。我们的0.95置信区间成为。

( x ¯ -0.98 ; x ¯ + )0.98 = ( 250.2-0.98 ; +250.2 ) 0.98= ( ; 249.22)251.18 。{\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

由于μ的期望值250在结果的置信区间内,没有理由认为机器被错误地校准了。

计算出的区间有固定的端点,其中μ可能在两者之间(或不在)。因此,这个事件的概率不是0就是1。我们不能说"概率为(1-α)的参数μ位于置信区间内"。我们只知道,通过重复,在100(1-α)%的情况下,μ会在计算的区间内。然而,在100α%的情况下,它不在。不幸的是,我们不知道在哪些情况下会发生这种情况。这就是为什么我们说"在置信度为100(1-α)%的情况下,μ位于置信区间内。"

右图显示了给定种群平均数μ的置信区间的50种实现方式。如果我们随机选择一种实现方式,那么我们最终选择包含参数的区间的概率是95%;但是我们可能不走运,选错了。我们永远不会知道;我们只能选择我们的区间。

垂直线段代表μ的置信区间的50次实现。Zoom
垂直线段代表μ的置信区间的50次实现。

问题和答案

问:什么是统计学中的置信区间?
答:置信区间是一种特殊的区间,用于估计一个参数,如人口平均数,给出该参数的可接受值范围,而不是一个单一的值。

问:为什么使用置信区间而不是单一数值?
答:使用置信区间而不是单一数值,是为了说明基于样本估计参数的不确定性,并给出参数的实际值在区间内的可能性。

问:什么是置信度?
答:置信度是指被估计的参数在置信区间内的可能性,通常以百分比形式给出(如95%的置信区间)。

问:什么是置信限?
答:置信限是置信区间的端点,它定义了被估计参数的可接受值的范围。

问:置信度是如何影响置信区间的?
答:在一个特定的估计程序中,置信度越高,置信区间就越宽。

问:计算置信区间需要哪些假设?
答:计算置信区间一般需要对估计过程的性质进行假设,例如假设样本所来自的人口分布是正常的。

问:置信区间是稳健的统计吗?
答:如下文所述,置信区间不是稳健统计,尽管可以通过调整来增加稳健性。

AlegsaOnline.com - 2020 / 2023 - License CC3