一台机器将人造黄油装入杯中。在这个例子中,机器被调整为杯子里的人造黄油含量为250克。由于机器不能准确地将250克的人造黄油装入每一个杯子,因此添加到各个杯子中的内容显示出一些变化,并被认为是一个随机变量X。这种变化被假定为围绕所需的平均250克的正态分布,标准差为2.5克。为了确定机器是否被充分校准,随机选择n=25杯人造黄油的样本,并对这些杯子进行称重。人造黄油的重量为X1,...,X25,是X的随机样本。
为了获得对期望值μ的印象,只需给出一个估计值。适当的估计值是样本平均数。
μ ^ = X ¯ = n 1∑ i = n 1X i 。{displaystyle {hat {mu }}={bar {X}}={frac {1}{n}}sum _{i=1}^{n}X_{i}.} 
样本显示实际权重x1,...,x25,有平均值。
x ¯ = 125∑ i = x125 i = grams250.2 。{displaystyle {bar {x}}={{frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{text{grams}}。} 
如果我们再取25个杯子的样本,我们很容易就会发现250.4或251.1克这样的数值。然而,如果杯子的平均含量实际上接近250克,那么280克的样本平均值将是极其罕见的。在样本平均值的观察值250.2周围有一个完整的区间,在这个区间内,如果整个人群的平均值确实在这个范围内,观察到的数据就不会被认为是特别不寻常的。这样一个区间被称为参数μ的置信区间。我们如何计算这样一个区间?区间的端点必须从样本中计算出来,所以它们是统计数据,是样本X1,...,X的函数25,因此是随机变量本身。
在我们的案例中,我们可以通过考虑正态分布样本的样本平均值X也是正态分布,具有相同的期望值μ,但标准误差σ/√n=0.5(克)来确定端点。通过标准化,我们得到一个随机变量
Z = X ¯ - μ σ / n = X ¯ - μ {0.5displaystyle Z={frac {{bar {X}-mu }{sigma /{sqrt {n}}}}={frac {{bar {X}-mu }{0.5}}] 
因此,有可能找到独立于μ的数字-z和z,其中Z位于两者之间,概率为1-α,这是衡量我们希望有多大信心的标准。我们取1-α=0.95。所以我们有。
P ( - z ≤ Z ≤ z ) = 1- α = 0.95。 {displaystyle P(-z\leq Z\leq z)=1-α =0.95.\,}。 
数字z由累积分布函数得出。
Φ ( z ) = P ( Z ≤ z ) = 1- α = 2,0.975z = Φ -1 ( Φ ( z ) ) = Φ -1 ( )0.975 = ,{1.96displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{tfrac {alpha }{2}}=0.975,[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}. ![{\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}](https://www.alegsaonline.com/image/0e80e68d525d87d1b722d1150abda18cecb8f684.svg)
而我们得到的是。
0.95= 1- α = P ( - z ≤ Z ≤ z ) = P ( -1.96 ≤ X ¯ - μ σ / n ≤ )1.96 = P ( X ¯ -1.96 σ n ≤ μ ≤ X ¯ + 1.96σ n ) = P ( X ¯ - 1.96× ≤ 0.5μ ≤ X ¯ + ×1.96 ) 0.5= P ( X ¯ -0.98 ≤ μ ≤ X ¯ + ) 0.98。{displaystyle {begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\leq {\frac {{bar {X}}-mu }{sigma /{\sqrt {n}}}}\leq 1.96\right)\[6pt]&=P\left({\bar {X}}-1.96{frac {sigma }{sqrt {n}}\leq mu\leq {\bar {X}}+1.96{frac {sigma }{sqrt {n}}\right)\[6pt]&=Pleft({bar {X}}-1.96\times 0.5\leq mu \leq {bar {X}}+1.96times 0.5right)&=Pleft({bar {X}-0.98leq `mu {bar {X}+0.98right).end{aligned}}. ![{\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}](https://www.alegsaonline.com/image/2437ee6c7c0320fa30cec1de64773a6e7cc3a095.svg)
这可以解释为:以0.95的概率,我们将找到一个置信区间,在这个区间内,我们将在随机端点之间遇到参数μ。
X ¯ -0 . 98 {displaystyle {bar {X}}-0{.}98\,}。 
和
X¯+0.98. {displaystyle {bar {X}}+0.98.}。 
这并不意味着在计算的区间内遇到参数μ的概率是0.95。每次重复测量,都会有另一个样本的平均值X的值。在95%的情况下,μ会在由这个平均值计算出来的端点之间,但在5%的情况下,它不会。实际的置信区间是通过在公式中输入测量的权重来计算的。我们的0.95置信区间成为。
( x ¯ -0.98 ; x ¯ + )0.98 = ( 250.2-0.98 ; +250.2 ) 0.98= ( ; 249.22)251.18 。{\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} 
由于μ的期望值250在结果的置信区间内,没有理由认为机器被错误地校准了。
计算出的区间有固定的端点,其中μ可能在两者之间(或不在)。因此,这个事件的概率不是0就是1。我们不能说"概率为(1-α)的参数μ位于置信区间内"。我们只知道,通过重复,在100(1-α)%的情况下,μ会在计算的区间内。然而,在100α%的情况下,它不在。不幸的是,我们不知道在哪些情况下会发生这种情况。这就是为什么我们说"在置信度为100(1-α)%的情况下,μ位于置信区间内。"
右图显示了给定种群平均数μ的置信区间的50种实现方式。如果我们随机选择一种实现方式,那么我们最终选择包含参数的区间的概率是95%;但是我们可能不走运,选错了。我们永远不会知道;我们只能选择我们的区间。