概率统计电子教案(20)_图文

§8.4

置信区间

置信区间是区间估计中应用最广泛的一种类型。本节将

通过分析一个实际例子,引出置信区间中的一些基本概念与
求置信区间的一般步骤。 例8.15 为了考察某厂生产的水泥构件的抗压强度(单位:

千克力/平方厘米),抽取了25件样品进行测试,得到25个
数据

x1 ,?, x ,并由此算得 25
1 25 x ? ? xi ? 415 25 i ?1

用点估计的观点看,415是该厂生产的水泥构件的平均抗压

强度的估计值。

如果在抽样前已经从历史上积累的资料中获悉,该厂
生产的水泥构件的抗压强度 X ~ N (? ,400),其中 ? 未知, 现在希望通过抽样所获得的信息给出 ? 的一个区间估计。 由于 x ? 415是 ? 的一个较优的点估计,因此一个合理 的区间估计应该是 [ x ? d , x ? d ]。 这里产生两个问题:

(1)d究竞取多大才比较合理?
(2)这样给出的区间估计的可靠程度如何? 从直观上可以想象:d愈大可靠程度也愈高,但区间过 宽是没有实际意义的;反之,d 愈小,似乎区间估计越精 确,但是可靠程度却很低。下面给出一种方法,它较合理 地解决了这一对矛盾。

在抽样前,区间估计 [ X ? d , X ? d ] 是一个随机区间,反 映区间估计可靠程度的量是这个随机区间覆盖未知参数 ? 的 概率

P( X ? d ? ? ? X ? d ) ? P(| X ? ? |? d ) 2 ? 由于 X ~ N ( ? , ) ,其中 ? 2 ? 400, n ? 25 ,因此上述概率 n 为 X ?? nd P(| n ? |? ) ? ?(c) ? ?(?c) ? 2?(c) ? 1

?

?

其中

c? ?

nd

?

5d d ? ? 20 4

d ? 4c

如果我们要求这个概率至少为1 ? ? ,其中 ? 是近于0的正

数,那么,由 2?(c) ? 1 ? 1 ? ?

c ? ? (1 ? ) ? u ? 1? 2 2 一般总是取 c ? u ? ,这是为了不使所给出的区间过宽。
解得
1?

?1

?

例如,当 ? ? 0.05 时, 1 ? ? ? 0.95, 1 ?

2

?

c ? u0.975

2 ? 1.96, d ? 4c ? 7.84,于是随机区间为

? 0.975, 因此

[ X ? d , X ? d ] ? [ X ? 7.84, X ? 7.84]
习惯上把这个区间估计通过分位数表达成

? ? ? ? , X ?u ? ? X ? u1?? ? 1? n n 2 2 ? ?
因为它清楚地表示这个区间估计的可靠程度(即它覆盖未知参 数的概率)为 1 ? ? 。

在抽样后,由样本观测值算得 x ? 415。因此, ? 的区间
估计的观测值为

? ? ? ? ? x ? u0.975 n , x ? u0.975 n ? ? ? 20 20 ? ? ? ?415? 1.96? ,415? 1.96? 25 25 ? ? ? ? [415? 7.84,415? 7.84] ? [407.16,422.84]
从样本观测值提供的信息,推断出以95%的可靠程度,

保证该厂生产的水泥构件的平均抗压强度在 407 .16 ~ 422 .84
(千克力/平方厘米)之间。 按照例8.15中给出的方法得到的区间估计便是置信区间。 置信区间的一般定义如下:

定义8.6 设( X 1 , ? , X n ) 是取自总体X的一个样本。对于 未知参数 ? ,给定 ? , 0 ? ? ? 1 。如果存在两个统计量

? ( X 1 , ? , X n ), ? ( X 1 , ? , X n ),使得
P (? ( X 1 , ? , X n ) ? ? ? ? ( X 1 , ? , X n )) ? 1 ? ?
那么称 [? , ? ] 为? 的双侧 1 ? ? 置信区间;称 1 ? ? 为置信水 平,称 ? (? ) 为 ? 的双侧 1 ? ? 置信区间的下(上)限,简称为 双侧置信下(上)限。

定义8.6表示双侧 1 ? ? 置信区间 [? ,? ] 覆盖未知参数 ?
的概率至少为 1 ? ? 。它的直观意义是,对同一个未知参数

? ,反复使用同一个置信区间 [? ,? ] 时,尽管不能保证每一
次都有 ? ?[? ,? ],但是至少约有 100(1 ? ? )% 次使得 ? ?[? ,? ] 成立。一般取 ? 为近于0的正数。

现在我们来给出求置信区间的一般步骤。它的基本思 想是,一个较优的点估计应该属于置信区间。 设未知参数为 ? ,置信水平为 1 ? ? :

?( X1,?, X n ). 步骤1 求出未知参数 ? 的一个较优的点估计 ?
尽可能使用 ? 的极大似然估计;
步骤2 以 ?? 为基础,寻找一个随机变量

J ? J ( X1,?, X n ;? )
它必须包含、也只能包含这个未知参数 ? 。要求 J 的分位 数能通过查表或计算得到具体数值;

步骤3 设 J 的

?
2

分位数为 a ,1 ?

?
2

分位数为 b ,于是

P(a ? J ? b) ? 1 ? ?
步骤4 把不等式 a ? J ? b 作等价变形,使它成为

? ( X1,?, X n ) ? ? ? ? ( X1,?, X n )
这个 [? ,? ] 便是一个双侧 1 ? ? 置信区间。

在实际问题中,还常常会遇到另一类区间估计问题。例 如,在例8.15中,我们希望知道该厂生产的水泥构件的平均 抗压强度至少有多大,或至多只有多大。这相当于双侧置信 区间中的 ? ? ?? 或 ? ? ? 。

定义8.7 设( X1 ,?, X n ) 是取自总体X的一个样本。对
于未知参数 ? ,给定 ? , 0 ? ? ? 1 。如果存在统计量

? ( X1,?, X n ),使得
P(? ( X1 ,?, X n ) ? ? ) ? 1 ? ?
那么称 [? , ?]为 ? 的单侧 1 ? ? 置信区间;称 1 ? ? 为置信水

平,称 ? 为 ? 的单侧 1 ? ? 置信区间的下限,简称为单侧置
信下限。 类似地,如果存在统计量 ? ( X1 ,?, X n ),使得

P(? ? ? ( X1,?, X n )) ? 1 ? ?
那么称 [??,? ] 为? 的单侧 1 ? ? 置信区间;称 ? 为? 的单 侧 1 ? ? 置信区间的上限,简称为单侧置信上限。

求单侧置信区间的方法基本上与求双侧置信区间的方法 相同,但要对上述一般步骤作些修改:

在步骤3中,a 表示 J 的 ? 分位数,b 表示 J 的1 ? ? 分
位数,然后对

P(a ? J ) ? 1 ? ? 或 P( J ? b) ? 1 ? ?
中的“a ? J ”或“ J ? b ”作不等式等价变形。

§8.5 正态总体下未知参数的置信区间
正态总体下未知参数的置信区间是实际工作中应用价值 最大的一类置信区间问题。本节将按正态总体的个数分别对 置信区间问题进行详细的研究。 一、一个正态总体的情形

设总体 X ~ N (?,? 2 ), ? ? ? ? ? ?, ? 2 ? 0;( X1,?, X n )
是取自正态总体X的一个样本,在§7.2中我们曾经讲过,正

态总体有三种类型。下面分别讨论这三种类型中未知参数的
置信区间问题,取置信水平为 1 ? ? 。

(1) ? 未知但 ? 2 已知
现在要求未知参数 ? 的置信区间。 ? 的极大似然估计 是 X ,令

J ? n?

X ??

?
2 1?

按定理7.5(i), J ~ N (0,1),由于 u? ? ?u

?
2

,因此,

P(?u

1?

?
2

? J ?u

1?

?
2

) ? P(?u

1?

?
2

? n?

X ??

?

?u

1?

?
2

)

? P( X ? u

?
?
2

1?

n

? ? ? X ?u

?
?
2

1?

n

) ? 1??

于是 ? 的双侧 1 ? ? 置信区间为

? ? ? ? , X ?u ? ? X ? u1? ? ? 1? n n 2 2 ? ? 如果要求 ? 的单侧 1 ? ? 置信区间,那么,由
P(u? ? J ) ? P(?u1?? ? J ) ? P(?u1?? ? n ? ? P( ? ? X ? u1?? X ??

?
n

?

)

) ? 1??

? 得到 ? 的单侧 1 ? ? 置信区间的上限为 X ? u1?? ? ;由 n X ?? ? P( J ? u1?? ) ? P( n ? ? u1?? ) ? P( ? ? X ? u1?? ) ? 1?? ? n
得到 ? 的单侧 1 ? ? 置信区间的下限为 X ? u1?? ?

? 。 n

例8.15(续) ? 的单侧95%(即 1 ? ? ? 0.95 )置信上限为

x ? u0.95

?

20 ? 415? 1.645? ? 415? 6.58 ? 421.58 n 25

它表示以95%的可靠性保证该厂生产的水泥构件的平均抗压
强度至多只有421.58(千克力/平方厘米)。

? 的单侧95%置信下限为
x ? u0.95

?

20 ? 415? 1.645? ? 415? 6.58 ? 408.42 n 25

它表示以95%的可靠性保证该厂生产的水泥构件的平均抗压 强度至少有408.42(千克力/平方厘米)。

(2) ? 已知但 ? 2 未知 现在要求未知参数 ? 2的置信区间。 ? 2 的极大似然估计
是 令

1 n ? ? ? ( xi ? ? ) 2 ? n i ?1
2

J?

?2 n?

?2

?

1

?2

2 ( x ? ? ) ? i i ?1

n

由定理7.7(ii)的证明过程中可以看出, J ~ ? 2 (n) 。因此
2 P( ? ? (n) ? J ? ? 2 ? (n)) 2 2 ? P( ? ? ( n) ? 2 1? 2

1

?2

2 2 ( X ? ? ) ? ? ? ? ( n)) ? 1 ? ? i ?1 1? 2

n

于是 ? 2 的双侧 1 ? ? 置信区间为

? n 2 ( X ? ? ) ?? ? i ?1 2 , ? ?1? ? (n) 2 ? ?

? (X ? ?) ? ? i ?1 ? 2 ? ? ( n) ? 2 ? ?
n 2

如果要求 ? 2 的单侧 1 ? ? 置信区间,那么,由

P( ?? (n) ? J ) ? P( ?? (n) ?
2 2

1

?2

2 ( X ? ? ) ) ? 1?? ? i ?1

n

2 得到 ? 的单侧 1 ? ? 置信区间的上限为

?(X
i ?1 2

n

i

? ? )2

?? ( n)

;由

P( J ? ?

2 1??

(n)) ? P(

1

?2

2 2 ( X ? ? ) ? ? ? 1?? (n)) ? 1 ? ? i ?1
2 ( X ? ? ) ? i i ?1 n

n

得到 ? 2 的单侧 1 ? ? 置信区间的下限为

?

2 1??

( n)



(3) ? 与 ? 2 均未知 未知参数 ? 的极大似然估计是 X 。令

X ?? J ? n? S 按定理7.6,J ~ t (n ? 1) 。由于 t? (n ? 1) ? ?t
2

1?

?
2

(n ? 1) ,因此,

P ( ?t

1?

?
2

(n ? 1) ? J ? t

1?

?
2

(n ? 1))

X ?? ? P (?t ? (n ? 1) ? n ? ? t ? (n ? 1)) ? 1 ? ? 1? 1? S 2 2
于是 ? 的双侧 1 ? ? 置信区间为

? S , ? X ? t1? ? ( n ? 1) n 2 ?

S ? X ? t ? ( n ? 1) ? 1? n? 2



P(t? (n ? 1) ? J ) ? P(?t1?? (n ? 1) ? n ?

X ?? ) ? 1?? S

得到 ? 的单侧置信上限为 X ? t1?? (n ? 1) S n X ?? 由 P( J ? t1?? (n ? 1)) ? P( n ? ? t1?? (n ? 1)) ? 1 ? ? S S 得到 ? 的单侧置信下限为 X ? t1?? (n ? 1) n n 1 2 未知参数 ? 2 的极大似然估计是 S n ? ? ( X i ? X )2 n i ?1 令

J?

2 nSn

?2

?

1

?

2 ( X ? X ) i 2 ? i ?1

n

按定理7.5(ii), J ~ ? 2 (n ?1) 。因此,

2 P( ? ? (n ? 1) ? J ? ? 2 ? (n ? 1)) 2 2 ? P( ? ? (n ? 1) ? 2 2 nSn 1? 2

?2

? ? 2 ? (n ? 1)) ? 1 ? ?
1? 2

于是 ? 2 的双侧 1 ? ? 置信区间为 ? ? 2 2 nS n ? ? nS n ? ? 2 ( n ? 1) , ? 2 ( n ? 1) ? ? ? ? ? 1? 2 ? 2 ? 由 2 nS 2 2 P ( ?? (n ? 1) ? J ) ? P( ?? (n ? 1) ? 2n ) ? 1 ? ?

?

2 nS 得到 ? 2 的单侧置信上限为 2 n ;由 ? ? ( n ? 1)

P( J ? ?12?? (n ? 1)) ? P(

2 nSn

?2

? ?12?? (n ? 1)) ? 1 ? ?

2 nS 得到 ? 2 的单侧置信下限为 2 n 。 ?1?? (n ? 1)

由 ? 2 的置信区间易得 ? 的双侧 1 ? ? 置信区间为

? 2 ? nSn ? ? 2 (n ? 1) , ? 1?? 2 ?
2 nSn 2 ?? (n ? 1)

? ? nS 2 ?? (n ? 1) ? ? 2 ?
2 n

类似地,? 的单侧置信上限与下限分别为
2 nSn ?12?? (n ? 1)

例8.16 电动机由于连续工作时间过长而会烧坏。今随机

地从某种型号的电动机中选取9台,并测试它们在烧坏前的
连续工作时间(单位:小时)。由数据 x1 ,?, xn 算得

1 9 x ? ? xi ? 39.7 9 i ?1

1 9 2 sn ? ( x ? x ) ? 2.5 ? i 9 i ?1

假定该种型号的电动机烧坏前连续工作时间 X ~ N (? , ? 2 ) , 取置信水平为0.95。试分别求出 ? 与 ? 2 的双侧置信区间。 解 由于 t0.975 (8) ? 2.306

因此,? 的双侧95%置信区间的上下限分别为 S 2.65 x ? t0.975 (8) ? 39.7 ? 2.306? ? 39.7 ? 2.04 9 3

即 ? 的双侧95%置信区间为[37.66,41.74]。
2 由 ?0 , .025 (8) ? 2.18 2 2 的双侧95% ,得到 ?0 ( 8 ) ? 17 . 54 ? .975

置信区间为
2 2 ? nSn ? ? 9 ? 2.52 9 ? 2.52 ? nSn , 2 , ? 2 ??? ? ? [3.21, 25.80] 2.18 ? ? ? 0.975 (8) ? 0.025 (8) ? ? 17.54

于是 ? 的双侧95%置信区间为

[ 3.21,

25.80] ? [1.79, 5.08]


相关文档

概率统计电子教案
概率统计电子教案(红15)
概率统计电子教案(18)
概率统计电子教案(5)
概率统计电子教案(13)
概率论电子教案,41
概率论与数理统计电子教案界面
学霸百科
新词新语
电脑版 | 学霸百科