概率论与数理统计_教案32课时

第一章

随机事件及其概率

概率论与数理统计是从数量化的角度来研究现实世界中一类不确定现象 (随机现象) 规 律性的一门应用数学学科,20 世纪以来,广泛应用于工业、国防、国民经济及工程技术等 各个领域. 本章介绍的随机事件与概率是概率论中最基本、最重要的概念之一. 【教学目的与要求】 通过学习, 使学生理解随机事件和样本空间的概念; 熟练掌握事件间的关系与基本运算。 理解事件频率的概念;了解随机现象的统计规律性。 知道概率的公理化定义;理解古典概 型的概念;了解几何概率;掌握概率的基本性质(特别是加法定理) ,会应用这些性质进行 概率计算。理解条件概率的概念;掌握乘法定理、全概率公式和贝叶斯公式,并会应用这些 公式进行概率计算。理解事件独立性的概念,会应用事件的独立性进行概率计算。掌握贝努 里概型及有关事件概率的计算。 【教学重点】 事件的关系与运算;概率的公理化体系;古典概型的计算;概率的加法公式、乘法公 式与全概率公式;条件概率与事件的独立性。贝努里概型。 【教学难点】 古典概率的计算;全概公式与贝叶斯公式的应用; 【计划课时】8 【教学内容】

第一节 随机事件
一. 随机现象 从亚里士多德时代开始,哲学家们就已经认识到随机性在生活中的作用, 但直到 20 世 纪初, 人们才认识到随机现象亦可以通过数量化方法来进行研究. 概率论就是以数量化方法 来研究随机现象及其规律性的一门数学学科.而我们已学过的微积分等课程则是研究确定性 现象的数学学科. 二. 随机现象的统计规律性 由于随机现象的结果事先不能预知, 初看似乎毫无规律. 然而人们发现同一随机现象 大量重复出现时, 其每种可能的结果出现的频率具有稳定性, 从而表明随机现象也有其固有 的规律性. 人们把随机现象在大量重复出现时所表现出的量的规律性称为随机现象的统计 规律性. 概率论与数理统计是研究随机现象统计规律性的一门学科. 为了对随机现象的统计规律性进行研究,就需要对随机现象进行重复观察, 我们把对随 机现象的观察称为随机试验, 并简称为试验, 记为 E . 例如, 观察某射手对固定目标进行射 击; 抛一枚硬币三次,观察出现正面的次数; 记录某市 120 急救电话一昼夜接到的呼叫次数 等均为随机试验. 随机试验具有下列特点: 1. 可重复性: 试验可以在相同的条件下重复进行; 2. 可观察性: 试验结果可观察,所有可能的结果是明确的; 3. 不确定性: 每次试验出现的结果事先不能准确预知.

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

三. 样本空间 尽管一个随机试验将要出现的结果是不确定的, 但其所有可能结果是明确的, 我们把随 机试验的每一种可能的结果称为一个样本点, 记为 e(或 ? ) ;它们的全体称为样本空间, 记 为 S (或 ? ). 基本事件的称谓是相对观察目的而言它们是不可再分解的、 最基本的事件, 其它事件均 可由它们复合而成,一般地,我们称由基本事件复合而成的事件为复合事件. 四. 事件的集合表示 按定义, 样本空间 S 是随机试验的所有可能结果(样本点)的全体, 故样本空间就是所 有样本点构成的集合, 每一个样本点是该集合的元素. 一个事件是由具有该事件所要求的特 征的那些可能结果所构成的, 所以一个事件对应于 S 中具有相应特征的样本点(元素)构成的 集合 , 它是 S 的一个子集 . 于是 , 任何一个事件都可以用 S 的某一子集来表示 , 常用字母 A, B,? 等表示. 五. 事件的关系与运算 因为事件是样本空间的一个集合, 故事件之间的关系与运算可按集合之间的关系和 运算来处理. 六. 事件的运算规律 事件间的关系及运算与集合的关系及运算是一致的,为了方便,给出下列对照表: 表 1.1
记号 ? ? 概率论 样本空间, 必然事件 不可能事件 基本事件 事件 A的对立事件 事件A发生导致B发生 事件A与事件B相等 事件A与事件B至少有一个发生 事件A与事件B同时发生 事件A发生而事件B不发生 事件A和事件B互不相容 集合论 全集 空集 元素 子集 A的余集 A是B的子集 A与B的相等 A与B的和集 A与B的交集 A与B的差集 A与B没有相同的元素

?
A A A? B A?B A? B AB A? B AB ? ?

例题选讲:
例 1 在管理系学生中任选一名学生, 令事件 A 表示选出的是男生, 事件 B 表示选出的是三 年级学生, 事件 C 表示该生是运动员. (1)叙述事件 ABC 的意义; (2)在什么条件下 ABC ? C 成立? (3)什么条件下 C ? B ? (4)什么条件下 A ? B 成立? 例2 考察某一位同学在一次数学考试中的成绩, 分别用 A, B, C, D, P, F 表示下列各事件 (括号中表示成绩所处的范围): A ? ?优秀([90,100]),
B ? ?良好([80,90) ) ,

C ? ?中等([70,80)), D ? ?及格([60,70)), P ? ?通过([60,100]), F ? ?未通过([0,60)),

则 A, B, C , D, F 是两两不相容事件 P 与 F 是互为对立事件,即有 P ? F ; A, B, C , D 均为 P 的 子事件,且有 P ? A ? B ? C ? D. 例 3 甲,乙,丙三人各射一次靶,记 A? “甲中靶” B? “乙中靶” C ? “丙中靶” 则可用上 述三个事件的运算来分别表示下列各事件: AB ; A; (1) “甲未中靶”: (2) “甲中靶而乙未中靶”:
2

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

(3) “三人中只有丙未中靶” ABC ;

(4) “三人中恰好有一人中靶” : AB C ? A BC ? A B C;

(5) “三人中至少有一人中靶”A ? B ? C; (6) “三人中至少有一人未中靶”A ? B ? C ; 或 ABC; (7)“三人中恰有兩人中靶” ABC ? AB C ? A BC; (8)“三人中至少兩人中靶” AB ? AC ? BC; (9)“三人均未中靶” A B C ; (10)“三人中至多一人中靶 AB C ? A BC ? A B C ? A B C ; (11)“三人中至多兩人中靶” ABC; 或 A ? B ? C ; 注:用其他事件的运算来表示一个事件, 方法往往不惟一,如上例中的(6)和(11)实际上 是同一事件, 读者应学会用不同方法表达同一事件, 特别在解决具体问题时,往往要根据需要 选择一种恰当的表示方法. 例 4 指出下列各等式命题是否成立, 并说明理由: (1) A ? B ? ( AB ) ? B ; (2) A B ? A ? B ; (3) A ? B ? C ? ABC ; (5) 如果 A ? B , 则 A ? AB; (7) 如果 A ? B , 那么 B ? A ; 例5 化簡下列事件:(1) ( A ? B )( A ? B); (4) ( AB)( AB ) ? ? ; (6) 如果 AB ? ? , 且 C ? A ,则 BC ? ? ; (8) 如果 B ? A , 那么 A ? B ? A. (2) AB ? A B ? A B .

思考题 1. 设当事件 A 与 B 同时发生时 C 也发生, 则 ( (A) A ? B 是 C 的子事件;

).

(B) ABC; 或 A ? B ? C ;

(C) AB 是 C 的子事件; (D) C 是 AB 的子事件. 2. 设事件 A ? {甲种产品畅销, 乙种产品滞销}, 则 A 的对立事件为 ( ). (A) 甲种产品滞销,乙种产品畅销; (B) 甲种产品滞销; (C) 甲、乙两种产品均畅销; (D) 甲种产品滞销或者乙种产品畅销.

第二节 随机事件的概率
对一个随机事件 A , 在一次随机试验中, 它是否会发生, 事先不能确定. 但我们可以问, 在一次试验中,事件 A 发生的可能性有多大?并希望找到一个合适的数来表征事件 A 在一 次试验中发生的可能性大小. 为此,本节首先引入频率,它描述了事件发生的频繁程度,进 而引出表征事件在一次试验中发生的可能性大小的数----概率. 一. 频率及其性质 定义 1 若 在 相 同 条 件 下 进 行 n 次 试 验 , 其 中 事 件 A 发 生 的 次 数 为 rn ( A) , 则 称

f n ( A) ?

rn ( A) 为事件 A 发生的频率 . 易见 , 频率具有下述基本性质 : n
3. 设 A1 , A2 , ?, An 是两两互不相容的事件, 则

1. 0 ? f n ( A) ? 1;

2. f n ( S ) ? 1;

f n ( A1 ? A2 ? ? ? An ) ? f n ( A1 ) ? f n ( A2 ) ? ? ? f n ( An ) .

二. 概率的统计定义

rn ( A) 随着试验次数 n n 的增大而稳定地在某个常数 p ( 0 ? p ? 1) 附近摆动,则称 p 为事件的概率,记为 P( A) .
定义 2 在相同条件下重复进行 n 次试验, 若事件 A 发生的频率 f n ( A) ? 频率的稳定值是概率的外在表现, 并非概率的本质. 据此确定某事件的概率是困难的, 但当进行大量重复试验时,频率会接近稳定值, 因此, 在实际应用时, 往往是用试验次数足够
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

3

大的频率来估计概率的大小, 且随着试验次数的增加, 估计的精度会越来越高。 三. 概率的公理化定义 任何一个数学概念都是对现实世界的抽象, 这种抽象使得其具有广泛的适用性. 概率的 频率解释为概率提供了经验基础, 但是不能作为一个严格的数学定义, 从概率论有关问题的 研究算起, 经过近三个世纪的漫长探索历程, 人们才真正完整地解决了概率的严格数学定义. 1933 年, 前苏联著名的数学家柯尔莫哥洛夫, 在他的“概率论的基本概念”一书中给出了现 在已被广泛接受的概率公理化体系, 第一次将概率论建立在严密的逻辑基础上. 定义 3 设 E 是随机试验, S 是它的样本空间,对于 E 的每一个事件 A 赋于一个实数 , 记为 P( A) , 若 P( A) 满足下列三个条件: 1. 非负性:对每一个事件 A ,有 P( A) ? 0 ; 2. 完备性: P( S ) ? 1; 3. 可列可加性:设 A1 , A2 ,? 是两两互不相容的事件,则有 P( ? Ai ) ?
i ?1 ?

? P( A ).
i i ?1

?

则称 P( A) 为事件 A 的概率. 四. 概率的性质 性质 1--性质 例题选讲: 频率及其性质 例 1 圆周率 ? ? 3.1415926?? 是一个无限不循环小数 , 我国数学家祖冲之第一次把它 计算到小数点后七位, 这个记录保持了 1000 多年! 以后有人不断把它算得更精确. 1873 年, 英国学者沈克士公布了一个 ? 的数值, 它的数目在小数点后一共有 707 位之多! 但几十年后, 曼彻斯特的费林生对它产生了怀疑. 他统计了 ? 的 608 位小数, 得到了下表:

数字

0

1

2

3

4

5

6

7

8

9

出现次数 60 62 67 68 64 56 62 44 58 67
你能说出他产生怀疑的理由吗? 因为 ? 是一个无限不循环小数,所以,理论上每个数字出现的次数应近似相等,或它 们出现的频率应都接近于 0.1,但 7 出现的频率过小.这就是费林产生怀疑的理由. 概率的统计定义 例2 检查某工厂一批产品的质量, 从中分别抽取 10 件、20 件、50 件、100 件、150 件、 200 件、300 件检查, 检查结果及次品频列入表 1-21
抽取产品总件数 n 10 次品数? 0 次品频率 ? / n 0 20 1 50 3 100 5 150 7 200 11 300 16

0.050 0.060 0.050 0.047 0.055 0.053

由表 1 看出, 在抽出的 n 件产品中, 次品数 ? 随着 n 的不同而取不同值, 从而次品频率 仅在 0.05 附近有微小变化. 所以 0.05 是次品频率的稳定值. n 例3 从某鱼池中取 100 条鱼, 做上记号后再放入该鱼池中. 现从该池中任意捉来 40 条鱼, 发现其中两条有记号, 问池内大约有多少条鱼? 概率的性质

?

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

4

例4 例 5

已知 P( A ) ? 0.5, P( AB ) ? 0.2, P( B) ? 0.4 , 求 (1) P( AB) ; (2) P( A ? B) ; (3) P ( A ? B) ; (4) P( A B ) . 观 察 某 地 区 未 来 5 天 的 天 气 情 况 , 记 Ai 为 事 件 : “ 有 i 天 不 下 雨 ”, 已 知

P( Ai ) ? iP( A0 ), i ? 1,2,3,4,5. 求下列各事件的概率:
(1) 天均下雨; (2) 至少一天不下雨; (2) 至少一天不下雨; 例 6 某城市中发行 2 种报纸 A, B. 经调查, 在这 2 种报纸的订户中, 订阅 A 报的有 45%,订 阅 B 报的有 35%, 同时订阅 2 种报纸 A, B 的有 10%. 求只订一种报纸的概率 a. 讲解注意: 思考题 1.设 AB ? ?, P( A) ? 0.6, P( A ? B) ? 0.8 , 求事件 B 的逆事件的概率. 2.设 P( A) ? 0.4, P( B) ? 0.3,

P( A ? B) ? 0.6, 求 P( A ? B) .

3.设 A, B 都出现的概率与 A, B 都不出现的概率相等, 且 P( A) ? p , 求 P( B) .

第三节 古典概型与几何概型
引例 一个纸桶中装有 10 个大小、 形状完全相同的球. 将球编号为 1—10.把球搅匀, 蒙上 眼睛从中任取一球. 因为抽取时这些球被抽到的可能性是完全平等的, 所以我们没有理由认 为这 10 个球中的某一个会比另一个更容易抽得, 也就是说,这 10 个球中的任一个被抽取的可

1 . 10 这样一类随机试验是一类最简单的概率模型, 它曾经是概率论发展初期主要的研究对象. 一、古典概型 我们称具有下列两个特征的随机试验模型为古典概型。1. 随机试验只有有限个可能的结果; 2. 每一个结果发生的可能性大小相同.。 因而古典概型又称为等可能概型.在概率论的产生和 发展过参程中,它是最早的研究对象,且在实际中也最常用的一种概率模型。它在数学上可 表述为: 在古典概型的假设下,我们来推导事件概率的计算公式. 设事件 A 包含其样本空间 S
能性均为 中 k 个基本事件, 即 A ? {ei } ? {ei } ? ?? {ei }, 则事件 A 发生的概率
1 2 k

P( A) ? P(? ei ) ? ? P(ei ) ?
j ?1
j

k

k

j ?1

j

k A包含的基本事件数 ? . 称此概率为古典概率.这种确定概率的 n S中基本事件的总数

方法称为古典方法. 这就把求古典概率的问题转化为对基本事件的计数问题. 二、 计算古典概率的方法 基本计数原理: 1. 加法原理:设完成一件事有 m 种方式,其中第一种方式有 n1 种方法,第二种方式有 n 2 种方 法, ……,第 m 种方式有 nm 种方法, 无论通过哪种方法都可以完成这件事,则完成这件事的方 法总数为 n1 ? n2 ? ? ? nm . 2. 乘法原理:设完成一件事有 m 个步骤,其中第一个步骤有 n1 种方法,第二个步骤有 n 2 种方 法,……,第 m 个步骤有 nm 种方法;完成该件事必须通过每一步骤才算完成,则完成这件 事的方法总数为 n1 ? n2 ? ?? nm .
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

5

3. 排列组合方法:排列公式:(2) 组合公式; (3) 二项式公式. 三、几何概型 古典概型只考虑了有限等可能结果的随机试验的概率模型 . 这里我们进一步研究样本空间 为一线段、平面区域或空间立体等的等可能随机试验的概率模型—几何概型. (a)设样本空间 S 是平面上某个区域, 它的面积记为 ? ( S ) ;(b)向区域 S 上随机投掷一点, 这里“随机投掷一点”的含义是指该点落入 S 内任何部分区域 A 的可能性只与区域 A 的面积 ? ( A) 成比例, 而与区域 A 的位置和形状无关. 向区域 S 上随机投掷一点, 该点落在区域 A 的的事件仍记为 A , 则 A 概率为 P ( A) ? ?? ( A) , 其中 ? 为常数, 而 P ( S ) ? ?? ( S ) , 于是得 ? ? 从而事件 A 的概率为 P ( A) ?
1

? (S )



? ( A) ? (S )

几何概率

(?)

注: 若样本空间 S 为一线段或一空间立体, 则向 S “投点”的相应概率仍可用 (?) 式确定, 但 ? (?) 应理解为长度或体积. 例题选讲: 例 1 一个袋子中装有 10 个大小相同的球, 其中 3 个黑球, 7 个白球, 求 (1) 从袋子中任取一球, 这个球是黑球的概率; (2) 从袋子中任取两球, 刚好一个白球一个黑球的概率以及两个球全是黑球的概率. 例 2 将标号为 1, 2, 3, 4 的四个球随意地排成一行, 求下列各事件的概率: (1) 各球自左至右或自右至左恰好排成 1, 2, 3, 4 的顺序; (2) 第 1 号球排在最右边或最左边; (3) 第 1 号球与第 2 号球相邻; (4) 第 1 号球排在第 2 号球的右边(不一定相邻). 例 3 将 3 个球随机放入 4 个杯子中, 问杯子中球的个数最多为 1, 2, 3 的概率各是多少? 例 4 将 15 名新生(其中有 3 名优秀生)随机地分配到三个班级中, 其中一班 4 名, 二班 5 名, 三 班 6 名, 求: (1) 每一个班级各分配到一名优秀生的概率; (2) 3 名优秀生被分配到一个班级的概率. 例 5 在 1~2000 的整数中随机地取一个数, 问取到的整数既不能被 6 整除, 又不能被 8 整除 的概率是多少? 例 6 一个袋子中装有 a ? b 个球, 其中 a 个黑球,b 个白球, 随意的每次从中取出一个球 (不 放回) ,求下列各事件的概率: (1)第 i 次取到的是黑球; (2)第 i 次才取到黑球; (3)前 i 次中能取到黑球. 几何概型 例 7 某人午觉醒来,发觉表停了 , 他打开收音机,想听电台报时 , 设电台每正点是报时一次 , 求他(她)等待时间短于 10 分钟的概率. 例 8 会面问题) 甲、 乙两人相约在 7 点到 8 点之间在某地会面, 先到者等候另一人 20 分钟, 过时就离开. 如果每个人可在指定的一小时内任意时刻到达, 试计算二人能够会面的概率. 思考题 1. 设有 N 件产品, 其中有 M 件次品, 现从中任取 n 件, 求其中有 k (k ? M ) 件次品的概率.
6

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

第四节 条件概率
先由一个简单的例子引入条件概率的概念. 一、 条件概率的概念 在解决许多概率问题时 ,往往需要在有某些附加信息 (条件)下求事件的概率 . 如在事件 A 发生的条件下,求事件 B 发生的条件概率,记作 P( B | A) . 定义 1 设 A, B 是两个事件, 且 P( A) ? 0 , 则称 P( B | A) ?
P( AB) (1)为在事件 A 发生的条件下, P( A)

事件 B 的条件概率.相应地,把 P( B) 称为无条件概率。一般地, P( B | A) ? P ( B ) . 注: 1. 用维恩图表达(1)式.若事件 A 已发生,则为使 B 也发生,试验结果必须是既在 A 中又在 B 中的样本点,即此点必属于 AB .因已知 A 已发生,故 A 成为计算条件概率 P ( B | A) 新的样本 空间. 2. 计算条件概率有两种方法::a) 在缩减的样本空间 A 中求事件 B 的概率,就得到 P ( B | A) ;b) 在样本空间 S 中,先求事件 P ( AB ) 和 P ( A) ,再按定义计算 P( B | A) 。 二、乘法公式 由条件概率的定义立即得到: P( AB) ? P( A) P( B | A) ( P( A) ? 0) (2) A , B 注意到 AB ? BA, 及 的对称性可得到: P( AB) ? P( B) P( A | B) ( P( B) ? 0) (2)和(3)式都称为乘法公式, 利用它们可计算两个事件同时发生的概率. 三、全概率公式 全概率公式是概率论中的一个基本公式。 它使一个复杂事件的概率计算问题, 可化为在 不同情况或不同原因或不同途径下发生的简单事件的概率的求和问题。 定理 1 设 A1 , A2 ,?, An ,? 是一个完备事件组,且 P( Ai ) ? 0, i ? 1,2, ? , 则对任一事件 B ,有
P( B) ? P( A1 ) P( B | A1 ) ? ? ? P( An ) P( B | An ) ? ?

(3)

注 : 全概率公式可用于计算较复杂事件的概率 , 公式指出: 在复杂情况下直接计算 P( B) 不 易时,可根据具体情况构造一组完备事件 {Ai } , 使事件 B 发生的概率是各事件 Ai (i ? 1,2, ?) 发生条件下引起事件 B 发生的概率的总和. 四、贝叶斯公式 利用全概率公式,可通过综合分析一事件发生的不同原因、情况或途径及其可能性来求 得该事件发生的概率 .下面给出的贝叶斯公式则考虑与之完全相反的问题 ,即,一事件已经发 生,要考察该事件发生的各种原因、情况或途径的可能性. 例如,有三个放有不同数量和颜色 的球的箱子,现从任一箱中任意摸出一球,发现是红球,求该球是取自 1 号箱的概率.或问:该球 取自哪号箱的可能性最大? 定理 2 设 A1 , A2 ,?, An ,? 是一完备事件组,则对任一事件 B , P( B) ? 0 ,有
P( Ai | B) ? P( Ai B) ? P( B) P( Ai ) P( B | Ai ) , ? P( A j ) P( B | A j )
j

i ? 1,2, ? , 贝叶斯公式

注 : 公式中, P ( Ai ) 和 P( Ai | B) 分别称为原因的验前概率和验后概率. P( Ai )(i ? 1,2,?) 是在没 有进一步信息(不知道事件 B 是否发生)的情况下诸事件发生的概率.当获得新的信息(知道 B
7

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

发生),人们对诸事件发生的概率 P( Ai | B) 有了新的估计. 贝叶斯公式从数量上刻划了这种变 化. 特别地,若取 n ? 2 ,并记 A1 ? A , 则 A2 ? A ,于是公式成为
P( A | B) ? P( AB) P( A) P( B | A) ? . P( B) P( A) P( B | A) ? P( A ) P( B | A )

例题选讲: 条件概率 例 1 一袋中装有 10 个球, 其中 3 个黑球, 7 个白球, 先后两次从袋中各取一球(不放回) (1) 已知第一次取出的是黑球, 求第二次取出的仍是黑球的概率; (2) 已知第二次取出的是黑球, 求第一次取出的也是黑球的概率. 例 2 袋中有 5 个球, 其中 3 个红球 2 个白球. 现从袋中不放回地连取两个. 已知第一次取得 红球时, 求第二次取得白球的概率. 乘法公式 例 3 一袋中装 10 个球, 其中 3 个黑球、7 个白球, 先后两次从中随意各取一球(不放回), 求 两次取到的均为黑球的概率. 分析:这一概率, 我们曾用古典概型方法计算过, 这里我们使用乘法公式来计算. 在本例中, 问题本身提供了两步完成一个试验的结构, 这恰恰与乘法公式的形式相应, 合理地利用问题 本身的结构来使用乘法公式往往是使问题得到简化的关键. 例 4 设袋中装有 r 只红球, t 只白球.每次自袋中任取一只球, 观察其颜色然后放回, 并再放 入 a 只与所取出的那只球同色的球. 若在袋中连续取球四次, 试求第一, 二次取到红球且第 三, 四次取到白球的概率. 例 5 设某光学仪器厂制造的透镜, 第一次落下时打破的概率为 1/2, 若第一次落下未打破, 第 二次落下打破的概率为 7/10, 若前两次落下未打破, 第三次落下打破的概率为 9/10. 试求透 镜落下三次而未打破的概率. 例 6)已知 P( A) ? 0.3, P( B) ? 0.4 , P( A | B) ? 0.5, 试求 P( B | A ? B), P( A ? B | A ? B). 例 7 一袋中装有 10 个球, 其中 3 个黑球、7 个白球,从中先后随意各取一球(不放回) ,求 第二次取到的是黑球的概率. 全概率公式 例 8 人们为了解一支股票未来一定时期内价格的变化, 往往会去分析影响股票价格的基本因 素, 比如利率的变化. 现假设人们经分析估计利率下调的概率为 60%, 利率不变的概率为 40%. 根据经验, 人们估计, 在利率下调的情况下, 该支股票价格上涨的概率为 80%, 而在利 率不变的情况下, 其价格上涨的概率为 40%, 求该支股票将上涨的概率. 例 9 某商店收进甲厂生产的产品 30 箱,乙厂生产的同种产品 20 箱,甲厂每箱装 100 个, 废品率为 0.06, 乙厂每箱装 120 个, 废品率为 0.05, 求: (1)任取一箱, 从中任取一个为废品的 概率;(2)若将所有产品开箱混放,求任取一个为废品的概率. 例 10 在例 7 中,我们将“第二次取到的球为黑球”这一事件分解为两种情况下发生,那里 利用全概率公式算得 “第二次取到的球为黑球” 的概率. 现在的问题是,假设我们已经观察到 “第二次取到的球为黑球” ,但我们不知道是在第一次取到的球为黑球的情况下第二次取的 是黑球的可能性大,还是在第一次取到的球为白球的情况下第二次取到的是黑球的可能性 大,现求“第一次取到的是黑球”这种“情况”发生的概率.

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

8

例 11 对以往数据分析结果表明, 当机器调整得良好时, 产品的合格率为 98%, 而当机器发生 某种故障时, 其合格率为 55%. 每天早上机器开动时, 机器调整良好的概率为 95%. 试求已 知某日早上第一件产品是合格时, 机器调整得良好的概率是多少? 例 12 设某批产品中, 甲, 乙, 丙三厂生产的产品分别占 45%, 35%, 20%, 各厂的产品的次品 率分别为 4%, 2%, 5%, 现从中任取一件,(1) 求取到的是次品的概率;(2) 经检验发现取到的 产品为次品, 求该产品是甲厂生产的概率. 例 13 根据以上的临床记录,某种诊断癌症的是眼睛有如下的效果:若以 A 表示事件“试验 反应为阳性” ,以 C 表示事件“被诊断者患有癌症” ,则有 P( A | C ) ? 0.95, P( A | C ) ? 0.95 现在对自然人群进行普查, 设备试验的人患有癌症的概率为 0.005, 即 P(C ) ? 0.005 , 试求 P(C | A). 思考题 1.设某种动物由出生算起活到 20 年以上的概率为 0.8, 活到 25 年以上的概率为 0.4. 问 现年 20 岁的这种动物, 它能活到 25 岁以上的概率是多少?

第五节 事件的独立性
一、 两个事件的独立性 定义 若两事件 A , B 满足 P( AB) ? P( A) P( B) (1)则称 A , B 独立, 或称 A , B 相互独立. 注: 当 P( A) ? 0 , P( B) ? 0 时, A , B 相互独立与 A , B 互不相容不能同时成立. 但 ? 与 S 既相 互独立又互不相容(自证). 定理 1 设 A , B 是两事件, 且 P( A) ? 0 ,若 A , B 相互独立, 则 P( A | B) ? P( A) . 反之亦然. 定理 2 设事件 A , B 相互独立,则下列各对事件也相互独立: A 与 B , A 与 B , A 与 B . 二、有限个事件的独立性

定义: A, B, C 为三个事件, 若满足等式

P( AB) ? P( A) P( B), P( AC) ? P( A) P(C ), P( BC) ? P( B) P(C ), P( ABC) ? P( A) P( B) P(C ),

则称事件 A, B, C 相互独立.

对 n 个事件的独立性, 可类似写出其定义: 定义 设 A1, A2 ,?, An 是 n 个事件, 若其中任意两个事件之间均相互独立 , 则称 A1 , A2 , ?, An 两两独立. 三、 相互独立性的性质 性质 1 若事件 A1 , A2 ,?, An (n ? 2) 相互独立, 则其中任意 k (1 ? k ? n) 个事件也相互独立; 由独立性定义可直接推出. 性质 2 若 n 个事件 A1 , A2 , ?, An (n ? 2) 相互独立, 则将 A1 , A2 , ?, An 中任意 m(1 ? m ? n) 个

事件换成它们的对立事件, 所得的 n 个事件仍相互独立; 对 n ? 2 时,定理 2 已作证明, 一般 情况可利用数学归纳法证之,此处略. ? A1 , A2 ,?, An 两 性质 3 设 A1 , A2 , ?, An 是 n (n ? 2) 个随机事件, 则 A1 , A2 , ?, An 相互独立 ? ? 两独立。 即相互独立性是比两两独立性更强的性质, 四、伯努利概型

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

9

设随机试验只有两种可能的结果: 事件 A 发生(记为 A ) 或 事件 A 不发生(记为 A ), 则称这 样的试验为伯努利 (Bermourlli) 试验 . 设 P( A) ? p,
P( A ) ? 1 ? p, (0 ? p ? 1), 将伯努利试验

独立地重复进行 n 次, 称这一串重复的独立试验为 n 重伯努利试验, 或简称为伯努利概型. 注: n 重伯努利试验是一种很重要的数学模型, 在实际问题中具有广泛的应用 .其特点是:事 件 A 在每次试验中发生的概率均为 p ,且不受其他各次试验中 A 是否发生的影响. 定理 3(伯努利定理) 设在一次试验中,事件 A 发生的概率为 p(0 ? p ? 1), 则在 n 重贝努里试
k k 验中,事件 A 恰好发生 k 次的概率为 P{X ? k} ? Cn p (1 ? p)n?k , (k ? 0,1,?, n).

推论

设在一次试验中 ,事件 A 发生的概率为 p(0 ? p ? 1), 则在 n 重贝努里试验中 , 事件 A

在第 k 次试验中的才首次发生的概率为 p(1 ? p) k ?1, (k ? 0,1, ?, n). 注意到“事件 A 第 k 次试验才首次发生”等价于在前 k 次试验组成的 k 重伯努利试验中“事 件 A 在前 k ? 1 次试验中均不发生而第 k 次试验中事件 A 发生”,再由伯努利定理即推得. 例题选讲: 两个事件的独立性 例 1 从一副不含大小王的扑克牌中任取一张, 记 A ? {抽到 K }, B ? {抽到的牌是黑色的}, 问事件 A 、 B 是否独立? 注:从例 1 可见, 判断事件的独立性, 可利用定义或通过计算条件概率来判断. 但在实际应 用中, 常根据问题的实际意义去判断两事件是否独立. 相互独立性的性质 例 2 已知甲、乙两袋中分别装有编号为 1, 2, 3, 4 的四个球. 今从甲、乙两袋中各取出一球, 设 A ? {从甲袋中取出的是偶数号球}, B ? {从乙袋中取出的是奇数号球}, C ? {从两袋中取 出的都是偶数号球或都是奇数号球}, 试证 A, B, C 两两独立但不相互独立. 例 3 加工某一零件共需经过四道工序, 设第一、二、三、四道工序的次品率分别是 2%, 3%, 5%, 3%, 假定各道工序是互不影响的, 求加工出来的零件的次品率. 例 4 如图是一个串并联电路系统. A, B, C , D, E, F , G, H 都是电路中的元件. 它们下方的数 字是它们各自正常工作的概率. 求电路系统的可靠性. 例 5 甲, 乙两人进行乒乓球比赛, 每局甲胜的概率为 p,p≥1/2. 问对甲而言,采用三局二胜制 有利, 还是采用五局三胜制有利. 设各局胜负相互独立. 例 6 某种小数移栽后的成活率为 90%, 一居民小区移栽了 20 棵,求能成活 18 的概率. 伯努利概型 例 7 一条自动生产线上的产品, 次品率为 4%, 求解以下两个问题: (1) 从中任取 10 件, 求至少有两件次品的概率; (2) 一次取 1 件, 无放回地抽取,求当取到第二件次品时, 之前已取到 8 件正品的概率. 例 8 一个医生知道某种疾病患者自然痊愈率为 0.25, 为试验一种新药是否有效,把它给 10 个 病人服用, 且规定若 10 个病人中至少有四个治好则认为这种药有效, 反之则认为无效. 求 (1)虽然新药有效,且把痊愈率提高到 0.35,但通过实验却被否定的概率. (2)新药完全无效,但通过实验却被认为有效的概率. 例 9 一个袋中装有 10 个球,其中 3 个黑球,7 个白球,每次从中随意取出一球,取后放回.

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

10

(1) 如果共取 10 次, 求 10 次中能取到黑球的概率及 10 次中恰好取到 3 次黑球的概率. (2)如果未取到黑球就一直去下去,直到取到黑球为止,求恰好要取 3 次黑球的概率. 例 10 一辆飞机场的交通车载有 25 名乘客途经 9 个站,每位乘客都等可能在这 9 站中任意 一站下车(且不受其他乘客下车与否的影响) ,交通车只在有乘客下车时才停车,求交通车 在第 i 站停车的概率以及在第 i 站不停车的条件下第 j 站的概率, 并判断 “第 i 站停车” 与 “第 j 站停车”两个事件是否独立. 例 11 某型号高炮,每门炮发射一发炮弹击中飞机的概率为 0.6,现若干门炮同时各射一发, (1) 问:欲以 99%的把握击中一架来犯的敌机至少需配置几门炮? (2)现有 3 门炮,欲以 99%的把握 击中一架来犯的敌机,问:每门炮的命中率应提高到多少? 思考题:1. 某工人一天出废品的概率为 0.2, 求在 4 天中: (1)都不出废品的概率; (2)至少有一天出废品的概率; (3)仅有一天出废品的概率; (4)最多有一天出废品的概率; (5)第一天出废品, 其余各天不出废品的概率.

第二章

随机变量及其分布

在随机试验中, 人们除对某些特定事件发生的概率感兴趣外, 往往还关心某个与随机试 验的结果相联系的变量. 由于这一变量的取值依赖于随机试验结果,因而被称为随机变量 . 与普通的变量不同,对于随机变量,人们无法事先预知其确切取值,但可以研究其取值的统 计规律性. 本章将介绍两类随机变量及描述随机变量统计规律性的分布. 【教学目的与要求】 通过学习,使学生了解随机变量的概念;理解分布函数的概念和性质;掌握离散型随 机变量和连续型随机变量的描述方法; 理解分布律与概率密度的概念和性质。 熟练掌握二项 分布、泊松分布、均匀分布、指数分布和正态分布;会利用概率分布计算有关事件的概率。 会求简单的随机变量函数的概率分布; 【教学重点】 离散型随机变量的分布律与连续型随机变量的概率密度的概念和性质; 二项分布、 泊松 分布、均匀分布、指数分布和正态分布;随机变量的函数的分布。 【教学难点】 连续型随机变量函数的分布; 【计划课时】7 【教学内容】

第一节 随机变量的概念
一、随机变量概念的引入 为全面研究随机试验的结果 , 揭示随机现象的统计规律性 , 需将随机试验的结果数量 化, 即把随机试验的结果与实数对应起来.1.在有些随机试验中, 试验的结果本身就由数量来 表示. 2.在另一些随机试验中, 试验结果看起来与数量无关,但可以指定一个数量来表示之. 二、随机变量的定义
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

11

定义: 设随机试验的样本空间为 S , 称定义在样本空间 S 上的实值单值函数 X ? X (e) 为随机 变量. 随机变量与高等数学中函数的比较: (1)都是实值函数,但前者在试验前只知道它可能取值的范围,而不能预先肯定它将取哪个值; (2) 试验结果的出现有一定的概率,故前者取每个值和每个确定范围内的值也有一定的概率. 三、引入随机变量的意义 随机变量的引入,使得随机试验中的各种事件可通过随机变量的关系式表达出来 . 由此 可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内 .也可以说,随机事件是 从静态的观点来研究随机现象,而随机变量则以动态的观点来研究之.其关系类似高等数学中 常量与变量的关系. 随机变量概念的产生是概率论发展史上的重大事件. 引入随机变量后, 对随机现象统计规律的研究,就由对事件及事件概率的研究转化为随机变量及其取值规律的 研究,使人们可利用数学分析的方法对随机试验的结果进行广泛而深入的研究. 随机变量因其取值方式不同, 通常分为离散型和非离散型两类. 而非非离散型随机变量 中最重要的是连续型随机变量. 今后,我们主要讨论离散型随机变量和连续型随机变量. 例题选讲: 例 1 在抛掷一枚硬币进行打赌时, 若规定出现正面时抛掷者赢 1 元钱, 出现反面时输 1 元钱, 则其样本空间为 S ? {正面, 反面},记赢钱数为随机变量 X , 则 X 作为样本空间 S 的实值函
? 1, e ? 正面, 数定义为 X (e) ? ? ?? 1, e ? 反面.

例 2 在将一枚硬币抛掷三次, 观察正面 H 、反面 T 出现情况的试验中, 其样本空间 S ? {HHH, HHT, HTH , THH , HTT , THT , TTH , TTT }; 记每次试验出现正面 H 的总次数为随机 变量 X , 则 X 作为样本空间 S 上的函数定义为 e HHH HHT HTH THH HTT THT TTH TTT X 3 2 2 2 1 1 1 0 易 见 , 使 X 取 值 为 2({ X ? 2}) 的 样 本 点 构 成 的 子 集 为 A ? {HHT, HTH , THH}, 故 P{ X ? 2} ? P( A) ? 3 / 8, 类似地,有 P{ X ? 1} ? P{HTT , THT , TTH , TTT } ? 4 / 8. 例 3 在测试灯泡寿命的试验中, 每一个灯泡的实际使用寿命可能是 [0,??) 中任何一个实数, 若 用 X 表 示 灯 泡 的寿 命 (小 时 ) , 则 X 是 定 义在 样 本空 间 S ? {t | t ? 0} 上 的 函 数 ,即 X ? X (t ) ? t ,是随机变量. 思考题:. 一报童卖报, 每份 0.15 元,其成本为 0.10 元. 报馆每天给报童 1000 份报, 并规定 他不得把卖不出的报纸退回 . 设 X 为报童每天卖出的报纸份数, 试将报童赔钱这一事件用 随机变量的表达式表示.

第二节 离散型随机变量及其分布函数
一、离散型随机变量及其概率分布 定义 设离散型随机变量 X 的所有可能取值为 xi (i ? 1,2, ?) , 称 P{X ? xi } ? pi , i ? 1,2, ? 为 X 的概率分布或分布律, 也称概率函数.

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

12

常用表格形式来表示 X 的概率分布:

X pi

x1 p1

x2

?

xn

?

p2 ?

pn ?

二、常用离散分布 退化分布 两点分布 n 个点上的均匀分布 二项分布 几何分布 超几何分布 泊松分布:泊松分布是概率论中最重要的几个分布之一. 实际问题中许多随机现象都服 从或近似服从泊松分布. 三、二项分布的泊松近似 定理 1 (泊松定理) 在 n 重伯努利试验中, 事件 A 在每次试验中发生的概率为 pn (注意这与 试验的次数 n 有关), 如果 n ? ? 时, npn ? ? ( ? ? 0 为常数), 则对任意给定的 k , 有
lim b(k , n, pn ) ?

?k
k!

n??

e?? .

例题选讲: 离散型随机变量及其概率分布 例 1 某篮球运动员投中篮圈的概率是 0.9, 求他两次独立投篮投中次数 X 的概率分布. 例 2 设随机变量 X 的概率分布为: P{ X ? K } ? a

?k
k!

, k ? 0, 1, 2, ? , ? ? 0 .确定常数 a .

二项分布 例 3 已知 100 个产品中有 5 个次品, 现从中有放回地取 3 次, 每次任取 1 个, 求在所取的 3 个中恰有 2 个次品的概率. 例 4 某人进行射击, 每次射击的命中率为 0.02, 独立射击 400 次, 试求至少击中两次的概率. 例 5 有 80 台同类型设备, 各台工作是相互独立的,发生故障的概率都是 0.01, 且一台设备的 故障能由一个人处理. 考虑两种配备维修工人的方法, 其一由 4 人维护, 每人负责 20 台; 其 二由 3 人共同维护 80 台. 试比较这两种方法在设备发生故障时不能及时维修的概率的大小. 几何分布 例 6 某射手连续向一目标射击, 直到命中为止, 已知他每发命中的概率是 p , 求所需射击发 数 X 的概率分布. 泊松分布 例 7 某一城市每天发生火灾的次数 X 服从参数 ? ? 0.8 的泊松分布, 求该城市一天内发生 3 次或 3 次以上火灾的概率. 二项分布的泊松近似 例 8 某公司生产的一种产品 300 件. 根据历史生产记录知废品率为 0.01. 问现在这 300 件产 品经检验废品数大于 5 的概率是多少? 例 9 一家商店采用科学管理,由该商店过去的销售记录知道, 某种商品每月的销售数可以用 参数 ? ? 5 的泊松分布来描述, 为了以 95%以上的把握保证不脱销, 问商店在月底至少应进 某种商品多少件? 例 10 自 1875 年至 1955 年中的某 63 年间, 上海市夏季(5—9 月)共发生大暴雨 180 次, 试建 立上海市夏季暴雨发生次数的概率分布模型. 思考题 1.某类灯泡使用时数在 1000 小时以上的概率是 0.2, 求三个灯泡在使用 1000 小时以后最多只 有一个坏了的概率. 2.一汽车沿一街道行驶, 需要通过三个均设有红绿信号灯的路口, 每个信号灯为红或绿与其 它信号灯为红或绿相互独立 , 且红绿两种信号灯显示的时间相等 . 以 X 表示该汽车首次遇
13

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

到红灯前已通过的路口的个数, 求 X 的概率分布.

第三节 随机变量的分布函数
要描述一个随机变量时,不仅要说明它能够取哪些值,而且还要指出它取这些值的概率. 只 有这样,才能真正完整地刻画一个随机变量, 为此,我们引入随机变量的分布函数的概念. 一. 随机变量的分布函数 (?? ? x ? ??) 为 X 的分布函数. 有时记 定义 设 X 是一个随机变量 , 称 F ( x) ? P( X ? x) 作 X ~ F ( x) 或 FX ( x ) . 分布函数的性质:1. 单调非减. 若 x1 ? x2 , 则 F ( x1 ) ? F ( x2 ) ; 2. F (??) ? lim F ( x) ? 0, F (??) ? lim F ( x) ? 1;
x??? x???

3. 右连续性. 即 lim F ( x) ? F ( x0 ).
? x? x0

二、离散型随机变量的分布函数 设离散型随机变量 X 的概率分布为
X pi
xi ? x

x1 p1

x2

?

xn

?

p2 ?

pn ?
xi ? x

则 X 的分布函数为 F ( x) ? P( X ? x) ? ? P( X ? xi ) ? ? pi . 例题选讲: 随机变量的分布函数 例 1 等可能地在数轴上的有界区间 [a, b] 上投点, 记 X 为落点的位置(数轴上的坐标) , 求随 机变量 X 的分布函数.
?0, x ? ?2, ? (1) F ( x) ? ?1 / 2, ? 2 ? x ? 0, ?1, x ? 0; ? ?0, x ? 0, ? 例 2 判别下列函数是否为某随机变量的分布函数 (2) F ( x) ? ?sin x, 0 ? x ? ? , ?1, x ? ? ; ? ?0, x ? 0, ? (3) F ( x) ? ? x ? 1 / 2, 0 ? x ? 1 / 2, ?1, x ? 1 / 2. ?

离散型随机变量的分布函数 X 0 1 2 , 求 F ( x) . 例3设 pi 1 / 3 1 / 6 1 / 2

X 具有离散均匀分布, 即 P( X ? xi ) ? 1 / n, i ? 1,2,?, n, 求 X 的分布函数. x ? 1, ?0, ?9 / 19, 1 ? x ? 2, ? 例 5 设随机变量 X 的分布函数为 F ( x) ? ? 求 X 的概率分布. ?15 / 19, 2 ? x ? 3, ? x ? 3. ?1,
例4 思考题 1.设随机变量 X 的概率分布为
X ?1 2 4 pi 1 / 4 1 / 2 1 / 4

,求 X 的的分布函数。

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

14

第四节 连续型随机变量及其概率密度
一、 连续型随机变量及其概率密度 定义 如果对随机变量 X 的分布函数 F ( x) ,存在非负可积函数 f ( x) ,使得对于任意实数 x 有

F ( x) ? P{X ? x} ?

?

x

??

f (t )dt. 则称 X 为连续型随机变量 , 称 f ( x) 为 X 的概率密度函数,简称

为概率密度或密度函数. 关于概率密度的说明:1. 对一个连续型随机变量 X ,若已知其密度函数 f ( x) ,则根据定义,可 求得其分布函数 F ( x) , 同时, 还可求得 X 的取值落在任意区间 (a, b] 上的概率:
P{a ? X ? b} ? F (b) ? F (a) ? ? f ( x)dx ;2. 连续型随机变量 X 取任一指定值 a(a ? R) 的概率 a
b

为 0;3. 若 f ( x) 在点 x 处连续, 则 F ?( x) ? f ( x) 二、常用连续型分布 均匀分布

(1)

? 1 , a? x?b ? 定义 若连续型随机变量 X 的概率密度为 f ( x) ? ? b ? a 则称 X 在区间 (a, b) 上服 ?0, 其它 ? 从均匀分布, 记为 X ~ U (a, b) .
指数分布 定义
??e ? ?x , x ? 0, 若随机变量 X 的概率密度为 f ( x) ? ? ? ? 0 则称 X 服从参数为 ? 的指 其它. ?0,

数分布.简记为 X ~ e(? ). 正态分布
? 定义 若随机变量 X 的概率密度为 f ( x) ? 1 e 2? ? ( x? ? )2 2? 2

, ? ? ? x ? ?.

其中 ? 和 ? (? ? 0) 都是常数, 则称 X 服从参数为 ? 和 ? 2 的正态分布. 记为 X ~ N (?, ? 2 ). 注: 正态分布是概率中最重要的连续型分布, 19 世纪前叶由高斯加以推广, 又称高斯分布. 一般来说, 一个随机变量如果受到许多随机因素的影响, 而其中每一个因素都不起主导作用 (作用微小) , 则它服从正态分布. 这是正态分布在实践中得以广泛应用的原因. 例如, 产品 的质量指标, 元件的尺寸, 某地区成年男子的身高、 体重, 测量误差, 射击目标的水平或垂直 偏差, 信号噪声、农作物的产量等等, 都服从或近似服从正态分布. 标准正态分布 正态分布当 ? ? 0, ? ? 1 时称为标准正态分布 , 此时 , 其密度函数和分布函数常用 ? ( x) 和
? ( x) 表示: ? ( x) ?

1 ?2 e , 2?

x2

?( x) ?

1 2?

?

x

??

e 2 dt 标准正态分布的重要性在于, 任何一

?

t2

个一般的正态分布都可以通过线性变换转化为标准正态分布. 定理 设 X ~ N (?, ? 2 ), 则 Y ?

X ??

?

~ N (0,1).

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

15

标准正态分布表的使用: (1)表中给出了 x ? 0 时 ? ( x) 的数值, 当 x ? 0 时, 利用正态分布的 对称性, 易见有 ?(? x) ? 1 ? ?( x); (2) 若 X ~ N (0,1), 则 P{a ? X ? b} ? ?(b) ? ?(a); (3)若 X ~ N (? , ? 2 ) ,则 Y ?

X ??

?

~ N (0,1),

?X ?? x??? ?x??? ? 故 X 的分布函数 F ( x) ? P{ X ? x} ? P ? ?; ? ? ?? ? ? ? ? ? ? ? b??? ?a ? ? ?b?? ? ?a??? P{a ? X ? b} ? P ? ?Y ? ? ? ?? ?. ? ? ?? ? ? ? ? ? ? ? ? ? ? 例题选讲: 连续型随机变量及其概率密度 ?2 1 ? x2 , ?1? x ?1 ? f ( x ) ? 例 1 设随机变量 X 的密度函数为 求其分布函数 F ( x) . ?? ? 0, 其它 ?

0 ? x ? 3, ?kx, ? x ? 例 2 设随机变量 X 具有概率密度 f ( x) ? ?2 ? , 3 ? x ? 4, 2 ? ? 其它. ?0, (1)确定常数 k; (2)求X的分布函数 F ( x); (3)求P{1 ? X ? 7 / 2}.
x?0 ?0, ? 2 例 3 设随机变量 X 的分布函数为 F ( x) ? ? x , 0 ? x ? 1 ?1, 1? x ?
求 (1) 概率 P{0.3 ? X ? 0.7} ; (2) X 的密度函数. 常用连续型分布 均匀分布 例 4 某公共汽车站从上午 7 时起, 每 15 分钟来一班车, 即 7:00, 7:15, 7:30, 7:45 等时刻有汽 车到达此站, 如果乘客到达此站时间 X 是 7:00 到 7:30 之间的均匀随机变量,试求他候车时间 少于 5 分钟的概率. 指数分布 例 5 某元件的寿命 X 服从指数分布, 已知其平均寿命为 1000 小时,求 3 个这样的元件使用 1000 小时, 至少已有一个损坏的概率. 正态分布 例 6 设 X ~ N (1,4) , 求 F (5), P{0 ? X ? 1.6}, P{| X ? 1 |? 2}. 例 7 设某项竞赛成绩 X ~ N (65, 100) ,若按参赛人数的 10%发奖,问获奖分数线应 定为多少? 例 8 将一温度调节器放置在 贮存着某种液体的容器 内,调节器整定在 d ℃,液体的温度 X (以℃计)是一个随机变量,且 X ~ N (d ,0.52 ) (1) 若 d ? 90 ℃,求 X 小于 89℃ 的概率; (2) 若要求保持液体的温度至少为 80℃的概率不低于 0.99,问 d 至少为多少? 例 9 某企业准备通过招聘考试招收 300 名职工,其中正式工 280 人, 临时工 20 人; 报考的人 数是 1657 人, 考试满分是 400 分. 考试后得知, 考试总平均成绩, 即 ? ? 166 分, 360 分以上的 高分考生 31 人. 某考生 B 得 256 分, 问他能否被录取? 能否被聘为正式工? 例 10 在电源电压不超过 200 伏,在 200~240 伏和超过 240 伏三种情形下,某种电子元件损 坏的概率分别为 0.1,0.001 和 0.2. 假设电源电压 X 服从正态分布 N (220,25 ),试求: (1) 该电子元件损坏的概率 ? ; (2) 该电子元件损坏时, 电源电压在 200~240 伏的概率 ? . 思考题
2

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

16

1.已知 X ~ N (8,0.5 2 ) ,求(1) F (9), F (7); (2) P{7.5 ? X ? 10} ; (3) P{| X ? 8 |? 1}; (4) P{| X ? 9 |? 0.5}. 2.某种型号电池的寿命 X 近似服从正态分布 N (? , ? 2 ) , 已知其寿命在 250 小时以上的概率 和寿命不超过 350 小时的概率均为 92.36%, 为使其寿命在 ? ? x 和 ? ? x 之间的概率不小于 0.9, x 至少为多少?

第五节 随机变量函数的分布
一、 随机变量的函数 定义 如果存在一个函数 g ( X ) , 使得随机变量 X , Y 满足 Y ? g ( X ) ,则称随机变量 Y 是随机变 量 X 的函数. 注: 在微积分中,我们讨论变量间的函数关系时 , 主要研究函数关系的确定性特征 , 例如:导 数、 积分等.而在概率论中, 我们主要研究是随机变量函数的随机性特征, 即由自变量 X 的统 计规律性出发研究因变量 Y 的统计性规律. 一般地, 对任意区间 I , 令 C ? {x | g ( x) ? I } , 则 {Y ? I } ? {g ( x) ? I } ? { X ? C}, P{Y ? I } ? P{g ( x) ? I } ? P{ X ? C}. 注: 随机变量 Y 与 X 的函数关系确定,为从 X 的分布出发导出 Y 的分布提供了可能. 二、离散型随机变量函数的分布 设离散型随机变量 X 的概率分布为 P{X ? xi } ? pi , i ? 1,2,? 易见 , X 的函数 Y ? g ( X ) 显 然还是离散型随机变量。 如何由 X 的概率分布出发导出 Y 的概率分布? 其一般方法是:先根据自变量 X 的可能取 值确定因变量 Y 的所有可能取值 , 然后对 Y 的每一个可能取值 yi , i ? 1,2,?, 确定相应的
Ci ? {x j | g ( x j ) ? yi }, {Y ? yi } ? {g ( xi ) ? yi } ? {X ? Ci }, P{Y ? yi } ? P{X ? Ci } ?

x j ?Ci

? P{X ? x }.
j

从而求得 Y 的概率分布. 三、 连续型随机变量函数的分布 一般地, 连续型随机变量的函数不一定是连续型随机变量, 但我们主要讨论连续型随机 变量的函数还是连续型随机变量的情形 , 此时我们不仅希望求出随机变量函数的分布函数 , 而且还希望求出其概率密度函数. 设已知 X 的分布函数 FX ( x ) 或概率密度函数 f X ( x) , 则随机变量函数 Y ? g ( X ) 的分布函数 可按如下方法求得: FY ( y) ? P{Y ? y} ? P{g ( X ) ? y} ? P{X ? C y }. 其中 C y ? {x | g ( x) ? y}. 而 P{X ? C y } 常常可由 X 的分布函数 FX ( x ) 来表达或用其概率密度函数 f X ( x) 的积分来表 达: P{ X ? C y } ? ? 定理 1
Cy

f X ( x)dx 进而可通过 Y 的分布函数 FY ( x) , 求出 Y 的密度函数.

设随机变量 X 具有概率密度 f X ( x), x ? (??,??) , 又设 y ? g ( x) 处处可导且恒有

g ?( x) ? 0 (或恒有 g ?( x) ? 0 ), 则 Y ? g ( X ) 是一个连续型随机变量,其概率密度为
17

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

? f [h( y) | h?( y) |, ? ? y ? ? 其中 x ? h( y) 是 y ? g ( x) 的反函数, 且 fY ( y) ? ? 其它 ? 0,

? ? min( g (??), g (??)), ? ? max( g (??), g (??)). 例题选讲: 离散型随机变量函数的分布
例 1 设随机变量 X 具有以下的分布律, 试求 Y ? ( X ? 1) 2 的分布律
X ?1 0 1 2 pi 0.2 0.3 0.1 0.4

连续型随机变量函数的分布 例 2 对一圆片直径进行测量, 其值在[5, 6]上均匀分布, 求圆片面积的概率分布密度. ? x / 8, 0 ? x ? 4 例 3 设 X ~ f X ( x) ? ? , 求 Y ? 2 X ? 8 的概率密度. ?0, 其它 例 4 设 X ~ N (0,1) , 求 Y ? X 2 的密度函数. 例 5 已知随机变量 X 的分布函数 F ( x) 是严格单调的连续函数, 证明 Y ? F ( X ) 服从 [0,1] 上的 均匀分布. 例 6 设随机变量 X ~ N (? , ? 2 ).试证明X的线性函数 Y ? aX ? b (a ? 0) 也服从正态分布. 例 7 设随机变量 X 在 (0,1) 上服从均匀分布, 求 Y ? ?2 ln X 的概率密度. 例 8 (对数正态分布) 随机变量 X 称为服从参数为 ? , ? 2 的对数正态分布, 如果 Y ? ln X 服从 正态分布 N (? , ? 2 ) . 试求对数正态分布的密度函数. 注: 在实际中, 通常用对数正态分布来描述价格的分布, 特别是在金融市场的理论研究 中, 如著名的期权定价公式(Black—Scholes 公式), 以及许多实证研究都用对数正态分布 来描述金融资产的价格. 设某种资产当前价格为 P0 , 考虑单期投资问题, 到期时该资产的价
r 格为一个随机变量, 记作 P1 , 设投资于该资产的连续复合收益率为 r , 则有 P 1 ?P 0e P 从而 r ? ln 1 ? ln P1 ? ln P0 注意到 P0 为当前价格, 是已知常数,因而假设价格 P1 服从对数正 P0

态分布实际上等价于假设连续复合收益率 r 服从正态分布. 例 9 设随机变量 X 服从参数为 ? 的指数分布, 求 Y ? min{X ,2} 的分布函数. 思考题 1. 设 X 的分布列为
X pi ?1 0 1 2 5/ 2 1 / 5 1 / 10 1 / 10 1 / 10 3 / 10

求: (1) 2X 的分布列; (2) X 2 的分布列.

?2 x / ? 2 , 0 ? x ? ? , 2. 设随机变量 X 的概率密度为 f ( x) ? ? 求 Y ? sin X 的概率密度. 其它. ? 0,

第三章 多维随机变量及其分布
在实际应用中, 有些随机现象需要同时用两个或两个以上的随机变量来描述. 例如, 研 究某地区学龄前儿童的发育情况时, 就要同时抽查儿童的身高 H 、体重 W , 这里, H 和 W 是定义在同一个样本空间 S ? {e} ? {某地区的全部学龄前儿童}上的两个随机变量. 又如, 考 察某次射击中弹着点的位置时,就要同时考察弹着点的横坐标 X 和纵坐标 Y . 在这种情况 下, 我们不但要研究多个随机变量各自的统计规律, 而且还要研究它们之间的统计相依关系, 因而还需考察它们的联合取值的统计规律, 即多为随机变量的分布. 由于从二维推广到多维 一般无实质性的困难, 故我们重点讨论二维随机变量. 【教学目的与要求】

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

18

通过学习,使学生了解随机向量(多维随机变量)的概念;了解二维随机变量的联合 分布函数、联合分布律、联合分布密度的概念和性质,并会计算有关事件的概率。掌握二维 随机变量的边缘分布与联合分布的关系。 理解随机变量独立性的概念, 并会应用随机变量的 独立性进行概率计算。会求简单的二维随机变量函数的分布。 【教学重点】 二维随机变量的边缘分布与联合分布的关系与计算;随机变量的独立性。 【教学难点】 条件分布;二维随机变量函数的分布; 【计划课时】5 【教学内容】

第一节 多维随机变量的分布
一、 二维随机变量 定义 1 设随机试验的样本空间为 S ? {e} , e ? S 为样本点,而 X ? X (e), Y ? Y (e) 是定义在 S 上的两个随机变量, 称 ( X , Y ) 为定义在 S 上的二维随机变量或二维随机向量. 二、 二维随机变量的分布函数 定义 2 设 ( X , Y ) 是二维随机变量, 对任意实数 x, y , 二元函数

F ( x, y) ? P{( X ? x)} ? P{(Y ? y)}

记为

P{X ? x, Y ? y} 称为二维随机变量 ( X , Y ) 的分布函数或

称为随机变量 X 和 Y 的联合分布函数. 联合分布函数的性质:(1) 0 ? F ( x, y) ? 1, 且对任意固定的 y, F (??, y ) ? 0, 对任意固定的 x, F ( x,??) ? 0, F (??,??) ? 0, F (??,??) ? 1; (2) F ( x, y ) 关于 x 和 y 均为单调非减函数 , 即对 任意固定的 y, 当 x2 ? x1 , F ( x2 , y) ? F ( x1 , y), 对任意固定的 x, 当 y2 ? y1 , F ( x, y2 ) ? F ( x, y1 ); (3) F ( x, y ) 关于 x 和 y 均为右连续, 即 F ( x, y) ? F ( x ? 0, y), F ( x, y) ? F ( x, y ? 0). 三、 二维离散型随机变量及其概率分布 定义 3 若二维随机变量 ( X , Y ) 只取有限个或可数个值, 则称 ( X , Y ) 为二维离散型随机变量. 结论: ( X , Y ) 为二维离散型随机变量当且仅当 X , Y 均为离散型随机变量. 若二维离散型随机变量 ( X , Y ) 所有可能的取值为 ( xi , y j ) i, j ? 1,2, ? , 则称
P{X ? xi , Y ? y j } ? pij (i, j ? 1,2,?) 为二维离散型随机变量 ( X , Y ) 的概率分布 ( 分布律 ), 或

X与 Y 的联合概率分布(分布律).

与一维情形类似,有时也将联合概率分布用表格形式来表示, 并称为联合概率分布表: 注:对离散型随机变量而言, 联合概率分布不仅比联合分布函数更加直观, 而且能够更加方 便地确定 ( X , Y ) 取值于任何区域 D 上的概率,即 P{( X , Y ) ? D} ?
( xi , y j )?D

?p

ij

,
p ij . xi ? x , y j ? y

特别地, 由联合概率分布可以确定联合分布函数: F ( x, y ) ? P{ X ? x, Y ? y} ? 四、二维连续型随机变量及其概率密度 定义

?

设 ( X , Y ) 为二维随机变量 , F ( x, y ) 为其分布函数 , 若存在一个非负可积的二元函数
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

19

f ( x, y ) , 使对任意实数 ( x, y ) , 有 F ( x, y) ?

? ?

x

y

?? ??

f (s, t )dsdt, 则称 ( X , Y ) 为二维连续型随

机变量, f ( x, y ) 为 ( X , Y ) 的概率密度(密度函数), 或 X , Y 的联合概率密度(联合密度函数). 概率密度函数 f ( x, y ) 的性质: (1) f ( x, y ) ? 0;
(2) ?
?

?? ??

?

?

f ( x, y )dxdy ? F (??,??) ? 1;

(3) 设 D 是 xOy 平面上的区域,点 ( X , Y ) 落入 D 内的概率为 P{( x, y) ? D} ? ?? f ( x, y)dxdy
D

特别地, 边缘分布函数
FX ( x) ? P{X ? x} ? P{X ? x, Y ? ??} ?

? ?

x

??

?? ??

f ( s, t )dsdt ?

? ? ??
??
??

x

?

??

??

? f ( s, t )dt ? ds, ?

上式表明: X 是连续型随机变量, 且其密度函数为: f X ( x) ? ? f ( x, y )dy, ?? 同理, Y 是连续型随机变量, 且其密度函数为: fY ( y ) ? ? f ( x, y )dx , ?? 分别称 f X ( x) 和 f Y ( y ) 为 ( X , Y ) 关于 X 和 Y 的边缘密度函数. (4) 若 f ( x, y ) 在点 ( x, y ) 连续, 则有
? 2 F ( x, y ) ? f ( x, y ). 进一步, 根据偏导数的定义, 可推得: ?x?y
??

当 ?x, ?y 很 小 时 , 有 P{x ? X ? x ? ?x, y ? Y ? y ? ?y} ? f ( x, y)?x?y, 即 , ( X , Y ) 落 在 区 间
( x, x ? ?x] ? ( y, y ? ?y] 上的概率近似等于 f ( x, y)?x?y.

五、二维均匀分布 设 G 是平面上的有界区域,其面积为 A .若二维随机变量 ( X , Y ) 具有概率密度函数

?1 ? , ( x, y) ? G 则称 ( X , Y ) 在 G 上服从均匀分布. f ( x, y) ? ? A ?0, 其它 ? 六、二维正态分布 若二维随机变量 ( X , Y ) 具有概率密度
1 2?? 1? 2 1 ? ? 2
? ?? x ? ? ? 2 ? x ? ?1 ? ? y ? ? 2 1? ?? ?? ?2 ? ? ? ? ?? ? ?1 ? 2 (1? ? ) ? ? 2 ? ? ? 1 ?? ? 1
2

f ( x, y ) ?

e

? ? y??2 ? ?? ? ? ? 2 ? ?

? ? ? ?

2?

? ? ?

其中 ?1 , ? 2 , ? 1 , ? 2 , ? 均为常数,

且 ? 1 ? 0, ? 2 ? 0, | ? |? 1 ,则称 ( X , Y ) 服从参数为 ?1 , ? 2 , ? 1 , ? 2 , ? 的二维正态分布. 注:二维正态随机变量的两个边缘分布都是一维正态分布,且都不依赖于参数 ? ,亦即对 给定的 ?1 , ? 2 , ? 1 , ? 2 ,不同的 ? 对应不同的二维正态分布,但它们的边缘分布都是相同的, 因此仅由关于 X 和关于 Y 的边缘分布, 一般来说不能确定二维随机变量 ( X , Y ) 的联合分布的 例题选讲:二维随机变量的分布函数 例 1 设二维随机变量 ( x, y ) 的分布函数为
x ?? y? ? F ( x, y ) ? A? B ? arctan ?? C ? arctan ?, ? ? ? x ? ??, ? ? ? y ? ?? 2 ?? 3? ? (1) 试确定常数 A, B, C. (2) 求事件 {2 ? X ? ??,0 ? Y ? 3} 的概率.

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

20

二维离散型随机变量及其概率分布 例 2 设随机变量 X 在 1, 2, 3, 4 四个整数中等可能地取一个值,另一个随机变量 Y 在 1~ X 中 等可能地取一整数值,试求 ( x, y ) 的分布律. 例 3 把一枚均匀硬币抛掷三次, 设 X 为三次抛掷中正面出现的次数, 而 Y 为正面出现次数与 反面出现次数之差的绝对值, 求 ( X , Y ) 的概率分布及 ( X , Y ) 关于 X , Y 的边缘分布. 例 4 设二维随机变量的联合概率分布为 Y X

?2
0.3 0.05

0 0.1 0.2 0

1 0.1 0 0.05

0.2 求 P{ X ? 1, Y ? 0} 及 F (0,0).

?1 1 2

二维连续型随机变量及其概率密度 例 5 ( X , Y ) 的概率分布由表 3—1B 给出,求 P{ X ? 0, Y ? 0}, P{ X ? 0, Y ? 0} P{ XY ? 0}, P{ X ? Y }, P{| X |?| y |}. 表 3—1B

Y X

?1

0

2

0 0.1 0.2 0 1 0.2 0.05 0.1 2 0.15 0 0.1 例 6 一整数 N 等可能地在 1,2,3, ?,10 十值中取一个值. 设 D ? D( N ) 是能整除 N 的正整 数的个数, F ? F ( N ) 是能整除 N 的素数的个数(注意 1 不是素数). 试写出 D 和 F 的联 合分布律.并求分布律.
?( 2 x ? y ) ? , ?2e 例 7 设二维随机变量 ( X , Y )具有概率密度 f ( x, y) ? ? ? ?0,

x ? 0, y ? 0, 其它.

(1) 求分布函数 F ( x, y );

(2) 求概率 P{Y ? X }.

?cy (2 ? x), 0 ? x ? 1,0 ? y ? x 例 8 设 ( X , Y ) 的概率密度是 f ( x, y) ? ? 其它 ? 0,

求 (1) c 的值; 二维均匀分布

(2) 两个边缘密度.

?6, x 2 ? y ? x 例 9 设随机变量 X 和 Y 具有联合概率密度 f ( x, y) ? ? 其它 ?0, 求边缘概率密度 f X ( x), f Y ( y ) .
例 10 设 ( X , Y ) 服从单位圆域 x 2 ? y 2 ? 1 上的均匀分布, 求 X 和 Y 的边缘概率密度. 二维正态分布 例 11 设二维随机变量 ( X , Y ) 的概率密度 f ( x, y ) ? 的边缘概率密度函数. 思考题 1.将两封信随意地投入 3 个邮筒, 设 X , Y 分别表示投入第 1, 2 号邮筒中信的数目, 求 X 和 Y 的联合概率分布及边缘概率分布.
21

1 ? 2 (x2 ? y2 ) e (1 ? sin x sin y ) 试求关于 X , Y 2?

1

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

?kxy , 0 ? x ? 1, 0 ? y ? 1 2.设向量 ( X , Y ) 的密度函数 f ( x, y ) 的密度函数为 f ( x, y ) ? ? ?0, 其它 求 (1) 参数 k 的值; (2) ( X , Y ) 的边缘密度.

第二节 条件分布与随机变量的独立性
一、 条件分布的概念 设 X 是一个随机变量, 其分布函数为 FX ( x) ? P{X ? x}, ?? ? x ? ??, 若另外有一事件 A 已经 发生 , 并且 A 的发生可能会对事件 { X ? x} 发生的概率产生影响 , 则对任一给定的实数 x , 记 F ( x | A) ? P{ X ? x | A}, ?? ? x ? ??, 称 F ( x | A) 为在 A 发生的条件下, X 的条件分布函数. 二、 随机变量的独立性 设 A 是随机变量 Y 所生成的事件: A ? {Y ? y} , 且 P{Y ? y} ? 0 , 则有 P{ X ? x, Y ? y} F ( x, y ) F ( x | Y ? y) ? ? .一般地, 由于随机变量 X , Y 之间存在相互联系 ,因而 P{Y ? y} FY ( y ) 一个随机变量的取值可能会影响另一个随机变量的取值统计规律性. 在何种情况下, 随机变 量 X , Y 之间没有上述影响, 而具有所谓的“独立性”, 我们引入如下定义. 定义 设随机变量 ( X , Y ) 的联合分布函数为 F ( x, y ) , 边缘分布函数为 FX ( x ) , FY ( y ) , 若对任

意实数 x, y , 有 P{ X ? x, Y ? y} ? P{ X ? x}P{Y ? y}, 即 F ( x, y) ? FX ( x) FY ( y), 则称随机变量 X 和 Y 相互独立. 关于随机变量的独立性, 有下列两个定理. 定理 1 随机变量 X 与 Y 相互独立的充要条件是 X 所生成的任何事件与 Y 生成的任何事件 独立, 即, 对任意实数集 A, B , 有 P{ X ? A, Y ? B} ? P{ X ? A}P{Y ? B}, 定理 2 如随机变量 X 与 Y 相互独立, 则对任意函数 g1 ( x ), g 2 ( y ) 均有 g1 ( X ), g 2 (Y ) 相互独立. 三、离散型随机变量的条件分布与独立性 设 ( X , Y ) 是二维离散型随机变量, 其概率分布为 P{X ? xi , Y ? y j } ? pij , i, j ? 1,2,? 由条件概率公式, 当 P{Y ? y j } ? 0 , 有 P{ X ? xi | Y ? y j } ? 称其为在 Y ? y j 条件下随机变量 X 的条件概率分布. 对离散型随机变量 ( X , Y ) , 其独立性的定义等价于:若对 ( X , Y ) 的所有可能取值 ( xi , x j ), 有
P{X ? xi , Y ? y j } ? P{X ? xi }P{Y ? y j } 即 pij ? pi? p? j , i, j ? 1,2,? 则称 X 和 Y 相互独立.
P{ X ? xi , Y ? y j } P{Y ? y j } ? pij p? j , i ? 1,2,?

四、 连续型随机变量的条件密度与独立性 定义 设二维连续型随机变量 ( X , Y ) 的概率密度为 f ( x, y ) ,边缘概率密度为 f X ( x), fY ( y) , 则 对一切使 f X ( x) ? 0 的 x , 定义在 X ? x 的条件下 Y 的条件概率密度为 f Y | X ( y | x ) ?
f ( x, y ) . f X ( x)

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

22

对一切使 fY ( y) ? 0 的 y , 定义在 Y ? y 的条件下 X 的条件密度函数为 f X |Y ( x | y ) ? 注: 关于定义表达式内涵的解释. 以 f X |Y ( x | y ) ? 以 (dxdy) / dy 即得 f X |Y ( x | y )dx ?

f ( x, y ) . fY ( y )

f ( x, y ) 为例. 在上式左边乘以 dx , 右边乘 fY ( y )

f ( x, y )dxdy P{x ? X ? x ? dx, y ? Y ? y ? dy} ? f Y ( y )dy P{ y ? Y ? y ? dy}

? P{x ? X ? x ? dx | y ? Y ? y ? dy}.

换句话说, 对很小的 dx 和 dy , f X |Y ( x | y)dx 表示已知 Y 取值于 y 和 y ? dy 之间的条件下, X 取值于 x 和 x ? dx 之间的条件概率. 对二维连续型随机变量 ( X , Y ) , 其独立性的定义等价于: 若对任意的 x, y , 有 f ( x, y) ? f X ( x) fY ( y) 几乎处处成立, 则称 X , Y 相互独立. 注: 这里“几乎处处成立”的含义是:在平面上除去面积为 0 的集合外,处处成立. 例题选讲: 条件分布的概念 例 1 设 X 服从 [0,1] 上的均匀分布, 求在已知 X ? 随机变量的独立性 例 2 设 X 与 Y 的联合概率分布为 Y X 0 1 2

1 的条件下 X 的条件分布函数. 2

?1
0.1 0.3 0.15

0 0.2 0.05 0

2 0 0.1 0.1

(1) 求 Y ? 0 时, X 的条件概率分布以及 X ? 0 时, Y 的条件概率分布; (2)判断 X 与 Y 是否相互独立? 例 3 设随机变量 X 与 Y 相互独立, 下表列出了二维随机变量 ( X , Y ) 联合分布律及关于 X 和关 于 Y 的边缘分布律中的部分数值, 试将其余数值填入表中的空白处. Y X
x1
x2

y1
1/8 1/6

y2

y3

P{X ? xi } ? Pi

1/8

P{ y ? y j } ? p j

1

例 4 一射手进行射击 ,击中目标的概率为 p, (0 ? p ? 1) , 射击进行到击中目标两次为止 . 以 X 表示首次击中目标所进行射击次数, 以 Y 表示总共进行的射击次数 . 试求 X 和 Y 的联合 分布及条件分布. 连续型随机变量的条件密度与独立性 ?( x ? y ) ? , x ? 0, y ? 0 ? xe 例 5 设 ( X , Y ) 的概率密度为 f ( x, y) ? ? ;问 X 和 Y 是否独立? ? 0 , 其它 ?

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

23

例 6 设 ( X , Y ) 服从单位圆上的均匀分布,概率密度为 求 f Y | X ( y | x).

?1 / ? , x 2 ? y 2 ? 1, f ( x, y) ? ? 其它. ? 0,

2 例 7 设 ( X ,Y ) ~ N (?1, ?2 ;? 2 ,?12 ; ? ), (1) 求 f X |Y ( x | y) 和 fY | X ( y | x) .

(2) 证明 X 与 Y 相互独立的充要条件是 ? ? 0 . 例 8 甲乙两人约定中午 12 时 30 分在某地会面. 如果甲来到的时间在 12:15 到 12:45 之间是 均匀分布. 乙独立地到达, 而且到达时间在 12:00 到 13:00 之间是均匀分布. 试求先到的人等 待另一人到达的时间不超过 5 分钟的概率. 又甲先到的概率是多少? 例 9 设数 X 在区间 (0,1) 均匀分布,当观察到 X ? x(0 ? x ? 1) 时,数 Y 在区间 ( x,1) 上等可 能随机地取值.求 Y 的概率密度. 例 10 设店主在每日开门营业时,放在柜台上的货物量为 Y ,当日销售量为 X 假定一天中 不 再 上 柜 台 上 补 充 货 物 , 于 是 X ? Y . 根 据 历 史 资 料 , ( X ,Y ) 的 概 率 密 度 函 数 为
?1 / 200, 当0 ? x ? y, 0 ? y ? 20时, f ( x, y) ? ? 即 ( X , Y ) 服从直角三角形区域 OAB 上的均匀 其它. ? 0, 分布, 见图 3—2A. 求(1) 给定 Y ? y 条件下, X 的条件分布.(2)假定某日开门时, Y ? 10 件,

求这天顾客买走 X ? 5 件的概率. 如果 Y ? 20 件呢?
?y ? ?e , 0 ? x ? y; 例 11 设随机变量 ( X , Y ) 的概率密度为 f ( x, y) ? ? ? 其它. ?0,

(1) 求 X 与 Y 的边际概率密度, 并判断 X 与 Y 是否相互独立; (2) 求在 Y ? y 的条件下, X 的条件概率密度; (3) 求概率 P{X ? 2Y ? 1}, 思考题 1. 设 ( X , Y ) 的分布律如下 Y X 1 2 问?, ? 1 2 3

P?0 ? X ? 1 / 2 | Y ? 1? P?X ? 2 | Y ? 4?.

1/6 1/9 1/18 ? 1/3 ? 为何值时, X 与 Y 相互独立.

?e ?x / y e ? y , 0 ? x ? ??, 0 ? y ? ?? ? 2. 设 ( X , Y ) 的概率密度是 f ( x, y ) ? ? 求 P{ X ? 1 | Y ? y}. y ? 0, 其它 ?
?4 xy, 3.设 f ( x, y ) ? ? ?0, 0 ? x ? 1,0 ? y ? 1 其它

,试判断 X 与 Y 是否相互独立.

第三节 多维随机变量函数的分布
在实际应用中,有些随机变量往往是两个或两个以上随机变量的函数. 例如,考虑全 国年龄在 40 岁以上的人群, 用 X 和 Y 分别表示一个人的年龄和体重,Z 表示这个人的血压, 并且已知 Z 与 X , Y 的函数关系式 Z ? g ( X , Y ) ,现希望通过 ( X , Y ) 的分布来确定 Z 的分布. 此类问题就是我们将要讨论的两个随机向量函数的分布问题. 在本节中,我们重点讨论两种特殊的函数关系 : (i) Z ? X ? Y ; (ii) Z ? max{ X , Y } 和
24

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

Z ? min{ X , Y } ,其中 X 与 Y 相互独立.

注:应指出的是,将两个随机变量函数的分布问题推广到 n 个随机变量函数的分布问题 只是表述和计算的繁杂程度的提高,并没有本质性的差异. 一、 离散型随机变量的函数的分布 设 ( X , Y ) 是二维离散型随机变量 , g ( x, y ) 是一个二元函数 , 则 g ( X , Y ) 作为 ( X , Y ) 的函数是 一个随机变量, 如果 ( X , Y ) 的概率分布为 P{X ? xi , Y ? y j } ? pij 的所有可能取值为 zk , k ? 1,2,? , 则 Z 的概率分布为
(i, j ? 1,2,?) 设 Z ? g ( X , Y )

P{Z ? zk } ? P{g ( X , Y ) ? zk } ?

g ( xi , y j )? zk

? P{X ? x , Y ? y },
i j

k ? 1,2, ?,

二、 连续型随机变量的函数的分布 设 ( X , Y ) 是二维连续型随机向量, 其概率密度函数为 f ( x, y ) , 令 g ( x, y ) 为一个二元函数, 则 g ( X , Y ) 是 ( X , Y ) 的函数. 可用类似于求一元随机变量函数分布的方法来求 Z ? g ( X , Y ) 的分 布.a) 求分布函数 FZ ( z), FZ ( z ) ? P{Z ? z} ? P{g ( X , Y ) ? z} ? P{( X , Y ) ? D Z } ? ?? f ( x, y )dxdy.
DZ

? ( z). 其中, DZ ? {( x, y) | g ( x, y) ? z}. b) 求其概率密度函数 f Z ( z ) , 对几乎所有 z, 有 f Z ( z) ? FZ

定理 1

设 ( X 1 , X 2 ) 是 具 有 密 度 函 数 f ( x1 , x2 ) 的 连 续 型 随 机 向 量 .(1) 设

y1 ? g1 ( x1 , x2 ), y2 ? g 2 ( x1 , x2 ) 是 R 2 到自身的一一映射, 即存在定义在该变换的值域上的逆变

换 : x1 ? h1 ( y1 , y2 ), x2 ? h2 ( y1 , y2 ); (2) 假 设 变 换 和 它 的 逆 都 是 连 续 的 ;(3) 假 设 偏 导 数
?h1 ?hi ?y (i ? 1,2, j ? 1,2) 存在且连续;(4) 假设逆变换的雅可比行列式 J ( y1 , y2 ) ? 1 ?h2 ?yi ?y1 ?h1 ?y2 ? 0, ?h2 ?y2

即 J ( y1 , y2 ) 对于在变换的值域中的 ( y1 , y2 ) 是不为 0 的. 则 Y1 , Y2 具有联合密度
w( y1 , y2 ) ?| J | f (h1 ( y1 , y2 ), h2 ( y1 , y2 )).
2 2 定理 2 设 X , Y 相互独立,且 X ~ N (?1, ?1 ), Y ~ N (?2 , ? 2 ). 则 Z ? X ? Y 仍然服从正态分 2 2 布,且 Z ~ N (?1 ? ?2 , ?1 ??2 ). 更一般地,可以证明:有限个相互独立的正态随机变量的线

性组合仍然服从正态分布, 即有 定 理 3 若 X i ~ N (?i , ? i2 )(i ? 1,2,?, n), 且 它 们 相 互 独 立 , 则 对 任 意 不 全 为 零 的 常 数
n n ? n 2? ? a1 , a2 , ?, an ,有 ? ai X i ~ N ? a ? , ? ? i i ? ai? i ? . i ?1 i ?1 ? i ?1 ?

三、 M ? max( X , Y ) 及 N ? min( X , Y ) 的分布 设随机变量 X , Y 相互独立,其分布函数分别为 FX ( x ) 和 FY ( y ) , 由于 M ? max( X , Y ) 不大于 z
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

25

等价于 X 和 Y 都不大于 z, 故有

FM ( z ) ? P{M ? z} ? P{ X ? z , Y ? z} ? P{ X ? z}P{Y ? z} ? FX ( z ) FY ( z );

类似地, 可得 N ? min( X , Y ) 的分布函数 FN ( z ) ? P{N ? z} ? 1 ? P{N ? z} ? 1 ? P{ X ? z, Y ? z} ? 1 ? P{ X ? z}P{Y ? z} ? 1 ? [1 ? F X ( z )][1 ? FY ( z )]. 例题选讲: 离散型随机变量的函数的分布 例 1 设随机变量 ( X , Y ) 的概率分布如下表 Y 0 1 ?1 X 0.2 0.15 0.1 ?1 2 0.1 0 0.1 求二维随机变量的函数 Z 的分布: (1)Z ? X ? Y ;

2 0.3 0.05 (2)Z ? XY.

例 2 设 X 和 Y 相互独立, X ~ b(n1 , p), Y ~ b(n2 , p) , 求 Z ? X ? Y 的分布. 例 3 (若 X 和 Y 相互独立, 它们分别服从参数为 ?1 , ?2 的泊松分布, 证明 Z ? X ? Y 服从参数 为 ?1 ? ?2 的泊松分布. 连续型随机变量的函数的分布 例 4 设随机变量 X 与 Y 相互独立, 且同服从 [0,1] 上的均匀分布, 试求 Z ?| X ? Y | 的分布函 数与密度函数. 例 5 设 ( X 1 , X 2 ) 的密度函数为 f ( x1 , x2 ). 令 Y1 ? X 1 ? X 2 , Y2 ? X 1 ? X 2 试用 f 表示 Y1 和
Y2 的联合密度函数. 和的分布:设 X 和 Y 的联合密度为 f ( x, y ) , 求 Z ? X ? Y 的密度.

卷积公式: 当 X 和 Y 独立时, 设 ( X , Y ) 关于 X , Y 的边缘密度分别为 f X ( x), fY ( y), 则上述两 式化为
f Z ( z ) ? ? f X ( z ? y ) f Y ( y )dy
?? ? ?

f Z ( z ) ? ? f X ( x) f Y ( z ? x)dx
??

以上两个公式称为卷积公式.

例 6 设 X 和 Y 是两个相互独立的随机变量. 它们都服从 N (0,1) 分布, 其概率密度为
f X ( x) ? f Y ( y) ? 1 2? 1 2? e ?x e?y
2

/2

, ? ? ? x ? ?,
求Z ? X ? Y的概率密度.

2

/2

, ? ? ? y ? ?.

?x ? ? xe , 当x ? 0时, 例 7 设某种商品一周的需要量是一个随机变量, 其概率密度函数为 f ( x) ? ? ? 其它. ?0,

如果各周的需要量相互独立, 求两周需要量的概率密度函数. 例 8 设 X 与 Y 相互独立, 且均在区间 [0,1] 上服从均匀分布, 求 Z ? X ? Y 的密度函数. 例 9 设 X1, X 2 相 互 独 立 且 分 别 服 从 参 数 为
X 1 ~ ?(?1 , ? ), X 2 ~ ?(? 2 , ? ),

? 1 , ? ;? 2 , ? 的 ? 分 布 ( 分 别 记 成

X 1 , X 2 的概率密度分别为

? 1 1 ? x ?1 ?1 e ? x / ? , x ? 0 y ? 2 ?1 e ? y / ? , y ? 0 ? ? f X 2 ( y ) ? ? ? ? 2 ?(? 2 ) f X 1 ( x) ? ? ? ?1 ? (?1 ) ? ? 0, 其它 0, 其它 ? ? 试证明 X 1 ? X 2 服从参数为 ? 1 ? ? 2 , ? 的 ? 分布. X 商的分布:设二维随机向量 ( X , Y ) 的密度函数为 f ( x, y ) , 求 Z ? 的密度函数. Y

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

26

例 10

在一简单电路中, 两电阻 R1 和 R2 串联连接, 设 R1 , R2 相互独立,它们的概率密度均

?10 ? x ? , 0 ? x ? 10 为 f ( x) ? ? 50 求总电阻 R ? R1 ? R2 的概率密度. ? 0 , 其它 . ?

例 11 设 X 与 Y 相互独立, 它们都服从参数为 ? 的指数分布. 求 Z ?

X 的密度函数. Y

积的分布: 设 ( X 1 , X 2 ) 具有密度函数 f ( x1 , x2 ) , 则 Y ? X 1 X 2 的概率密度为
? ? y? 1 fY ( y ) ? ? f ? z, ? dz. ?? ? z ?| z| 例 12 设二维随机向量 ( X , Y ) 在矩形 G ? {( x, y) | 0 ? x ? 2,0 ? y ? 1} 上服从均匀分布, 试求 边长为 X 和 Y 的矩形面积 S 的密度函数 f (s) .

例 13 设随机变量 X 1 , X 2 独立 , 且有相同的几何分布 : P{X i ? k} ? pqk ?1, k ? 1,2,?, i ? 1,2 , q ? 1 ? p 求 Y ? max( X 1 , X 2 ) 的分布. 例 14 设系统 L 由两个相互独立的子系统 L1 , L2 联接而成,联接方式分别为串联、并联、备 用 (当系统 L1 损坏时, 系统 L2 开始工作) , 如图 3—3—6 所示. 设 L1 , L2 的寿命分别为 X , Y ,

??e??x , x ? 0, ??e? ?y , y ? 0, 已 知 它 们 的 概 率 密 度 分 别 为 f X ( x) ? ? 其中 fY ( y ) ? ? x ? 0, y ? 0, ?0, ?0, ? ? 0, ? ? 0 且 ? ? ? . 试分别就以上三种联接方式写出 L 寿命 Z 的概率密度.
思考题 1.已知 ( X , Y ) 的分布律为

Y X
0 1

0 0.10 0.15

1 0.25 0.20

2 0.15 0.15

求:(1) Z ? X ? Y ; (2) Z ? XY ; (3) Z ? sin?

? ? ?X ? Y ?? ?; (4) Z ? max{ X , Y } 分布律. 2 ? ?

?1, 0 ? x ? 1 2. 若 X 和 Y 独立, 具有共同的概率密度 f ( x) ? ? 求 Z ? X ? Y 的概率密度. ?0, 其它

第四章 随机变量的数字特征
前面讨论了随机变量的分布函数 , 从中知道随机变量的分布函数能完整地描述随机变 量的统计规律性.但在许多实际问题中, 人们并不需要去全面考察随机变量的变化情况 , 而 只要知道它的某些数字特征即可 .例如, 在评价某地区粮食产量的水平时 , 通常只要知道该 地区粮食的平均产量;又如, 在评价一批棉花的质量时, 既要注意纤维的平均长度, 又要注意 纤维长度与平均长度之间的偏离程度, 平均长度较大, 偏离程度小, 则质量就较好. 等等 实际上, 描述随机变量的平均值和偏离程度的某些数字特征在理论和实践上都具有重 要的意义, 它们能更直接、更简洁更清晰和更实用地反映出随机变量的本质. 本章将要讨论的随机变量的常用数字特征包括: 数学期望、方差、相关系数、矩. 【教学目的与要求】 通过学习,使学生理解数学期望、方差的概念,掌握它们的性质与计算;会计算随机 变量函数的数学期望。熟记二项分布、泊松分布、均匀分布、指数分布和正态分布的数学期
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

27

望与方差。了解协方差与相关系数的概念并掌握它的性质与计算。了解矩的概念。 【教学重点】 数学期望、方差、协方差、相关系数的概念、性质和计算。 【教学难点】 相关系数 【计划课时】5 【教学内容】

第一节 数学期望
一、离散型随机变量的数学期望 平均值是日常生活中最常用的一个数字特征, 它对评判事物、作出决策等具有重要作用. 定义 设 X 是离散型随机变量的概率分布为 P{X ? xi } ? pi , i ? 1,2,? 如果
?

? x p 绝对收敛,
i i i ?1

?

则定义 X 的数学期望(又称均值)为 E ( X ) ? ? xi pi .
i ?1

二、连续型随机变量的数学期望 定义 设 X 是连续型随机变量, 其密度函数为 f ( x) ,如果 学期望为 E( X ) ?

?

?

??

xf ( x)dx 绝对收敛, 定义 X 的数

?

?

??

xf ( x)dx.

三、 随机变量函数的数学期望 设 X 是一随机变量, g ( x) 为一实函数,则 Y ? g ( X ) 也是一随机变量, 理论上, 虽然可通 过 X 的分布求出 g ( X ) 的分布, 再按定义求出 g ( X ) 的数学期望 E[ g ( X )] . 但这种求法一般 比较复杂. 下面不加证明地引入有关计算随机变量函数的数学期望的定理. 定理 1 设 X 是一个随机变量, Y ? g ( X ) ,且 E (Y ) 存在, 则 (1) 若 X 为离散型随机变量, 其 概率分布为 P{X ? xi } ? pi , i ? 1,2,? 则 Y 的数学期望为 E (Y ) ? E[ g ( X )] ? ? g ( xi ) pi . (2) 若
i ?1 ?

X 为 连 续 型 随 机 变 量 , 其 概 率 密 度 为 f ( x) , 则 Y 的 数 学 期 望 为
E (Y ) ? E[ g ( X )] ? ? g ( x) f ( x)dx.
?? ?

注 : (i) 定理的重要性在于 :求 E[ g ( X )] 时 , 不必知道 g ( X ) 的分布 , 只需知道 X 的分布即可 . 这给求随机变量函数的数学期望带来很大方便;(ii) 上述定理可推广到二维以上的情形, 即 定理 2 设 ( X , Y ) 是二维随机向量, Z ? g ( X , Y ) ,且 E ( Z ) 存在, 则(1)若 ( X , Y ) 为离散型随 机向量, 其概率分布为 P{X ? xi , Y ? y j } ? pij (i, j ? 1,2,?) 则 Z 的数学期望为
E ( Z ) ? E[ g ( X , Y )] ? ?? g ( xi , y j ) pij ( , 2) 若 ( X , Y ) 为连续型随机向量, 其概率密度为 f ( x, y )
j ?1 i ?1 ? ?

则 Z 的数学期望为 E ( Z ) ? E[ g ( X , Y )] ? ?

?

?? ??

?

?

g ( x, y ) f ( x, y )dx.

四、数学期望的性质 1. 设 C 是常数, 则 E (C ) ? C ; 2.若 k 是常数,则 E (kX ) ? kE ( X );

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

28

3. E ( X 1 ? X 2 ) ? E ( X 1 ) ? E ( X 2 ); 4. 设 X , Y 独立, 则 E ( XY ) ? E ( X ) E (Y ) ; 注: (i) 由 E ( XY ) ? E ( X ) E (Y ) 不一定能推出 X , Y 独立,例如,在例 10 中,已计算得

E( XY ) ? E( X ) E(Y ) ?

9 3 1 ,但 P{X ? 1, Y ? 0} ? 0, P{X ? 1 ? }, P{Y ? 0} ? ,显 4 4 8 P{ X ? 1, Y ? 0} ? P{ X ? 1} ? P{Y ? 0} 故 X 与 Y 不独立

(ii) 这个性质可推广到有限个随机变量之和的情形. 例题选讲: 离散型随机变量的数学期望 例 1 甲, 乙两人进行打靶, 所得分数分别记为 X 1 , X 2 , 它们的分布律分别为

X1 0 1 2 X2 , pi 0 0.2 0.8 pi

0 1 2 试评定他们的成绩的好坏. 0.6 0.3 0.1

例 2 某种产品的每件表面上的疵点数服从参数 ? ? 0.8 的泊松分布, 若规定疵点数不超过 1 个为一等品, 价值 10 元; 疵点数大于 1 个不多于 4 个为二等品, 价值 8 元; 疵点数超过 4 个 为废品. 求(1) 产品的废品率;(2) 产品价值的平均值. 例 3 按规定,某车站每天 8:00~9:00 和 9:00~10:00 之间都恰有一辆客车到站, 但到站的时刻 是随机的, 且两者到站的时间相互独立. 其规律为 8:00~9:00 到站时间 9:00~10:00 到站时间 概率 8:10 9:10 1/6 8:30 9:30 3/6 8:50 9:50 2/6 一旅客 8:20 到车站, 求他候车时间的 数学期望.

连续型随机变量的数学期望
?0, x ? 0 ? 例 4 已知随机变量 X 的分布函数 F ( x) ? ? x / 4, 0 ? x ? 4 , 求 E ( X ). ?1, x ? 4 ? 例 5 某商店对某种家用电器的销售采用先使用后付款的方式. 记使用寿命为 X (以年计), 规

X ? 1, 一台付款 1500 元; 1X ? 2, 一台付款2000 元; 定: 设寿命 X 服从指数分布, 概率密度为 2 ? X ? 3, 一台付款2500 元; X ? 3, 一台付款3000 元. ? 1 ? x / 10 ? e , x?0 f ? x ? ? ?10 试求该商店一台电器收费 Y 的数学期望. ? 0 , x ? 0 . ?
例 6 设随机变量 X ~ f ( x), E ( X ) ? 布函数 F ( x) . 例 7 有 2 个相互独立工作的电子装置, 它们的寿命 X k (k ? 1,2) 服从统一指数分布,其概率
? 1 ?x /? ? e , x?0 密度为 f ( x) ? ?? , ? ? 0. 若将这 2 个电子装置串联联接组成整机, 求整机寿命 ? x?0 ? 0, (以小时计) N 的数学期望.
?ax ? b, 7 , 且 f ( x) ? ? 12 ?0, 0 ? x ?1 其它

求 a 与 b 的值, 并求分

随机变量函数的数学期望 例 8 设 ( X , Y ) 的联合概率分布为,求 E ( X ), E (Y ), E ( XY ).
29

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

Y X 1 3

0 0 1/8

1 3/8 0

2 3/8 0

3 0 1/8

例 9 设随机变量 X 在 [0, ? ] 上服从均匀分布, 求 E(sin X ), E( X 2 ) 及 E[ X ? E( X )]2 .
1 ? 3 , ? y ? x, x ? 1, ? x 例 10 设随机变量 ( X , Y ) 的概率密度 f ( x, y ) ? ? 2 x 3 y 2 ?0, 其它. ? ? 1 ? 求数学期望 E (Y ), E ? ?. ? XY ? 例 11 设某商店经营一种商品, 每周的进货量 X 和顾客对该种商品的需求量 Y 是两个相互独 立的随机变量, 均服从[10,20]上的均匀分布. 此商店每售出一个单位的商品可获利 1000 元, 若需求量超过进货量, 可从其他商店调剂供应, 此时售出的每单位商品仅获利 500 元. 求此 商店经销这种商品每周获利的期望.

例 12 设 E( X ), E( X 2 ) 均存在,证明 E[ X ? E( X )]2 ? E( X 2 ) ? [E( X )]2 . 例 13 若 X ~ b(n, p), 求 E ( X ). 数学期望的性质 例 14 一民航送各车载有 20 位旅客自机场开出, 旅客有 10 个车站可以下车. 如到达一个车站 没有旅客下车就不停车. 以 X 表示停车的次数, 求 E(X) (设每位旅客在各个车站下车是等可 能的, 并设各旅客是否下车相互独立). 思考题 1. 设甲、乙两人玩必分胜负的赌博游戏, 假定游戏的规则不公正, 以致两人获胜的概率不 等,甲为 p , 乙为 q , p ? q , p ? q ? 1 . 为了补偿乙的不利地位, 另行规定两人下的赌注不相等, 甲为 a , 乙为 b , a ? b . 现在的问题是: a 究竟应比 b 大多少, 才能做到公正? 2. 某种新药在 400 名病人中进行临床试验有一半人服用,一班人未服,经过 5 天后,有 210 人痊愈,其中 190 人是服了新药的.试用概率统计方法说明新药的疗效. 3. 把数字 1,2, ? , n 任意地排成一列, 如果数字 k 恰好出现在第 k 个位置上, 则称为一个巧合, 求巧合个数的数学期望.

第二节 方差
随机变量的数学期望是对随机变量取值水平的综合评价, 而随机变量取值的稳定性是 判断随机现象性质的另一个十分重要的指标. 一、 方差的定义 定义 1 设 X 是一个随机变量, 若 E[( X ? E( X )]2 存在,则称它为 X 的方差, 记为

D( X ) ? E[ X ? E( X )]2 . 方差的算术平方根 D( X ) 称为标准差或均方差, 它与 X 具有相同的
度量单位, 在实际应用中经常使用.方差刻划了随机变量 X 的取值与数学期望的偏离程度,它 的大小可以衡量随机变量取值的稳定性.从方差的定义易见:(1)若 X 的取值比较集中,则方差 较小;(2)若 X 的取值比较分散,则方差较大;(3)若方差 D( X ) ? 0 , 则随机变量 X 以概率 1 取常 数值,此时 X 也就不是随机变量了. 二、 方差的计算 若 X 是 离 散 型 随 机 变 量 , 且 其 概 率 分 布 为 P{X ? xi } ? pi , i ? 1,2,? 则

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

30

D( X ) ? ? [ xi ? E ( X )]2 pi ; 若 X 是连续型随机变量,且其概率密度为 f ( x), 则
i ?1
?

?

D( X ) ? ? [ xi ? E ( X )]2 f ( x)dx. 利用数学期望的性质, 易得计算方差的一个简化公式:
??

D( X ) ? E( X 2 ) ? [ E( X )]2 .

三、方差的性质 1. 设 C 常数, 则 D(C ) ? 0 ; 2. 若 X 是随机变量, 若 C 是常数, 则 D(CX ) ? C 2 D( X ); 3. 设 X , Y 是两个随机向量,则 D( X ? Y ) ? D( X ) ? D(Y ) ? 2E (( X ? E ( X ))(Y ? E (Y ))); 特别地, 若 X , Y 相互独立, 则 D( X ? Y ) ? D( X ) ? D(Y ).
?n ? n ?n ? n 注: 对 n 维: 若 X 1 , X 2 ,?, X n 相互独立, 则 D ?? X i ? ? ? D( X i ), D ?? Ci X i ? ? ? Ci2 D( X i ). ? i?1 ? i?1 ? i ?1 ? i?1

*四、 条件数学期望和条件方差简介 由于随机变量之间存在相互联系 , 一个随机变量的取值可能会对另一随机变量的分布 产生影响, 这种影响会在数字特征上得到反映. 下面要讨论的是:在某个随机变量取某值的 条件下,求另一个与之相关的随机变量的数字特征. 作为简介,我们直接给出它们的定义 1. 设 ( X , Y ) 是离散型随机向量, 其概率分布为 P{X ? xi ,Y ? y j } ? pij

(i ? 1,2,?, j ? 1,2,?, )

定义 2 (i) 称 E(Y | X ? xi ) ? ? y j P{Y ? y j | X ? xi } (绝对收敛)为在 X ? xi 条件下 Y 的条件
j

数学期望.类似地,称 E ( X | Y ? yi ) ? ? xi P{X ? xi | Y ? y j }(绝对收敛)为在 Y ? yi 条件下
i

(绝对收敛) X 的条件数学期望;(ii) 称 D(Y | X ? xi ) ? ?[ y j ? E(Y | X ? xi )] P{Y ? y j | X ? xi }
2 j

为在 X ? xi 条件下 Y 的条件方差. 类似地,称 D( X | Y ? yi ) ? ?[ xi ? E( X | Y ? y j )] P{X ? xi | Y ? y j }(绝对收敛)为在 Y ? y j 条
2 i

件下 X 的条件方差. 2 .设 ( X , Y ) 是连续型随机向量 , fY | X ( y | x) 是在 X ? x 条件下的概率密度, f X |Y ( x | y) 是在
Y ? y 条件下 X 的概率密度.

定义 3 (i) 称 E[Y | X ? x] ? ? yfY | X ( y | x)dy (绝对收敛)为在 X ? x 条件下 Y 的条件数学
??

??

期望;类似地,称 E[ X | Y ? y] ? ? xf X |Y ( x | y)dx (绝对收敛)为在 Y ? y 条件下 X 的条件数
??

??

学期望; (ii) 称 D(Y | X ? x) ? ? [ y ? E (Y | X ? x)]2 fY | X ( y | x)dy(绝对收敛) 为在 X ? x 条件下
??

??

Y 的条件方差;类似地,称 D( X | Y ? y) ? ? [ x ? E ( X | Y ? y)]2 f X |Y ( x | y)dx (绝对收敛)为在
??

??

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

31

Y ? y 条件下 X 的条件方差.

例题选讲: 方差的计算 例 1 设随机变量 X 具有数学期望 E ( X ) ? ? , 方差 D( X ) ? ? 2 ? 0. 记 X * ?

X ??

?

, 则

E( X * ) ?

1

?

E( X ? ? ) ?

1

?

[ E( X ) ? ? ] ? 0;
X ??

D( X * ) ? E ( X *2 ) ? [ E ( X * )] 2 ? E[(
即 X* ?

?

)2 ] ?

1

X ??

?2

E[( X ? ? ) 2 ] ?

?2 ? 1. ?2

?

的数学期望为 0, 方差为 1. X * 称为 X 的标准化变量.

例 2 设随机变量 X 具有 (0 ? 1) 分布, 其分布律为 P{ X ? 0} ? 1 ? p, P{ X ? 1} ? p, 求 E ( X ), D( X ). 例 3 设 X ~ P(? ), 求 E ( X ), D( X ). 例 4 设 X ~ U (a, b), 求 E ( X ), D( X ). 例 5 设随机变量 X 服从指数分布, 其概率密度为 f ( x ) ? ??

? 1 ?x /? ? e , x ? 0, ? ? 0, x ? 0.

其中 ? ? 0, 求 E ( X ), D( X ). 例 6 设随机变量 X 服从几何分布, 概率函数 P{X ? k} ? p(1 ? p) k ?1 , k ? 1,2, ?, n 其中 0 ? p ? 1 , 求 E ( X ), D( X ) . 例 7 设随机变量 X , Y 的联合点分布在以点(0,1), (1,0), (1,1)为顶点的三角形区域上服从均匀 分布, 试求随机变量 Z ? X ? Y 的期望与方差. 方差的性质 例 8 设 f ( x) ? E( X ? x) 2 , x ? R, 证明当 x ? E ( X ) 时, f ( x) 达到最小值. 注:本例子说明了数学期望 E ( X ) 是随机变量 X 取值的集中位置, 反映了 X 的平均值. 例 9 (设 X ~ b(n, p) , 求 E ( X ), D( X ). 例 10 设 X ~ N (? , ? 2 ), 求 E ( X ), D( X ).

X ~ N (22.40, 0.03 ) ,气缸的直径 Y ~ N (22.50, 0.04 ), 例 11 设活塞的直径 (以 cm 计) X , Y 相互独立, 任取一只活塞, 任取一只气缸, 求活塞能装入气缸的概率.
例 12 随机变量 X 和 Y 相互独立,证 D( XY ) ? D( X )D(Y ) ? [E( X )]2 D(Y ) ? [E(Y )]2 D( X ). 条件数学期望和条件方差简介
2 2 例 13 设 ( X , Y ) ~ N (?1 , ? 2 , ? 1 ,? 2 , ? ) ,求 E (Y | X ? x), D(Y | X ? x) . 思考题 0 ? x ?1 ? x, ? 1. 设随机变量 X 的密度函数为 f ( x) ? ?2 ? x, 1 ? x ? 2 求 E ( X ). ? 0, 其它. ?

2

2

2. 设随机变量 X 的概率分布律为

X ? 1 0 1/ 2 1 2 pi 1 / 3 1 / 6 1 / 6 1 / 12 1 / 4

2 试求 Y ? ? X ? 1 及 Z ? X 的期望与方差.

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

32

第三节 协方差及相关系数
对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没 能反映随机变量之间的关系 . 本节将要讨论的协方差是反映随机变量之间依赖关系的一个 数字特征. 一、 协方差的定义 定义 设 ( X , Y ) 为二维随机向量 ,若 E{[ X ? E ( X )][Y ? E (Y )]} 存在, 则称其为随机变量 X 和 Y 的协方差, 记为 Cov( X , Y ) ,即 cov(X , Y ) ? E{[ X ? E ( X )][Y ? E (Y ) ] } . 按定义, 若 ( X , Y ) 为离散型随机向量,其概率分布为 P{X ? xi , Y ? y j } ? pij 则 cov(X , Y ) ? ? E{[ xi ? E( X )][ y j ? E(Y )]}.
i, j

(i, j ? 1,2,?)

若 ( X , Y ) 为连续型随机向量, 其概率分布为 f ( x, y ), 则 cov(X , Y ) ? ?
?? ?? ?? ??

?

E{[ x ? E ( X )][ y ? E (Y )]} f ( x, y)dxdy .

此外, 利用数学期望的性质, 易将协方差的计算化简.
cov(X , Y ) ? E{[ X ? E ( X )][Y ? E (Y )]} ? E ( XY ) ? E ( X ) E (Y ) ? E (Y ) E ( X ) ? E ( X ) E (Y ) ? E ( XY ) ? E ( X ) E (Y ).

特别地, 当 X 与 Y 独立时, 有 cov(X , Y ) ? 0. 二、协方差的性质 1. 协方差的基本性质 (1) cov(X , X ) ? D( X ); (2) cov(X , Y ) ? cov(Y , X ); (3) cov(aX , bY ) ? ab cov(X , Y ) ,其中 a , b 是常数; (4) cov(C , X ) ? 0, C 为任意常数;
(5) cov(X1 ? X 2 , Y ) ? cov(X1, Y ) ? cov(X 2 , Y ). (6) 若 X 与 Y 相互独立时,则 cov(X , Y ) ? 0.

2. 随机变量和的方差与协方差的关系 D( X ? Y ) ? D( X ) ? D(Y ) ? 2 cov(X , Y ), 特别地, 若 X 与 Y 相互独立时, 则 D( X ? Y ) ? D( X ) ? D(Y ) . 三、相关系数的定义与性质 定义 设 ( X , Y ) 为二维随机变量, D( X ) ? 0, D(Y ) ? 0, 称 ? XY ?
Cov( X , Y ) D ( X ) D (Y )

为随机变量 X 和 Y 的相关系数.有时也记 ? XY 为 ? . 特别地, 当 ? XY ? 0 时, 称 X 与 Y 不相关. 相关系数的性质 1. | ? XY |? 1; 2. 若 X 和 Y 相互独立, 则 ? XY ? 0 .

3. 若 DX ? 0, DY ? 0 ,则 | ? XY |? 1 当且仅当存在常数 a, b(a ? 0). 使 P{Y ? aX ? b} ? 1 , 而且当
a ? 0 时, ? XY ? 1 ;当 a ? 0 时, ? XY ? ?1 .

注: 相关系数 ? XY 刻画了随机变量 Y 与 X 之间的“线性相关”程度. | ? XY | 的值越接近 1, Y 与 X 的线性相关程度越高; | ? XY | 的值越近于 0, Y 与 Y 的线性相关程度越弱.当 | ? XY |? 1 时, Y 与 X
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

33

的变化可完全由 X 的线性函数给出.当 ? XY ? 0 时, Y 与 X 之间不是线性关系. 4. 设 e ? E[Y ? (aX ? b)]2 , 称 为 用 aX ? b 来 近 似 Y 的 均 方 误 差 , 则 有 下 列 结 论 . 设
D( X ) ? 0, D(Y ) ? 0, 则 a0 ?
cov(X , Y ) , b0 ? E (Y ) ? a0 E ( X ) 使均方误差达到最小. D( X )

注:可用均方误差 e 来衡量以 aX ? b 近似表示 Y 的好坏程度, e 值越小表示 aX ? b 与 Y 的近似
2 程度越好.且知最佳的线性近似为 a0 X ? b. 而其余均方误差 e ? D(Y )(1 ? ? XY ) . 从这个侧面也

能说明. | ? XY | 越接近 1, e 越小.反之, | ? XY | 越近于 0, e 就越大.Y 与 X 的线性相关性越小. 四、矩的概念 定义 设 X 和 Y 为随机变量, k , l 为正整数, 称

E( X k ) E([ X ? E( X )]k ) E(| X | ) E(| X ? E( X ) |k ) E( X Y )
k l k

为 k 阶原点矩(简称 k 阶矩阵); 为 k 阶中心矩; 为 k 阶绝对原点矩; 为 k 阶绝对中心矩; 为 X 和 Y 的 k ? l 阶混合矩;

为 X 和 Y 的 k ? l 阶混合中心矩; E{[ X ? E( X )]k [Y ? E(Y )]l } 注: 由定义可见:(1) X 的数学期望 E ( X ) 是 X 的一阶原点矩 ;(2) X 的方差 D ( X ) 是 X 的二 阶中心矩;(3)协方差 Cov( X , Y ) 是 X 和 Y 的二阶混合中心矩. 五、协方差矩阵
c11 ? E{[ X 1 ? E ( X 1 )]2 }, c22 ? E{[ X 2 ? E ( X 2 )]2 },

将二维随机变量 ( X1 , X 2 ) 的四个二阶中心矩 c12 ? E{[ X 1 ? E ( X 1 )][ X 2 ? E ( X 2 )]}, c21 ? E{[ X 2 ? E ( X 2 )][ X 1 ? E ( X 1 )]}.
? c11 c12 ? ? 排成矩阵的形式: ? ,称此矩阵为 ( X 1 , X 2 ) 的协方差矩阵. ?c ? (对称矩阵) ? 21 c22 ?

类似定义 n 维随机变量 ( X 1 , X 2 ,?, X n ) 的协方差矩阵. 若 cij ? Cov( X i , X j ) ? E{[ X i ? E( X i )][ X j ? E( X j )]} i, j ? 1,2, ?, n 都存在, 则称
? c11 c12 ? c ?c C ? ? 21 22 ? ? ? ?c ? n1 cn 2 ? ? ? ? c1n ? ? c2 n ? 为 ( X 1 , X 2 ,?, X n ) 的协方差矩阵. ?? ? cnn ? ?

六、n 维正态分布的概率密度 七、n 维正态分布的几个重要性质 例题选讲: 协方差的性质

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

34

例 1 已知离散型随机向量 ( X , Y ) 的概率分布为,求 cov(X , Y ) . Y 0 2 ?1 X 0 0.1 0.2 0 1 2 0.3 0.15 0.05 0 0.1 0.1

?8 xy, 0 ? x ? y ? 1 例 2 设连续型随机变量 ( X , Y ) 的密度函数为 f ( x, y ) ? ? 其它 ?0,

求 cov(X , Y ) 和 D( X ? Y ) . 相关系数的性质 例 3 设(X,Y)的分布律为 X Y 1 4
P{X ? xi }

?2
0 1/4 1/4

?1
1/4 0 1/4

1 1/4 0 1/4

2 0 1/4 1/4

P{Y ? y j }
1/2 1/2 1

易知 E ( X ) ? 0, E (Y ) ? 5 / 2, E ( XY ) ? 0, 于是 ? XY ? 0, X , Y 不相关. 这表示 X , Y 不存在 线 性 关 系 . 但 P{ X ? ?2, Y ? 1} ? 0 ? P{ X ? ?2}P{Y ? 1}, 知 X , Y 不 是 相 互 独 立 的 .
2 事实上, X 和 Y 具有关系: Y ? X , Y 的值完全可由 X 的值所确定. 例 4 设 ? 服从 [?? , ? ] 上的均匀分布, X ? sin ? , Y ? cos ? 判断 X 与 Y 是否不相关, 是否 独立.

例 5 已知 X ~ N (1,32 ) , Y ~ N (0,4 2 ), 且 X 与 Y 的相关系数 ? XY ? ?
D ( Z ) 及 ? XZ . 例 6 设 ( X , Y ) 服从二维正态分布, 它的概率密度为

1 X Y .设 Z ? ? , 求 2 3 2

f ( x, y ) ?

1 2?? 1? 2

? ? ( x ? ?1 ) 2 ( x ? ?1 )( y ? ? 2 ) ( y ? ? 2 ) 2 ? ? ? ?1 ? exp ? ? 2 ? ? ? ?, 2 ? 2 2 2 ? ? ?2 ? ? ?1 ?? 1 2 1? ? ? ? 2(1 ? ? ) ? ?

求 X 和 Y 的相关系数 ? XY . 注:在上一章中我们已经得到:若 ( X , Y ) 服从二维正态分布, 那么 X 和 Y 相互独立的充 要条件为 ? ? 0 . 现在知道 ? 即为 X 与 Y 的相关系数, 故有下列结论: “若 ( X , Y ) 服从二维正态分布,则 X 与 Y 相互独, 立当且仅当 X 与 Y 不相关”. n 维正态分布的几个重要性质 例 7 设随机变量 X 和 Y 相互独立且 X ~ N (1,2),. Y ~ N (0,1) , 试求 Z ? 2 X ? Y ? 3 的概率密度. 思考题 1. 对不同品牌的某种机械的两项重要指标评分, 设 X1 , X 2 为其所得分数(百分制). 已知

E ( X 1 ) ? 68.9, E ( X 2 ) ? 72.8 ;
分布的综合分 Y ?

D( X 1 ) ? 81, D( X 2 ) ? 49; cov(X 1 , X 2 ) ? 36. 现以服从正态

9 7 X1 ? X 2 来决定各参评品牌的名次.(1) 试求 Y 的分布; (2) 如果对综 16 16 合分 Y ? 85 的品牌颁奖, 试计算获奖者的百分比.

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

35

第五章 大数定理与中心极限定理
概率论与数理统计是研究随机现象统计规律性的学科 . 而随机现象的规律性在相同的 条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面 出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品 率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题. 在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这 种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中, 我们将介绍有关随机变量 序列的最基本的两类极限定理----大数定理和中心极限定理. 【教学目的与要求】 通过学习,使学生了解契比雪夫不等式的定义并会利用其进行概率估算,了解契比雪 夫定理和伯努里定理。理解独立同分布的中心极限定理和棣莫佛-拉普拉斯定理,并会利用 其进行概率近似计算。 【教学重点】 契比雪夫不等式与中心极限定理。 【教学难点】 中心极限定理 【计划课时】3 【教学内容】 一、依概率收敛 与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性. 定义 1 设 X 1 , X 2 ,?, X n ,? 是一个随机变量序列, a 为一个常数,若对于任意给定的正数 ? ,

有 lim P{| X n ? a |? ? } ? 1, 则称序列 X 1 , X 2 , ?, X n , ? 依概率收敛于 a ,
n??
P P P 记为 X n ? ?? a (n ? ?). 定理 1 设 X n ? ?? a, Yn ? ?? b, 又设函数 g ( x, y ) 在点 (a, b) 连续 ,

P 则 g ( X n , Yn ) ? ?? g (a, b) .

二、切比雪夫不等式 定理 2 设随机变量 X 有期望 E ( X ) ? ? 和方差 D( X ) ? ? 2 ,则对于任给 ? ? 0 , 有

P{| X ? ? |? ? } ?

?2 .上述不等式称切比雪夫不等式. ?2

注:(i) 由切比雪夫不等式可以看出,若 ? 2 越小, 则事件 {| X ? E ( X ) |? ? } 的概率越大, 即, 随 机变量 X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度. (ii) 当方差已知时,切比雪夫不等式给出了 X 与它的期望的偏差不小于 ? 的概率的估计

?2 ? 0.111. 故对任给的分布,只要期望和方差 ? 2 2 9? 存在, 则随机变量 X 取值偏离 E ( X ) 超过 3? 的概率小于 0.111.
式.如取 ? ? 3? , 则有 P{| X ? E ( X ) |? 3? } ? 三、大数定理 1.切比雪夫大数定律
36

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

定理 3 (切比雪夫大数定律)设 X 1 , X 2 ,?, X n ,? 是两两不相关的随机变量序列,它们数学期望 和方差均存在, 且方差有共同的上界, 即 D( X i ) ? K , i ? 1,2,?, 则对任意 ? ? 0 , 有

? ? 1 n ?1 n ? lim P? ? X i ? ? E ( X i ) ? ? ? ? 1 n ?? ? n n i ?1 ? ? i ?1 ?
注: 定理表明: 当 n 很大时,随机变量序列 { X n } 的算术平均值 望
1 n ? E( X i ) . n i ?1 1 n ? X i 依概率收敛于其数学期 n i ?1

2.伯努利大数定理 定理 4 (伯努利大数定律)设 nA 是 n 重伯努利试验中事件 A 发生的次数, p 是事件 A 在每次试
?n ? 验中发生的概率, 则对任意的 ? ? 0 , 有 lim P ? A ? p ? ? ? ? 1 或 n?? ? n ? ?n ? lim P? A ? p ? ? ? ? 0 . ? n ?

n??

注:(i) 伯努利大数定律是定理 1 的推论的一种特例, 它表明: 当重复试验次数 n 充分大时,

nA 依概率收敛于事件 A 发生的概率 p .定理以严格的数学形式表达了频 n 率的稳定性. 在实际应用中 , 当试验次数很大时 ,便可以用事件发生的频率来近似代替事件 的概率. (ii) 如果事件 A 的概率很小, 则由伯努利大数定律知事件 A 发生的频率也是很小的, 或者说事件 A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生” ,这一原理 称为小概率原理, 它的实际应用很广泛. 但应注意到, 小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生. 3.辛钦大数定理
事件 A 发生的频率 定理 5 (辛钦大数定律) 设随机变量 X 1 , X 2 ,?, X n ,? 相互独立, 服从同一分布,且具有数学期
?1 n ? 望 E ( X i ) ? ? , i ? 1,2,?, 则对任意 ? ? 0 , 有 lim P? ? X i ? ? ? ? ? ? 1 . n?? ? n i?1 ?

注: (i) 定理不要求随机变量的方差存在; (ii) 伯努利大数定律是辛钦大数定律的特殊情况; (iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计 某地区的平均亩产量, 可收割某些有代表性的地块, 如 n 块,计算其平均亩产量, 则当 n 较大 时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义. 四、中心极限定理 在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一 个因素在总的影响中所起的作用是微小的 . 这类随机变量一般都服从或近似服从正态分布 . 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差 , 瞄准时的误差, 受风速、风向的干扰而造成的误差等 . 其中每一种误差造成的影响在总的影响中所起的作用是微小的 , 并且可以看成是相互独立 的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机 变量和的问题.
37

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许 多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布. 1.林德伯格—勒维定理 定理 6 (林德伯格—勒维) 设 X 1 , X 2 , ?, X n , ? 是独立同分布的随机变量序列, 且

E( X i ) ? ? , D( X i ) ? ? 2 , i ? 1,2,?, n,?
? n ? ? ? X i ? n? ? x 1 ?t 2 / 2 ? ? lim P ? i ?1 ? x? ? ? e dt ? ? 2? n?? ? ? n ? ? ? ? ?



注: 定理 6 表明: 当 n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服 从正态分布. 虽然在一般情况下, 我们很难求出 X 1 ? X 2 ? ? ? X n 的分布的确切形式, 但当 n 很大时, 可求出其近似分布. 由定理结论有 n 1 n ? X i ? n? 近似 ? X i ? ? 近似 n i ?1 1 n i ?1 ~ N (0,1) ? ~ N (0,1) ? X ~ N ( ? , ? 2 / n), X ? ? X i . n i ?1 ? n ?/ n 故 定 理 又 可 表 述 为 : 均 值 为 ? , 方 差 的 ?2 ?0 的 独 立 同 分 布 的 随 机 变 量
X 1 , X 2 ,?, X n ,? 的算术平均值 X , 当 n 充分大时近似地服从均值为 ? ,方差为 ? 2 / n 的正态

分布. 这一结果是数理统计中大样本统计推断的理论基础. 2. 棣莫佛—拉普拉斯定理 在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里 再次给出,并利用上述中心极限定理证明之. 定理 7(棣莫佛—拉普拉斯定理)设随机变量 Yn 服从参数 n, p (0 ? p ? 1) 的二项分布, 则对
t ? ? ? Y ? np ? x 1 ?2 任意 x , 有 lim P? n ? x? ? ? e dt ? ?( x) ? ? 2? n ? ? ? np(1 ? p) ? ? ?
2

注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况. 3.用频率估计概率的误差 设 ? n 为 n 重贝努里试验中事件 A 发生的频率, p 为每次试验中事件 A 发生的概率, q ? 1 ? p, 由
? ?? ? ? 棣莫佛—拉普拉斯定理,有 P ? n ? p ? ? ? ? P ?? ? n ? ? ? ?

? ? np n ? n ?? pq npq

n ? ? ? pq ? ?

? ? ?? ? ? ?

? n ? ? ? ?? ? ? ? pq ? ? ?

? n ? ? ? 2?? ? ? pq ? ? ?

n ? ? ? 1. 此关系式可用解决用频率估计概率的计算问题: pq ? ?

4. 李雅普诺夫定理 定理 8(李雅普诺夫定理) 设随机变量 X 1 , X 2 ,?, X n ,? 相互独立, 它们具有数学期望和方 差: E( X k ) ? ?k , D( X k ) ? ? k2 ? 0, i ? 1,2,?,记 Bn2 ? ? ? k2 . 若存在正数 ? , 使得当 n ? ? 时,
k ?1 n

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

38

1
2?? Bn

? E{| X k ? ? k |2?? } ? 0, 则随机变量之和 ? X k 的标准化变量:
k ?1 k ?1

n

n

Zn ?

?X
k ?1

n

? n ? ? E? ?? Xk ? ? ? k ?1 ?? n ? ? D? ?? Xk ? ? ? k ?1 ?
k

? X ???
k k ?1 k ?1

n

n

k

Bn

的分布函数 Fn ( x) 对于任意 x , 满足

? n X ? n ? x ?k ?1 k ? x? k 1 ?t 2 / 2 ?? ? lim Fn ( x) ? lim P? k ?1 ?? e dt ? ?( x). ? ?? n?? n?? Bn 2? ? ? ? ?

注:定理 8 表明, 在定理的条件下, 随机变量 Z n ?

? X ? ??
k k ?1 k ?1

n

n

k

Bn
n k ?1

.
n

当 n 很大时,近似地服从正态分布 N (0,1) . 由此, 当 n 很大时, ? X k ? Bn Z n ? ? ? k 近似地服
k ?1

? n 2? ? 从正态分布 N ? ? ? ? k , Bn ? .这就是说,无论各个随机变量 X k (k ? 1,2, ?) 服从什么分布,只要满 ? k ?1 ?

足定理的条件,那么它们的和 ? X k 当 n 很大时,就近似地服从正态分布.这就是为什么正态随
k ?1

n

机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示 成很多个独立的随机变量之和,例如,在任一指定时刻 ,一个城市的耗电量是大量用户耗电量 的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往 近似地服从正态分布. 例题选讲: 切比雪夫不等式 例 1 已知正常男性成人血液中, 每一毫升白细胞数平均是 7300, 均方差是 700. 利用切比雪 夫不等式估计每毫升白细胞数在 5200~9400 之间的概率. 例 2 在每次试验中, 事件 A 发生的概率为 0.75, 利用切比雪夫不等式求: 事件 A 出现的频率 在 0.74~0.76 之间的概率至少为 0.90? 切比雪夫大数定律

例 3 设 { X k } 为相互独立的随机变量序列, 且

Xk p

? 2k 1 2 k ?1 2

0 1? 1 2 2k

2k 1 , 2 k ?1 2

k ? 1,2,?

试证 { X k } 服从大数定律. 辛钦大数定理 例 4 设 { X k } 为相互独立且同分布的随机变量序列, 并且 X k 的概率分布为

P{X k ? 2i ? 2 ln i } ? 2?i

(i ? 1,2,?), 试证 { X k } 服从大数定律.

中心极限定理 例 5 在一个罐子中,装有 10 个编号为 0-9 的同样的球,从罐中放回地抽取若干次,每次抽

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

39

?1, 第k次取到号码 0 一个, 并记下号码. 设 X k ? ? , 否则 ?0,

k ? 1,2,?n 问对序列 { X k } 能否应用

大数定律? 例 6 一盒同型号螺丝钉共有 100 个,已知该型号的螺丝钉的重量是一个随机变量,期望值是 100g 标准差是 10g, 一盒螺丝钉的重量超过 10.2kg 的概率. 例 7 一船舶在某海区航行, 已知每遭受一次波浪的冲击, 纵摇角大于 3 ? 的概率为 p ? 1 / 3, 若 船舶遭受了 90000 次波浪冲击,问其中有 29500~30500 次纵摇角度大于 3 ? 的概率是多少? 例 8 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1 名家长, 2 名家长来参加会议的概率分别 0.05, 0.8, 0.15. 若学校共有 400 名学生, 设各学生参 加会议的家长数相互独立, 且服从同一分布.(1)求参加会议的家长数 X 超过 450 的概率; (2)求有 1 名家长来参加会议的学生数不多于 340 的概率. 例 9(供电问题)某车间有 200 台车床, 在生产期间由于需要检修、调换刀具、变换位置及 调换工作等常需停车. 设开工率为 0.6,并设每台车床的工作是独立的, 且在开工时需电力 1 千瓦. 问应供应多少瓦电力就能以 99.9%的概率保证该车间不会因供电不足而影响生产? 例 10 设有 1000 人独立行动, 每个人能够按时进入掩蔽体的概率为 0.9. 以 95%概率估计, 在 一次行动中:(1)至少有多少人能进入掩蔽体;(2)至多有多少人能进入掩蔽体. 例 11 设一大批产品中一级品率为 10%, 现从中任取 500 件.(1) 分别用切比雪夫不等式估计 和中心极限定理计算: 这 500 件中一级品的比例与 10%之差的绝对值小于 2%的概率;(2) 至 少应取多少件才能使一级品的比例与 10%之差的绝对值小于 2%的把握大于 95%? 用频率估计概率的误差 例 12 现从某厂生产的一批同型号电子元件中抽取 395 件, 由于次品率未知,需要通过次品的 相对频率来估计, 这时估计的可靠性大于 95% (1)求绝对误差 ? ; (2)如果样品中有十分之一 是次品, 应对 p 怎样估计? 李雅普诺夫定理 例 13 高尔顿钉板试验如图 4-4-2 是高尔顿钉板, 常常在赌博游戏中见到, 庄家常常在两边放 置值钱的东西来吸引顾客, 现在可用中心极限定理来揭穿这个赌博中的奥秘 .设 n 为钉子的
?1, 第i次碰球后小球从左边落 下 排数, 记随机变量 X i ? ? 易见, X i 服从两点分布: ?? 1 第i次碰球后小球从右边落 下
Xi pi 1
?

?1

1/ 2 1/ 2
i ?1

, E ( X i ) ? 0, D( X i ) ? 1.i ? 1,2, ? 设 Yn 表 示 第 n 次 碰 钉 后 小 球 的 位 置 , 显 然 ,

Yn ? ? X i , 由中心极限定理知 Yn 近似服从正态分布 N (0, n),

E (Yn ) ? 0,

D(Yn ) ? n. 如图

4-4-2, 钉板有 n ? 16 层,则标准差 ? ? 16 ? 4 ,由正态分布的特征, 小球落入中间的概率远远 大于落入两边的概率. 思考题 1. 证明马尔可夫 (Markow) 大数定律:若随机变量序列 X1, X 2 ,?, X n ,? 满足马尔可夫条件:

? ? ? 1 ? n 1 n ?1 n ? ? ? ? ? 0 则 对 任 意 D X ? 0 , n ? ? l i P m X ? ?i ? ? ? ? 1 其 中 ? ? i ? ? i 2 ? ? n ?? ? n n i ?1 n ? i ?1 ? ? ? i ?1 ? ?i ? E ( X i ), i ? 1,2,?. 2. 某地有甲、乙两个电影院竞争当地每天的 1000 名观众, 观众选择电影院是独立的和随机
40

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

的 . 问 : 每个电影院至少应设有多少个座位 , 才能保证观众因缺少座位而离去的概率小于 1%?

第六章
【教学目的与要求】

数理统计的基本概念

通过学习,使学生理解总体、个体、样本和统计量的概念;了解直方图的作法,掌握 2 样本均值和样本方差的计算。理解χ 分布、t 分布、F 分布的定义并会查表计算;掌握正态 总体的某些常用统计量的分布。 【教学重点】 总体、个体、样本和统计量的概念;χ 分布、t 分布、F 分布的定义以及它们密度函 数图形上的 ? 分位点;正态总体的常用统计量的分布。 【教学难点】 χ 分布、t 分布、F 分布密度函数图形上的 ? 分位点。
2 2

【计划课时】2 【主要内容】 从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于 19 世纪 末 20 世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的 数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断. 由于大量随机现象必然呈现出它的规律性 , 故理论上只要对随机现象进行足够多次观 察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象 的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的 数据. 数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料 进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问 题, 本课程主要讲述统计推断的基本内容.

第一节 数理统计的基本概念
一、总体与总体分布 总体是具有一定共性的研究对象的全体 , 其大小与范围随具体研究与考察的目的而确 定. 例如, 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总 体. 总体确定后, 我们称总体的每一个可观察值为个体. 如前述总体(一年级新生) 中的每一 个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称 为有限总体, 容量为无限的称为无限总体. 数理统计中所关心的并非每个个体的所有性质 , 而仅仅是它的某一项或某几项数量指 标. 如前述总体(一年级新生)中, 我们关心的是个体的体重, 进而也可考察该总体中每个个 体的身高和数学高考成绩等数量指标. 总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量 X 的值,于是, 一 个总体对应于一个随机变量 X , 对总体的研究就相当于对一个随机变量 X 的研究, X 的分 布就称为总体的分布函数, 今后将不区分总体与相应的随机变量, 并引入如下定义: 定义 统计学中称随机变量(或向量) X 为总体, 并把随机变量(或向量)的分布称为总体 分布. 注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全 体学生的血型, 试验的结果有 O 型、A 型、B 型、AB 型 4 种, 若分别以 1,2,3,4 依次记这 4 种血型,则试验的结果就可以用数量来表示了; (ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型(如正态分布、 二项分布 2 等),但不知这些分布中所含的参数等(如 ? , ? , p 等).数理统计的任务就是根据总体中部分个 体的数据资料对总体的未知分布进行统计推断.
41

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

二、样本与样本分布 由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一 般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体 X 的一组数 值 ( x1 , x 2 , ?, x n ) ,其中每一 x i 是从总体中抽取的某一个体的数量指标 X i 的观察值.上述抽取 过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进 行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一 个随机变量(或向量).容量为 n 的样本可视为 n 维随机向量 ( X 1 , X 2 ,?, X n ) ,一旦具体取定一 组样本,便得到样本的一次具体的观察值 ( x1 , x2 , ?, xn ) , 称其为样本值.全体样本值组成的集合称为样本空间. 为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方 法称为简单随机抽样, 它要求抽取的样本满足下面两个条件: 1. 代表性: X1 , X 2 , ?, X n 与所考察的总体具有相同的分布; 2. 独立性: X1 , X 2 , ?, X n 是相互独立的随机变量. 由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的 n 个相互 独立的随机变量 X 1 , X 2 ,?, X n 表示. 显然, 简单随机样本是一种非常理想化的样本 , 在实际 应用中要获得严格意义下的简单随机样本并不容易. 对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总体很大时, 无放回抽样与有放回抽样 的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本 . 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本. 注: 今后假定所考虑的样本均为简单随机样本, 简称为样本. 设总体 X 的分布函数为 F ( x) ,则简单随机样本 ( X 1 , X 2 ,?, X n ) 的联合分布函数为
F ( x1 , x2 , ? , xn ) ? ? F ( xi )
i ?1 n

并称其为样本分布. 特别地, 若总体 X 为连续型随机变量,其概率密度为 f ( x) ,则样本的概率密度为
f ( x1 , x2 , ?, xn ) ? ? f ( xi )
i ?1 n

分别称 f ( x) 与 f ( x1 , x2 , ?, xn ) 为总体密度与样本密度. 若总体 X 为离散型随机变量,其概率分布为 p( xi ) ? P{X ? xi } , x 取遍 X 所有可能取值, 则样本的概率分布为
p( x1 , x2 , ?, xn ) ? p{ X ? x1 , X ? x2 , ?, X ? xn } ? ? p( xi ),
i ?1 n

分别称 p( xi ) 与 p( x1, x2 ,?, xn ) 为离散总体密度与离散样本密度. 三、统计推断问题简述 总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而 可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研 究总体可以省时省力 (特别是针对破坏性的抽样试验而言) . 我们称通过总体 X 的一个样本 X 1 , X 2 , ?, X n 对总体 X 的分布进行推断的问题为统计推断问题. 总体、样本、样本值的关系: 总体 ↙ ↖推断 (个体)样本 → 样本值 抽样 在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包
42

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断. 为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将 对相关统计量进行深入的讨论. 四、分组数据统计表和频数直方图 通过观察或试验得到的样本值, 一般是杂乱无章的, 需要进行整理才能从总体上呈现其 统计规律性. 分组数据统计表或频率直方图是两种常用整理方法. 1. 分组数据表: 若样本值较多时, 可将其分成若干组, 分组的区间长度一般取成相等, 称 区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少, 则难以反映出分布的特征, 若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或 组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该 区间的组频数. 组频数与总的样本容量之比称为组频率. 2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下: 设 x1 , x2 , ?, xn 是样本的 n 个观察值. (i) 求出 x1 , x2 , ?, xn 中的最小者 x(1) 和最大者 x ( n ) ; (ii) 选取常数 a(略小于 x(1) ) 和 b(略大于 x ( n ) ) , 并将区间 [a, b] 等分成 m 个小区间 (一 般取 m 使

1 m 在 左右) : 10 n [ti , ti ? ?t ), i ? 1,2,?, m, ?t ? b?a , m

一般情况下,小区间不包括右端点. n ? (iii) 求出组频数 ni ,组频率 i ? fi ,以及 n f hi ? i , (i ? 1,2,?, n) ?t (iv) 在 [ti , ti ? ?t ) 上以 hi 为高, ?t 为宽作小矩形,其面积恰为 f i ,所有小矩形合在一起 就构成了频率直方图 五、经验分布函数 样本的直方图可以形象地描述总体的概率分布的大致形态, 而经验分布函数则可以用来 描述总体分布函数的大致形状。 定义 设总体 X 的一个容量为 n 的样本的样本值 x1 , x2 , ?, xn 可按大小次序排列成

x(1) ? x(2) ? ? ? x(n) . 若x(k ) ? x ? x(k ?1) , 则 不 大 于 x 的 样 本 值 的 频 率 为

k . n

因 而 函 数

?0, 若x ? x (1) , ? ?k Fn ( x) ? ? , 若x ( k ) ? x ? x ( k ?1) , ?n ?1, 若x ? x ( n ) . ? { X ? x } 与事件 在 n 次独立重复试验中的频率是相同的,我们称 Fn ( x) 为经验分布函数。

对于经验分布函数 Fn ( x) , 格里汶科(Glivenko)在 1933 年证明了以下的结果: 对于任一 实数 x, 当 n ? ? 时 Fn ( x) 以概率 1 一致收敛于分布函数 F ( x) , 即
P{ lim sup | Fn ( x) ? F ( x) |? 0} ? 1.
n?? ??? x??

因此, 对于任一实数 x 当 n 充分大时, 经验分布函数的任一个观察值 Fn ( x) 与总体分布函 数 F ( x) 只有微小的差别, 从而在实际中可当作 F ( x) 来使用. 这就是由样本推断总体其可行 性的最基本的理论依据.
43

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

六、统计量 为由样本推断总体,要构造一些合适的统计量, 再由这些统计量来推断未知总体. 这里, 样本的统计量即为样本的函数. 广义地讲, 统计量可以是样本的任一函数, 但由于构造统计 量的目的是为推断未知总体的分布 ,故在构造统计量时 , 就不应包含总体的未知参数 , 为此 引入下列定义. 定义 设 ( X 1 , X 2 ,?, X n ) 为总体 X 的一个样本 , 称此样本的任一不含总体分布未知参 数的函数为该样本的统计量. 七、样本的数字特征 以下设 X1 , X 2 , ?, X n 为总体 X 的一个样本. 1. 样本均值 2. 样本方差 3. 样本标准差
X?
S2 ?

1 n ? Xi n i?1
1 n ? ( X i ? X )2 n ? 1 i ?1

S?

1 n ? ( X i ? X )2 n ? 1 i?1
1 n k ? X i , k ? 1,2,? n i ?1

4. 样本(k 阶)原点矩 Ak ? 5. 样本(k 阶)中心矩 Bk ?

1 n ? ( X i ? X )k , k ? 2,3,? n i ?1

注: 上述五种统计量可统称为矩统计量,简称为样本矩,它们都是样本的显示函数,它们的 观察值仍分别称为样本均值、样本方差、样本标准差、样本(k 阶)原点矩、样本(k 阶)中心矩. 6. 顺序统计量 将样本中的各分量按由小到大的次序排列成 X (1) ? X (2) ? ? ? X (n) , 则称 X (1) , X ( 2) ,?, X ( n) 为样本的一组顺序统计量 , X (i ) 称为样本的第 i 个顺序统计量 . 特别 地, 称 X (1) 与 X ( n ) 分别为样本极小值与样本极大值, 并称 X ( n) ? X (1) 为样本的极差. 例 1 样本的一些例子与观察值的表示方法: (1) 某食品厂用自动装罐机生产净重为 345 克的午餐肉罐头, 由于随机性, 每个罐头的 净重都有差别. 现在从生产线上随机抽取 10 个罐头, 秤其净重, 得如下结果: 344 336 345 342 340 338 344 343 344 343 这是一个容量为 10 的样本的观察值, 它是来自该生产线罐头净重这一总体的一个样本的观 察值. (2) 对某型号的 20 辆汽车记录每加仑汽油各自行驶的里程数(单位:公里)如下: 29.8 27.6 28.3 28.7 27.9 30.1 29.9 28.0 28.7 27.9 28.5 29.5 27.2 26.9 28.4 27.8 28.0 30.0 29.6 29.1 这是一个容量为 20 的样本的观察值, 对应的总体是该型号汽车每加仑汽油行驶的里程. (3) 对 363 个零售商店调查周售额(单位:元)的结果如下:
零售额 ? 1000 (1000,5000] (5000,10000] (10000,20000] (20000,30000] 商店数 61 135 110 42 15

这是一个容量为 363 的样本的观察值, 对应的总体是所有零售店的周零售额. 不过这里没有 给出每一个样品的具体的观察值, 而是给出了样本观察值所在的区间, 称为分组样本的观察 值.这样一来当然会损失一些信息 , 但是在样本量较大时, 这种经过整理的数据更能使人们 对总体有一个大致的印象. 例 2 称总体 X 为正态总体, 如它服从正态分布. 正态总体是统计应用中最常见的总体. 现设总体 X 服从正态分布 N (? , ? 2 ) , 则其样本密度由下式给出:

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

44

n 2 ? ? ? 1 ? 1 n ? 1 ? xi ? ? ? ? ? ? ? ? f ( x1 , x 2 , ? , x n ) ? ? exp ?? ? ? exp ? ( xi ? ? ) 2 ?. ? ? ? ? ? ? ? 2 ? 2 ? ? ? ? ? ? 2? ? ? i ?1 ? 2? ? 2? i ?1 ? ? ? 例 3 称总体 X 为伯努利总体,如果它服从以 p(0 ? p ? 1) 为参数的伯努利分布, 即 P{ X ? 1} ? p, P{ X ? 0} ? 1 ? p. n

1

不难算出其样本 ( X 1 , X 2 , ?, X n ) 的概率分布为

P{X1 ? i1, X 2 ? i2 , ?, X n ? in } ? p sn (1 ? p) sn 其中 ik (1 ? k ? 1) 取 1 或 0, 而 sn ? i1 ? i2 ? ? ? in , 它恰等于样本中取值为 1 的分量之总数. 服 从伯努利分布的总体也具有较广泛的应用背景. 概率 p 通常可视为某实际总体(如工厂的某 一批产品)中具有一特征(如废品)的个体所占的比例, 称为比率. 从总体中随机抽取一个个体, 可视为一个随机试验, 试验结果可用一随机变量 X 来刻画: 若恰好抽到具有该特征的个体, 记 X ? 1 ; 否则, 记 X ? 0 . 这样, X 便服从以 p 为参数的伯努利分布. 通常参数 p 是未知的, 故需通过抽样对其作统计推断. 例 4 设总体 X 服从参数为 ? 的泊松分布, X 1 , X 2 , ?, X n 为其样本, 则样本的概率分 布为 n n ?ik ?? ? sn P{ X 1 ? i1 , X 2 ? i 2 , ? , X n ? i n } ? ? P{ X ? i k } ? ? e ? e ?n? , i1!, i 2 !, ?, i n ! k ?1 k ?1 i k !
其中 ik (1 ? k ? n) 取非负整数, 而 sn ? i1 ? i2 ? ? ? in . 例 5 从某厂生产的某种零件中随机抽取 120 个, 测得其质量(单位: g) 如表 5.1 所示. 列 出分组表, 并作频率直方图. 表 5-1-1
200 202 203 208 216 206 222 213 209 219 216 203 197 208 206 209 206 208 202 203 206 213 218 207 208 202 194 203 213 211 193 213 208 208 204 206 204 206 208 209 213 203 206 207 196 201 208 207 213 208 210 208 211 211 214 220 211 203 216 221 211 218 206 210 211 209 190 217 216 201 218 219 214 204 216 214 211 201 221 211 219 208 212 208 209 211 199 213 209 208 208 214 211 214 209 221 207 212 214 202 211 207 216 199 211 218 214 206 204 207

220 205 206 216 213 206 206 207 200 198

例 6 随机观察总体 X ,得到一个容量为 10 的样本值: 3.2, 2.5, ?2 , 2.5, 0, 3, 2, 2.5, 2, 4 求 X 经验分布函数. 例 7 某厂实行计件工资制, 为及时了解情况,随机抽取 30 名工人, 调查各自在一周内 加工的零件数, 然后按规定算出每名工人的周工资如下: (单位:元) 156 134 160 141 159 141 161 157 171 155 149 144 169 138 168 147 153 156 125 156 135 156 151 155 146 155 157 198 161 151 这便是一个容量为 30 的样本观察值, 其样本均值为: 1 x ? (156 ? 134 ? ? ? 161? 151) ? 153.5 30
45

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

它反映了该厂工人周工资的一般水平. 试计算其样本方差与样本标准差. 例 8 (分组样本均值的近似计算) 如果在例 7 中收集得到的样本观察值用分组样本形 式给出(见表 4.2.1), 此时样本均值可用下面方法近似计算: 以 xi 表示第 i 个组的组中值(即区 间的中点), ni 为第 i 组的频率,
i ? 1,2, , k , ? ni ? n , 则
i ?1 k

x?

1 ? ni xi n i ?1

k

(4.2.3)

表 4.2.1 某厂 30 名工人周平均工资额
周工资额区间 工人数 ni (120,130] (130,140] (140,150] (150,160] (160,170] (170,180] (180,190] (190,200] 合计 1 3 6 14 4 1 0 1 30 组中值 xi 125 135 145 155 165 175 185 195 ni xi 125 405 870 2170 660 175 0 195 4600

则本例中

x?

4600 ? 153.33 30

这与例 4.2.2 的完全样本结果差不多. 注: 在样本容量较大时,给出分组样本是常用的一种方法,虽然会损失一些信息,但对总体 数学期望给出的信息还是十分接近的. 例 9 设我们获得了如下三个样本: 样本 A: 3,4,5,6,7;样本 B: 1,3,5,7,9; 样本 C: 1,5,9 如果将它们画在数轴上(图 5-1-3), 明显可见它们的“分散”程度是不同的: 样本 A 在这 三个样本中比较密集, 而样本 C 比较分散. 这一直觉可以用样本方差来表示. 这三个样本的均值都是 5, 即 x A ? xB ? xC ? 5, 而样 本容量 nA ? 5, nB ? 5, nC ? 3, 从而它们的样本方差分别为: 1 10 2 sA ? [(3 ? 5) 2 ? (4 ? 5) 2 ? (5 ? 5) 2 ? (6 ? 5) 2 ? (7 ? 5) 2 ] ? ? 2.5 5 ?1 4 1 40 2 sB ? [(1 ? 5) 2 ? (3 ? 5) 2 ? (5 ? 5) 2 ? (7 ? 5) 2 ? (9 ? 5) 2 ] ? ? 10 5 ?1 4 1 32 2 sC ? [(1 ? 5)2 ? (5 ? 5)2 ? (9 ? 5)2 ? ? 16 . 3 ?1 2 2 2 2 由此可见 sC ,这与直觉是一致的, 它们反映了取值的分散程度. 由于样本方差 ? sB ? sA 的量纲与样品的量纲不一致, 故常用样本标准差表示分散程度, 这里有 s A ? 1.58, s B ? 3.16, sC ? 4, 同样有 sC ? s B ? s A . 由于样本方差(或样本标准差)很好地反映了总体方差(或标准差)的信息, 因此若当方差

? 未知时, 常用 S 2 去估计, 而总体标准差 ? 常用样本标准差 S 去估计.
2

思考题

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

46

1. 一组工人完成某一装配工序所需的时间(分)分别如下: 35 38 44 33 44 43 48 40 45 30 45 32 42 39 49 37 45 37 36 42 35 41 45 46 34 30 43 37 44 49 36 46 32 36 37 37 45 36 46 42 38 43 34 38 47 35 29 41 40 41 (1) 将上述数据整理成组距为 3 的频数表,第一组以 27 为起点; (2) 绘制样本直方图; (3) 写出经验分布函数.

第二节 常用统计分布
取得总体的样本后, 通常是借助样本的统计量对未知的总体分布进行推断, 为此须进一 步确定相应的统计量所服从的分布, 除在概率论中所提到的常用分布外, 本节还要介绍几个 在统计学中常用的统计分布: t 分布 F 分布 ? 2 分布 一、分位数 设随机变量 X 的分布函数为 F ( x) , 对给定的实数 ? (0 ? ? ? 1), 若实数 F? 满足不等式
P{ X ? F? } ? ? ,

则称 F? 为随机变量 X 的分布的水平 ? 的上侧分位数. 若实数 T? 满足不等式
P{| X |? T? } ? ? ,

则称 T? 为随机变量 X 的分布的水平 ? 的双侧分位数. 二、 ? 2 分布 定义 1 设 X1, X 2 ,?, X n 是取自总体 N (0,1) 的样本, 则称统计量
2 2 ? 2 ? X12 ? X 2 ??? X n

(1)

服从自由度为 n 的 ? 分布,记为 ? ~ ? (n). 这里, 自由度是指(1)式右端所包含的独立变量的个数.
2 2 2

? 2 (n) 分布的概率密度:
n 1 ? ?1 ? x 1 2 2 ? n/2 f ( x) ? ? 2 ?(n / 2) x e , x ? 0. ?0, x?0 ?

其中 ? (?) 为 Gamma 函数, f ( x) 的图形如 5-2-3. 1. ? 2 分布的数学期望与方差: 若 ? 2 ~ ? 2 (n) , 则 E( ? 2 ) ? n, D( ? 2 ) ? 2n. 2. ? 2 分布的可加性:
2 2 2 2 2 ~ ? 2 (n), 且 ?1 若 ?12 ~ ? 2 (m), ? 2 相互独立,则 ?1 ? ?2 ~ ? 2 (m ? n). , ?2

3. ? 2 分布的分位数:
2 设 ? 2 ~ ?? (n) ,对给定的实数 ? (0 ? ? ? 1), 称满足条件
2 P{? 2 ? ?? (n)} ? ? ??
2 ?? ( n)

f ( x)dx ? ?

2 的点 ?? (n) 为 ? 2 (n) 分布的水平 ? 的上侧分位数. 简称为上侧 ? 分位数. 对不同的 ? 与 n, 分 位数的值已经编制成表供查用(参见附表).

三、t 分布
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

47

定义 2 设 X ~ N (0,1), Y ~ ? 2 (n) ,且 X 与 Y 相互独立,则称 X t? Y /n 服从自由度为 n 的 t 分布, 记为 t ~ t (n) , t ( n ) 分布的概率密度:
?[(n ? 1) / 2] ? x 2 ? ?1 ? ? f ( x) ? n ? ?n?(n / 2) ? ? ? t 分布具有如下性质: 1. f ( x) 的图形关于 y 轴对称,且 lim f ( x) ? 0 ;
x ??
? n ?1 2

,?? ? t ? ??

2.当 n 充分大时,t 分布近似于标准正态分布; 3.t 分布的分位数: 设 T ~ t? (n) ,对给定的实数 ? (0 ? ? ? 1), 称满足条件
P{T ? t? (n)} ? ?
t1?? (n) ? ?t? (n).
?? t? ( n )

f ( x)dx ? ?

的 点 t? (n) 为 t ( n ) 分 布 的 水 平 ? 的 上 侧 分 位 数 . 由 密 度 函 数 f ( x) 的 对 称 性 , 可 得 类似地,我们可以给出 t 分布的双侧分位数
P{| T |? t? / 2 (n)} ?

?

?t ? / 2 ( n )

??

f ( x)dx ?

?

??

t ? / 2 (n)

f ( x)dx ? ? ,

显然有

2 对不同的 ? 与 n, t 分布的双侧分位数可从附表查得.
四、F 分布

P{T ? t ? / 2 (n)} ?

?

; P{T ? ?t ? / 2 (n)} ?

?
2

.

定义 3 设 X ~ ? 2 (m), Y ~ ? 2 (n), 且 X 与 Y 相互独立, 则称 X / m nX F? ? Y / n mY 服从自由度为 ( m, n) 的 F 分布, 记为 F ~ F (m, n). F (m, n) 分布的概率密度:
m 1 ? ?1 ? ( m ? n) m ?? m ? 2 ? m ? 2 ? ?[(m ? n) / 2] ? ,x ?0 ? ?? x ? ?1 ? x ? f ( x) ? ? ?(m / 2)?(n / 2) ? n ?? n ? ? n ? ? x?0 ? 0,

F 分布具有如下性质: 1.若 X ~ t (n) ,则 X 2 ~ F (1, n); 1 2.若 F ~ F (m, n), 则 ~ F (n, m). F 3.F 分布的分位数: 设 F ~ F? (n, m) ,对给定的实数 ? (0 ? ? ? 1), 称满足条件

P{F ? F? (n, m)} ?

?

??

F? ( n, m)

f ( x)dx ? ?

的点 F? (n, m) 为 F (n, m) 分布的水平 ? 的上侧分位数. F 分布的上侧分位数的可自附表查得. 4.F 分布的一个重要性质: 1 F? ( m, n) ? . F1?? ( n, m)
48

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

此式常常用来求 F 分布表中没有列出的某些上侧分位数.

分位数
例 1 设 ? ? 0.05 , 求标准正态分布的水平 0.05 的上侧分位数和双侧分位数.

? 2 分布
例 2 设 X 1 , ?, X 6 是来自总体 N (0,1) 的样本, 又设

Y ? ( X1 ? X 2 ? X 3 ) 2 ? ( X 4 ? X 5 ? X 6 ) 2
试求常数 C, 使 CY 服从 ? 2 分布. t 分布 例 3 设随机变量 X ~ N (2,1) , 随机变量 Y1 , Y2 , Y3 , Y4 均服从 N (0,4) , 且 X , Yi (i ? 1,2,3,4) 都 相互独立, 令 4( X ? 2) T? ,

?Y
i ?1

4

i

2

试求 T 的分布, 并确定 t 0 的值, 使 P{| T |? t 0 } ? 0.01. F 分布 例 4 设总体 X 服从标准正态分布, X 1 , X 2 , ?, X n 是来自总体 X 的一个简单随机样本, 试 问统计量 5 ?n ? 5 Y ? ? ? 1? ? X i2 ? X i2 , n ? 5 ? 5 ? i ?1 i ?1 服从何种分布? 思考题 1.设 X1, X 2 , X 3 , X 4 , X 5 是来自正态总体 N (0,22 ) 的样本. C ( X1 ? X 2 ) (1) 求 C 使统计量 Y1 ? 服从 t (m) 分布. 2 2 2 X3 ? X4 ? X5 (3) 求 Y2 ?
( X1 ? X 2 )2 所服从的分布. ( X 4 ? X 3 )2

第三节 抽样分布
一、抽样分布 有时, 总体分布的类型虽然已知 , 但其中含有未知参数 ,此时需对总体的未知参数或对 总体的重要数字特征(如数学期望、分差等) 进行统计推断, 此类问题称为参数统计推断.在 参数统计推断问题中, 常需利用总体的样本构造出合适的统计量, 并使其服从或渐近地服从 已知的总体分布. 统计学中泛称统计量分布为抽样分布. 讨论抽样分布的途径有两个. 一是精确地求出抽样分布, 并称相应的统计推断为小样本 统计推断; 另一种方式是让样本容量趋于无穷, 并求出轴样分布的极限分布.然后,在样本容 量充分大时, 再利用该极限分布作为抽样分布的近似分布 , 进而对未知参数进行统计推断, 称与此相应的统计推断为大样本统计推断. 这里重点讨论正态总体的抽样分布, 属小样本统 计范畴;此外, 也简要介绍一般总体的某些抽样分布的极限分布, 属大样本统计范畴。 二、单正态总体的抽样分布 设总体 X 的均值 ? ,方差为 ? 2 , X1 , X 2 , ?, X n 是取自 X 的一个样本, X 与 S 2 分别为该样 本的样本均值与样本方差, 则有

E( X ) ? ? , D( X ) ? ? 2 ,

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

49

? 1 ? n 2 ?? ? ? X i ? nX 2 ?? E (S 2 ) ? E ? ? ? ? ?? ? n ? 1 ? i ?1 ? n 1 ? 1 ?n 2 2 ? 2 2 2 2 ? 2 ? ?? E ( X i ) ? nE( X )? ? ?? (? ? ? ) ? n(? / n ? ? )? ? ? . n ? 1 ? i ?1 n ? 1 ? ? i ?1 ? 故有下列定理: 定理 1 设总体 X ~ N (?, ? 2 ), X 1 , X 2 ,?, X n 是取自 X 的一个样本, X 与 S 2 分别为该样 本的样本均值与样本方差, 则有
而 (1) X ~ N (? , ? 2 / n) ; (2) U ?
X ?? ~ N (0,1). ?/ n

定理 2 设总体 X ~ N (?, ? 2 ), X 1 , X 2 ,?, X n 是取自 X 的一个样本, X 与 S 2 分别为该样 本的样本均值与样本方差, 则有 (1) ? 2 =

n ?1

?2

S2 ?

1

?2

?(Xi
i ?1

n

? X ) 2 ~ ? 2 (n ? 1);

(2) X 与 S 2 相互独立. 定理 3 设总体 X ~ N (?, ? 2 ), X 1 , X 2 ,?, X n 是取自 X 的一个 样本, X 与 S 2 分别为该样本的样本均值与样本方差, 则有 (1) ? 2 ? (2) T ?
1

?

2

?(X
i ?1

n

i

? ? ) 2 ~ ? 2 (n)

X ?? S/ n

~ t (n ? 1).

三、双正态总体的抽样分布 2 定 理 4 设 X ~ N (?1 , ? 12 ) 与 Y ~ N (?2 , ? 2 ) 是两个相互独立的正态总体, 又设

X 1 , X 2 ,?, X n 是 取 自 总 体 X 的 样 本 , X 与 S12 分 别 为 该 样 本 的 样 本 均 值 与 样 本 方 差 .
1

2 分别为此样本的样本均值与样本方差. 再记 S w 2 是 Y1 , Y2 ,?, Yn 是取自总体 Y 的样本, Y 与 S2
2

2 的加权平均, S12 与 S2


Sw2 ?
2 (n1 ? 1) S12 ? (n2 ? 1) S 2 . n1 ? n2 ? 2

则 (1) U ?

( X ? Y ) ? ( ?1 ? ? 2 )
2 ? 12 / n1 ? ? 2 / n2
2

~ N (0,1);

? ? 2 ? S12 (2) F ? ? ?? ? ? 2 ~ F (n1 ? 1, n2 ? 1); ? 1 ? S2 ( X ? Y ) ? ( ?1 ? ? 2 ) 2 2 ~ t (n1 ? n2 ? 2). (3) 当 ? 1 ??2 ? ? 2 时, T ? S w 1 / n1 ? 1 / n2
四、一般总体抽样分布的极限分布 定义 1 设 Fn ( x) 为随机变量 X n 的分布函数, F ( x) 为随机变量 X 的分布函数,并记 C ( F ) 为由 F ( x) 的全体连续点组成的集合, 若

limFn ( x) ? F ( x), ?x ? C(F ),
n??

则称随机变量 X n 依分布收敛于 X, 简记为
d d Xn ? ?? X 或 Fn ( x) ? ?? F ( x) .

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

50

命题

设随机变量 X 有连续的分布函数,且有 d P Xn ? ?? X , Yn ? ?? 1,

d 则 X nYn ? ?? X.

定理 5 设 X1 , X 2 , ?, X n 为总体 X 的样本,并设总体 X 的数学期望与方差均存在, 记为

EX ? ?; DX ? ? 2 . 记统计量

?/ n S/ n 其中 X 与 S 分别表示上述样本的样本均值与样本方差,则有
d (1)FUn ( x) ? ?? ? 0 ( x), d (2)FTn ( x) ? ?? ? 0 ( x),

Un ?

X ??

, Tn ?

X ??

,

以上 FUn ( x) , FTn ( x) 与 ? ( x) 分别表示 U n , Tn 与标准正态分布的分布函数. 注: 定理 4 成立的条件只是总体的方差存在,这样当样本的容量 n 充分大时,U n和Tn 都近似地服从标准正态分布,因此在 ? 2 已知时,可用 U n 对 ? 进行统计推断;在 ? 2 未知时, 可用 Tn 对 ? 进行统计推断。

单正态总体的抽样分布
例 1 设 X ~ N (21,22 ), X1, X 2 ,?, X 25 为 X 的一个样本,求: (1) 样本均值 X 的数学期望与方差; (2) P{| X ? 21|? 0.24}. 例 2 假设某物体的实际重量为 ? , 但它是未知的. 现在用一架天平去称它, 共称了 n 次, 得到 X 1 , X 2 , ?, X n . 假设每次称量过程彼此独立且没有系统误差, 则可以认为这些测量值都 服从正态分布 N (? , ? 2 ) , 方差 ? 2 反映了天平及测量过程的总精度, 通常我们用样本均值 X

? ?2? ? 3? 去估计 ? , 根据定理 1, X ~ N ? ? ? , n ?. 再从正态分布的 性质知 ? ? ? 3? ? P ?| X ? ? |? ? ? 99.7%. n? ?
这就是说, 我们的估计值 X 与真值 ? 的偏差不超过 3? / n 的概率为 99.7%,并且随着称量次 数 n 的增加, 这个偏差界限 3? / n 愈来愈小. 例如若 ? ? 0.1, n ? 10 . 则
? 3 ? 0.1? P ?| X ? ? |? ? ? P{| X ? ? |? 0.09} ? 99.7%, 10 ? ? 于是我们以 99.7%的概率断言, X 与物体真正重量 ? 的偏差不超过 0.09.如果将称量次数 n

增加到 100, 则
? 3 ? 0.1? P ?| X ? ? |? ? ? P{| X ? ? |? 0.03} ? 99.7%. 100 ? ? 这时,我们以同样的概率断言, X 与物体真正重量 ? 的偏差不超过 0.03. 例 3 在设计导弹发射装置时, 重要事情之一是研究弹着点偏离目标中心的距离的方差.

对 于 一 类 导 弹 发 射 装 置 , 弹 着 点 偏 离 目 标 中 心 的 距 离 服 从 正 态 分 布 N (? , ? 2 ) , 这 里

? 2 ? 100米2 , 现在进行了 25 次发射试验, 用 S 2 记这 25 次试验中弹着点偏离目标中心的距
离的样本方差. 试求 S 2 超过 50 米 2 的概率. 例 4 从正态总体 N (? ,0.52 ) 中抽取容量为 10 的样本 X1 , X 2 ,?, X10 . X 是样本的均值. 若 ? 未知, 计算概率

? 10 ? ? 10 ? P?? ( X i ? ? ) 2 ? 1.68? 与 P?? ( X i ? X ) 2 ? 2.85? . ? i?1 ? ? i?1 ?
-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

51

双正态总体的抽样分布 例 5 从正态总体 X ~ N (? , ? 2 ) 中抽取容量为 16 的一个样本, X , S 2 分别为样本的均值和 方差. 若 ? , ? 2 均未知, 求 S 2 的方差 DS 及概率:
2

?S2 ? ?? 2 ? 1 16 (1) P ? 2 ? 2.041? ; (2) P? ? ? ( X i ? X ) 2 ? 2? 2 ? ?? ? ? 2 16 i ?1 ? 2 16 ?? ? 1 (3) P? ? ? ( X i ? ? ) 2 ? 2? 2 ? . ? 2 16 i ?1 ?
例 6 设两个总体 X 与 Y 都服从正态分布 N (20,3) ,今从总体 X 与 Y 中分别抽得容量
n1 ? 10, n2 ? 15 的两个相互独立的样本, 求 P{| X ? Y |? 0.3}.

例 7 设总体 X 和 Y 相互独立且都服从正态分布 N (30,32 ); X 1 ,?, X 20 ; Y1 ,?, Y25 分别
2 2 来自总体 X 和 Y 的样本, X , Y , S12 和 S2 分别是这两个样均值和方差. 求 P{S12 / S2 ? 0.4}.

思考题: 1. 设 X1, X 2 ,?, X15 为正态总体 N (0,32 ) 的一个样本, X 为样本均值, 求:
15 ? ? P?36.65 ? ? ( X i ? X ) 2 ? 235?. i ?1 ? ?

2. 设 X 1 , X 2 , ?, X n 为总体 X ~ N (? , ? 2 ) 的一个样本, X 和 S 2 为样本均值和样本方差. 又设新增加一个试验量 X n ?1, X n ?1 与 X 1 , ?, X n 也相互独立, 求统计量
U? X n ?1 ? X S n n ?1

的分布. 参考资料: 《概率论与数理统计》 韩旭里等编著 复旦大学出版社 《概率论与数理统计》 吴赣昌编著 人民大学出版社

-6weldform apcIyvu;zkqC7BxSjDT0 : 行 执 照 遵 货 供 、 位 单 施 各 请 求 要 下 如 本 对 针 特 部 踪 跟 ,我 作 工 计 审 算 结 的 目 项 地 基 发 所 究 研 学 科 通 交 省 东 山 好 搞 stnghi()1.52b43为

52


相关文档

概率论与数理统计教案32课时
概率论与数理统计教案
《概率论与数理统计》教案-第12.4节
概率论与数理统计表式教案
概率论与数理统计教案1
概率论与数理统计 7-1点估计教案
概率论与数理统计教案4
《概率论与数理统计》教案-第12.3.2节
《概率论与数理统计》教案-第12.1节
《概率论与数理统计》教案-第12.5节
学霸百科
新词新语
电脑版 | 学霸百科