7.3 区间估计 iterval etimate. 在点估计的基础上, 给出总体参数估计的一个区间范围, 该区间由点估计量加减估计误差而构成 估计误差 区间半径 置信区间 样本统计量 点估计 置信下限 置信上限 06/0/8 8
. 包含总体参数的区间是一个随机区间 它有两个方面的含义一是估计误差大小二是估计误差发生的可能性大小 3. 估计误差发生的可能性大小是根据点估计量的抽样分布来确定的 比如, 某班级平均分数在 75~85 之间, 概率是 95% 06/0/8 9
区间估计的图示 z S S -.58S -.65S +.65S +.58S -.96S +.96S 90% 的样本 95% 的样本 99% 的样本 06/0/8 0
置信区间的定义 设 是一个待估参数, 给定 0, 若由样本 X,X, X 确定的两个统计量 θ θ X X X,,, θ θ X X X,,, θ θ 满足 P{ θ θ θ} α 则称区间 θθ, 是的置信水平 置信度 为 的置信区间. θ 和 θ 分别称为置信下限和置信上限.
关于定义的说明.,,,, 是随机的而区间没有随机性虽然未知但它是一个常数被估计的参数 : },,,,,, { 的本质是因此定义中下表达式 X X X X X X P.,,, 的概率落入随机区间以而不能说参数的真值的概率包含着参数以随机区间
另外定义中的表达式 P{ X, X,, X X, X,, X } 还可以描述为 : 若反复抽样多次 各次得到的样本容量相等, 都是 每个样本值确定一个区间,, 每个这样的区间或包含 的真值或不包含 的真值, 按伯努利大数定理, 在这样多的区间中, 包含 真值的约占 00 %, 不包含的约占 00 %.
区间估计的基本要求. 估计的精确度 指对估计误差的要求 表现为置信区间越短越好. 估计的置信程度 指置信区间包含被估参数的可靠程度 表现为置信区间越长越好 3. 区间估计的矛盾 估计的精确度与置信程度反向变化 4. 解决矛盾的方法 ------ Neyma 原则 即在保证置信度的前提下, 尽可能提高估计的精确度 06/0/8 4
区间估计时应考虑的一些具体问题 在对总体参数进行区间估计时, 常常 需要考虑 :. 总体是否为正态总体. 总体方差 均值 是否已知 3. 用于构造统计量的样本是大样本? 还是小样本? 4. 两总体时, 两样本是否独立? 等情况 06/0/8 5
一个总体参数的区间估计. 总体均值的区间估计. 总体比例的区间估计 3. 总体方差的区间估计 06/0/8 6
总体参数符号表示样本统计量 均值 比例 方差 06/0/8 7
总体均值的区间估计 正态总体 已知, 或非正态总体 大样本 06/0/8 8
总体均值的区间估计 含大样本情形. 假定条件 总体服从正态分布, 且方差 已知 如果不是正态分布, 可由正态分布来近似 30. 使用正态分布统计量 z z ~ N0, 3. 总体均值 在 - 置信水平下的置信区间为 z 或 z 未知 06/0/8 9
总体均值的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主, 为对食品质量进行监测, 企业质检部门经常要进行抽检, 以分析每袋重量是否符合要求 现从某天生产的一批食品中随机抽取了 5 袋, 测得每袋重量如下表所示 已知产品重量的分布服从正态分布, 且总体标准差为 0g 试估计该批产品平均重量的置信区间, 置信水平为 95% 5 袋食品的重量.5 0.0 03.0 0.0 00.5 0.6 07.5 95.0 08.8 5.6 00.0 3.5 0.0 0.6 0. 6.6 95.4 97.8 08.6 05.0 36.8 0.8 0.5 98.4 93.3 06/0/8 30
解 : 已知 X~N,0,=5, - = 95%,z / =.96 根据样本数据计算得: 05.36 由于是正态总体, 且方差已知 总体均值 在 - 置信水平下的置信区间为 0 z 05.36.96 5 05.36 3.9 0.44,09.8 该食品平均重量的置信区间为 0.44g~09.8g 06/0/8 3
总体均值的区间估计 例题分析 例 一家保险公司收集到由 36 个投保人组成的随机样本, 得到每个投保人的年龄 单位 : 周岁 数据如下表 试建立投保人年龄 90% 的置信区间 36 个投保人年龄的数据 3 35 39 7 36 44 36 4 46 43 3 33 4 53 45 54 47 4 34 8 39 36 44 40 39 49 38 34 48 50 34 39 45 48 45 3 06/0/8 3
解 : 已知 =36, - = 90%,z / =.645 根据样本数据计算得 :, 总体均值 在 - 置信水平下的置信区间为 z 39.5 7. 77 39.5.645 39.5.3 37.37,4.63 7.77 36 投保人平均年龄的置信区间为 37.37 岁 ~4.63 岁 06/0/8 33
总体均值的区间估计 正态总体 未知 小样本 06/0/8 34
总体均值的区间估计 小样本. 假定条件 总体服从正态分布, 但方差 未知且小样本 < 30. 使用 t 分布统计量 t ~ t 3. 总体均值 在 - 置信水平下的置信区间为 t 06/0/8 35
总体均值的区间估计 小样本例题分析 例 已知某种灯泡的寿命服从正态分布, 现从一批灯泡中随机抽取 6 只, 测得其使用寿命 单位 :h 如下 建立该批灯泡平均使用寿命 95% 的置信区间 6 只灯泡使用寿命数据 50 50 480 500 450 480 50 50 480 490 530 50 460 460 470 470 06/0/8 36
解 : 已知 X~N,,=6, - = 95%,t / =.3 根据样本数据计算得 : 490, 4. 77 总体均值 在 - 置信水平下的置信区间为 t 490 490 3..3 476.8,503. 4.77 6 该种灯泡平均使用寿命的置信区间为 476.8h~ 503.h 06/0/8 37
总体比例的区间估计 非正态总体 大样本 06/0/8 38
总体比例的区间估计. 假定条件 总体服从二项分布, 大样本下可以由正态分布来近似. 使用正态分布统计量 z z ~ N0, 3. 总体比例 在 - 置信水平下的置信区间为 z - 06/0/8 39
总体比例的区间估计 大样本例题分析 例 某城市想要估计下岗职工中女性所占的比例, 随机地抽取了 00 名下岗职工, 其中 65 人为女性职工 试以 95% 的置信水平估计该城市下岗职工中女性比例的置信区间 解 : 已知 =00,=65%, - =95%, z / =.96 z 65%.96 65% 9.35% 65% 65% 00 55.65%,74.35% 该城市下岗职工中女性比例的置信区间为 55.65%~74.35% 06/0/8 40
总体方差的区间估计 06/0/8 4
06/0/8 4 总体方差的区间估计. 估计一个总体的方差. 假设总体服从正态分布且总体均值 μ 未知 3. 总体方差 的点估计量为, 且 4. 总体方差在 - 置信水平下的置信区间为 ~ ~
总体方差的区间估计 图示 总体方差的 的置信区间 自由度为 - 的 06/0/8 43
总体方差的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主, 现从某天生产的一批食品中随机抽取了 5 袋, 测得每袋重量如下表所示 已知产品重量的分布服从正态分布 以 95% 的置信水平建立该种食品重量方差的置信区间 5 袋食品的重量.5 0.0 03.0 0.0 00.5 0.6 07.5 95.0 08.8 5.6 00.0 3.5 0.0 0.6 0. 6.6 95.4 97.8 08.6 05.0 36.8 0.8 0.5 98.4 93.3 06/0/8 44
解 : 已知 =5,-=95%, 根据样本数据计算得 =93. 0.054 39.364 置信度为 95% 的置信区间为 5 93. 5 39.364 56.83 80.39 0.9754.40 93..40 该企业生产的食品总体重量标准差的的置信区间为 7.54g~3.43g 06/0/8 45
一个总体参数的区间估计 小结 待估参数 均值比例方差 大样本小样本大样本 μ 未知 已知 已知 Z 分布 分布 Z 分布 未知 Z 分布 未知 Z 分布 t 分布 06/0/8 46
两个总体参数的区间估计. 两个总体均值之差的区间估计. 两个总体比例之差的区间估计 3. 两个总体方差之比的区间估计 06/0/8 47
两个总体参数的区间估计 总体参数符号表示样本统计量 均值差比例差 方差比 06/0/8 48
两个总体均值之差的区间估计 独立 已知 或独立 未知 大样本 06/0/8 49
06/0/8 50 两个总体均值之差的估计 独立 已知或独立 未知 大样本. 假定条件 两个总体都服从正态分布, 已知或不是正态分布, 但 30 和 30, 可以用正态分布来近似 两个样本是独立的随机样本. 使用正态分布统计量 z 0, ~ N z 0, ~ N z
06/0/8 5., 已知时, 两个总体均值之差 - 在 - 置信水平下的置信区间为 z z z z. 未知时, 两个总体均值之差 - 在 - 置信水平下的置信区间为
两个总体均值之差的估计 例题分析 例 某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差, 为此在两所中学独立抽取两个随机样本, 有关数据如右表 建立两所中学高考英语平均分数之差 95% 的置信区间 两个样本的有关数据 中学 中学 =46 =33 86 78 S =5.8 S =7. 06/0/8 5
06/0/8 53 解 : 两个总体均值之差在 - 置信水平下的置信区间为两所中学高考英语平均分数之差的置信区间为 5.03 分 ~0.97 分 5.03,0.97.97 8 33 7. 46 5.8.96 78 86 z 5.03,0.97.97 8 33 7. 46 5.8.96 78 86 z
两个总体均值之差的区间估计 独立 小样本 06/0/8 54
06/0/8 55 两个总体均值之差的估计 小样本 :. 假定条件 两个总体都服从正态分布 两个总体方差未知但相等 : = 两个独立的小样本 <30 和 <30. 总体方差的合并估计量 3. 估计量 - 的抽样标准差
06/0/8 56 4. 两个样本均值之差的标准化 ~ t t ~ t t 5. 两个总体均值之差 - 在 - 置信水平下的置信区间为 t t
两个总体均值之差的估计 例题分析 例 为估计两种方法组装产品所需时间的差异, 分别对两种不同的组装方法各随机安排 名工人, 每个工人组装一件产品所需的时间 单位 :mi 下如表 假定两种方法组装产品的时间服从正态分布, 且方差相等 试以 95% 的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间 方法 方法 8.3 36.0 7.6 3.7 30. 37.. 6.0 9.0 38.5 3.0 3.0 37.6 34.4 33.8 3. 3. 8.0 0.0 33.4 8.8 30.0 30. 6.5 06/0/8 57
解 : 根据样本数据计算得 3.5 5. 996 8. 8 9. 358 总体方差的合并估计量为 5.996 9.358 7.677 3.5 8.8.0739 7.677 3.7 3.56 两种方法组装产品所需平均时间之差的置信区间为 0.4mi~7.6mi 06/0/8 58
06/0/8 59 两个总体均值之差的估计 小样本 :. 假定条件 两个总体都服从正态分布 两个总体方差未知且不相等 : 两个独立的小样本 <30 和 <30. 使用统计量 ~ v t t ~ v t t
06/0/8 60 两个总体均值之差 - 在 - 置信水平下的置信区间为 v t v t v v 自由度
两个总体均值之差的估计 例题分析 例 沿用前例 假定第一种方法随机安排 名工人, 第二种方法随机安排 8 名工人, 即 =, =8, 所得的有关数据如表 假定两种方法组装产品的时间服从正态分布, 且方差不相等 以 95% 的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间 方法 方法 8.3 36.0 7.6 3.7 30. 37.. 6.5 9.0 38.5 3.0 37.6 34.4 33.8 3. 8.0 0.0 8.8 30.0 30. 06/0/8 6
解 : 根据样本数据计算得 3.5 5. 996 7. 875 3. 04 自由度为 v 5.996 5.996 3.04 8 3.04 8 8 3.88 3 5.996 3.04 3.5 7.875.604 4.65 4.433 433 8 两种方法组装产品所需平均时间之差的置信区间为 0.9mi~9.058mi 06/0/8 6
两个总体均值之差的区间估计 匹配样本 06/0/8 63
. 假定条件 两个总体均值之差的估计 匹配大样本 两个匹配的大样本 30 和 30 两个总体各观察值的配对差服从正态分布. 两个总体均值之差 d = - 在 - 置信水平下的置信区间为 d z d 对应差值的均值 对应差值的标准差 06/0/8 64
. 假定条件 两个总体均值之差的估计 匹配小样本 两个匹配的小样本 <30 和 < 30 两个总体各观察值的配对差服从正态分布 两个总体各观察值的配对差的方差未知. 两个总体均值之差 d = - 在 - 置信水平下的置信区间为 d t d 06/0/8 65
例 由 0 名学生组成一个随机样本, 让他们分别采用 A 和 B 两套试卷进行测试, 结果如右表 试建立两种试卷分数之差 d = - 95% 的置信区间 两个总体均值之差的估计 例题分析 0 名学生两套试卷的得分 学生编号试卷 A 试卷 B 差值 d 78 7 7 63 44 9 3 7 6 4 89 84 5 6 9 74 7 5 49 5-7 68 55 3 8 76 60 6 9 85 77 8 0 55 39 6 06/0/8 66
06/0/8 67 解 : 根据样本数据计算得两种试卷所产生的分数之差的置信区间为 6.33 分 ~5.67 分 0 0 d i i d d 0 0 d i i d d 53 6. d i i d d d 53 6. d i i d d d 4.67 0 6.53.6 t d d 4.67 0 6.53.6 t d d
两个总体比例之差区间的估计 大样本 06/0/8 68
06/0/8 69 两个总体比例之差的区间估计 大样本. 假定条件 两个总体服从二项分布 可以用正态分布来近似 两个样本是独立的. 两个总体比例之差 - 在 - 置信水平下的置信区间为 z z
两个总体比例之差的估计 例题分析 例 在某个电视节目的收视率调查中, 农村随机调查了 400 人, 有 3% 的人收看了该节目 ; 城市随机调查了 500 人, 有 45% 的人收看了该节目 试以 95% 的置信水平估计城市与农村收视率差别的置信区间 06/0/8 70
解 : 已知 =500, =400, =45%, =3%, - =95%, z / =.96 - 置信度为 95% 的置信区间为 45% 45% 45% 3%.96 500 3% 6.3% 6.68%, 9.3% 3% 400 3% 城市与农村收视率差值的置信区间为 6.68%~9.3% 06/0/8 7
两个总体方差比的区间估计 06/0/8 7
06/0/8 73 两个总体方差比的区间估计. 比较两个总体的方差大小. 用两个样本的方差比来判断 如果 S / S 接近于, 说明两个总体方差很接近 如果 S / S 远离, 说明两个总体方差之间存在差异 3. 总体方差比在 - 置信水平下的置信区间为 F F F F,, F F,, F F
两个总体方差比的区间估计 图示 总体方差比的 的置信区间 F 方差比置信区间示意图 F 06/0/8 74 F
两个总体方差之比的区间估计 例题分析 例 为了研究男女学生在生活费支出 单位 : 元 上的差异, 在某大学各随机抽取 5 名男学生和 5 名女学生, 得到下面的结果 男学生 : 60 50 80 女学生 : 480 试以 90% 置信水平估计男女学生生活费支出方差比的置信区间 06/0/8 75
解 : 根据自由度 =5-=4, =5-=4, 查得 F / 4=.98, F -/ 4=/.98=0.505 / 置信度为 90% 的置信区间为 60 80.98 60 80 0.505 男女学生生活费支出方差比的置信区间为 0.47~.84 06/0/8 76
两个总体参数的区间估计 小结 待估参数 均值差比例差方差比 独立大样本独立小样本匹配样本独立大样本 F 分布 已 正态总体 t 分布 Z 分布 Z 分布 已知 未知 未 Z 分布 = Z 分布 06/0/8 t 分布 t 分布 77