第五章 数理统计中的统计量 及其分布
随机样本 统计量 三大抽样分布 正态总体下常用统计量的一些重要结论 数理统计 以概率论为基础 主要研究如何收集 整理和分析实际问题的数据 有限的资源 以便对所研究的问题作出有效的 精确而可靠 推断 基础 概率论 功能 处理数据 目的 作出科学推断 就概率特征
总体与随机样本 总体 研究对象的某项数量指标值的全体 记作 Y 个体 总体中每个研究对象 元素. 例如 要研究华理全体男生的身高 总体 研究某批灯泡的质量 总体 考察国产轿车的质量 总体可以用一个随机变量 及其分布来描述
样本 : 在总体中抽取若干个有代表性的个体 样本容量 : 样本中所含个体的数目 代表性 : 样本的每个分量 与总体 有相同的 分布函数 ; 独立性 : 满足以上条件的样本 为相互独立的随机变量 称为来自总体 的容量为 的一个简单随机样本 简称样本 样本的一次具体实现 x x x 称为样本观测值 样本二重性 : 既是随机变量 抽样前 又是数 抽样后
若总体 设 P { x } 则 是离散型随机变量 概 为来自总体 的一组样本 则 率分布为 的联合概率分布为 x x x} P{ x } P{ 若总体 是连续型随机变量 概 则 的联合概率密度为 p x x x p x 3 若总体 的分布函数为 F x 则 的联合分布函数为 x x F x F x 率密度为 p x
统计量 定义. 设 若其满足两条要求 : 注意 : 为总体的样本 称 T 为统计量 T 为样本的函数 即 T T = ; T 的表达式中不含有任何未知参数 统计量是随机变量. 是否统计量?. 对于样本提供的信息要进行提炼. 样本的函数中不包含任何未知参数 是为了推断的可行性 3. 统计量 与后面的 枢轴量 不同
常用的统计量. 样本均值 :. 样本方差 : 有的书中定义为 :
3. 样本标准差 : 4. 样本 k 阶原点矩 : 5 样本 k 阶中心矩 k B k k A B. k A k k k 可见
6. 样本中位数 : 为偶数为奇数 M e Δ 7. 极差 : R Δ m max 与第二章中描述统计中不同的是这里强调了 随机性 例如对应于 随机的 样本均值 Δ 强调概率分布 第二章中所给出的 x x 可以认为是样本观测值的平均 注重数值
使用计算器计算统计量的值 使用 ECEL 计算统计量的值 样本均值 AVERAGE 样本方差 VAR 样本标准差 TDEV 菜单中的 工具 \ 数据分析 \ 描述统计 详见 P37 例. 已知样本观测值为 5.84.4.57.4 3.0.87.99..08.56.4.6 计算样本平均值 样本方差
总体 描述 随机抽样 样本 作出推断 统计量
统计量的分布叫抽样分布 除正态分布外 最著名的就是 c 分布 t 分布 与 F 分布 它们被称为数理统计中的 三大抽样分布. c 分布 卡方分布 构造定理 : 设随机变量 相互独立 并且都服从标准正态分布 N 0 则随机变量 c 3. 三大抽样分布 服从自由度为 的 c 分布 记为 自由度 独立随机变量的个数 c 分布的密度函数 : p x x 0 e x c x x 0 0
c 分布的性质 px 的性质 : x 时 p x 增加时 分布分散 不确定性增加 3 分布 E 相同 若 ~ N 0 则 ~ c 0 时 c 与指数 可加性设 c ~ c ~ 则 ~ c 3 设 ~ c 则 E= D= 且 相互独立
c 分布的分位点 0 定义 : 对于给定的正数 称满足条件 P{ c } c c 的点 c 为的 下 分位数或 临界值 表 7 c 分布的临界值 P. 3
. t 分布 学生分布 构造定理 : 设随机变量 与 Y 相互独立 并且 ~ N 0 Y ~ c 则随机变量 T 服从自由度为 的 t 分布 记为 t Y 密度函数 : p x x
px 的性质 : x 时 p x 0 x 0时 p x 取到最大值 3 p x 关于 x 0 对称 4 时 p x e 标准正态 x
t 分布的分位点定义 : 对于给定的正数 0 称满足条件 P {T t } 的点 t 为的 分位数 性质 : t t 0.05 0. 95 0. 85 0 t t0.050.85. 表 6 t分布的临界值 P. 3 同理 标准正态分布的分位点 z t P {z } 的点 z 为标准正态分布的 分位数 z z 表 5 : 标准正态分布的临界值 P. 309 t
4. F 分布构造定理 : 设随机变量 与 Y 相互独立 并且 ~ m c ~ Y c 则随机变量 Y m F 服从自由度为 m 的 F 分布 记为 m F 时 时 密度函数 0 0 0 : x x mx x m m m x p m m m
由定义可看出 F Y m ~ F m 分位数 P{ F F m } F 分布的性质 : F m F m 表 8 F分布的临界值 P. 33
使用 ECEL 计算分位数 t- 分布 TINV 双侧分位数 c - 分布 CHINV 上分位数 F- 分布 FINV 上分位数 CHINV 0.05 0=8.30703 等价于 c 0.95 0 TINV 0.05 0.8 等价于 t 0.975 0 FINV 0.05 6 3 8.9406 等价于 F 6 3 0.95
设 是取自正态总体 N 的样本 其样本均值和样本方差分 则有如下结论 : / ~ N ; ~ 0 / N 与 相互独立 ; 3 ~ c ; 4 ~ c 4. 正态总体下常用统计量的一些重要结论定理
推论 : 在定理 的条件下 有 ~ t ~ 0 / N ~ c 又和相互独立 / ~ t 证 :
定理 : 设 是来自正态母体 的样本 ~ N Y Y Y 是来自正态 母体样本 Y的样本 Y ~ N 与 Y独立 则 Y ~ N 0
证明 : N ~ Y Y N ~ 与 Y 相互独立 Y ~ N Y ~ N 0
定理 3 设 样本 其中 m Y Y Y 是来自正态总体 是来自正态总体 N N 样本 且两样本相互独立 Y 分别表示其 样本均值 Y 分别表示其样本方差 则有 Y ~ t m W m 其中 W m Y m 即 W 可视为样本方差 与 Y 的加权平均值
证明 : Y ~ N 0 m m Y ~ c m ~ c 以上两者相互独立 根据 c 的可加性 m Y m W 又 与相互独立 Y W ~ c m
Y m m m Y ~ t m W m W
定理 4 设总体 证明 : 则统计量 且 c c ~ N 总体 Y ~ N Y j j Y j j ~ F c ~ c c ~ c c 与 c 相互独立 Y j j 与 Y j都独立 ~ F
定理 5 设 m 为来自正态总体 N 样本 Y Y Y 体 是来自正态总 N 样本 且两个样本相互独立 Y 分别表示两个样本的样本方差 则有 特别 若 / Y / ~ F m 则 Y ~ F m
证明 : 相互独立 Y m ~ ~ Y c m c m / ~ F m / m / Y Y / 特别 若 则 Y ~ F m
例. 设随机变量 和 Y 都服从标准正态分布 则 A +Y 服从正态分布 B C 和 Y 都服从 c 分布 D Y 服从 c Y 分布 服从 F 分布 分析 : 如果加上 Y 相互独立的条件四个选项都对. 取 Y = 可排除 A B D 答案 : C
例 3. 设 3 4 是来自正态总体 N 0 的简单 样本 = a b3 3 4 4 a b 时 统计量 服从 其自由度为 分析 : 由于 服从 则当 c 分布 c 分布 可取 ~ 0 a N b 3 4 ~ 0 3 4 N E a 0 E b 4 3 3 4 0 D a a 4 4 4 0a D b 33 4 4 b 94 64 00b 0 00 故有 a b ~ c
例 4. 设 6 是来自正态总体 N 0 Y 3 4 5 6 试确定常数 c 使 cy 服从 c 分布 的样本 设 解 : 由于 ~ N 0 6 3 ~ N03 c ~ 0 3 N 4 5 6 ~ N 03 c ~ 0 4 5 6 N D Y 3 c 3c ~ 故 3 cd 3 c c. 3
例 5. ~ 的分布求设 t t t 例 6 的分布 : 来自 的样本 求下列统计量 0 5 N ; 3 5 4 3 U ; 4 3 V. 3 3 5 4 3 W ~ F ~ c ~ t ~ F3 Y T ~ ~ ~ 0 0 4 3 c N N Y T /
例 7 设总体 服从正态分布 N 80400 求 P{ 80 3}. 00 其样本为 解由已知得 ~ N 804 得 80 ~ N 0 3 80 3 所以 P{ 80 3} P{ } 3 0.933 0.336
例 8 设总体 服从正态分布 Y N 其样本为 求 的分布. 其中 解由已知得 所以 N N N ~ ~ ~ 0 标准化得 ~ N0
~ N0 又因为 故 Y ~ c / ~ t Y ~ t
例 9 设总体 Y 相互独立 ~ N03 Y ~ N03 和 Y Y Y 其样本为 0 5 P{ Y 0.3}. 解由已知得 0 3 试求以下概率 ~ N0 0 0 5 3 Y Y ~ N0 则 Y ~ N0/ 5 5 Y 所以 ~ N0 / P{ Y 0.3} 0.3 0.6774