ii
|
|
|
- 袈壤 侯
- 9 years ago
- Views:
Transcription
1 i 概 率 统 计 讲 义 原 著 : 何 书 元 课 件 制 作 : 李 东 风 2015 年 秋 季 学 期
2 ii
3 目 录 第 一 章 古 典 概 型 和 概 率 空 间 试 验 与 事 件 古 典 概 型 与 几 何 概 型 古 典 概 型 几 何 概 型 概 率 的 公 理 化 和 加 法 公 式 概 率 的 公 理 化 概 率 的 加 法 公 式 概 率 的 连 续 性 条 件 概 率 和 乘 法 公 式 事 件 的 独 立 性 全 概 率 公 式 与 Bayes 公 式 全 概 率 公 式 Bayes 公 式 概 率 与 频 率 第 二 章 随 机 变 量 和 概 率 分 布 随 机 变 量 离 散 型 随 机 变 量 连 续 型 随 机 变 量 概 率 分 布 函 数 概 率 分 布 函 数 常 见 分 布 的 分 布 函 数 随 机 变 量 函 数 的 分 布 第 三 章 随 机 向 量 及 其 分 布 随 机 向 量 及 其 联 合 分 布 离 散 型 随 机 向 量 及 其 分 布 iii
4 iv 目 录 3.3 连 续 型 随 机 向 量 及 其 分 布 随 机 向 量 函 数 的 分 布 极 大 极 小 值 的 分 布 条 件 分 布 和 条 件 密 度 第 四 章 数 学 期 望 和 方 差 数 学 期 望 数 学 期 望 概 念 常 见 分 布 数 学 期 望 数 学 期 望 的 性 质 随 机 向 量 函 数 的 数 学 期 望 数 学 期 望 的 性 质 随 机 变 量 的 方 差 协 方 差 和 相 关 系 数 第 五 章 多 元 正 态 分 布 和 极 限 定 理 多 元 正 态 分 布 大 数 律 中 心 极 限 定 理 第 六 章 描 述 性 统 计 总 体 和 参 数 抽 样 调 查 方 法 用 样 本 估 计 总 体 分 布 众 数 和 中 位 数 随 机 对 照 试 验 第 七 章 参 数 估 计 点 估 计 和 矩 估 计 最 大 似 然 估 计 离 散 型 随 机 变 量 的 情 况 连 续 型 随 机 变 量 的 情 况 抽 样 分 布 及 其 上 α 分 位 数 抽 样 分 布 抽 样 分 布 的 上 α 分 位 数 正 态 总 体 的 区 间 估 计 已 知 σ 时, µ 的 置 信 区 间 未 知 σ 时 µ 的 置 信 区 间
5 目 录 v 方 差 σ 2 的 置 信 区 间 均 值 差 µ 1 µ 2 的 置 信 区 间 方 差 比 σ1/σ 的 置 信 区 间 单 侧 置 信 区 间 非 正 态 总 体 和 比 例 p 的 置 信 区 间 正 态 逼 近 法 比 例 p 的 置 信 区 间 第 八 章 假 设 检 验 假 设 检 验 的 概 念 正 态 均 值 的 假 设 检 验 已 知 σ 时, µ 的 正 态 检 验 法 p 值 检 验 法 未 知 σ 时, 均 值 µ 的 t 检 验 法 未 知 σ 时, µ 的 单 边 检 验 法 正 态 近 似 法 样 本 量 的 选 择 均 值 比 较 的 检 验 已 知 σ1 2, σ2 2 时, µ 1, µ 2 的 检 验 未 知 σ1, 2 σ2, 2 但 已 知 σ1 2 = σ2 2 时, µ 1 µ 2 的 检 验 成 对 数 据 的 假 设 检 验 未 知 σ1, 2 σ2 2 时, µ 1, µ 2 的 检 验 方 差 的 假 设 检 验 比 例 的 假 设 检 验 小 样 本 情 况 下 的 假 设 检 验 大 样 本 情 况 下 单 个 比 例 的 假 设 检 验 大 样 本 情 况 下 两 个 总 体 比 例 的 比 较 总 体 分 布 的 假 设 检 验 第 九 章 线 性 回 归 分 析 数 据 的 相 关 性 样 本 相 关 系 数 相 关 性 检 验 回 归 直 线 一 元 线 性 回 归 最 大 似 然 估 计 和 最 小 二 乘 估 计 平 方 和 分 解 公 式
6 vi 目 录 斜 率 b 的 检 验 预 测 的 置 信 区 间 多 元 线 性 回 归
7 目 录 1 课 程 介 绍 介 绍 掌 握 概 率 论 和 数 理 统 计 的 基 本 数 学 知 识 训 练 用 概 率 论 和 数 理 统 计 方 法 对 实 际 问 题 进 行 数 学 建 模 的 能 力 学 会 解 决 常 见 的 统 计 分 析 问 题 是 应 用 型 很 强 的 学 科 参 考 书 教 材 : 何 书 元 : 概 率 论 与 数 理 统 计, 高 等 教 育 出 版 社,2006. 陈 家 鼎 刘 婉 如 汪 仁 官 : 概 率 统 计 讲 义 ( 第 三 版 ), 高 等 教 育 出 版 社,2004. 何 书 元 概 率 论, 北 京 大 学 出 版 社,2005. 李 贤 平, 概 率 论 基 础 第 三 版, 高 等 教 育 出 版 社, 2010; 李 贤 平, 陈 子 毅, 概 率 论 基 础 学 习 指 导 书, 高 等 教 育 出 版 社,2011 Sheldon M. Ross, 概 率 论 基 础 教 程 (A First Course in Probability), 人 民 邮 电 出 版 社,2006, 郑 忠 国 詹 从 赞 翻 译 陈 家 鼎, 郑 忠 国, 概 率 与 统 计, 北 京 大 学 出 版 社,2007 程 士 宏, 测 度 论 与 概 率 论 基 础, 北 京 大 学 出 版 社,2004 Sheldon M. Ross, 应 用 随 机 过 程 概 率 模 型 导 论 (Introduction to Probability Models), 人 民 邮 电 出 版 社,2011, 龚 光 鲁 翻 译 陈 家 鼎 孙 山 泽 李 东 风 刘 力 平, 数 理 统 计 学 讲 义, 高 等 教 育 出 版 社,2006 年 Robert V. Hogg and Allen T. Craig, Introduction to Mathematical Statistics(5th ed.), Prentice Hall, 1995.
8 2 目 录 概 率 论 的 内 容 随 机 事 件 与 概 率 ; 随 机 变 量 及 其 概 率 分 布 ; 多 维 随 机 变 量 及 其 概 率 分 布 ; 随 机 变 量 的 数 字 特 征 ; 大 数 定 律 及 中 心 极 限 定 理 数 理 统 计 的 内 容 描 述 统 计 ; 参 数 估 计 ; 假 设 检 验 ; 回 归 分 析. 课 程 安 排 时 间 地 点 : 周 二 ( 双 周 )1-2, 周 四 3-4, 二 教 102 答 疑 : 周 二 上 午 10:00 11:30, 理 科 1 号 楼 1425E 教 材 : 何 书 元 : 概 率 论 与 数 理 统 计, 高 等 教 育 出 版 社,2006. 成 绩 评 定 ( 暂 定 ): 期 末 60 + 作 业 20 + 期 中 20. 作 业 : 每 周 四 交 作 业, 发 上 周 作 业 教 学 要 求 认 真 预 习 ; 完 成 作 业 ; 自 己 学 习 一 种 统 计 数 据 分 析 软 件, 建 议 学 习 R, 见 李 东 风 主 页
9 第 一 章 古 典 概 型 和 概 率 空 间 1.1 试 验 与 事 件 第 一 章 介 绍 在 考 虑 一 个 ( 未 来 ) 事 件 是 否 会 发 生 的 时 候, 人 们 常 关 心 该 事 件 发 生 的 可 能 性 的 大 小. 就 像 用 尺 子 测 量 物 体 的 长 度 我 们 用 概 率 测 量 一 个 未 来 事 件 发 生 的 可 能 性 大 小. 将 概 率 作 用 于 被 测 事 件 就 得 到 该 事 件 发 生 的 可 能 性 大 小 的 测 量 值. 为 了 介 绍 概 率, 需 要 先 介 绍 试 验 和 事 件. 试 验 我 们 把 按 照 一 定 的 想 法 去 作 的 事 情 称 为 随 机 试 验. 随 机 试 验 的 简 称 是 试 验 (experiment). 下 面 都 是 试 验 的 例 子. 掷 一 个 硬 币, 观 察 是 否 正 面 朝 上, 掷 两 枚 骰 子, 观 察 掷 出 的 点 数 之 和, 在 一 副 扑 克 牌 中 随 机 抽 取 两 张, 观 察 是 否 得 到 数 字 相 同 的 一 对, 有 7 个 运 动 员 参 加 100 米 短 跑 比 赛, 观 测 比 赛 结 果 的 名 次 排 列, 乘 电 梯 从 一 楼 上 到 9 楼, 观 测 电 梯 一 共 停 了 几 次 ; 观 测 放 学 回 家 的 路 上 所 用 的 时 间 ; 观 测 航 天 器 发 射 的 成 功 与 否 ; 3
10 4 第 一 章 古 典 概 型 和 概 率 空 间 观 察 明 天 的 最 高 气 温 ; 考 察 某 商 场 在 一 天 内 来 到 的 顾 客 数 量 ; 观 测 下 次 概 率 统 计 课 有 多 少 同 学 迟 到. 观 察 2003 年 爆 发 的 非 典 型 肺 炎 案 例 首 次 下 降 到 零 的 日 期. 在 概 率 论 的 语 言 中, 试 验 还 是 指 对 试 验 的 一 次 观 测 或 试 验 结 果 的 测 量 过 程. 样 本 空 间 投 掷 一 枚 硬 币, 用 ω + 表 示 硬 币 正 面 朝 上, 用 ω 表 示 硬 币 反 面 朝 上, 则 试 验 有 两 个 可 能 的 结 果 :ω + 和 ω. 我 们 称 ω + 和 ω 是 样 本 点, 称 样 本 点 的 集 合 Ω = {ω +, ω } 为 试 验 的 样 本 空 间. 投 掷 一 枚 骰 子, 用 1 表 示 掷 出 点 数 1, 用 2 表 示 掷 出 点 数 2,, 用 6 表 示 掷 出 点 数 6. 试 验 的 可 能 结 果 是 1, 2, 3, 4, 5, 6. 我 们 称 这 6 个 数 是 试 验 的 样 本 点. 称 样 本 点 的 集 合 Ω = {ω ω = 1, 2,, 6} 是 试 验 的 样 本 空 间. 为 了 叙 述 的 方 便 和 明 确, 下 面 把 一 个 特 定 的 试 验 称 为 试 验 S. 样 本 点 (sample point): 称 试 验 S 的 可 能 结 果 为 样 本 点, 用 ω 表 示. 样 本 空 间 (sample space): 称 试 验 S 的 样 本 点 构 成 的 集 合 为 样 本 空 间, 用 Ω 表 示. 于 是 Ω = {ω ω 是 试 验 S 的 样 本 点 }. 事 件 投 掷 一 枚 骰 子 的 样 本 空 间 是 Ω = {ω ω = 1, 2,, 6}. 用 集 合 A = {3} 表 示 掷 出 3 点, 则 A 是 Ω 的 子 集. 我 们 称 A 是 事 件. 掷 出 3 点, 就 称 事 件 A 发 生, 否 则 称 事 件 A 不 发 生.
11 1.1 试 验 与 事 件 5 用 集 合 B = {2, 4, 6} 表 示 掷 出 偶 数 点, B 是 Ω 的 子 集, 我 们 也 称 B 是 事 件. 当 掷 出 偶 数 点, 称 事 件 B 发 生, 否 则 称 事 件 B 不 发 生. 事 件 B 发 生 和 掷 出 偶 数 点 是 等 价 的. 事 件 (event): 设 Ω 是 试 验 S 的 样 本 空 间. 当 Ω 中 只 有 有 限 个 样 本 点 时, 称 Ω 的 子 集 为 事 件. 当 试 验 的 样 本 点 ( 试 验 结 果 ) ω 落 在 A 中, 称 事 件 A 发 生, 否 则 称 A 不 发 生. 按 照 上 述 约 定, 子 集 符 号 A Ω 表 示 A 是 事 件. 通 常 用 大 写 字 母 A, B, C, D 或 A 1, A 2,, B 1, B 2, 等 表 示 事 件. 用 A = Ω A 表 示 集 合 A 的 余 集. 则 事 件 A 发 生 和 样 本 点 ω A 是 等 价 的, 事 件 A 不 发 生 和 样 本 点 ω A 是 等 价 的. 空 集 ϕ 是 Ω 的 子 集. 由 于 ϕ 中 没 有 样 本 点, 永 远 不 会 发 生, 所 以 称 ϕ 是 不 可 能 事 件. Ω 也 是 样 本 空 间 Ω 的 子 集, 包 含 了 所 有 的 样 本 点, 因 而 总 会 发 生. 我 们 称 Ω 是 必 然 事 件. 例 1.1: 投 掷 两 枚 硬 币 投 掷 两 枚 硬 币, 写 出 试 验 的 样 本 点 和 样 本 空 间. 解 用 H(head) 表 示 硬 币 正 面 朝 上, 用 T(tail) 表 示 硬 币 反 面 朝 上, 试 验 一 共 有 4 个 样 本 点, 他 们 是 HH HT TH TT 样 本 空 间 是 Ω = {HH, HT, TH, TT}. 注 意, HT 和 TH 是 不 同 的 样 本 点. 例 1.2: 播 音 员 选 择 例 1.2 某 电 视 台 要 招 聘 播 音 员, 现 在 有 三 位 符 合 条 件 的 女 士 和 两 位 符 合 条 件 的 男 士 前 来 应 聘. (1) 写 出 招 聘 男 女 播 音 员 各 一 名 的 样 本 空 间 和 样 本 点,
12 6 第 一 章 古 典 概 型 和 概 率 空 间 (2) 写 出 招 聘 两 名 播 音 员 的 样 本 空 间 Ω 和 事 件 A= 招 聘 到 两 名 女 士. 解 本 试 验 是 招 聘 播 音 员. 用 W 1, W 2, W 3 分 别 表 示 第 1,2,3 位 女 士, 用 M 1,M 2 分 别 表 示 第 1,2 位 男 士. 用 W 1 M 1 表 示 招 聘 到 第 1 位 女 士 和 第 1 位 男 士, 用 W 1 M 2 表 示 招 聘 到 第 1 位 女 士 和 第 2 位 男 士,. (1) 招 聘 男 女 播 音 员 各 一 名 时, 样 本 空 间 是 Ω = { W 1 M 1, W 1 M 2, W 2 M 1, W 2 M 2, W 3 M 1, W 3 M 2 }. Ω 中 的 元 素 是 样 本 点. (2) 招 聘 两 名 播 音 员 时, 样 本 空 间 是 Ω = { W 1 W 2, W 1 W 3, W 2 W 3, W 1 M 1, W 1 M 2, W 2 M 1, W 2 M 2, W 3 M 1, W 3 M 2, M 1 M 2 }. 招 聘 到 两 名 女 士 的 事 件 A = { W 1 W 2, W 1 W 3, W 2 W 3 }. 事 件 与 集 合 当 A, B 都 是 事 件, 则 A B, A B, A B = A B 都 是 事 件. 也 就 是 说 事 件 经 过 集 合 运 算 得 到 的 结 果 还 是 事 件.( 图 示 ) 我 们 也 用 AB 表 示 A B. 当 AB = ϕ 时, 也 用 A + B 表 示 A B. 当 事 件 AB = ϕ, 称 事 件 A, B 不 相 容. 特 别 称 A 为 A 的 对 立 事 件 或 逆 事 件. 如 果 多 个 事 件 A 1, A 2,... 两 两 不 相 容 : A i A j = ϕ, i j, 就 称 他 们 互 不 相 容. 注 意, 互 不 相 容 与 后 面 要 讲 到 的 独 立 是 完 全 不 同 的 概 念 从 以 上 的 叙 述 看 出, 从 集 合 角 度 看, 样 本 空 间 Ω 是 由 试 验 S 的 可 能 结 果 构 成 的 全 集, 样 本 点 ω 就 是 Ω 的 元 素, 事 件 A 就 是 Ω 的 子 集. 事 件 的 运 算 符 号 和 集 合 的 运 算 符 号 也 是 相 同 的, 例 如 :
13 1.2 古 典 概 型 与 几 何 概 型 7 (1) A = B 表 示 事 件 A, B 相 等, (2) A B 发 生 等 价 于 至 少 A, B 之 一 发 生, (3) A B ( 或 AB) 发 生 等 价 于 A 和 B 都 发 生, (4) n j=1a j 发 生 表 示 至 少 有 一 个 A j (1 j n) 发 生, j=1a j 发 生 表 示 至 少 有 一 个 A j (j = 1, 2, ) 发 生, (5) n j=1a j 发 生 表 示 所 有 的 A j (1 j n) 都 发 生. j=1a j 发 生 表 示 所 有 的 A j (j = 1, 2, ) 都 发 生. 事 件 的 运 算 事 件 的 运 算 公 式 就 是 集 合 的 运 算 公 式, 例 如 1 : 1. A B = B A, A B = B A, 2. A (B C) = A B C, A (B C) = A B C, 3. A(B C) = (AB) (AC), A (B C) = (A B) (A C), 4. A B = A + AB, A = AB + AB, 5. 对 偶 公 式 : A B = Ā B, A B = Ā B, 进 而 有 j=1 A = j j=1 A j. 其 中 的 公 式 4 和 5 是 值 得 牢 记 的. j=1 A j = j=1 A j, 古 典 概 型 古 典 概 率 模 型 1.2 古 典 概 型 与 几 何 概 型 设 Ω 是 试 验 S 的 样 本 空 间. 对 于 Ω 的 事 件 A, 我 们 用 P (A) 表 示 A 发 生 的 可 能 性 的 大 小, 称 P (A) 是 事 件 A 发 生 的 概 率, 简 称 为 A 的 概 率. 概 率 是 介 于 0 和 1 之 间 的 数, 描 述 事 件 发 生 的 可 能 性 的 大 小. 按 照 以 上 原 则, 如 果 事 件 A, B 发 生 的 可 能 性 相 同, 则 有 P (A) = P (B). 如 果 事 件 A 发 生 的 可 能 性 比 B 发 生 的 可 能 性 大 2 倍, 则 有 P (A) = 2P (B). 1 图 示 讲 解
14 8 第 一 章 古 典 概 型 和 概 率 空 间 用 # A, # Ω 分 别 表 示 事 件 A 和 样 本 空 间 Ω 中 样 本 点 的 个 数. 定 义 2.1 设 试 验 S 的 样 本 空 间 Ω 是 有 限 集 合, A Ω. 如 果 Ω 的 每 个 样 本 点 发 生 的 可 能 性 相 同, 则 称 P (A) = # A # Ω (2.1) 为 试 验 S 下 A 发 生 的 概 率, 简 称 为 事 件 A 的 概 率. 能 够 用 定 义 2.1 描 述 的 模 型 称 为 古 典 概 率 模 型, 简 称 为 古 典 概 型. 概 率 的 性 质 因 为 # A 0, 当 AB = ϕ 时, # (A + B) = # A + # B, 所 以 从 定 义 (2.1) 可 以 得 到 概 率 P 的 以 下 性 质 : (1) P (A) 0, (2) P (Ω) = 1, (3) 如 果 A, B 不 相 容, 则 P (A + B) = P (A) + P (B). 从 以 上 的 性 质 再 得 到 (4) 如 果 A 1, A 2,, A n 互 不 相 容, 则 P (A 1 + A A n ) = P (A 1 ) + P (A 2 ) + + P (A n ), (5) P (ϕ) = 0, P (A) + P (A) = 1, P (A) = P (AB) + P (AB). 实 际 上, 我 们 由 (3) 得 到 P (ϕ) + P (Ω) = P (Ω), 于 是 P (ϕ) = 0, 由 A + A = Ω 和 (3) 得 到 P (A) + P (A) = 1, 由 AB + AB = A 和 (3) 得 到 P (A) = P (AB) + P (AB). 利 用 古 典 概 型 计 算 概 率 列 出 样 本 空 间 所 有 样 本 点, 一 定 注 意 这 些 样 本 点 应 该 是 可 能 性 完 全 相 同 的 ; 计 算 样 本 空 间 样 本 点 个 数 ; 计 算 事 件 A 样 本 点 个 数 ; 用 公 式 (2.1) 计 算 P (A)
15 1.2 古 典 概 型 与 几 何 概 型 9 例 2.1 以 下 的 例 子 中 任 取 随 机 抽 取 都 是 指 等 可 能 的 抽 取 假 设 硬 币 骰 子 等 是 均 匀 的 掷 一 个 均 匀 的 硬 币, 用 A 表 示 正 面 朝 上. # Ω =2 # A =1 P (A) =1/2 例 2.2 掷 一 个 均 匀 的 骰 子, 用 A 表 示 掷 出 奇 数, B 表 示 掷 出 5. # Ω = 6, # A = 3, # B = 1 P (A) = 3 6, P (B) = 1 6. 古 典 概 型 中 的 常 用 计 数 加 法 原 理 如 果 一 个 问 题 的 做 法 分 为 两 类, 第 一 类 有 n 种 方 法, 第 二 类 有 m 种 方 法, 这 两 类 没 有 重 叠 而 且 仅 有 此 两 类, 则 问 题 的 做 法 共 有 n + m 种 多 类 的 情 况 类 似 例 选 班 长 时, 可 以 从 15 个 男 生 中 选 一 个, 也 可 以 从 10 个 女 生 中 选 一 个, 那 么 一 共 有 = 25 种 选 法 古 典 概 型 中 的 常 用 计 数 乘 法 原 理 如 果 一 个 问 题 要 两 步 完 成, 第 一 步 有 n 种 做 法, 第 二 步 有 m 种 做 法, 则 问 题 有 nm 种 做 法 多 步 的 情 况 类 似 例 要 选 一 个 男 生 班 长 和 一 个 女 生 班 长 组 成 领 导 核 心, 男 生 15 人, 女 生 10 人, 则 问 题 的 做 法 有 = 150 种 做 法
16 10 第 一 章 古 典 概 型 和 概 率 空 间 古 典 概 型 中 常 用 计 数 有 重 复 的 排 列 数 从 n 个 不 同 元 素 中 有 放 回 地 每 次 随 机 抽 取 一 个, 共 抽 取 m 次, 有 序 地 记 录 结 果, 共 有 n m 种 等 可 能 的 不 同 结 果 例 掷 骰 子 3 次, 记 录 每 次 结 果, 结 果 一 共 有 = 6 3 种 例 从 52 张 扑 克 牌 中 随 机 有 放 回 地 抽 取 并 记 录 3 次, 结 果 共 有 52 3 种 古 典 概 型 中 常 用 计 数 排 列 数 从 n 个 不 同 元 素 中 无 放 回 地 每 次 随 机 抽 取 一 个, 共 抽 取 m 次 (m n), 有 序 地 记 录 结 果, 共 有 种 等 可 能 的 不 同 结 果 A m n = n(n 1)... (n m + 1) = n! (n m)! A m n 在 有 的 教 材 中 记 为 P m n 例 从 52 张 扑 克 牌 中 随 机 无 放 回 地 抽 取 3 张, 记 录 每 次 结 果, 结 果 有 = A 3 52 种 古 典 概 型 中 常 用 计 数 组 合 数 从 n 个 不 同 元 素 中 无 放 回 地 每 次 抽 取 一 个, 共 抽 取 m 次 (m n), 不 计 次 序 地 记 录 结 果 ( 只 要 元 素 相 同, 不 管 次 序 是 否 相 同 都 算 是 相 同 结 果 ), 共 有 C m n = n(n 1)... (n m + 1) m! = n! m!(n m)! 种 等 可 能 的 不 同 结 果 例 从 一 副 扑 克 牌 的 4 张 A 中 随 机 无 放 回 抽 取 2 张 组 成 一 手 牌, 不 计 次 序 有 C 2 4 = 4 3/2 = 6 种 结 果 分 别 为
17 1.2 古 典 概 型 与 几 何 概 型 11 古 典 概 型 中 常 用 计 数 分 组 方 式 数 将 n 个 不 同 元 素 分 成 有 序 号 的 k 组, 要 求 第 i 组 恰 好 有 n i 个 元 素 (i = 1, 2,..., k), 分 组 结 果 中 同 组 的 元 素 不 考 虑 次 序 则 这 样 分 组 的 所 有 不 同 分 法 个 数 为 ( ) n = n 1, n 2,..., n k 当 随 机 分 组 时, 这 些 分 法 是 等 可 能 的 n! n 1!n 2!... n k!. 随 机 分 组 的 方 法 是 n 个 元 素 随 机 排 列 (n! 种 排 法 ), 然 后 前 n 1 个 不 计 次 序 地 归 入 i = 1 组, 后 续 n 2 个 不 计 次 序 地 归 入 i = 2 组, 以 此 类 推 例 10 个 学 生 分 成 A, B, C 三 个 组, 分 别 有 人, 组 内 不 计 次 序 分 组 方 式 个 数 为 10! 3!3!4! ( ) 10 = 3, 3, 4 古 典 概 型 中 常 用 计 数 可 重 复 分 组 数 从 n 个 不 同 的 球 中 有 放 回 地 每 次 抽 取 一 个, 共 抽 取 m 次, 结 果 不 计 次 序 共 有 C m n+m 1 种 不 同 的 组 合 参 考 : 何 书 元 概 率 论 1.2 用 0 和 1 组 成 的 序 列 表 示 一 个 结 果 用 n 1 个 1 分 隔 出 n 个 组,1 表 示 组 边 界 这 n 个 组 是 结 果 排 序 后 球 号 1, 2,..., n 的 组 每 组 内 有 若 干 个 0 表 示 该 组 个 数, 如 果 出 现 11 则 该 组 没 有 球, 把 m 个 0 分 配 到 各 个 组 中 这 样, 用 长 度 为 n + m 1 的 0-1 向 量 表 示 一 个 结 果, 结 果 个 数 为 C n 1 n+m 1( 从 n + m 1 个 二 进 制 位 中 选 择 1 的 位 置, 即 边 界 的 位 置 ) 可 重 复 分 组 数 在 随 机 分 组 时 一 般 不 是 等 可 能 的 例 如, 从 红 白 两 个 球 中 有 放 回 地 抽 取 2 次, 计 数 这 2 次 红 球 白 球 个 数
18 12 第 一 章 古 典 概 型 和 概 率 空 间 共 有 ( 红 0, 白 2), ( 红 1, 白 1), ( 红 2, 白 0) 三 种 结 果, 即 C = 3 中 结 果 随 机 抽 取 时 ( 红 1, 白 1) 概 率 为 1 2, ( 红 0, 白 2) 和 ( 红 2, 白 0) 的 概 率 都 是 1 4 例 2.3 例 2.3 掷 两 个 骰 子, 用 A 表 示 点 数 之 和 为 7. 计 算 P (A). 解 用 (i, j) 表 示 第 一 个 骰 子 的 点 数 是 i, 第 二 个 骰 子 的 点 数 是 j. 则 Ω = {(i, j) i, j = 1, 2,, 6}, A = {(i, j) i + j = 7, i, j = 1, 2,, 6}. Ω 中 的 样 本 点 具 有 等 可 能 性. 由 # Ω = 6 2, # A = 6 知 道 P (A) = 6/36 = 1/6. 注 意 : 这 个 概 率 空 间 是 有 次 序 的, 如 果 取 无 次 序 的 概 率 空 间 ( 比 如 (1,2) 和 (2,1) 看 成 同 一 样 本 点 ) 则 概 率 空 间 中 的 样 本 点 不 是 等 可 能 的 例 2.4 例 2.4 在 4 个 白 球, 6 个 红 球 中 任 取 4 个, 求 取 到 2 个 白 球 和 2 个 红 球 的 概 率. 解 任 取 指 无 放 回 等 可 能 随 机 抽 取 用 A 表 示 取 到 2 个 白 球 和 2 个 红 球. 由 # Ω = C10, 4 # A = C4C 得 到 P (A) = C2 4C 2 6 C 4 10 = 例 2.5 例 2.5 将 52 张 扑 克 ( 去 掉 两 张 王 牌 ) 随 机 地 分 给 4 家, 求 每 家 都 是 同 花 色 的 概 率. 解 认 为 52 张 牌 被 等 可 能 地 分 为 4 组, 求 每 组 13 张 牌 同 花 色 的 概 率. 这 时 # Ω = 52!/(13!) 4, # A = 4!, 故 P (A) = # A # Ω = 4!(13!)4 52! = 这 样 的 小 概 率 事 件 你 和 你 周 围 的 人 是 不 会 遇 到 的.
19 1.2 古 典 概 型 与 几 何 概 型 13 例 2.6 例 2.6 N 件 产 品 中 有 N i 件 i(1 i k) 等 品, 从 中 任 取 n 件. 求 n 件 中 恰 有 n i 件 i (1 i k) 等 品 的 概 率. 解 从 题 意 知 N 1 + N N k = N, n 1 + n n k = n. 用 Ω 则 表 示 试 验 的 样 本 空 间, 用 A 表 示 取 出 的 n 件 中 恰 有 n i 件 i 等 品, # Ω = C n N, # A = C n 1 N 1 C n 2 N 2 C n k N k 于 是 P (A) = Cn1 N 1 C n2 N 2 C n k N k. C n N 例 2.7( 生 日 问 题 ) 例 2.7 ( 生 日 问 题 ) 求 n 个 人 中 至 少 有 两 个 人 同 生 日 的 概 率. 解 认 为 每 个 人 的 生 日 等 可 能 地 出 现 在 365 天 中 的 任 一 天, 则 样 本 空 间 Ω 的 元 素 数 为 # Ω = 365 n. 用 A 表 示 n 个 人 的 生 日 各 不 相 同, 则 做 为 Ω 的 子 集 # A = A n 365. 要 求 的 概 率 p n = P (A) = 1 P (A) = 1 A n 365/365 n. 这 里 和 以 后 规 定 对 k > n, A k n = Cn k = 0. 可 以 计 算 出 以 下 结 果 : n p n 图 是 p n 和 n 的 关 系 图. 横 坐 标 是 n, 纵 坐 标 是 p n. 可 以 看 出, 当 n 增 加 时, p n 增 加 得 很 快. 例 2.8 例 2.8 设 样 本 空 间 Ω 有 n 个 样 本 点, 在 古 典 概 率 模 型 下 证 明 (1) 如 果 A 1, A 2,, 是 事 件, 则 j=1 A j 是 事 件, 证 明 : j=1 A j Ω, 所 以 (1) 成 立.
20 14 第 一 章 古 典 概 型 和 概 率 空 间 (2) 对 于 互 不 相 容 的 事 件 A 1, A 2,, 证 明 (2) P ( j=1 A j) = P (A j ). j=1 因 为 # Ω = n, 所 以 只 有 有 限 个 A j 非 空. 设 前 m 个 A j 可 能 非 空, 其 余 是 空 集. 则 j=1 A j = m j=1 A j. 对 j > m, P (A j ) = 0. 于 是 用 性 质 (4) 得 到 几 何 概 型 欧 式 空 间 中 的 体 积 P ( A ) ( m j = P A ) m j = P (A j ) = j=1 j=1 用 R r 表 示 r 维 欧 式 空 间 j=1 P (A j ). j=1 R r = {(x 1, x 2,..., x r ) x i (, ), i = 1, 2,..., r}. 对 于 R r 的 子 集 A, 用 m(a) = A dx 1 dx 2... dx r 表 示 A 的 体 积 ( 更 一 般 地,m(A) 表 示 可 测 集 A 的 测 度, 参 见 实 变 函 数 ) 几 何 概 率 用 Ω 表 示 试 验 S 的 样 本 空 间, 当 Ω R r 时, 称 Ω 的 子 集 是 事 件 定 义 设 样 本 空 间 Ω 的 体 积 m(ω) 是 正 数, 样 本 点 等 可 能 地 落 在 Ω 中 ( 指 Ω 的 体 积 相 同 的 长 方 体 事 件 发 生 的 可 能 性 相 同 ), 对 于 A Ω, 称 P (A) = m(a) m(ω) 为 事 件 A 发 生 的 概 率, 简 称 为 A 的 概 率 这 样 的 定 义 也 满 足 1.2 中 的 非 负 性 全 空 间 概 率 等 于 1 可 加 性 三 个 性 质, 从 而 性 质 (4) 和 (5) 也 成 立
21 1.3 概 率 的 公 理 化 和 加 法 公 式 15 例 ( 同 心 圆 ) 两 个 同 心 圆, 大 圆 圆 面 为 Ω: 半 径 1m; 内 部 小 圆 圆 面 为 A: 半 径 0.5m 落 入 A 概 率 落 入 A 外 的 大 圆 的 概 率 P (A) = m(a) m(ω) = π(0.5)2 π1 2 = 0.25 P (Ā) = 1 P (A) = 0.75 例 ( 会 面 概 率 ) 两 人 1:00 2:00 间 独 立 地 随 机 到 达 某 地 会 面, 先 到 者 仅 等 待 20 分 钟 求 会 面 概 率 用 x, y 表 示 两 人 分 别 的 到 达 时 间, 则 Ω = {(x, y) : 0 x, y 60}, 样 本 点 (x, y) 等 可 能 地 落 在 空 间 Ω 内 A 表 示 两 人 相 遇, 则 A = {(x, y) x y 20, (x, y) Ω} m(ω) = m(a) 用 图 示,A 的 两 条 斜 边 为 y = x ± 20, 面 积 等 于 60 2 减 去 两 个 三 角 形 面 积 即 , 所 以 m(a) = 概 率 概 率 的 公 理 化 概 率 空 间 P (A) = = 概 率 的 公 理 化 和 加 法 公 式
22 16 第 一 章 古 典 概 型 和 概 率 空 间 古 典 概 型 只 对 样 本 空 间 Ω 含 有 限 个 样 本 点, 且 每 个 样 本 点 发 生 的 可 能 性 相 同 的 情 况 定 义 了 概 率. 下 面 将 概 率 的 定 义 进 行 推 广. 设 Ω 是 试 验 S 的 样 本 空 间, 在 实 际 问 题 中 往 往 并 不 需 要 关 心 Ω 的 所 有 子 集, 只 要 把 关 心 的 子 集 称 为 事 件 就 够 了. 但 是 事 件 必 须 是 Ω 的 子 集, 并 且 满 足 以 下 三 个 条 件 : (a) Ω 是 事 件, (b) A, B 是 事 件, 则 A B, A B, A B, A 都 是 事 件, (c) 当 A j 是 事 件, 则 j=1 A j 是 事 件. 以 后 总 假 设 上 面 的 条 件 (a), (b), (c) 成 立. 由 (b) 知 道 有 限 个 事 件 经 过 有 限 次 运 算 后 得 到 的 结 果 仍 然 是 事 件. 满 足 条 件 (a), (b), (c) 的 事 件 的 集 合 F 叫 做 σ 域 或 σ 代 数 对 于 试 验 S 的 事 件 A, 我 们 用 0,1 之 间 的 数 P (A) 表 示 事 件 A 发 生 的 可 能 性 的 大 小. 对 于 每 个 事 件 A F, P (A) 是 一 个 实 数. P (A) 是 事 件 A 的 函 数. 概 率 及 公 理 化 定 义 3.1 如 果 事 件 的 函 数 P 满 足 条 件 (a) 非 负 性 : 对 于 任 何 事 件 A, P (A) 0, (b) 完 全 性 : P (Ω) = 1, (c) 可 列 可 加 性 : 对 于 互 不 相 容 的 事 件 A 1, A 2,..., 有 ( ) P A j = P (A j ). j=1 j=1 就 称 P 是 试 验 S 的 概 率, 简 称 为 概 率, 称 P (A) 是 A 的 概 率 (probability). 我 们 称 定 义 3.1 中 的 (a), (b), (c) 为 概 率 的 公 理 化 条 件. 不 满 足 公 理 化 条 件 的 P 不 是 概 率. 条 件 (c) 中 的 可 列, 指 集 合 的 个 数 或 运 算 的 次 数 可 以 依 次 排 列 起 来. 从 例 2.8 知 道, 古 典 概 率 模 型 中 的 P 是 概 率.
23 1.3 概 率 的 公 理 化 和 加 法 公 式 17 概 率 的 性 质 概 率 的 公 理 化 条 件 并 不 直 接 告 诉 我 们 在 实 际 问 题 中 如 何 计 算 P (A). P (A) 的 计 算 要 根 据 问 题 的 条 件 和 背 景 得 到. 设 P 是 试 验 S 的 概 率, 则 有 以 下 的 结 果. (1) 不 可 能 事 件 的 概 率 是 0: P (ϕ) = 0, (2) 有 限 可 加 性 : 如 果 A 1, A 2,, A n 是 互 不 相 容, 则 P ( n n A j) = P (A j ), j=1 (3) 单 调 性 : B A, 则 P (A) P (B) = P (A B) 0. ( 证 明 手 写 ) j= 概 率 的 加 法 公 式 概 率 的 加 法 公 式 概 率 的 有 限 可 加 性 和 可 列 可 加 性 是 概 率 P 的 最 基 本 性 质, 由 此 推 出 概 率 的 加 法 公 式. (4) P (A B) = P (A) + P (B) P (AB), (5) 如 果 B A, 则 P (A B) = P (A) P (B), P (A) P (B), (6) Jordan 公 式 : 设 A 1, A 2,, A n 是 事 件, 记 p k = P (A j1 A j2 A jk ) 1 j 1<j 2< <j k n 时, 有 P ( n A i) = i=1 例 3.1 n ( 1) k 1 p k. (3.2) 例 3.1 全 班 有 26 个 人 会 打 网 球, 有 28 个 人 会 打 羽 毛 球, 他 们 中 有 20 个 人 同 时 会 打 网 球 和 羽 毛 球. 从 全 班 的 40 名 同 学 中 任 选 一 名, 计 算 他 会 打 网 球 或 会 打 羽 毛 球 的 概 率. k=1
24 18 第 一 章 古 典 概 型 和 概 率 空 间 解 对 任 选 出 的 同 学, 用 A 表 示 他 会 打 网 球, 用 B 表 示 他 会 打 羽 毛 球, 则 A B 表 示 他 会 打 网 球 或 会 打 羽 毛 球. 利 用 P (A) = 26/40, P (B) = 28/40, P (AB) = 20/40 得 到 P (A B) = P (A) + P (B) P (AB) = 概 率 的 连 续 性 概 率 的 连 续 性 = 如 果 A 1 A 2, 就 称 事 件 序 列 {A j } {A j j = 1, 2, } 是 单 调 增 的. 如 果 A 1 A 2, 就 称 事 件 序 列 {A j } 是 单 调 减 的. 我 们 把 单 调 增 序 列 和 单 调 减 序 列 统 称 为 单 调 序 列. 定 理 3.1 设 {A j } 和 {B j } 是 事 件 列. (1) 如 果 {A j } 是 单 调 增 序 列, 则 P ( (2) 如 果 {B j } 是 单 调 减 序 列, 则 P ( j=1 A j) = lim n P (A n). j=1 B j) = lim n P (B n). 通 常 称 j=1 A j 为 单 调 增 序 列 {A j } 的 极 限, 称 j=1 B j 为 单 调 减 序 列 {B j } 的 极 限. 定 理 3.1 说 明, A j 的 概 率 收 敛 到 它 的 极 限 j=1 A j 的 概 率, B j 的 概 率 收 敛 到 它 的 极 限 j=1 B j 的 概 率. 所 以 称 概 率 具 有 连 续 性. 1.4 条 件 概 率 和 乘 法 公 式 例 4.1: 掷 骰 子 的 条 件 概 率 例 4.1 掷 一 个 骰 子, 已 知 掷 出 了 偶 数 点, 求 掷 出 的 是 2 的 概 率. 用 A 表 示 掷 出 偶 数 点, B 表 示 掷 出 2.
25 1.4 条 件 概 率 和 乘 法 公 式 19 已 知 A 发 生 后 试 验 的 条 件 已 经 改 变. 在 新 的 试 验 条 件 下 A 成 为 样 本 空 间, A 的 样 本 点 具 有 等 可 能 性, B 是 A 的 子 集, # A = 3, # B = 1. 所 以, 用 P (B A) 表 示 要 求 的 概 率 时, P (B A) = # B # A = 1 3. 我 们 称 P (B A) 是 已 知 A 发 生 的 条 件 下, B 发 生 的 概 率. 例 4.2: 扑 克 牌 的 条 件 概 率 例 4.2 在 52 张 扑 克 中 任 取 一 张, 已 知 抽 到 草 花 的 条 件 下, 求 抽 到 的 是 草 花 5 的 概 率. 解 设 A= 抽 到 草 花, B= 抽 到 草 花 5. 按 例 4.1 的 方 法 有 P (B A) = # B/ # A = 1/13. 条 件 概 率 设 A, B 是 事 件, 以 后 总 用 P (B A) 表 示 已 知 A 发 生 的 条 件 下, B 发 生 的 条 件 概 率, 简 称 为 条 件 概 率 (conditional probability). 下 面 是 条 件 概 率 的 计 算 公 式. 条 件 概 率 公 式 : 如 果 P (A) > 0, 则 P (B A) = P (AB) P (A). (4.1) 可 以 对 古 典 概 型 给 出 (4.1) 的 证 明 : 设 试 验 S 的 样 本 空 间 是 Ω, A, B 是 事 件, P (A) > 0. 已 知 A 发 生 后 试 验 的 条 件 已 经 改 变. 在 新 的 试 验 条 件 下 A 成 为 样 本 空 间, A 的 样 本 点 具 有 等 可 能 性. 已 知 A 发 生 后, AB 是 A 的 子 集. 利 用 古 典 概 型 的 定 义 知 道 P (B A) = P (AB A) = # (AB) # A = # (AB)/ # Ω # A/ # Ω = P (AB) P (A). 例 4.3: 扑 克 牌 问 题 在 计 算 条 件 概 率 时, 公 式 (4.1) 有 时 会 带 来 许 多 的 方 便. 但 有 时 根 据 问 题 的 特 点 可 以 直 接 得 到 结 果. 例 4.3 将 一 副 扑 克 牌 的 52 张 随 机 均 分 给 四 家, 设 A= 东 家 得 到 6 张 草 花, B= 西 家 得 到 3 张 草 花, 求 P (B A).
26 20 第 一 章 古 典 概 型 和 概 率 空 间 解 四 家 各 有 13 张 牌, 可 以 认 为 东 家 先 取 13 张 后 西 家 再 取 13 张 在 A 发 生 的 条 件 下, 西 家 的 总 可 能 取 法 为 C 13 39,B 发 生 要 求 西 家 取 法 为 C 3 7C 10 32, 用 古 典 概 型. P (B A) = C3 7C C 例 4.4: 条 件 概 率 是 公 理 化 概 率 例 4.4 设 P (A) > 0, 对 于 任 何 事 件 B, 定 义 P A (B) = P (B A). 则 (1) P A 是 概 率, (2) 对 于 事 件 B, C, 当 P (AB) > 0 时, P A (C B) = P (C AB). (4.2) ( 证 明 略 ) 乘 法 公 式 乘 法 公 式 : 设 A, B, A 1, A 2,..., A n 是 事 件, 则 (1) P (AB) = P (A)P (B A), (2) 当 P (A 1 A 2... A n 1 ) 0, 有 P (A 1 A 2... A n ) = P (A 1 )P (A 2 A 1 )... P (A n A 1 A 2... A n 1 ). (4.3) 证 明 将 条 件 概 率 公 式 (4.1) 用 于 等 式 右 边 的 条 件 概 率 就 得 到 证 明. ( 手 写 ) 例 4.5: 官 员 受 贿 问 题 例 4.5 ( 官 员 受 贿 问 题 ) 某 官 员 第 1 次 受 贿 没 被 查 处 的 概 率 是 q 1 = 98/100 = 第 1 次 没 被 查 处 后, 第 2 次 受 贿 没 被 查 处 的 概 率 是 q 2 = 96/98 = ,. 前 j 1 次 没 被 查 处 后, 第 j 次 受 贿 不 被 查 处 的 概 率 是 q j = (100 2j)/(100 2(j 1)),. 求 他 受 贿 n 次 还 不 被 查 处 的 概 率 p n. 解 用 A j 表 示 该 官 员 第 j 次 受 贿 没 被 查 处, 则 A 1 A 2 A n 表 示 受 贿 n 次 还 不 被 查 处.
27 1.5 事 件 的 独 立 性 21 容 易 计 算 p n =P (A 1 A 2... A n ) =P (A 1 )P (A 2 A 1 )... P (A n A 1 A 2... A n 1 ) =q 1 q 2 q n = (n 1) 100 2n (n 2) 100 2(n 1) 100 2n = 100 =1 n 50. p 10 = 0.8, p 20 = 0.6, p 30 = 0.4 p 40 = 0.2, p 50 = 0. ( 如 果 假 设 q 1 = q 2 = = 0.98, 有 p n = 0.98 n, 于 是 得 到 p 10 = 0.817, p 20 = 0.668, p 30 = 0.545, p 40 = 0.446, p 50 = 0.364, p 60 = ) 1.5 事 件 的 独 立 性 两 个 事 件 独 立 设 A 是 试 验 S 1 下 的 事 件, B 是 试 验 S 2 下 的 事 件, 且 A 的 发 生 与 否 不 影 响 B 的 发 生. 用 公 式 表 述 出 来 就 是 P (B A) = P (B). ( 设 P (A) > 0) 再 用 乘 法 公 式 得 到 P (AB) = P (A)P (B A) = P (A)P (B). 此 式 表 示 事 件 A, B 相 互 独 立, 不 要 求 P (A) > 0. 定 义 5.1 如 果 事 件 A, B 满 足 P (AB) = P (A)P (B), 就 称 A, B 相 互 独 立, 简 称 为 A, B 独 立 (independent). 不 可 能 事 件, 必 然 事 件 与 任 何 事 件 独 立. 这 是 因 为 P (ϕa) = P (ϕ)p (A) = 0, P (ΩA) = P (Ω)P (A) = P (A) 总 成 立. 当 P (A) > 0 时, A, B 独 立 当 且 仅 当 P (B A) = P (B). 例 5.1: 独 立 的 试 验 例 5.1 用 Ω 1 表 示 试 验 S 1 的 样 本 空 间, 用 Ω 2 表 示 S 2 的 样 本 空 间. 如 果 试 验 S 1 和 S 2 是 独 立 进 行 的, 可 以 证 明 试 验 S 1 的 事 件 和 试 验 S 2 的 事 件 是 相 互 独 立 的.
28 22 第 一 章 古 典 概 型 和 概 率 空 间 例 5.2: 长 方 形 等 分 例 5.2 两 线 段 将 长 方 形 Ω 四 等 分, 得 到 E 1, E 2, E 3, E 4. E 1 E 2 E 3 E 4 设 A = E 1 E 2, B = E 1 E 3, C = E 1 E 4. 在 Ω 中 任 取 一 点, 则 P (AB) = P (A)P (B) = 1/4, P (AC) = P (A)P (C) = 1/4, P (BC) = P (B)P (C) = 1/4. 于 是 A, B, C 两 两 独 立. 定 理 5.1 定 理 5.1 A, B 独 立 当 且 仅 当 A, B 独 立. 证 明 只 需 由 A, B 独 立 证 明 A, B 独 立. 当 A, B 独 立, 有 P (AB) = P (B) P (AB) = P (B) P (A)P (B) = P (A)P (B). 于 是 A, B 独 立. 多 个 事 件 的 相 互 独 立 定 义 5.2 (1) 称 事 件 A 1, A 2,, A n 相 互 独 立, 如 果 对 任 何 1 j 1 < j 2 < < j k n, P (A j1 A j2 A jk ) = P (A j1 )P (A j2 )... P (A jk ) (2) 称 事 件 A 1, A 2, 相 互 独 立, 如 果 对 任 何 n 2, 事 件 A 1, A 2,, A n 相 互 独 立. (3) 称 {A n } 是 独 立 事 件 列, 如 果 A 1, A 2, 相 互 独 立. 例 5.3: 三 个 事 件 相 互 独 立 例 5.3 事 件 A,B, C 相 互 独 立 当 且 仅 当 他 们 两 两 独 立, 并 且 P (ABC) = P (A)P (B)P (C).
29 1.5 事 件 的 独 立 性 23 例 5.4: 性 质 例 5.4 设 A 1, A 2,, A n 相 互 独 立, 则 有 如 下 的 结 果. (1) 对 1 j 1 < j 2 < < j k n, A j1, A j2,, A jk 相 互 独 立, (2) 用 B i 表 示 A i 或 A i, 则 B 1, B 2,, B n 相 互 独 立, (3) (A 1 A 2 ), A 3,, A n 相 互 独 立 ; (4) (A 1 A 2 ), A 3,, A n 相 互 独 立. 事 实 上, 把 A 1, A 2,..., A n 分 为 k 个 组, 每 个 组 内 的 事 件 作 并 交 差 运 算 后 得 到 的 事 件 B 1, B 2,..., B k 仍 是 相 互 独 立 的 例 5.5 例 5.5 例 5.2 中 的 A,B,C 两 两 独 立 但 非 相 互 独 立 因 为 P (ABC) = 1/4, P (A)P (B)P (C) = 1/8. 例 5.6: 高 炮 例 5.6 每 门 高 炮 击 中 飞 机 的 概 率 是 0.3, 要 以 99% 的 把 握 击 中 飞 机, 需 要 几 门 高 炮. 解 用 A i 表 示 第 i 门 高 炮 击 中 目 标. 设 需 要 n 门 高 炮, 则 要 求 n 满 足 P ( n A j) = 1 P ( n A j) = 1 (0.7) n j=1 j=1 由 n ln 0.7 ln(1 0.99) 解 出 n 于 是 取 n = 13. 例 5.7: 明 青 花 例 5.7 明 青 花 ( 瓷 ) 享 有 盛 誉. 设 一 只 青 花 盘 在 一 年 中 被 失 手 打 破 的 概 率 是 (1) 计 算 一 只 弘 治 ( ) 时 期 的 青 花 麒 麟 ( 图 案 ) 盘 保 留 到 现 在 ( 约 500 年 ) 的 概 率, (2) 如 果 弘 治 年 间 生 产 了 1 万 件 青 花 麒 麟 盘, 计 算 这 1 万 件 至 今 都 已 经 被 失 手 打 破 的 概 率.
30 24 第 一 章 古 典 概 型 和 概 率 空 间 解 (1) 用 A i 表 示 该 盘 在 第 i 年 没 被 打 破, 则 至 今 没 被 打 破 的 概 率 是 p =P (A 1 A 2 A 500 ) =P (A 1 )P (A 2 A 1 ) P (A 500 A 1 A 2 A 499 ) =(1 0.03) 500 = , 被 失 手 打 破 的 概 率 是 q = 1 p = (2) 用 B j 表 示 第 j 件 至 今 已 被 打 破, m = 10000, 则 B 1, B 2,, B m 相 互 独 立. 这 1 万 件 至 今 都 已 经 被 失 手 打 破 的 概 率 是 q 1 =P ( m m B j) = P (B j ) = q m = j=1 j=1 有 这 类 青 花 麒 麟 盘 流 传 至 今 的 概 率 是 p 1 = 1 q 1 = 如 果 当 时 生 产 了 五 十 万 件, 则 有 这 类 青 花 麒 麟 盘 流 传 至 今 的 概 率 是 p 50 = 如 果 当 时 生 产 了 五 百 万 件, 则 有 这 类 青 花 麒 麟 盘 流 传 至 今 的 概 率 是 p 500 = 当 然, 这 个 模 型 里 每 年 失 手 打 破 的 概 率 都 是 0.03 的 假 设 过 于 粗 糙, 实 际 上 随 着 现 存 总 数 的 减 少 保 护 必 然 加 强, 打 破 概 率 变 得 很 小 全 概 率 公 式 全 概 率 公 式 1.6 全 概 率 公 式 与 Bayes 公 式 定 理 6.1( 全 概 率 公 式 ) 如 果 事 件 A 1, A 2,, A n 互 不 相 容, B n j=1 A j, 则 n P (B) = P (A j )P (B A j ). (6.1) j=1
31 1.6 全 概 率 公 式 与 BAYES 公 式 25 证 明 : 因 为 B = B( n j=1 A j) = n j=1 (BA j), 用 概 率 的 有 限 可 加 性 和 乘 法 公 式 得 到 P (B) =P (B( n j=1 A j)) =P ( n (BA j)) j=1 n = P (BA j ) = j=1 n P (A j )P (B A j ). j=1 全 概 率 公 式 完 备 事 件 组 全 概 率 公 式 容 易 推 广 到 可 列 个 事 件 的 情 况 ( 见 习 题 1.14)). 如 果 事 件 A 1, A 2,, A n 互 不 相 容, n j=1 A j = Ω, 则 称 A 1, A 2,, A n 是 完 备 事 件 组, 这 时 (6.1) 对 任 何 事 件 B 成 立. A 和 A 总 构 成 完 备 事 件 组, 所 以 总 有 P (B) = P (A)P (B A) + P (A)P (B A). (6.2) 例 6.1( 抽 签 问 题 ) 例 6.1 ( 抽 签 问 题 ) n 个 签 中 有 m 个 标 有 中, 证 明 无 放 回 依 次 随 机 抽 签 时, 第 j 次 抽 中 的 概 率 是 m/n. 解 用 归 纳 法. 用 A j 表 示 第 j 次 抽 中, 则 对 一 切 m, n, 当 m n 时, 有 P (A 1 ) = m/n. 设 对 一 切 m, n, 当 m n 时, 有 P (A j 1 ) = m/n, 则 有 于 是 有 P (A j A 1 ) = m 1 n 1, P (A j A 1 ) = m n 1. P (A j ) =P (A 1 )P (A j A 1 ) + P (A 1 )P (A j A 1 ) = m n m 1 n 1 + n m n = m n, 1 j n. m n 1
32 26 第 一 章 古 典 概 型 和 概 率 空 间 例 6.2( 敏 感 问 题 调 查 ) 例 6.2 ( 敏 感 问 题 调 查 ) 在 调 查 家 庭 暴 力 ( 或 婚 外 恋 服 用 兴 奋 剂 吸 毒 等 敏 感 问 题 ) 所 占 家 庭 的 比 例 p 时, 被 调 查 者 往 往 不 愿 回 答 真 相, 这 使 得 调 查 数 据 失 真. 为 得 到 实 际 的 p 同 时 又 不 侵 犯 个 人 隐 私, 调 查 人 员 将 袋 中 放 入 比 例 是 p 0 的 红 球 和 比 例 是 q 0 = 1 p 0 的 白 球. 被 调 查 者 在 袋 中 任 取 一 球 窥 视 后 放 回, 并 承 诺 取 得 红 球 就 讲 真 话, 取 到 白 球 就 讲 假 话. 被 调 查 者 只 需 在 匿 名 调 查 表 中 选 是 ( 有 家 庭 暴 力 ) 或 否, 然 后 将 表 放 入 投 票 箱. 没 人 能 知 道 被 调 查 者 是 否 讲 真 话 和 回 答 的 是 什 么. 如 果 声 称 有 家 庭 暴 力 的 家 庭 比 例 是 p 1, 求 真 正 有 家 庭 暴 力 的 比 例 p. 解 对 任 选 的 一 个 家 庭, 用 B 表 示 回 答 是, 用 A 表 示 实 际 是. 利 用 全 概 率 公 式 得 到 p 1 =P (B) ( 回 答 是 ) =P (B A)P (A) + P (B A)P (A) =p 0 P (A) + q 0 (1 P (A)) ( P (B A) 即 讲 真 话 概 率, P (B A) 等 于 讲 假 话 概 率 ) =pp 0 + q 0 (1 p) = q 0 + (p 0 q 0 )p. 于 是 只 要 p 0 q 0, 则 p = P (A) = p 1 q 0 p 0 q 0. 实 际 问 题 中, p 1 是 未 知 的, 需 要 经 过 调 查 得 到. 假 定 调 查 了 n 个 家 庭, 其 中 有 k 个 家 庭 回 答 是, 则 可 以 用 ˆp 1 = k/n 估 计 p 1, 于 是 可 以 用 估 计 p. ˆp = ˆp 1 q 0 p 0 q 0
33 1.6 全 概 率 公 式 与 BAYES 公 式 27 如 果 袋 中 装 有 30 个 红 球,50 个 白 球, 调 查 了 320 个 家 庭, 其 中 有 195 个 家 庭 回 答 是, 则 p 0 = 3/8, q 0 = 5/8, ˆp 1 = 195/320, ˆp = 195/320 5/8 3/8 5/8 = 6.25%. 可 以 证 明 p 0 q 0 越 大, 得 到 的 结 论 越 可 靠. 但 是 p 0 q 0 太 大 时, 调 查 方 案 不 易 让 被 调 查 者 接 受. 例 6.3( 赌 徒 破 产 模 型 ) 例 6.3 ( 赌 徒 破 产 模 型 ) 甲 有 本 金 a 元, 决 心 再 赢 b 元 停 止 赌 博. 设 甲 每 局 赢 的 概 率 是 p = 1/2, 每 局 输 赢 都 是 一 元 钱, 甲 输 光 后 停 止 赌 博, 求 甲 输 光 的 概 率 q(a). 解 用 A 表 示 甲 第 一 局 赢, 用 B k 表 示 甲 有 本 金 k 元 时 最 后 输 光. 由 题 意, q(0) = 1, q(a + b) = 0, 并 且 q(k) =P (B k ) =P (A)P (B k A) + P (A)P (B k A) = 1 2 P (B k+1) P (B k 1) = 1 2 q(k + 1) + 1 q(k 1). 2 于 是 有 2q(k) = q(k + 1) + q(k 1). 从 而 得 到 q(k + 1) q(k) = q(k) q(k 1) = = q(1) q(0) = q(1) 1. 上 式 两 边 对 k = n 1, n 2,, 0 求 和 后 得 到, q(n) 1 = n(q(1) 1). (6.3) 取 n = a + b, 得 到 0 1 = (a + b)(q(1) 1), q(1) 1 = 1/(a + b).
34 28 第 一 章 古 典 概 型 和 概 率 空 间 最 后 由 (6.3) 得 到 : q(a) = 1 + a(q(1) 1) = 1 a a + b = b b + a. (6.4) (6.4) 说 明, 当 甲 的 本 金 a 有 限, 则 贪 心 b 越 大, 输 光 的 概 率 越 大, 如 果 一 直 赌 下 去 (b ), 必 定 输 光 Bayes 公 式 Bayes 公 式 定 理 6.2(Bayes 公 式 ) 如 果 事 件 A 1, A 2,, A n 互 不 相 容, B n j=1 A j, 则 P (B) > 0 时, 有 P (A j B) = P (A j )P (B A j ) n i=1 P (A, 1 j n. (6.5) i)p (B A i ) 证 明 由 条 件 概 率 公 式 和 全 概 率 公 式 得 到 P (A j B) = P (A jb) P (B) = P (A j )P (B A j ) n i=1 P (A i)p (B A i ), 1 j n. 值 得 指 出 的 是, 分 子 总 是 分 母 中 的 一 项. 当 A 1, A 2,, A n 是 完 备 事 件 组, P (B) > 0 时, (6.5) 成 立. Bayes 公 式 也 可 以 推 广 到 可 列 个 事 件 的 情 况 ( 见 习 题 1.21). 最 常 用 到 的 Bayes 公 式 是 当 P (B) > 0, 例 6.4( 疾 病 普 查 问 题 ) P (A B) = 例 6.4 ( 疾 病 普 查 问 题 ) P (A)P (B A) P (A)P (B A) + P (A)P (B A). (6.6) 一 种 新 方 法 对 某 种 特 定 疾 病 的 诊 断 准 确 率 是 90%( 有 病 被 正 确 诊 断 和 没 病 被 正 确 诊 断 的 概 率 都 是 90%). 如 果 群 体 中 这 种 病 的 发 病 率 是 0.1%, 甲 在 身 体 普 查 中 被 诊 断 患 病, 问 甲 的 确 患 病 的 概 率 是 多 少? 解 设 A= 甲 患 病, B = 甲 被 诊 断 有 病. 根 据 题 意, P (A) = 0.001, P (B A) = 0.9, P (B A) = 0.1,
35 1.6 全 概 率 公 式 与 BAYES 公 式 29 于 是, 用 公 式 (6.6) 得 到 P (A)P (B A) P (A B) = P (A)P (B A) + P (A)P (B A) = = 9 = < 1% 没 有 病 的 概 率 P (A B) = > 99%. 造 成 这 个 结 果 的 原 因 是 发 病 率 较 低 和 诊 断 的 准 确 性 不 够 高. 如 果 甲 复 查 时 又 被 诊 断 有 病, 则 他 的 确 有 病 的 概 率 将 增 加 到 7.5%. 如 果 人 群 的 发 病 率 不 变, 诊 断 的 准 确 率 提 高 到 99%, 可 以 计 算 出 P (A B) = 9.02%. 例 6.5( 吸 烟 与 肺 癌 问 题 ) 例 6.5 ( 吸 烟 与 肺 癌 问 题 ) 1950 年 某 地 区 曾 对 岁 的 男 性 公 民 进 行 调 查. 肺 癌 病 人 中 吸 烟 的 比 例 是 99.7%, 无 肺 癌 人 中 吸 烟 的 比 例 是 95.8%. 如 果 整 个 人 群 的 发 病 率 是 p = 10 4, 求 吸 烟 人 群 中 的 肺 癌 发 病 率 和 不 吸 烟 人 群 中 的 肺 癌 发 病 率. 解 引 入 A = 有 肺 癌, B = 吸 烟, 则 P (A) =10 4, P (B A) =99.7%, P (B A) =95.8%. 利 用 公 式 (6.6) 得 到 : P (A)P (B A) P (A B) = P (A)P (B A) + P (A)P (B A) % = % + ( ) 95.8% = P (A)P (B A) P (A B) = P (A)P (B A) + P (A)P (B A) 10 4 (1 99.7%) = 10 4 (1 99.7%) + ( ) (1 95.8%) =
36 30 第 一 章 古 典 概 型 和 概 率 空 间 于 是, 吸 烟 人 群 的 发 病 率 = P (A B) 不 吸 烟 人 群 的 发 病 率 P (A B) = 结 论 : 吸 烟 人 群 的 肺 癌 发 病 率 是 不 吸 烟 人 群 的 肺 癌 发 病 率 的 倍. 例 6.6( 肇 事 车 判 定 ) 例 6.6 某 城 市 夏 利 牌 出 租 车 占 85%, 富 康 牌 出 租 车 占 15%. 这 两 种 出 租 车 都 是 红 色, 富 康 出 租 车 略 大 一 些, 每 辆 车 肇 事 的 概 率 相 同. 在 一 次 出 租 车 的 交 通 肇 事 逃 逸 案 件 中, 有 证 人 指 证 富 康 车 肇 事. 为 了 确 定 是 否 富 康 车 肇 事, 在 肇 事 地 点 和 相 似 的 能 见 度 下 警 方 对 证 人 辨 别 出 租 车 的 能 力 进 行 了 测 验, 发 现 证 人 正 确 识 别 富 康 车 的 概 率 是 90%, 正 确 识 别 夏 利 车 的 概 率 是 80%. 如 果 证 人 没 有 撒 谎, 求 富 康 车 肇 事 的 概 率. 解 : 用 A 表 示 证 人 看 见 富 康 车 肇 事, 用 B 表 示 富 康 车 肇 事, 则 B 表 示 夏 利 车 肇 事, 并 且 P (B) = 0.15, P (A B) = 0.9, P (A B) = 要 求 的 概 率 是 P (B A). 用 Bayes 公 式 得 到 P (A B)P (B) P (B A) = P (A B)P (B) + P (A B)P (B) = (1 0.8) 0.85 =44.26%. 这 个 概 率 看 起 来 很 小, 但 是 在 没 有 证 人 的 情 况 下, 富 康 车 肇 事 的 概 率 更 小, 是 15%. 1.7 概 率 与 频 率 概 率 与 频 率 古 典 概 型 只 对 等 可 能 的 情 况 定 义 了 概 率, 为 了 能 够 描 述 更 复 杂 的 试 验, 很 多 学 者 使 用 概 率 的 频 率 定 义.
37 1.7 概 率 与 频 率 31 设 A 是 试 验 S 的 事 件. 在 相 同 的 条 件 下 将 试 验 S 独 立 地 重 复 N 次, 我 们 称 f N = N 次 试 验 中 A 发 生 的 次 数 N 是 N 次 独 立 重 复 试 验 中, 事 件 A 发 生 的 频 率 (frequency). 理 论 和 试 验 都 证 明, 当 N, f N 会 收 敛 到 一 个 数 P (A). 我 们 称 P (A) 为 事 件 A 在 试 验 S 下 发 生 的 概 率, 简 称 为 A 的 概 率. (Flash 演 示 )
38 32 第 一 章 古 典 概 型 和 概 率 空 间
39 第 二 章 随 机 变 量 和 概 率 分 布 2.1 随 机 变 量 随 机 变 量 引 入 事 件 是 用 来 描 述 随 机 试 验 的 某 些 现 象 是 否 出 现 的, 要 说 明 比 较 复 杂 的 试 验 结 果, 就 需 要 定 义 许 多 事 件. 为 了 更 深 入 地 研 究 随 机 现 象, 就 要 建 立 数 学 模 型, 随 机 变 量 是 随 机 现 象 的 最 基 本 的 数 学 模 型, 我 们 用 随 机 变 量 的 值 表 示 随 机 试 验 的 结 果 如 果 用 X 表 示 明 天 的 最 高 气 温, {X 30} 就 表 示 明 天 的 最 高 气 温 不 超 过 30 o C, 由 于 X 的 取 值 在 今 天 无 法 确 定, 所 以 称 X 是 随 机 变 量 (random variable). 例 1.1: 骰 子 点 数 例 1.1 掷 一 个 骰 子, 样 本 空 间 是 Ω = { ω ω = 1, 2,, 6 }. 用 X 表 示 掷 出 的 点 数, 称 X 是 随 机 变 量. {X 3} 表 示 掷 出 的 点 数 不 超 过 3, 并 且 {X 3} = { ω ω = 1, 2, 3} 是 事 件 将 X 视 为 Ω 上 的 函 数, X(ω) = ω, ω Ω, 则 {X j} = {ω ω = 1, 2,, j}. 是 事 件 33
40 34 第 二 章 随 机 变 量 和 概 率 分 布 例 1.2: 扑 克 牌 点 数 例 1.2 张 扑 克. 在 一 副 扑 克 的 52 张 中 任 取 一 张, 样 本 空 间 的 每 个 点 表 示 一 用 X 表 示 所 取 扑 克 的 大 小, 则 X = 3 表 示 所 取 到 的 扑 克 是 3. 将 X 视 为 样 本 空 间 上 的 函 数, 则 {X = 3} { ω X(ω) = 3 } = { 草 花 3, 黑 桃 3, 红 桃 3, 方 块 3 }. 是 事 件 我 们 称 X 是 随 机 变 量. 随 机 变 量 定 义 定 义 ( 随 机 变 量 ) X 是 定 义 在 样 本 空 间 Ω 上 的 实 值 函 数 : 对 每 一 个 样 本 点 ω, X(ω) 是 一 个 实 数. ( 更 严 格 的 数 学 定 义 还 要 求 关 于 X 落 入 区 间 是 事 件 ) 通 常 将 随 机 变 量 X(ω) 简 记 为 X. 在 概 率 论 和 数 理 统 计 学 中, 人 们 习 惯 用 大 写 的 X, Y, Z, ξ, η 等 表 示 随 机 变 量. 不 够 时 还 可 以 用 X 1, X 2, 等 表 示. 随 机 变 量 的 事 件 我 们 用 {X x}, 或 更 简 单 地 用 X x 表 示 事 件 { ω X(ω) x}. 对 于 实 数 的 集 合 A, 我 们 用 {X A}, 或 更 简 单 地 用 X A 表 示 事 件 {ω X(ω) A}. 于 是 {X A} ={ω X(ω) A}, {a < X b} ={ω a < X(ω) b}. 注 : 这 里 和 以 后 所 述 的 数 集 都 是 高 等 数 学 中 的 实 数 的 ( 可 测 ) 集 合, 并 且 对 数 集 A, 承 认 {X A} 是 事 件.
41 2.2 离 散 型 随 机 变 量 35 例 1.3,1.4: 随 机 变 量 的 函 数 例 1.3 掷 一 个 骰 子, 用 X 表 示 掷 出 的 点 数, 则 X, X 2, X + X 都 是 样 本 空 间 上 的 函 数, 因 而 都 是 随 机 变 量. 例 1.4 掷 n 个 骰 子, 用 Y 表 示 掷 出 的 点 数 之 和, 则 Y 是 随 机 变 量. 对 函 数 g(x), X = g(y ) 也 是 随 机 变 量, 因 为 X(ω) = g(y (ω)) 也 是 样 本 空 间 Ω 上 的 函 数. 例 1.5: 随 机 变 量 与 概 率 例 1.5 率. 在 52 张 扑 克 中 任 取 13 张, 求 这 13 张 牌 中 恰 有 5 张 草 花 的 概 解 易 得 到 注 : 用 X 表 示 这 13 张 牌 中 草 花 的 张 数, 则 X = 5 是 关 心 的 事 件, 容 P (X = 5) = C5 13 C 8 39 C = 在 许 多 实 际 问 题 中, 一 个 随 机 变 量 X 的 含 义 是 十 分 清 楚 的, 所 以 一 般 不 再 关 心 随 机 变 量 X 在 样 本 空 间 Ω 上 是 如 何 定 义 的. 可 以 认 为 X 的 所 有 取 值 就 是 我 们 的 样 本 空 间 只 是 在 必 要 的 时 候 才 将 自 变 元 ω 写 出 来. 2.2 离 散 型 随 机 变 量 离 散 型 随 机 变 量 有 些 变 量 只 能 取 有 限 个 或 可 列 个 值, 比 如, 被 访 问 者 的 性 别 年 龄 职 业, 一 批 产 品 中 次 品 个 数, 一 个 医 学 试 样 中 白 细 胞 个 数, 掷 两 个 骰 子 第 一 次 得 到 12 点 的 时 间, 等 等 另 外 的 变 量 可 以 取 到 区 间 内 任 何 值, 比 如 温 度 气 压 长 度 时 间 等 测 量 值 定 义 2.1 如 果 随 机 变 量 X 只 取 有 限 个 值 x 1, x 2,, x n, 或 可 列 个 值 x 1, x 2,, 就 称 X 是 离 散 型 随 机 变 量, 简 称 为 离 散 随 机 变 量 (discrete random variable). 以 下 就 X 取 可 列 个 值 的 情 况 加 以 表 述, 对 于 X 取 有 限 个 值 的 情 况 可 类 似 的 表 述.
42 36 第 二 章 随 机 变 量 和 概 率 分 布 定 义 2.2 设 X 是 离 散 随 机 变 量, 称 P (X = x k ) = p k, k 1, (2.1) 为 X 的 概 率 分 布 (probability distribution). 称 {p k } 是 概 率 分 布 列, 简 称 为 分 布 列. (distribution sequence). 分 布 列 当 分 布 列 {p k } 的 规 律 性 不 够 明 显 时, 也 常 常 用 如 下 的 方 式 表 达 概 率 分 布, X x 1 x 2 x 3 P p 1 p 2 p 3 (2.2) 分 布 列 {p k } 有 如 下 的 性 质 : (a) p k 0, (b) j=1 p j = 1. 由 于 p k 是 概 率, 所 以 是 非 负 的. 下 面 证 明 (b). 对 k j, {X = x j } 发 生, {X = x k } 就 不 能 发 生, 所 以 两 点 分 布 {X = x j }, j = 1, 2,, 互 不 相 容. 利 用 Ω = {X = x j }. 和 概 率 的 可 列 可 加 性 得 到 1 = P (Ω) = j=1 P (X = x j ) = j=1 p j. 两 点 分 布 (Bernoulli 分 布 ) B(1, p): 如 果 X 只 取 值 0 或 1, 概 率 分 布 是 j=1 P (X = 1) = p, P (X = 0) = q, p + q = 1, (2.3) 就 称 X 服 从 两 点 分 布, 记 做 X B(1, p) 或 X b(1, p) 任 何 试 验, 当 只 考 虑 成 功 与 否 时, 就 可 以 用 两 点 分 布 的 随 机 变 量 描 述 : 1, 试 验 成 功, X = 0, 试 验 不 成 功.
43 2.2 离 散 型 随 机 变 量 37 二 项 分 布 二 项 分 布 (Binomial 分 布 )B(n, p): 如 果 随 机 变 量 有 如 下 的 概 率 分 布 : P (X = k) =Cnp k k q n k, k = 0, 1,, n, (2.4) ( 其 中 pq > 0, p + q = 1) 就 称 X 服 从 二 项 分 布, 记 做 X B(n, p). 称 为 二 项 分 布 的 原 因 是 Cnp k k q n k 为 二 项 展 开 式 : (p + q) n = 的 第 k + 1 项. B 表 示 Binomial. n Cnp k k q n k k=0 二 项 分 布 的 折 线 图 二 项 分 布 的 背 景 二 项 分 布 的 背 景 设 试 验 S 成 功 的 概 率 为 p, 将 试 验 S 重 复 n 次, 用 X 表 示 成 功 的 次 数, 则 X B(n, p). 解 释 : 用 A j 表 示 第 j 次 试 验 成 功, 则 A 1, A 2,, A n 相 互 独 立, 且 P (A j ) = p.
44 38 第 二 章 随 机 变 量 和 概 率 分 布 从 n 次 试 验 中 选 定 k 次 试 验 的 方 法 共 有 C k n 种. 对 第 j 种 选 法 为 {j 1, j 2,, j k } 成 功, 其 余 失 败, 用 B j = A j1 A j2 A jk A jk+1 A jk+2 A jn 表 示, 则 {B j } 互 不 相 容, 并 且 {X = k} = C k n j=1 B j, P (B j ) = p k q n k. 用 概 率 的 有 限 可 加 性 得 到 C k n P (X = k) = P (B j ) = Cnp k k q n k. j=1 泊 松 分 布 (Poisson 分 布 ) Poisson(λ): 概 率 分 布 : 如 果 随 机 变 量 X 有 如 下 的 P (X = k) = λk k! e λ, k = 0, 1,, (2.5) 就 称 X 服 从 参 数 是 λ 的 Poisson 分 布, 简 记 为 X Poisson (λ). 这 里 λ 是 正 常 数. Poisson 分 布 的 例 子 : 单 位 时 间 放 射 性 粒 子 个 数 ; 某 段 高 速 公 路 上 一 年 的 事 故 数 ; 某 商 场 一 天 中 顾 客 到 来 个 数 ; 一 段 时 间 内 接 到 的 电 话 个 数 ; 等 等 泊 松 分 布 的 折 线 图
45 2.2 离 散 型 随 机 变 量 39 例 2.1 放 射 性 粒 子 数 例 年, 著 名 科 学 家 Rutherford( 罗 瑟 福 ) 和 Geiger( 盖 克 ) 观 察 了 放 射 性 物 质 钋 ( 读 po1)(polonium) 放 射 α 粒 子 的 情 况. 他 们 进 行 了 N = 2608 次 观 测, 每 次 观 测 7.5 秒, 一 共 观 测 到 个 α 粒 子 放 出, 下 面 的 表 是 观 测 记 录. 其 中 的 Y 是 服 从 Poisson(3.87) 分 布 的 随 机 变 量, 3.87 = 10094/2608 是 7.5 秒 中 放 射 出 α 粒 子 的 平 均 数. 用 Y 表 示 这 块 放 射 性 钋 在 7.5 秒 内 放 射 出 的 α 粒 子 数, 表 的 最 后 两 列 表 明 事 件 {Y = k} 在 N = 2608 次 重 复 观 测 中 发 生 的 频 率 和 P (Y = k) 基 本 相 同.
46 40 第 二 章 随 机 变 量 和 概 率 分 布 观 测 到 的 观 测 到 k 个 粒 子 发 生 的 P (Y = k) α 粒 子 数 k 的 次 数 m k 频 率 m k /N Y Poisson(3.87) 总 计 放 射 粒 子 数 的 观 测 频 率 与 泊 松 概 率 对 比 图 例 2.2 战 争 数 例 2.2 自 1500 至 1931 年 的 N = 432 年 间, 比 较 重 要 的 战 争 在 全 世 界 共 发 生 了 299 次. 以 每 年 为 一 个 时 间 段 的 记 录 见 下 面
47 2.2 离 散 型 随 机 变 量 41 爆 发 的 战 争 数 k 爆 发 k 次 战 争 的 年 数 m k 频 率 m k /N P (Y = k) 总 计 平 均 每 年 发 生 战 争 次 数 λ = 299/ 上 面, Y Poisson(0.69). 一 年 中 发 生 战 争 次 数 的 频 率 与 泊 松 概 率 对 比 图 例 2.3 出 租 车 遇 红 灯 数 例 2.3 设 一 辆 出 租 车 一 天 内 穿 过 的 路 口 数 Y 服 从 泊 松 分 布 Poisson(λ), 设 各 个 路 口 的 红 绿 灯 是 独 立 工 作 的, 在 每 个 路 口 遇 到 红 灯 的 概 率 是 p(> 0). (1) 已 知 一 辆 出 租 车 一 天 内 路 过 了 k 个 路 口, 求 遇 到 的 红 灯 数 的 分 布 ; (2) 求 一 辆 出 租 车 一 天 内 遇 到 的 红 灯 数 的 分 布. 解 设 这 辆 出 租 车 路 过 的 路 口 数 是 Y, 遇 到 的 红 灯 数 是 X. 每 到 一 个 路 口 相 当 于 作 一 次 试 验, 遇 到 红 灯 是 试 验 成 功.
48 42 第 二 章 随 机 变 量 和 概 率 分 布 (1) P (X = m Y = k) = C m k p m q k m, m = 0, 1,..., k, q = 1 p, (2) {Y = j}; j = 0, 1, 2,..., 构 成 完 备 事 件 组. 利 用 全 概 率 公 式 得 到 P (X = m) = = = P (Y = k)p (X = m Y = k) k=m k=m k=m = (λp)m e λ m! λ k k! e λ C m k p m q k m (λq) k m m!(k m)! e λ (λp) m j=0 = (λp)m e λ e λq m! 说 明 X 服 从 泊 松 分 布 Poisson(pλ). (λq) j j! = (λp)m e λp, m = 0, 1,. m! 超 几 何 分 布 H(n, M, N) 如 果 X 的 概 率 分 布 是 P (X = m) = Cm M Cn m N M, m = 0, 1,..., M, (2.8) C n N 就 称 X 服 从 超 几 何 分 布, 记 作 H(n, M, N). 注 意 对 k < 0 或 k > n, 约 定 C k n = 0. 名 称 超 几 何 分 布 来 自 超 几 何 函 数, 类 似 于 二 项 分 布 来 自 二 项 展 开 式. 例 2.4 N 件 产 品 中 恰 有 M 件 次 品, 从 中 任 取 n 件, 用 X 表 示 这 n 件 中 的 次 品 数, 则 X 服 从 超 几 何 分 布 (2.8). 如 果 这 批 产 品 充 分 多, 无 放 回 的 抽 取 和 有 放 回 的 抽 取 就 没 有 本 质 的 差 异 : P (X = m) = Cm M Cn m N M C n N C m n p m (1 p) n m, (p = M N )
49 2.3 连 续 型 随 机 变 量 43 几 何 分 布 如 果 随 机 变 量 X 有 如 下 的 分 布 P (X = k) = q k 1 p, k = 1, 2,, pq > 0, p + q = 1, (2.10) 就 称 X 服 从 参 数 是 p 的 几 何 分 布. 设 某 试 验 成 功 概 率 为 p, 独 立 地 重 复 此 试 验 直 到 第 一 次 成 功, 则 第 一 次 成 功 需 要 的 试 验 次 数 分 布 为 参 数 p 的 几 何 分 布 例 2.5 甲 向 一 个 目 标 射 击, 直 到 击 中 为 止. 用 X 表 示 首 次 击 中 目 标 时 的 射 击 次 数. 如 果 甲 每 次 击 中 目 标 的 概 率 是 p, 则 X 服 从 几 何 分 布 (2.10). 解 用 A j 表 示 甲 第 j 次 没 击 中 目 标, 由 {A j } 的 独 立 性 得 到 P (X = k) =P (A 1 A 2 A k 1 A k ) =q k 1 p, k = 1, 2,. (2.11) 2.3 连 续 型 随 机 变 量 连 续 型 随 机 变 量 定 义 在 线 段 上 随 机 投 点 的 位 置, 温 度 气 压 电 压 电 流 等 物 理 量 等 等, 理 论 上 可 以 在 取 到 某 个 区 间 任 何 实 数 值 这 样 取 值 的 随 机 变 量 称 为 连 续 型 随 机 变 量 定 义 3.1 设 X 是 随 机 变 量, 如 果 存 在 非 负 函 数 f(x) 使 得 对 任 何 满 足 a < b 的 a, b, 有 P (a < X b) = b a f(x) dx, (3.1) 就 称 X 是 连 续 型 随 机 变 量, 称 f(x) 是 X 的 概 率 密 度 函 数, 简 称 为 概 率 密 度 (probability density) 或 密 度. 分 布 密 度 性 质 设 f(x) 是 X 的 概 率 密 度, 则 f(x) 有 如 下 的 基 本 性 质. (a) f(x) dx = 1,
50 44 第 二 章 随 机 变 量 和 概 率 分 布 (b) P (X = a) = 0. 于 是 P (a < X b) = P (a X b), (c) 对 数 集 A( 严 格 意 义 下 要 求 可 测 性 ), P (X A) = f(x) dx. (3.2) 证 明 : (a) 由 可 得 (b) f(x)dx = P ( < X ) = 1, Pr(X = a) Pr(X (a ε, a]) = (c) 不 证 A a a ε f(x) dx 0, ε 0. 概 率 密 度 的 意 义 概 率 密 度 与 离 散 型 随 机 变 量 的 分 布 列 有 很 大 差 别, 分 布 列 p k = Pr(X = x k ) 本 身 就 是 X 取 x k 的 概 率 ; 连 续 型 随 机 变 量 取 任 何 一 个 特 定 值 的 概 率 都 等 于 零 ; f(x) 是 一 个 相 对 均 匀 分 布 的 概 念, 如 果 f(x 2 ) = 2f(x 1 ), 可 以 认 为 X 在 x 2 附 近 取 值 的 概 率 比 X 在 x 1 附 近 取 值 的 概 率 大 一 倍, 严 格 讲, 假 设 f(x) 在 x 1 和 x 2 处 连 续, Pr(x 2 ε < X x 2 + ε) Pr(x 1 ε < X x 1 + ε) = x2+ε x 2 ε x1 +ε f(x) dx f(x) dx f(x 2) f(x 1 ) = 2 x 1 ε 均 匀 分 布 (Uniform 分 布 ) U(a, b): 对 a < b, 如 果 X 的 密 度 是 1 f(x) =, x (a, b), b a (3.3) 0, x (a, b). 就 称 X 服 从 区 间 (a, b) 上 的 均 匀 分 布, 记 做 X U(a, b). 这 里 U 是 Uniform 的 缩 写. 明 显, 表 达 式 (3.3) 中 的 区 间 (a, b) 也 可 以 写 成 (a, b], [a, b) 或 [a, b].
51 2.3 连 续 型 随 机 变 量 45 采 用 (a, b) 的 示 性 函 数 (indicator function) 1, x (a, b), I (a,b) = 0, x / (a, b), 还 可 以 将 (3.3) 中 的 密 度 f(x) 写 成 f(x) = 1 b a I (a,b). 例 3.1 等 车 例 3.1 每 天 的 整 点 ( 如 9 点, 10 点, 11 点 等 ) 甲 站 都 有 列 车 发 往 乙 站. 一 位 要 去 乙 站 的 乘 客 在 9 点 至 10 点 之 间 随 机 到 达 甲 站. 用 Y 表 示 他 的 等 车 时 间, 计 算 他 候 车 时 间 小 于 30 分 钟 的 概 率. 解 题 目 中 随 机 到 达 的 含 义 指 在 等 长 的 时 间 段 中 到 达 的 可 能 性 相 同. 用 X 表 示 他 的 到 达 时 刻, X 在 0 至 60 分 钟 内 均 匀 分 布, 有 密 度 函 数 f(x) = 1 60 I (0,60). {Y < 30 分 钟 } 表 示 该 乘 客 在 9 : 30 至 10 : 00 之 间 到 达, 这 是 和 {30 < X 60} 等 价 的, 于 是 P (Y < 30 分 钟 ) = P (30 < X 60) = f(x)dx = 1 2. 指 数 分 布 (Exponential 分 布 ) E(λ): 对 正 常 数 λ, 如 果 X 的 密 度 是 λe λx, x 0, f(x) = (3.4) 0, x < 0, 就 称 X 服 从 参 数 λ 的 指 数 分 布, 记 做 X E(λ). 这 里 E 是 Exponential 的 缩 写. 通 常 还 把 (3.4) 简 记 为 f(x) = λe λx, x 0, 或 f(x) = λe λx I [0, ).
52 46 第 二 章 随 机 变 量 和 概 率 分 布 指 数 分 布 的 密 度 图 示 例 指 数 分 布 的 无 后 效 性 指 数 分 布 经 常 用 来 表 示 电 子 元 件 寿 命 事 件 到 来 间 隔 时 间 等 这 样 的 量 经 常 具 有 无 后 效 性, 即 已 经 存 活 ( 等 待 ) 了 多 长 时 间 对 还 会 再 存 活 ( 等 待 ) 多 长 时 间 没 有 影 响 非 负 随 机 变 量 : 若 随 机 变 量 X 满 足 Pr(X < 0) = 0 则 称 X 为 非 负 随 机 变 量 定 理 3.1 设 X 是 连 续 型 非 负 随 机 变 量, 则 X 服 从 指 数 分 布 的 充 分 必 要 条 件 是 对 任 何 s, t 0, 有 P (X > s + t X > s) = P (X > t). (3.5) 性 质 (3.5) 称 为 无 后 效 性. 无 后 效 性 是 指 数 分 布 的 特 征. 如 果 X 表 示 某 仪 器 的 工 作 寿 命, 无 后 效 性 (3.5) 的 解 释 是 : 当 仪 器 工 作 了 s 小 时 后 再 能 继 续 工 作 t 小 时 的 概 率 等 于 该 仪 器 刚 开 始 就 能 工 作 t 小 时 的 概 率. 说 明 该 仪 器 的 使 用 寿 命 不 随 使 用 时 间 的 增 加 发 生 变 化, 或 说 仪 器 是 永 葆 青 春 的. 一 般 来 说, 电 子 元 件 和 计 算 机 软 件 等 具 备 这 种 性 质, 它 们 本 身 的 老 化 是 可 以 忽 略 不 计 的, 造 成 损 坏 的 原 因 是 意 外 的 高 电 压, 计 算 机 病 毒 等 等. 青 花 盘 的 使 用 寿 命 也 可 被 认 为 有 无 后 效 性.
53 2.3 连 续 型 随 机 变 量 47 例 3.2 粒 子 到 来 间 隔 时 间 设 时 间 (0, t] 内 有 N(t) 个 粒 子 放 射 出 来 N(t) Poisson(µt) 设 X 为 第 一 个 粒 子 发 射 出 来 的 时 刻, 则 {X > t} = {N(t) = 0} µt (µt)0 Pr(X > t) = Pr(N(t) = 0) = e 0! = e µt 对 任 何 0 a < b 有 P (a < X 1 b) = P (X 1 > a) P (X 1 > b) =e µa e µb = b a µe µx dx. 即 X 的 概 率 密 度 为 f(x) = µe µx I [0, ) (x). 正 态 分 布 正 态 分 布 (Normal 分 布 ) N(µ, σ 2 ): 设 µ 是 常 数, σ 是 正 常 数. 如 果 X 的 密 度 是 f(x) = ( ) 1 exp (x µ)2, x R, (3.8) 2πσ 2 2σ 2 就 称 X 服 从 参 数 为 (µ, σ 2 ) 的 正 态 分 布, 记 做 X N(µ, σ 2 ). 这 里 N 是 Normal 的 缩 写. 特 别, 当 X N(0, 1) 时, 称 X 服 从 标 准 正 态 分 布 (standard normal distribution). 标 准 正 态 分 布 的 密 度 函 数 有 特 殊 的 地 位, 所 以 用 一 个 特 定 的 符 号 φ 表 示 : φ(x) = 1 ) exp ( x2, x R. (3.9) 2π 2 正 态 分 布 的 密 度 图 示 例
54 48 第 二 章 随 机 变 量 和 概 率 分 布 正 态 分 布 密 度 特 点 参 数 µ 是 密 度 的 中 心 和 最 大 值 点, 密 度 在 µ 两 侧 对 称 ; 参 数 σ 代 表 了 密 度 的 宽 度,σ 越 大 密 度 越 宽 ( 见 演 示 ) 正 态 分 布 的 随 机 变 量 X 具 有 大 部 分 值 靠 近 µ 的 特 点 ( 经 验 规 则 ): Pr( X µ σ) =68.27% Pr( X µ 2σ) =95.45% Pr( X µ 3σ) =99.73% Pr( X µ > 6σ) = 出 现 在 µ ± kσ(k=2,3,6 等 ) 外 的 点 认 为 是 比 较 值 得 注 意 的 点 记 Φ(x) = x φ(t) dt, Φ(x) 有 表 格 另 外 Φ( x) = 1 Φ(x) 对 X N(µ, σ 2 ), 正 态 分 布 的 历 史 Pr(X (a, b]) = Φ( b µ σ ) Φ(a µ σ ) 正 态 分 布 最 早 由 Gauss 在 研 究 测 量 误 差 时 得 到, 所 以 正 态 分 布 又 被 称 为 Gauss 分 布.
55 2.3 连 续 型 随 机 变 量 49 在 布 朗 运 动 的 研 究 中, 人 们 也 得 到 了 正 态 分 布. 正 态 分 布 在 概 率 论 和 数 理 统 计 中 有 特 殊 的 重 要 地 位. 事 实 表 明, 产 品 的 许 多 质 量 指 标, 生 物 和 动 物 的 许 多 生 理 指 标 等 都 服 从 或 近 似 服 从 正 态 分 布. 大 量 相 互 独 立 且 有 相 同 分 布 的 随 机 变 量 的 累 积 也 近 似 服 从 正 态 分 布 ( 参 考 二 项 分 布 当 n 较 大 时 的 概 率 分 布 图 形 ). 例 3.3 零 件 长 度 例 3.3 一 台 机 床 加 工 的 部 件 长 度 服 从 正 态 分 布 N(10, ). 当 部 件 的 长 度 在 10 ± 0.01 内 为 合 格 品, 求 一 部 件 是 合 格 品 的 概 率. 解 件 用 X 表 示 生 产 的 一 个 部 件 的 长 度, 则 X N(10, ). 事 { 0.01 X } 表 示 这 个 部 件 是 合 格 品. P ( 0.01 X ) =P ( 0.01 X ) 3 =Φ(1.67) Φ( 1.67) = 2Φ(1.67) 1 = = 这 个 概 率 令 人 太 不 满 意 了, 说 明 这 台 机 床 的 质 量 有 问 题. 以 后 会 知 道 质 量 问 题 可 以 由 参 数 σ 2 体 现 出 来 ( 参 考 习 题 2.17). Gamma 分 布 Gamma 分 布 Γ(α, λ): 设 α, λ 是 正 常 数, Γ(α) 由 积 分 Γ(α) = 0 x α 1 e x dx (3.14) 定 义. 如 果 X 的 密 度 是 λ α Γ(α) f(x) = xα 1 e λx, x 0, (3.15) 0, x < 0. 就 称 X 服 从 参 数 (α, λ) 的 Gamma 分 布, 记 做 X Γ(α, λ). 这 里 Γ 是 Gamma 的 简 写.
56 50 第 二 章 随 机 变 量 和 概 率 分 布 注 意 α = 1 时 Γ(1, λ) 即 E(λ) 伽 马 分 布 的 密 度 图 示 例 Gamma 分 布 的 历 史 英 国 著 名 统 计 学 家 Pearson 在 研 究 物 理, 生 物 及 经 济 中 的 随 机 变 量 时, 发 现 很 多 连 续 型 随 机 变 量 的 分 布 都 不 是 正 态 分 布. 这 些 随 机 变 量 的 特 点 是 只 取 非 负 值, 于 是 他 致 力 于 这 类 随 机 变 量 的 研 究. 从 1895 年 至 1916 年 间, Pearson 连 续 发 表 了 一 系 列 的 连 续 分 布 密 度 曲 线, 认 为 这 些 曲 线 可 以 包 括 常 见 的 单 峰 分 布, 其 中 就 有 Gamma 分 布. 在 气 象 学 中, 干 旱 地 区 的 年 季 或 月 降 水 量 被 认 为 服 从 Γ 分 布, 指 定 时 间 段 内 的 最 大 风 速 等 也 被 认 为 服 从 Γ 分 布. 例 3.4: 指 数 分 布 随 机 变 量 的 和 例 3.4 在 Poisson 分 布 的 例 子 中, 用 S k 表 示 从 开 始 到 观 测 到 第 k 个 α 粒 子 的 时 间, 可 以 证 明 S k 服 从 Γ(k, λ) 分 布.
57 2.4 概 率 分 布 函 数 概 率 分 布 函 数 概 率 分 布 函 数 概 率 分 布 函 数 为 了 计 算 事 件 {X (a, b]} 的 概 率, 如 果 X 是 离 散 型 随 机 变 量, 则 Pr(X (a, b]) = 如 果 X 是 连 续 型 随 机 变 量, 则 Pr(X (a, b]) = x k (a,b] b a p k f(x) dx 事 实 上, 如 果 我 们 定 义 F (x) = Pr(X x), 则 Pr(X (a, b]) = F (b) F (a) 这 样 的 F (x) 可 以 帮 助 我 们 计 算 {X (a, b]} 的 概 率 概 率 分 布 函 数 定 义 定 义 4.1 对 随 机 变 量 X, 称 x 的 函 数 F (x) = P (X x), x, (4.1) 为 X 的 概 率 分 布 函 数, 简 称 为 分 布 函 数 (distribution function), 也 称 为 累 积 (cumulative) 分 布 函 数 例 4.1 Φ(x) = x φ(t) dt 是 标 准 正 态 分 布 的 分 布 函 数. 离 散 型 随 机 变 量 的 分 布 函 数 从 定 义 看 出, 如 果 X 是 离 散 型 随 机 变 量, 有 概 率 分 布 p k = P (X = x k ), k = 1, 2,, (4.2) 则 X 的 分 布 函 数 F (x) = P (X x) = P ( {X = x j }) = p j (4.3) j: x j x j: x j x 是 单 调 不 减 的 阶 梯 函 数.
58 52 第 二 章 随 机 变 量 和 概 率 分 布 它 在 每 个 x j 有 跳 跃 p j. 这 时, 我 们 也 称 F (x) 是 分 布 列 {p j } 的 分 布 函 数. 见 二 项 分 布 B(10, 0.6) 的 分 布 函 数 图, 横 坐 标 是 x, 纵 坐 标 是 F (x). 从 图 形 可 以 看 出, F (x) 是 单 调 不 减 右 连 续 函 数. B(10,0.6) 的 分 布 函 数 图 连 续 型 随 机 变 量 的 分 布 函 数 如 果 X 是 连 续 型 随 机 变 量, 有 概 率 密 度 f(x), 则 F (x) = x f(t) dt (4.4) 是 连 续 函 数, 并 且 在 f(x) 的 连 续 点 x 有 f(x) = F (x). 我 们 也 称 F (x) 是 f(x) 分 布 函 数. 见 图 形 N(0,1), E(1.2), E(0.6), E(0.3) 分 布 函 数 图
59 2.4 概 率 分 布 函 数 53 分 布 函 数 性 质 分 布 函 数 F (x) 的 常 用 性 质 : (1) F 单 调 不 减 右 连 续, (2) F ( ) = 1, F ( ) = 0. 证 明 (1) 对 x < y, 单 调 不 减 性 由 {x < X y} = {X y} {X x} 和 P (x < X y) = P (X y) P (X x) = F (y) F (x) 0 得 到. 由 于 n 越 大, 集 合 {X 1/n} 越 小, 所 以 用 F 的 单 调 性 和 概 率 P 的 连 续 性 得 到 lim F (x + δ) = lim F (x + 1/n) δ 0 n = lim P (X x + 1/n) n =P ( n=1{x x + 1/n}) =P (X x) = F (x). (2) 由 F ( ) = P (X ) = P (Ω) = 1 和 F ( ) = P (X ) = P ( ) = 0 得 到 (2).
60 54 第 二 章 随 机 变 量 和 概 率 分 布 密 度 与 分 布 函 数 对 于 连 续 型 的 随 机 变 量, 密 度 函 数 通 过 (4.4) 唯 一 决 定 分 布 函 数. 定 理 4.1 设 X 的 分 布 函 数 F 连 续, 数 集 A 中 任 何 两 点 之 间 的 距 离 大 于 正 数 δ. 如 果 在 A 外 导 数 F (x) 存 在 且 连 续, 则 F (x), 当 x A, f(x) = (4.5) 0, 当 x A 是 X 的 密 度 函 数. 连 续 型 分 布 的 分 布 函 数 一 定 是 连 续 的, 分 布 函 数 如 果 不 连 续 就 不 是 连 续 型 分 布 除 了 连 续 型 分 布 和 离 散 型 分 布 以 外 还 存 在 其 它 类 型 的 分 布 如 : 零 过 多 数 据 的 分 布 常 见 分 布 的 分 布 函 数 均 匀 分 布 的 分 布 函 数 若 X U(0, 1), 则 其 分 布 密 度 为 f(x) = 1, x (0, 1) 其 分 布 函 数 为 0 x 0 F (x) = x 1 dt = x, x (0, 1) 0 1 x 1 若 X U(a, b), 则 其 分 布 密 度 为 f(x) = 1, x (a, b) b a 其 分 布 函 数 为 0 x a F (x) = x 1 x a dt =, x (a, b) a b a b a 1 x b
61 2.4 概 率 分 布 函 数 55 正 态 分 布 的 分 布 函 数 设 X N(0, 1), 则 X 的 分 布 函 数 为 Φ(x) = x φ(t) dt 其 中 φ(x) = 1 e x2 2 2π 设 X N(µ, σ 2 ), 下 一 节 将 证 明 其 分 布 函 数 为 F (x) = Φ( x µ σ ) 指 数 分 布 的 分 布 函 数 若 X E(λ), 则 其 分 布 密 度 为 f(x) = λe λx, x 0 其 分 布 函 数 为 F (x) = x 0 λe λt dt = 1 e λx, x 0 Gamma 分 布 的 分 布 函 数 若 X Γ(α, λ), 则 其 分 布 密 度 为 f(x) = λα Γ(α) xα 1 e λx, x 0 当 λ = 1 时 其 分 布 函 数 为 I α (x) = 1 Γ(α) x 0 t α 1 e t dt, t 0 称 为 不 完 全 Gamma 函 数, 是 没 有 解 析 表 达 式 的 对 一 般 Γ(α, λ) 其 分 布 函 数 为 F (x) = I α (λx), x 0
62 56 第 二 章 随 机 变 量 和 概 率 分 布 2.5 随 机 变 量 函 数 的 分 布 随 机 变 量 函 数 分 布 例 5.1 例 5.1 设 X 有 如 下 的 概 率 分 布 X P 求 Y = X 2 的 分 布. 解 Y 的 取 值 是 0, 1, 4, 9, 而 且 P (Y = 0) = P (X = 0) = 0.3; P (Y = 1) = P ( X = 1) = = 0.4; P (Y = 4) = P ( X = 2) = P (X = 2) = 0.1; P (Y = 9) = P (X = 3) = 0.2. 于 是 Y 有 分 布 Y P 例 5.2 均 匀 分 布 的 反 函 数 例 5.2 设 X U(0, 1), Φ 1 (p)(p (0, 1)) 是 Φ(x) 的 反 函 数, 求 Y = Φ 1 (X) 的 分 布. 解 F Y (y) = P (Φ 1 (X) y) = P (X Φ(y)) = Φ(y), x R, 所 以 Y N(0, 1). 例 5.3: 正 态 分 布 例 5.3 解 设 X N(µ, σ 2 ), 则 Y = (X µ)/σ 服 从 标 准 正 态 分 布 N(0, 1), 且 X 的 分 布 函 数 为 Φ( x µ σ ). 先 求 Y 的 分 布 函 数 F Y (y). 设 F X (x) 是 X 的 分 布 函 数, 则 F X 连 续 可 导, 并 且 有 F X(x) = 1 ( exp (x ) µ)2. 2πσ 2 2σ 2
63 2.5 随 机 变 量 函 数 的 分 布 57 于 是, 关 于 y 连 续 可 导, 对 y 求 导 数 得 到 概 率 密 度 F Y (y) =P (Y y) = P ((X µ)/σ y) =P (X yσ + µ) = F X (yσ + µ) f Y (y) =F Y (y) = F X(yσ + µ)σ = σ ( ) (yσ + µ µ) 2 exp 2πσ 2 2σ 2 = 1 2π e y2 /2 = φ(y). 定 理 说 明 Y N(0, 1). 因 为 F Y (y) = F X (µ + σy) 所 以 F X (x) = F Y ( x µ σ x µ ) = Φ( ). σ 定 理 5.1 设 X 有 密 度 函 数 f(x), D R, Y = g(x), P (Y D) = 1. 如 果 存 在 函 数 h i (y) 使 得 (1) 对 y D, {Y = y} = n i=1 {X = h i(y)}, (2) 每 个 h i (y) 是 D 到 其 值 域 D i 的 可 逆 映 射, 有 连 续 的 导 数, (3) 值 域 D 1, D 2,, D n 互 不 相 交, 则 Y 有 密 度 函 数 n i=1 f Y (y) = f(h i(y)) h i(y), y D, 0, y D. (5.1) 证 明 见 附 录 A3. 注 : 定 理 5.1 中 的 n 也 可 以 是. 计 算 随 机 变 量 的 函 数 的 概 率 密 度 的 更 直 接 方 法 请 参 考 附 录 D. 为 了 方 便 记 忆, 可 以 把 (5.1) 写 成 f Y (y) = n df X(h i (y)), y D. (5.2) dy i=1
64 58 第 二 章 随 机 变 量 和 概 率 分 布 推 论 推 论 : 设 随 机 变 量 X 取 值 于 C R, Y = g(x), g(x) 是 C 到 D R 的 一 一 变 换,x = h(y) = g 1 (y) 是 g(x) 的 反 函 数, 设 h(y) 有 连 续 的 导 数 则 f Y (y) = f(h(y)) h (y), y D. 例 5.4: 正 态 分 布 的 线 性 变 换 例 5.4 设 常 数 a 0, X N(µ, σ 2 ), 则 Y = ax + b 服 从 正 态 分 布 N(aµ + b, a 2 σ 2 ). 特 别 地, Y = X µ σ N(0, 1) 解 X 有 密 度 函 数 f X (x) = 1 ( exp (x ) µ)2. 2πσ 2 2σ 2 设 D = (, ), 则 P (Y D) = 1, {Y = y} = {ax + b = y} = {X = (y b)/a}. h(y) = (y b)/a 满 足 定 理 5.1( 或 推 论 ) 的 条 件, 有 导 数 h (y) = 1/a. 利 用 定 理 5.1 得 到 Y 的 概 率 密 度 f Y (y) =f X (h(y)) h (y) = 1 ( exp 2πσ 1 ( = exp 2πσ a [(y b)/a µ]2 2σ 2 ) 1 a (y b ) aµ)2 2a 2 σ 2 再 由 正 态 分 布 的 定 义 知 道 Y N(aµ + b, a 2 σ 2 ). 例 5.5: 正 态 分 布 的 平 方 设 X N(0, 1), 求 Y = X 2 的 分 布. 解 设 D = (0, ), 则 P (Y D) = P ( X > 0) = 1. {Y = y} = {X = y} + {X = y}, y D. h 1 (y) = y, h 2 (y) = y 满 足 定 理 5.1 的 条 件.
65 2.5 随 机 变 量 函 数 的 分 布 59 由 定 理 5.1 得 到 Y 的 密 度 f Y (y) =f X (h 1 (y)) h 1(y) + f X (h 2 (y)) h 2(y) = 1 ( exp 1 ) 1 2π 2 h2 1(y) + 1 ( exp 1 2π 2 h2 2(y) = 1 2πy e y/2, y (0, ). 2 y ) 1 2 y 例 5.6 设 r 是 正 数, X U(0, 2π), 求 Y = r cos X 的 密 度. 解 设 D = ( r, r), 则 P (Y D) = 1. 对 于 y D, 有 {Y = y} = {cos X = y/r} ={cos X = y/r, X (0, π)} {cos X = y/r, X (π, 2π)} ={cos X = y/r, X (0, π)} {cos(2π X) = y/r, X (π, 2π)} ={X = arccos(y/r)} {X = 2π arccos(y/r)}, h 1 (y) = arccos(y/r), h 2 (y) = 2π arccos(y/r) 满 足 定 理 5.1 的 条 件, 在 D 中 有 导 数 h 1 1(y) = r2 y, 1 2 h 2(y) = r2 y. 2 因 为 X 有 分 布 函 数 于 是 Y 有 密 度 函 数 F X (x) = x, x (0, 2π), 2π f Y (y) =f X (h 1 (y)) h 1(y) + f X (h 2 (y)) h 2(y) 1 = π r 2 y, 2 y ( r, r).
66 60 第 二 章 随 机 变 量 和 概 率 分 布
67 第 三 章 随 机 向 量 及 其 分 布 3.1 随 机 向 量 及 其 联 合 分 布 随 机 向 量 如 果 X, Y 都 是 随 机 变 量, 就 称 (X, Y ) 是 2 维 随 机 向 量, 简 称 为 随 机 向 量 (random vector). 对 于 随 机 向 量 (X, Y ), 我 们 称 F (x, y) = P (X x, Y y) (1.1) 为 (X, Y ) 的 联 合 概 率 分 布 函 数, 简 称 为 联 合 分 布 (joint distribution). 容 易 证 明, 联 合 分 布 函 数 F (x, y) 是 x, y 的 单 调 不 减 函 数. 对 随 机 事 件 A, B, A 1, A 2,, A n, 以 后 用 {A, B} 表 示 AB, 用 {A 1, A 2,, A n } 表 示 n A j. j=1 边 缘 分 布 设 F (x, y) 是 (X, Y ) 的 联 合 分 布, 则 X,Y 分 别 有 概 率 分 布 F X (x) =P (X x, Y ) = F (x, ), F Y (y) =P (X, Y y) = F (, y). 我 们 称 X 的 分 布 函 数 F X (x), Y 的 分 布 函 数 F Y (x) 为 (X, Y ) 的 边 缘 分 布 函 数 (marginal distribution function). 61
68 62 第 三 章 随 机 向 量 及 其 分 布 独 立 随 机 变 量 定 义 1.1 称 随 机 变 量 X, Y 独 立, 如 果 对 任 何 实 数 x, y, 事 件 {X x} 和 {Y y} 独 立. 按 照 定 义 1.1, X, Y 独 立 的 充 分 必 要 条 件 是 对 任 何 x, y, P (X x, Y y) = P (X x)p (Y y) 或 等 价 地 有 F (x, y) = F X (x)f Y (y). 定 义 1.2 设 X 1, X 2, 是 随 机 变 量, (1) 如 果 对 任 何 实 数 x 1, x 2,, x n, P (X 1 x 1, X 2 x 2,, X n x n ) =P (X 1 x 1 )P (X 2 x 2 ) P (X n x n ), 就 称 随 机 变 量 X 1, X 2,, X n 相 互 独 立. (2) 如 果 对 任 何 n, X 1, X 2,, X n 相 互 独 立, 就 称 随 机 变 量 的 序 列 {X j } = {X j : j = 1, 2, } 相 互 独 立. 这 时 称 {X j } 是 独 立 序 列 (independent sequence). 独 立 的 性 质 当 X 1, X 2,, X n 是 来 自 相 互 独 立 进 行 的 随 机 试 验 的 随 机 变 量 时, 它 们 相 互 独 立. 常 数 与 任 何 随 机 变 量 独 立. 定 理 1.1 设 X 1, X 2,, X n 相 互 独 立, 则 有 如 下 的 结 果. (1) 对 于 数 集 A 1, A 2,, A n, 事 件 {X 1 A 1 }, {X 2 A 2 }, {X n A n } 相 互 独 立, (2) 对 于 一 元 函 数 g 1 (x), g 2 (x),, g n (x), 随 机 变 量 Y 1 = g 1 (X 1 ), Y 2 = g 2 (X 2 ),, Y n = g n (X n ) 相 互 独 立, (3) 对 于 k 元 函 数 φ(x 1, x 2,, x k ), 随 机 变 量 φ(x 1, X 2,, X k ), X k+1, X k+2,, X n 相 互 独 立. 略 去 定 理 证 明.
69 3.2 离 散 型 随 机 向 量 及 其 分 布 63 n 元 随 机 向 量 如 果 X 1, X 2,, X n 都 是 随 机 变 量, 就 称 X = (X 1, X 2,, X n ) 是 n 维 随 机 向 量, 也 简 称 为 随 机 向 量. 定 义 1.3 设 X = (X 1, X 2,, X n ) 是 随 机 向 量, 称 R n 上 的 n- 元 函 数 F (x 1, x 2,, x n ) = P (X 1 x 1, X 2 x 2,, X n x n ) (1.2) 为 X = (X 1, X 2,, X n ) 的 联 合 分 布 函 数, 简 称 为 联 合 分 布. 设 随 机 向 量 (X 1, X 2,, X n ) 有 联 合 分 布 F (x 1, x 2,, x n ), X i 有 分 布 函 数 F i (x i ), 根 据 随 机 变 量 独 立 性 的 定 义 知 道, X 1, X 2,, X n 相 互 独 立 的 充 分 必 要 条 件 是 对 任 何 (x 1, x 2,, x n ), 有 F (x 1, x 2,, x n ) = F 1 (x 1 )F 2 (x 2 ) F n (x n ). (1.3) 二 元 离 散 型 随 机 向 量 3.2 离 散 型 随 机 向 量 及 其 分 布 如 果 X, Y 都 是 离 散 型 随 机 变 量, 就 称 (X, Y ) 是 离 散 性 随 机 向 量. 设 离 散 型 随 机 向 量 (X, Y ) 有 概 率 分 布 p i,j = P (X = x i, Y = y j ), i, j 1 (2.1) 则 X 和 Y 分 别 有 概 率 分 布 p i P (X = x i ) = P (X = x i, Y = y j ) = p i,j, i 1, j=1 j=1 q j P (Y = y j ) = P (X = x i, Y = y j ) = p i,j, j 1. (2.2) i=1 i=1 我 们 称 X 的 分 布 {p j }, Y 的 分 布 {q j } 为 (X, Y ) 的 边 缘 分 布. 概 率 分 布 表 当 (X, Y ) 的 概 率 分 布 的 规 律 性 不 强, 或 不 能 用 (2.2) 明 确 表 达 时, 还 可
70 64 第 三 章 随 机 向 量 及 其 分 布 以 用 表 格 的 形 式 表 达 如 下. p i,j y 1 y 2 y 3 y n {p i } x 1 p 1,1 p 1,2 p 1,3 p 1,n p 1 x 2 p 2,1 p 2,2 p 2,3 p 2,n p 2 x 3 p 3,1 p 3,2 p 3,3 p 3,n p 3 {q j } q 1 q 2 q 3 q n 1 这 时 p i 是 其 所 在 行 中 p i,j 之 和, q j 是 其 所 在 列 的 p i,j 之 和. 离 散 型 随 机 变 量 的 独 立 性 定 理 2.1 设 离 散 型 随 机 向 量 (X, Y ) 的 所 有 不 同 取 值 是 (x i, y j ), i, j 1, 则 X, Y 相 互 独 立 的 充 分 必 要 条 件 是 对 任 何 (x i, y j ), P (X = x i, Y = y j ) = P (X = x i )P (Y = y j ). (2.3) 定 理 2.1 证 明 如 果 (2.3) 成 立, 则 对 任 何 x, y R, 利 用 概 率 的 可 列 可 加 性 得 到 ( P (X x, Y y) =P {X = x i}, ) {Y = y j} i:x i x j:y j y = P (X = x i, Y = y j ) 于 是 X,Y 独 立. i:x i x = j:y j y i:x i x j:y j y = i:x i x P (X = x i ) =P (X x)p (Y y). P (X = x i )P (Y = y j ) j:y j y P (Y = y j ) 现 在 设 X, Y 独 立. 对 于 A = {x k k = i} 和 B = {y k k = j} 由 定 理 1.1 知 道 {X = x i } = {X A} 与 {Y = y j } = {Y B} 独 立, 所 以 有 (2.3) 成 立.
71 3.3 连 续 型 随 机 向 量 及 其 分 布 65 离 散 型 随 机 向 量 如 果 X 1, X 2,, X n 都 是 离 散 型 的 随 机 变 量, 就 称 X = (X 1, X 2,, X n ) 是 离 散 型 随 机 向 量. 如 果 X 所 有 的 不 同 取 值 是 (x 1j1, x 2j2,, x njn ), j 1, j 2,, j n 1, 就 称 p(j 1, j 2,, j n ) =P ( ) X 1 = x 1j1,, X n = x njn, j1, j 2,, j n 1, 是 X 的 联 合 概 率 分 布. 例 2.1( 多 项 分 布 ): 略 3.3 连 续 型 随 机 向 量 及 其 分 布 联 合 概 率 密 度 定 义 3.1 设 (X, Y ) 是 随 机 向 量, 如 果 有 R 2 上 的 非 负 可 积 函 数 f(x, y) 使 得 对 R 2 的 所 有 长 方 形 子 集 D = { (x, y) a < x b, c < y d } (3.1) 有 P ((X, Y ) D) = f(x, y) dxdy, (3.2) D 就 称 (X, Y ) 是 连 续 型 随 机 向 量, 并 称 f(x, y) 是 (X, Y ) 的 联 合 概 率 密 度 或 联 合 密 度 (joint density). 按 照 上 述 定 义, 连 续 型 随 机 向 量 有 概 率 密 度, 没 有 概 率 密 度 的 随 机 向 量 不 是 连 续 型 随 机 向 量. 设 f(x, y) 是 (X, Y ) 的 概 率 密 度. 可 以 证 明 对 R 2 的 子 区 域 B, 有 P ((X, Y ) B) = f(x, y)dx dy. (3.3) B 于 是 有 R 2 f(x, y)dx dy = P ((X, Y ) R 2 ) = 1. (3.4)
72 66 第 三 章 随 机 向 量 及 其 分 布 Fubini 定 理 定 理 3.1 (Fubini 定 理 ) 设 D 是 R n 的 子 区 域, φ(x 1, x 2,, x n ) 是 D 上 的 非 负 函 数 或 满 足 φ(x 1, x 2,, x n ) dx 1 dx 2 dx n <, D 则 对 区 域 D 上 的 n 重 积 分 φ(x 1, x 2,, x n )dx 1 dx 2 dx n D 可 以 进 行 累 次 积 分 计 算, 且 积 分 的 次 序 可 以 交 换. 边 缘 密 度 设 f(x, y) 是 随 机 向 量 (X, Y ) 的 概 率 密 度, 则 X 和 Y 也 都 是 连 续 型 随 机 变 量, 我 们 称 X, Y 各 自 的 概 率 密 度 为 f(x, y) 或 (X, Y ) 的 边 缘 密 度 (marginal density). 对 任 何 a < b, 有 P (a < X b) =P (a < X b, Y < ) b ( ) = f(x, y)dy dx. a 由 概 率 密 度 的 定 义 知 道 X 有 边 缘 密 度 f X (x) = 完 全 对 称 地 得 到 Y 的 边 缘 函 数 f Y (y) = 例 : 平 面 上 的 均 匀 分 布 f(x, y)dy. (3.5) f(x, y)dx. 设 D 是 R 2 的 子 区 域, 面 积 m(d) (0, ). 如 果 (X, Y ) 有 密 度 函 数 1, (x, y) D, m(d) f(x, y) = (3.6) 0, (x, y) D, 就 称 (X, Y ) 服 从 D 上 的 均 匀 分 布, 记 做 (X, Y ) U(D).
73 3.3 连 续 型 随 机 向 量 及 其 分 布 67 例 3.1 设 (X, Y ) 在 单 位 圆 D = {(x, y) x 2 + y 2 1} 内 均 匀 分 布, 求 X 和 Y 的 概 率 密 度. 解 用 I D 表 示 D 的 示 性 函 数, 即 则 (X, Y ) 有 联 合 密 度 f(x, y) = (1/π)I D. X 只 在 [ 1, 1] 中 取 值. 由 (3.5) 知 道 f X (x) = = 1 π = 1 π f(x, y)dy I {x2 +y 1}dy 2 I { y 1 x2 } dy = 2 π 1 x2, x 1. 同 理 得 到 Y 的 密 度 函 数 f Y (y) = 2 π 1 y2, y 1. 联 合 分 布 与 联 合 密 度 定 理 3.2 设 (X, Y ) 有 连 续 的 分 布 函 数 F (x, y), 定 义 2 F (x,y), 当 该 混 合 偏 导 数 存 在, x y f(x, y) = 0, 其 他. (3.7) 如 果 f(x, y)dxdy = 1, R 2 则 f(x, y) 是 (X, Y ) 的 联 合 密 度. 证 明 略. 没 有 密 度 的 例 子 例 3.2 续 型 随 机 变 量. 存 在 随 机 向 量 (X, Y ), 它 有 连 续 的 联 合 分 布 函 数, 但 不 是 连 解 设 X 在 [0, 1] 上 均 匀 分 布, Y = X. 则 (X, Y ) 有 连 续 的 联 合 分 布
74 68 第 三 章 随 机 向 量 及 其 分 布 函 数 ( 见 图 3.3.1) F (x, y) =P (X x, X y) =P (X min(x, y) ) 0, min(x, y) 0, = min(x, y), min(x, y) (0, 1], 1, min(x, y) > 1. (X, Y ) 只 在 D = {(x, y) 0 x = y 1} 上 取 值. 如 果 (X, Y ) 有 联 合 密 度 f(x, y), 则 有 矛 盾 的 结 果 1 = P ((X, Y ) D) = f(x, y)dxdy = 0. 所 以 (X, Y ) 没 有 联 合 密 度, 从 而 不 是 连 续 型 随 机 变 量. D 例 3.2 说 明 : F (x, y) 连 续, 除 去 有 限 条 直 线 外, 2 F (x,y) x y 条 件 还 不 能 保 证 (X, Y ) 有 联 合 密 度. 存 在 且 连 续 的 连 续 型 随 机 变 量 独 立 性 定 理 定 理 3.3 设 X, Y 分 别 有 概 率 密 度 f X (x), f Y (y). 则 X, Y 独 立 的 充 分 必 要 条 件 是 随 机 向 量 (X, Y ) 有 联 合 密 度 f(x, y) = f X (x)f Y (y). (3.8) 证 明 如 果 (3.8) 是 (X, Y ) 的 联 合 密 度, 则 有 x ( y ) P (X x, Y y) = f X (s)f Y (t)dt ds = x y f X (s)ds f Y (t)dt =P (X x)p (Y y). 由 定 义 1.1 知 道 X, Y 独 立. 如 果 X, Y 独 立, 对 a b, c d, 利 用 Fubini 定 理 得 到 P (a < X b, c < Y d) =P (a < X b)(c < Y d) = = b a b d a c f X (x)dx d c f Y (y)dy f X (x)f Y (y)dxdy.
75 3.3 连 续 型 随 机 向 量 及 其 分 布 69 按 联 合 分 布 密 度 定 义 可 知 f X (x)f Y (y) 是 (X, Y ) 的 联 合 分 布 密 度 均 匀 分 布 例 3.3 设 (X, Y ) 在 矩 形 D = {(x, y) a < x b, c < y d} 上 均 匀 分 布. 容 易 计 算 出 X 和 Y 的 概 率 密 度 如 下, f X (x) = f Y (y) = I D m(d) dy = 1 (b a) I (a,b], I D m(d) dx = 1 (d c) I (c,d]. 于 是 X U(a, b), Y U(c, d). 由 于 f X (x)f Y (y) = 1 m(d) I D 是 (X, Y ) 的 联 合 密 度, 所 以 X, Y 相 互 独 立. 反 之, 若 X U(a, b), Y U(c, d), 且 X, Y 相 互 独 立, 则 (X, Y ) 在 D 上 均 匀 分 布. 因 为 这 时 (X, Y ) 的 联 合 密 度 在 D 上 是 常 数. 对 于 非 长 方 形 上 的 均 匀 分 布 其 分 量 非 均 匀 分 布 联 合 概 率 计 算 的 例 子 例 3.4 两 人 某 天 在 1 点 至 2 点 间 独 立 地 随 机 到 达 某 地 会 面, 先 到 者 等 候 20 分 钟 后 离 去. 求 这 两 人 能 相 遇 的 概 率. 解 认 为 每 个 人 在 0 至 60 分 钟 内 等 可 能 到 达, 用 X, Y 分 别 表 示 他 们 的 到 达 时 间. 则 X U(0, 60), Y U(0, 60), X, Y 独 立. 利 用 1, x (0, 60), 60 f X (x) = f Y (x) = 0, x / (0, 60), 得 到 (X, Y ) 的 联 合 密 度 1/60 2, (x, y) D, f(x, y) = f X (x)f Y (y) = 0, (x, y) / D. 其 中 D = {(x, y) 0 x, y 60}. 定 义 ( 见 图 3.3.2) A = { (x, y) x y 20, (x, y) D }.
76 70 第 三 章 随 机 向 量 及 其 分 布 要 计 算 的 概 率 是 P ( X Y 20) = f(x, y)dxdy A = = A 二 维 正 态 分 布 例 3.5 ( 二 维 正 态 分 布 ) 设 µ 1, µ 2 是 常 数, σ 1, σ 2 是 正 常 数, ρ 是 ( 1, 1) 中 的 常 数. 如 果 随 机 向 量 (X, Y ) 有 概 率 密 度 1 { f(x, y) = 2πσ 1 σ exp 2 1 ρ 2 1 [ (x µ1 ) 2 2(1 ρ 2 ) 2ρ(x µ 1)(y µ 2 ) σ 1 σ 2 + (y µ 2) 2 σ 2 2 σ 2 1 ]}, (3.9) 就 称 (X, Y ) 服 从 二 维 正 态 分 布, 记 做 (X, Y ) N(µ 1, µ 2 ; σ 2 1, σ 2 2; ρ). 二 维 正 态 分 布 ( 续 ) 例 3.6 ( 接 例 3.5) 设 (X, Y ) 有 联 合 密 度 (3.9). 证 明
77 3.3 连 续 型 随 机 向 量 及 其 分 布 71 (1) X N(µ 1, σ 2 1), Y N(µ 2, σ 2 2), (2) X,Y 独 立 的 充 分 必 要 条 件 是 ρ = 0. 解 (1) 引 入 则 有 f X (x) = u = x µ 1 σ 1, v = y µ 2 σ 2, µ = ρu, σ = 1 ρ 2, σ 2 = 2πσ 1 σ 2 1 ρ 2 f(x, y)dy 1 = exp 2πσ 1 1 ρ 2 = 1 ( exp u2 2πσ1 = 1 2πσ1 exp = 1 2πσ1 exp 于 是 X N(µ 1, σ 2 1). [ exp [ ) 1 2πσ 1 ] 2(1 ρ 2 ) (u2 2ρuv + v 2 ) dv 1 ] 2(1 ρ 2 ) (v ρu)2 2 ( ) u2 ( 注 意 密 度 积 分 为 1) 2 ( (x µ 1) 2 ). 2σ 2 1 完 全 对 称 地 得 到 Y N(µ 2, σ 2 2). X,Y 独 立 的 充 分 必 要 条 件 是 exp [ (v ] µ)2 exp dv 2σ 2 ( ) u2 dv 2 f X (x)f Y (y) = f(x, y). (3.10) 当 ρ = 0, (3.10) 成 立, 于 是 X,Y 独 立. 当 X,Y 独 立, 有 (3.10) 成 立, 取 (x, y) = (µ 1, µ 2 ) 得 到 于 是 有 ρ = = 2πσ1 2πσ2 1 2πσ 1 σ 2 1 ρ 2, 即 证 明 了 X,Y 独 立 的 充 分 必 要 条 件 是 ρ = 0. 在 军 事 武 器 的 鉴 定 工 作 中, 如 果 用 (X, Y ) 表 示 某 型 号 导 弹 的 弹 落 点, 则 (X, Y ) 服 从 二 维 正 态 分 布. 这 时 (µ 1, µ 2 ) 是 目 标 的 地 理 坐 标, R = (X µ 1 ) 2 + (Y µ 2 ) 2 是 弹 落 点 至 目 标 的 距 离, 被 称 为 脱 靶 量. σ 2 1, σ 2 2 的 大 小 描 述 的 是 制 导 精 度.
78 72 第 三 章 随 机 向 量 及 其 分 布 n 元 连 续 型 随 机 向 量 定 义 3.2 设 X = {X 1, X 2,, X n } 是 随 机 向 量, 如 果 有 R n 上 的 非 负 可 积 函 数 f(x 1, x 2,, x n ) 使 得 对 R n 的 任 何 子 立 方 体 有 D = { (x 1, x 2,, x n ) a i < x i b i, 1 i n } P (X D) = f(x 1, x 2,, x n )dx 1 dx 2 dx n, D 就 称 X 是 连 续 型 随 机 向 量, 并 称 f(x 1, x 2,, x n ) 是 X 的 联 合 概 率 密 度 函 数, 简 称 为 联 合 密 度 或 概 率 密 度. 按 照 上 述 定 义, 连 续 型 随 机 向 量 有 概 率 密 度, 没 有 概 率 密 度 的 随 机 向 量 不 是 连 续 型 随 机 向 量. 设 f(x 1, x 2,, x n ) 是 X 的 概 率 密 度. 可 以 证 明 对 R n 的 子 集 B, 有 P (X B) = f(x 1, x 2,, x n )dx 1 dx 2 dx n. B 于 是 有 f(x 1, x 2,, x n )dx 1 dx 2 dx n = P (X R n ) = 1. R n n 个 随 机 变 量 的 独 立 性 定 理 定 理 3.4 设 对 每 个 i(1 i n), 随 机 变 量 X i 有 概 率 密 度 f i (x i ). 则 X 1, X 2,, X n 相 互 独 立 的 充 分 必 要 条 件 是 随 机 向 量 X = (X 1, X 2,, X n ) 有 联 合 密 度 f 1 (x 1 )f 2 (x 2 ) f n (x n ), (x 1, x 2,, x n ) R n. (3.11) 独 立 的 随 机 向 量 的 值 域 一 定 是 ( 超 ) 长 方 体 3.4 随 机 向 量 函 数 的 分 布 离 散 型 随 机 向 量 的 函 数 Poisson 分 布 例 例 4.1 ( 泊 松 分 布 的 可 加 性 ) 设 一 个 公 交 车 站 有 1 路, 2 路,, n 路 汽 车 停 靠. 早 7 点 至 8 点 之 间 乘 i 路 车 的 乘 客 到 达 数 X i 服 从 参 数 是 λ i 的 泊 松 分 布. 计 算 7 点 至 8 点 之 间
79 3.4 随 机 向 量 函 数 的 分 布 73 (1) 乘 1 和 2 路 汽 车 的 到 达 人 数 Z 2 = X 1 + X 2 的 概 率 分 布, (2) 到 达 总 人 数 Z n = X 1 + X X n 的 概 率 分 布. 解 Z 2 是 取 非 负 整 数 值 的 随 机 变 量, 对 于 k = 0, 1,, 有 P (Z 2 = k) =P (X 1 + X 2 = k) =P ( k {X 1 = i, X 2 = k i}) i=0 k = P (X 1 = i)p (X 2 = k i) = = i=0 k i=0 k i=0 λ i 1 i! λ k i 2 (k i)! e λ 1 λ 2 (X, Y 独 立 ) 1 k! Ci kλ i 1λ k i 2 e λ1 λ2 = (λ 1 + λ 2 ) k e (λ 1+λ 2 ). k! 说 明 到 达 的 总 人 数 Z 2 = X 1 + X 2 Poisson(λ 1 + λ 2 ). 现 在 假 设 Z n 1 Poisson(λ 1 + λ λ n 1 ). 利 用 Z n 1 和 X n 独 立, Z n = Z n 1 + X n 和 (1) 中 的 结 果 得 到 Z n Poisson(λ 1 + λ λ n ). 从 例 4.1 可 以 得 到 如 下 的 结 果 : 如 果 X 1, X 2,, X n 相 互 独 立, X i Poisson(λ i ), 则 Z n = X 1 +X 2 + +X n Poisson(λ 1 +λ 2 + +λ n ). 离 散 型 随 机 向 量 二 项 分 布 例 例 4.2 设 全 班 有 k 个 同 学, 在 相 同 的 条 件 下 每 个 同 学 重 复 进 行 同 一 试 验. 如 果 第 i 个 同 学 作 了 m i 次 试 验, 其 中 试 验 成 功 的 次 数 是 X i. 计 算 全 班 同 学 的 试 验 成 功 总 次 数 Z n = X 1 + X X n 的 概 率 分 布. 解 设 每 次 试 验 成 功 的 概 率 是 p, 全 班 同 学 一 共 进 行 了 m = m 1 + m m n 次 独 立 重 复 试 验, 试 验 成 功 的 总 次 数 Z n 服 从 二 项 分 布 B(m, p).
80 74 第 三 章 随 机 向 量 及 其 分 布 例 4.2 说 明 : 如 果 X i 服 从 二 项 分 布 B(m i, p) 分 布, X 1, X 2,, X n 相 互 独 立, 则 它 们 的 和 Z n = X 1 + X X n 服 从 二 项 分 布 B(m 1 + m m n, p). 当 然 也 可 以 按 照 例 4.1 的 方 法 推 导 出 上 述 结 果, 但 是 从 问 题 的 背 景 出 发 得 到 的 结 果 更 加 直 接 和 容 易 理 解. 连 续 型 随 机 向 量 函 数 的 分 布 设 随 机 向 量 (X, Y ) 有 联 合 密 度 f(x, y), u = u(x, y), v = v(x, y) 是 二 元 函 数, 则 U = u(x, Y ), V = v(x, Y ) 是 随 机 变 量, 于 是 可 以 计 算 U, V 的 概 率 分 布. 连 续 型 随 机 向 量 函 数 的 分 布 例 4.3 例 4.3 设 (X, Y ) 有 联 合 密 度 f(x, y), 则 Z = X + Y 有 密 度 函 数 f Z (z) = 特 别 当 X,Y 独 立 时, Z = X + Y 有 密 度 函 数 解 对 任 何 a < b, f Z (z) = P (a < Z b) =P (a < X + Y b) = I {a<x+y b} f(x, y)dxdy R 2 ( b x ) = f(x, y)dy dx = = b a a x f(x, z x)dx. (4.1) f X (x)f Y (z x)dx. (4.2) ( b ) f(x, z x)dz dx ( 取 y = z x) a ( ) f(x, z x)dx dz. (4.3) 由 密 度 函 数 的 定 义 知 道 最 后 一 式 括 号 中 以 z 为 自 变 量 的 函 数 是 Z = X + Y 的 密 度. 由 于 Z = Y + X, 所 以 Z 的 密 度 也 可 以 表 示 成 f Z (z) = f(z y, y)dy. (4.4)
81 3.4 随 机 向 量 函 数 的 分 布 75 连 续 型 随 机 向 量 函 数 的 分 布 例 4.4 例 4.4 设 (X, Y ) 有 联 合 密 度 f(x, y), 则 V = X Y 有 密 度 函 数 f V (v) = 特 别 当 X,Y 独 立 时, V = X Y 有 密 度 函 数 f V (v) = 证 明 同 例 4.3 f(x, x v)dx. (4.5) f X (x)f Y (x v)dx. (4.6) 例 4.5 Reileigh 分 布 例 4.5 设 X, Y 独 立, 都 服 从 标 准 正 态 分 布 N(0, 1), 求 脱 靶 量 Z = X2 + Y 2 的 分 布. 解 (X, Y ) 有 联 合 密 度 Z 在 [0, ) 取 值. f(x, y) = 1 + y 2 2π exp( x2 ). (4.7) 2 对 z 0, 利 用 公 式 (3.3) 得 到 Z 的 分 布 函 数 F Z (z) =P ( X 2 + Y 2 z) 1 + y 2 = 2π exp( x2 )dxdy 2 = 1 2π { 2π 0 x 2 +y 2 z} z dθ 0 e r2 /2 r dr ( 取 x = r cos θ, y = r sin θ, Jacobi=r) z = e r2 /2 r dr. 0 F Z (z) 连 续, 求 导 得 到 Z 的 密 度 函 数 f Z (z) = ze z2 /2, z 0. (4.8) (4.8) 称 为 瑞 利 (Rayleigh) 分 布 密 度, 于 是 脱 靶 量 Z 服 从 瑞 利 分 布.
82 76 第 三 章 随 机 向 量 及 其 分 布 随 机 向 量 函 数 的 联 合 密 度 定 理 定 理 4.1 设 (X, Y ) 有 联 合 密 度 f(x, y), U = u(x, Y ), V = v(x, Y ) 是 (X, Y ) 的 函 数, D 是 平 面 上 的 区 域 使 得 P ((U, V ) D) = 1. 如 果 有 D 上 的 函 数 x i = x i (u, v), y i = y i (u, v), i = 1, 2,, n, 使 得 以 下 条 件 成 立, (1) 对 (u, v) D, 有 {U = u, V = v} = n i=1 {X = x i, Y = y i }, (2) 每 个 x i = x i (u, v), y i = y i (u, v) (4.9) 是 D 到 其 值 域 D i 的 可 逆 映 射, 有 连 续 的 偏 导 数, 并 且 雅 可 比 (Jacobi) 行 列 式 (x i, y i ) 0, (u, v) D, i = 1, 2, n, (u, v) (3) 集 合 D 1, D 2,, D n 互 不 相 交, 则 (U, V ) 有 联 合 密 度. n i=1 g(u, v) = f(x i(u, v), y i (u, v)) (x i,y i ) (u,v), (u, v) D, 0, (u, v) D. (4.10) 独 立 同 分 布 定 义 4.1( 独 立 同 分 布 随 机 变 量 列 ) 如 果 随 机 变 量 X 1, X 2,, X n 相 互 独 立 并 且 有 相 同 的 分 布, 就 称 它 们 独 立 同 分 布 (independent and identically distributed), 简 称 为 i.i.d..
83 3.4 随 机 向 量 函 数 的 分 布 77 例 4.6 例 4.6 设 X, Y 独 立 都 服 从 标 准 正 态 分 布 N(0, 1), (R, Θ) 由 极 坐 标 变 换 X = R cos Θ, Y = R sin Θ 决 定. 求 (R, Θ) 的 联 合 密 度. 解 (X, Y ) 有 联 合 密 度 (4.7). 定 义 D = {(r, θ) r > 0, θ [0, 2π)}. 则 P ((R, Θ) D) = 1. : x = r cos θ, y = r sin θ 建 立 了 D 到 D 1 = {(x, y) (x, y) 0} 的 可 逆 变 换. 对 (r, θ) D, 利 用 {R = r, Θ = θ} = {X = x, Y = y}, (x, y) (r, θ) = r > 0, 得 到 (R, Θ) 的 联 合 密 度 R 和 Θ 分 别 有 概 率 密 度 g R (r) = g Θ (θ) = g(r, θ) = f(r cos θ, r sin θ)r = 1 2π r exp( r2 /2), (r, θ) D. 2π 0 0 g(r, θ)dθ = r exp( r2 2 )I (0, ), g(r, θ)dr = 1 2π I [0,2π). (4.11) 从 g(r, θ) = g R (r)g Θ (θ), (r, θ) D. 知 道 R 和 Θ 独 立. R 服 从 瑞 利 分 布, Θ 服 从 [0, 2π) 上 的 均 匀 分 布.
84 78 第 三 章 随 机 向 量 及 其 分 布 例 4.7 设 X, Y 独 立 同 分 布, 都 服 从 标 准 正 态 分 布, 求 U = X/Y, V = X 2 +Y 2 的 联 合 密 度. 解 设 D = {(u, v) v > 0, < u < }, 则 P ((U, V ) D) = 1. 对 (u, v) D, 函 数 x = u v, y = v 1+u 2 1+u 2 使 得 {U = u, V = v} ={X/Y = u, X 2 + Y 2 = v} ={X = x, Y = y} + {X = x, Y = y}. 可 以 计 算 (x, y) J = (u, v) = v u2 v 1+u 2 (1+u 2 ) 3/2 u v u 2 v 1+u 2 1 (1+u 2 ) 3/2 2 v 1+u 2 1 = 2(1 + u 2 ) u 2 2(1 + u 2 ) + u 2 2 2(1 + u 2 ) 2 1 = 2(1 + u 2 ). 再 利 用 定 理 4.1 得 到 (U, V ) 的 联 合 密 度 g(u, v) =f(x, y) J + f( x, y) J = 1 2 exp( v/2) 1, v 0, u (, ). π(1 + u 2 ) g(u, v) 说 明 U, V 独 立, V 服 从 参 数 是 1/2 的 指 数 分 布, U 有 密 度 1/[π(1 + u 2 )]. 这 时 称 U 服 从 柯 西 分 布. 3.5 极 大 极 小 值 的 分 布 次 序 统 计 量 在 研 究 产 品 的 使 用 寿 命 时, 经 常 需 要 进 行 寿 命 试 验. 用 X 1, X 2,, X n (5.1) 分 别 表 示 第 1, 2,, n 件 产 品 的 使 用 寿 命.
85 3.5 极 大 极 小 值 的 分 布 79 在 时 间 t = 0 时 对 这 n 件 产 品 开 始 进 行 寿 命 试 验. 用 X (1) 表 示 第 一 个 寿 终 的 产 品 的 使 用 寿 命, 用 X (2) 表 示 第 二 个 寿 终 的 产 品 的 使 用 寿 命,, 用 X (n) 表 示 第 n 个 ( 最 后 一 个 ) 寿 终 的 产 品 的 使 用 寿 命 则 每 个 X (i) 都 是 随 机 变 量, 并 且 X (1) X (2) X (n). (5.2) 我 们 称 (5.2) 中 的 随 机 变 量 为 X 1, X 2,, X n 的 ( 从 小 到 大 ) 次 序 统 计 量 (order statistics). 我 们 称 X (1) 是 X 1, X 2, X n 的 极 小 值, 它 是 寿 命 最 短 的 产 品 的 使 用 寿 命 ; 称 X (n) 是 X 1, X 2, X n 的 极 大 值, 它 是 寿 命 最 长 的 产 品 的 使 用 寿 命. X (n) = max(x 1, X 2,, X n ), (5.3) X (1) = min(x 1, X 2,, X n ). 极 小 值 和 极 大 值 的 意 义 设 华 北 地 区 第 j 年 的 降 雨 量 是 X j, 则 X (50) = max(x 1, X 2,, X 50 ) 是 50 年 一 遇 的 最 大 降 雨 量, 也 是 50 年 中 涝 灾 最 严 重 的 那 一 年 的 降 雨 量. 同 理, X (1) = min(x 1, X 2,, X 50 ) 是 50 年 中 最 干 旱 的 那 一 年 的 降 雨 量. 明 显, X (1) X 1 X (50), X (1) 的 分 布 和 X 1 的 分 布 是 不 同 的, X (50) 的 分 布 和 X 1 的 分 布 也 是 不 同 的. 研 究 随 机 变 量 X (1), X (50) 的 概 率 分 布 是 有 意 义 的.
86 80 第 三 章 随 机 向 量 及 其 分 布 例 5.1 设 某 地 区 的 年 降 水 量 X 1, X 2,, 是 独 立 同 分 布 的, 有 公 共 的 分 布 函 数 F (x) 和 分 段 连 续 的 密 度 函 数 f(x), 求 50 年 一 遇 的 最 大, 最 小 降 雨 量 的 分 布 函 数 和 分 布 密 度. 解 取 n = 50. X (n) 有 分 布 函 数 F max (x) =P (X (n) x) =P (X 1 x, X 2 x,, X n x) =P (X 1 x)p (X 2 x) P (X n x) =[F (x)] n. F max (x) 连 续, 在 有 导 数 的 点 求 导 数 得 到 X n 的 密 度 f max (x) = F max(x) = n[f (x)] n 1 f(x). (5.4) X (1) 有 分 布 函 数 F min (x) =P (X (1) x) =1 P (X (1) > x) =1 P (X 1 > x, X 2 > x,, X n > x) =1 P (X 1 > x)p (X 2 > x) P (X n > x) =1 [1 F (x)] n. F min (x) 连 续, 在 有 导 数 的 点 求 导 数 得 到 X (1) 的 密 度 f min (x) = F min(x) = n[1 F (x)] n 1 f(x). (5.5) 例 5.2 某 家 庭 原 来 有 4 个 灯 泡 用 于 室 内 照 明, 新 装 修 后 有 24 个 灯 泡 用 于 室 内 照 明. 装 修 入 住 后 主 人 总 认 为 灯 泡 更 容 易 坏 了, 试 解 释 其 中 的 原 因. 解 设 所 有 灯 泡 的 使 用 寿 命 相 互 独 立, 且 服 从 指 数 分 布 Exp(λ). 用 X i 表 示 第 i 只 灯 泡 的 使 用 寿 命. 装 修 前 等 待 第 一 个 灯 泡 烧 坏 的 时 间 长 度 X 为 X = min{x 1, X 2,, X 4 }.
87 3.6 条 件 分 布 和 条 件 密 度 81 装 修 后 等 待 第 一 个 灯 泡 烧 坏 的 时 间 长 度 Y 为 Y = min{x 1, X 2,, X 24 }. 利 用 P (X > t) = e 4λt, P (Y > t) = e 24λt 可 以 分 别 得 到 X 和 Y 的 密 度 函 数 f X (t) = 4λe 4λt, 和 f Y (t) = 24λe 24λt. 所 以 X Exp(4λ), Y Exp(24λ). 容 易 计 算 当 λ = 1/(1500 小 时 ) 时, P (X > 400) =0.3442, P (Y > 400) = P (X > 200) =0.5866, P (Y > 200) = P (X > 100) =0.7651, P (Y > 100) = 从 中 不 难 看 出, Y 要 比 X 随 机 地 小 很 多. 装 修 前 使 用 200 小 时 不 换 灯 泡 的 概 率 是 58.7%, 装 修 后 使 用 200 个 小 时 不 换 灯 泡 是 不 大 可 能 的. 3.6 条 件 分 布 和 条 件 密 度 条 件 分 布 和 条 件 密 度 设 X = (X 1, X 2,, X n ), Y = (Y 1, Y 2,, Y m ) 是 随 机 向 量, 本 节 讨 论 已 知 X = (x 1, x 2,, x m ) 的 条 件 下, Y 的 概 率 分 布. 为 了 叙 述 的 简 单, 我 们 只 对 n = m = 1 的 情 况 详 细 讨 论. 离 散 型 随 机 变 量 的 条 件 分 布 设 (X, Y ) 是 离 散 型 随 机 向 量, 有 概 率 分 布 X, Y 分 别 有 边 缘 分 布 p ij = P (X = x i, Y = y j ) > 0, i, j = 1, 2,, (6.1) p i = P (X = x i ), q j = P (Y = y j ), i, j = 1, 2,. (6.2) 对 每 个 固 定 的 i, 由 条 件 概 率 公 式 得 到 条 件 概 率 P (Y = y j X = x i ) = P (X = x i, Y = y j ) P (X = x i ) = p ij p i, j = 1, 2,... (6.3) 定 义 6.1 称 (6.3) 为 条 件 X = x i 下, Y 的 条 件 概 率 分 布, 简 称 为 条 件 分 布 (conditional distribution).
88 82 第 三 章 随 机 向 量 及 其 分 布 例 6.1 甲 向 一 个 目 标 射 击, 用 S n 表 示 第 n 次 击 中 目 标 时 的 射 击 次 数. 如 果 甲 每 次 击 中 目 标 的 概 率 是 p = 1 q, 则 (X, Y ) = (S 1, S 2 ) 有 联 合 分 布 P (X = i, Y = j) =P ( 失 败 i 1 次, 第 i 次 击 中, 再 失 败 j i 1 次, 第 j 次 击 中 ) =p 2 q j 2, j > i 1. (6.4) 从 问 题 的 背 景 得 到 X 的 边 缘 分 布 ( 几 何 分 布 ) P (X = i) = pq i 1, i = 1, 2,, Y 的 边 缘 分 布 是 j 1 P (Y = j) = P (X = i, Y = j) i=1 p 2 q j 2 j 1 = i=1 =(j 1)p 2 q j 2, j = 2, 3,. 于 是 对 确 定 的 j( 2), 得 到 X 的 条 件 分 布 P (X = i Y = j) = p 2 q j 2 (j 1)p 2 q = 1, 1 i < j. (6.5) j 2 j 1 (6.5) 说 明 已 知 S 2 = j 时, S 1 在 {1, 2,, j 1} 中 的 取 值 是 等 可 能 的. 连 续 型 随 机 变 量 条 件 分 布 问 题 北 京 夏 季 的 高 温 闷 热 天 气 会 造 成 北 京 电 网 的 负 荷 过 高. 用 X 表 示 夏 季 未 来 某 天 的 最 高 气 温, 用 Y 表 示 同 一 天 北 京 电 网 的 最 大 负 荷, 可 以 认 为 (X, Y ) 是 连 续 型 随 机 向 量, 有 联 合 密 度 f(x, y). 如 果 已 有 对 X 的 预 测 值 x, 在 已 知 X = x 的 条 件 下 研 究 Y 的 概 率 分 布 是 有 实 际 意 义 的 工 作.
89 3.6 条 件 分 布 和 条 件 密 度 83 我 们 用 P (Y y X = x) 表 示 已 知 X = x 的 条 件 下, Y 的 分 布 函 数, 称 为 条 件 分 布 函 数. 注 意, 条 件 分 布 函 数 P (Y y X = x) 就 是 最 高 气 温 为 x 的 那 天 北 京 电 网 最 大 负 荷 的 概 率 分 布 函 数, 是 有 明 确 的 意 义 的. 不 能 直 接 按 条 件 概 率 公 式 理 解 连 续 型 随 机 变 量 的 条 件 分 布 推 导 如 何 计 算 连 续 型 随 机 变 量 的 条 件 分 布? 首 先 X,Y 分 别 有 边 缘 密 度 f X (x) = f(x, y)dy, f Y (y) = f(x, y)dx. 对 于 充 分 小 的 正 数 ε, 可 以 理 解 P (Y y x ε < X x) P (Y y X = x). 另 一 方 面, 如 果 f X (x) 在 x 连 续, f X (x) > 0, 并 且 x F (x, y) 存 在, 就 有 lim P (Y y x ε < X x) ε 0+ P (Y y, x ε < X x) = lim ε 0+ P (x ε < X x) = lim ε 0+ F (x,y) x = F X (x) x x = = = F (x, y) F (x ε, y) F X (x) F X (x ε) y f(x, t) dt f X (x) y y f(s, t)dtds f X (x) f(x, t) f X (x) dt
90 84 第 三 章 随 机 向 量 及 其 分 布 条 件 密 度 定 义 6.2 称 设 随 机 向 量 (X, Y ) 有 联 合 密 度 f(x, y), X 有 边 缘 密 度 f X (x), 若 在 x( 确 定 的 x) 处 f X (x) > 0, 就 称 P (Y y X = x) = y f(x, t) dt, y R (6.6) f X (x) 为 条 件 X = x 下, Y 的 条 件 分 布 函 数 (conditional distribution function), 简 称 为 条 件 分 布, 记 做 F Y X (y x). f Y X (y x) = f(x, y), y R, (6.7) f X (x) 为 条 件 X = x 下, Y 的 条 件 概 率 密 度, 简 称 为 条 件 密 度 (conditional density). 条 件 密 度 和 条 件 分 布 的 关 系 对 使 得 f X (x) > 0 的 x, (1)F Y X (y x) = P (Y y X = x) = y f Y X (t x) dt, y R, (2) 如 果 F Y X (y x) 关 于 y 连 续, 且 除 有 限 个 点 外 有 连 续 的 导 数, 则 f Y X (y x) = F y Y X(y x), 当 偏 导 数 存 在, 0, 当 偏 导 数 不 存 在, 是 X = x 下, Y 的 条 件 密 度 例 6.2 ( 接 例 3.1) 设 (X, Y ) 在 单 位 圆 D = {(x, y) x 2 + y 2 1} 内 均 匀 分 布, 则 X 和 Y 分 别 有 概 率 密 度 : f X (x) = 2 1 x2, x 1, 和 f Y (y) = 2 1 y2, y 1. π π f(x, y) = 1 π I D 是 (X, Y ) 的 联 合 密 度. 对 x ( 1, 1), Y 有 条 件 密 度 f Y X (y x) = I D πf X (x) = x 2, y 1 x 2. 说 明 已 知 X = x 后, Y 在 ( 1 x 2, 1 x 2 ) 上 均 匀 分 布.
91 3.6 条 件 分 布 和 条 件 密 度 85 例 6.3 设 炮 击 的 目 标 是 (µ 1, µ 2 ), 弹 落 点 的 坐 标 (X, Y ) 服 从 正 态 分 布 N(µ 1, µ 2 ; σ1, 2 σ2; 2 ρ). 已 知 X = x 时, 求 Y 的 条 件 密 度. 解 (X, Y ) 的 联 合 密 度 为 1 { f(x, y) = 2πσ 1 σ exp 2 1 ρ 2 1 [ (x µ1 ) 2 2(1 ρ 2 ) 2ρ(x µ 1)(y µ 2 ) σ 1 σ 2 + (y µ 2) 2 σ 2 2 σ 2 1 ]}, X 有 边 缘 分 布 N(µ 1, σ 2 1). X = x 时, Y 的 条 件 密 度 为 f(x, y) f Y X (y x) = f X (x) 1 ( = exp (y µ x) 2 2π(1 ρ2 )σ 2 2(1 ρ 2 )σ2 2 其 中 µ x = µ 2 + (ρσ 2 /σ 1 )(x µ 1 ). 说 明 已 知 X = x 时, Y N(µ x, (1 ρ 2 )σ 2 2). 当 X 和 Y 独 立 时, ρ = 0, 于 是 f Y X (y x) = f Y (y). ), (6.8) 布 朗 运 动 与 正 态 分 布 布 朗 运 动 描 述 浸 没 ( 或 悬 浮 ) 在 液 体 或 气 体 中 微 小 颗 粒 的 运 动, 这 种 现 象 由 英 国 植 物 学 家 Robert Brown 发 现, 由 Einstein 于 1905 年 作 出 解 释 : 微 粒 运 动 是 由 大 量 分 子 的 连 续 碰 撞 造 成 的. 自 1918 年 开 始, Wiener 发 表 了 一 系 列 的 论 文 对 布 朗 运 动 进 行 数 学 的 描 述. 所 以 布 朗 运 动 又 称 为 Wiener 过 程. 至 今 布 朗 运 动 已 经 是 量 子 力 学, 概 率 统 计, 金 融 证 券 等 研 究 中 最 重 要 的 随 机 过 程. 现 在 设 花 粉 的 微 粒 在 液 体 表 面 由 于 受 到 水 分 子 的 连 续 碰 撞 而 进 行 布 朗 运 动, 运 动 起 点 的 坐 标 是 (µ 1, µ 2 ). 用 (X, Y ) 表 示 花 粉 在 t 时 刻 的 坐 标, 则 (X, Y ) 服 从 二 维 正 态 分 布.
92 86 第 三 章 随 机 向 量 及 其 分 布
93 第 四 章 数 学 期 望 和 方 差 4.1 数 学 期 望 数 学 期 望 概 念 数 学 期 望 引 入 随 机 变 量 的 分 布 函 数 或 密 度 函 数 描 述 了 随 机 变 量 的 统 计 性 质, 从 中 可 以 了 解 随 机 变 量 落 入 某 个 区 间 的 概 率, 但 是 还 不 能 给 人 留 下 更 直 接 的 总 体 印 象. 例 如 用 X 表 示 某 计 算 机 软 件 的 使 用 寿 命, 当 知 道 X 服 从 指 数 分 布 E(λ) 后, 我 们 还 不 知 道 该 软 件 的 平 均 使 用 寿 命 是 多 少. 这 里 的 平 均 使 用 寿 命 应 当 是 一 个 实 数. 我 们 需 要 为 随 机 变 量 X 定 义 一 个 实 数, 这 个 数 就 是 数 学 期 望, 它 反 映 随 机 变 量 的 平 均 取 值. 演 示 : 不 同 参 数 的 指 数 分 布 的 期 望 值 不 同 参 数 的 指 数 分 布 的 期 望 值 Exponential density f(x) x 87
94 88 第 四 章 数 学 期 望 和 方 差 例 1.1 一 个 班 有 n = 126 的 学 生, 期 中 考 试 后 有 n j (0 j 100). 个 同 学 的 成 绩 是 j 分 用 x i 表 示 第 i 个 同 学 的 成 绩, 则 全 班 同 学 的 平 均 分 是 µ 1 n n x i = j n j = j n j n n. (1.1) i=1 j=0 j=0 现 在 从 班 中 任 选 一 个 同 学, 用 X 表 示 这 个 同 学 的 期 中 成 绩, 则 X 有 分 布 p j = P (X = j) = n j, 0 j 100. (1.2) n 随 机 变 量 X 的 概 率 分 布 就 是 该 班 期 中 考 试 成 绩 的 分 布, 所 以 X 的 数 学 期 望 应 当 定 义 成 平 均 分 µ. 用 E(X) 表 示 X 的 数 学 期 望 时, 应 当 有 100 E(X) = j n 100 j n = jp j. j=0 j=0 例 1.2 设 X 有 概 率 分 布 X p 作 为 X 的 可 能 值 的 平 均 数, ( )/2 = 50.5 并 不 能 代 表 X 的 取 值 的 平 均. 对 X 进 行 N 次 独 立 重 复 观 测. 由 于 频 率 是 概 率 的 估 计, 所 以 当 N 充 分 大, 观 测 到 1 的 比 例 大 约 是 0.01, 观 测 到 100 的 比 例 大 约 是 于 是 对 X 的 单 次 平 均 观 测 值 大 约 是 = 这 就 说 明 用 E(X) = = 表 示 X 的 平 均 值 是 合 理 的.
95 4.1 数 学 期 望 89 数 学 期 望 定 义 离 散 型 定 义 1.1 设 X 有 概 率 分 布 p j = P (X = x j ), j = 0, 1,, 只 要 级 数 j=0 x j p j 收 敛, 就 称 E(X) = x j p j (1.3) 为 X 或 分 布 {p j } 的 数 学 期 望 (expected value ) 或 均 值 (mean). 在 定 义 1.1 中 要 求 j=0 x j p j 收 敛 的 原 因 是 要 使 (1.3) 中 的 级 数 有 确 切 的 意 义. 当 所 有 的 x j 非 负 时, 如 果 (1.3) 中 的 级 数 是 无 穷, 由 (1.3) 定 义 的 E(X) 也 有 明 确 的 意 义, 它 表 明 X 的 平 均 取 值 是 无 穷. 这 时 也 称 X 的 数 学 期 望 是 无 穷. 不 难 看 出, 只 取 有 限 个 值 的 随 机 变 量 的 数 学 期 望 总 是 存 在 的. j=0 数 学 期 望 的 重 心 解 释 在 定 义 1.1 中, 将 p j 视 为 横 坐 标 x j 处 的 质 量, 由 (x j µ)p j = j=1 知 道 {p j } 的 重 心 是 µ. x j p j µ = 0, j=1 所 以 数 学 期 望 E(X) 是 X 的 分 布 {p j } 的 重 心. 对 于 有 概 率 密 度 f(x) 的 连 续 型 随 机 变 量 X, 我 们 也 用 f(x) 和 横 轴 所 夹 面 积 的 ( 横 坐 标 的 几 何 ) 重 心 定 义 X 的 数 学 期 望. 设 µ 是 所 述 的 重 心, 如 果 就 有 (x µ)f(x)dx = x f(x)dx <, (1.4) 于 是 µ = xf(x)dx 是 所 述 的 重 心. 参 见 前 面 不 同 参 数 的 指 数 分 布 的 密 度 图 xf(x)dx µ = 0.
96 90 第 四 章 数 学 期 望 和 方 差 数 学 期 望 定 义 连 续 型 定 义 1.2 设 X 是 有 概 率 密 度 f(x) 的 随 机 变 量, 如 果 下 式 成 立, x f(x)dx <, (1.4) 就 称 xf(x)dx (1.5) 为 X 或 f(x) 的 数 学 期 望 或 均 值. 和 离 散 时 的 情 况 一 样, 在 定 义 1.2 中 要 求 (1.4) 的 原 因 是 要 使 (1.5) 中 的 积 分 有 确 切 的 意 义. 当 X 非 负 时, 如 果 (1.4) 中 的 积 分 是 无 穷, 由 (1.5) 定 义 的 E(X) 也 有 明 确 的 意 义, 它 表 明 X 的 平 均 取 值 是 无 穷. 这 时 也 称 X 的 数 学 期 望 是 无 穷. 由 于 随 机 变 量 的 数 学 期 望 由 随 机 变 量 的 概 率 分 布 唯 一 决 定, 所 以 也 可 以 对 概 率 分 布 定 义 数 学 期 望. 概 率 分 布 的 数 学 期 望 就 是 以 它 为 概 率 分 布 的 随 机 变 量 的 数 学 期 望. 有 相 同 分 布 的 随 机 变 量 必 有 相 同 的 数 学 期 望. 例 1.3 某 省 的 体 育 彩 票 中, 有 顺 序 的 7 个 数 字 组 成 一 个 号 码, 称 为 一 注. 7 个 数 字 中 的 每 个 数 字 都 选 自 0, 1, 2,, 9, 可 以 重 复. 如 果 彩 票 一 元 一 张, 且 全 体 不 同 的 彩 票 中 只 有 一 个 大 奖, 中 大 奖 获 得 奖 金 300 万 元, 上 税 20%, 甲 购 买 一 注 时 期 望 盈 利 多 少? 解 用 X 表 示 甲 购 买 一 注 时 的 收 益, 中 大 奖 获 利 % = 240 万, 于 是 P (X = 240 万 1) = 10 7, P (X = 1) = X 的 数 学 期 望 是 E(X) = 1 ( ) = 于 是 每 购 买 一 注, 甲 期 望 获 得 0.76 元. 也 就 是 说, 每 买 一 注, 平 均 损 失 0.76 元.
97 4.1 数 学 期 望 91 例 1.4 在 澳 门 赌 场, 有 很 多 人 在 赌 廿 一 点 时 顺 便 押 对 子. 其 规 则 如 下 : 庄 家 从 6 副 ( 每 副 52 张 ) 扑 克 中 随 机 发 给 你 两 张. 如 果 你 下 注 a 元, 当 得 到 的 两 张 牌 是 一 对 时, 庄 家 赔 你 十 倍, 否 则 输 掉 你 的 赌 注. 如 果 你 下 注 100 元, 你 和 庄 家 在 每 局 中 各 期 望 赢 多 少 元? 解 : 用 X, Y 分 别 表 示 你 和 庄 家 在 一 局 中 的 获 利, a = 100. 则 P (X = 10a) = 13C2 4 6 C = 0.074, P (X = a) = , 于 是, 你 期 望 赢 EX = 10a a ( ) = 0.186a = 18.6( 元 ). 庄 家 期 望 赢 18.6 元, 这 是 因 为 EY = 10a a ( ) = EX. 当 只 使 用 一 副 扑 克, 可 以 计 算 出 你 每 局 期 望 赢 元 常 见 分 布 数 学 期 望 两 点 分 布 B(1, p) P (X = 1) = p, P (X = 0) = 1 p, 则 E(X) = 1 p + 0 (1 p) = p. 设 A 是 事 件, I A 是 A 的 示 性 函 数, 即 1, 当 A 发 生, I A = 0, 当 A 不 发 生. 则 I A 服 从 两 点 分 布, 且 P (I A = 1) = P (A). 于 是 E(I A ) = P (I A = 1) = P (A).
98 92 第 四 章 数 学 期 望 和 方 差 二 项 分 布 B(n, p) 设 q = 1 p, 由 p j = P (X = j) = C j np j q n j, 0 j n, 得 到 E(X) = =np n j=1 n 1 =np n jcnp j j q n j j=0 C j 1 n 1p j 1 q n j ( 用 jc j n = nc j 1 n 1) Cn 1p k k q n 1 k ( 用 k = j 1) k=0 =np(p + q) n 1 =np. 说 明 在 n 次 独 立 重 复 试 验 中, 成 功 的 概 率 p 越 大, 平 均 成 功 的 次 数 越 多. 泊 松 分 布 Poisson(λ) 由 得 到 E(X) = P (X = k) = λk k! e λ, k = 0, 1,, k=0 k λk k! e λ = λ k=1 λ k 1 (k 1)! e λ = λ. 说 明 参 数 λ 是 泊 松 分 布 Poisson(λ) 的 数 学 期 望. 回 忆 在 2.2 的 例 2.1 中, 7.5 秒 内 放 射 性 钋 平 均 放 射 出 3.87 个 α 粒 子, 7.5 秒 内 放 射 出 的 粒 子 数 X Poisson(3.87). 几 何 分 布 服 从 几 何 分 布 的 随 机 变 量 X 有 离 散 分 布 P (X = j) = pq j 1, j = 1, 2,.
99 4.1 数 学 期 望 93 X 的 数 学 期 望 E(X) = j=1 jpq j 1 ( ) =p q j j=0 ( 1 =p 1 q = 1 p. ) 结 论 说 明 单 次 试 验 中 的 成 功 概 率 p 越 小, 首 次 成 功 所 需 要 的 平 均 试 验 次 数 就 越 多. 指 数 分 布 E(λ) 由 X 的 概 率 密 度 f(x) = λe λx, x > 0 得 到 E(X) = xf(x)dx = 0 xλe λx dx = 1 λ. 在 3.5 的 例 5.2 中, X 1 E(λ), 1/λ = 1500( 小 时 ), 所 以 单 个 灯 泡 的 平 均 使 用 寿 命 是 1500 小 时. 家 里 用 4 只 灯 泡 时, X = min{x 1, X 2,, X 4 } E(4λ), 于 是 平 均 使 用 1500/4 = 375 小 时 要 换 一 个 灯 泡 ; 家 里 用 24 只 灯 泡 时, Y = min{x 1, X 2,, X 24 } E(24λ), 平 均 使 用 1500/24 = 62.5 小 时 要 换 一 个 灯 泡. Γ(α, λ) 分 布 由 X 的 概 率 密 度 f(x) = λα Γ(α) xα 1 e λx, x > 0,
100 94 第 四 章 数 学 期 望 和 方 差 得 到 E(X) = = 0 xf(x)dx λ α = 1 Γ(α)λ 0 Γ(α + 1) = Γ(α)λ Γ(α) xα e λx dx t α e t dt = α λ. ( 用 Γ(α + 1) = αγ(α)) ( 用 t = λx) 若 X 表 示 寿 命, 则 平 均 寿 命 EX = α/λ 和 α 成 正 比, 和 λ 成 反 比. 这 和 f(x) 的 形 状 是 一 致 的 ( 演 示 :Gamma 分 布 密 度 ). 当 α = 1, 又 得 到 指 数 分 布 E(λ) 的 数 学 期 望 1/λ. 对 称 分 布 的 期 望 定 理 1.1 设 X 的 数 学 期 望 有 限, 概 率 密 度 f(x) 关 于 µ 对 称 : f(µ + x) = f(µ x), 则 E(X) = µ. 证 这 时 g(t) = tf(t + µ) 是 奇 函 数 : g( t) = g(t). 于 是 E(X) = = =µ + =µ. xf(x)dx µf(x)dx + tf(t + µ)dt (x µ)f(x µ + µ)dx 定 理 1.1 的 结 论 是 自 然 的, 因 为 只 要 f(x) 关 于 µ 对 称, 则 µ 就 是 曲 线 f(x) 和 x 轴 所 夹 面 积 的 几 何 重 心 的 横 坐 标. 推 论 1.2 正 态 分 布 N(µ, σ 2 ) 的 数 学 期 望 是 µ, 均 匀 分 布 U(a, b) 的 数 学 期 望 是 (a + b)/ 随 机 向 量 函 数 的 数 学 期 望 随 机 向 量 函 数 的 数 学 期 望 4.2 数 学 期 望 的 性 质
101 4.2 数 学 期 望 的 性 质 95 定 理 2.1 设 X = (X 1, X 2,, X n ) 是 随 机 向 量, x = (x 1, x 2,, x n ) R n. (1) 如 果 X 有 联 合 密 度 f(x) = f(x 1, x 2,, x n ), 实 函 数 g(x) 使 得 g(x) f(x)dx 1 dx 2 dx n <, R n 则 Y = g(x) 有 数 学 期 望 E(Y ) = g(x)f(x)dx 1 dx 2 dx n ; (2.1) R n (2) 如 果 X 是 离 散 型 随 机 向 量, 有 概 率 分 布 p j1,j 2,,j n = P ( X = (x j1, x j2,, x jn ) ), j 1, j 2,, j n 1, 实 函 数 h(x) 使 得 h(x j1, x j2,, x jn ) p j1,j 2,,j n <, j 1,j 2,,j n 则 Y = h(x) 有 数 学 期 望 E(Y ) = h(x j1, x j2,, x jn )p j1,j 2,,j n. (2.2) j 1,j 2,,j n 推 论 推 论 设 g(x) 为 一 元 函 数, 若 随 机 变 量 X 有 密 度 f(x) 且 g(x) f(x)dx < 则 Eg(X) = 若 随 机 变 量 X 有 概 率 分 布 列 g(x)f(x) dx; Pr(X = x k ) = p k, k = 1, 2,... 且 则 g(x k ) p k < k Eg(X) = g(x k )p k. k
102 96 第 四 章 数 学 期 望 和 方 差 例 2.1 设 X N(0, 1), 计 算 E(X 2 ). 解 X 有 概 率 密 度 f(x) = 1 2π exp( x 2 /2), 由 公 式 (2.1) 得 到 E(X 2 ) = 1 2π x 2 exp( x 2 /2)dx = 2 x 2 exp( x 2 /2)dx 2π 0 = 2 2π 0 = 2 π 0 2te t 1 2t dt ( 取 x = 2t) t 3/2 1 e t dt = 2 π Γ( ) = 2 π 1 2 Γ(1 2 ) ( 用 Γ(1 + α) = αγ(α)) =1. ( 用 Γ(1/2) = π) 例 2.2 设 X 在 (0, π/2) 上 均 匀 分 布, 计 算 E(cos X). X 有 概 率 密 度 f(x) = 2/π, x (0, π/2). 用 (2.1) 得 到 E(X) = f(x) cos x dx = 2 π π/2 0 cos x dx = 2 π. 例 2.3 设 X, Y 独 立 同 分 布 且 服 从 N(0, 1), Z = X 2 + Y 2. 计 算 E(Z). 解 (X, Y ) 有 联 合 密 度 f(x, y) = 1 2π exp ( x2 + y 2 ). 2
103 4.2 数 学 期 望 的 性 质 97 用 公 式 (2.1) 得 到 E(Z) = (x 2 + y 2 )f(x, y)dxdy R 2 = 1 R2 (x 2 + y 2 ) exp ( x2 + y 2 ) dxdy 2π 2 = 1 2π ( dθ r 3 exp( r2 2π ) dr x = r cos θ, 取 y = r sin θ 1 =2 3/2 t 3/2 e t 2t dt ( 取 r = 2t) =2 0 0 te t dt = 2. ) 例 2.4 (X, Y ) 在 单 位 圆 D = {(x, y) x 2 + y 2 1} 内 均 匀 分 布, 计 算 E(X), E(Y ). 解 (X, Y ) 有 联 合 密 度 f(x, y) = 1 π I D. 用 公 式 (2.1) 得 到 E(X) = xf(x, y)dxdy = 1 R π 2 对 称 地 得 到 E(Y ) = y 2 dy x dx = 0. 1 y 数 学 期 望 的 性 质 数 学 期 望 的 性 质 根 据 定 理 2.1, j=1 E X = x j p j, 当 p j = P (X = x j ), x f(x) dx, 当 X 有 密 度 f(x). 于 是, EX 有 限 的 充 分 必 要 条 件 是 E X <. 定 理 2.2 设 E X j < (1 j n), c 0, c 1,, c n 是 常 数, 则 有 以 下 结 果.
104 98 第 四 章 数 学 期 望 和 方 差 (1) 线 性 组 合 Y = c 0 + c 1 X 1 + c 2 X c n X n 的 数 学 期 望 存 在, 而 且 E(Y ) = c 0 + c 1 E(X 1 ) + c 2 E(X 2 ) + + c n E(X n ), (2.3) (2) 如 果 X 1, X 2,, X n 相 互 独 立, 则 Z = X 1 X 2 X n 的 数 学 期 望 存 在, 并 且 E(X 1 X 2 X n ) = E(X 1 )E(X 2 ) E(X n ), (3) 如 果 X 1 X 2, 则 E(X 1 ) E(X 2 ). 定 理 2.2 证 明 只 对 X = (X 1, X 2,, X n ) 有 联 合 密 度 f(x) 的 情 况 给 出 证 明. (1) 利 用 公 式 (2.1) 得 到 E Y = R n c 0 + n f(x)dx1 c j x j dx 2 dx n j=1 n c 0 + c j x j f(x)dx 1 dx 2 dx n j=1 R n n =c 0 + c j E X j <. j=1 再 利 用 公 式 (2.1) 得 到 E(Y ) = R n ( c 0 + n c j x j )f(x)dx 1 dx 2 dx n j=1 n =c 0 + c j x j f(x)dx 1 dx 2 dx n j=1 R n n =c 0 + c j E(X j ). j=1 (2) 这 时 f(x) = f 1 (x 1 )f 2 (x 2 ) f n (x n ), 其 中 f j (x j ) 是 X j 的 概 率 密 度. 利 用 公 式 (2.1) 和 Fubini 定 理 得 到 E Y = x 1 x 2 x n f(x)dx 1 dx 2 dx n R n = x 1 f 1 (x 1 )dx 1 x 2 f 2 (x 2 )dx 2 =E( X 1 )E( X 2 ) E( X n ) <. x n f n (x n )dx n
105 4.2 数 学 期 望 的 性 质 99 再 利 用 公 式 (2.1)) 和 Fubini 定 理 得 到 E(Y ) = x 1 x 2 x n f(x)dx 1 dx 2 dx n R n = x 1 f 1 (x 1 )dx 1 x 2 f 2 (x 2 )dx 2 x n f n (x n )dx n =E(X 1 )E(X 2 ) E(X n ). (3) 只 对 Y = X 2 X 1 有 概 率 密 度 g(y) 的 情 况 证 明. 由 Y 0, 知 道 对 y < 0 有 g(y) = 0. 于 是 用 (1) 得 到 E(X 2 ) E(X 1 ) = E(Y ) = 例 2.5( 二 项 分 布 B(n, p)) 0 yg(y) dy 0. 设 单 次 试 验 成 功 的 概 率 是 p, 问 n 次 独 立 重 复 试 验 中, 期 望 有 几 次 成 功? 解 引 入 1, 第 i 试 验 成 功, X i = 0, 第 i 次 试 验 不 成 功. 则 EX i = p, X = (X 1 + X X n ) 是 n 次 试 验 中 的 成 功 次 数, 期 望 的 成 功 数 是 EX = EX 1 + EX EX n = np. 这 里 X B(n, p). 可 见 X 的 数 学 期 望 是 指 对 X 的 期 望 值, 它 也 是 X 的 平 均 取 值. 例 2.6( 超 几 何 分 布 H(n, M, N)) N 件 产 品 中 有 M 件 正 品, 从 中 任 取 n 件, 期 望 有 几 件 正 品? 解 定 义 随 机 变 量 1, 第 i 次 取 得 正 品, X i = 0, 第 i 次 取 得 次 品. 则 无 论 是 否 有 放 回 的 抽 取, 总 有 EX i = M/N( 参 考 1.6 例 6.1). Y = X 1 + X X n 是 抽 到 的 正 品 数. 期 望 的 正 品 数 是 EY = EX 1 + EX EX n = nm/n.
106 100 第 四 章 数 学 期 望 和 方 差 本 例 中, 有 放 回 的 抽 取 时,Y B(n, M/N). 无 放 回 的 抽 取 时, Y 服 从 超 几 何 分 布 H(n, M, N)( 参 考 2.2 的 (4)). 例 2.7( 信 封 搭 配 ) 将 n 个 不 同 的 信 笺 随 机 放 入 n 个 写 好 地 址 的 信 封, 平 均 有 几 封 能 正 确 搭 配? 解 定 义 随 机 变 量 1, 第 i 封 信 正 确 搭 配, X i = 0, 第 i 封 信 没 有 正 确 搭 配. 则 EX i = P (X i = 1) = 1/n. Y = X 1 + X X n 是 正 确 搭 配 的 个 数, 于 是 平 均 正 确 搭 配 的 个 数 是 EY = EX 1 + EX EX n = n/n = 1. 本 例 说 明 无 论 有 多 少 个 信 封, 平 均 只 有 一 封 信 能 正 确 搭 配. 例 2.8 如 果 E X = 0, 则 P (X = 0) = 1. 证 用 I {n X >1} 表 示 事 件 {n X > 1} 的 示 性 函 数, 利 用 定 理 2.2 的 (3) 得 到 P ( X > 1/n) =P (n X > 1) =E(I {n X >1} ) E(n X I {n X >1} ) ne X =0. 由 概 率 的 连 续 性 得 到 P ( X > 0) = P ( n=1{ X > 1/n}) = lim P ( X > 1/n) = 0. n 最 后 得 到 P ( X = 0) = 1 P ( X > 0) = 1. 本 例 说 明 E X = 0 的 充 分 必 要 条 件 是 P (X = 0) = 1.
107 4.2 数 学 期 望 的 性 质 101 当 P (X = 0) = 1, 我 们 称 X = 0 以 概 率 1 发 生, 记 做 X = 0, wp1. 这 里 wp1. 表 示 with probability 1. 完 全 类 似 地, 我 们 把 P (X Y ) = 1 记 做 X Y, wp1. 当 P (A) = 1, 我 们 称 A 以 概 率 1 发 生. 不 难 理 解, 当 P (A) = 1, A 在 实 际 中 必 然 发 生. 以 概 率 1 发 生 又 称 作 几 乎 处 处 或 几 乎 必 然 (almost surely) 发 生, 用 a.s. 表 示. 例 2.9 设 商 店 每 销 售 一 吨 大 米 获 利 a 元, 每 库 存 一 吨 大 米 损 失 b 元, 假 设 大 米 的 销 量 Y 服 从 指 数 分 布 E(λ). 问 库 存 多 少 吨 大 米 才 能 获 得 最 大 的 平 均 利 润. 解 库 存 量 是 x 时, 利 润 是 ay b(x Y ), Y < x, Q(x, Y ) = ax, Y x. 用 I {Y <x} 表 示 事 件 {Y < x} 的 示 性 函 数, 用 I {Y x} 表 示 {Y x} 的 示 性 函 数, 就 可 以 将 Q(x, Y ) 写 成 Q(x, Y ) = [ay b(x Y )]I {Y <x} + axi {Y x}. 平 均 利 润 是 q(x) =EQ(x, Y ) = = x 0 Q(x, y)f Y (y)dy [ay b(x y)]f Y (y)dy + ax = a + b λ (1 e λx ) bx. ( 具 体 过 程 略 ) q(x) 的 最 大 值 点 是 所 要 的 库 存 数. 由 x f Y (y)dy q (x) = (a + b)e λx b = 0, q (x) = (a + b)λe λx < 0, 得 到 x = λ 1 ln[(a + b)/b] 是 q(x) 的 最 大 值 点. 于 是 库 存 λ 1 ln[(a + b)/b] 吨 大 米 可 以 获 得 最 大 平 均 利 润.
108 102 第 四 章 数 学 期 望 和 方 差 中 心 矩 和 原 点 矩 定 义 2.1 设 X 是 随 机 变 量, m 是 正 整 数. 如 果 E X m <, 就 称 EX m 为 X 的 m 阶 原 点 矩, 称 E(X EX) m 为 X 的 m 阶 中 心 矩. 当 m > 2 时, 我 们 将 原 点 矩 和 中 心 矩 统 称 为 高 阶 矩. 方 差 定 义 4.3 随 机 变 量 的 方 差 方 差 用 来 描 述 分 布 的 分 散 程 度, 或 宽 窄 定 义 3.1 如 果 随 机 变 量 X 的 数 学 期 望 µ = EX 有 限, 就 称 E(X µ) 2 (3.1) 为 X 的 方 差 (variance), 记 做 Var(X) 或 σ XX. 当 Var(X) <, 称 X 的 方 差 有 限. 称 σ X = Var(X) 为 X 的 标 准 差. 设 X 是 对 长 度 为 µ 的 物 体 的 测 量 值, 则 X µ 是 测 量 误 差, (X µ) 2 是 测 量 误 差 的 平 方. 如 果 测 量 仪 器 无 系 统 偏 差 ( 即 EX = µ), 则 E(X µ) 2 是 测 量 误 差 平 方 的 平 均, 称 为 均 方 误 差. 方 差 的 计 算 公 式 当 X 有 离 散 分 布 P (X = x j ), j = 1, 2, 时, 利 用 公 式 (2.2) 得 到 Var(X) = (x j µ) 2 P (X = x j ). j=1 当 X 有 概 率 密 度 f(x) 时, 利 用 公 式 (2.1) 得 到 Var(X) = (x µ) 2 f(x) dx. 随 机 变 量 X 的 方 差 Var(X) 由 X 的 分 布 唯 一 决 定. X 的 方 差 描 述 了 X 的 分 散 程 度, Var(X) 越 小, 说 明 X 在 数 学 期 望 µ 附 近 越 集 中. 特 别 当 Var(X) = 0 时, 由 例 2.8 知 道 P (X = µ) = 1.
109 4.3 随 机 变 量 的 方 差 103 利 用 数 学 期 望 的 线 性 性 质 得 到, Var(X) = E(X 2 2Xµ + µ 2 ) = EX 2 (EX) 2. (3.2) (3.2) 是 计 算 方 差 的 常 用 公 式. 两 点 分 布 B(1, p) 的 方 差 P (X = 1) = p, P (X = 0) = 1 p. 由 X 2 = X 和 EX = p, 得 到 Var(X) = EX 2 (EX) 2 = p p 2 = pq. 二 项 分 布 B(n, p) 的 方 差 设 q = 1 p, 由 EX = np, P (X = j) = C j np j q n j, 0 j n, 和 计 算 随 机 向 量 函 数 数 学 期 望 的 公 式 (2.2) 得 到 E(X 2 ) = E[X(X 1)] + EX n = Cnj(j j 1)p j q n j + np j=0 =p 2 d2 dx 2 n Cnx j j q n j x=p + np j=0 =p 2 d2 dx 2 (x + q)n x=p + np =n(n 1)p 2 + np. 最 后 用 方 差 的 计 算 公 式 (3.2) 得 到 Var(X) = n(n 1)p 2 + np (np) 2 = npq. 后 面 讲 了 定 理 3.1 后 可 以 用 B(1,p) 来 计 算 B(n, p) 的 方 差
110 104 第 四 章 数 学 期 望 和 方 差 泊 松 分 布 Poission(λ) 的 方 差 由 EX = λ, P (X = k) = λk k! e λ, k = 0, 1,, 和 函 数 期 望 公 式 (2.2) 得 到 E(X 2 ) =E[X(X 1)] + EX = k(k 1) λk k! e λ + λ k=0 =λ 2 k=2 =λ 2 + λ. 用 方 差 的 展 开 计 算 公 式 (3.2) 得 到 λ k 2 (k 2)! e λ + λ Var(X) = λ 2 + λ λ 2 = λ. 几 何 分 布 服 从 几 何 分 布 的 随 机 变 量 X 有 离 散 分 布 P (X = j) = pq j 1, j = 1, 2,. 用 EX = 1/p 和 公 式 函 数 期 望 公 式 (2.2) 得 到 E(X 2 ) =E[X(X 1)] + EX = j(j 1)pq j p j=1 ( ) =pq q j 1 + p j=0 ( 1 ) 1 =pq + 1 q p = 2pq (1 q) p = 2q p p. 最 后 用 方 差 的 展 开 计 算 公 式 (3.2) 得 到 Var(X) = 2q p p 1 p 2 = q p 2.
111 4.3 随 机 变 量 的 方 差 105 均 匀 分 布 U(a, b) 由 X 的 概 率 密 度 f(x) = 1 b a I (a,b), 数 学 期 望 EX = (a + b)/2, 和 得 到 EX 2 = b a x 2 b a dx = b3 a 3 3(b a). Var(X) = b3 a 3 ( a + b 3(b a) ) 2 (b a) 2 = 指 数 分 布 E(λ) X 有 数 学 期 望 EX = 1/λ 和 概 率 密 度 f(x) = λe λx, x > 0. 于 是 由 E(X 2 ) = 0 x 2 λe λx dx = 1 t 2 e t dt λ 2 0 = 1 λ 2 Γ(3) ( 取 x = t/λ) = 2 λ 2, 得 到 Var(X) = 2 λ 2 1 λ 2 = 1 λ 2. 正 态 分 布 N(µ, σ 2 ) X 有 数 学 期 望 EX = µ 和 概 率 密 度 f(x) = 1 2πσ e (x µ)2 2σ 2,
112 106 第 四 章 数 学 期 望 和 方 差 于 是 Var(X) = = 1 2πσ (x µ) 2 f(x)dx = σ2 2π ( (x µ) 2 (x ) µ)2 exp 2σ 2 t 2 exp =σ 2. ( 用 例 2.1) ( ) t2 dt 2 dx ( 取 x µ = σt) 现 在 我 们 知 道 了 正 态 分 布 N(µ, σ 2 ) 中 的 µ 和 σ 2 就 是 该 正 态 分 布 的 数 学 期 望 和 方 差. 如 果 (X, Y ) N(µ 1, µ 2 ; σ1, 2 σ2; 2 ρ), 则 从 3.3 的 例 3.6 知 道 X (µ 1, σ1),y 2 (µ 2, σ2), 2 于 是 得 到 µ 1 = EX, µ 2 = EY, σ1 2 = Var(X), σ2 2 = Var(Y ). 方 差 的 性 质 定 理 3.1 设 a, b, c 是 常 数, EX = µ, Var(X) <, µ j = EX j, 定 理 证 明 Var(X j ) < (1 j n), 则 (1) Var(a + bx) = b 2 Var(X), (2) Var(X) = E(X µ) 2 < E(X c) 2, 只 要 c µ, (3) Var(X) = 0 的 充 分 必 要 条 件 是 P (X = µ) = 1, (4) Var( n j=1 X j) = n i=1 n j=1 [E(X ix j ) µ i µ j ], (5) 当 X 1, X 2,, X n 相 互 独 立, Var( n j=1 X j) = n j=1 Var(X j). (1) 由 方 差 的 定 义 得 到 (2) 对 c µ, 由 Var(a + bx) =E[(a + bx) E(a + bx)] 2 =E[a + bx (a + bµ)] 2 =E[b 2 (X µ) 2 ] =b 2 Var(X) E(X c) 2 =E[(X µ) + (µ c)] 2 =E(X µ) 2 + 2E(X µ)(µ c) + E(µ c) 2 =Var(X) + (µ c) 2,
113 4.3 随 机 变 量 的 方 差 107 知 道 (2) 成 立. (3) Var(X) = 0 即 E(X µ) 2 = 0, 由 例 2.8 其 充 分 必 要 条 件 为 P ((X µ) 2 = 0) = 1, 即 P (X = µ) = 1 (4) Var( j [ ] 2 x j ) =E (X j µ j ) j = E [(X i µ i )(X j µ j )] i j = [E(X i X j ) µ i µ j ] i j (5) 独 立 时 Var( j [ ] 2 X j ) =E (X j µ j ) j = E(X j µ j ) E [(X i µ i )(X j µ j )] j i<j = j = j Var(X i ) + 2 i<j Var(X i ) [E(X i µ i )E(X j µ j )] 在 性 质 (1) 中 取 b = 1 得 到 Var(a + X) = Var(X), 说 明 对 随 机 变 量 进 行 常 数 的 平 移 后, 随 机 变 量 的 分 散 程 度 不 变 ; 取 a = 0 得 到 Var(bX) = b 2 Var(X), 说 明 将 X 扩 大 b 倍 后, 方 差 扩 大 b 2 倍. (2) 说 明 随 机 变 量 X 在 均 方 误 差 的 意 义 下 距 离 µ 最 近. (3) 说 明 除 了 以 概 率 1 等 于 常 数 的 随 机 变 量 外, 任 何 随 机 变 量 的 方 差 都 大 于 零. 以 后 无 特 殊 说 明, 都 认 为 所 述 随 机 变 量 的 方 差 大 于 零. 例 3.2 设 Var(X) = σ 2 <, Y = (X EX)/σ, 则 EY = 0, Var(Y ) = 1.
114 108 第 四 章 数 学 期 望 和 方 差 这 时 称 Y 是 X 的 标 准 化. 特 别 地, 当 X N(µ, σ 2 ), Y N(0, 1). 例 3.3 设 X 1, X 2,, X n 相 互 独 立, 有 共 同 的 方 差 σ 2 <, 则 ( 1 n ) Var X j = 1 n n σ2. j=1 如 果 X i 是 第 i 次 测 量 重 量 为 µ 的 物 体 时 的 测 量 值, 测 量 的 均 方 误 差 是 Var(X i ) = σ 2, 则 用 n 次 测 量 的 平 均 值 作 为 µ 的 测 量 值 时 均 方 误 差 降 低 n 倍. 说 明 只 要 测 量 仪 器 没 有 系 统 偏 差 ( 指 EX = µ), 测 量 精 度 总 可 以 通 过 多 次 测 量 的 平 均 来 改 进. 例 3.4 ( 接 例 2.5, 二 项 分 布 B(n, p)) 设 X 1, X 2,, X n 独 立 同 分 布, 都 服 从 两 点 分 布 B(1, p), 则 Y = X 1 + X X n B(n, p). 利 用 Var(X i ) = pq 和 定 理 3.1 的 (5) 得 到 Var(Y ) = Var(X 1 ) + Var(X 2 ) + + Var(X n ) = npq. 例 3.5 ( 接 例 2.6, 超 几 何 分 布 ) 设 N 件 产 品 中 有 M 件 正 品, 无 放 回 地 从 中 依 次 取 n 件, 用 Y 表 示 取 解 得 的 正 品 数, 则 Y H(n, M, N). 求 Var(Y ). 设 X 1, X 2,, X n 在 例 2.6 中 定 义, 即 X i 为 第 i 次 抽 取 结 果 的 两 点 分 布, 则 EX i = M/N. 对 i < j, X j X i 服 从 两 点 分 布. 利 用 抽 签 的 原 理 ( 参 考 1.6 的 例 6.1) 知 道 E(X j X i ) =P (X j X i = 1) = P (X j = 1, X i = 1) =P (X j = 1 X i = 1)P (X i = 1) = M 1 M N 1 N.
115 4.3 随 机 变 量 的 方 差 109 再 利 用 Y = (X 1 + X X n ) 和 定 理 3.1 的 (4) 得 到 Var(Y ) = n j=1 i=1 n [E(X i X j ) EX i EX j ] =nex 1 + n(n 1)E(X 1 X 2 ) n 2 (EX 1 ) 2 ( 用 X 2 1 = X 1 ) =n M N =n M N 1 M ( M + n(n 1)M N 1 N n2 N ( 1 M ) N n N N 1. 特 别 当 n = N, Var(Y ) = 0. 实 际 上 这 时 Y = EY = M. 本 例 中 如 果 采 用 有 放 回 的 抽 样, 则 Y B(n, M/N), Y 的 方 差 n M N (1 M ) 要 更 大. 说 明 对 均 值 的 估 计, 无 放 回 的 抽 取 要 比 有 放 回 的 抽 取 方 差 N 小. ) 2 Markov 不 等 式 定 理 3.2 ( 马 尔 柯 夫 (Markov) 不 等 式 ) 对 随 机 变 量 X 和 ε > 0, 有 P ( X ε) 1 ε α E X α, α > 0. (3.3) 作 为 定 理 3.2 的 直 接 推 论, 取 α = 2, 用 X EX 代 替 X 就 得 到 P ( X EX ε) 1 Var(X), ε > 0. (3.4) ε2 证 用 I[A] 表 示 事 件 A 的 示 性 函 数, 对 任 何 正 数 α, P ( X ε) =EI[ X ε] E ( X α I[ X ε]) ε α E X α ε α = 1 ε α E X α. 人 们 称 α = 2 时 的 马 尔 柯 夫 不 等 式 为 切 比 雪 夫 (Chebyshev) 不 等 式. 内 积 不 等 式 定 理 3.3 ( 内 积 不 等 式 ) 设 EX 2 <, EY 2 <, 则 有 E(XY ) EX 2 EY 2. (3.5) (3.5) 中 等 号 成 立 的 充 分 必 要 条 件 是 有 不 全 为 零 的 常 数 a, b, 使 得 P (ax + by = 0) = 1.
116 110 第 四 章 数 学 期 望 和 方 差 证 对 于 不 全 为 零 的 常 数 a, b, 二 次 型 E(aX + by ) 2 =a 2 EX 2 + 2abE(XY ) + b 2 EY 2 =(a, b)σ(a, b) T 0. (3.6) 其 中 ( ) EX 2 E(XY ) Σ =. E(XY ) EY 2 (3.6) 说 明 矩 阵 Σ 非 负 定, 于 是 Σ 0 从 det(σ) = EX 2 EY 2 [E(XY )] 2 得 到 (3.5), 并 且 知 道 (3.5) 中 等 号 成 立 当 且 仅 当 Σ 退 化, 当 且 仅 当 有 不 全 为 零 的 常 数 a, b 使 E(aX + by ) 2 = 0, 当 且 仅 当 ( 用 例 2.8) 有 不 全 为 零 的 常 数 a, b 使 P (ax + by = 0) = 1. 协 方 差 和 相 关 系 数 的 定 义 4.4 协 方 差 和 相 关 系 数 设 σ X = σ XX, σ Y = σ Y Y 分 别 是 X, Y 的 标 准 差. 定 义 4.1 设 µ X = EX, µ Y = EY 存 在, (1) 当 E (X µ X )(Y µ Y ) <, 称 E[(X µ X )(Y µ Y )] (4.1) 为 随 机 变 量 X, Y 的 协 方 差 (covariance), 记 做 Cov(X, Y ) 或 σ XY. 当 Cov(X, Y ) = 0 时, 称 X, Y 不 相 关. (2) 当 0 < σ X σ Y <, 称 ρ XY = σ XY σ X σ Y (4.2) 为 X, Y 的 相 关 系 数 (correlation coefficient). 有 时 也 用 ρ(x, Y ) 表 示 相 关 系 数 ρ XY. 在 定 义 4.1 中, 引 入 X, Y 的 标 准 化 则 有 X µ X, Y µ Y, σ X σ Y [ ( X µ X ρ XY = E 下 面 是 计 算 协 方 差 的 常 用 公 式. σ X )(Y µ Y σ Y ) ]. σ XY = E(XY ) (EX)(EY ). (4.3)
117 4.4 协 方 差 和 相 关 系 数 111 相 关 系 数 的 性 质 从 定 义 4.1 和 内 积 不 等 式 ( 见 定 理 3.3) 马 上 得 到 相 关 系 数 的 性 质 如 下. 定 理 4.1 设 ρ XY 是 X, Y 的 相 关 系 数, 则 有 1. ρ XY 1, 2. ρ XY = 1 的 充 分 必 要 条 件 是 有 常 数 a, b 使 得 P (Y = a + bx) = 1, 3. 如 果 X, Y 独 立, 则 X, Y 不 相 关. 证 明 课 外 例 4.1 ( 接 例 2.4 ) 设 (X, Y ) 在 单 位 圆 D = {(x, y) x 2 + y 2 1} 内 均 匀 分 布, 则 X, Y 不 证 相 关, 也 不 独 立. 由 例 2.4 知 道 E(X) = E(Y ) = 0, 于 是 Cov(X, Y ) = xyf(x, y)dxdy = 1 R π 2 所 以 X, Y 不 相 关 y 2 ydy x dx = 0. 1 y 2 又 由 3.3 的 例 3.1 知 道 联 合 密 度 不 能 写 成 两 个 边 缘 密 度 的 乘 积, 所 以 X, Y 不 独 立. 例 4.2 相 关 系 数 ρ XY 只 表 示 了 X, Y 间 的 线 性 关 系. 当 ρ XY 系. = 0, 尽 管 称 X, Y 不 相 关, 它 们 之 间 还 可 以 有 很 强 的 非 线 性 关 例 如 当 Y = X 2, X N(0, σ 2 ) 时, (X, Y ) 总 在 抛 物 线 y = x 2 上, 但 是 X, Y 不 相 关, 因 为 Cov(X, Y ) = E[X(Y σ 2 )] = EX 3 σ 2 EX = 0.
118 112 第 四 章 数 学 期 望 和 方 差 例 4.3 ( 接 3.3 例 3.6) 设 (X, Y ) N(µ 1, µ 2 ; σ 2 1, σ 2 2; ρ), 则 ρ XY 必 要 条 件 是 X, Y 不 相 关. = ρ, 并 且 X, Y 独 立 的 充 分 证 明 : 课 外 随 机 向 量 和 随 机 矩 阵 的 期 望 设 X = (X 1, X 2,..., X n ) 是 随 机 向 量, 若 EX i = µ i, 则 记 µ = (µ 1, µ 2,..., µ n ) 称 EX = µ 若 Y ij (i = 1,..., m, j = 1,..., n) 是 随 机 变 量,EY ij 存 在, 记 Y 11 Y 12 Y 1n Y 21 Y 22 Y 2n Y =... Y m1 Y m2 Y mn 则 称 EY = EY 11 EY 12 EY 1n EY 21 EY 22 EY 2n... EY m1 EY m2 EY mn 随 机 向 量 和 随 机 矩 阵 的 性 质 设 X 和 Y 如 上 定 义,EX 和 EY 存 在 对 任 意 常 数 向 量 a = (a 1,..., a n ), k m 常 数 矩 阵 A 和 n l 常 数 矩 阵 B, 有 E(aX T ) =aex T, (EY ) T =E(Y T ), E(AY ) =A E(Y ), E(Y B) =E(Y ) B, E(AY B) =A E(Y ) B. (4.6)
119 4.4 协 方 差 和 相 关 系 数 113 证 明 略 协 方 差 阵 定 义 4.2 如 果 随 机 向 量 X = (X 1, X 2,, X n ) 的 数 学 期 望 µ = EX 存 在, 每 个 X i 的 方 差 Var(X i ) <, 就 称 Σ = E[(X µ) T (X µ)] = (σ ij ) n n (4.7) 为 X 的 协 方 差 矩 阵. 其 中 σ ij = Cov(X i, X j ) (4.8) 是 X i, X j 的 协 方 差. 协 方 差 矩 阵 Σ 是 对 称 矩 阵. 如 果 矩 阵 A 的 行 列 式 det(a) = 0, 就 称 A 是 退 化 的. 定 理 4.2 设 Σ 是 X = (X 1, X 2,, X n ) 的 协 方 差 矩 阵, 则 (1) Σ 是 非 负 定 矩 阵, (2) Σ 退 化 的 充 分 必 要 条 件 是 有 不 全 为 零 的 常 数 a 1, a 2,, a n 使 得 其 中 µ i = EX i. ( n ) P a i (X i µ i ) = 0 = 1. (4.9) i=1 定 理 4.2 证 明
120 114 第 四 章 数 学 期 望 和 方 差 任 取 一 个 n 维 实 向 量 a = (a 1, a 2,, a n ), 有 aσa T = = n i=1 j=1 n i=1 j=1 [ n =E n a i a j σ ij n a i a j E[(X i µ i )(X j µ j )] n i=1 j=1 =E [ n a i (X i µ i ) ] 2 i=1 =Var [ n a i (X i µ i ) ] i=1 ] a i a j (X i µ i )(X j µ j ) 0. (4.10) 所 以 Σ 非 负 定. 从 (4.10) 看 出, Σ 退 化 的 充 分 必 要 条 件 是 有 非 零 向 量 a 使 得 Var [ n a i (X i µ i ) ] = 0. i=1 再 用 定 理 3.1 的 (3) 得 到 本 定 理 的 (2).
121 第 五 章 多 元 正 态 分 布 和 极 限 定 理 5.1 多 元 正 态 分 布 多 元 正 态 分 布 本 节 中 的 向 量 都 是 列 向 量, 用 A T 表 示 矩 阵 A 的 转 置. 设 µ = (µ 1, µ 2,, µ n ) T 是 n 维 常 数 列 向 量, B 是 n m 常 数 矩 阵, ε 1, ε 2,, ε m 是 相 互 独 立 都 服 从 标 准 正 态 分 布 的 随 机 变 量, ε = (ε 1, ε 2,, ε m ) T. 定 义 1.1 如 果 X = µ + Bε, (1.1) 就 称 随 机 向 量 X = (X 1, X 2,, X n ) T 服 从 n 元 ( 或 多 元 ) 正 态 分 布, 记 做 X N(µ, Σ), 其 中 Σ = BB T. 上 面 定 义 的 X 的 数 学 期 望 和 方 差 阵 为 EX =E [µ + Bε] = µ + BEε =µ + B 0 = µ Var(X) =E [ (X µ)(x µ) T ] =E [ (Bε)(Bε) T ] = E [ B(εε T )B T ] =BE(εε T )B T = BI n B T = BB T = Σ 注 意 : µ 和 Σ 完 全 决 定 多 元 正 态 分 布 的 随 机 向 量 X 的 联 合 分 布 多 元 正 态 分 布 的 性 质 性 质 1 多 元 正 态 分 布 的 边 缘 分 布 也 是 多 元 ( 或 一 元 ) 正 态 分 布. 115
122 116 第 五 章 多 元 正 态 分 布 和 极 限 定 理 证 : 这 是 因 为,X = µ + Bε 则 其 一 部 分 分 量 可 以 写 成 用 µ 和 B 的 对 应 行 线 性 组 合 的 结 果 性 质 2 如 果 X N(µ, Σ), A 是 m n 矩 阵, 则 Y = AX N(Aµ, AΣA T ). 特 别 对 向 量 a = (a 1, a 2,, a n ) T, 有 n a j X j = a T X N(a T µ, a T Σa). j=1 证 由 Y = AX = (Aµ) + (AB)ε 和 定 义 1.1 得 到 结 论. 性 质 3 量, 有 联 合 密 度 : 证 明 略 设 X N(µ, Σ). 当 Σ = BB T 正 定 时, X 是 连 续 型 随 机 向 1 [ f(x) = ( 2π) n det(σ) exp 1 ] 2 (x µ)t Σ 1 (x µ), x = (x 1, x 2, x n ) T R n. (1.3) 性 质 4 如 果 Σ 正 定,X N(µ, Σ), 则 X 1, X 2,..., X n 相 互 独 立 的 充 分 必 要 条 件 是 Σ = diag(σ 2 1, σ 2 2,..., σ 2 n) 证 明 : 利 用 性 质 3 以 及 独 立 的 充 分 必 要 条 件 是 联 合 密 度 等 于 边 缘 密 度 乘 积 性 质 5 设 X N(µ, Σ), 则 X 1, X 2,, X n 相 互 独 立 都 服 从 标 准 正 态 分 布 的 充 分 必 要 条 件 是 µ = 0, Σ = I, 即 X N(0, I). 证 明 : 必 要 性 : 设 各 分 量 iid 标 准 正 态 分 布, 则 0 0 X = + I. n ε 0 其 中 ε = (X 1,..., X n ) T, 由 定 义 可 知 X N(0, I n ). 充 分 性 : 若 µ = 0, Σ = I n, 由 性 质 1 可 知 各 X i 为 正 态 分 布, 且 为 N(0,1) 的 正 态 分 布, 再 由 性 质 4 可 知 X 1, X 2,..., X n 相 互 独 立
123 5.1 多 元 正 态 分 布 117 性 质 6 设 X N(µ, Σ), 有 可 逆 矩 阵 A 使 得 Σ = AA T, 则 Y = A 1 (X µ) N(0, I). 证 由 性 质 2 知 Y 服 从 正 态 分 布, 数 学 期 望 和 方 差 阵 为 EY =A 1 E(X µ) = 0, E(Y Y T ) =A 1 E[(X µ)(x µ) T ]A T =A 1 AA T A T = I. 例 1.1 设 X 1, X 2,, X n 相 互 独 立, X j N(µ j, σ 2 j ), 则 对 非 零 向 量 a = (a 1, a 2,, a n ) T, Y = n j=1 a jx j N ( n j=1 a jµ j, n j=1 a2 jσ 2 j ). 证 定 义 ε j = (X j µ j )/σ j, 则 ε 1, ε 2,, ε n 相 互 独 立 都 服 从 标 准 正 态 分 布, 并 且 X j = µ j + σ j ε j. 从 定 义 1.1 知 道 X = X 1 X 2. = µ 1 µ 2. + σ σ ε 1 ε 2. X n µ n 0 0 σ n ε n 服 从 多 元 正 态 分 布. 从 性 质 2 知 道 Y = a T X 服 从 正 态 分 布. 容 易 计 算 EY = n j=1 a jµ j, Var(Y ) = n j=1 a2 jσ 2 j, 故 结 论 成 立. 例 1.2 如 果 X = (X 1, X 2,..., X n ) T N(µ, Σ), 其 中 µ = (µ 1, µ 2,..., µ n ) T, Σ = (σ ij ) n n. 则 X j N(µ j, σ jj ). 证 设 向 量 a = (0,..., 0, 1, 0,..., 0) T 的 第 j 个 元 素 是 1, 其 余 是 零. 则 a T µ = µ j, a T Σa = σ jj. 从 性 质 2 得 到 X j = a T X N(µ j, σ jj ).
124 118 第 五 章 多 元 正 态 分 布 和 极 限 定 理 概 率 频 率 定 义 与 大 数 律 5.2 大 数 律 在 n 次 独 立 重 复 试 验 中, 引 入 1, 当 第 j 试 验 成 功, X j = 0, 当 第 j 试 验 不 成 功. 则 S n = X 1 + X X n 是 n 次 试 验 中 的 成 功 次 数, 由 概 率 的 频 率 定 义 知 道, 对 于 成 功 的 频 率 X n = S n /n, 有 下 面 的 强 大 数 定 律 将 (2.1) 进 行 了 推 广. lim X n = P (X 1 = 1) = EX 1. (2.1) n 依 概 率 收 敛 称 随 机 变 量 的 序 列 {ξ n } = {ξ 1, ξ 2, } 为 随 机 序 列 (random sequence). 定 义 2.1 设 {ξ n } 是 随 机 序 列, ξ 是 随 机 变 量. 如 果 对 任 何 ϵ > 0, 有 就 称 ξ n 依 概 率 收 敛 到 ξ, 记 做 ξ n p ξ. lim P ( ξ n ξ ϵ) = 0, (2.2) n 其 含 义 是 n 很 大 时, ξ n 与 ξ 有 非 零 差 距 的 可 能 性 很 小 弱 大 数 律 定 理 2.1 设 随 机 序 列 {X n } 独 立 同 分 布, 如 果 µ = EX 1 有 限, 则 有 1 n p X n = lim X j µ. (2.5) n n j=1 证 只 对 σ 2 = Var(X) < 的 情 况 证 明. 因 为 X n 分 别 有 数 学 期 望 和 方 差 E X n = µ, Var( X n ) = σ2 n, 利 用 马 尔 柯 夫 不 等 式 ( 见 4.3 定 理 3.2) 得 到, 对 任 何 ϵ > 0, ( 1 P n n ) (X j µ) ϵ j=1 Var( X n ) ϵ 2 = σ2 0, n. nϵ2 通 常 把 类 似 于 2.5 的 结 论 称 为 弱 大 数 律 (weak law of large numbers).
125 5.2 大 数 律 119 例 2.1 ( 接 4.1 的 例 1.4 ) 在 赌 对 子 时, 甲 每 次 下 注 100 元. 如 果 他 连 续 下 注 n 次, 证 明 他 的 盈 利 S n 满 足 P (S n 18n) 1. 证 用 X i 表 示 甲 第 i 次 下 注 的 盈 利, 则 X 1, X 2,, X n 独 立 同 分 布. 由 4.1 的 例 1.4 知 道 µ = EX i = S n = X 1 + X X n. 利 用 和 定 理 2.1 得 到, n 时, 于 是 {S n > 18n} ={ X n µ > } ={ X n µ > 0.6} { X n µ > 0.6}, P (S n > 18n) P ( X n µ > 0.6) Var(X 1) n P (S n 18n) = 1 P (S n > 18n) 1. 说 明 下 注 的 次 数 n 越 多, 至 少 输 18n 元 的 概 率 越 大. 强 大 数 律 定 义 2.2 设 {ξ n } 是 随 机 序 列, ξ 是 随 机 变 量. 如 果 ( ) P lim ξ n = ξ = 1, n 就 称 ξ n 以 概 率 1 收 敛 到 ξ, 记 做 ξ n ξ, wp1, 或 a.s. 定 理 2.2 如 果 {X j } 是 独 立 同 分 布 的 随 机 序 列, µ = EX 1, 则 1 n X j µ, wp1. (2.6) n j=1 (2.6) 的 另 一 个 表 达 方 式 是 P ( lim n X n = µ ) = 1. 类 似 于 (2.6) 的 结 果 称 为 强 大 数 律 (strong law of large numbers). 从 强 大 数 律 结 论 (2.6) 知 道 概 率 的 频 率 定 义 是 合 理 的. 强 大 数 律 结 论 比 弱 大 数 律 结 论 要 强 : 定 理 2.3 如 果 ξ n ξ, wp1. 则 ξ n p ξ.
126 120 第 五 章 多 元 正 态 分 布 和 极 限 定 理 例 2.2 在 多 次 独 立 重 复 试 验 过 程 中, 小 概 率 事 件 必 然 发 生. 证 : 设 p 是 任 意 小 的 正 数, 事 件 A 1, A 2,... 相 互 独 立, P (A i ) = p. 用 I[A i ] 表 示 A i 的 示 性 函 数, 则 I[A i ] 独 立 同 分 布. 由 强 大 数 律 得 到 1 n n I[A i ] p, wp1. i=1 所 以 I[A i ] =, wp1. i=1 说 明 有 无 穷 个 A i 发 生 的 概 率 是 中 心 极 限 定 理 中 心 极 限 定 理 问 题 强 大 数 律 和 弱 大 数 律 分 别 讨 论 了 随 机 序 列 部 分 和 的 依 概 率 收 敛 和 以 概 率 1 收 敛. 中 心 极 限 定 理 讨 论 对 充 分 大 的 n, 随 机 变 量 的 部 分 和 的 概 率 分 布 问 题. X 1 + X X n 例 3.1: 二 项 分 布 独 立 地 重 复 某 一 试 验, 设 1 试 验 成 功 X i = 0 试 验 失 败 i = 1, 2,..., n 则 X i iid B(1, p)( 两 点 分 布 ) 令 S n = X 1 + X X n 则 S n 为 n 次 独 立 试 验 中 成 功 的 次 数,S n B(n, p) 从 演 示 看 出 n 时 S n 的 分 布 形 状 很 象 正 态 分 布
127 5.3 中 心 极 限 定 理 121 例 3.2: Poisson( 泊 松 ) 分 布 若 {X j } iid P(λ), 则 由 3.4 的 例 4.1 知 道 部 分 和 n S n = P(nλ). j=1 从 演 示 看 出 n 时 S n 的 分 布 形 状 很 象 正 态 分 布 X j 例 3.4: 几 何 分 布 的 部 分 和 设 {X j } 独 立 同 分 布 都 服 从 几 何 分 布 P (X = k) = pq k 1, k = 1, 2,, p + q = 1. 可 以 将 S n = n j=1 X j 设 想 成 第 n 次 击 中 目 标 时 的 射 击 次 数 ( 参 考 几 何 分 布 的 背 景 ), 于 是 得 到 P (S n = k) = C n 1 k 1 pn q k n, k = n, n + 1,.... 上 述 分 布 称 为 帕 斯 卡 分 布. 从 演 示 看 出 S n 的 概 率 分 布 当 n 时 越 来 越 接 近 于 正 态 分 布 注 : 得 到 第 n 次 成 功 前 失 败 的 次 数 Y 的 分 布 称 为 负 二 项 分 布, 易 见 且 S n = Y + n P (Y = k) = C k n+k 1p n (1 p) k, k = 0, 1, 2,... 例 3.4: 指 数 分 布 的 独 立 和 设 {X j } 独 立 同 分 布 都 服 从 指 数 分 布 E(λ), 可 以 证 明 部 分 和 S n = n j=1 X j 服 从 Γ(n, λ) 分 布. 从 演 示 看 出 S n 的 密 度 趋 向 于 正 态 分 布 中 心 极 限 定 理 定 理 3.1 ( 中 心 极 限 定 理 ) 设 随 机 序 列 {X j } 独 立 同 分 布, 有 共 同 的 数 学 期 望 µ 和 方 差 σ 2. 部 分 和 由 S n = n j=1 X j 定 义, 则 S n 的 标 准 化 ξ n = S n nµ nσ 2 依 分 布 收 敛 到 标 准 正 态 分 布. 即 对 任 何 x, 这 里 Φ(x) 是 标 准 正 态 分 布 的 分 布 函 数. lim P (ξ n x) = Φ(x). (3.2) n
128 122 第 五 章 多 元 正 态 分 布 和 极 限 定 理 我 们 把 结 论 (3.2) 记 成 ξ n d N(0, 1), 其 中 的 d 表 示 依 分 布 收 敛. 中 心 极 限 定 理 的 应 用 : 可 以 用 N(0,1) 近 似 计 算 关 于 ξ n 的 概 率, 用 N(nµ, nσ 2 ) 近 似 计 算 关 于 S n 的 概 率 例 3.6: 近 似 计 算 当 辐 射 的 强 度 超 过 每 小 时 0.5 毫 伦 琴 (mr) 时, 辐 射 会 对 人 的 健 康 造 成 伤 害. 设 一 台 彩 电 工 作 时 的 平 均 辐 射 强 度 是 0.036(mr/h), 方 差 是 则 家 庭 中 一 台 彩 电 的 辐 射 一 般 不 会 对 人 造 成 健 康 伤 害. 但 是 彩 电 销 售 店 同 时 有 多 台 彩 电 同 时 工 作 时, 辐 射 可 能 对 人 造 成 健 康 伤 害. 现 在 有 16 台 彩 电 同 时 工 作, 问 这 16 台 彩 电 的 辐 射 量 可 以 对 人 造 成 健 康 伤 害 的 概 率. 解 用 X i 表 示 第 i 台 彩 电 的 辐 射 量 (mr/h), 则 X i 的 数 学 期 望 是 µ = 0.036, 方 差 是 σ 2 = S n = X 1 + X X 16 是 n = 16 台 彩 电 的 辐 射 量. 题 目 要 求 P (S n > 0.5). 认 为 {X i } 独 立 同 分 布 时, 按 照 定 理 3.1, ξ n = S n nµ nσ 2 近 似 服 从 N(0, 1) 分 布, 于 是 ( Sn nµ P (S n > 0.5) =P > nσ nµ ) nσ 2 ( ) =P ξ n > =P (ξ n > 0.211) Φ(0.211) = 这 16 台 彩 电 以 大 约 58% 的 概 率 会 对 人 造 成 健 康 伤 害. 二 项 分 布 的 正 态 近 似 推 论 3.3 设 S n B(n, p), p = 1 q (0, 1), 则 S n np npq d N(0, 1). (3.3) 证 明 设 {X n } 是 独 立 同 分 布 的 随 机 序 列, X i 服 从 两 点 分 布 B(1, p). 则 ξ n = X 1 + X X n 和 S n 同 分 布, Eξ n = np, Var(ξ n ) = npq.
129 5.3 中 心 极 限 定 理 123 于 是 S n np npq 和 ξ n np npq 同 分 布. 由 定 理 3.1 知 道 当 n, 对 x (, ), ( Sn np ) ( ξn np ) P x = P x Φ(x). npq npq 例 3.7: 用 正 态 分 布 计 算 二 项 分 布 设 S n B(n, p) 则 S n 近 似 N(np, npq) 分 布 设 X N(np, npq), 设 a, b 为 非 负 整 数 由 中 心 极 限 定 理 n 较 大 时 p = Pr(a S n b) P (a < X < b) (*) 但 是 注 意 S n 是 取 整 数 值 的, 所 以 p = Pr(a S n b) =Pr(a 1 < S n < b + 1) 上 式 右 端 用 正 态 近 似 和 (*) 不 同 为 此 取 折 衷, 令 p =Pr(a S n b) Pr(a 0.5 < X < b + 0.5) ( b np ) ( a 0.5 np =Φ Φ ). (3.4) npq npq 称 为 连 续 性 校 正 此 近 似 公 式 应 在 n 充 分 大 时 使 用, 实 际 规 则 可 以 用 min(np, nq) > 5 特 别 地, Pr(S n = a) Pr(a 0.5 < X < a + 0.5). 例 3.8 某 药 厂 试 制 了 一 种 新 药, 声 称 对 贫 血 的 治 疗 有 效 率 达 到 80%. 医 药 监 管 部 门 准 备 对 100 个 贫 血 患 者 进 行 此 药 的 疗 效 试 验, 若 这 100 人 中 至 少 有 75 人 用 药 有 效, 就 批 准 此 药 的 生 产. 如 果 该 药 的 有 效 率 确 实 达 到 80%, 此 药 被 批 准 生 产 的 概 率 是 多 少?
130 124 第 五 章 多 元 正 态 分 布 和 极 限 定 理 解 用 S n 表 示 这 n(= 100) 个 患 者 中 用 药 后 有 效 的 人 数. 如 果 该 药 的 有 效 率 确 实 是 p = 80%, 则 S n B(n, p). 由 100p = 80 > 5, 100(1 p) = 20 > 5, 知 道 可 用 近 似 公 式 (3.4). 于 是 P ( 药 被 批 准 ) =P (S n 75) =P (S n > 74.5) =P ( Sn np np(1 p) > ( Sn np =P > np(1 p) 74.5 np ) np(1 p) ) Φ( 5.5/4) = Φ(1.375) = 于 是 药 获 得 批 准 的 概 率 是 92%. 如 果 有 效 率 p > 80%, 则 获 得 批 准 的 概 率 > 92%( 参 考 习 题 7.29).
131 第 六 章 描 述 性 统 计 6.1 总 体 和 参 数 什 么 是 统 计 学 统 计 学 研 究 如 何 收 集 数 据 分 析 数 据 从 数 据 做 出 有 依 据 的 推 断 结 果 一 言 以 蔽 之, 统 计 学 是 研 究 数 据 的 科 学 统 计 学 主 要 的 数 学 工 具 是 概 率 论, 也 广 泛 使 用 现 代 信 息 技 术 作 为 支 撑, 通 过 计 算 机 和 信 息 网 络 获 取 数 据 进 行 建 模 数 据 分 析 计 算 统 计 学 是 一 门 科 学, 不 再 是 数 学 的 一 个 分 支 描 述 性 统 计 统 计 学 的 做 法 分 为 两 种 : 描 述 性 统 计 : 从 数 据 样 本 中 计 算 一 些 平 均 值 标 准 差 最 小 值 最 大 值 等 概 括 统 计 量, 画 直 方 图 散 点 图 等 描 述 图 形 推 断 性 统 计 : 假 定 要 研 究 的 对 象 服 从 某 种 概 率 模 型, 收 集 数 据 后 把 数 据 用 模 型 解 释, 并 做 出 有 概 率 意 义 的 结 论 总 体 个 体 和 均 值 所 要 调 查 的 对 象 全 体 叫 做 总 体 (population), 总 体 中 每 个 成 员 叫 做 个 体 举 例 : 一 批 橘 子 甜 不 甜? 这 批 橘 子 作 为 总 体 ; 或 者, 其 甜 度 作 为 总 体 总 体 一 般 用 随 机 变 量 作 为 数 学 模 型 如 : 一 批 橘 子 的 甜 度 分 布 情 况 用 随 机 变 量 作 为 数 学 模 型 125
132 126 第 六 章 描 述 性 统 计 总 体 参 数 是 描 述 总 体 特 性 的 指 标, 简 称 参 数 如 果 总 体 中 的 个 体 是 有 限 个, 称 个 体 总 数 N 为 总 体 容 量 总 体 平 均 或 总 体 均 值 是 参 数 常 用 µ 表 示 如 果 知 道 总 体 的 全 部 个 体 ( 比 如, 某 小 学 所 有 一 年 级 新 生 的 身 高 ) y 1, y 2,..., y N 则 N µ = 1 N i=1 y i 总 体 方 差 是 参 数 常 记 为 σ 2 如 果 知 道 总 体 的 全 部 个 体 y 1, y 2,..., y N 则 σ 2 = 1 N σ 称 为 总 体 标 准 差 N (y i µ) 2 i=1 样 本 与 估 计 如 果 总 体 只 有 有 限 个 样 本 虽 然 可 以 测 量 所 有 样 本 计 算 总 体 参 数, 但 可 能 会 消 耗 过 大 有 些 总 体 有 无 限 个 个 体, 比 如, 对 某 放 射 性 物 质 测 量 固 定 长 度 时 间 内 放 射 出 的 粒 子 数, 每 试 验 一 次 就 有 一 个 不 同 结 果 为 了 得 到 总 体 的 信 息, 可 以 从 总 体 中 抽 取 一 个 有 代 表 性 的 个 体 的 集 合, 称 为 总 体 的 一 个 样 本 也 叫 观 测 数 据 样 本 中 个 体 的 个 数 叫 做 样 本 量 (sample size) 试 图 用 样 本 的 情 况 去 判 断 总 体 的 情 况 注 意, 有 代 表 性 是 一 个 不 容 忽 视 的 要 求 从 总 体 中 抽 取 样 本 的 工 作 叫 做 抽 样 (sampling) 设 一 个 样 本 为 x 1, x 2,..., x n, 可 计 算 样 本 均 值 n x = 1 n i=1 x i 样 本 方 差 s 2 = n (x i x) 2. i=1 s = s 2 称 为 样 本 标 准 差
133 6.2 抽 样 调 查 方 法 127 估 计 如 果 样 本 确 实 是 有 代 表 性 的, 则 当 样 本 量 n 较 大 时, 从 样 本 计 算 的 样 本 均 值 和 样 本 方 差 可 以 与 相 应 的 总 体 均 值 和 总 体 方 差 很 接 近 利 用 样 本 计 算 出 的 对 总 体 参 数 的 估 计 值 称 为 估 计 (estimator 或 estimate) 不 同 的 方 法 可 能 给 出 不 同 的 估 计, 而 评 判 估 计 优 劣 的 标 准 也 不 是 唯 一 的 这 方 面 有 一 些 数 学 理 论 例 1.1 实 际 问 题 中, 总 体 的 样 本 量 往 往 是 非 常 大 的, 这 时 从 数 据 本 身 无 法 看 清 总 体 的 情 况. 样 本 均 值 和 样 本 方 差 可 以 提 供 必 要 的 信 息. 比 赛 中 甲, 乙 两 位 射 击 运 动 员 分 别 进 行 了 10 次 射 击, 成 绩 分 别 如 下 : 甲 乙 问 哪 个 运 动 员 平 均 水 平 高, 哪 个 运 动 员 水 平 更 稳 定. 解 用 x, s x 和 ȳ, s y 分 别 表 示 甲 和 乙 成 绩 的 样 本 均 值 和 样 本 标 准 差. x = 9.67, s x = , ȳ = 9.4, s y = 甲 的 平 均 水 平 和 稳 定 性 都 比 乙 好. 知 道 样 本 方 差 后, 可 以 作 出 更 好 的 比 较 结 果. 6.2 抽 样 调 查 方 法 抽 样 调 查 的 可 行 性 抽 样 的 可 行 性 : 汤 的 例 子 样 本 的 随 机 性 ( 代 表 性 ) 如 : 把 汤 搅 拌 均 匀 适 当 的 样 本 量 不 用 太 多 也 不 能 太 少 样 本 量 不 必 随 总 体 增 大 而 增 大 在 大 数 据 背 景 下, 统 计 数 据 又 有 了 盲 人 摸 象 的 窘 境 : 数 据 多 而 繁 杂, 特 征 过 多 造 成 数 据 分 布 不 集 中
134 128 第 六 章 描 述 性 统 计 抽 样 调 查 的 必 要 性 为 了 从 样 本 推 断 总 体 的 情 况, 样 本 的 代 表 性 是 最 关 键 的 问 题 调 查 全 部 总 体 不 现 实 或 不 必 要, 如 : 寿 命 试 验 抽 样 调 查 因 为 工 作 量 较 小, 控 制 可 以 更 严 格, 所 以 有 时 比 普 查 可 以 更 准 确 但 是, 如 何 确 保 抽 取 的 样 本 有 代 表 性? 随 机 抽 样 如 果 总 体 中 的 每 个 个 体 都 有 相 同 的 机 会 被 抽 中, 就 称 这 样 的 抽 样 方 法 为 随 机 抽 样 方 法 简 单 地 分, 抽 样 分 为 有 放 回 抽 取 和 无 放 回 抽 取 无 放 回 随 机 抽 样 指 在 总 体 中 随 机 抽 出 一 个 个 体 后, 下 次 在 余 下 的 个 体 中 再 进 行 随 机 抽 样. 有 放 回 随 机 抽 样 指 抽 出 一 个 个 体, 记 录 下 抽 到 的 结 果 后 放 回, 摇 匀 后 再 进 行 下 一 次 随 机 抽 样. 无 放 回 抽 取 从 实 现 上 和 从 精 度 上 更 好, 总 体 容 量 N 很 大 时 两 者 差 异 很 小 提 高 样 本 量 可 以 提 高 估 计 精 度, 但 不 是 总 体 越 大, 考 虑 的 特 征 越 多, 样 本 量 也 需 要 随 之 增 大 例 2.1 设 N 件 产 品 中 有 M 件 次 品, N, M 都 是 未 知 的. 用 随 机 抽 样 方 法 估 计 解 这 批 产 品 的 次 品 率 p = M/N. 无 放 回 地 从 中 依 次 取 n 件, 用 Y 表 示 取 得 的 次 品 数, 则 Y H(n, M, N) EY = np, Var(Y ) = np(1 p) N n N 1. 用 样 本 次 品 率 ˆp = Y /n 估 计 p 时, 有 Eˆp = p, Var(ˆp) = 1 n p(1 p)n n N 1. (2.1)
135 6.2 抽 样 调 查 方 法 129 如 果 采 用 有 放 回 的 随 机 抽 样, 用 X 表 示 取 得 的 次 品 数, 则 X B(n, p) EX = np, Var(X) = np(1 p). 用 这 时 的 样 本 次 品 率 p = X/n 估 计 p 时, 有 E p = p, Var( p) = 1 p(1 p). (2.2) n Eˆp = E p = p, 说 明 这 两 种 方 法 都 是 较 好 的 估 计 方 法, 没 有 偏 差. 由 于 样 本 方 差 E(Y /n p) 2 描 述 的 是 Y /n 向 真 实 参 数 p 的 集 中 程 度, 因 而 是 描 述 估 计 精 度 的 量. 样 本 方 差 越 小, 说 明 估 计 的 精 度 越 高. Var(ˆp) < Var( p) 说 明 无 放 回 随 机 抽 样 的 估 计 精 度 更 好 但 是 当 N 比 n 大 很 多 时, (N n)/(n 1) 接 近 于 1, 说 明 两 种 抽 样 方 法 差 别 不 大. 另 外 Var( p) 与 N 无 关, 说 明 要 达 到 一 定 的 估 计 精 度, 只 需 要 适 当 地 增 加 n. 并 不 是 说 总 体 数 目 N 越 大, 就 需 要 多 抽 样. 无 放 回 随 机 抽 样 下 的 情 况 也 是 类 似 的. 试 验 和 理 论 都 证 明 : 在 随 机 抽 样 下, 样 本 均 值 x 是 总 体 均 值 µ 很 好 的 估 计, 样 本 标 准 差 s 是 总 体 标 准 差 σ 很 好 的 估 计. 在 样 本 量 不 大 时, 增 加 样 本 量 可 以 比 较 好 地 提 高 估 计 的 精 确 度. 例 : 考 虑 某 大 学 一 年 级 2000 个 同 学 的 平 均 身 高 µ 时, 需 要 调 查 50 同 学 的 身 高. 实 现 无 放 回 的 随 机 抽 样 的 方 法 是 先 将 2000 个 同 学 的 学 号 分 别 写 在 2000 张 小 纸 片 上, 然 后 放 入 一 个 大 纸 箱 进 行 充 分 的 摇 匀. 最 后 从 纸 箱 中 无 放 回 地 抽 取 50 个 纸 片. 纸 片 上 的 学 号 就 是 被 选 中 的 同 学 的 学 号. 现 在 一 般 采 用 计 算 机 随 机 抽 签 方 法 以 上 问 题 的 一 种 计 算 机 抽 签 方 法 为 : 对 2000 个 学 号 i,i = 1, 2,..., 2000, 独 立 地 从 U(0,1) 抽 取 U i, i = 1,..., 2000 对 应 到 每 个 学 生 从 U 1, U 2,..., U 2000 中 选 出 最 小 的 50 个, 其 对 应 的 学 生 作 为 样 本
136 130 第 六 章 描 述 性 统 计 随 机 抽 样 的 无 偏 性 从 总 体 X 中 等 可 能 地 随 机 抽 取, 不 论 是 有 放 回 还 是 无 放 回, 得 到 的 X 1, X 2,..., X n 看 成 随 机 变 量, 都 可 以 证 明 E X = µ 样 本 在 需 要 讨 论 其 分 布 性 质 时 看 成 随 机 变 量, 记 做 大 写 的 X 1, X 2,..., X n ; 在 讨 论 样 本 的 具 体 取 值 时 看 成 普 通 数 值, 记 做 小 写 的 x 1, x 2,..., x n 代 表 性 偏 差 失 误 举 例 例 年 是 美 国 总 统 选 举 年. 这 年 罗 斯 福 (Roosevelt) 任 美 国 总 统 期 满, 参 加 第 二 届 的 连 任 竞 选, 对 手 是 堪 萨 斯 州 州 长 兰 登 (Landon). 当 时 美 国 刚 从 经 济 大 萧 条 中 恢 复 过 来, 失 业 人 数 仍 高 达 900 多 万, 人 们 的 经 济 收 入 下 降 了 三 分 之 一 后 开 始 逐 步 回 升. 当 时, 观 察 家 们 普 遍 认 为 罗 斯 福 会 当 选. 而 美 国 的 文 学 摘 要 杂 志 的 调 查 却 预 测 兰 登 会 以 57% 对 43% 的 压 倒 优 势 获 胜. 文 学 摘 要 的 预 测 是 基 于 对 二 百 四 十 万 选 民 的 民 意 调 查 得 出 的. 自 1916 年 以 来, 在 历 届 美 国 总 统 的 选 举 中 文 学 摘 要 都 做 了 正 确 的 预 测. 文 学 摘 要 的 威 信 有 力 地 支 持 着 它 的 这 次 预 测. 但 是 选 举 的 结 果 是 罗 斯 福 以 62% 对 38% 的 压 倒 优 势 获 胜. 此 后 不 久 文 学 摘 要 杂 志 就 破 产 了. 要 了 解 文 学 摘 要 预 测 失 败 的 原 因 就 必 须 检 查 他 们 的 抽 样 调 查 方 案. 文 学 摘 要 是 将 问 卷 寄 给 了 一 千 万 个 选 民, 基 于 收 回 的 240 万 份 问 卷 得 出 的 判 断. 这 些 选 民 的 地 址 是 在 诸 如 电 话 簿, 俱 乐 部 会 员 名 单 等 上 查 到 的. 分 析 : 1936 年 只 有 大 约 四 分 之 一 的 家 庭 安 装 了 电 话. 由 于 有 钱 人 才 更 有 可 能 安 装 家 庭 电 话 和 参 加 俱 乐 部, 所 以 文 学 摘 要 的 调 查 方 案 漏 掉 了 那 些 不 属 于 俱 乐 部 的 穷 人 和 没 有 安 装 电 话 的 穷 人, 这 就 导 致 了 调 查 结 果 有 排 除 穷 人 的 偏 向.
137 6.2 抽 样 调 查 方 法 131 在 1936 年, 由 于 经 济 开 始 好 转, 穷 人 普 遍 有 赞 同 罗 斯 福 当 选 的 倾 向, 富 人 有 赞 同 兰 登 当 选 的 倾 向. 文 学 摘 要 的 调 查 结 果 更 多 地 代 表 了 富 人 的 意 愿, 导 致 了 预 测 的 失 败. 抽 样 的 方 案 应 当 公 平 的 对 待 每 一 位 选 民 和 每 一 个 群 体, 以 便 得 到 选 民 的 真 实 情 况. 将 哪 一 个 群 体 排 除 在 外 的 抽 样 方 案 都 会 导 致 有 偏 的 样 本, 从 而 导 致 错 误 的 结 论. 分 层 抽 样 方 法 总 体 当 中 分 为 不 同 人 群 时 ( 如 城 镇 和 乡 村 ), 虽 然 仍 然 进 行 等 可 能 随 机 抽 样, 这 样 不 同 人 群 差 异 过 大 引 起 估 计 误 差 变 大, 而 且 操 作 也 不 方 便 好 的 作 法 是 按 人 口 比 例 在 不 同 人 群 中 分 别 进 行 随 机 抽 样 计 算 平 均 值 等 统 计 量 时 要 用 加 权 求 和 ( 平 均 ) 计 算 例 年, 某 市 进 行 家 庭 年 收 入 调 查 时, 分 别 对 城 镇 家 庭 和 农 村 家 庭 进 行 调 查. 在 全 部 城 镇 的 85,679 户 中 无 放 回 随 机 抽 取 了 350 户, 在 全 部 农 村 的 275,692 户 中 无 放 回 随 机 抽 取 了 360 户. 调 查 结 果 如 下 : 城 镇 家 庭 年 平 均 收 入 是 元 ; 农 村 家 庭 年 平 均 收 入 是 5623 元. 这 里 遇 到 了 两 个 分 总 体 A 1 和 A 2, 第 一 个 分 总 体 A 1 是 所 有 城 镇 家 庭 的 年 收 入, 第 二 个 分 总 体 A 2 是 所 有 农 村 家 庭 的 年 收 入. 用 A 表 示 该 市 所 有 家 庭 的 年 收 入 时, 总 体 A 是 两 个 分 总 体 A 1 和 A 2 的 并. 用 x 1 表 示 来 自 总 体 A 1 的 样 本 均 值, 用 x 2 表 示 来 自 总 体 A 2 的 样 本 均 值, 则 x 1 = 35612, x 2 = 5623.
138 132 第 六 章 描 述 性 统 计 A 1 和 A 2 在 A 中 所 占 的 比 例 分 别 是 w 1 = w 2 = = = A 的 总 体 均 值 µ 的 估 计 是 X = w 1 x 1 + w 2 x 2 = = 12733( 元 ). 于 是 该 市 平 均 年 家 庭 收 入 的 估 计 是 元. 上 面 的 抽 样 调 查 问 题 中, 还 可 以 把 全 部 家 庭 再 细 分 成 城 镇 中 的 工 人, 公 务 员, 教 师 等 ; 将 农 村 家 庭 分 成 农 民 家 庭, 农 村 干 部 家 庭 等. 一 般 分 层 抽 样 方 法 把 总 体 A 分 成 L 个 互 不 相 交 子 总 体 : A = A 1 + A A L. 称 这 些 子 总 体 为 层 (strata), 称 A i 为 第 i 层. 然 后 在 每 层 中 独 立 地 进 行 随 机 抽 样. 用 N 表 示 总 体 A 的 个 体 总 数, 用 N i 表 示 第 i 层 的 个 体 总 数 时, 有 N = N 1 + N N L. 我 们 称 w i = N i, (i = 1, 2,, L) N 为 第 i 层 的 层 权 (weight). 用 µ 表 示 A 的 总 体 均 值. 对 i = 1, 2,, L, 用 n i 表 示 从 第 i 层 抽 出 样 本 的 个 数, x i 表 示 从 第 i 层 抽 出 样 本 的 样 本 均 值. 称 是 总 体 均 值 µ 的 简 单 估 计. x st = w 1 x 1 + w 2 x w L x L 称 V ( x st ) w 2 1Var( x 1 ) + w 2 2Var( x 2 ) + + w 2 LVar( x L ) 是 简 单 估 计 x st 的 抽 样 方 差.
139 6.2 抽 样 调 查 方 法 133 抽 样 方 差 V ( x st ) 是 评 价 简 单 估 计 x st 的 估 计 精 度 的 指 标. V ( x st ) 越 小, 说 明 x st 越 好. 当 各 层 内 总 体 方 差 相 近 时, 各 层 样 本 量 n i 应 该 正 比 于 各 层 总 体 容 量 N i 为 什 么 要 用 加 权 平 均 在 例 2.3( 城 镇 与 农 村 收 入 ) 中, 如 果 从 城 镇 与 农 村 都 抽 取 相 同 的 样 本 个 数, 采 用 直 接 两 个 平 均 值 再 简 单 地 平 均, 而 忽 略 实 际 农 村 人 口 数 为 城 镇 人 口 三 倍 以 上 的 事 实, 就 过 于 乐 观 地 估 计 了 所 有 人 口 的 收 入 设 所 有 城 镇 个 体 收 入 为 X i, i = 1,..., N 1, 所 有 农 村 个 体 收 入 为 Y j, j = 1,..., N 2. 则 城 镇 总 体 收 入 平 均 值 为 µ 1 = 1 N 1 X i ; N 1 i=1 农 村 总 体 收 入 平 均 值 为 µ 2 = 1 N 2 Y j. N 2 j=1 总 体 平 均 值 为 1 µ = N 1 + N 2 ( N1 ) N 2 X i + Y j i=1 j=1 1 = (N 1 µ 1 + N 2 µ 2 ) N 1 + N 2 = N 1 N 1 + N 2 µ 1 + N 2 N 1 + N 2 µ 2. 设 城 镇 样 本 平 均 值 为 x, 则 x 为 µ 1 的 良 好 估 计 ; 设 农 村 样 本 平 均 值 为 ȳ, 则 ȳ 为 µ 2 的 良 好 估 计 为 了 估 计 总 体 平 均 值 µ, 需 要 用 加 权 公 式 ˆµ = N 1 N 2 x + ȳ. N 1 + N 2 N 1 + N 2
140 134 第 六 章 描 述 性 统 计 分 层 抽 样 方 法 的 优 点 同 时 得 到 分 层 的 统 计 量 容 易 保 证 样 本 代 表 性 从 而 提 高 精 度 实 施 容 易 系 统 抽 样 随 机 抽 样 有 时 难 于 实 施, 当 个 体 排 列 本 身 比 较 随 机 时, 根 据 某 种 固 定 规 律 抽 取, 也 能 达 到 类 似 随 机 抽 样 效 果, 称 为 系 统 抽 样 例 2.4 在 调 查 某 居 民 住 宅 区 的 999 个 住 户 对 住 宅 区 的 环 境 满 意 程 度 时, 要 按 照 1 : 14 的 比 例 进 行 抽 样 调 查. 为 方 便 抽 样, 将 这 999 户 按 门 牌 号 码 的 顺 序 依 次 编 号. 下 面 的 每 个 数 对 应 一 户 的 门 牌 号 码 先 在 1-14 中 随 机 抽 取 一 个 数 字, 如 果 抽 到 7, 就 调 查 排 在 第 7 列 的 所 有 家 庭, 请 这 些 家 庭 对 小 区 环 境 的 满 意 程 度 打 分, 分 数 分 为 1, 2, 3, 4, 5 级. 第 7 列 有 71 户, 所 以 样 本 量 n = 71. 这 71 户 的 平 均 分 是 样 本 均 值. 用 样 本 均 值 作 为 全 体 住 户 对 小 区 环 境 的 平 均 分 的 估 计. 用 x i 表 示 这 71 户 中 第 i 户 的 打 分, 样 本 均 值 是 称 上 面 的 抽 样 方 法 为 系 统 抽 样 法. x = x 1 + x x
141 6.3 用 样 本 估 计 总 体 分 布 135 系 统 抽 样 法 的 特 点 如 果 总 体 中 的 个 体 按 一 定 的 方 式 排 列, 在 规 定 的 范 围 内 随 机 抽 取 一 个 个 体, 然 后 按 照 制 定 好 的 规 则 确 定 其 他 个 体 的 抽 样 方 法 称 为 系 统 抽 样 法. 最 简 单 的 系 统 抽 样 法 是 取 得 一 个 个 体 后, 按 相 同 的 间 隔 抽 取 其 他 个 体. 系 统 抽 样 方 法 的 主 要 优 点 是 实 施 简 单, 只 需 要 先 随 机 抽 取 第 一 个 个 体, 以 后 按 规 定 抽 取 就 可 以 了. 系 统 抽 样 法 比 随 机 抽 样 法 简 单, 随 机 抽 样 方 法 每 次 都 要 随 机 抽 取 个 体. 如 果 了 解 总 体 中 个 体 排 列 的 规 律, 设 计 合 适 的 系 统 抽 样 规 则 可 以 增 加 估 计 的 精 度. 6.3 用 样 本 估 计 总 体 分 布 表 格 与 图 形 概 括 实 际 数 据 量 可 能 很 大, 比 如 几 千 几 万 几 十 万 几 百 万 观 测 值 都 是 可 能 的 直 接 浏 览 数 据 可 以 获 得 一 些 直 观 印 象, 但 是 不 能 形 成 总 体 分 布 概 念 总 体 分 布 包 括 : 变 量 是 离 散 取 值 还 是 连 续 取 值 的, 如 果 离 散 取 值, 所 有 可 取 值 集 合 是 什 么, 每 种 取 值 出 现 多 少 次, 占 百 分 之 几 如 果 变 量 是 连 续 取 值 的, 需 要 了 解 变 量 的 取 值 范 围, 然 后 在 取 值 范 围 内 分 段, 对 每 段 的 取 值 个 数 进 行 计 数 并 计 算 百 分 比, 可 以 画 出 每 段 的 比 例 的 图 形 ( 称 为 直 方 图 ), 可 以 计 算 简 单 的 样 本 平 均 值 标 准 差 等, 可 以 画 密 度 估 计 图 茎 叶 图 等 频 率 分 布 表 对 离 散 型 总 体 ( 如 性 别 职 业 等 ), 只 要 列 出 样 本 样 本 每 个 值 的 次 数 和 比 例 例 如, 某 班 学 生 名 单 中, 男 生 30 个, 女 生 12 个, 可 以 列 出 如 下 概 括 统 计 表 格 : 人 数 百 分 比 男 生 30 71% 女 生 12 29%
142 136 第 六 章 描 述 性 统 计 对 于 连 续 型 总 体, 可 以 适 当 分 组 后 列 出 每 组 的 观 测 个 数 和 百 分 比 做 出 的 表 格 称 为 频 率 分 布 表 当 样 本 量 是 n, 可 以 参 照 下 面 的 经 验 公 式 将 数 据 分 成 大 约 K = 1 + 4lg n 段. 但 是 这 里 的 经 验 公 式 只 对 分 段 起 参 考 作 用. 例 3.1 下 面 是 某 城 市 公 共 图 书 馆 在 一 年 中 通 过 随 机 抽 样 调 查 得 到 的 60 天 的 读 者 借 书 数, 数 据 已 经 从 小 到 大 排 列, 制 作 频 率 分 布 表. 数 据 : 解 数 据 中 的 最 小 值 是 213, 最 大 值 是 584. 这 60 个 数 据 就 散 布 在 闭 区 间 [213, 584] 中. 取 一 个 略 大 的 区 间 (200, 600], 它 的 端 点 都 是 整 数. 用 经 验 公 式 计 算 出 K = 1 + 4lg n = lg 60 = 我 们 将 (200, 600] 八 等 分, 排 在 下 表 的 第 一 列. 计 算 出 数 据 落 入 各 段 的 个 数 n i, 填 入 第 二 列. 计 算 出 数 据 落 入 各 段 的 频 率 ( 百 分 比 ) f 1 = 3 60 = 5%, f 2 = %,, f 8 = 3 60 = 5%, 依 次 填 入 第 三 列.
143 6.3 用 样 本 估 计 总 体 分 布 137 最 后 将 各 列 之 和 填 入 最 后 一 行, 得 到 如 下 频 率 分 布 表. 借 出 书 数 i 发 生 次 数 n i f i = 发 生 频 率 (200, 250] 3 5.0% (250, 300] 2 3.3% (300, 350] % (350, 400] % (400, 450] % (450, 500] % (500, 550] 3 5.0% (550, 600] 3 5.0% 总 计 % 由 于 计 算 频 率 时 四 舍 五 入 引 起 计 算 误 差, 频 率 之 和 可 能 是 1 的 近 似. 从 上 述 频 率 分 布 表 可 以 方 便 地 分 析 出 以 下 结 果 : 有 8.3% 的 工 作 日 借 出 的 图 书 少 于 等 于 300 册 ; 有 63.3% 的 工 作 日 借 出 图 书 的 数 量 在 301 至 450 册 之 间 ; 有 48.3% 的 工 作 日 借 出 的 图 书 在 400 册 以 上 ; 只 有 10% 的 工 作 日 借 出 的 图 书 多 于 500 册. 当 总 体 X 是 全 年 每 个 工 作 日 的 借 书 数 量 时, 上 述 结 果 可 以 作 为 对 总 体 的 推 测. 制 作 频 率 分 布 表 的 一 般 步 骤 第 一 步 : 将 数 据 从 小 到 大 排 列, 将 排 列 后 的 数 据 进 行 分 段, 相 等 的 数 据 必 须 分 在 同 一 段 内. 每 段 中 的 数 据 被 称 为 一 组 数 据, 所 以 我 们 又 把 分 段 称 为 分 组. 分 段 的 多 少 应 当 适 中. 分 段 过 多, 数 据 过 于 分 散, 不 利 于 看 出 数 据 的 特 征 和 规 律 ; 分 段 过 少 也 不 利 于 看 到 数 据 的 特 征 和 规 律. 第 二 步 : 决 定 各 段 的 长 短. 在 许 多 情 况 下, 为 了 方 便, 除 去 第 一 和 最 后 这 两 段, 可 以 把 其 他 各 段 的 长 度 取 作 相 同.
144 138 第 六 章 描 述 性 统 计 还 应 当 把 各 段 的 端 点 确 定 在 便 于 记 忆 的 数 值 上. 为 了 达 到 以 上 目 的, 第 一 段 的 左 端 点 可 以 比 数 据 的 最 小 值 小 一 些, 最 后 一 段 的 右 端 点 可 以 比 数 据 的 最 大 值 大 一 些. 第 三 步 : 绘 制 频 率 分 布 表 的 第 一 列 ( 参 考 例 3.1). 第 四 步 : 计 算 每 段 内 数 据 的 个 数 n i, 填 入 表 格 的 第 二 列. 第 五 步 : 计 算 数 据 落 在 每 一 段 内 的 频 率 f i, 填 入 表 格 的 第 三 列. 第 六 步 : 将 第 2,3 列 之 和 填 入 最 后 一 行 形 成 总 计. 注 : 由 于 频 率 分 布 表 的 制 作 没 有 统 一 的 数 据 分 段 方 法, 所 以 对 相 同 的 数 据, 可 以 作 出 不 同 的 频 率 分 布 表. 但 是 好 的 频 率 分 布 表 应 当 是 简 单 明 了 的. 频 率 直 方 图 离 散 型 总 体 的 各 不 同 类 型 个 数 可 以 用 条 形 图 表 示 连 续 型 数 据 分 组 后 可 以 绘 制 频 数 直 方 图 这 与 频 率 分 布 表 类 似, 只 不 过 分 组 和 频 数 都 体 现 在 图 形 中 以 横 坐 标 表 示 分 组, 以 纵 坐 标 表 示 频 数, 一 个 组 用 一 个 小 矩 形 表 示 纵 坐 标 也 可 以 用 频 率, 这 样 图 形 不 变, 只 有 纵 坐 标 刻 度 变 化 称 为 频 率 直 方 图 纵 坐 标 还 可 以 适 当 伸 缩 使 得 小 长 方 形 的 的 总 面 积 等 于 1, 用 来 作 为 分 布 密 度 估 计, 称 为 密 度 直 方 图 下 面 的 图 用 的 是 频 数 每 日 借 出 图 书 分 布 频 数 直 方 图
145 6.3 用 样 本 估 计 总 体 分 布 139 Histogram of borrowed books Frequency x 折 线 直 方 图 对 密 度 直 方 图, 在 直 方 图 最 小 值 端 和 最 大 值 端 分 别 延 伸 出 一 个 高 度 为 零 的 小 矩 形, 然 后 把 两 个 相 邻 小 矩 形 的 顶 部 中 点 用 折 线 连 接 起 来, 得 到 密 度 估 计 的 折 线 图 见 下 面 图 的 蓝 色 线 每 日 借 出 图 书 分 布 密 度 估 计 折 线 图 Histogram of borrowed books Density x
146 140 第 六 章 描 述 性 统 计 茎 叶 图 茎 叶 图 可 以 看 成 水 平 放 置 的 直 方 图 茎 叶 图 可 以 把 所 有 数 据 点 画 到 图 上 双 茎 叶 图 可 以 比 较 两 个 变 量 例 3.4 上 海 市 2004 年 7 月 10 日 至 2004 年 7 月 31 日 空 气 中 可 吸 入 颗 粒 物 的 监 测 数 据 : 解 先 将 数 据 从 小 到 大 排 列 得 到 : 数 据 的 十 位 上 的 数 是 5,6,7,8,9, 把 他 们 叫 做 茎, 排 列 下 表 的 第 一 列 ; 茎 5 后 面 的 个 位 数 分 别 是 1,2,2,5,7,9,9, 把 他 们 叫 做 茎 5 的 叶, 排 在 茎 5 的 后 面, 按 相 同 的 方 法 把 茎 6 的 叶 2,2,2,6,7 排 在 茎 6 的 右 边,, 把 茎 9 的 叶 3,4,6,6,7 排 在 茎 9 的 右 边. 就 得 到 了 如 下 的 茎 叶 图. 茎 叶 茎 起 到 坐 标 轴 的 作 用 叶 可 以 用 来 核 查 数 据, 叶 的 多 少 构 成 了 横 向 的 直 方 图
147 6.3 用 样 本 估 计 总 体 分 布 141 从 茎 叶 图 中 看 出, 尽 管 这 22 天 中 可 吸 入 颗 粒 物 都 是 处 于 良 的 水 平, 但 是 有 较 多 的 时 间 接 近 于 优, 也 有 较 多 的 时 间 接 近 于 轻 度 污 染. 注 : 可 吸 入 颗 粒 物 在 0 至 50 之 间 称 为 优 ; 可 吸 入 颗 粒 物 在 51 至 100 之 间 称 为 良 ; 可 吸 入 颗 粒 物 在 101 至 150 之 间 称 为 轻 度 污 染. 每 日 借 出 图 书 样 本 的 茎 叶 图 The decimal point is 2 digit(s) to the right of the 数 据 值 近 似 到 了 两 位 有 效 数 字 双 茎 叶 图 例 子 上 海 市 2004 年 7 月 10 日 至 2004 年 7 月 31 日 空 气 中 二 氧 化 硫 和 二 氧 化 氮 的 监 测 数 据. 二 氧 化 硫 数 据 : 二 氧 化 氮 数 据 : 先 将 两 组 数 据 分 别 从 小 到 大 排 列, 得 到 : 二 氧 化 硫 数 据 :
148 142 第 六 章 描 述 性 统 计 二 氧 化 氮 数 据 : 两 个 茎 叶 图 共 享 同 一 个 茎 作 为 坐 标 轴 二 氧 化 硫 的 叶 子 放 在 茎 左 侧, 二 氧 化 氮 的 叶 子 放 在 茎 右 侧 图 : 二 氧 化 硫 树 二 氧 化 氮 树 叶 茎 树 叶 纯 以 数 值 比 较, 二 氧 化 硫 的 空 气 质 量 指 标 比 二 氧 化 氮 的 空 气 质 量 指 标 要 差 很 多. 数 据 茎 叶 图 的 优 点 是 利 用 了 数 据 的 每 个 信 息, 从 茎 叶 图 中 可 以 直 观 地 看 到 数 据 的 分 布 情 况. 但 是 数 据 量 很 大 时, 茎 叶 图 的 效 果 就 不 好 了, 因 为 这 时 的 茎 叶 图 会 很 长 或 很 宽. 6.4 众 数 和 中 位 数 众 数 和 中 位 数 数 据 的 频 率 分 布 表, 频 率 分 布 直 方 图 和 茎 叶 图 都 可 以 展 示 出 数 据 的 分 布 形 状, 从 中 可 以 对 数 据 有 一 个 大 致 的 了 解. 需 要 更 简 单 概 括 的 描 述 方 式 平 均 值 标 准 差 众 数 中 位 数 等 称 为 数 据 的 数 字 特 征
149 6.4 众 数 和 中 位 数 143 众 数 众 数 是 观 测 值 中 出 现 次 数 最 多 的 数, 记 为 M 0 如 果 次 数 最 多 的 不 止 一 个, 众 数 允 许 有 多 个 众 数 有 一 定 代 表 性 它 受 数 据 中 极 大 或 极 小 值 变 化 的 影 响 较 小. 从 分 布 的 角 度 看, 众 数 出 现 的 频 率 最 高. 但 是, 众 数 的 位 置 偶 然 性 也 比 较 大, 现 代 采 用 较 少 例 4.1 某 超 市 用 随 机 抽 样 的 方 式 调 查 了 30 个 顾 客 购 买 商 品 的 件 数, 结 果 从 小 到 大 排 列 如 下 : 求 众 数 和 样 本 均 值. 解 样 本 中 10 出 现 的 次 数 最 多, 是 4 次, 所 以 10 是 众 数. 样 本 均 值 是 x = 1 ( ) = 在 例 4.1 中, 如 果 购 买 件 数 最 多 的 那 个 顾 客 购 买 件 数 增 加 从 29 增 加 的 到 40, 众 数 不 变, 样 本 均 值 增 加 为 数 据 中 最 大 值 的 变 化 对 众 数 没 有 影 响, 对 样 本 均 值 的 影 响 较 大. 极 差 数 据 中 最 大 值 与 最 小 值 的 差 称 为 极 差, 直 观 反 映 了 数 据 分 布 范 围 宽 窄 例 4.1 中 极 差 为 29 0 = 29
150 144 第 六 章 描 述 性 统 计 中 位 数 样 本 数 据 从 小 到 大 排 列 后, 最 中 间 的 一 个 ( 有 奇 数 个 时 ) 的 值 或 最 中 间 的 两 个 ( 有 偶 数 个 时 ) 的 平 均 值 为 样 本 中 位 数 记 作 M d 用 作 样 本 左 右 位 置 的 一 个 度 量 指 标, 以 及 总 体 左 右 位 置 的 估 计 设 观 测 数 据 已 经 被 从 小 到 大 排 列 为 : x 1 x 2 x n. 对 n 为 奇 数 情 况, 中 位 数 是 从 小 到 大 排 在 中 间 一 个,M d = x n+1 如 : 2 1, 5, 9, 12, 13 的 中 位 数 是 9. 对 n 为 偶 数 情 况, 中 位 数 用 从 小 到 大 排 在 中 间 的 两 个 平 均 计 算, M d = 1 2 (x n 2 + x n 2 +1 ) 如 : 1, 5, 9, 12, 13, 21 的 中 位 数 是 M d = = 10.5 小 于 等 于 中 位 数 的 数 据 不 少 于 样 本 量 的 二 分 之 一, 大 于 等 于 中 位 数 的 数 据 不 少 于 样 本 量 的 二 分 之 一 中 位 数 作 为 总 体 位 置 的 度 量 比 较 不 受 极 端 值 影 响, 而 均 值 则 会 收 到 极 端 值 影 响 例 年, 在 对 A 城 市 进 行 年 人 均 收 入 调 查 时, 采 用 随 机 抽 样 的 方 法 得 到 了 以 下 10 个 数 据 ( 单 位 : 万 元 ): 0.79, 0.98, 1.17, 1.46, 1.67, 1.79, 1.82, 1.98, 2.26, 9.78 计 算 中 位 数 和 样 本 均 值. 解 数 据 已 经 从 小 到 大 排 列. 中 位 数 是 M d = = 样 本 均 值 x = = 2.37.
151 6.4 众 数 和 中 位 数 145 数 据 的 茎 叶 图 ( 精 确 到 小 数 点 后 1 位 ): 茎 叶 观 测 点 9.78 和 其 它 值 距 离 很 远 称 这 样 的 值 为 离 群 值 如 果 对 A 城 市 不 了 解 其 他 经 济 情 况, 很 难 作 出 年 人 均 收 入 的 合 理 估 计. x = 2.37 很 可 能 过 高 估 计 了 总 体 均 值, 因 为 9.78 万 元 的 年 收 入 比 其 他 人 的 年 收 入 大 的 太 多 了 拉 高 了 样 本 均 值. 中 位 数 1.73 看 来 好 一 些, 但 是 也 可 能 低 估 或 高 估 了 总 体 均 值, 我 们 还 不 了 解 有 9.78 万 元 年 收 入 的 人 的 比 例. 要 作 出 合 理 的 估 计, 必 须 增 加 抽 样 调 查 的 样 本 量. 例 4.3 数 学 考 试 后, 甲 班 成 绩 的 中 位 数 是 72 分, 乙 班 成 绩 的 中 位 数 是 78 分. 仅 从 这 两 个 数 看, 哪 班 数 学 好 的 同 学 更 多 一 些. 解 甲 班 有 不 少 于 50% 的 同 学 的 成 绩 在 72 分 之 下, 乙 班 有 不 少 于 50% 的 同 学 的 学 习 成 绩 在 78 分 之 上, 乙 班 数 学 好 的 同 学 更 多 一 些. 四 分 之 一 和 四 分 之 三 分 位 数 设 样 本 的 中 位 数 为 M d, 从 样 本 中 取 出 小 于 等 于 M d 的 子 集, 计 算 这 个 子 集 的 中 位 数, 定 义 为 四 分 之 一 分 位 数
152 146 第 六 章 描 述 性 统 计 大 于 等 于 四 分 之 一 分 位 数 的 样 本 点 占 所 有 样 本 点 比 例 约 为 四 分 之 一, 小 于 等 于 四 分 之 一 分 位 数 的 样 本 点 占 所 有 样 本 点 比 例 约 为 四 分 之 三 四 分 之 三 分 位 数 类 似 计 算 总 体 分 位 数 设 总 体 X 有 严 格 单 调 增 的 连 续 分 布 函 数 F (x),f 1 (p), p (0, 1) 为 F ( ) 的 反 函 数 对 p (0, 1), 称 F 1 (p) 为 X 的 p 分 位 数 一 般 地, 若 x p 使 得 P (X x p ) p, P (X x p ) 1 p, 称 x p 为 X 的 p 分 位 数 这 样 的 p 分 位 数 可 能 不 唯 一 为 了 使 得 p 分 位 数 定 义 唯 一, 令 F 1 (p) = inf{x : F (x) p}, p (0, 1) 称 F 1 (p) 为 X 的 p 分 位 数 样 本 分 位 数 样 本 分 位 数 是 总 体 分 位 数 的 估 计 对 样 本 x 1, x 2,..., x n, 设 其 从 小 到 大 排 列 为 x (1) x (2)... x (n), 总 体 分 位 数 x p 的 估 计 常 采 用 b = x ([np]), 这 里 [ ] 表 示 向 下 取 整 运 算 分 位 数 估 计 有 多 种 方 法,b = x ([np]) 是 一 个 最 简 单 的 估 计 约 有 比 例 p 的 样 本 小 于 等 于 样 本 p 分 位 数, 约 有 比 例 1 p 的 样 本 大 于 等 于 样 本 p 分 位 数 6.5 随 机 对 照 试 验 随 机 对 照 试 验 观 察 研 究 是 不 严 谨 的 研 究 方 式 为 了 解 某 药 物 治 疗 等 的 效 果, 需 要 进 行 双 盲 随 机 对 照 试 验
153 6.5 随 机 对 照 试 验 147 例 : 坏 血 病 研 究 例 : 经 脉 吻 合 分 流 试 验 随 机 对 照 组 是 必 要 的, 否 则 可 能 得 出 错 误 结 论 例 : 脊 髓 灰 质 炎 疫 苗 双 盲 随 机 对 照 试 验 例 : 坏 血 病 的 研 究 17 世 纪 初 期, 长 期 在 海 上 航 行 的 水 手 经 常 患 坏 血 病. 坏 血 病 的 症 状 是 牙 龈 肿 大 出 血, 皮 肤 上 出 现 青 灰 的 斑 点. 英 国 海 军 部 试 图 考 察 坏 血 病 的 起 因. 他 们 怀 疑 这 是 因 为 水 手 缺 乏 柑 橘 类 的 水 果 造 成 的. 当 此 想 法 提 出 时, 刚 好 有 4 艘 军 舰 要 远 航. 为 了 调 查 是 否 由 于 水 手 缺 乏 柑 橘 类 的 水 果 而 导 致 坏 血 病, 海 军 部 随 机 地 安 排 了 一 艘 军 舰 上 的 水 兵 每 天 喝 柑 橘 汁, 另 外 3 艘 军 舰 不 供 应 柑 橘 汁. 这 是 一 次 安 排 好 的 试 验. 试 验 的 结 果 是 : 航 行 还 没 有 结 束, 没 有 提 供 柑 橘 汁 的 水 手 多 数 得 了 坏 血 病, 而 提 供 柑 橘 汁 的 军 舰 没 有 发 现 坏 血 病. 最 后, 提 供 柑 橘 汁 的 军 舰 不 得 不 把 携 带 的 柑 橘 汁 分 给 其 他 的 军 舰, 以 帮 助 他 们 顺 利 返 航. 尽 管 本 次 试 验 的 计 划 还 可 以 从 各 个 方 面 进 行 改 进, 但 是 试 验 的 结 果 成 功 地 证 实 了 最 初 的 怀 疑. 在 例 5.1 中, 我 们 称 喝 柑 橘 汁 的 水 兵 是 试 验 组 (experimental group), 称 不 喝 柑 橘 汁 的 水 兵 为 对 照 组 (control group). 试 验 组 由 随 机 选 择 出 的 对 象 构 成, 试 验 组 的 成 员 要 接 受 某 种 特 殊 的 待 遇 或 治 疗 等. 而 对 照 组 由 那 些 没 有 接 受 这 种 特 殊 待 遇 的 对 象 构 成. 一 个 好 的 试 验 设 计 应 当 有 一 个 试 验 组 和 一 个 对 照 组. 为 什 么 要 有 对 照 组? 在 例 5.1 中, 如 果 没 有 对 照 组, 为 4 艘 军 舰 都 提 供 柑 橘 汁, 就 没 有 水 兵 患 上 坏 血 病, 海 军 部 就 不 能 确 认 他 们 的 最 初 怀 疑. 因 为 不 能 确 定 是 否 有 其 他 的 食 品 或 治 疗 避 免 了 坏 血 病. 为 什 么 试 验 组 要 随 机 抽 取?
154 148 第 六 章 描 述 性 统 计 在 例 5.1 中, 如 果 安 排 喜 欢 喝 柑 橘 汁 的 水 兵 在 试 验 组, 喜 欢 喝 啤 酒 的 水 兵 在 对 照 组, 就 不 能 确 定 研 究 开 始 前 这 两 组 水 兵 的 身 体 状 况 是 否 有 差 异. 水 手 身 体 状 况 的 差 异 也 可 能 影 响 是 否 容 易 得 坏 血 病. 随 机 选 择 试 验 组 能 够 有 效 地 抵 消 个 体 差 异 造 成 的 对 试 验 结 果 的 影 响. 随 机 选 择 试 验 对 象 是 英 国 统 计 学 家 费 歇 (Fisher) 的 贡 献, 在 20 世 纪 初, 他 用 此 方 法 致 力 于 农 业 试 验 的 研 究. 从 此 随 机 选 择 试 验 组 成 为 安 排 试 验 的 基 本 原 则. 例 : 静 脉 吻 合 分 流 术 在 一 些 肝 硬 化 病 例 中, 许 多 病 人 会 从 肝 出 血 直 至 死 亡. 历 史 上 有 一 种 称 为 静 脉 吻 合 分 流 术 的 外 科 手 术 用 于 治 疗 肝 硬 化, 其 原 理 是 运 用 外 科 手 术 的 方 法 使 血 流 改 变 方 向. 这 种 手 术 花 费 很 大 并 且 有 很 高 的 危 险 性. 值 得 做 这 样 的 手 术 吗? 为 了 解 决 上 述 问 题, 一 共 有 三 批 共 51 次 手 术 试 验. 第 一 批 进 行 了 32 次 无 对 照 组 的 试 验. 结 果 如 下 : 设 计 方 法 显 著 有 效 中 等 有 效 无 效 试 验 次 数 无 对 照 组 所 占 比 例 75% 21.9% 3.1% 100% 试 验 说 明 有 75% 的 手 术 显 著 有 效, 21.9% 的 手 术 中 等 有 效, 看 来 手 术 是 值 得 做 的. 第 二 批 共 进 行 了 15 次 手 术 试 验, 这 批 试 验 有 对 照 组, 但 是 对 照 组 的 病 人 不 是 随 机 选 取 的. 医 生 根 据 病 人 的 临 床 诊 断 情 况 决 定 是 将 病 人 编 入 实 验 组 做 手 术, 还 是 编 入 对 照 组 不 做 手 术. 结 果 如 下 : 设 计 方 法 显 著 有 效 中 等 有 效 无 效 试 验 次 数 非 随 机 对 照 所 占 比 例 66.7% 20% 13.3% 100% 这 次 试 验 的 结 果 是 66.7% 的 手 术 显 著 有 效, 20% 的 手 术 中 等 有 效, 13.3% 的 手 术 无 效. 这 个 试 验 结 果 也 是 对 静 脉 吻 合 分 流 术 的 肯 定. 这 次 的 结 果 与 无 对 照 组 的 试 验 结 果 差 别 不 是 很 大. 再 看 有 随 机 选 取 的 对 照 组 的 第 三 批 试 验, 这 批 试 验 只 有 4 次 手 术. 随 机 选 取 的 方 式 类 似 于 掷 硬 币, 如 果 硬 币 正 面 朝 上 就 将 病 人 选 入 试 验 组
155 6.5 随 机 对 照 试 验 149 作 手 术. 这 次 试 验 处 理 组 的 结 果 如 下 : 设 计 方 法 显 著 有 效 中 等 有 效 无 效 试 验 次 数 随 机 对 照 所 占 比 例 0% 25% 75% 100% 随 机 对 照 试 验 的 结 果 显 著 地 否 定 了 外 科 手 术 静 脉 吻 合 分 流 术. 结 果 显 示 : 设 计 差 的 试 验 研 究 过 分 夸 大 了 外 科 手 术 静 脉 吻 合 分 流 术 的 价 值. 经 过 认 真 设 计 的 试 验 研 究 显 示 静 脉 吻 合 分 流 术 几 乎 没 有 什 么 价 值. 为 什 么 会 出 现 如 此 大 的 差 别 呢? 在 无 对 照 组 和 非 随 机 选 取 对 照 组 的 试 验 中, 实 验 者 根 据 病 人 的 临 床 诊 断 决 定 是 否 将 他 编 入 试 验 组 进 行 手 术. 这 样 做 就 出 现 一 种 自 然 的 倾 向 : 试 验 人 员 更 倾 向 于 将 那 些 身 体 状 态 较 好 的 病 人 选 入 试 验 组, 以 减 少 手 术 风 险. 其 结 果 有 利 于 对 手 术 的 肯 定 评 价, 这 种 结 果 是 不 真 实 的. 对 上 述 试 验 的 跟 踪 观 测 发 现, 做 手 术 的 51 个 病 人 中 3 年 后 大 约 有 60% 仍 然 活 着, 随 机 对 照 组 中 ( 没 做 手 术 的 病 人 )3 年 后 大 约 也 有 60% 的 病 人 仍 然 活 者. 这 就 说 明 手 术 基 本 是 无 效 的. 而 在 非 随 机 对 照 组 中, 只 有 45% 的 病 人 存 活 期 超 过 三 年, 这 就 说 明 了 非 随 机 对 照 组 中 的 病 人 健 康 情 况 较 差, 验 证 了 健 康 情 况 较 好 的 病 人 更 容 易 被 选 入 试 验 组 作 手 术. 随 机 安 排 对 照 组 是 十 分 必 要 的, 否 则 可 能 得 出 错 误 的 结 论. 我 们 称 随 机 选 取 试 验 组 的 对 照 试 验 为 随 机 对 照 试 验. 其 它 随 机 对 照 试 验 案 例 在 人 类 历 史 上 还 有 许 多 成 功 使 用 随 机 对 照 试 验 的 例 子, 也 有 许 多 惨 重 的 教 训. 例 如, 随 机 对 照 实 验 否 定 了 治 疗 冠 状 动 脉 病 的 冠 状 旁 道 外 科 手 术 ( 该 手 术 费 用 昂 贵 ), 否 定 了 用 抗 凝 剂 治 疗 心 脏 病 突 发, 否 定 了 用 5-FU 对 结 肠 癌 进 行 化 疗, 否 定 了 用 乙 烯 雌 粉 预 防 流 产.
156 150 第 六 章 描 述 性 统 计 具 体 情 况 如 下. 医 疗 方 法 随 机 对 照 实 验 非 随 机 对 照 实 验 结 论 有 效 无 效 有 效 无 效 冠 状 旁 道 手 术 抗 凝 剂 治 疗 FU 结 肠 癌 化 疗 乙 烯 雌 粉 预 防 流 产 特 别 需 要 指 出 的 是 有 关 乙 烯 雌 粉 的 实 验, 随 机 对 照 试 验 完 全 否 定 了 这 种 预 防 流 产 的 药. 但 是 起 初 的 非 随 机 对 照 试 验 却 赞 同 药 的 疗 效, 这 是 一 个 医 学 的 悲 剧. 在 美 国 的 60 年 代 末, 医 生 每 年 大 约 为 5 万 名 孕 妇 发 放 这 种 药. 后 来 揭 示, 怀 孕 期 间 的 母 亲 服 用 乙 烯 雌 粉, 20 年 后 给 她 们 的 女 儿 带 来 灾 害 性 的 副 作 用, 可 能 引 发 他 们 的 女 儿 得 一 种 罕 见 的 癌 症. 该 药 于 1971 年 被 禁 止 使 用. 人 们 从 太 多 的 悲 剧 中 总 结 了 教 训 : 对 一 种 新 药 不 作 随 机 对 照 实 验 是 非 常 危 险 的. 小 儿 麻 痹 症 疫 苗 随 机 对 照 双 盲 试 验 1916 年 小 儿 麻 痹 症 ( 脊 髓 灰 质 炎 ) 袭 击 了 美 国, 以 后 的 40 年 间, 受 害 者 成 千 上 万. 20 世 纪 50 年 代, 人 们 开 始 开 发 预 防 疫 苗. 当 时 萨 凯 (Salk) 培 育 的 疫 苗 最 有 希 望. 他 的 疫 苗 在 实 验 室 中 表 现 良 好 : 安 全, 产 生 对 脊 髓 灰 质 炎 病 毒 的 抗 体. 但 是 在 大 规 模 使 用 前 必 须 进 行 现 场 人 体 试 验, 通 过 试 验 最 后 确 定 疫 苗 是 否 有 效. 只 有 这 样 才 能 达 到 保 护 儿 童 的 目 的. 当 时 采 用 了 随 机 对 照 的 研 究 方 案, 对 每 个 儿 童 用 类 似 投 掷 一 个 硬 币 的 方 法 决 定 是 否 将 其 编 入 试 验 组 : 正 面 朝 上 分 在 试 验 组, 否 则 分 在 对 照 组. 除 了 试 验 的 设 计 人 员, 连 医 生 也 不 知 道 哪 个 儿 童 分 在 试 验 组, 哪 个 儿 童 分 在 对 照 组. 然 后, 给 分 在 试 验 组 的 儿 童 注 射 疫 苗, 给 分 在 对 照 组 的 儿 童 注 射 生 理 盐 水, 让 他 们 认 为 也 被 注 射 了 疫 苗. 得 到 的 结 果 如 下 : 试 验 人 数 试 验 后 的 发 病 率 试 验 组 20 万 28/10 万 对 照 组 20 万 71/10 万
157 6.5 随 机 对 照 试 验 151 试 验 结 果 显 示, 疫 苗 将 小 儿 麻 痹 症 的 发 病 率 从 10 万 分 之 71 降 低 到 10 万 分 之 28. 由 于 和 的 差 别 超 出 了 随 机 性 本 身 所 能 解 释 的 范 围, 所 以 宣 布 疫 苗 是 成 功 的. 进 一 步 的 分 析 指 出, 可 以 以 近 100% 的 概 率 保 证 疫 苗 是 有 效 的 ( 参 考 8.6, 例 6.4). 我 们 把 对 照 组 中 的 处 理 方 法 称 为 使 用 安 慰 剂 (placebo), 例 5.3 中 的 安 慰 剂 是 注 射 生 理 盐 水. 给 对 照 组 的 儿 童 使 用 安 慰 剂 是 为 了 避 免 儿 童 的 心 理 作 用 影 响 试 验 的 结 果. 尽 管 可 以 认 为 光 靠 精 神 作 用 不 能 抵 抗 小 儿 麻 痹 症, 但 是 为 了 确 认 试 验 结 果 的 可 靠 性, 使 用 安 慰 剂 是 必 要 的. 不 让 医 生 知 道 儿 童 是 来 自 试 验 组 还 是 对 照 组 是 为 了 使 医 生 能 够 作 出 更 公 正 的 诊 断, 避 免 在 诊 断 儿 童 是 否 患 有 小 儿 麻 痹 症 时 受 到 心 理 因 素 的 影 响. 此 例 中 的 随 机 对 照 试 验 又 称 为 随 机 对 照 双 盲 试 验. 双 盲 的 之 一 是 指 儿 童 自 己 不 知 道 自 己 是 在 试 验 组 还 是 在 试 验 组, 也 就 是 说 不 知 道 自 己 被 注 射 的 是 疫 苗 还 是 安 慰 剂, 甚 至 不 知 道 有 安 慰 剂, 这 就 有 效 地 避 免 了 潜 在 的 心 理 影 响. 另 外 一 盲 是 指 医 生 不 了 解 他 诊 断 的 病 人 在 对 照 组 还 是 在 试 验 组, 这 就 避 免 了 医 生 对 疫 苗 的 主 观 看 法 带 来 的 可 能 影 响. 在 可 能 的 场 合, 随 机 对 照 双 盲 试 验 可 以 最 大 程 度 地 避 免 心 理 因 素 的 影 响. 在 许 多 场 合, 精 神 因 素 是 不 能 忽 视 的. 有 资 料 显 示 在 医 院 中 给 那 些 手 术 后 产 生 剧 痛 的 病 人 服 用 由 淀 粉 制 成 的 止 痛 片 后, 大 约 有 1/3 的 病 人 感 觉 剧 痛 减 轻.
158 152 第 六 章 描 述 性 统 计
159 第 七 章 参 数 估 计 7.1 点 估 计 和 矩 估 计 总 体 和 样 本 如 果 X 是 从 总 体 中 随 机 抽 样 得 到 的 个 体, 则 X 是 随 机 变 量, X 的 分 布 就 是 总 体 的 分 布. 如 果 对 总 体 进 行 有 放 回 的 随 机 抽 样, 就 得 到 独 立 同 分 布 的, 和 X 同 分 布 的 随 机 变 量 X 1, X 2,, X n. 我 们 称 X 1, X 2,, X n 是 来 自 总 体 X 的 简 单 随 机 样 本. 在 2.2 的 例 2.1, 观 测 放 射 性 钋 放 射 α 粒 子 的 试 验 中, 用 X 表 示 7.5 秒 内 观 测 到 的 粒 子 数. 在 独 立 重 复 观 测 时, 用 X i 表 示 第 i 次 观 测 结 果, 则 X 1, X 2,, X n 独 立 同 分 布, 和 X 同 分 布, X 1, X 2,, X n 是 来 自 总 体 X 的 简 单 随 机 样 本. 定 义 1.1 如 果 X 1, X 2,, X n 独 立 同 分 布, 和 X 同 分 布, 就 称 X 是 总 体, 称 X 1, X 2,, X n 是 总 体 X 的 简 单 随 机 样 本, 称 观 测 数 据 的 个 数 n 为 样 本 量. 为 了 简 单, 也 把 总 体 X 的 简 单 随 机 样 本 简 称 为 总 体 X 的 样 本. 在 实 际 问 题 中 得 到 的 总 是 简 单 随 机 样 本 X 1, X 2,, X n 的 观 测 值 x 1, x 2,, x n. 我 们 也 称 x 1, x 2,, x n 是 总 体 X 的 简 单 随 机 样 本. 在 统 计 学 中, 常 常 不 把 X 1, X 2,, X n 与 它 们 的 观 测 值 x 1, x 2,, x 2 严 格 区 分, 这 是 为 了 符 号 使 用 的 方 便. 当 对 数 据 进 行 统 计 分 析 时, 用 大 写 的 X 1, X 2,, X n, 实 际 计 算 时 更 多 地 用 小 写 的 x 1, x 2,, x n. 在 统 计 问 题 中, 总 体 X 的 分 布 形 式 往 往 是 已 知 的. 例 如 重 复 测 量 一 个 物 体 的 重 量 时, 认 为 总 体 X 服 从 正 态 分 布 N(µ, σ 2 ), 未 知 参 数 是 153
160 154 第 七 章 参 数 估 计 (µ, σ 2 ), 问 题 是 根 据 来 自 总 体 X 的 样 本 X 1, X 2,, X n 估 计 总 体 参 数 (µ, σ 2 ). 观 测 放 射 性 钋 放 射 α 粒 子 时, 总 体 X 服 从 泊 松 分 布 P(λ), 未 知 参 数 是 λ, 问 题 是 根 据 来 自 总 体 X 的 样 本 X 1, X 2,, X n 估 计 λ. 估 计 量 ( 统 计 量 ) 设 X 1, X 2,, X n 是 总 体 X 的 简 单 随 机 样 本, θ 是 总 体 X 的 未 知 参 数. 如 果 g(x 1, x 2,, x n ) 是 已 知 函 数, 就 称 ˆθ = g(x 1, X 2,, X n ) 是 θ 的 估 计 量, 简 称 为 估 计 (estimator). 换 句 话 说, 估 计 或 估 计 量 是 从 观 测 数 据 X 1, X 2,, X n 能 够 直 接 计 算 的 量. 计 算 后 得 到 的 值 称 为 估 计 值. 估 计 量 也 称 为 统 计 量 (statistic). 设 ˆθ 是 总 体 参 数 θ 的 估 计, 作 为 随 机 变 量 X 1, X 2,, X n 的 函 数, 估 计 量 ˆθ 也 是 随 机 变 量. 估 计 量 是 样 本 的 函 数. 估 计 的 优 良 性 用 估 计 量 ˆθ 去 估 计 总 体 参 数 θ, 我 们 希 望 ˆθ 能 够 尽 可 能 与 θ 接 近, 但 由 于 随 机 性 影 响 误 差 是 不 可 避 免 的 引 入 下 面 的 关 于 估 计 优 良 性 的 定 义 定 义 1.2 设 ˆθ 是 θ 的 估 计. (1) 如 果 Eˆθ = θ, 称 ˆθ 是 θ 的 无 偏 估 计 ; (2) 如 果 当 样 本 量 n, ˆθ 依 概 率 收 敛 到 θ, 就 称 ˆθ 是 θ 的 相 合 估 计 (consistent estimator); (3) 如 果 当 样 本 量 n, ˆθ 以 概 率 1 收 敛 到 θ, 就 称 ˆθ 是 θ 的 强 相 合 估 计 (strongly consistent estimator). 由 于 以 概 率 1 收 敛 可 以 推 出 依 概 率 收 敛, 所 以 强 相 合 估 计 一 定 是 相 合 估 计. 一 个 估 计 起 码 应 当 是 相 合 的, 否 则 我 们 不 知 道 这 个 估 计 有 什 么 优 点, 也 不 知 道 它 估 计 的 是 谁.
161 7.1 点 估 计 和 矩 估 计 155 均 值 的 估 计 设 总 体 均 值 µ = EX 存 在, X 1, X 2,, X n 是 总 体 X 的 简 单 随 机 样 本. 均 值 µ 的 估 计 定 义 为 X n = 1 n n X i (1.1) i=1 由 于 Xn 是 从 样 本 计 算 出 来 的, 所 以 是 样 本 均 值. 样 本 均 值 Xn 有 如 下 的 性 质. (1) X n 是 µ 的 无 偏 估 计. 这 是 因 为 E X n = µ. (2) X n 是 µ 的 强 相 合 估 计, 从 而 是 相 合 估 计. 这 是 因 为 从 强 大 数 律 得 到 lim n X n = µ, wp1. (1.2) 方 差 的 估 计 总 体 方 差 σ 2 = Var(X) 的 点 估 计 由 S 2 = 1 n 1 n (X j ˆµ) 2 (1.4) j=1 定 义. 由 于 S 2 是 从 样 本 计 算 出 来 的, 所 以 是 样 本 方 差. 定 义 Y j = X j µ, 有 Ȳ n = 1 n n Y j = ˆµ µ, j=1 Y j Ȳn = X j ˆµ, EȲ 2 n = σ2 n.
162 156 第 七 章 参 数 估 计 于 是 得 到 S 2 = 1 n 1 = 1 n 1 = 1 n 1 = 1 n 1 n (X j X n ) 2 = 1 n (Y j n 1 Ȳn) 2 j=1 n (Yj 2 2Y j Ȳ n + Ȳ n 2 ) j=1 [ n j=1 [ n j=1 Y 2 j Y 2 j 2nȲnȲn + nȳ 2 n nȳ 2 n j=1 ] ]. (1.5) 从 而 有 ES 2 = 1 n 1 [ n j=1 EY 2 j 说 明 S 2 是 σ 2 的 无 偏 估 计. 利 用 强 大 数 律 得 到 所 以 由 1.5 得 到 1 n 1 n j=1 neȳ 2 n ] = 1 n 1 (nσ2 σ 2 ) = σ 2. Y 2 j EY 2 1 = σ 2, wp1. 1 n 1 nȳ 2 n (EY 1 ) 2 = 0, wp1. 说 明 S 2 是 强 相 合 估 计, 从 而 也 是 相 合 估 计. S 2 σ 2, wp1. (1.6) 标 准 差 σ 的 估 计 由 于 S 2 是 σ 2 的 估 计, 所 以 定 义 标 准 差 σ 的 估 计 为 S = S 2 = 1 n (X j ˆµ) n 1 2. S 是 样 本 标 准 差. 由 于 S σ, wp1. 成 立, 所 以 S 是 σ 的 强 相 合 估 计. 但 是 S 一 般 不 是 σ 的 无 偏 估 计. 实 际 上 用 内 积 不 等 式 得 到 j=1 ES = E(1 S) 1 ES 2 = σ. 等 号 成 立 时 有 不 全 为 零 的 常 数 a, b 使 得 P (as + b = 0) = 1, 于 是 S = b/a, wp1. 所 以 只 要 S 等 于 常 数 的 概 率 小 于 1, 则 ES < σ.
163 7.1 点 估 计 和 矩 估 计 157 样 本 均 值 方 差 标 准 差 的 理 论 结 果 定 理 1.1 设 X 1, X 2,, X n 是 总 体 X 的 简 单 随 机 样 本, µ = EX, σ 2 = Var(X). (1) 样 本 均 值 Xn 是 总 体 均 值 µ 的 强 相 合 无 偏 估 计, (2) 样 本 方 差 S 2 是 总 体 方 差 σ 2 的 强 相 合 无 偏 估 计, (3) 样 本 标 准 差 S 是 总 体 标 准 差 σ 的 强 相 合 估 计. 例 1.1 设 X 1, X 2,, X n 是 总 体 X 的 简 单 随 机 样 本, 则 X j 1, X j 2,, X j n 是 总 体 X j 的 简 单 随 机 样 本, 所 以 当 原 点 矩 ν j = EX j 存 在 时, 是 ν j 的 点 估 计. ˆν j 具 有 无 偏 性 和 强 相 合 性. ˆν j = 1 n n X j i (1.7) 最 后 指 出, 在 实 际 数 据 的 计 算 中, 也 常 用 x n, s 2 和 s 分 别 表 示 样 本 均 矩 估 计 值, 样 本 方 差 和 样 本 标 准 差 : x n = 1 n x j, s 2 = 1 n (x j x n ) 2, s = s n n 1 2. (1.8) j=1 设 X 1, X 2,, X n 是 总 体 X 的 简 单 随 机 样 本, 已 知 X 有 分 布 函 数 其 中 的 θ 1, θ 2,, θ m 是 未 知 参 数. i=1 j=1 F (x; θ 1, θ 2,, θ m ). (1.9) 如 果 能 得 到 表 达 式 其 中 θ 1 = g 1 (ν 1, ν 2,, ν m ), θ 2 = g 2 (ν 1, ν 2,, ν m ),, θ m = g m (ν 1, ν 2,, ν m ), ν j = EX j, j = 1, 2,, m, (1.10)
164 158 第 七 章 参 数 估 计 就 称 由 ˆθ 1 = g 1 (ˆν 1, ˆν 2,, ˆν m ), ˆθ 2 = g 2 (ˆν 1, ˆν 2,, ˆν m ),, ˆθ m = g m (ˆν 1, ˆν 2,, ˆν m ) (1.11) 定 义 的 ˆθ1, ˆθ 2,, ˆθ m 分 别 是 θ 1, θ 2,, θ m 的 矩 估 计 (moment estimator). 这 里 的 ˆν j 是 ν j 的 点 估 计, 由 (1.7) 定 义. 由 于 总 体 分 布 (1.9) 中 含 有 未 知 参 数, 所 以 ν j 是 参 数 θ 1, θ 2,, θ m 的 函 数, 而 方 程 (1.10) 通 常 是 由 下 面 的 估 计 方 程 ν 1 = h 1 (θ 1, θ 2,, θ m ), ν 2 = h 2 (θ 1, θ 2,, θ m ), (1.12), ν m = h m (θ 1, θ 2,, θ m ) 得 到 的. 注 意 这 里 的 ν j = EX j. 正 态 分 布 参 数 的 矩 估 计 设 X 服 从 正 态 分 布 N(µ, σ 2 ). 由 于 µ = EX, σ 2 = EX 2 (EX) 2 = ν 2 ν 2 1, 所 以 µ, σ 2 的 矩 估 计 分 别 是 ˆµ = X n, ˆσ 2 =ˆν 2 (ˆν 1 ) 2 = 1 n = 1 n 指 数 分 布 参 数 的 矩 估 计 设 X 服 从 指 数 分 布 E(λ). n Xj 2 ( X n ) 2 j=1 n (X j ˆµ) 2. j=1
165 7.1 点 估 计 和 矩 估 计 159 由 µ = EX = 1/λ 得 到 λ = 1/µ, 从 而 得 到 矩 估 计 ˆλ = 1/ X n. 泊 松 分 布 参 数 的 矩 估 计 设 X 服 从 泊 松 分 布 P(λ). 由 µ = EX = λ, 得 到 矩 估 计 ˆλ = Xn. 均 匀 分 布 参 数 的 矩 估 计 X 服 从 均 匀 分 布 U(0, b). 由 µ = b/2, 得 到 b = 2µ, 从 而 得 到 矩 估 计 ˆb = 2 Xn. 二 项 分 布 参 数 的 矩 估 计 X 服 从 二 项 分 布 B(m, p), 其 中 m 已 知. 由 µ = EX = mp 得 到 p = µ/m, 从 而 得 到 p 的 矩 估 计 ˆp = X n /m. 几 个 矩 估 计 的 性 质 以 上 的 几 个 矩 估 计 中, 除 了 正 态 分 布 的 ˆσ 2 和 指 数 分 布 中 的 ˆλ 不 是 无 偏 估 计 外, 其 余 的 都 是 无 偏 估 计. 以 上 五 个 矩 估 计 都 是 强 相 合 估 计.
166 160 第 七 章 参 数 估 计 例 1.2 设 一 大 批 产 品 的 合 格 率 是 p, 每 次 从 中 随 机 抽 出 10 件 进 行 检 验. 用 X i 表 示 第 i 次 抽 出 的 10 件 中 次 品 的 个 数, 则 可 以 认 为 X 1, X 2,, X n 独 立 同 分 布, 总 体 分 布 是 二 项 分 布 B(10, p). 用 µ = EX 表 示 B(10, p) 的 数 学 期 望, 由 EX = 10p, 得 到 p = EX 10. 于 是 p 的 矩 估 计 是 ˆp = 1 10 X n 给 定 n 次 抽 样 的 观 测 数 据 x 1, x 2,, x n 后, p 的 矩 估 计 ˆp = x 1 + x x n. 10n 7.2 最 大 似 然 估 计 离 散 型 随 机 变 量 的 情 况 例 2.1 某 试 验 成 功 的 概 率 是 p = 0.9 或 p = 0.1. 现 在 试 验 成 功 了, 应 当 判 断 p = 0.9 还 是 判 断 p = 0.1? 答 案 是 明 显 的, 应 当 判 断 p = 0.9. 这 时 判 断 失 误 的 概 率 是 p = 0.1 成 立 时, 试 验 成 功 的 概 率. 这 个 概 率 是 0.1. 于 是 判 断 正 确 的 概 率 是 0.9. 同 理, 判 断 p = 0.1 时, 判 断 正 确 的 概 率 只 有 0.1. 例 2.1 提 示 我 们, 试 验 能 成 功 是 因 为 成 功 的 概 率 较 大. 更 一 般 地 说, 我 们 能 够 观 测 到 一 个 事 件 是 因 为 这 个 事 件 发 生 的 概 率 较 大. 这 样 思 考 问 题 的 思 想 被 称 为 最 大 似 然 思 想. 例 2.2 设 X 1, X 2,, X n 独 立 同 分 布, 都 服 从 Poisson 分 布 Poisson(λ). (1) 给 定 观 测 X 1 = x 1, 试 估 计 λ, (2) 给 定 观 测 数 据 x 1, x 2,, x n, 试 估 计 λ.
167 7.2 最 大 似 然 估 计 161 解 (1) X 1 有 概 率 分 布 P (X 1 = x) = λx x! e λ, x = 0, 1,. 按 照 最 大 似 然 估 计 思 想, 观 测 到 X 1 = x 1 的 原 因 是 观 测 到 x 1 的 概 率 较 大. 于 是 参 数 λ 应 当 使 得 达 到 最 大 值. L(λ) = λx1 x 1! e λ, λ > 0, 于 是 问 题 简 化 为 求 L(λ) 的 最 大 值 的 问 题. 为 了 计 算 方 便, 引 入 l(λ) = ln L(λ) = x 1 ln λ λ ln(x 1!), 由 l (λ) = x 1 /λ 1 = 0, 知 道 应 当 取 λ = x 1. (2) 根 据 最 大 似 然 估 计 的 思 想, 参 数 λ 应 当 使 得 观 测 到 (x 1, x 2,, x n ) 的 概 率 最 大. 这 等 价 于 λ 使 得 (X 1, X 2,, X n ) 的 联 合 分 布 取 得 最 大 值. 于 是 应 当 用 L(λ) 的 最 大 值 点 作 为 λ 的 估 计. L(λ) =P (X 1 = x 1, X 2 = x 2,, X n = x n ) = λx1 λx2 e λ x 1! x 2! e λ λxn x n! e λ λ(x1+x2+ +xn) = x 1!x 2! x n! e nλ. ˆλ = x 1 + x x n n 注 意 在 上 述 问 题 中, (x 1, x 2,, x n ) 是 已 经 观 测 到 的 数 据, 所 以 L(λ) 是 λ 的 函 数, 称 为 基 于 数 据 (x 1, x 2,, x n ) 的 似 然 函 数, 简 称 为 似 然 函 数 (likelihood function).
168 162 第 七 章 参 数 估 计 最 大 似 然 估 计 定 义 ( 离 散 情 况 ) 定 义 2.1 设 离 散 随 机 变 量 X 1, X 2,, X n 有 联 合 分 布 p(x 1, x 2,, x n ; θ) = P (X 1 = x 1, X 2 = x 2,, X n = x n ), 其 中 θ 是 未 知 参 数, 给 定 观 测 数 据 x 1, x 2,, x n 后, 我 们 称 θ 的 函 数 L(θ) = p(x 1, x 2,, x n ; θ) 为 基 于 x 1, x 2,, x n 的 似 然 函 数, 称 L(θ) 的 最 大 值 点 ˆθ 为 θ 的 最 大 似 然 估 计 (maximum likelihood estimator). 定 义 2.1 中 的 θ 也 可 以 是 向 量 θ = (θ 1, θ 2,, θ m ) 连 续 型 随 机 变 量 的 情 况 例 2.3 设 X N(µ, 1), 给 定 观 测 数 据 X = x, 如 何 估 计 µ 呢? 根 据 正 态 密 度 函 数 的 图 形 和 最 大 似 然 思 想, 知 道 µ 应 当 在 x 的 附 近. 如 果 取 µ 大 于 x, 就 会 问 为 什 么 不 取 µ 小 于 x. 因 而 最 好 取 µ = x. 注 意 X 有 密 度 函 数 f(x; µ) = 1 2π e (x µ)2 /2, 给 定 观 测 X = x, µ = x 恰 好 使 得 f(x; µ) 达 到 最 大. 一 元 正 态 分 布 N(µ,1) 的 密 度 函 数
169 7.2 最 大 似 然 估 计 163 Normal N(µ,1) density µ 例 2.4 设 X 1, X 2 独 立 同 分 布, 都 服 从 正 态 分 布 N(µ, σ 2 ). 给 定 观 测 数 据 x 1, x 2 如 何 估 计 µ, σ 2 呢? 我 们 知 道 (X 1, X 2 ) 的 联 合 密 度 f(x 1, x 2 ; µ, σ 2 ) = 1 ( 2πσ exp 1 ) 2 2σ [(x 2 1 µ) 2 + (x 2 µ) 2 ] 是 一 个 扣 在 x, y 平 面 上 的 单 峰 曲 面. 根 据 最 大 似 然 思 想, µ, σ 2 的 选 择 应 当 使 得 曲 面 在 (x 1, x 2 ) 处 达 到 最 大. 于 是 使 得 函 数 L(µ, σ 2 ) = f(x 1, x 2 ; µ, σ 2 ) 达 到 最 大 值 的 (ˆµ, ˆσ 2 ) 就 是 参 数 (µ, σ 2 ) 的 估 计. 于 是 问 题 转 化 为 求 L(µ, σ 2 ) 的 最 大 值 点 的 问 题. 注 意 上 面 的 x 1, x 2 已 经 是 常 数 了, 自 变 元 是 (µ, σ 2 ). 二 元 正 态 分 布 的 密 度 函 数 曲 面
170 164 第 七 章 参 数 估 计 2 D Joint Normal Density Curve 最 大 似 然 估 计 ( 连 续 型 ) 定 义 2.2 设 随 机 向 量 X = (X 1, X 2,, X n ) 有 联 合 密 度 f(x; θ), 其 中 θ 是 未 知 参 数. 得 到 X 的 观 测 值 x 后, 称 θ 的 函 数 L(θ ) = f(x; θ ) 为 基 于 x 的 似 然 函 数. 称 似 然 函 数 L(θ) 的 最 大 值 点 ˆθ 为 参 数 θ 的 最 大 似 然 估 计. 最 大 似 然 估 计 通 常 被 缩 写 成 MLE(Maximum Likelihood Estimator). 设 总 体 X 有 密 度 函 数 f(x; θ), X 1, X 2,, X n 是 总 体 X 的 简 单 随 机 样 本, 则 (X 1, X 2,, X n ) 的 联 合 密 度 是 n f(x 1, x 2,, x n ; θ) = f(x j ; θ ), j=1 基 于 观 测 值 x = (x 1, x 2,, x n ) 的 似 然 函 数 是 L(θ) = 由 于 n f(x j ; θ). (2.1) j=1 l(θ) = ln L(θ) (2.2)
171 7.2 最 大 似 然 估 计 165 和 似 然 函 数 (2.1) 有 相 同 的 最 大 值 点, 所 以 称 (2.2) 为 对 数 似 然 函 数. 实 际 问 题 中, 求 对 数 似 然 函 数 l(θ) 的 最 大 值 点 往 往 要 方 便 得 多. 例 : 正 态 总 体 参 数 的 MLE 设 总 体 X 服 从 正 态 分 布 N(µ, σ 2 ). 由 于 总 体 X 的 密 度 函 数 是 f(x; µ, σ 2 ) = 1 2πa exp [ (x µ)2 ], 其 中 a = σ 2. 2a 所 以 基 于 观 测 值 x = (x 1, x 2,, x n ) 的 似 然 函 数 是 对 数 似 然 函 数 是 L(µ, a) = 1 ( 2πa) n exp [ n (x j µ) 2 ]. 2a j=1 l(µ, a) = n n 2 ln a (x j µ) 2 2a j=1 n 2 ln(2π). 求 l(µ, a) 的 最 大 值 点 可 以 通 过 解 方 程 组 l = 1 n µ a j=1 (x j µ) = 0, l a = n 2a + 1 2a 2 n j=1 (x j µ) 2 = 0 (2.3) 得 到. 从 (2.3) 解 得 µ, σ 2 = a 的 MLE 为 ˆµ = X n ; ˆσ 2 = â = 1 n n j=1 (x j X n ) 2. 可 以 看 出, 对 于 正 态 总 体 来 讲, 最 大 似 然 估 计 和 矩 估 计 是 一 致 的. 指 数 分 布 总 体 参 数 的 MLE 设 总 体 X 服 从 指 数 分 布 E(λ). 由 于 指 数 分 布 E(λ) 的 密 度 函 数 是 f(x; λ) = λe λx, x 0.
172 166 第 七 章 参 数 估 计 基 于 观 测 值 x = (x 1, x 2,, x n ) 的 似 然 函 数 是 L(λ) = λ n exp ( n ) λ x j j=1 对 数 似 然 函 数 是 由 n l(λ) = n ln λ λ x j. j=1 l λ = n n λ x j = 0, j=1 得 到 参 数 λ 的 MLE 为 ˆλ = 1/ Xn. 均 匀 分 布 总 体 参 数 的 MLE 设 总 体 X 服 从 均 匀 分 布 U[0, b]. 密 度 函 数 是 f(x; b) = 1 b I {0 x b}. 给 定 观 测 数 据 x 1, x 2,, x n, 定 义 x (1) = min{x 1, x 2,, x n }, x (n) = max{x 1, x 2,, x n }. (2.4) 可 以 把 似 然 函 数 写 成 L(b) = 1 b n n j=1 I {0 xi b} = 1 b n I {0 x (1) x (n) b}. 要 L(b) 达 到 最 大, 首 先 要 示 性 函 数 I {0 x(1) x (n) b} = 1, 即 要 b x (n). 然 后 再 要 求 1/b n 尽 量 的 大. 不 难 看 出, 这 时 必 须 取 b = x (n), 所 以 b 的 MLE 是 ˆb = x(n). 均 匀 分 布 最 大 似 然 估 计 和 矩 估 计 的 比 较 对 于 均 匀 分 布 来 将, 矩 估 计 是 b = 2 xn, 最 大 似 然 估 计 是 ˆb = x(n). 这 两 者 明 显 是 不 一 样 的.
173 7.2 最 大 似 然 估 计 167 为 了 解 那 个 估 计 更 准 确 一 些, 我 们 用 计 算 机 产 生 一 万 个 在 区 间 [0, 2.8] 上 均 匀 分 布 的 随 机 数 ( 独 立 同 分 布 随 机 变 量 的 观 测 值 ), 使 用 前 n 个 随 机 数 计 算 出 矩 估 计 b 和 MLE ˆb 的 估 计 误 差 列 在 下 面 的 表 中. b = 2.8 n = b b = ˆb b = 我 们 称 上 述 的 方 法 为 计 算 机 模 拟 试 验 方 法. 从 上 述 模 拟 试 验 看 出, MLE ˆb 的 表 现 似 乎 要 比 矩 估 计 b 好. 但 是 数 据 的 产 生 带 有 随 机 性, 所 以 一 次 模 拟 试 验 显 然 不 够. 为 了 克 服 数 据 的 随 机 性, 我 们 将 上 述 模 拟 试 验 独 立 重 复 1000 次. 用 bj 表 示 第 j 次 模 拟 计 算 得 到 的 矩 估 计 b, 用 ˆbj 表 示 第 j 次 模 拟 计 算 得 到 的 最 大 似 然 估 计 ˆb. 再 定 义 m = 1000 次 模 拟 的 平 均 M( b) = 1 m m bj, j=1 M(ˆb) = 1 m m ˆbj. j=1 和 m = 1000 次 模 拟 的 样 本 标 准 差 std( b) = 1 m ( b j m 1 b) 2, j=1 std(ˆb) = 1 m (ˆb j m 1 b) 2. 结 论 列 入 下 表. n = M( b) b = std( b) = M(ˆb) b = std(ˆb) = 从 上 述 计 算 中 看 出, M( b) b 普 遍 小 于 M(ˆb) b, 所 以 从 偏 差 的 角 度 讲, 矩 估 计 好 一 些. j=1
174 168 第 七 章 参 数 估 计 这 个 结 果 是 和 E X n = b, Eˆb < b 一 致 的. 但 是 另 一 方 面, std(ˆb) 普 遍 小 于 std( b), 说 明 最 大 似 然 估 计 的 稳 定 性 更 好 一 些. 由 于 一 千 次 重 复 试 验 已 经 能 够 较 好 的 克 服 随 机 因 素 的 影 响, 所 以 可 以 认 为 上 述 模 拟 试 验 的 结 果 是 可 信 的. 7.3 抽 样 分 布 及 其 上 α 分 位 数 抽 样 分 布 及 其 上 α 分 位 数 引 言 如 果 X 1, X 2,, X n 是 来 自 总 体 X 的 简 单 随 机 样 本, 当 X N(µ, σ 2 ) 时, 也 称 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 简 单 随 机 样 本. 仍 用 X n = 1 n n X j, j=1 S 2 = 1 (n 1) 分 别 表 示 样 本 均 值 和 样 本 方 差. n (X j X n ) 2 (3.1) 为 了 进 一 步 研 究 未 知 参 数 的 统 计 推 断 问 题, 本 节 介 绍 几 个 重 要 的 抽 样 j=1 分 布. 我 们 将 在 以 后 的 章 节 中 使 用 这 里 介 绍 的 分 布. 所 谓 抽 样 分 布, 意 指 基 于 样 本 构 造 的 统 计 量 的 概 率 分 布. 以 后 把 来 自 总 体 X 的 简 单 随 机 样 本 简 称 为 来 自 总 体 X 的 样 本 抽 样 分 布 卡 方 分 布 定 义 3.1 (χ 2 分 布 ( 卡 方 分 布 )) 如 果 随 机 变 量 ξ 有 概 率 密 度 p(u) = 1 2 n/2 Γ(n/2) u n 2 1 e u/2, u 0. (3.2) 就 称 ξ 服 从 n 个 自 由 度 的 χ 2 分 布, 记 做 ξ χ 2 (n). 卡 方 χ 2 (n) 分 布 密 度 的 图 形, 按 纵 坐 标 的 最 大 值 从 高 到 低 自 由 度 依 次 是 n = 1, 3, 5, 7:
175 7.3 抽 样 分 布 及 其 上 α 分 位 数 169 χ 2 分 布 与 正 态 分 布 的 关 系 定 理 3.1 如 果 X 1, X 2,, X n 是 来 自 总 体 N(0, 1) 的 样 本, 则 平 方 和 ξ n = X X X 2 n χ 2 (n). (3.3) 用 归 纳 法 可 以 证 明 本 定 理. 定 理 3.2 如 果 X 1, X 2,, X n 是 来 自 总 体 N(0, 1) 的 样 本, 则 有 如 下 的 结 果. (1) X n 和 S 2 独 立 ; (2) (n 1)S 2 χ 2 (n 1). 推 论 3.3 如 果 ξ χ 2 (n), η χ 2 (m), 则 (1) 则 Eξ = n, (2) 当 ξ 和 η 独 立, 有 ξ + η χ 2 (n + m). 证 (1) ξ 和 (3.3) 中 的 ξ n 同 分 布, 所 以 有 相 同 的 数 学 期 望 n. (2) 设 X 1, X 2,, X n+m 是 来 自 总 体 N(0, 1) 的 样 本, 则 ξ + η 和 ξ n + η m = (X X X 2 n) + (X 2 n+1 + X 2 n X 2 n+m) 同 分 布, 所 以 结 论 成 立. 定 理 3.4 如 果 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, 则 (1) X n 和 S 2 独 立 ; (2) n 1 σ 2 S 2 = 1 σ 2 n j=1 (X j X n ) 2 χ 2 (n 1).
176 170 第 七 章 参 数 估 计 证 : 本, 且 设 Y j = (X j µ)/σ, 则 Y 1, Y 2,, Y n 是 来 自 总 体 N(0, 1) 的 样 (n 1)S 2 Y = Ȳ n = 1 σ ( X n µ), n (Y j Y n ) 2 = 1 n (X σ 2 j X n ) 2 j=1 (n 1) = S 2. σ 2 j=1 根 据 定 理 3.2, Ȳn 和 S 2 Y 独 立. 独 立, 从 而 知 道 X n = σȳn + µ 和 S 2 = σ 2 S 2 Y 又 由 定 理 3.2 知 道 t 分 布 (n 1) σ 2 S 2 = (n 1)S 2 Y χ 2 (n 1). 定 义 3.2 (t 分 布 ) 如 果 随 机 变 量 T 有 概 率 密 度 p n (u) = Γ( n+1 2 ) Γ( n 2 ) nπ (1 + u2 n ) n+1 2, u (, ). 就 称 T 服 从 n 个 自 由 度 的 t 分 布, 记 做 T t(n). t 分 布 分 布 密 度 t 分 布 的 密 度 函 数 比 正 态 分 布 的 密 度 函 数 低 一 点. 下 图 是 t(n) 分 布 密 度 函 数 的 图 形, 按 纵 坐 标 的 最 大 值 从 低 到 高, 自 由 度 依 次 是 n = 1, 3, 7, 10. 最 高 的 一 条 曲 线 是 标 准 正 态 密 度 曲 线. 从 中 看 出 n 增 大 时, t(n) 分 布 向 N(0, 1) 分 布 的 收 敛 是 很 快 的. 当 n 33, t(n) 分 布 的 密 度 和 N(0, 1) 的 密 度 几 乎 就 没 有 差 别 了.
177 7.3 抽 样 分 布 及 其 上 α 分 位 数 171 实 际 上 可 以 验 证 当 n 33, 对 标 准 正 态 密 度 函 数 φ(x) 有 t 分 布 与 正 态 分 布 及 卡 方 分 布 的 关 系 sup p n (x) φ(x) x 定 理 3.5 如 果 Z N(0, 1), η χ 2 (n), Z, η 独 立, 则 Z η/n t(n). 定 理 3.6 如 果 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, 则 X n µ S/ n = n( Xn µ) S t(n 1). 证 F 分 布 由 定 理 3.4 知 道 Z = X n µ σ/ n Z 和 ξ 独 立, 于 是 用 定 理 3.5 得 到 定 义 3.3 (F (n, m) 分 布 ) p(u) = N(0, 1), ξ = n 1 σ 2 S 2 χ 2 (n 1), X n µ S/ n = Z ξ/(n 1) t(n 1). 如 果 随 机 变 量 F 有 概 率 密 度 n+m Γ( ) ( 2 n ) n ( 2 Γ( n)γ( m) 1 + n ) n+m m m u 2 u n 2 1, u 0, 2 2 就 称 F 服 从 自 由 度 为 (n, m) 的 F 分 布, 记 做 F F (n, m). 我 们 又 称 n 是 第 一 自 由 度, m 是 第 二 自 由 度. 下 图 是 F (6, m) 的 分 布 密 度 函 数 图 形, 按 纵 坐 标 的 最 大 值 从 小 到 大, 第 二 自 由 度 依 次 是 m = 1, 3, 7, 10.
178 172 第 七 章 参 数 估 计 F 分 布 与 卡 方 分 布 的 关 系 定 理 3.7 如 果 ξ χ 2 (n), η χ 2 (m), ξ 和 η 独 立, 则 F = ξ/n η/m = mξ nη F 1 = η/m ξ/n = nη mξ F (n, m), F (m, n). F 分 布 与 正 态 分 布 的 关 系 定 理 3.8 设 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, Y 1, Y 2,, Y m 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, 又 设 这 两 个 总 体 是 相 互 独 立 的. 则 当 n, m 2, 其 中 S 2 X = 1 n 1 n j=1 S 2 X/S 2 Y F (n 1, m 1). (X j X n ) 2, S 2 Y = 1 m 1 m (Y j Ȳm) 2. j=1 证 明 : 设 X 1, X 2,, X n 是 来 自 总 体 X 的 样 本, Y 1, Y 2,, Y m 是 来 自 总 体 Y 的 样 本. 如 果 总 体 X 和 总 体 Y 独 立, 则 来 自 这 两 个 总 体 的 样 本 也 是 相 互 独 立 的, 于 是 是 相 互 独 立 的 随 机 变 量. 所 以 S 2 X 与 S 2 Y 独 立 由 定 理 3.4 知 道 X 1, X 2,, X n, Y 1, Y 2,, Y m ξ = n 1 σ 2 S 2 X χ 2 (n 1), η = m 1 σ 2 S 2 Y χ 2 (m 1), 而 ξ, η 又 是 独 立 的, 所 以 用 定 理 3.7 得 到 S 2 X S 2 Y = ξ/(n 1) F (n 1, m 1). η/(m 1)
179 7.3 抽 样 分 布 及 其 上 α 分 位 数 173 依 分 布 收 敛 的 一 个 定 理 下 面 的 定 理 也 是 后 面 常 用 的 结 论. 回 忆 Φ(x) 总 表 示 标 准 正 态 分 布 的 分 布 函 数, ξ n d ξ 表 示 ξ n 依 分 布 收 敛 到 ξ. 定 理 3.9 设 ξ n 依 分 布 收 敛 到 N(0, 1): P (ξ n x) Φ(x). 如 果 η n 1, wp1., 则 ξ n η n 也 依 分 布 收 敛 到 N(0, 1). 例 3.1 设 µ = EX, σ 2 = Var(X) 是 正 数, X 1, X 2,, X n 是 来 自 总 体 X 的 样 本, 则 X n µ S/ n d N(0, 1). 证 由 中 心 极 限 定 理 知 道 ξ n = X n µ σ/ n d N(0, 1). 样 本 标 准 差 S 是 σ 的 强 相 合 估 计 : S σ, wp1., 于 是 η n = σ/s 1, wp1. 最 后 利 用 定 理 3.9 得 到 X n µ S/ n = X n µ σ/ σ n S = ξ nη n d N(0, 1). 在 例 3.1 中, 如 果 总 体 X N(µ, σ 2 ), 则 X n µ S/ n t(n 1). 对 较 大 的 n, 又 有 近 似 成 立. X n µ S/ n N(0, 1) 所 以 当 n 较 大, t(n) 分 布 和 标 准 正 态 分 布 相 近.
180 174 第 七 章 参 数 估 计 抽 样 分 布 的 上 α 分 位 数 抽 样 分 布 的 上 α 分 位 数 设 正 数 α (0, 1). 对 Z N(0, 1), 有 唯 一 的 z α 使 得 P (Z z α ) = α, 对 ξ n χ 2 (n), 有 唯 一 的 χ 2 α(n) 使 得 P ( ξ n χ 2 α(n) ) = α, 对 T n t(n), 有 唯 一 的 t α (n) 使 得 P (T n t α (n)) = α, 对 F n,m F (n, m), 有 唯 一 的 F α (n, m) 使 得 P ( F n,m F α (n, m) ) = α. 定 义 3.4 我 们 称 z α, χ 2 α(n), t α (n) 和 F α (n, m) 分 别 为 N(0, 1), χ 2 (n), t(n) 和 F (n, m) 分 布 的 上 α 分 位 数, 并 统 一 称 为 上 α 分 位 数. 容 易 理 解, 上 α 分 位 数 是 α 的 减 函 数. 对 于 上 α 分 位 数, 容 易 验 证 ( 参 考 后 面 的 图 ) P (Z z α ) = 1 α, P (χ 2 n χ 2 α(n)) = 1 α, P (T n t α (n)) = 1 α, P (F n,m F α (n, m)) = 1 α. 标 准 正 态 分 布 上 分 位 数 的 图 形 α = 0.05, z α = 1.645
181 7.3 抽 样 分 布 及 其 上 α 分 位 数 175 卡 方 分 布 上 分 位 数 的 图 形 α = 0.05, χ 2 α(3) = 分 位 数 的 计 算 对 某 些 固 定 的 α, 可 以 查 书 后 面 的 表 得 到 z α, χ α (n), t α (n) 和 F α (n, m), 也 可 以 用 Matlab R SAS 等 直 接 计 算. 记 住 下 面 的 (3.4) 和 (3.5) 式 是 有 帮 助 的. 例 3.2 对 Z N(0, 1), T n t(n), 有 ( 参 考 后 面 的 图 ) P ( Z z α/2 ) = α, P ( Z z α/2 ) = 1 α. (3.4) P ( T n z α/2 ) = α, P ( T n z α/2 ) = 1 α. (3.5) 证 利 用 Z N(0, 1), 得 到 P ( Z z α/2 ) =P ( Z z α/2 ) + P ( Z z α/2 ) =α/2 + α/2 = α. P ( Z z α/2 ) = 1 P ( Z z α/2 ) = 1 α. (3.4) 的 证 明 只 用 到 标 准 正 态 密 度 关 于 原 点 的 对 称 性. 由 于 t(n) 分 布 的 密 度 函 数 也 是 关 于 原 点 对 称 的, 所 以 可 以 相 同 地 证 明 (3.5).
182 176 第 七 章 参 数 估 计 双 侧 分 位 数 图 形 α = 0.05, z 0.05/2 = 1.96 例 3.3( 两 个 常 用 的 正 态 分 位 数 ) z = 1.96, z 0.05 = 解 查 正 态 分 布 表 可 以 得 到 以 上 结 果. z = 1.96 和 z 0.05 = 是 两 个 最 常 用 的 分 位 数, 值 得 牢 记. 例 3.4(F 分 布 的 分 位 数 ) 对 F (n, m) 的 上 α 分 位 数 F α (n, m), 有 F α (m, n) = 1 F 1 α (n, m). 证 对 F n,m F (n, m), 从 定 理 3.7 得 到 1/F n,m F (m, n). 于 是 对 F m,n F (m, n), 得 到 P (F m,n 1/F 1 α (n, m)) =P (1/F n,m 1/F 1 α (n, m)) =P (F n,m F 1 α (n, m)) =1 (1 α) = α. 二 项 分 布 的 分 位 数 定 义 3.5 设 X B(n, p), 对 于 α (0, 1), 如 果 正 整 数 B α (n, p) 使 得 P ( X B α (n, p) ) α, P ( X B α (n, p) 1 ) > α, (3.6) 就 称 B α (n, p) 为 二 项 分 布 B(n, p) 的 上 α 分 位 数. 可 以 查 表 得 到 上 α 分 位 数 B α (n, p), 或 用 软 件 计 算
183 7.4 正 态 总 体 的 区 间 估 计 正 态 总 体 的 区 间 估 计 区 间 估 计 在 独 立 同 分 布 场 合, 样 本 均 值 Xn 和 样 本 方 差 S 2 分 别 是 总 体 均 值 µ 和 总 体 方 差 σ 2 的 无 偏 估 计 和 相 合 估 计, 说 明 样 本 均 值 和 样 本 方 差 都 是 不 错 的 估 计 量. 它 告 诉 我 们, 在 n 比 较 大 的 时 候, 真 值 µ 就 在 Xn 的 附 近, 真 值 σ 2 就 在 S 2 的 附 近. 但 是 到 底 有 多 近 呢? n 多 大 就 够 了 呢? 区 间 估 计 可 以 回 答 这 一 问 题 已 知 σ 时, µ 的 置 信 区 间 已 知 σ 时, µ 的 置 信 区 间 例 1 例 4.1 为 了 得 到 鲜 牛 奶 的 冰 点, 对 鲜 牛 奶 的 冰 点 进 行 了 21 次 独 立 重 复 测 量, 得 到 数 据 如 下 ( 单 位 : 摄 氏 度 ) 已 知 测 量 ( 仪 器 ) 的 标 准 差 是 σ = , 测 量 没 有 系 统 偏 差 ( 也 就 是 说 测 量 值 X 的 数 学 期 望 等 于 牛 奶 的 冰 点 ), 估 计 牛 奶 的 冰 点 是 多 少. 解 牛 奶 的 冰 点 是 常 数, 测 量 值 的 随 机 性 由 测 量 误 差 造 成. 通 常 认 为 测 量 值 X 服 从 正 态 分 布 N(µ, σ 2 ), µ = EX 是 牛 奶 的 冰 点, σ = 是 测 量 的 标 准 差. 对 n = 21, 容 易 从 数 据 计 算 出 Xn = 0.546, 这 是 对 µ 的 估 计. 真 正 的 µ 到 底 距 离 Xn = 有 多 远 呢? 用 X i 表 示 第 i 次 测 量 值, 则 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 21 个 样 本 值, Xn N(µ, σ 2 /n). 取 α = 0.05, 则 (1 α) = 0.95, z α/2 = 1.96.
184 178 第 七 章 参 数 估 计 于 是 得 到 P ( X n µ 1.96σ/ n) ( Xn µ ) =P σ/ n 1.96 = (4.1) 也 就 是 以 0.95 的 概 率 保 证 X n µ 1.96σ/ n, 现 在 Xn = 0.546, σ = , n = 21, 所 以 我 们 以 0.95 的 概 率 保 证 µ [ X n 1.96σ/ n, Xn σ/ n] =[ , ]. (4.2) 我 们 称 [ , ] 是 µ 的 置 信 度 为 0.95 的 置 信 区 间. 置 信 区 间 的 长 度 是 = 容 易 得 到 以 下 的 结 论 : 如 果 x 1, x 2,, x n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, σ 已 知, 则 µ 的 置 信 度 为 0.95 的 置 信 区 间 是 [ X n 1.96σ/ n, Xn σ/ n]. (4.3) 同 样 可 以 计 算 µ 的 置 信 度 为 0.99 的 置 信 区 间 是 [ X n 2.576σ/ n, Xn σ/ n], (4.5) = z 0.01/2. 置 信 区 间 定 义 定 义 4.1 设 X 1, X 2,, X n 是 来 自 总 体 X 的 样 本,X = (X 1, X 2,, X n ), θ 是 未 知 参 数, ˆθ 1 = ˆθ 1 (X), ˆθ 2 = ˆθ 2 (X) 是 两 个 统 计 量. 对 于 给 定 的 α (0, 1), 如 果 有 P ( ˆθ 1 θ ˆθ 2 ) 1 α, (4.6) 就 称 [ˆθ 1, ˆθ 2 ] 为 参 数 θ 的 置 信 度 为 (1 α) 的 置 信 区 间 (confidence interval, CI). 在 定 义 4.1 中, 置 信 度 又 称 为 置 信 水 平 (confidence level), 置 信 区 间 的 右 端 点 ˆθ2 又 称 为 置 信 上 界, 置 信 区 间 的 左 端 点 ˆθ1 又 称 为 置 信 下 界. 由 于 ˆθ1 = ˆθ 1 (X) 和 ˆθ2 = ˆθ 2 (X) 都 是 随 机 变 量 的 函 数, 因 而 是 随 机 变 量.
185 7.4 正 态 总 体 的 区 间 估 计 179 但 是 给 定 样 本 观 测 值 x = (x 1, x 2,, x n ), 就 得 到 了 一 个 具 体 的 闭 区 间 [ˆθ 1 (x), ˆθ 2 (x)], 这 个 闭 区 间 或 者 包 含 µ 或 者 不 包 含 µ, 我 们 对 1 α 置 信 度 的 理 解 是 : 如 果 允 许 我 们 反 复 独 立 抽 取 样 本 得 到 多 次 置 信 区 间,µ 落 入 这 些 置 信 区 间 中 的 比 例 接 近 于 1 α 很 明 显, 在 相 同 的 置 信 度 下, 置 信 区 间 的 长 度 越 小 越 好. 正 态 总 体 σ 已 知 时 µ 的 置 信 区 间 例 4.2 设 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, 当 标 准 差 σ 已 知, 均 值 µ 的 置 信 度 为 (1 α) 的 置 信 区 间 是 [ Xn z α/2σ, Xn + z α/2σ ]. (4.7) n n 解 这 时 Z = X n µ σ/ n N(0, 1). 对 于 给 定 的 置 信 度 (1 α), 有 P ( Xn z α/2 σ/ n µ X n + z α/2 σ/ n ) =P ( X n µ z α/2 σ/ n) =P ( Z z α/2 ) = 1 α. 所 以, 已 知 标 准 差 σ 时, 均 值 µ 的 置 信 度 为 (1 α) 的 置 信 区 间 是 (4.7). 正 态 总 体 σ 已 知 时 µ 的 置 信 区 间 讨 论 置 信 区 间 (4.7) 的 长 度 是 L = 2z α/2 σ/ n. L 越 小, 置 信 区 间 提 供 的 信 息 越 准 确. 由 于 z α/2 是 置 信 度 (1 α) 的 增 函 数, 所 以 对 于 相 同 的 标 准 差 σ, 从 (4.7) 看 出 以 下 结 论 : (1) 置 信 区 间 的 中 心 总 是 样 本 均 值 ; (2) 置 信 度 1 α 越 高, 置 信 区 间 就 越 长 ; (3) 样 本 量 n 越 大, 置 信 区 间 越 短.
186 180 第 七 章 参 数 估 计 标 准 差 σ 越 大, 说 明 总 体 越 分 散, 从 中 估 计 µ 越 难 估 计 准 确, 置 信 区 间 越 长 为 了 克 服 置 信 区 间 过 长 带 来 的 不 足, 同 时 考 虑 置 信 度 不 能 太 低, 人 们 一 般 使 用 置 信 度 为 1 α = 0.95 的 置 信 区 间. z α/2 = 1.96 是 值 得 牢 记 的 未 知 σ 时 µ 的 置 信 区 间 未 知 σ 时 µ 的 置 信 区 间 在 例 4.2 中, 如 果 σ 是 未 知 数, 自 然 想 到 用 样 本 标 准 差 S 代 替 σ. 根 据 定 理 3.6, 统 计 量 T n 1 = X n µ S/ n t(n 1). 对 于 给 定 的 置 信 度 (1 α), 查 t 分 布 表 ( 附 录 C2) 可 以 得 到 上 分 位 数 t α/2 (n 1), 这 时 ( Xn µ ) P S/ n t α/2(n 1) = P ( T n 1 t α (n 1)) = 1 α. 由 于 { Xn µ } S/ n t α/2(n 1) { = Xn t α/2(n 1)S µ X n + t α/2(n 1)S }, n n 所 以 在 置 信 度 (1 α) 下, µ 的 置 信 区 间 是 [ Xn t α/2(n 1)S n, Xn + t α/2(n 1)S n ]. (4.8) 例 4.3 在 例 4.1 中, 假 设 标 准 差 σ 未 知, 计 算 均 值 µ 的 置 信 度 为 0.95 的 置 信 区 间. 解 从 例 4.1 中 的 数 据 可 以 计 算 出 样 本 标 准 差 S = 0.005, 查 表 得 到 t α/2 (20) =
187 7.4 正 态 总 体 的 区 间 估 计 181 代 入 (4.8), 得 到 µ 的 置 信 区 间 [ / 21, / 21] =[ , ]. 置 信 区 间 的 长 度 是 这 个 置 信 区 间 和 已 知 σ = 的 置 信 区 间 基 本 相 同. 这 是 因 为 样 本 量 n = 21 时, S σ, t(20) 的 密 度 和 N(0, 1) 的 密 度 也 基 本 相 同 的 原 因. 例 4.4 在 例 4.1 中, 只 使 用 前 7 个 数 据 计 算 µ 的 置 信 度 为 0.95 的 置 信 区 间 和 置 信 区 间 的 长 度. (1) 已 知 标 准 差 σ = ; (2) 未 知 标 准 差 σ. 解 (1 α) = 0.95, α = 前 7 个 数 据 的 样 本 均 值 X7 = , 样 本 标 准 差 S = (1) 已 知 σ = 时, 利 用 z α/2 = 1.96 和 公 式 (4.7) 得 到 µ 的 置 信 区 间 [ / 7, / 7 ] =[ , ]. 置 信 区 间 的 长 度 是 (2) 未 知 σ 时, 查 t 分 布 表, 得 到 t α/2 (6) = 2.447, 代 入 公 式 (4.8) 得 到 µ 的 置 信 度 为 0.95 的 置 信 区 间 [ / 7, / 7] =[ , ]. 置 信 区 间 的 长 度 是 例 4.1 中 置 信 区 间 长 度 为 只 使 用 7 个 数 据 时 的 置 信 区 间 比 使 用 21 个 数 据 的 置 信 区 间 要 长 一 些, 说 明 样 本 量 越 大, 置 信 区 间 越 精 确.
188 182 第 七 章 参 数 估 计 方 差 σ 2 的 置 信 区 间 方 差 σ 2 的 置 信 区 间 例 4.5 地 球 生 物 的 演 变 经 历 了 漫 长 的 岁 月, 只 有 化 石 为 这 一 演 变 进 行 了 记 录. 现 在 科 学 家 们 利 用 物 质 的 放 射 性 衰 变 来 研 究 生 物 的 演 变 规 律. 几 乎 所 有 的 矿 物 质 含 有 K( 钾 ) 元 素 及 其 同 位 素 40 K( 钾 40). 40 K 并 不 稳 定, 它 可 以 缓 慢 地 衰 变 成 40 Ar( 氩 40) 和 40 Ca( 钙 40). 于 是 知 道 了 40 K 的 衰 变 速 率, 就 可 以 通 过 测 量 化 石 中 的 40 K 和 40 Ar 的 比 例 ( 钾 氩 比 ) 估 计 化 石 的 形 成 年 代. 下 面 是 根 据 钾 氩 比 计 算 出 的 德 国 黑 森 林 中 发 掘 的 19 个 化 石 样 品 的 形 成 年 龄 ( 单 位 : 百 万 年 ). ( 见 [4]) 假 设 每 个 样 品 的 估 算 年 代 都 服 从 正 态 分 布. 为 了 评 价 钾 氩 比 方 法 的 估 计 精 度, 需 要 完 成 以 下 工 作. (1) 计 算 σ 2 的 置 信 度 为 (1 α) 的 置 信 区 间 ; (2) 计 算 σ 2 的 置 信 度 为 0.95 的 置 信 区 间 ; (3) 计 算 标 准 差 σ 的 置 信 度 为 0.95 的 置 信 区 间. 解 (1) 用 X i 表 示 第 i 个 样 品 的 估 算 年 代, 则 根 据 题 意, X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, 样 本 量 n = 19. 样 本 方 差 S 2 = 1 (n 1) n (X j X n ) 2 j=1 是 总 体 方 差 σ 2 的 无 偏 估 计 和 强 相 合 估 计. 于 是 应 当 在 (n 1) 附 近. (n 1)S 2 σ 2
189 7.4 正 态 总 体 的 区 间 估 计 183 又 从 定 理 3.4 知 道, χ 2 n 1 (n 1)S2 = χ 2 (n 1), σ 2 记 λ 1 = χ 2 1 α/2 (n 1), λ 2 = χ 2 α/2 (n 1), 则 (n ) 1)S2 P (λ 1 λ σ α. 对 不 等 式 进 行 变 换 得 (n } 1)S2 {λ 1 λ σ 2 2 = { (n 1)S 2 λ 2 σ 2 (n 1)S2 λ 1 } 所 以 在 置 信 度 (1 α) 下, σ 2 的 置 信 区 间 是 [ (n 1)S 2 λ 2, (2) 本 例 中 n 1 = 18, α/2 = (n 1)S 2 λ 1 ]. (4.9) 可 以 计 算 出 X n = 276.9, S 2 = 查 χ 2 (18) 表 得 到 λ 2 = χ (18) = 31.53, λ 1 = χ (18) = 将 上 述 数 据 代 入 (4.9), 得 到 σ 2 的 置 信 度 为 0.95 的 置 信 区 间 [ , ] 8.23 =[418.7, ] ( 百 万 年 ) 2. (3) 由 于 { (n 1)S 2 σ χ 2 α/2 (n 1) { (n 1)S 2 = χ 2 α/2 (n 1) σ2 (n 1)S 2 } χ 2 1 α/2 (n 1) (n } 1)S2 χ 2 1 α/2 (n 1). (4.10) 所 以 σ 的 置 信 度 为 0.95 的 置 信 区 间 是 [ (n 1)S 2 χ 2 α/2 (n 1), (n 1)S 2 χ 2 1 α/2 (n 1) ]. (4.11)
190 184 第 七 章 参 数 估 计 代 入 数 值 后 得 到 σ 的 置 信 度 为 0.95 的 置 信 区 间 是 [ 418.7, 1604] = [20.5, 40.05] ( 百 万 年 ). 注 : 从 图 4.1 看 出, 在 置 信 水 平 0.95 下, 置 信 区 间 (4.9) 的 长 度 不 是 最 短 的 一 个, 但 是 它 有 计 算 和 使 用 方 便 的 优 点 均 值 差 µ 1 µ 2 的 置 信 区 间 均 值 差 µ 1 µ 2 的 置 信 区 间 设 X N(µ 1, σ1) 2, Y N(µ 2, σ2). 2 X 1, X 2,, X n 是 来 自 X 的 样 本, Y 1, Y 2,, Y m 是 来 自 Y 的 样 本, 设 总 体 X 和 总 体 Y 独 立, 于 是 X 1, X 2,, X n, Y 1, Y 2,, Y m 相 互 独 立. 下 面 构 造 µ 1 µ 2 置 信 区 间. 用 Xn, Ȳm 分 别 表 示 样 本 均 值, 用 S1, 2 S2 2 分 别 表 示 样 本 方 差, 则 X n Ȳm N(µ 1 µ 2, σ 2 1/n + σ 2 2/m). 于 是 得 到 Z = ( X n Ȳm) (µ 1 µ 2 ) σ 2 1 /n + σ 2 2/m N(0, 1). (4.12) (1) 置 信 区 间 (2) 已 知 σ 2 1, σ 2 2 时, 对 置 信 度 (1 α), 利 用 (4.12) 构 造 出 µ 1 µ 2 的 [ ( X n Ȳm) z α/2 σ 2 1 n + σ2 2 m, ( X n Ȳm) + z α/2 σ 2 1 n + σ2 2 m 未 知 σ1, 2 σ2, 2 但 是 已 知 σ1 2 = σ2 2 = σ 2 时, 由 ξ 1 = (n 1)S2 1 = 1 n (X σ 2 σ 2 j X n ) 2 χ 2 (n 1); ξ 2 = (m 1)S2 2 σ 2 = 1 σ 2 及 ξ 1, ξ 2 独 立 j=1 ]. (4.13) m (Y j Ȳm) 2 χ 2 (m 1), (4.14) j=1
191 7.4 正 态 总 体 的 区 间 估 计 185 得 到 ξ 1 + ξ 2 χ 2 (n + m 2). 引 入 SW 2 = (ξ 1 + ξ 2 )σ 2 n + m 2 = (n 1)S2 1 + (m 1)S2 2, (4.15) n + m 2 根 据 定 理 3.4 知 道 Z, ξ 1, ξ 2 独 立, 再 注 意 σ1 2 = σ2 2 = σ 2 和 利 用 定 理 3.5 得 到 ( X n Ȳm) (µ 1 µ 2 ) S W 1/n + 1/m Z = (ξ1 + ξ 2 )/(n + m 2) t(n + m 2). (4.16) 利 用 (4.16) 构 造 出 µ 1 µ 2 的 置 信 度 为 (1 α) 的 置 信 区 间 其 中 t α/2 = t α/2 (n + m 2). [ ( X 1 n Ȳm) t α/2 S W n + 1 m, ( X n Ȳm) + t α/2 S W 1 n + 1 m ]. (4.17) 方 差 比 σ 2 1/σ 2 2 的 置 信 区 间 方 差 比 σ 2 1/σ 2 2 的 置 信 区 间 在 D 的 假 设 下, 我 们 计 算 σ 2 1/σ 2 2 的 置 信 区 间. 根 据 定 理 3.4 和 定 理 3.7, 知 道 F = S2 1/S 2 2 σ 2 1/σ 2 2 = S2 1/σ 2 1 S 2 2/σ 2 2 利 用 F α 表 示 F α (n 1, m 1), 得 到 ( P F 1 α/2 S2 1/S2 2 σ1/σ F (n 1, m 1). F α/2 ) = 1 α. 于 是 在 置 信 度 (1 α) 下, 可 以 得 到 σ 2 1/σ 2 2 的 置 信 区 间 [ S 2 1 S 2 2F α/2, S 2 1 S 2 2F 1 α/2 ].
192 186 第 七 章 参 数 估 计 单 侧 置 信 区 间 单 侧 置 信 区 间 定 义 4.2 设 X 1, X 2,, X n 是 来 自 总 体 X 的 样 本, X = (X 1, X 2,, X n ), θ 是 未 知 参 数, θ = θ(x), θ = θ(x) 是 两 个 统 计 量. 对 于 给 定 的 α (0, 1), 1. 如 果 有 P ( θ θ ) 1 α, (4.18) 就 称 θ 为 参 数 θ 的 置 信 度 为 (1 α) 的 单 侧 置 信 上 限 ; 2. 如 果 有 P ( θ θ ) 1 α, (4.19) 就 称 θ 为 参 数 θ 的 置 信 度 为 (1 α) 的 单 侧 置 信 下 限. 正 态 总 体 µ 和 σ 2 的 单 侧 置 信 限 表 条 件 µ 的 单 侧 置 信 上 限 µ 的 单 侧 置 信 下 限 已 知 σ µ = X n + z α σ/ n µ = X n z α σ/ n 未 知 σ µ = X n + t α (n 1)S/ n µ = X n t α (n 1)S/ n 条 件 σ 2 的 单 侧 置 信 上 限 σ 2 的 单 侧 置 信 下 限 未 知 µ σ 2 = (n 1)S 2 /χ 2 1 α(n 1) σ 2 = (n 1)S 2 /χ 2 α(n 1) (4.20) 其 他 的 单 侧 置 信 限 可 以 类 似 得 到, 见 正 态 总 体 和 正 态 逼 近 置 信 区 间 表. 7.5 非 正 态 总 体 和 比 例 p 的 置 信 区 间 正 态 逼 近 法 正 态 逼 近 法 σ 已 知 总 体 分 布 不 是 正 态 分 布 的 情 况 也 需 要 对 均 值 和 方 差 计 算 置 信 区 间. 设 X 1, X 2,, X n 是 来 自 总 体 X 的 样 本, µ = EX, σ 2 = Var(X) 分 别 是 总 体 均 值 和 总 体 方 差.
193 7.5 非 正 态 总 体 和 比 例 P 的 置 信 区 间 187 根 据 中 心 极 限 定 理, 对 较 大 的 样 本 量 n, 近 似 服 从 标 准 正 态 分 布. 对 较 大 的 n, 有 X n µ σ/ n P ( X n µ z α/2 σ/ n ) (1 α). 于 是, 已 知 标 准 差 σ 时, 对 置 信 度 (1 α), 总 体 均 值 µ 的 近 似 置 信 区 间 仍 然 是 [ Xn z α/2σ n, Xn + z α/2σ n ]. 正 态 逼 近 法 σ 未 知 当 σ 未 知 时, 对 较 大 的 n, S 是 σ 的 强 相 合 估 计, 所 以 可 以 用 S 代 替 σ. 根 据 例 3.1 近 似 成 立. X n µ S/ n N(0, 1) 所 以 未 知 标 准 差 σ 时, 均 值 µ 的 置 信 度 为 (1 α) 的 近 似 置 信 区 间 是 [ Xn z α/2s n, Xn + z α/2s n ]. (5.1) n 越 大, 近 似 的 程 度 越 好. 我 们 称 以 上 方 法 为 正 态 逼 近 法. 使 用 正 态 逼 近 法 时, 一 般 的 要 求 是 n 30. 例 5.1 研 究 年 龄 和 血 液 中 的 各 种 成 份 之 间 的 关 系. 通 过 随 机 抽 样 调 查 了 30 个 30 岁 健 康 公 民 的 血 小 板 数. 数 据 如 下 ( 单 位 : 万 /mm 3 ):
194 188 第 七 章 参 数 估 计 用 µ 表 示 30 岁 健 康 公 民 的 血 小 板 数 的 总 体 均 值. 对 于 置 信 度 (1 α) = 0.95, 计 算 µ 的 置 信 区 间. 解 可 以 认 为 被 选 到 的 个 体 的 血 小 板 数 是 独 立 同 分 布 的. 经 过 计 算 得 到 X n = 22.7, S = 代 入 (5.1) 得 到 置 信 度 0.95 下, µ 的 近 似 置 信 区 间 [ / 30, / ] 30 =[25.75, 29.65] 比 例 p 的 置 信 区 间 比 例 p 的 置 信 区 间 例 5.2 设 X 1, X 2,, X n 是 来 自 两 点 分 布 总 体 B(1, p) 的 样 本, 对 置 信 度 (1 α), 当 n 较 大 ( 至 少 使 得 5 < nˆp < n 5), p 的 近 似 置 信 区 间 是 其 中 证 明 略 [ b b2 4ac, 2a b + b 2 4ac 2a a = 1 + z2 α/2 n, b = 2 X n + z2 α/2 n, c = X 2 n. 当 n 更 大, 更 简 单 一 些 的 近 似 置 信 区 间 是 [ Xn (1 Xn z X n ) Xn (1 α/2, Xn + z X n ) α/2 n n (5.3) 式 是 由 于 X n p Xn (1 X n )/n d N(0, 1) ], (5.2) ]. (5.3) 估 计 p 所 需 的 样 本 量 例 5.3 给 定 置 信 度 (1 α), 要 使 得 置 信 区 间 (5.2) 或 (5.3) 的 长 度 不 超 过 d, 只 要 取 样 本 量 n ( zα/2 取 (1 α) = 0.95 时, 可 以 列 出 和 d 对 应 的 n 如 下. d ) 2. (5.7) d = n = (5.8) 证 明 略
195 7.5 非 正 态 总 体 和 比 例 P 的 置 信 区 间 189 例 5.4 饮 用 水 资 源 的 匮 乏 限 制 了 我 国 许 多 城 市 的 经 济 发 展. 为 了 节 约 用 水, 城 市 甲 准 备 对 自 来 水 提 价. 现 在 需 要 对 每 吨 水 提 价 0.5 元 还 是 0.8 元 进 行 随 机 抽 样 调 查, 为 的 是 即 达 到 节 水 的 目 的, 又 不 影 响 百 姓 的 日 常 生 活. (1) 用 p 表 示 赞 同 提 价 0.5 元 的 人 口 比 例, 为 了 得 到 p 的 置 信 度 为 (1 α) = 0.95 的 置 信 区 间, 且 置 信 区 间 长 度 不 超 过 0.04, 应 当 随 机 抽 样 调 查 多 少 人? (2) 如 果 随 机 抽 样 调 查 的 n = 2500 个 人 中 有 1668 个 人 同 意 提 价 0.5 元, 计 算 p 的 置 信 度 为 0.95 的 置 信 区 间, (3) 计 算 (2) 中 置 信 区 间 的 长 度. 解 (1) d = 0.04, α = 从 (5.8) 知 道 至 少 应 当 调 查 2401 个 人. (2) 2500 个 人 中 有 1668 个 人 同 意 提 价 0.5 元 时, 可 以 计 算 出 X n = = , n = 2500, z α/2 = 由 于 样 本 量 已 经 较 大, Xn 偏 离 0.5 又 不 远, 我 们 使 用 简 单 一 些 的 置 信 区 间 (5.3). 将 上 面 的 数 代 入 (5.3), 得 到 p 的 置 信 度 为 0.95 的 置 信 区 间 [ Xn z α/2 Xn (1 X n )/n, Xn + z α/2 Xn (1 X n )/n ] =[0.6487, ]. 于 是, 我 们 以 95/% 的 把 握 保 证, 赞 同 提 价 0.5 元 的 人 口 比 例 在 64/% 至 69/% 之 间. (3) 置 信 区 间 的 长 度 是
196 190 第 七 章 参 数 估 计
197 第 八 章 假 设 检 验 8.1 假 设 检 验 的 概 念 假 设 检 验 引 入 假 设 检 验 是 统 计 推 断 的 一 个 主 要 部 分. 其 想 法 和 前 面 的 最 大 似 然 类 似 : 如 果 实 际 观 测 到 得 到 数 据 在 某 假 设 下 不 太 可 能 出 现 则 认 为 该 假 设 错 误 例 1.1 一 条 新 建 的 南 北 交 通 干 线 全 长 10 公 里. 公 路 穿 过 一 个 隧 道 ( 长 度 忽 略 不 计 ), 隧 道 南 面 3.5 公 里, 北 面 6.5 公 里. 在 刚 刚 通 车 的 一 个 月 中, 隧 道 南 发 生 了 3 起 交 通 事 故, 而 隧 道 北 没 有 发 生 交 通 事 故, 能 否 认 为 隧 道 南 的 路 面 更 容 易 发 生 交 通 事 故? 解 隧 道 将 公 路 分 为 两 段, 隧 道 南 3.5 公 里, 隧 道 北 6.5 公 里. 用 p 表 示 一 起 交 通 事 故 发 生 在 隧 道 南 的 概 率, 则 p = 0.35 表 示 隧 道 南 北 的 路 面 发 生 交 通 事 故 的 可 能 性 相 同. p > 0.35 表 示 后 隧 道 南 的 路 面 发 生 交 通 事 故 的 概 率 比 隧 道 北 的 路 面 发 生 交 通 事 故 的 概 率 大. 为 了 作 出 正 确 的 判 断, 先 作 一 个 假 设 H 0 : p = 我 们 称 H 0 是 原 假 设 或 零 假 设. 再 作 一 个 备 择 假 设 H 1 : p > 在 本 问 题 中, 如 果 判 定 H 0 不 对, 就 应 当 承 认 H 1. 三 起 交 通 事 故 的 发 生 是 相 互 独 立 的, 他 们 之 间 没 有 联 系. 191
198 192 第 八 章 假 设 检 验 如 果 H 0 为 真, 则 每 一 起 事 故 发 生 在 隧 道 南 的 概 率 都 是 0.35, 于 是 这 三 起 交 通 事 故 都 发 生 在 隧 道 南 的 概 率 是 P = 这 是 一 个 很 小 的 概 率, 一 般 不 容 易 发 生. 所 以 我 们 否 定 H 0, 认 为 隧 道 南 的 路 面 发 生 交 通 事 故 的 概 率 比 隧 道 北 大. 做 出 以 上 结 论 也 有 可 能 犯 错 误, 犯 错 误 的 概 率 正 是 这 是 因 为 当 隧 道 南 北 的 路 面 发 生 交 通 事 故 的 概 率 相 同, 而 3 起 交 通 事 故 又 都 出 现 在 隧 道 南 时, 我 们 才 犯 错 误. 这 一 概 率 正 是 P = 于 是, 我 们 判 断 正 确 的 概 率 是 = 95.7%( 在 多 次 解 决 类 似 问 题 意 义 下 ). 通 过 对 例 1.1 的 分 析, 我 们 得 到 以 下 的 概 念. 进 行 假 设 检 验 时, 根 据 问 题 的 背 景, 先 作 出 原 假 设 H 0 : p = 0.35, 及 其 备 择 假 设 H 1 : p > 然 后 在 H 0 的 下, 计 算 出 观 测 数 据 出 现 的 概 率 P. 如 果 P 很 小 ( 一 般 用 0.05 衡 量 ), 就 应 当 否 定 H 0, 承 认 H 1 ; 如 果 P 不 是 很 小, 也 不 必 急 于 承 认 H 0, 这 是 因 为 证 据 往 往 还 不 够 充 分. 如 果 继 续 得 到 的 观 测 数 据 还 不 能 使 得 P 降 低 下 来, 再 承 认 H 0 不 迟. 为 了 简 便, 我 们 把 以 上 的 原 假 设 和 备 择 假 设 记 作 H 0 : p = 0.35 vs H 1 : p > 其 中 的 vs 是 versus 的 缩 写.
199 8.1 假 设 检 验 的 概 念 193 假 设 检 验 的 一 般 提 法 一 般 来 讲, 设 X 1, X 2,, X n 是 来 自 总 体 X 的 样 本, θ 是 总 体 X 的 未 知 参 数, 但 是 已 知 θ Θ 0 + Θ 1. 这 里 Θ 是 θ 的 大 写, Θ 0, Θ 1 是 互 不 相 交 的 参 数 集 合. 对 于 假 设 H 0 : θ Θ 0 vs H 1 : θ Θ 1 的 检 验 法 W ( 我 们 用 W 表 示 这 个 检 验 法 ), 如 果 否 定 H 0 时 犯 错 误 的 概 率 不 超 过 α, 就 称 W 是 检 验 水 平 为 α 的 检 验, 称 α 是 检 验 法 W 的 检 验 水 平. 检 验 法 W 可 以 被 事 件 W 完 全 确 定, 事 件 W 发 生 时 拒 绝 H 0, 称 W 为 拒 绝 域 定 义 1.1 设 α 是 (0, 1) 中 的 常 数. 如 果 对 一 切 的 θ Θ 0, 有 P θ (W ) α, 就 称 拒 绝 域 W 的 检 验 水 平 或 显 著 性 水 平 是 α. 假 设 检 验 的 两 类 错 误 在 解 决 假 设 检 验 的 问 题 时, 无 论 作 出 否 定 还 是 接 受 原 假 设 H 0 的 决 定, 都 有 可 能 犯 错 误. 我 们 称 否 定 H 0 时 犯 的 错 误 为 第 一 类 错 误, 接 受 H 0 时 犯 的 错 误 为 第 二 类 错 误. 检 验 结 果 H 0 H 1 真 实 H 0 正 确 第 I 类 错 误 情 况 H 1 第 II 类 错 误 正 确 假 设 检 验 一 般 控 制 第 一 类 错 误 在 检 验 水 平 α 以 下, 所 以 否 定 H 0 时 结 论 比 较 可 靠 如 果 承 认 H 0, 可 能 犯 第 二 类 错 误, 错 误 概 率 可 能 会 比 较 大 在 正 确 的 统 计 推 断 前 提 下, 犯 错 误 的 原 因 总 是 随 机 因 素 造 成 的. 要 有 效 减 少 犯 错 误 的 概 率, 只 好 增 加 观 测 数 据, 或 在 可 能 的 情 况 下 提 高 数 据 的 质 量, 这 相 当 于 降 低 数 据 的 样 本 方 差.
200 194 第 八 章 假 设 检 验 在 例 1.1 中, 如 果 第 一 起 交 通 事 故 发 生 后, 就 断 定 隧 道 南 更 容 易 发 生 交 通 事 故, 犯 第 一 类 错 误 的 概 率 是 当 第 二 起 交 通 事 故 发 生 后, 断 定 隧 道 南 更 容 易 发 生 交 通 事 故, 犯 第 一 类 错 误 的 概 率 是 = 当 第 三 起 交 通 事 故 发 生 后, 断 定 隧 道 南 更 容 易 发 生 交 通 事 故, 犯 第 一 类 错 误 的 概 率 是 = 如 果 第 四 起 交 通 事 故 又 发 生 在 隧 道 南, 否 定 p = 0.35 时 犯 第 一 类 错 误 的 概 率 是 = 例 1.2: 第 一 类 错 误 与 第 二 类 错 误 的 比 较 一 个 有 20 多 年 教 龄 的 教 师 声 称 他 上 课 从 来 不 点 名. 如 何 判 定 他 讲 的 话 是 真 实 的? 为 了 解 决 这 个 问 题, 我 们 也 做 一 个 原 假 设 H 0 : 他 没 有 点 过 名, 然 后 再 调 查 H 0 是 否 为 真. 当 调 查 了 他 教 过 的 3 个 班, 都 说 他 没 有 点 过 名, 这 时 如 果 承 认 H 0, 犯 错 误 的 概 率 还 是 较 大 的. 当 调 查 了 他 教 过 的 10 个 班, 都 说 他 没 有 点 过 名, 这 时 承 认 H 0 犯 错 误 的 概 率 会 明 显 减 少. 如 果 调 查 了 他 教 过 的 30 个 班, 都 说 他 没 有 点 过 名, 这 时 承 认 H 0 犯 错 误 的 概 率 就 会 很 小 了. 可 惜 调 查 30 个 班 是 很 难 做 到 的. 反 过 来, 在 调 查 中 只 要 有 人 证 实 这 位 老 师 点 过 名, 就 可 以 否 定 H 0 了 ( 不 论 调 查 了 几 个 班 ), 并 且 这 样 做 犯 错 误 的 概 率 很 小. 例 1.2 告 诉 我 们, 要 否 定 原 假 设 H 0 是 比 较 简 单 的, 只 要 观 测 到 了 H 0 下 小 概 率 事 件 就 可 以 要 承 认 H 0 就 比 较 费 力 了 : 必 须 有 足 够 多 的 证 据 ( 样 本 量 ), 才 能 够 以 较 大 的 概 率 保 证 H 0 的 真 实. 在 这 个 例 子 中 还 有 一 个 现 象 值 得 注 意 : 当 调 查 10 个 班 发 现 都 没 有 点 过 名 就 承 认 H 0 时, 即 使 判 断 失 误, 造 成 的 后 果 也 不 严 重. 因 为 数 据 已 经 说 明 这 位 老 师 不 爱 点 名.
201 8.2 正 态 均 值 的 假 设 检 验 正 态 均 值 的 假 设 检 验 已 知 σ 时, µ 的 正 态 检 验 法 已 知 σ 时, µ 的 正 态 检 验 法 例 2.1 例 2.1 一 台 方 差 是 0.8 克 的 自 动 包 装 机 在 流 水 线 上 包 装 净 重 500 克 的 袋 装 白 糖. 现 在 随 机 抽 取 了 该 包 装 机 包 装 的 9 袋 白 糖, 测 得 净 重 如 下 ( 单 位 : 克 ) 能 否 认 为 包 装 机 在 正 常 工 作? 分 析 : 抽 查 的 9 袋 白 糖 中 有 7 袋 净 重 少 于 500 克, 似 乎 已 经 说 明 µ 0 = 500 不 对. 但 是, 由 于 包 装 机 的 方 差 是 0.8 克, 所 以 也 有 可 能 是 由 于 包 装 机 的 随 机 误 差 导 致 了 以 上 的 数 据. 下 面 的 分 析 说 明, 由 于 随 机 误 差 导 致 上 述 观 测 数 据 的 概 率 不 超 过 解 我 们 将 包 装 机 包 装 的 袋 装 白 糖 的 净 重 视 为 总 体 X, 则 X N(µ, σ 2 ), 其 中 σ 2 = 0.8 已 知,µ 未 知. 用 X j 表 示 第 j 袋 白 糖 的 净 重, 则 X 1, X 2,, X 9 是 来 自 总 体 X 的 n = 9 个 样 本. 设 µ 0 = 500, 作 假 设 H 0 : µ = µ 0 vs H 1 : µ µ 0. 在 H 0 下, Z = X n µ 0 σ/ 9 N(0, 1). Z 取 值 应 当 与 0 差 距 不 大. 当 Z 取 值 较 大 时, 要 否 定 H 0. 对 于 标 准 正 态 分 布 的 上 α/2 分 位 数 z α/2, 在 H 0 下, P ( Z z α/2 ) = α, 如 果 取 α = 0.05, 则 z α/2 = 1.96, P ( Z 1.96) = 0.05.
202 196 第 八 章 假 设 检 验 当 Z 1.96 时, 不 该 发 生 的 小 概 率 事 件 发 生 了, 于 是 否 定 原 假 设 H 0. 本 例 中 Xn = , Z = = 1.97 > 1.96, 0.8/9 所 以 应 当 否 定 H 0, 认 为 包 装 机 没 有 正 常 工 作. 在 例 2.1 中, 称 α 为 检 验 的 显 著 性 水 平, 简 称 为 显 著 性 水 平, 检 验 水 平, 或 水 平 (level); 称 Z 为 检 验 统 计 量 ; 称 { Z z α/2 } 为 检 验 的 拒 绝 域 或 否 定 域 ; 如 果 { Z z α/2 } 发 生, 就 称 检 验 是 显 著 的. 这 时 否 定 H 0, 犯 第 一 类 错 误 的 概 率 不 超 过 α; 检 验 水 平 就 是 犯 第 一 类 错 误 的 概 率. 值 得 注 意, 拒 绝 域 { Z z α/2 } 是 一 个 事 件, 它 的 发 生 与 否 由 Z, 从 而 由 观 测 样 本 X 1, X 2,, X n 决 定. 已 知 σ 时, µ 的 正 态 检 验 法 如 果 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, σ 已 知 时, 的 显 著 性 水 平 为 α 的 拒 绝 域 是 H 0 : µ = µ 0 vs H 1 : µ µ 0 W = { Z z α/2 }, 其 中 Z = X n µ 0 σ/ n. (2.1) 如 果 Z z α/2 发 生, 就 称 检 验 是 显 著 的, 表 示 结 论 和 假 设 有 显 著 性 差 异. 这 时, 否 定 H 0 犯 错 误 的 概 率 不 超 过 α. 特 别 当 α = 0.05, z α/2 = 由 于 这 种 检 验 方 法 是 基 于 正 态 分 布 的 方 法, 所 以 又 称 为 正 态 检 验 法 或 Z 检 验 法.
203 8.2 正 态 均 值 的 假 设 检 验 197 在 例 2.1 中, 如 果 取 检 验 水 平 α = 0.04, 则 临 界 值 z α/2 = z 0.02 = ( 查 附 录 C1( 续 )). 这 时 Z = 1.97 < 2.054, 不 能 否 定 H 0. 说 明 在 不 同 的 检 验 水 平 下 可 以 得 到 不 同 的 检 验 结 果. 降 低 犯 第 一 类 错 误 的 概 率, 就 会 使 得 拒 绝 域 减 小 : } { Z > z 0.04/2 { Z > z 0.05/2 }. 从 而 拒 绝 H 0 的 机 会 变 小, 接 受 H 0 的 机 会 变 大 p 值 检 验 法 p 值 检 验 法 在 例 2.1 中, 已 知 样 本 标 准 差 σ = 0.8, 从 实 际 数 据 计 算 得 到 z = 如 果 把 拒 绝 域 取 成 W = { Z 1.97} 则 刚 刚 能 够 拒 绝 H 0. 这 时 犯 第 一 类 错 误 的 概 率 是 P = P ( Z 1.97) = 2[1 Φ(1.97)] = 我 们 称 P = 是 检 验 的 P 值 (P value). P 值 越 小, 数 据 提 供 的 否 定 H 0 的 证 据 越 充 分. p 值 是 在 H 0 成 立 的 假 设 下 观 测 到 的 样 本 倾 向 于 H 1 的 概 率 如 果 检 验 的 显 著 性 水 平 α 是 事 先 给 定 的, 当 P 值 小 于 等 于 α, 就 要 否 定 H 0. 检 验 法 (2.1) 的 P 值 是 P = P ( Z z ) = 2Φ( z ), 其 中 z = x n µ 0 σ/ n.
204 198 第 八 章 假 设 检 验 未 知 σ 时, 均 值 µ 的 t 检 验 法 未 知 σ 时, 均 值 µ 的 t 检 验 法 例 2.2 例 2.2 在 例 2.1 中 如 果 9 个 袋 装 白 糖 的 样 品 是 从 超 级 市 场 仓 库 中 随 机 抽 样 得 到 的, 能 否 认 为 这 批 500 克 袋 装 白 糖 的 平 均 重 量 是 500 克? 解 σ 未 知, 需 要 寻 找 其 他 的 方 法. 对 µ 0 = 500 克, 仍 作 假 设 H 0 : µ = µ 0 vs H 1 : µ µ 0. 在 标 准 差 σ 未 知 时, 可 用 样 本 标 准 差 S = 1 n (X j n 1 X n ) 2 代 替 σ. j=1 在 H 0 下, 从 7.3 的 定 理 3.6 知 道 检 验 统 计 量 T = X n µ 0 S/ n t(n 1). 说 明 T 在 0 附 近 取 值 是 正 常 的, 如 果 T 取 值 较 大 就 应 当 拒 绝 H 0. 根 据 分 位 数 t α/2 (n 1) 的 性 质, 有 P ( T t α/2 (n 1)) = α. 于 是 H 0 的 显 著 性 水 平 为 α 的 拒 绝 域 是 { T tα/2 (n 1) }, T = X n µ 0 S/ n. (2.2) 现 在 µ 0 = 500. 取 α = 0.05, 查 表 得 到 t 0.05/2 (8) = t (8) = 经 过 计 算 得 到 Xn = , S = 0.676, T = X n µ 0 S/ = > n T 大 于 临 界 值 2.306, 所 以 应 当 否 定 H 0, 认 为 µ 在 本 例 中, Xn = < 500, 所 以 认 为 供 应 的 白 糖 是 缺 斤 少 两 的. 作 出 以 上 判 断 也 有 可 能 犯 错 误, 但 是 犯 错 误 的 概 率 不 超 过 α = 0.05.
205 8.2 正 态 均 值 的 假 设 检 验 199 我 们 将 例 2.2 中 的 方 法 总 结 如 下 : 如 果 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, σ 未 知 时, 的 显 著 性 水 平 为 α 的 拒 绝 域 是 H 0 : µ = µ 0 vs H 1 : µ µ 0 { T tα/2 (n 1) }, 其 中 T = X n µ 0 S/ n. (2.3) 如 果 T t α/2 (n 1) 发 生, 就 称 检 验 是 显 著 的, 这 时 否 定 H 0 犯 错 误 的 概 率 不 超 过 α. 由 于 这 种 检 验 方 法 是 基 于 t 分 布 的 方 法, 所 以 又 称 为 t 检 验 法. 设 T 统 计 量 的 计 算 结 果 为 a, 则 检 验 法 (2.3) 的 P 值 为 ( ) P =P T n 1 a ( ) =2P T n 1 a, 其 中 T n 1 t(n 1). 其 中 的 x n, s 分 别 是 实 际 计 算 出 的 样 本 均 值, 样 本 标 准 差 未 知 σ 时, µ 的 单 边 检 验 法 未 知 σ 时, µ 的 单 边 检 验 法 例 2.3 例 2.1 和 例 2.2 中 都 是 检 验 H 0 : µ = µ 0 vs H 1 : µ µ 0, 当 Xn 比 µ 0 大 许 多 或 小 许 多 时, 都 应 当 否 定 原 假 设 H 0, 所 以 这 种 检 验 问 题 又 被 称 为 双 边 检 验. 下 面 是 单 边 检 验 问 题 例 2.3 在 例 2.2 中, 抽 查 的 9 袋 白 糖 的 平 均 重 量 X = 就 可 以 引 起 我 们 的 怀 疑. 这 批 袋 装 白 糖 的 平 均 重 量 是 否 不 足 呢? 解 为 了 解 决 这 个 问 题, 我 们 作 原 假 设 H 0 : µ 500 vs H 1 : µ < 500. 如 果 否 定 了 H 0, 就 认 定 这 批 袋 装 白 糖 的 份 量 不 足. 由 于 在 H 0 下, 只 知 道 总 体 均 值 µ 500, 不 知 道 µ 的 具 体 值, 所 以 T = X n 500 S/ n
206 200 第 八 章 假 设 检 验 的 分 布 是 未 知 的. 但 是 这 时 有 T = X n 500 S/ n T 0 = X n µ S/ t(n 1). n 所 以 T 取 值 较 小 时 应 当 否 定 H 0. 因 为 P ( T t α (n 1) ) P ( T 0 t α (n 1) ) = α, 所 以, 当 T t α (n 1), 应 当 否 定 H 0, 这 时 犯 第 一 类 错 误 的 概 率 不 超 过 α. 在 本 例 中, 查 表 得 到 t 0.05 (8) = 1.86, T = < 1.86, 所 以 应 当 否 定 H 0. 认 定 这 批 袋 装 白 糖 的 分 量 不 足 时, 犯 错 误 的 概 率 不 超 过 例 2.3 中, 以 {T 2.609} 为 检 验 的 拒 绝 域 时, 刚 刚 可 以 拒 绝 H 0. 所 以 检 验 的 P 值 是 P = P (T ) = 分 析 例 2.1 和 2.3 的 问 题 背 景 就 会 看 出, 在 例 2.1 中 应 当 作 双 边 检 验 H 0 : µ = 500 vs H 1 : µ 500. 因 为 多 装 和 少 装 白 糖 都 是 不 符 合 生 产 标 准 的. 在 例 2.3 中 只 需 要 作 单 边 检 验 H 0 : µ 500 vs H 1 : µ < 500, 因 为 超 市 只 需 要 知 道 袋 装 白 糖 不 缺 斤 少 两 就 够 了. 未 知 σ 时, µ 的 单 边 检 验 法 我 们 将 例 2.3 中 的 方 法 总 结 如 下 : 如 果 X 1, X 2,, X n 是 来 自 总 体 N(µ, σ 2 ) 的 样 本, σ 未 知 时, 的 水 平 为 α 的 拒 绝 域 是 H 0 : µ µ 0 vs H 1 : µ < µ 0 { T tα (n 1) }, 其 中 T = X n µ 0 S/ n. (2.4) 如 果 T t α (n 1) 发 生, 就 称 检 验 是 显 著 的, 这 时 否 定 H 0 犯 错 误 的 概 率 不 超 过 α.
207 8.2 正 态 均 值 的 假 设 检 验 201 检 验 的 P 值 是 ( P = P T n 1 x n µ 0 s/ n ), 其 中 T n 1 t(n 1). (2.5) 同 理, 对 于 来 自 总 体 N(µ, σ 2 ) 的 样 本 X 1, X 2,, X n, σ 未 知 时, 在 检 验 水 平 α 下, 假 设 H 0 : µ µ 0 vs H 1 : µ > µ 0 的 拒 绝 域 是 { T tα (n 1) }, 其 中 T = X n µ 0 S/ n. (2.6) 如 果 T t α (n 1) 发 生, 就 称 检 验 是 显 著 的, 这 时 否 定 H 0 犯 错 误 的 概 率 不 超 过 α. 检 验 的 P 值 是 ( P = P T n 1 x n µ 0 s/ n ), 其 中 T n 1 t(n 1). 以 上 两 种 检 验 方 法 也 称 为 t 检 验 法. 例 2.4 糕 点 厂 经 理 为 判 断 牛 奶 供 应 商 所 供 应 的 鲜 牛 奶 是 否 被 兑 水, 对 它 供 应 的 牛 奶 进 行 了 随 机 抽 样 检 查. 测 得 12 个 鲜 牛 奶 样 品 的 冰 点 如 下, 已 知 天 然 牛 奶 的 冰 点 是 摄 氏 度. 问 牛 奶 是 否 被 兑 水. 解 设 n = 12. 用 X i 表 示 第 i 个 样 品 的 冰 点, 则 X 1, X 2,, X n 是 来 自 正 态 总 体 N(µ, σ 2 ) 的 样 本, 参 数 µ, σ 未 知. 如 果 牛 奶 没 有 被 兑 水, 则 µ = 根 据 测 量 的 数 据 可 以 计 算 出 样 本 均 值 Xn = , 样 本 方 差 S = 由 于 水 的 冰 点 是 0 摄 氏 度, 所 以 兑 水 牛 奶 的 冰 点 将 会 提 高. 现 在 Xn > 0.545, 于 是 有 理 由 怀 疑 牛 奶 被 兑 水.
208 202 第 八 章 假 设 检 验 为 了 判 定 牛 奶 被 兑 水, 就 要 看 牛 奶 没 被 对 兑 水 时, Xn = , S = 发 生 的 概 率 有 多 大. 设 µ 0 = 0.545, 作 假 设 H 0 : µ µ 0 ( 没 兑 水 ) vs H 1 : µ > µ 0 ( 兑 水 ). 如 果 否 定 了 H 0, 就 判 定 牛 奶 被 兑 水. 现 在 查 t(11) 表 得 到 t 0.05 (11) = T = X n µ 0 S/ n = 由 于 T > 1.796, 检 验 是 显 著 的, 所 以 否 定 H 0, 认 为 牛 奶 被 兑 水. 判 断 牛 奶 被 兑 水, 犯 错 误 的 概 率 不 超 过 检 验 水 平 α = 本 例 中 检 验 的 P 值 是 P = P (T ) 正 态 近 似 法 正 态 近 似 法 设 总 体 X 分 布 未 知,X 的 期 望 和 方 差 µ 和 σ 2 未 知 希 望 检 验 H 0 : µ = µ 0 vs H 1 : µ µ 0 对 X 的 样 本 X 1, X 2,..., X n, 如 果 n 充 分 大, 则 根 据 H 0 下 可 构 造 水 平 α 的 否 定 域 类 似 地, 对 Z = X n µ 0 S/ n d N(0, 1) W = { Z > z α/2 } H 0 : µ µ 0 vs H 1 : µ > µ 0 检 验 的 否 定 域 为 W = {Z > z α } 对 H 0 : µ µ 0 vs H 1 : µ < µ 0 检 验 的 否 定 域 为 W = {Z < z α }
209 8.3 样 本 量 的 选 择 203 比 例 的 近 似 假 设 检 验 双 边 设 总 体 X b(1, p), 样 本 X 1, X 2,..., X n, 则 Xn 是 比 例 p 的 估 计, 记 为 ˆp 对 检 验 H 0 : p = p 0 vs H 1 : p p 0 在 H 0 成 立 时 Z = ˆp p 0 p0 (1 p 0 )/n d N(0, 1) n 充 分 大 时 可 用 否 定 域 W = { Z > z α/2 } 比 例 的 近 似 假 设 检 验 单 边 对 单 边 检 验 H 0 : p p 0 vs H 1 : p > p 0 由 上 面 的 正 态 近 似 法, 当 p = p 0 时 Z = ˆp p 0 ˆp(1 ˆp)/n d N(0, 1) n 充 分 大 时 可 用 否 定 域 W = {Z > z α } 对 左 侧 单 边 检 验 否 定 域 则 为 W = {Z < z α } 8.3 样 本 量 的 选 择 功 效 函 数 对 检 验 H 0 : θ Θ 0 vs H 1 : θ Θ 1 设 W 为 α 水 平 的 检 验 法, 定 义 P θ (W ) = 真 实 参 数 为 θ 时 否 定 H 0 的 概 率 为 检 验 法 W 的 功 效 函 数
210 204 第 八 章 假 设 检 验 当 H 0 成 立 时,P θ (W ) 是 第 一 类 错 误 概 率 当 H 1 成 立 是,P θ (W ) 是 1 减 去 第 二 类 错 误 概 率, 称 为 检 验 的 功 效 检 验 法 控 制 P θ (W ) α, θ Θ 0 给 定 水 平 后 功 效 越 高 检 验 法 越 好, 但 是 在 Θ 0 和 Θ 1 交 界 的 地 方 功 效 可 以 只 有 α, 即 第 二 类 错 误 概 率 可 以 很 高 在 Θ 0 和 Θ 1 交 界 的 地 方 第 二 类 错 误 概 率 大 是 可 以 容 忍 的 功 效 函 数 的 例 子 考 虑 正 态 总 体 σ 2 已 知 时 检 验 H 0 : µ µ 0 vs H 1 : µ > µ 0 否 定 域 为 功 效 函 数 W = { } Xn µ 0 σ/ n > z α P µ (W ) = P (Z + µ µ 0 σ/ n > z α) Power function Power n=5 n=15 α µ 8.4 均 值 比 较 的 检 验 独 立 两 总 体 比 较 抽 样 分 布 设 X N(µ 1, σ1) 2, Y N(µ 2, σ2). 2 X 1, X 2,, X n 是 来 自 X 的 样 本, Y 1, Y 2,, Y m 是 来 自 Y 的 样 本, 考 虑 有 关 µ 1 和 µ 2 的 比 较 的 假 设 检 验 问 题.
211 8.4 均 值 比 较 的 检 验 205 以 下 设 总 体 X 和 总 体 Y 独 立, 于 是 X 1, X 2,, X n, Y 1, Y 2,, Y m 相 互 独 立. 用 Xn, Ȳm 分 别 表 示 X, Y 的 样 本 均 值, 用 S1, 2 S2 2 分 别 表 示 X, Y 的 样 本 方 差, 由 7.4 (4.12) 知 Z = ( X n Ȳm) (µ 1 µ 2 ) σ 2 1 /n + σ 2 2/m N(0, 1). (4.1) 当 未 知 σ 2 1, σ 2 2, 但 已 知 σ 2 1 = σ 2 2 时, 设 σ 2 = σ 2 1, 由 7.4 的 (4.16) 得 其 中 T 0 = ( X n Ȳm) (µ 1 µ 2 ) S W 1/n + 1/m t(n + m 2). (4.4) 已 知 σ 2 1, σ 2 2 时, µ 1, µ 2 的 检 验 已 知 σ 2 1, σ 2 2 时, µ 1, µ 2 的 检 验 例 4.1 SW 2 = (n 1)S2 1 + (m 1)S2 2, (4.3) n + m 2 甲 乙 两 公 司 都 生 产 700MB( 兆 字 节 ) 的 光 盘, 从 甲 的 产 品 中 抽 查 了 7 张 光 盘, 从 乙 生 产 的 产 品 中 抽 查 了 9 张 光 盘. 分 别 测 得 他 们 的 储 量 如 下 X( 甲 ) Y ( 乙 ) 现 在 已 知 甲 的 光 盘 储 量 X N(µ 1, 2), 乙 的 光 盘 储 量 Y N(µ 2, 3). 在 显 著 性 水 平 α = 0.05 下, 甲 乙 两 家 光 盘 的 平 均 储 量 有 无 显 著 性 差 异? 计 算 检 验 的 P 值. 解 n = 7, m = 9, σ 2 1 = 2, σ 2 2 = 3. 作 假 设 设 Z 由 (4.1) 定 义, 在 H 0 下, H 0 : µ 1 = µ 2 vs H 1 : µ 1 µ 2. (4.5) ξ = ( X n Ȳm) N(0, 1). (4.6) σ 2 1 /n + σ2/m 2
212 206 第 八 章 假 设 检 验 P ( ξ 1.96) = H 0 的 水 平 0.05 拒 绝 域 是 W = { ξ 1.96 }. (4.7) 经 过 计 算 得 到 Xn = , Ȳ m = , ξ = /7 + 3/9 = > 可 以 在 水 平 0.05 下 认 为 这 两 家 光 盘 的 平 均 储 量 有 显 著 差 异. 检 验 的 P 值 是 P = P ( Z ) = 2P (Z > ) = 例 4.2 在 例 4.1 中, 能 否 在 检 验 水 平 0.02 下 认 为 甲 光 盘 的 平 均 储 量 大 于 乙 光 盘 的 平 均 储 量? 计 算 检 验 的 P 值. 解 由 于 Xn = > Ȳm = , 所 以 初 看 起 来 µ 1 > µ 2. 作 假 设 H 0 : µ 1 µ 2 vs H 1 : µ 1 > µ 2. (4.8) 在 H 0 下, Xn Ȳm 应 当 比 较 小, ξ 取 值 较 大 时 应 当 否 定 H 0. 查 表 C1( 续 ) 知 道 z 0.02 = 所 以 H 0 的 水 平 0.02 拒 绝 域 是 W = {ξ > 2.054}. 现 在 ξ = > 2.054, 所 以 可 以 在 水 平 0.02 下 认 为 甲 光 盘 的 平 均 储 量 大 于 乙 光 盘 的 平 均 储 量. 检 验 的 P 值 是 P = P (Z > ) = 在 例 4.2 中, 由 于 P 值 小 于 0.02, 所 以 在 水 平 0.05 下, 更 能 否 定 H 0 : µ 1 µ 2. 分 析 例 4.1 和 例 4.2 看 出 : 由 于 z α/2 > z α, 所 以 对 双 边 假 设 能 够 否 定 H 0 : µ 1 = µ 2 时, 在 相 同 的 检 验 水 平 下, 只 要 Xn > Ȳm, 对 单 边 假 设 更 能 够 否 定 H 0 : µ 1 < µ 2.
213 8.4 均 值 比 较 的 检 验 未 知 σ1, 2 σ2, 2 但 已 知 σ1 2 = σ2 2 时, µ 1 µ 2 的 检 验 未 知 σ1, 2 σ2, 2 但 已 知 σ1 2 = σ2 2 时, µ 1 µ 2 的 检 验 例 4.3 甲 乙 两 公 司 用 同 型 号 的 组 装 线 分 别 生 产 自 己 的 128MB( 兆 字 节 ) 闪 盘, 从 甲 的 产 品 中 抽 查 了 7 只, 从 乙 生 产 的 产 品 中 抽 查 了 8 只 闪 盘. 分 别 测 得 他 们 的 储 量 如 下 X( 甲 ) Y ( 乙 ) 设 甲 的 闪 盘 储 量 和 乙 的 闪 盘 储 量 都 服 从 正 态 分 布, 且 有 相 同 的 标 准 差. (1) 在 显 著 性 水 平 α = 0.05 下, 这 两 家 光 盘 的 平 均 储 量 有 无 显 著 差 异, (2) 在 显 著 性 水 平 α = 0.1 下, 这 两 家 光 盘 的 平 均 储 量 有 无 显 著 差 异, (3) 在 显 著 性 水 平 α = 0.05 下, 能 否 认 为 EX > EY. 解 设 µ 1 = EX, µ 2 = EY, n = 7, m = 8. (1) 作 假 设 H 0 : µ 1 = µ 2 vs H 1 : µ 1 µ 2. (4.9) 在 H 0 下, 由 (4.4) 知 道 T = X n Ȳm S W 1/n + 1/m t(n + m 2), (4.10) 于 是 P ( T t 0.05/2 (13)) = 查 t 分 布 表 得 到 t 0.05/2 (13) = 2.16, 于 是 H 0 的 水 平 0.05 拒 绝 域 是 W = { T 2.16}. (4.11) 经 过 计 算 得 到 X n = 125.9, Ȳ m = 125.0, S1 2 = , S2 2 = SW 2 = ,
214 208 第 八 章 假 设 检 验 最 后 得 到 T = S W 1/7 + 1/8 = < 所 以 不 能 在 水 平 0.05 下 认 为 这 两 家 闪 盘 的 平 均 储 量 有 显 著 性 差 异. (2) 由 于 n, m 都 较 小, T 的 值 又 比 较 大, 我 们 还 不 情 愿 接 受 H 0. 查 t 分 布 表, 得 到 t 0.1/2 (13) = t 0.05 (13) = 根 据 (4.10), 在 H 0 下 P ( T > 1.771) = 0.1. 现 在 T = > 1.771, 所 以 我 们 可 以 在 水 平 0.1 下 否 定 H 0, 认 为 这 两 家 闪 盘 的 平 均 储 量 有 显 著 性 差 异. (3) 因 为 Xn = > Ȳm = 125.0, 所 以 可 能 有 µ 1 > µ 2. 作 假 设 H 0 : µ 1 µ 2 vs H 1 : µ 1 > µ 2. 设 T 0, T 分 别 在 (4.4) 和 (4.10) 中 定 义. 在 H 0 下, (µ 1 µ 2 ) 0, 故 T T 0 = ( X n Ȳm) (µ 1 µ 2 ) S W 1/n + 1/m t(n + m 2), P (T t 0.05 (13)) P (T 0 t 0.05 (13)) = 由 于 已 得 到 t 0.05 (13) = 于 是 得 到 H 0 的 水 平 0.05 拒 绝 域 是 W = {T 1.771}. 现 在 T = > 1.771, 所 以 我 们 可 以 在 水 平 0.05 下 否 定 H 0. 认 为 甲 光 盘 的 平 均 储 量 比 乙 光 盘 的 平 均 储 量 大. 从 例 4.3 看 出, 在 相 同 的 显 箸 性 水 平 下, 和 双 边 检 验 比 较, 单 边 检 验 更 易 于 得 出 否 定 H 0 的 结 果 成 对 数 据 的 假 设 检 验 成 对 数 据 的 假 设 检 验 例 4.4 在 考 古 学 中, 人 们 可 以 用 碳 14 方 法 确 定 发 掘 物 的 年 代.
215 8.4 均 值 比 较 的 检 验 209 这 是 由 于 不 论 何 种 动 植 物 生 长 在 何 处, 由 于 新 陈 代 谢 的 原 因, 存 活 时 其 细 胞 组 织 中 每 一 克 碳 内 所 含 的 碳 14 数 目 是 相 同 的. 但 是 当 动 植 物 的 生 命 停 止 后, 得 不 到 补 充 的 碳 14 衰 变 时 能 放 出 β 粒 子, 其 半 衰 期 约 为 5730 年. 即 大 约 经 过 5730 年 下 降 一 半, 经 年 减 少 到 1/4 等. 依 此 类 推, 就 能 根 据 动 植 物 残 骸 中 碳 14 的 含 量 来 确 定 其 停 止 呼 吸 的 时 间. 现 在 考 古 学 家 们 在 某 建 筑 工 地 陆 续 发 掘 出 了 已 经 碳 化 了 的 谷 物 种 子 的 12 个 样 品, X,Y 两 个 考 古 单 位 分 别 对 这 12 个 样 品 用 碳 14 方 法 进 行 了 年 代 测 定 ( 单 位 : 万 年 ), 结 果 如 下. X Y X Y (1) 在 检 验 水 平 0.05 下, 这 两 家 的 测 量 年 代 有 无 明 显 的 差 异? (2) 认 为 有 明 显 差 异 时 犯 错 误 的 概 率 是 多 少? 解 用 X 1, X 2,, X 2 分 别 表 示 甲 单 位 对 第 1, 2,, 12 号 样 品 的 测 定, 用 Y 1, Y 2,, Y 2 分 别 表 示 乙 单 位 对 第 1, 2,, 12 号 样 品 的 测 定. 引 入 Z 1 = X 1 Y 1, Z 2 = X 2 Y 2,, Z n = X n Y n. 设 Z = X Y N(µ, σ 2 ), Z 1, Z 2,..., Z n 是 Z 的 样 本 我 们 要 检 验 的 是 假 设 H 0 : µ = 0 vs H 1 : µ 0. 问 题 已 经 转 化 成 一 个 样 本 的 t 检 验 问 题. H 0 的 水 平 0.05 拒 绝 域 是 由 于 t 0.05/2 (11) = 2.201, W = { T t 0.05/2 (11)}, T = T = Z n S Z / n. Z n S z / = < n 所 以 不 能 否 定 H 0, 即 不 能 认 为 两 单 位 的 测 定 有 明 显 的 差 异.
216 210 第 八 章 假 设 检 验 (2) 由 于 检 验 的 P 值 为 P = P ( T 11 > ) = 2P (T 11 > ) = 0.512, 说 明 否 定 H 0 的 证 据 不 足 本 例 中, 如 果 采 用 方 差 相 等 的 检 验 法 ( 当 然, 理 论 上 不 合 适 ), 也 不 能 否 定 H 未 知 σ 2 1, σ 2 2 时, µ 1, µ 2 的 检 验 未 知 σ 2 1, σ 2 2 时, µ 1, µ 2 的 检 验 未 知 σ 2 1, σ 2 2 时, 对 η n = σ 2 1 /n + σ 2 2/m S 2 1 /n + S 2 2/m = σ σ 2 2(n/m) S S 2 2(n/m), 利 用 S 2 1 σ 2 1, S 2 2 σ 2 2, wp1., 得 到 当 n/m 1, lim η n 1, wp1. n,m 于 是 利 用 7.3 的 定 理 3.9, 在 H 0 下 得 到, 当 n/m 1, n 时, T = X n Ȳm S 2 1 /n + S 2 2/m = Xn Ȳm σ 2 1 /n + σ 2 2/m η n = Zη n d N(0, 1). 即 当 样 本 量 n, m 都 较 大 时, T 近 似 服 从 N(0, 1) 分 布, 从 而 可 以 得 到 H 0 : µ 1 = µ 2 vs H 1 : µ 1 µ 2 的 检 验 法 W = { T > z α/2 }, 其 中 T = X n Ȳm S 2 1 /n + S 2 2/m. 例 4.5 X, Y 两 个 渔 场 在 初 春 放 养 相 同 的 鳜 鱼 苗, 但 是 采 用 不 同 的 方 法 喂 养. 入 冬 时, 从 第 一 渔 场 打 捞 出 59 条 鳜 鱼, 从 第 二 渔 场 打 捞 出 41 条 鳜 鱼. 分 别 秤 出 他 们 的 平 均 重 量 和 样 本 标 准 差 如 下 ( 单 位 :kg), X n = 0.59, S 1 = 0.2, Ȳ m = 0.62, S 2 = (1) 在 显 著 性 水 平 0.05 下, 就 鳜 鱼 的 平 均 重 量 来 讲, 两 个 渔 场 的 养 殖 结 果 有 无 显 著 差 异 ; (2) 计 算 检 验 的 P 值.
217 8.5 方 差 的 假 设 检 验 211 解 对 n = 59, m = 41, 容 易 计 算 出 Z = X n Ȳm S 2 1 /n + S 2 2/m = 由 于 Z < 1.96, 所 以 在 水 平 0.05 下 不 能 否 定 H 0 : EX = EY. 不 能 认 为 两 个 渔 场 的 养 殖 结 果 有 显 著 性 差 异. 检 验 的 P 值 是 P = P ( Z > ) = 2[1 Φ(0.7164)] 否 定 H 0 的 证 据 不 足 8.5 方 差 的 假 设 检 验 方 差 的 假 设 检 验 例 5.1 在 例 4.5 中, 从 第 一 渔 场 打 捞 出 59 条 鳜 鱼, 从 第 二 渔 场 打 捞 出 41 条 鳜 鱼. 分 别 秤 出 他 们 的 样 本 标 准 差 如 下 ( 单 位 :kg) S 1 = 0.2, S 2 = 对 σ0 2 = , 在 显 著 性 水 平 α = 0.05 下, 解 决 以 下 检 验 问 题. (1) H 0 : σ1 2 = σ0 2 vs H 1 : σ1 2 σ0, 2 (2) H 0 : σ1 2 σ0 2 vs H 1 : σ1 2 > σ0, 2 (3) H 0 : σ1 2 σ2 2 vs H 1 : σ1 2 < σ2. 2 解 设 X 1, X 2,, X n 是 来 自 总 体 N(µ 1, σ 2 1) 的 样 本, 则 ξ 1 = (n 1)S2 1 σ 2 1 χ 2 (n 1), n = 59. (1) 在 H 0 下 ξ = (n 1)S2 1 σ 2 0 χ 2 (n 1), n = 59. S1 2 是 σ0 2 的 强 相 合 估 计, 所 以 ξ 取 值 过 大 和 过 小 都 是 拒 绝 H 0 的 依 据. 用 χ 2 α(n 1) 表 示 χ 2 (n 1) 的 上 α 分 位 数, 则 可 以 构 造 出 假 设 (1) 的 水 平 α 拒 绝 域 W 1 = {ξ χ 2 1 α/2(n 1)} {ξ χ 2 α/2(n 1)}. (5.1)
218 212 第 八 章 假 设 检 验 这 是 因 为 在 H 0 下, 有 P (W 1 ) = P (ξ χ 2 1 α/2(n 1)) + P (ξ χ 2 α/2) = α 2 + α 2 = α. 本 例 中, 查 表 得 到 χ 2 1 α/2 (58) = χ (58) = 38.84, χ 2 α/2 (58) = 80.94, 否 定 域 是 W 1 = {ξ 38.84} {ξ 80.94}. 现 在 ξ = 58S = / W 1. 所 以 在 检 验 水 平 0.05 下 不 能 否 定 H 0. 本 检 验 是 用 χ 2 分 布 完 成 的, 所 以 又 称 为 χ 2 检 验. (2) 在 H 0 : σ 2 1 σ 2 0 下, σ 2 1 是 真 参 数, ξ = (n 1)S2 1 σ 2 0 (n 1)S2 1 σ 2 1 = ξ 1 χ 2 (n 1). 对 σ 1 σ 0, 取 λ = χ 2 α(n 1), 则 P σ1 (ξ > λ) P σ1 (ξ 1 > λ) P σ1 (ξ > λ) α ξ 取 值 过 大 是 拒 绝 H 0 的 依 据, 于 是 得 到 H 0 的 水 平 0.05 拒 绝 域 现 在 ξ = 71.6, 仍 然 不 能 否 定 H 0. W 2 = {ξ χ (58)} = {ξ 76.78} 这 个 检 验 也 是 用 χ 2 分 布 完 成 的, 也 称 为 χ 2 检 验. (3) 在 H 0 下, σ 2 1/σ 2 2 大 于 1, 所 以 F S 2 1/S 2 2 取 值 也 应 当 较 大, F 较 小 时 应 当 拒 绝 H 0. 由 于 总 体 X 和 Y 独 立, 所 以 利 用 7.3 的 定 理 3.7 知 道 F = S2 1 S 2 2 S2 1 S 2 2 σ2 2 σ 2 1 于 是 得 到 H 0 的 水 平 α 否 定 域 = S2 1/σ 2 1 S 2 2/σ 2 2 W 3 = {F F 1 α (58, 40)}. F (n 1, m 1). 经 过 查 表 和 计 算 得 到 F (58, 40) = 1/F 0.05 (40, 58) = F = / = 所 以 不 能 在 显 著 性 水 平 0.05 下 否 定 H 0.
219 8.6 比 例 的 假 设 检 验 213 我 们 还 不 能 根 据 数 据 判 定 X 的 方 差 小 于 Y 的 方 差. 这 里 的 检 验 是 用 F 分 布 进 行 的, 所 以 又 称 为 F 检 验. 8.6 比 例 的 假 设 检 验 小 样 本 情 况 下 的 假 设 检 验 小 样 本 单 个 比 例 的 右 侧 检 验 设 总 体 X B(1, p), X 1, X 2,..., X n 是 X 的 样 本,p 0 (0, 1) 为 已 知 常 数 单 样 本 单 边 比 例 检 验 问 题 H 0 : p p 0 H 1 : p > p 0 (6.1) 用 统 计 量 ξ n = X 1 + X X n B(n, p), 取 否 定 域 为 W 1 = {ξ n B α (n, p 0 )} (6.2) 其 中 B α (n, p 0 ) 是 B(n, p 0 ) 的 上 侧 α 分 位 数 当 H 0 成 立 即 p p 0 时, 设 η 为 B(n, p 0 ) 随 机 变 量, 则 P (W 1 ) = P (ξ n B α (n, p 0 )) P (η B α (n, p 0 )) α 于 是, 对 检 验 问 题 (6.1), 给 定 检 验 水 平 α, 设 n 个 独 立 样 本 点 中 成 功 个 数 为 ξ n, 查 二 项 分 布 上 侧 分 位 数 表 得 B α (n, p 0 ), 当 ξ n B α (n, p 0 ) 拒 绝 H 0, 认 为 在 检 验 水 平 α 下 成 功 概 率 p 显 著 地 高 于 p 0 ; 否 则, 认 为 在 检 验 水 平 α 下 成 功 概 率 p 不 显 著 高 于 p 0 小 样 本 单 个 比 例 的 左 侧 检 验 类 似 地, 对 检 验 问 题 H 0 : p p 0 H 1 : p < p 0 (6.3) 取 拒 绝 域 为 W 2 = {ξ n n B α (n, 1 p 0 )} (6.4)
220 214 第 八 章 假 设 检 验 记 q = 1 p, q 0 = 1 p 0, 这 时 ζ n = n ξ n B(n, q), 令 η B(n, q 0 ), 则 H 0 成 立 即 p p 0 时 q q 0, 有 P (W 2 ) =P (ξ n n B α (n, q 0 )) = P (ζ n B α (n, q 0 )) P ( η B α (n, q 0 )) α. 给 定 检 验 水 平 α 后, 查 二 项 分 布 上 侧 分 位 数 表 得 B α (n, 1 p 0 ), 当 且 仅 当 ξ n n B α (n, 1 p 0 ) 时 拒 绝 H 0 小 样 本 单 个 比 例 的 双 侧 检 验 对 检 验 问 题 H 0 : p = p 0 H 1 : p p 0 (6.5) 取 否 定 域 为 W 3 = {ξ n n B α 2 (n, 1 p 0) 或 ξ n B α 2 (n, p 0)} (6.6) 二 项 分 布 上 侧 分 位 数 定 义 设 随 机 变 量 X B(n, p) 若 非 负 整 数 λ {0, 1,..., n} 使 得 P (X λ) α, P (X λ 1) > α (*) 则 称 λ 为 B(n, p) 分 布 的 上 侧 α 分 位 数 记 作 B α (n, p) 实 际 上, 因 为 n P (X m) = Cnp k k (1 p) n k, m = 0, 1,..., n k=m 是 一 个 严 格 单 调 递 减 序 列, 所 以 对 任 意 α (0, 1) 一 定 能 找 到 唯 一 的 λ 满 足 (*) 式 简 单 而 言 可 以 用 穷 举 法 找 到 B α (n, p) 的 值
221 8.6 比 例 的 假 设 检 验 215 例 6.1 小 区 物 业 称 业 主 满 意 率 p 80% 随 机 抽 样 调 查 50 户, 有 33 户 回 答 满 意,ˆp = 30/50 = 66% 能 否 认 为 满 意 率 真 的 p 80%? 解 答 : 如 何 选 择 单 侧 检 验 的 方 向? 数 据 中 实 际 满 意 率 是 低 于 p 0 = 0.8 的, 所 以 对 立 假 设 设 为 p < 0.8, 这 样 零 假 设 用 p 0.8 设 ξ n 是 回 答 满 意 的 户 数, 否 定 域 为 ξ n n B α (n, p 0 ). 取 α = 0.05,n = 50, ξ n = 33, 查 表 得 B 0.05 (50, 0.8) = 45 现 在 ξ n = 成 立, 拒 绝 H 0, 在 0.05 水 平 下 业 主 满 意 率 显 著 地 低 于 80% 大 样 本 情 况 下 单 个 比 例 的 假 设 检 验 大 样 本 情 况 下 单 个 比 例 的 假 设 检 验 对 单 个 比 例 p, 设 ξ n 是 n 个 独 立 抽 样 中 成 功 的 个 数, 则 ξ n B(n, p), 当 n 很 大 时 ( 一 般 要 求 成 功 和 失 败 个 数 都 超 过 5 个 ), 根 据 中 心 极 限 定 理,ξ n 近 似 服 从 正 态 分 布 N(np, np(1 p)) 令 ˆp = ξ n /n 为 样 本 中 成 功 比 例 则 η = ˆp p p(1 p)/n 近 似 服 从 标 准 正 态 分 布 当 n 很 大 时 另 一 近 似 为 Z = ˆp p ˆp(1 ˆp)/n 近 似 服 从 标 准 正 态 分 布
222 216 第 八 章 假 设 检 验 双 侧 检 验 对 双 侧 问 题 在 H 0 下 H 0 : p = p 0 H 1 : p p 0 ˆp p 0 p0 (1 p 0 )/n 近 似 服 从 标 准 正 态 分 布 给 定 检 验 水 平 α, 取 否 定 域 为 { } ˆp p 0 W = p0 (1 p 0 )/n z α 2 (6.7) 右 侧 检 验 对 右 侧 检 验 问 题 H 0 : p p 0 H 1 : p > p 0 取 否 定 域 为 { } ˆp p 0 W = z α ˆp(1 ˆp)/n (6.8) 左 侧 检 验 对 左 侧 检 验 问 题 H 0 : p p 0 H 1 : p < p 0 取 否 定 域 为 { } ˆp p 0 W = z α ˆp(1 ˆp)/n (6.9) 这 样 的 比 例 检 验 方 法 称 为 正 态 逼 近 法
223 8.6 比 例 的 假 设 检 验 217 例 6.2 收 藏 家 一 年 中 购 入 了 98 幅 名 画, 经 鉴 定 其 中 26 幅 是 赝 品 能 否 认 为 该 收 藏 家 的 鉴 定 准 确 率 大 于 等 于 75%? 解 答 : 准 确 率 p 的 估 计 为 ˆp = (98 26)/98 = , 低 于 75%, 所 以 取 单 侧 检 验 的 方 向 为 H 0 : p 0.75 H 1 : p < 0.75 用 正 态 近 似 法, 取 检 验 水 平 α = 0.05, n = 98, 否 定 域 为 { } ˆp 0.75 ˆp(1 ˆp)/n < 计 算 得 ˆp 0.75 ˆp(1 ˆp)/n = 未 落 入 否 定 域, 在 0.05 水 平 下 不 能 拒 绝 鉴 定 准 确 率 大 于 等 于 75% 的 假 设 注 意, 如 果 我 们 去 假 设 的 方 向 为 右 侧 问 题 H 0 : p 0.75 H 1 : p > 水 平 否 定 域 为 { } ˆp 0.75 ˆp(1 ˆp)/n > 现 在 统 计 量 ˆp 0.75 ˆp(1 ˆp)/n = 也 没 有 落 入 否 定 域, 在 0.05 水 平 下 不 能 拒 绝 鉴 定 准 确 率 小 于 等 于 75% 的 假 设 这 是 通 常 的 假 设 检 验 方 法 的 局 限 性 : 当 不 能 拒 绝 H 0 时, 最 后 的 结 论 往 往 是 不 确 定 的
224 218 第 八 章 假 设 检 验 大 样 本 情 况 下 两 个 总 体 比 例 的 比 较 大 样 本 情 况 下 两 个 总 体 比 例 的 比 较 设 总 体 X B(1, p 1 ), 总 体 Y B(1, p 2 ) 与 X 独 立 设 X 1,..., X n 为 来 自 X 的 样 本,S 1 = X X n 为 n 个 独 立 抽 样 的 成 功 次 数,ˆp 1 = S 1 /n 为 成 功 比 例 ; 设 Y 1,..., Y m 为 来 自 Y 的 样 本,S 2 = Y Y m 为 m 个 独 立 抽 样 的 成 功 次 数,ˆp 2 = S 2 /m 为 成 功 比 例 由 中 心 极 限 定 理, 当 n, m 都 很 大 时 近 似 有 从 而 近 似 有 ˆp 1 ˆp 2 N ˆp 1 N(p 1, p 1 (1 p 1 )/n), ˆp 2 N(p 2, p 2 (1 p 2 )/m), ( p 1 p 2, 1 n p 1(1 p 1 ) + 1 ) m p 2(1 p 2 ) 实 际 使 用 时, 设 两 个 样 本 中 的 成 功 和 失 败 个 数 都 在 5 个 以 上 右 侧 检 验 对 右 侧 检 验 问 题 取 统 计 量 H 0 : p 1 p 2 H 1 : p 1 > p 2 ˆp 1 ˆp 2 ξ = 1 ˆp n 1(1 ˆp 1 ) + 1 ˆp m 2(1 ˆp 2 ) 当 p 1 = p 2 时 且 n, m 都 很 大 时 ξ 近 似 标 准 正 态 分 布 取 水 平 α 的 否 定 域 为 {ξ z α } 左 侧 检 验 对 左 侧 检 验 问 题 H 0 : p 1 p 2 H 1 : p 1 < p 2 取 水 平 α 的 否 定 域 为 {ξ z α }
225 8.6 比 例 的 假 设 检 验 219 双 侧 检 验 对 双 侧 检 验 问 题 H 0 : p 1 = p 2 H 1 : p 1 p 2 在 H 0 下 设 p 1 = p 2 = p 0, 则 近 似 地 有 ( ˆp 1 ˆp 2 N 0, [ 1 n + 1 m ] ) p 0 (1 p 0 ) 其 中 p 0 可 以 用 ˆp 0 = (S 1 + S 2 )/(n + m) 来 估 计 取 统 计 量 η = ˆp 1 ˆp 2 ( n m) ˆp0 (1 ˆp 0 ) 当 p 1 = p 2 时 且 n, m 都 很 大 时 η 近 似 标 准 正 态 分 布 取 水 平 α 的 否 定 域 为 { eta z α 2 } 以 上 的 三 个 两 总 体 比 例 比 较 方 法 也 称 为 正 态 逼 近 法 例 6.3 n = 1230 位 男 应 届 毕 业 生 和 m = 1542 名 女 应 届 毕 业 生 参 加 由 政 府 组 织 的 就 业 洽 谈 会 结 果 有 251 名 男 生 和 232 名 女 生 求 职 成 功 假 设 除 性 别 不 同 外 学 生 表 现 没 有 其 它 方 面 的 系 统 差 异, 问 此 次 招 聘 有 无 性 别 歧 视 解 答 : 成 立 设 男 生 成 功 率 为 p 1, 女 生 成 功 率 为 p 2, 问 题 是 p 1 = p 2 是 否 检 验 问 题 是 H 0 : p 1 = p 2 H 1 : p 1 p 2 样 本 量 足 够 大, 可 以 用 正 态 逼 近 法 水 平 0.05 否 定 域 为 { η > 1.96}
226 220 第 八 章 假 设 检 验 现 在 n = 1230, m = 1542, ˆp 1 = 251/1230 = , ˆp 2 = 232/1542 = , ˆp 0 = ( )/( ) = 计 算 统 计 量 值 ˆp 1 ˆp 2 η = ( n m) ˆp0 (1 ˆp 0 ) = ( 1 + ) = > ( ) 在 0.05 水 平 下 否 定 H 0, 认 为 招 聘 男 女 比 例 有 显 著 差 异, 可 以 认 为 有 性 别 歧 视, 而 且 是 不 利 于 女 生 例 6.4 在 第 六 章 例 5.3 中, 被 实 验 组 的 20 万 儿 童 注 射 疫 苗, 发 病 率 为 ˆp 1 = , 对 照 组 的 20 万 儿 童 发 病 率 为 ˆp 2 = 问 : 疫 苗 是 否 有 效? 因 为 做 出 疫 苗 有 效 的 结 论 是 需 要 很 慎 重 的, 所 以 我 们 取 双 侧 检 验 ( 这 是 医 学 中 通 常 的 做 法 ) 样 本 足 够 大 H 0 : p 1 = p 2 H 1 : p 1 p 2 取 检 验 水 平 0.01, 否 定 域 为 { η > 2.58} ˆp 0 = ( )/ = 统 计 量 为 ˆp 1 ˆp 2 η = ( n m) ˆp0 (1 ˆp 0 ) = ( 1 + ) = ( ) η > 2.58, 在 0.01 水 平 下 拒 绝 零 假 设, 认 为 处 理 组 发 病 率 与 对 照 组 发 病 率 有 显 著 差 异, 疫 苗 有 效 可 进 一 步 计 算 检 验 p 值 为 P ( Z > ) = 2[1 Φ(6.311)] = 所 以 显 著 性 差 异 的 证 据 是 很 强 的
227 8.7 总 体 分 布 的 假 设 检 验 总 体 分 布 的 假 设 检 验 总 体 分 布 的 假 设 检 验 设 X 1, X 2,..., X n 是 总 体 X 的 样 本, 设 X 的 分 布 函 数 F (x) 未 知, F 0 (x) 是 一 个 已 知 的 分 布 函 数 考 虑 假 设 检 验 问 题 H 0 : F (x) F 0 (x) H 1 : F (x) F 0 (x) 这 样 的 检 验 问 题 称 为 拟 合 优 度 检 验 离 散 分 布 情 形 设 F 0 代 表 了 一 个 离 散 分 布, 设 X 仅 在 {a 1, a 2,..., a m } 中 取 值, 在 F 0 下 P (X = a j ) = p j, j = 1, 2,..., m 设 n 个 样 本 点 中 a j 出 现 的 次 数 为 f j, 称 为 频 数, 当 H 0 成 立 时,f j 应 该 与 np j 近 似 相 等 取 统 计 量 m (f j np j ) 2 ξ = np j j=1 当 n 充 分 大 时 ξ 在 H 0 下 近 似 服 从 χ 2 (m 1) 分 布 称 ξ 为 拟 合 优 度 卡 方 统 计 量 取 水 平 α 的 拒 绝 域 为 {ξ χ 2 α(m 1)} 推 广 1 如 果 F 0 是 一 类 分 布, 其 中 还 包 含 k 个 未 知 参 数, 可 以 用 最 大 似 然 估 计 方 法 求 得 参 数 估 计, 用 估 计 的 参 数 计 算 F 0 下 p j = P (X = a j ) 的 值 仍 计 算 统 计 量 ξ, 但 取 否 定 域 为 {ξ χ 2 α(m k 1)} ( 卡 方 临 界 值 的 自 由 度 等 于 组 数 减 一 再 减 未 知 参 数 个 数 )
228 222 第 八 章 假 设 检 验 推 广 2 当 F 0 代 表 的 离 散 分 布 有 无 穷 多 个 取 值, 或 者 取 值 个 数 有 限 但 是 有 些 组 频 数 太 小 时 ( 一 般 要 求 频 数 超 过 5), 可 以 把 频 数 很 小 的 类 合 并 仍 记 m 为 合 并 后 的 组 数, 这 时 p j 为 合 并 过 后 的 第 j 组 在 H 0 下 的 理 论 概 率,f j 是 合 并 过 后 第 j 组 的 频 数 仍 有 m (f j np j ) 2 ξ = np j j=1 水 平 α 的 拒 绝 域 为 其 中 k 是 F 0 中 未 知 参 数 的 个 数 {ξ χ 2 α(m k 1)} 推 广 3 连 续 分 布 情 形 如 果 F 0 是 一 个 连 续 型 分 布, 适 当 选 择 分 点 b 0, b 1,..., b m, 构 成 区 间 (b 0, b 1 ], (b 1, b 2 ],..., (b m 1, b m ] 把 X 的 取 值 空 间 分 成 m 个 组, 设 f j 为 第 j 组 的 频 数, 令 p j = P (X (b j 1, b j ] H 0 ) = F 0 (b j ) F 0 (b j 1 ) 如 果 F 0 中 有 未 知 参 数, 计 算 p j 时 先 获 得 参 数 的 最 大 似 然 估 计,F 0 ( ) 使 用 参 数 最 大 似 然 估 计 计 算 仍 计 算 统 计 量 m (f j np j ) 2 ξ = np j j=1 否 定 域 为 其 中 k 是 F 0 中 未 知 参 数 的 个 数 {ξ χ 2 α(m k 1)}
229 8.7 总 体 分 布 的 假 设 检 验 223 例 7.1 在 第 二 章 例 2.2 中,1500 年 至 1931 年 的 n = 432 年 中, 全 世 界 发 生 了 299 次 比 较 重 要 的 战 争 用 X j 表 示 第 j 年 发 生 的 战 争 次 数, 认 为 X 1,..., X n 是 来 自 泊 松 分 布 的 样 本 估 计 泊 松 参 数 为 ˆλ = Xj /n = 0.69, 合 并 比 较 小 的 概 率, 把 总 体 X 的 取 值 分 为 0, 1, 2, [3, ) 在 Poisson(0.69) 下 计 算 m = 4 个 组 分 别 的 概 率 p 1 =P (X = 0) = 0.502, p 2 = P (X = 1) = 0.346, p 3 =P (X = 2) = 0.119, p 4 = P (X 3) = 1 p 1 p 2 p 3 = 各 组 的 频 数 为 (223, 142, 48, 19) 检 验 统 计 量 为 ( )2 ( )2 ξ = ( )2 ( ) =2.346 水 平 0.05 的 否 定 域 为 {ξ χ (4 1 1)} = {ξ 5.991}, ξ = 未 落 入 否 定 域, 所 以 在 0.05 水 平 下 可 以 认 为 样 本 来 自 泊 松 分 布 注 意 拟 合 优 度 检 验 承 认 H 0 时 可 以 承 认 总 体 服 从 F 0 分 布, 但 是 和 其 它 检 验 承 认 H 0 的 问 题 类 似, 如 果 H 0 换 成 某 个 其 它 的 已 知 分 布 G 0, 也 可 能 会 获 得 承 认 例 7.2 在 第 六 章 例 3.1 中, 列 出 了 某 公 共 图 书 馆 在 一 年 中 通 过 随 机 抽 样 调 查 得 到 了 60 天 中 每 天 的 读 者 借 书 数, 能 否 认 为 这 批 数 据 是 来 自 正 态 总 体 的 样 本?
230 224 第 八 章 假 设 检 验 设 总 体 分 布 是 N(µ, σ 2 ), 可 以 计 算 出 µ, σ 2 的 最 大 似 然 估 计 分 别 是 ˆµ = X n = 403.5, ˆσ 2 = 1 n (X j ˆµ) 2 = n 数 据 的 最 小 值 是 213 > 200, 最 大 值 是 584 < 600. 按 照 制 作 直 方 图 的 方 法 将 将 (200, 600] 八 等 分. 计 算 出 数 据 落 入 各 段 的 频 数 为 (3, 2, 12, 14, 12, 11, 3, 3) 用 最 大 似 然 估 计 作 为 正 态 分 布 参 数 计 算 各 个 组 的 取 值 概 率 p i, i = 1, 2,..., m = 8 各 组 频 数 和 理 论 概 率 列 表 如 下 : 区 间 频 数 f j 理 论 概 率 p j (200, 250] (250, 300] (300, 350] (350, 400] (400, 450] (450, 500] (500, 550] (550, 600] 这 里 第 1 2 组 和 第 7 8 组 都 频 数 太 小, 分 别 合 并 j=1 合 并 后 的 6 个 组 的 频 数 和 理 论 概 率 列 表 如 下 : 区 间 频 数 f j 理 论 概 率 p j (200, 300] (300, 350] (350, 400] (400, 450] (450, 500] (500, 600] 计 算 检 验 统 计 量 6 (f j np j ) 2 ξ = = np j j=1
231 8.7 总 体 分 布 的 假 设 检 验 225 否 定 域 为 {ξ χ (6 1 2)} = {ξ 7.815} 检 验 统 计 量 未 落 入 否 定 域, 在 0.05 水 平 下, 不 拒 绝 样 本 来 自 正 态 分 布 的 假 设
232 226 第 八 章 假 设 检 验
233 第 九 章 线 性 回 归 分 析 9.1 数 据 的 相 关 性 二 战 初 期, 德 国 对 法 国 发 动 攻 势 后, 英 国 首 相 丘 吉 尔 应 法 国 的 请 求, 动 用 了 十 几 个 防 空 中 队 对 德 作 战. 由 于 防 空 中 队 的 飞 机 需 要 在 欧 洲 大 陆 的 机 场 进 行 维 护, 使 得 空 战 中 英 国 飞 机 损 失 严 重. 这 时, 法 国 总 理 请 求 英 国 继 续 增 派 十 个 中 队 的 飞 机, 丘 吉 尔 决 定 同 意 这 一 要 求. 英 国 内 阁 知 道 此 事 后, 请 来 统 计 学 家 利 用 线 性 回 归 模 型 对 出 动 飞 机 与 战 损 飞 机 的 数 据 进 行 了 统 计 分 析, 发 现 如 果 飞 机 的 补 充 率 和 损 失 率 不 变, 飞 机 数 量 的 下 降 是 非 常 快 的 : 以 现 在 的 损 失 率 损 失 两 周, 英 国 在 法 国 的 飓 风 式 战 斗 机 就 一 架 也 不 存 在 了. 内 阁 希 望 丘 吉 尔 收 回 他 的 决 定. 最 后, 丘 吉 尔 同 意 了 内 阁 的 要 求, 并 在 几 天 内 撤 回 了 在 法 国 的 飓 风 式 战 机, 只 留 下 了 三 个 中 队, 为 以 后 英 国 本 土 的 保 卫 战 保 留 了 实 力 ( 读 者 ). 线 性 回 归 方 法 是 统 计 学 中 的 常 用 方 法, 是 处 理 变 量 之 间 线 性 关 系 的 重 要 方 法. 数 据 的 相 关 性 例 在 实 际 问 题 中, 我 们 经 常 遇 到 有 相 关 关 系 的 变 量. 比 如 讲 身 高 与 体 重 的 关 系 时, 虽 然 身 高 不 能 确 定 体 重, 但 总 的 来 讲, 身 越 高, 体 越 重. 227
234 228 第 九 章 线 性 回 归 分 析 在 考 虑 某 一 个 特 定 地 区 居 民 的 身 高 和 体 重 的 关 系 时, 用 x 表 示 身 高, 用 y 表 示 体 重, 总 体 来 讲, y 随 着 x 增 大 一 般 也 会 增 大. 这 时 我 们 称 y 和 x 有 相 关 关 系. 例 1.1 一 位 社 会 学 家 对 他 所 在 城 市 进 行 了 随 机 抽 样 调 查, 得 到 了 36 对 新 婚 夫 妇 的 身 高 数 据 ( 单 位 :cm). 数 据 对 (x j, y j ) 中, x j 是 第 j 对 夫 妇 中 丈 夫 的 身 高, y j 是 妻 子 的 身 高. 我 们 称 数 据 对 (x j, y j ), j = 1, 2,, 36 为 样 本 或 观 测 数 据. 这 时, 样 本 是 直 角 坐 标 系 中 的 36 个 点, 将 这 36 个 点 画 在 坐 标 系 上 得 到 观 测 数 据 的 散 点 图 (scatter diagram). 横 坐 标 是 x, 纵 坐 标 是 y. 丈 夫 与 妻 子 身 高 的 散 点 图 Wife height Husband height 样 本 相 关 系 数 样 本 相 关 系 数 无 论 是 从 抽 样 调 查 中 得 到 的 成 对 数 据, 还 是 从 科 学 试 验, 工 农 业 生 产 中 得 到 的 成 对 数 据, 在 统 计 学 中 也 都 称 为 观 测 数 据 或 样 本, 数 据 对 的 个 数 称 为 样 本 量. 样 本 量 是 n 的 成 对 观 测 数 据 是 用 (x 1, y 1 ), (x 2, y 2 ),, (x n, y n ) (1.1)
235 9.1 数 据 的 相 关 性 229 表 示 的. 这 里, 对 固 定 的 j, x j 和 y j 或 来 自 相 同 的 个 体, 或 是 同 一 次 试 验 的 观 测 数 据. 对 i j, (x i, y i ) 和 (x j, y j ) 或 来 自 不 同 的 个 体, 或 是 不 同 次 试 验 的 观 测 数 据. 对 于 观 测 数 据 (1.1), 我 们 用 {x j } 表 示 数 据 x 1, x 2,, x n, 用 {y j } 表 示 数 据 y 1, y 2,, y n. 用 x 和 ȳ 分 别 表 示 {x j } 和 {y j } 的 样 本 均 值. 用 s 2 x 表 示 {x j } 的 样 本 方 差, 用 s 2 y 表 示 {y j } 的 样 本 方 差. 对 n > 2, 有 x = 1 n n j=1 x j, s 2 x = 1 n 1 n j=1 (x j x) 2, ȳ = 1 n n j=1 y j s 2 y = 1 n 1 n j=1 (y j ȳ) 2. s x = s 2 x, s y = s 2 y 分 别 是 样 本 标 准 差. 再 引 入 样 本 协 方 差 定 义 1.1 (1) 当 s x s y 0, 我 们 称 s xy = 1 n 1 n (x j x)(y j ȳ). (1.2) j=1 ˆρ xy = s xy s x s y 为 {x j } 和 {y j } 的 样 本 相 关 系 数, (2) 当 ˆρ xy > 0, 我 们 称 {x j } 和 {y j } 正 相 关, (3) 当 ˆρ xy < 0, 我 们 称 {x j } 和 {y j } 负 相 关, (4) 当 ˆρ xy = 0, 我 们 称 {x j } 和 {y j } 不 相 关. 大 量 的 成 对 数 据 都 显 示 了 相 关 系 数 ˆρ xy 的 以 下 性 质 ( 参 考 习 题 9.1): 1 ˆρ xy 总 是 在 区 间 [ 1, 1] 中 取 值, 2 当 ˆρ xy = 1, 样 本 (x j, y j ), j = 1, 2,, n, 在 同 一 条 直 线 上, 3 当 ˆρ xy 接 近 于 1 时, x 增 加, y 也 倾 向 于 增 加, 这 时 数 据 (1.1) 分 散 在 一 条 上 升 的 直 线 附 近,
236 230 第 九 章 线 性 回 归 分 析 4 当 ˆρ xy 接 近 于 1 时, x 增 加, y 倾 向 于 减 少, 这 时 数 据 (1.1) 分 散 在 一 条 减 少 的 直 线 附 近. 在 实 际 问 题 中, 当 ˆρ xy 0.8, 可 以 认 为 {x j } 和 {y j } 高 度 相 关 ; 当 0.5 ˆρ xy < 0.8, 可 以 认 为 {x j } 和 {y j } 中 度 相 关 ; 当 0.3 ˆρ xy < 0.5, 可 以 认 为 {x j } 和 {y j } 低 度 相 关 ; 当 ˆρ xy < 0.3, 可 以 认 为 {x j } 和 {y j } 相 关 性 极 弱. 见 演 示 容 易 计 算 出 例 1.1 中 丈 夫 和 妻 子 身 高 的 样 本 均 值 分 别 是 x = , ȳ = , 样 本 标 准 差 s x = , s y = , 样 本 协 方 差 s xy = , 样 本 相 关 系 数 ˆρ xy = s xy s x s y = 说 明 丈 夫 和 妻 子 的 身 高 是 中 度 相 关 的 粗 略 地 讲, 丈 夫 的 身 高 越 高, 妻 子 的 身 高 也 会 较 高 一 点. 或 说 妻 子 身 高 越 高, 丈 夫 的 身 高 也 会 较 高 一 点 相 关 性 检 验 相 关 性 检 验 如 果 随 机 向 量 (X j, Y j ) 独 立 同 分 布, 并 且 和 (X, Y ) 同 分 布, 就 称 (X j, Y j ) 及 其 观 测 值 (x j, y j ), j = 1, 2,, n, 是 来 自 总 体 (X, Y ) 的 样 本. 如 果 (x j, y j ), j = 1, 2,, n, 是 来 自 总 体 (X, Y ) 的 样 本, ρ xy = E[(X EX)(Y EY )] Var(X)Var(Y ) 是 X, Y 的 相 关 系 数, 用 强 大 数 律 可 以 证 明 样 本 相 关 系 数 是 ρ xy 的 强 相 合 估 计. ˆρ xy = s xy s x s y
237 y 9.1 数 据 的 相 关 性 231 在 实 际 问 题 中, 有 时 需 要 检 验 H 0 : ρ xy = 0 vs H 1 : ρ xy 0. (1.3) 如 果 否 定 了 H 0, 就 认 为 X, Y 是 相 关 的. 当 总 体 (X, Y ) 服 从 联 合 正 态 分 布, H 0 成 立 时, 可 以 证 明 n 2 T = ˆρ xy t(n 2). 1 ˆρ 2 xy (1.4) 因 为 H 0 成 立 时, ˆρ xy, 从 而 T 应 当 取 值 较 小, 于 是 假 设 (1.3) 的 显 著 性 水 平 为 α 的 拒 绝 域 是 W = { T > t α/2 (n 2)}. (1.5) 例 1.2 在 例 1.1 中, ˆρ xy = 假 设 夫 妻 的 身 高 总 体 (X, Y ) 服 从 联 合 正 态 分 布. 经 过 计 算 得 到 n 2 T = ˆρ xy 1 ˆρ 2 xy = 查 表 得 到 t 0.05/2 (36 2) = t (34) = < T. 检 验 的 结 果 是 显 著 的, 所 以 认 为 X, Y 是 相 关 的. 尽 管 拒 绝 域 (1.5) 是 针 对 X, Y 服 从 正 态 分 布 得 到 的, 但 是 对 于 非 正 态 分 布 的 情 况, 当 n 较 大, 人 们 也 利 用 (1.5) 作 为 假 设 (1.3) 的 拒 绝 域. 还 应 当 指 出, ˆρ xy = 0 只 是 表 示 X, Y 之 间 没 有 线 性 关 系, 并 不 表 示 X 和 Y 没 有 关 系. 因 为 这 时 X,Y 之 间 可 能 存 在 着 非 线 性 关 系, 看 下 面 的 例 子. 例 x
238 232 第 九 章 线 性 回 归 分 析 给 定 来 自 总 体 X 的 30 个 样 本. 取 y j = x 2 j, 则 (x j, y j ) 是 来 自 总 体 (X, Y ) = (X, X 2 ) 的 30 个 样 本. 这 些 样 本 都 在 抛 物 线 y = x 2 上, 因 而 x, y 存 在 非 线 性 函 数 关 系. 见 图 形 可 以 计 算 出 ˆρ xy = 这 时, n 2 T = ˆρ xy 1 ˆρ 2 xy = 查 表 得 到 t 0.05/2 (30 2) = t (28) = > T. 所 以 不 能 否 定 H 0 : ρ xy = 0. 检 验 的 P 值 是 P ( T 28 > ) = 2[1 P (T 28 < )] 0.97, 所 以 应 当 承 认 H 0 : ρ xy = 0. 即 {x j }, {y j } 不 存 在 线 性 关 系. 回 归 直 线 9.2 回 归 直 线 当 {x j } 和 {y j } 高 度 相 关 时, 我 们 已 经 知 道 数 据 (x 1, y 1 ), (x 2, y 2 ),, (x n, y n ) 会 分 散 在 一 条 直 线 的 附 近. 我 们 将 这 条 直 线 叫 做 回 归 直 线, 下 面 就 寻 找 这 条 直 线. 在 直 角 坐 标 系 中, 两 个 点 (x 1, y 1 ), (x 2, y 2 ) 可 以 决 定 一 条 直 线. l : y = y 2 y 1 x 2 x 1 (x x 1 ) + y 1, 当 x 2 x 1. 这 时, 两 个 点 都 在 直 线 上, 所 以 这 两 个 点 平 均 距 离 直 线 l 最 近.
239 9.2 回 归 直 线 B C 5 A 给 定 三 对 数 据, (x 1, y 1 ), (x 2, y 2 ), (x 3, y 3 ), 当 x 1, x 2, x 3 不 全 相 同, 我 们 也 求 一 条 直 线 l, 使 得 以 上 三 个 点 距 离 直 线 l 平 均 最 近. 用 l : y = a + bx 表 示 要 求 的 直 线, 在 平 行 于 y 轴 的 方 向, 做 以 上 三 点 到 直 线 l 的 连 线, 交 点 A, B, C 的 坐 标 分 别 是 A : (x 1, a + bx 1 ), B : (x 2, a + bx 2 ), C : (x 3, a + bx 3 ). 三 对 观 测 数 据 和 交 点 A, B, C 的 距 离 分 别 是 y 1 (a + bx 1 ), y 2 (a + bx 2 ), y 3 (a + bx 3 ). 我 们 用 这 三 个 距 离 的 平 方 和 (y 1 a bx 1 ) 2 + (y 2 a bx 2 ) 2 + (y 3 a bx 3 ) 2. 衡 量 这 三 对 观 测 数 据 远 离 直 线 l 的 程 度. 如 果 a, b 使 得 Q(a, b) = (y 1 a bx 1 ) 2 + (y 2 a bx 2 ) 2 + (y 3 a bx 3 ) 2 达 到 最 小 就 称 直 线 l : y = a + bx 是 数 据 的 回 归 直 线.
240 234 第 九 章 线 性 回 归 分 析 一 般 地 要 为 样 本 量 是 n 的 观 测 数 据, (x 1, y 1 ), (x 2, y 2 ),, (x n, y n ), 其 中 的 x j 不 全 相 同, 建 立 回 归 直 线 l : y = a + bx, 使 之 与 观 测 数 据 平 均 最 近 时, 也 采 用 相 同 的 方 法. 沿 平 行 于 y 轴 的 方 向, 点 (x j, y j ) 到 它 与 l 的 交 点 的 距 离 是 y j (a + bx j ), j = 1, 2,, n. 我 们 用 这 些 距 离 的 平 方 和 Q(a, b) =(y 1 a bx 1 ) 2 + (y 2 a bx 2 ) (y n a bx n ) 2 (2.1) 衡 量 观 测 数 据 远 离 直 线 l 的 程 度. 如 果 常 数 a, b 使 得 Q(a, b) 达 到 最 小, 就 称 直 线 l : y = a + bx 是 {x j } 与 {y j } 的 回 归 直 线 (regression line). 得 到 了 回 归 直 线 后, 只 要 {x j } 与 {y j } 相 关 性 较 强, 对 于 新 的 x, 就 可 以 用 回 归 直 线 上 的 点 ŷ = a + bx 作 为 y 的 预 测 值. 事 实 证 明 : ˆρ xy 越 接 近 于 1, 预 测 就 越 准 确 ; x 越 接 近 x, 预 测 也 越 好. 最 小 二 乘 解 定 理 2.1 如 果 {x j } 不 全 相 同, 则 Q(a, b) 的 最 小 值 点 是 s xy (xi x)(y i ȳ) ˆb = =, s 2 x (xi x) 2 â =ȳ ˆb x. (2.2) 称 â, ˆb 是 回 归 直 线 系 数 a, b 的 最 小 二 乘 估 计 证 明 将 Q(a, b) 右 端 的 每 一 项 对 a, b 进 行 二 项 展 开, 就 知 道 Q(a, b) 是 a, b 的 二 元 二 次 多 项 式, 二 次 项 系 数 大 于 零. Q(a, b) 是 开 口 向 上 的 椭 圆 抛 物 面, 最 小 值 唯 一 存 在, 并 且 可 以 令 两 个 一 阶 偏 导 数 为 零 得 到 最 小 值 点.
241 9.2 回 归 直 线 235 由 Q n a = 2 (y j a bx j ) = 0, j=1 Q n b = 2 (y j a bx j )x j = 0, (2.3) j=1 得 到 方 程 组 j=1 ȳ a b x =0; n n y j x j an x b x 2 j =0, j=1 j=1 把 前 式 中 a 代 入 后 式, 并 利 用 n n y j x j n x ȳ = (y j ȳ)(x j x), n x 2 j n x x = j=1 j=1 j=1 n (x j x) 2 得 xj y j n(ȳ b x) x b x 2 j =0 xj y j n xȳ b( x 2 j n x 2 ) =0 解 出 ˆb = n j=1 y jx j n x ȳ n j=1 x2 j n x2 â =ȳ ˆb x. = s xy, s 2 x 于 是 直 线 l : ŷ = â + ˆbx 为 数 据 (x j, y j ), j = 1, 2,, n 的 回 归 直 线. 给 了 任 何 另 外 的 x, 当 ˆρ xy 接 近 于 1 时, 我 们 可 以 用 回 归 直 线 l 上 的 点 ŷ = â + ˆbx (2.4) 对 和 x 相 应 的 y 作 出 预 测.
242 236 第 九 章 线 性 回 归 分 析 我 们 又 称 (2.4) 为 经 验 公 式. 从 (2.2) 的 第 二 式 知 道, ( x, ȳ) 总 在 回 归 直 线 上. 因 为 â, ˆb 是 极 小 化 a, b 的 二 次 函 数 Q(a, b) 得 到 的, 所 以 又 称 它 们 是 a, b 的 最 小 二 乘 估 计 (least square estimator). 例 2.1 容 易 计 算 例 1.1 中 的 x = , ȳ = , s 2 x = , s xy = , 于 是 得 到 ˆb = = , â = ȳ ˆb x = 回 归 直 线 是 ŷ = x. 9.3 一 元 线 性 回 归 一 元 线 性 回 归 模 型 对 数 据 (x j, y j ) 建 立 了 回 归 直 线 l 后, 我 们 用 回 归 直 线 l 上 的 作 为 y j 的 预 测 值, 预 测 误 差 是 ŷ j = â + ˆbx j ˆε j = y j ŷ j = y j â ˆbx j. 我 们 也 称 ˆε j 为 残 差, 称 残 差 的 平 方 和 Q = 为 残 差 平 方 和. n n ˆε 2 j = (y j â ˆbx j ) 2 = Q(â, ˆb) (3.1) j=1 j=1 Q 较 小 时, l 代 表 了 x, y 之 间 的 线 性 关 系 : y j = â + ˆbx j + ˆε j, j = 1, 2,, n.
243 9.3 一 元 线 性 回 归 237 为 了 统 计 分 析 的 方 便, 我 们 认 为 成 对 数 据 (x j, y j ) 满 足 模 型 Y j = a + bx j + ε j, j = 1, 2,, n. (3.2) 其 中 的 a, b 是 未 知 常 数, {ε j } 是 独 立 同 分 布 的 随 机 变 量, 服 从 正 态 分 布 N(0, σ 2 ). 这 里 σ 2 是 未 知 正 数, 代 表 了 随 机 误 差 的 强 弱. σ 2 越 大, 说 明 随 机 误 差 越 强. 模 型 (3.2) 称 为 一 元 线 性 回 归 模 型 (linear regression model). 其 中 a, b 分 别 是 直 线 y = a + bx 的 截 距 和 斜 率, 称 为 回 归 参 数. 在 模 型 (3.2) 中, 我 们 称 x j 是 设 计 变 量 或 输 入 变 量, 它 表 示 得 到 Y j 时 的 输 入 条 件. 我 们 将 x j 看 作 常 量, 不 做 随 机 变 量 处 理. Y j 是 观 测 变 量, 它 是 输 入 条 件 x j 后 得 到 的 观 测 结 果. 我 们 称 (x j, y j ) 是 来 自 一 元 线 性 回 归 模 型 的 样 本. 给 定 来 自 一 元 线 性 回 归 模 型 (3.2) 的 样 本 (x j, y j ), 我 们 的 问 题 是 需 要 估 计 出 回 归 参 数 a, b 和 σ 最 大 似 然 估 计 和 最 小 二 乘 估 计 回 归 参 数 的 最 大 似 然 估 计 设 (x j, Y j ) 满 足 一 元 线 性 回 归 模 型 (3.2), 则 Y j, j = 1, 2,, n 相 互 独 立, 都 服 从 正 态 分 布. 利 用 知 道 Y j N(a + bx j, σ 2 ). EY j = a + bx j, Var(Y j ) = Var(ε j ) = σ 2, 于 是 得 到 基 于 Y 1, Y 2,, Y n 的 似 然 函 数 n L(a, b, σ 2 1 ( ) = exp 1 ) 2πσ 2 2σ (y 2 j a bx j ) 2 j=1 其 中 的 Q(a, b) 由 (2.1) 定 义. ( 1 ) n ( = exp 1 n ) (y 2πσ 2 2σ 2 j a bx j ) 2 j=1 ( 1 ) n ( = exp 1 ) 2πσ 2 2σ Q(a, b). (3.3) 2
244 238 第 九 章 线 性 回 归 分 析 对 数 似 然 函 数 是 解 方 程 组 l(a, b, σ 2 ) = 1 2σ 2 Q(a, b) n 2 ln σ2 n ln 2π. l = 1 Q = 0, a 2σ 2 a l = 1 Q = 0, b 2σ 2 b l = 1 Q(a, b) n = 0, σ 2 2σ 4 2σ 2 可 以 得 到 a, b, σ 2 的 最 大 似 然 估 计. 注 意 前 两 个 方 程 和 (2.3) 是 等 价 的, 所 以 当 s 2 x 0, 从 前 两 个 方 程 得 到 a, b 的 最 大 似 然 估 计 s xy ˆb =, â = ȳ s ˆb x. (3.4) 2 x 将 â, ˆb 代 入 第 三 个 方 程, 得 到 σ 2 1 的 最 大 似 然 估 计 是 Q(â, ˆb). n 因 为 数 学 上 可 以 证 明 EQ(â, ˆb) = (n 2)σ 2, 所 以 σ 2 的 最 大 似 然 估 计 不 是 σ 2 无 偏 估 计, 为 了 使 用 无 偏 估 计, 我 们 以 后 用 作 为 σ 2 的 估 计. 这 时 有 Eˆσ 2 = σ 2. ˆσ 2 = 1 n 2 Q(â, ˆb) (3.5) 容 易 看 出, (a, b) 的 最 小 二 乘 估 计 和 最 大 似 然 估 计 是 相 同 的. 引 入 记 号 : 则 n l yy = (y i ȳ) 2 i=1 n l xx = (x i x) 2 i=1 n l xy = (x i x)(y i ȳ) Q = i=1 n (y i ŷ i ) 2 i=1 ˆb = l xy l xx, σ 2 = 1 n 2 Q
245 9.3 一 元 线 性 回 归 239 回 归 参 数 估 计 的 性 质 以 后 总 设 s 2 x 0. 下 面 是 这 些 估 计 量 的 基 本 性 质. 定 理 3.1 设 (x j, Y j ), j = 1, 2,, n, 满 足 一 元 线 性 回 归 模 型 (3.2), â, ˆb, ˆσ 2 由 (3.4) 和 (3.5) 定 义, n > 2 时, 有 (1) (2) (3) ˆb N ( b, σ2 l xx ), â N (a, [ 1 ) n + x2 ]σ 2, l xx n 2 σ 2 ˆσ 2 χ 2 (n 2), (4) Ȳ, ˆb, ˆσ 2 相 互 独 立. 定 理 证 明 (1) 对 任 何 常 数 c, 有 n (x j x)c = (n x n x)c = 0. (3.6) j=1 利 用 (3.6) 得 到 1 1 ˆb = s 2 x n 1 = 1 s 2 x 1 n 1 n (x j x)(y j Ȳ ) j=1 n (x j x)y j. (3.7) j=1 由 于 ˆb 已 经 是 相 互 独 立 的 正 态 随 机 变 量 Y j 的 线 性 组 合, 所 以 服 从 正 态 分 布. 只 需 要 再 计 算 它 的 数 学 期 望 和 方 差.
246 240 第 九 章 线 性 回 归 分 析 利 用 Y j N(a + bx j, σ 2 ), (3.6) 和 (3.7), 得 到 Eˆb = 1 1 n (x s 2 j x)ey j x n 1 j=1 = 1 1 n (x s 2 j x)(a + bx j ) x n 1 j=1 = 1 b n (x s 2 j x)(x j x) x n 1 = b s 2 s 2 x = b. x 因 为 Y 1, Y 2,, Y n 相 互 独 立, 有 共 同 的 方 差 σ 2, 利 用 (3.7) 得 到 Var(ˆb) = 1 1 n (x s 4 x (n 1) 2 j x) 2 Var(Y j ) (2) = 1 s 4 x j=1 j=1 1 (n 1) s2 xσ 2 = 设 ε n = n j=1 ε j/n, 在 (3.2): 两 边 求 样 本 平 均 得 到 σ 2 (n 1)s 2 x = σ2 l xx. Y j = a + bx j + ε j, j = 1, 2,, n. (3.2) Ȳ = a + b x + ε n, EȲ = a + b x. (3.8) 因 为 Ȳ 和 ˆb 都 是 Y 1, Y 2,, Y n 的 线 性 组 合, 所 以 â = Ȳ ˆb x 也 是 Y 1, Y 2,, Y n 的 线 性 组 合, 从 而 也 服 从 正 态 分 布. 再 计 算 它 的 均 值 和 方 差 如 下. 利 用 (3.8) 得 到 Eâ =E(Ȳ ˆb x) = EȲ Eˆb x =a + b x b x = a. 最 后 再 利 用 得 到 â = Ȳ ˆb x Var(â) =Var(Ȳ ) + Var(ˆb x) 2 xcov(ȳ, ˆb) = σ2 n + x2 σ 2 2 xcov(ȳ (n 1)s, ˆb). 2 x
247 9.3 一 元 线 性 回 归 241 由 于 从 (3.7) 得 到 Cov(Ȳ, ˆb) ( 1 n 1 n ) =Cov Y j, (x n (n 1)s 2 j x)y j j=1 x j=1 1 ( n n ) = Cov Y n(n 1)s 2 j, (x j x)y j x j=1 j=1 1 n = (x n(n 1)s 2 j x)σ 2 x =0, j=1 这 说 明 Ȳ 和 ˆb 独 立 于 是 有 ( 1 Var(â) = n + x 2 ) σ 2. (n 1)s 2 x 平 方 和 分 解 公 式 平 方 和 分 解 公 式 最 小 二 乘 回 归 直 线 :l : ŷ = â + ˆbx 总 平 方 和 为 因 变 量 y 的 变 动 情 况, 代 表 了 y 包 含 的 信 息 多 少 : l yy = n (y i ȳ) 2 i=1 残 差 平 方 和 代 表 用 直 线 解 释 y 与 x 间 关 系 的 接 近 程 度 : Q = n (y i ŷ) 2 i=1 回 归 平 方 和 是 由 x 的 值 所 确 定 的 y 的 变 化 情 况 : lŷŷ = n (ŷ i ȳ) 2 j=1 注 意 1 n n ŷ i 1 n i=1 n (â + ˆbx i ) = â + ˆb x = ȳ i=1
248 242 第 九 章 线 性 回 归 分 析 另 外 其 中 lŷŷ = i=1 n [(â + ˆbx i ) (â + ˆb x)] n 2 = [ˆb(x i x)] 2 = ˆb 2 l xx i=1 i=1 n l xx = (x i x) 2 i=1 总 平 方 和 可 以 分 解 为 回 归 平 方 和 与 残 差 平 方 和 : l yy = lŷŷ + Q = ˆb 2 l xx + Q (3.12) 证 明 只 要 看 y i ȳ = (y i ŷ i ) + (ŷ i ȳ) 并 证 明 交 叉 项 为 零 : n n (y i ŷ i )(ŷ i ȳ) = [(y i ȳ) (ŷ i ȳ)](ŷ i ȳ) = =ˆb n (y i ȳ)(ŷ i ȳ) i=1 i=1 n (ŷ i ȳ) 2 i=1 n (y i ȳ)(x i x) ˆb n 2 (x i x) 2 = 0 i=1 i= 斜 率 b 的 检 验 斜 率 b 的 检 验 当 斜 率 b = 0 时, 回 归 直 线 退 化 为 l : y = a, 这 时 x 对 y 没 有 影 响, 线 性 回 归 没 有 意 义 只 有 b 0 的 回 归 结 果 才 是 有 意 义 的 检 验 : H 0 : b = 0 vs H a : b 0 直 观 构 造 否 定 域 : 当 ˆb 很 大 时 拒 绝 H 0 需 要 知 道 ˆb 在 H 0 下 的 分 布 才 能 给 出 很 大 的 临 界 值 定 理 3.1 说 明 ˆb N(b, σ 2 /l xx ); (n 2)ˆσ 2 /σ 2 χ 2 (n 2) 且 与 ˆb 独 立, 说 明 在 H 0 下 T = ˆb ˆσ/ l xx t(n 2)
249 9.3 一 元 线 性 回 归 243 于 是 水 平 α 的 否 定 域 为 W = { T > t α/2 (n 2)} 回 归 系 数 检 验 的 例 子 对 例 1.1 的 数 据, 检 验 b 是 否 等 于 零 计 算 得 ˆb = , ˆσ 2 = , l xx = , n = 36, t (34) = 2.032, T = 6.14 落 入 否 定 域, 应 拒 绝 H 0 : b = 预 测 的 置 信 区 间 预 测 的 置 信 区 间 回 归 直 线 l : ŷ = â + ˆbx 对 于 新 的 输 入 条 件 x 0, 预 测 ŷ 0 = â + ˆbx 0 未 知 的 真 实 值 为 Y 0 = a + bx 0 + ε 0 要 得 到 Y 0 的 置 信 区 间, 必 须 知 道 Y 0 ŷ 0 的 概 率 分 布. 引 入 η 0 = ˆσ n + (x 0 x) 2 l xx. 定 理 3.2 (3.2) 的 数 据, 则 利 用 定 理 3.2 和 如 果 (x j, y j ), j = 1, 2,, n, 是 来 自 一 元 线 性 回 归 模 型 Y 0 ŷ 0 η 0 t(n 2). (3.21) P ( ) ŷ 0 t α/2 (n 2)η 0 Y 0 ŷ 0 + t α/2 (n 2)η 0 ( Y0 ŷ 0 ) =P t α/2 (n 2) η 0 =1 α,
250 244 第 九 章 线 性 回 归 分 析 得 到 Y 0 的 置 信 度 为 1 α 的 置 信 区 间 [ ŷ 0 t α/2 (n 2)η 0, ŷ 0 + t α/2 (n 2)η 0 ]. (3.22) 置 信 区 间 的 长 度 是 L =2t α/2 (n 2)η 0 =2t α/2 (n 2)ˆσ n + (x 0 x) 2 l xx. 在 相 同 的 置 信 度 下, 置 信 区 间 的 长 度 越 小 越 好. 相 同 的 置 信 度 下, n 越 大, L 越 小 ; l xx 越 大, L 越 小 ; x 0 离 x 越 近,L 越 小 ; ˆσ 越 小, L 越 小. 9.4 多 元 线 性 回 归
證 明 : 令 φ(x f(x, ydy, 則 φ(x + x φ(x x f x (ξ, ydy f x (ξ, y f x (x, y dy f x (x, ydy f(x + x, y f(x, y d dy f x (x, ydy x f x (x, ydy, ξ ξ(y 介 於 x, x
微 分 與 積 分 的 交 換 積 分 設 f 在 [a, b] [, d] 上 連 續, 問 d dx f(x, y? f(x, ydy x 首 先 (1 式 兩 邊 必 須 有 意 義 f(x, ydy 必 須 對 x 可 導 若 f 及 x f(x, ydy 積 分 必 須 存 在 x f 在 [a, b] [, d] 上 連 續, 則 ( 及 (3 式 成 立, 下 面 的 定 理 告 訴
Microsoft Word - Probability.doc
十 一 機 率 (Probability).... 分 立 變 值 (discrete variate) 及 連 續 變 值 (continuous variate)..... 連 續 變 質 (Continuous variate)/ 連 續 變 數 (Continuous variable)..... 分 立 變 值 (Discrete variate)/ 間 斷 變 數 (Discrete variable)....
Microsoft Word - BD-QH2004.doc
从 线 性 方 程 谈 起 ( 清 华 大 学 数 学 科 学 系 章 梅 荣 教 授 ) 烟 台 大 学 与 北 京 大 学 和 清 华 大 学 有 着 密 切 的 联 系, 我 在 北 大 读 书 时 的 不 少 同 学 朋 友 还 在 烟 台 大 学 工 作 我 应 邀 来 烟 台 大 学 作 这 个 演 讲, 受 到 了 朋 友 们 的 热 情 接 待, 我 感 到 非 常 高 兴, 也 深
標準 BIG 中文字型碼表 A 0 9 B C D E F 一 乙 丁 七 乃 九 了 二 人 儿 入 八 几 刀 刁 力 匕 十 卜 又 三 下 丈 上 丫 丸 凡 久 么 也 乞 于 亡 兀 刃 勺 千 叉 口 土 士 夕 大 女 子 孑 孓 寸 小 尢 尸 山 川 工 己 已 巳 巾 干 廾
標準 BIG 中文字型碼表 A 0 9 B C D E F B C D ± E F A 0 9 B C D E F 兙 兛 兞 兝 兡 兣 嗧 瓩 糎 0 B 9 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ C Ⅷ Ⅸ Ⅹ 〡 〢 〣 〤 〥 〦 〧 〨 〩 十 卄 卅 D B C D E F G H I J K L M N O P Q E R S T U V W X Y Z a b c d e f g F h i
untitled
5 55-% 8-8 8-5% - 7 7 U- n n lim n n n n lim n n n n un n n k k n k u n k k k n k ` n k u n k k n n n lim n n.7. 8 f f e f f f e. f f e f f f f f f f [ e ] f e e www.tsinghuatutor.om 5 79 755 f f f f [
總目186-運輸署
管 制 人 員 : 運 輸 署 署 長 會 交 代 本 總 目 下 的 開 支 二 零 一 六 至 一 七 年 度 預 算... 28.585 億 元 二 零 一 六 至 一 七 年 度 的 編 制 上 限 ( 按 薪 級 中 點 估 計 的 年 薪 值 ) 相 等 於 由 二 零 一 六 年 三 月 三 十 一 日 預 算 設 有 的 1 5 3 6 個 非 首 長 級 職 位, 增 至 二 零
微 分 方 程 是 经 典 数 学 的 一 个 重 要 分 支, 常 用 来 描 述 随 时 间 变 化 的 动 态 系 统, 被 广 泛 应 用 于 物 理 学 工 程 数 学 和 经 济 学 等 领 域. 实 际 上, 系 统 在 随 时 间 的 变 化 过 程 中, 经 常 会 受 到 一 些
不 确 定 微 分 方 程 研 究 综 述 李 圣 国, 彭 锦 华 中 师 范 大 学 数 统 学 院, 湖 北 4379 黄 冈 师 范 学 院 不 确 定 系 统 研 究 所, 湖 北 438 [email protected] 摘 要 : 不 确 定 微 分 方 程 是 关 于 不 确 定 过 程 的 一 类 微 分 方 程, 其 解 也 是 不 确 定 过 程. 本 文 主
() 求 其 能 级 和 本 征 函 数 ; V, α < ϕ < () 加 ˆ H ' = V ( ϕ ) = V, < ϕ < α 微 扰,, 其 他 求 对 最 低 的 两 能 级 的 一 级 微 扰 修 正 注 : 在 坐 标 系 中 = ( r ) + + r r r r ϕ, < x <
中 国 科 学 院 研 究 生 院 年 招 收 攻 读 硕 士 研 究 生 学 位 研 究 生 入 学 统 一 考 试 试 题 第 一 题 : 选 择 和 简 答 ( 5' 8 = 4' ) 试 题 名 称 : 量 子 力 学. 氢 原 子 的 基 态 电 离 能 是 3.6ev, 问 处 于 第 一 激 发 态 的 氢 原 子 电 离 能 是 ( 3.4ev) 34. 普 朗 克 常 数 h 等
Microsoft Word - 中三選科指南 2014 subject
必 修 科 目 簡 介 < < < 1. 中 文 > > > 本 科 的 公 開 評 核 以 課 程 發 展 議 會 與 香 港 考 試 及 評 核 局 聯 合 編 訂 的 中 國 語 文 科 課 程 及 評 估 指 引 ( 中 四 至 中 六 ) 為 根 據 目 標 本 科 主 要 評 核 考 生 : (1) 讀 寫 聽 說 能 力 思 維 能 力 審 美 能 力 和 自 學 能 力 ; (2)
QWWTML
好 玩 的 数 学 张 景 中 主 编 趣 味 随 机 问 题 孙 荣 恒 著 北 京 内 容 简 介 本 书 分 为 概 率 论 数 理 统 计 随 机 过 程 三 部 分, 每 部 分 包 含 若 干 个 趣 味 问 题 其 中 有 分 赌 注 问 题 巴 拿 赫 火 柴 盒 问 题 波 利 亚 坛 子 问 题 巴 格 达 窃 贼 问 题 赌 徒 输 光 问 题 群 体 ( 氏 族 ) 灭 绝
13WuYW_4questions
EuMath (/008 來 自 身 邊 的 四 個 小 問 題 胡 奕 偉 麗 水 學 院 數 學 系 這 是 一 組 來 自 筆 者 身 邊 的 問 題 問 題 平 凡, 問 題 簡 單, 問 題 3 略 見 抽 象, 問 題 4 則 源 遠 流 長, 被 稱 為 亞 里 斯 多 德 旋 輪 悖 論 平 凡 的 問 題 呼 喚 靈 活 的 思 維, 處 理 方 法 要 創 新 ; 貌 似 簡 單
Microsoft Word - 001.pdf.doc
閱 讀 理 解 和 寫 作 內 容 1. 閱 讀 理 解 與 寫 作 教 學 策 略 一 覽 表 1 2. 詞 語 5 教 學 策 略 5 認 識 詞 語 類 別 6 名 詞 7 動 詞 18 形 容 詞 35 副 詞 45 量 詞 51 理 解 抽 象 詞 語 56 書 面 語 58 詞 語 遊 戲 63 3. 句 子 69 教 學 策 略 69 句 子 結 構 70 擴 張 句 子 79 香 港
ABC Amber Text Converter
释 迦 牟 尼 佛 广 传 白 莲 花 论 全 知 麦 彭 仁 波 切 著 下 一 页 Page 1 一 功 德 品 上 一 页 首 页 下 一 页 一 功 德 品 总 体 说 来, 以 业 力 感 召 而 轮 回 于 三 界 中 之 众 生, 无 有 能 摆 脱 三 大 痛 苦 抛 开 束 缚 的 自 由, 因 而 也 得 不 到 任 何 究 竟 的 安 乐 自 在 正 因 为 他 们 从 无 始
天主教永年高級中學綜合高中課程手冊目錄
天 主 教 永 年 高 級 中 學 綜 合 高 中 課 程 手 冊 目 錄 壹 學 校 背 景. 貳 教 育 理 念 與 教 育 目 標. 3 一 規 劃 理 念...3 二 教 育 目 標...3 參 畢 業 要 求. 5 一 總 學 分 數...5 二 必 選 修 學 分 數...5 三 必 須 參 加 活 動...9 四 成 績 評 量 方 式...9 肆 課 程 概 述.. 9 一 課 程
:,,,, ( CIP ) /,. :, ISBN CIP ( 2001) : : 127, : : : ht t p: / / www. nwpup. com : :
:,,,, ( CIP ) /,. :, 2001. 8 ISBN 7 5612 1363 8............. 0342 CIP ( 2001) 027392 : : 127, : 710072 : 029-8493844 : ht t p: / / www. nwpup. com : : 787mm1 092mm : 19. 75 : 480 : 2001 8 1 2001 8 1 :
d y dy P x Q x y 0. dx dx d d P x Q x C C 1y1 y dx dx d d P x Q x C 1y 1 dx dx d d P x Q x C y 0. dx dx d x 1dx F. ox1 dt dt d x1 1dx1 x 0 1 F 1 dt dt d x 1dx x 0 F dt dt d y 1dy y F 0 1 F1 y x1 x. dt
Microsoft Word - chead095.doc
管 制 人 员 : 康 乐 及 文 化 事 务 署 署 长 会 交 代 本 总 目 下 的 开 支 二 O 一 O 至 一 一 年 度 预 算... 54.547 亿 元 二 O 一 O 至 一 一 年 度 的 编 制 上 限 ( 按 薪 级 中 点 估 计 的 年 薪 值 ) 相 等 于 由 二 O 一 O 年 三 月 三 十 一 日 预 算 设 有 的 8 049 个 非 首 长 级 职 位,
虎克定律實驗 楊勝斐
虎 克 定 律 實 驗 楊 勝 斐 1. 目 地 : 測 試 彈 簧 的 虎 克 定 律, 並 從 彈 簧 作 簡 諧 運 動 的 特 性, 以 求 其 彈 性 係 數. 儀 器 : 彈 簧 一 條, 砝 碼 一 組, 虎 克 定 律 儀 一 組, 碼 錶 一 個, 米 尺 一 支 圖 1. 虎 克 定 律 儀 器 全 圖 與 零 件 圖 1 圖. 彈 簧 受 外 力 產 生 反 彈 力 與 變 形
996,,,,,,, 997 7, 40 ; 998 4,,, 6, 8, 3, 5, ( ),, 3,,, ;, ;,,,,,,,,,
,, AB,, ( CIP) /, 000 ( /, ) ISBN 704009448 F47 CIP ( 000) 86786 55 00009 0064054588 ht tp www hep edu cn ht tp www hep com cn 006404048 787960/ 6 05 370 000 730,, 996,,,,,,, 997 7, 40 ; 998 4,,, 6, 8,
3.1 ( ) (Expectation) (Conditional Mean) (Median) Previous Next
3-1: 3.1 ( )........... 2 3.1.1 (Expectation)........ 2 3.1.2............. 12 3.1.3 (Conditional Mean)..... 17 3.1.4 (Median)............ 22 Previous Next First Last Back Forward 1 1.. 2. ( ): ( ), 3.
MATHEMATICAL MODELING SPONSORED BY: SHUMO.COM COMPILED BY: Mathematical Modeling Editors Group HOMEPAGE:
MATHEMATICAL MODELING S H U M O SHUMO.COM 2004. 1 Vol. 1 No. 1 MATHEMATICAL MODELING SPONSORED BY: SHUMO.COM COMPILED BY: Mathematical Modeling Editors Group www.shumo.com HOMEPAGE: www.shumo.com [email protected]
高二立體幾何
008 / 009 學 年 教 學 設 計 獎 勵 計 劃 高 二 立 體 幾 何 參 選 編 號 :C00 學 科 名 稱 : 適 用 程 度 : 高 二 簡 介 一 本 教 學 設 計 的 目 的 高 中 立 體 幾 何 的 學 習 是 學 生 較 難 理 解 而 又 非 常 重 要 的 一 個 部 分, 也 是 高 中 教 學 中 較 難 講 授 的 一 個 部 分. 像 國 內 的 聯 校
3.2 導 函 數 其 切 線 (tangent line) 為 通 過 P, 且 其 斜 率 為 m 的 直 線, 即 y = f(a) + m(x a) (3) 其 法 線 (normal line) 為 通 過 P 且 與 切 線 垂 直 的 直 線, 即 y = f(a) 1 (x a) m
第 3 章 微 分 (Differentiation) 目 錄 3.1 切 線................................... 25 3.2 導 函 數.................................. 26 3.3 微 分 公 式................................. 28 3.4 連 鎖 律..................................
untitled
常 见 支 座 形 式 及 提 供 的 反 力 : 几 何 不 变 体 系 组 成 规 律 : (1) 用 既 不 平 行 又 不 相 交 于 一 点 的 三 连 杆 连 接 两 个 刚 体 (2) 用 一 连 杆 和 不 再 同 一 直 线 上 的 铰 连 接 两 个 刚 体 (3) 不 再 同 一 直 线 上 的 铰 连 接 三 个 刚 体 (4) 一 个 刚 体 加 两 相 交 的 连 杆 拱
最新监狱管理执法全书(二百零五)
.............................. I ........................... II ................................. III 1996 1994 5 16 1 2 1997 12 29 84 1996 1994 5 16
Microsoft Word - 实验习题N.doc
数 学 实 验 实 验 练 习 题 汇 总 实 验 数 学 建 模 初 步 实 验 目 的 通 过 解 决 简 化 的 实 际 问 题 学 习 初 步 的 数 学 建 模 方 法, 培 养 建 模 意 识 实 验 内 容. 怎 样 解 决 下 面 的 实 际 问 题? 包 括 需 要 哪 些 数 据 资 料, 要 做 些 什 么 观 察 试 验 以 及 建 立 什 么 样 的 数 学 模 型 等 :
在 上 述 物 理 模 型 中 ( 三 隻 猴 子 的 重 量 都 一 樣 ), 考 慮 底 下 四 個 問 題 : () 當 三 股 力 量 處 於 平 衡 狀 態, 而 且 F 點 處 於 ABC 的 內 部 時, 利 用 力 的 向 量 和 為 零 的 觀 念, 求 角 度 AFB, BFC,
許 教 授 講 故 事 許 志 農 / 國 立 台 灣 師 範 大 學 數 學 系 在 數 學 教 學 中, 有 這 樣 一 道 數 學 應 用 問 題 : 在 哪 裡 建 學 校, 可 使 附 近 的 三 個 村 子 A, 與 C 的 三 位 學 生 到 學 校 所 走 路 程 的 和 最 小? 此 問 題 實 質 為 : 給 平 面 上 A, B, C 三 點, 試 尋 求 一 點 F, 使 距
<4D6963726F736F667420576F7264202D20C7C5C1BABDE1B9B9CAB5D1E9D6B8B5BCCAE92E646F63>
桥 梁 结 构 实 验 指 导 书 ( 土 木 水 利 学 院 土 木 工 程 专 业 桥 梁 方 向 本 科 生 适 用 ) 大 连 理 工 大 学 土 木 水 利 实 验 教 学 中 心 桥 梁 工 程 实 验 室 010 年 9 月 1 桥 梁 实 验 1 桥 梁 结 构 静 态 机 械 式 仪 表 测 试 ( 一 ) 实 验 概 况 : 为 了 使 桥 梁 设 计 更 合 理 经 济 耐 用
統計課程目錄95
統 計 課 程 10.0.1 起 統 計 學 上 課 講 義 : 上 課 內 容 老 師 自 訂 講 義 參 考 書 籍 : 統 計 學 3 版 劉 明 德 著 全 華 出 版 實 用 統 計 學 ( 第 二 版 ) 東 華 書 局 林 真 真 著 上 課 內 容 : 基 本 統 計 理 論 概 念, 由 老 師 授 課 學 生 需 配 合 練 習 成 績 計 算 : 平 時 ( 含 出 席 尚 可
Ps22Pdf
) ,,, :,,,,,,, ( CIP) /. :, 2001. 9 ISBN 7-5624-2368-7.......... TU311 CIP ( 2001) 061075 ( ) : : : : * : : 174 ( A ) : 400030 : ( 023) 65102378 65105781 : ( 023) 65103686 65105565 : http: / / www. cqup.
① ⑰ ⒀ ⒐ ② ⑱ ⒁ ⒑ 〡 〱 ぁ ③ ⑲ ⒂ ⒒ 〢 〲 あ ④ ⑳ ⒃ ⒓ 〣 〳 ぃ ⑤ ⑴ ⒄ ⒔ 〤 〴 い ⑥ ⑵ ⒅ ⒕ 々 〥 〵 ぅ ⑦ ⑶ ⒆ ⒖ 〆 〦 う ⑧ ⑷ ⒇ ⒗ 〇 〧 ぇ ⑨ ⑸ ⒈ ⒘ 〨 ⑩ ⑹ ⒉ ⒙ 〩 ⑪ ⑺ ⒊ ⒚ ⓪ ⑯ ⑿ ⒏ え ぉ お
! " @ P Q R ` a b p q r # S c s $ % & ' ( G H T U V W X d e f g h t u v w x ) I Y i y * : J Z j z + ; K [ k {, -. / < = >? L M N O \ ] ^ _ l m n o } ~ À Ð à ð ΐ Π ΰ π ϐ Ϡ ϰ Ѐ А Р а р Ѐ Ѡ Ѱ Ҁ Ґ Ҡ Ұ Ӏ Ӑ
Microsoft Word - 00教学管理手册2011-12-11mo.doc
目 录 工 作 职 责 广 西 医 科 大 学 教 务 处 工 作 职 责 3 广 西 医 科 大 学 教 学 质 量 与 教 育 研 究 中 心 工 作 职 责 8 教 学 组 织 管 理 广 西 医 科 大 学 教 学 委 员 会 章 程 13 广 西 医 科 大 学 十 二 五 专 业 建 设 规 划 16 广 西 医 科 大 学 十 二 五 课 程 建 设 规 划 20 广 西 医 科 大
恆載及外加荷載作業守則2011
恆 載 及 外 加 荷 載 作 業 守 則 2011 年 i 前 言 本 作 業 守 則 ( 守 則 ) 為 建 築 物 及 街 道 的 設 計 提 供 了 釐 定 恆 載 及 最 小 外 加 荷 載 的 指 引 建 築 物 ( 建 造 ) 規 例 中 對 樓 面 用 途 及 相 應 外 加 荷 載 的 規 定 亦 收 錄 於 本 守 則 第 3 節 各 表 內, 以 方 便 業 界 參 考 儘 管
Microsoft Word - 物质结构导论E4.docx
前 言 本 书 是 我 们 在 中 国 科 学 技 术 大 学 讲 授 物 质 结 构 课 程 所 编 的 讲 义 的 基 础 上 多 次 补 充 修 改 而 成 的 目 前, 用 量 子 理 论 处 理 原 子 分 子 和 固 体 的 结 果 已 能 根 据 微 观 粒 子 的 相 互 作 用 来 解 释 和 预 言 很 多 宏 观 上 所 能 观 察 到 的 规 律 因 此, 这 门 课 的 目
<3935BCC6A5D2C1CDB6D52E747066>
95 指 定 科 目 考 試 數 學 甲 趨 勢 分 析 95 指 定 科 目 考 試 數 學 甲 解 析 大 公 開 4 95 指 定 科 目 考 試 數 學 乙 趨 勢 分 析 1 95 指 定 科 目 考 試 數 學 乙 解 析 大 公 開 13 發 行 人 : 李 枝 昌 執 行 編 輯 : 蔡 孟 秀 張 龍 慧 美 術 編 輯 : 蔡 雅 真 發 行 所 : 康 熹 文 化 事 業 股
1 2 m v e 2 ö e m e m e m e m e e m m 1 1840 e m e m 2 v r Å Å Å 9999 10000 2 n λ = b( 2 2 ) n 2 Å 1 1854 1919 λ 1 1 1 2 2 λ = R ( Z H n ) 1 1 1 2 2 λ R H ( ) n f ni Z Z E ν = h mvr = n h 2π mvr = nh
390 1975 23 664 25 117 1986 Km % % % I 3.61 23.1 387.8 15.4 35.8 A 2.21 14.1 300.1 11.9 33.44 B 1.40 9.0 87.7 3.5 2.36 II 6.11
封面
高 中 数 学 教 师 备 课 联 盟 ( 群 刊 ) 4503 卷 首 语 教 师 要 做 师, 不 要 做 匠 叶 澜 创 新 现 在 是 一 个 非 常 流 行 的 名 词, 什 么 人 都 可 以 说, 哪 里 都 在 这 么 说. 对 于 教 育 来 讲, 创 新 创 造 创 生, 其 实 都 跟 人 的 生 命 有 关. 人 作 为 一 个 生 命 体, 要 生 存, 要 发 展, 就
第一章合成.ppt
[email protected] 1. 2. 3. 4. 5. 1. Mathematical Statistics R.V.Hogg ( 1979) 2. Statistics -The Conceptual Approach G. R. Iversen, ed ( - 2000) 3. Mathematical Statistics and Data Analysis J. A. Rice
(Microsoft Word - 1012-2\256\325\260\310\267|\304\263\254\366\277\375.doc)
國 立 屏 北 高 級 中 學 101 學 年 度 第 2 學 期 第 2 次 校 務 會 議 紀 錄 壹 會 議 名 稱 :101 學 年 度 第 2 學 期 第 2 次 校 務 會 議 貳 時 間 :102 年 6 月 28 日 ( 星 期 五 ) 下 午 13 時 10 分 參 地 點 : 本 校 圖 書 館 四 樓 視 聽 會 議 室 肆 出 列 席 人 員 : 詳 如 簽 到 簿 伍 主
悖论
年 月总第 8 期 数学方法与数学思想 编辑点评 数学与哲学都是研究最普遍的事物的 但是研究的角度 目的 方法 过 程和成果并不一样 所以两者之间有联系也有区别 该文通过对像 先有鸡 还是先有蛋 这样一些通俗又典型的例子 说明数学家与哲学家对于同一 个问题思维和处理的方式如何不同 便于读者形象地理解文中的论点 文 章的论述比较恰当 准确 深刻 写作也通顺流利 是一篇可读性较强的 文章 值得读者体会和学习
厨房小知识(四)
I...1...2...3...4...4...5...6...6...7...9...10... 11...12...12...13...14...15...16...17...18...18...19...22...22 II...23...24...25...26...27...27...28...29...29...30...31...31?...32...32...33?...33...34...34...35...36...36...37...37...38...38...40
妇女更年期保健.doc
...1...2...3...5...6...7 40...8... 11...13...14...16...17...19...20...21...26...29...30...32 I ...34...35...37...41...46...50...51...52...53...54...55...58...64...65 X...67...68...70...70...74...76...78...79
小儿传染病防治(上)
...1...2...3...5...7...7...9... 11...13...14...15...16...32...34...34...36...37...39 I ...39...40...41...42...43...48...50...54...56...57...59...59...60...61...63...65...66...66...68...68...70...70 II
<4D6963726F736F667420576F7264202D2031303430333234B875B9B5A448ADFBBADEB27AA740B77EA4E2A5555FA95EAED6A641ADD75F2E646F63>
聘 僱 人 員 管 理 作 業 參 考 手 冊 行 政 院 人 事 行 政 總 處 編 印 中 華 民 國 104 年 3 月 序 人 事 是 政 通 人 和 的 關 鍵 是 百 事 俱 興 的 基 礎, 也 是 追 求 卓 越 的 張 本 唯 有 人 事 健 全, 業 務 才 能 順 利 推 動, 政 府 施 政 自 然 績 效 斐 然 本 總 處 做 為 行 政 院 人 事 政 策 幕 僚 機
女性青春期保健(下).doc
...1...4...10... 11...13...14...15...17...18...19...20...21...22...23...24...26...27...30...31 I ...32...33...36...37...38...40...41...43...44...45...46...47...50...51...51...53...54...55...56...58...59
避孕知识(下).doc
...1...3...6...13...13...14...15...16...17...17...18...19...19...20...20...23...24...24...25 I ...25...26...26...27...28...28...29...30...30...31...32...34...35 11...36...37...38...40...42...43...44...44...46
孕妇饮食调养(下).doc
...1...2...5...9 7...9...14...15...16...18...22...23...24...25...27...29...31...32...34 I ...35...36...37...39...40...40...42...44...46...48...51...52...53...53...54...55...56...56...58...61...64 II ...65...66...67...68...69...70...71...72...73...74...75...76...77...80...83...85...87...88
禽畜饲料配制技术(一).doc
( ) ...1...1...4...5...6...7...8...9...10... 11...13...14...17...18...21...23...24...26 I ...28 70...30...33...35...36...37...39...40...41...49...50...52...53...54...56...58...59...60...67...68...70...71
中老年保健必读(十一).doc
...1...2...4...6...8...9...10...12...14...15...17...18...20...22...23...25...27...29 I ...30...32...35...38...40...42...43...45...46...48...52...55...56...59...62...63...66...67...69...71...74 II ...76...78...79...81...84...86...87...88...89...90...91...93...96...99...
怎样使孩子更加聪明健康(七).doc
...1...2...2...4...5 7 8...6...7...9 1 3... 11...12...14...15...16...17...18...19...20...21...22 I II...23...24...26 1 3...27...29...31...31...33...33...35...35...37...39...41...43...44...45 3 4...47...48...49...51...52
i
i ii iii iv v vi 1 g j 2 3 4 ==== ==== ==== 5 ==== ======= 6 ==== ======= 7 ==== ==== ==== 8 [(d) = (a) (b)] [(e) = (c) (b)] 9 ===== ===== ===== ===== ===== ===== 10 11 12 13 14 15 16 17 ===== [ ] 18 19
二零零六年一月二十三日會議
附 件 B 有 关 政 策 局 推 行 或 正 在 策 划 的 纾 缓 及 预 防 贫 穷 措 施 下 文 载 述 有 关 政 策 局 / 部 门 为 加 强 纾 缓 及 预 防 贫 穷 的 工 作, 以 及 为 配 合 委 员 会 工 作, 在 过 去 十 一 个 月 公 布 及 正 在 策 划 的 新 政 策 和 措 施 生 福 利 及 食 物 局 (i) 综 合 儿 童 发 展 服 务 2.
马太亨利完整圣经注释—雅歌
第 1 页 目 录 雅 歌 简 介... 2 雅 歌 第 一 章... 2 雅 歌 第 二 章... 10 雅 歌 第 三 章... 16 雅 歌 第 四 章... 20 雅 歌 第 五 章... 25 雅 歌 第 六 章... 32 雅 歌 第 七 章... 36 雅 歌 第 八 章... 39 第 2 页 雅 歌 简 介 我 们 坚 信 圣 经 都 是 神 所 默 示 的 ( 提 摩 太 后 书
正 德 之 光 系 列 一 目 錄. 正 德 佛 堂 觀 世 音 菩 薩 靈 感 廣 大 救 太 太 一 命 06. 正 德 佛 堂 觀 世 音 菩 薩 藥 籤 特 靈, 治 癒 公 公 喉 結 石 09. 正 德 佛 堂 大 悲 咒 水 治 癒 罹 患 十 四 年 癲 癇 症 10. 正 德 佛 堂 菩 薩 藥 籤 靈 感 治 癒 多 年 坐 骨 神 經 痛 12. 觀 世 音 菩 薩 慈 悲 靈
2 目 录 2.4.1 Euler 方 法................................ 39 2.4.2 龙 格 库 塔 方 法............................ 40 2.4.3 两 点 边 值 问 题...........................
目 录 第 零 章 绪 论 5 第 一 章 计 算 机 数 和 误 差 9 1.1 计 算 机 数 及 其 表 示................................ 9 1.2 舍 入 误 差 对 计 算 的 影 响............................. 10 1.3 减 法 的 计 算.................................... 12
