IBM SPSS Modeler 14.2 建模节点

Size: px
Start display at page:

Download "IBM SPSS Modeler 14.2 建模节点"

Transcription

1 IBM SPSS Modeler 14.2 建 模 节 点

2 注 意 : 使 用 本 信 息 以 及 其 支 持 的 产 品 之 前, 请 阅 读 注 意 事 项 第 页 码 下 的 常 规 信 息 本 文 件 包 含 SPSS Inc,IBM Company 的 专 利 信 息 本 文 件 依 照 许 可 证 协 议 提 供 并 受 版 权 法 保 护 本 出 版 物 中 包 含 的 任 何 信 息 不 包 括 任 何 产 品 保 证, 同 时 本 手 册 中 提 供 的 任 何 声 明 不 应 被 解 释 为 保 证 当 您 发 送 信 息 给 IBM 或 SPSS 时, 您 将 授 予 非 独 占 权 利 给 IBM 和 SPSS, 允 许 它 以 其 认 为 合 适 的 任 何 方 式 使 用 或 分 发 这 些 信 息 而 不 承 担 任 何 责 任 Copyright IBM Corporation 1994,

3 前 言 IBM SPSS Modeler 是 IBM Corp. 企 业 级 数 据 挖 掘 工 作 平 台 SPSS Modeler 通 过 深 入 的 数 据 分 析 帮 助 组 织 改 进 与 客 户 和 市 民 的 关 系 组 织 通 过 借 助 源 自 SPSS Modeler 的 洞 察 力 可 以 留 住 优 质 客 户, 识 别 交 叉 销 售 机 遇, 吸 引 新 客 户, 检 测 欺 诈, 降 低 风 险, 促 进 政 府 服 务 交 付 SPSS Modeler 的 可 视 化 界 面 让 用 户 可 以 应 用 他 们 自 己 的 业 务 专 长, 这 将 生 成 更 强 有 力 的 预 测 模 型, 缩 减 实 现 解 决 方 案 所 需 的 时 间 SPSS Modeler 提 供 了 多 种 建 模 技 术, 例 如 预 测 分 类 细 分 和 关 联 检 测 算 法 模 型 创 建 成 功 后, 通 过 IBM SPSS Modeler Solution Publisher, 在 广 泛 的 企 业 内 交 付 给 决 策 者, 或 通 过 数 据 库 交 付 关 于 IBM Business Analytics IBM Business Analytics 软 件 为 决 策 者 提 供 可 信 赖 的 完 整 一 致 和 准 确 信 息, 以 帮 助 其 提 升 业 务 绩 效 这 一 涵 盖 商 务 智 能 预 测 分 析 财 务 绩 效 与 战 略 管 理 以 及 分 析 应 用 程 序 的 全 面 组 合 可 提 供 有 关 当 前 业 务 表 现 的 清 晰 立 即 和 切 实 可 行 的 深 入 见 解, 并 能 够 有 效 预 测 未 来 结 果 其 中 整 合 了 丰 富 的 行 业 解 决 方 案 经 过 验 证 的 做 法 与 专 业 服 务, 以 帮 助 各 种 规 模 的 组 织 提 升 生 产 效 率 自 动 化 决 策 并 取 得 卓 越 成 果 作 为 该 软 件 组 合 的 一 部 分,IBM SPSS Predictive Analytics 软 件 能 够 帮 助 各 类 组 织 有 效 地 预 测 未 来 事 件, 并 针 对 所 得 到 的 深 入 见 解 提 前 采 取 行 动, 以 取 得 更 优 秀 的 业 务 成 果 全 球 企 业 政 府 和 学 院 客 户 依 赖 IBM SPSS 技 术 作 为 吸 引 留 住 和 增 加 客 户 数 量 的 竞 争 优 势, 并 降 低 欺 诈 和 转 移 风 险 通 过 将 IBM SPSS 软 件 融 入 其 日 常 运 营 中, 这 些 组 织 将 成 为 预 测 型 企 业, 即 能 够 指 引 并 自 动 化 决 策, 以 实 现 业 务 目 标 和 取 得 可 衡 量 的 竞 争 优 势 有 关 详 细 信 息, 或 联 系 我 们 的 代 表, 请 访 问 技 术 支 持 我 们 提 供 有 技 术 支 持 服 务 以 维 护 客 户 客 户 可 就 IBM Corp. 产 品 使 用 或 某 一 受 支 持 硬 件 环 境 的 安 装 帮 助 寻 求 技 术 支 持 要 获 得 技 术 支 持, 请 访 问 IBM Corp. 网 站 在 请 求 帮 助 时, 请 做 好 准 备, 以 便 识 别 您 自 己 您 的 组 织 以 及 您 的 支 持 协 议 Copyright IBM Corporation 1994, iii

4 内 容 1 关 于 IBM SPSS Modeler 1 IBM SPSS Modeler Server IBM SPSS Modeler 选 项 IBM SPSS Text Analytics IBM SPSS Modeler 文 档 应 用 程 序 示 例 Demos 文 件 夹 建 模 简 介 5 构 建 流 浏 览 模 型 评 估 模 型 对 记 录 评 分 摘 要 建 模 概 述 21 建 模 节 点 概 述 构 建 分 割 模 型 分 割 和 分 区 支 持 拆 分 模 型 的 建 模 节 点 受 分 割 影 响 的 特 征 建 模 节 点 字 段 选 项 使 用 频 率 和 权 重 字 段 建 模 节 点 分 析 选 项 倾 向 得 分 模 型 块 模 型 链 接 替 换 模 型 模 型 选 项 板 浏 览 模 型 块 模 型 块 概 要 / 信 息 预 测 变 量 重 要 性 整 体 模 型 分 割 模 型 的 模 型 块 使 用 流 中 的 模 型 块 iv

5 重 新 生 成 建 模 节 点 导 入 和 导 出 PMML 模 型 非 精 练 模 型 筛 选 模 型 64 筛 选 字 段 和 记 录 特 征 选 择 节 点 特 征 选 择 模 型 设 置 特 征 选 择 选 项 特 征 选 择 模 型 块 特 征 选 择 模 型 结 果 按 照 重 要 性 选 择 字 段 从 特 征 选 择 模 型 中 生 成 过 滤 器 异 常 检 测 节 点 异 常 检 测 模 型 选 项 异 常 检 测 专 家 选 项 异 常 检 测 模 型 块 异 常 检 测 模 型 详 细 信 息 异 常 检 测 模 型 概 要 异 常 检 测 模 型 设 置 自 动 建 模 节 点 79 自 动 建 模 节 点 算 法 设 置 自 动 建 模 节 点 停 止 规 则 自 动 分 类 器 节 点 自 动 分 类 器 节 点 模 型 选 项 自 动 分 类 器 节 点 专 家 选 项 误 分 类 损 失 自 动 分 类 器 节 点 丢 弃 选 项 自 动 分 类 器 节 点 设 置 选 项 自 动 数 值 节 点 自 动 数 值 节 点 模 型 选 项 自 动 数 值 节 点 专 家 选 项 自 动 数 值 节 点 设 置 选 项 自 动 聚 类 节 点 自 动 聚 类 节 点 模 型 选 项 v

6 自 动 聚 类 节 点 专 家 选 项 自 动 聚 类 节 点 丢 弃 选 项 自 动 模 型 块 生 成 节 点 和 模 型 生 成 评 估 图 表 评 估 图 形 决 策 树 105 决 策 树 模 型 交 互 树 构 建 器 生 成 和 修 剪 树 定 义 自 定 义 分 割 分 割 的 详 细 信 息 和 代 用 项 自 定 义 树 状 视 图 Gains 风 险 保 存 树 模 型 和 结 果 生 成 过 滤 节 点 和 选 择 节 点 从 决 策 树 中 生 成 规 则 集 直 接 构 建 树 模 型 决 策 树 节 点 C&R 树 节 点 CHAID 节 点 QUEST 节 点 决 策 树 节 点 字 段 选 项 决 策 树 节 点 构 建 选 项 决 策 树 节 点 模 型 选 项 C5.0 节 点 C5.0 节 点 模 型 选 项 决 策 树 模 型 块 单 个 树 模 型 块 用 于 推 进 bagging 和 超 大 型 数 据 集 的 模 型 块 规 则 集 模 型 块 规 则 集 模 型 选 项 卡 从 AnswerTree 3.0 中 导 入 工 程 vi

7 7 贝 叶 斯 网 络 模 型 165 贝 叶 斯 网 络 节 点 贝 叶 斯 网 络 节 点 模 型 选 项 贝 叶 斯 网 络 节 点 专 家 选 项 贝 叶 斯 网 络 模 型 块 贝 叶 斯 网 络 模 型 设 置 贝 叶 斯 网 络 模 型 摘 要 神 经 网 络 174 神 经 网 络 模 型 对 遗 存 流 使 用 神 经 网 络 目 标 基 本 停 止 规 则 整 体 高 级 模 型 选 项 模 型 摘 要 预 测 变 量 重 要 性 按 已 观 测 进 行 预 测 分 类 网 络 设 置 决 策 表 188 决 策 列 表 模 型 选 项 决 策 列 表 节 点 专 家 选 项 决 策 列 表 模 型 块 决 策 列 表 模 型 块 设 置 Decision List Viewer 工 作 模 型 窗 格 替 代 选 项 卡 快 照 选 项 卡 使 用 Decision List Viewer vii

8 10 统 计 模 型 220 线 性 节 点 线 性 模 型 目 标 基 本 模 型 选 择 整 体 高 级 模 型 选 项 模 型 摘 要 自 动 数 据 准 备 预 测 变 量 重 要 性 按 已 观 测 进 行 预 测 残 差 离 群 值 效 应 系 数 估 计 平 均 值 模 型 构 建 摘 要 设 置 逻 辑 节 点 Logistic 节 点 模 型 选 项 将 项 添 加 到 Logistic 回 归 模 型 Logistic 节 点 专 家 选 项 Logistic 回 归 收 敛 选 项 Logistic 回 归 高 级 输 出 Logistic 回 归 步 进 选 项 Logistic 模 型 块 Logistic 模 型 块 详 细 信 息 Logistic 模 型 块 概 要 Logistic 模 型 块 设 置 Logistic 模 型 块 高 级 输 出 主 成 份 分 析 / 因 子 节 点 主 成 分 分 析 / 因 子 节 点 模 型 选 项 主 成 份 分 析 (PCA)/ 因 子 节 点 专 家 选 项 主 成 分 分 析 (PCA)/ 因 子 节 点 旋 转 选 项 主 成 分 分 析 (PCA)/ 因 子 模 型 块 主 成 分 分 析 / 因 子 模 型 块 方 程 式 主 成 分 分 析 / 因 子 模 型 块 概 要 主 成 分 分 析 / 因 子 模 型 块 高 级 输 出 判 别 式 节 点 判 别 式 节 点 模 型 选 项 viii

9 判 别 式 节 点 专 家 选 项 判 别 式 节 点 输 出 选 项 判 别 式 节 点 步 进 选 项 判 别 式 模 型 块 判 别 式 模 型 块 高 级 输 出 判 别 式 模 型 块 设 置 判 别 式 模 型 块 汇 总 GenLin 节 点 GenLin 节 点 字 段 选 项 GenLin 节 点 模 型 选 项 GenLin 节 点 专 家 选 项 广 义 线 性 模 型 迭 代 广 义 线 性 模 型 高 级 输 出 GenLin 模 型 块 GenLin 模 型 块 高 级 输 出 GenLin 模 型 块 设 置 GenLin 模 型 块 汇 总 Cox 节 点 Cox 节 点 字 段 选 项 Cox 节 点 模 型 选 项 Cox 节 点 专 家 选 项 Cox 节 点 设 置 选 项 Cox 模 型 块 Cox 回 归 输 出 设 置 Cox 回 归 高 级 输 出 聚 类 模 型 292 Kohonen 节 点 Kohonen 节 点 模 型 选 项 Kohonen 节 点 专 家 选 项 Kohonen 模 型 块 Kohonen 模 型 汇 总 K-Means 节 点 K-Means 节 点 模 型 选 项 K-Means 节 点 专 家 选 项 K-Means 模 型 块 K-Means 模 型 汇 总 两 步 聚 类 节 点 两 步 聚 类 节 点 模 型 选 项 ix

10 两 步 聚 类 模 型 块 两 步 模 型 汇 总 聚 类 浏 览 器 聚 类 浏 览 器 - 模 型 选 项 卡 浏 览 聚 类 浏 览 器 从 聚 类 模 型 生 成 图 形 关 联 规 则 319 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据 Apriori 节 点 Apriori 节 点 模 型 选 项 Apriori 节 点 专 家 选 项 CARMA 节 点 CARMA 节 点 字 段 选 项 CARMA 节 点 模 型 选 项 CARMA 节 点 专 家 选 项 关 联 规 则 模 型 块 关 联 规 则 模 型 块 详 细 信 息 关 联 规 则 模 型 块 设 置 关 联 规 则 模 型 块 概 要 从 关 联 模 型 块 生 成 规 则 集 生 成 已 过 滤 的 模 型 关 联 规 则 评 分 部 署 关 联 模 型 序 列 节 点 序 列 节 点 字 段 选 项 序 列 节 点 模 型 选 项 序 列 节 点 专 家 选 项 序 列 模 型 块 序 列 模 型 块 详 细 信 息 序 列 模 型 块 设 置 序 列 模 型 块 概 要 从 序 列 模 型 块 生 成 规 则 超 节 点 x

11 13 时 间 序 列 模 型 355 为 什 么 要 进 行 预 测? 时 间 序 列 数 据 时 间 序 列 的 特 征 自 相 关 函 数 和 部 分 自 相 关 函 数 序 列 变 换 预 测 变 量 序 列 时 间 序 列 建 模 节 点 要 求 时 间 序 列 模 型 选 项 时 间 序 列 Expert Modeler 标 准 时 间 序 列 指 数 平 滑 标 准 时 间 序 列 ARIMA 标 准 传 输 函 数 处 理 离 群 值 生 成 时 间 序 列 模 型 生 成 多 个 模 型 使 用 时 间 序 列 模 型 进 行 预 测 重 新 估 计 和 预 测 时 间 序 列 模 型 块 时 间 序 列 模 型 参 数 时 间 序 列 模 型 残 差 时 间 序 列 模 型 汇 总 时 间 序 列 模 型 设 置 自 学 响 应 节 点 模 型 381 SLRM 节 点 SLRM 节 点 字 段 选 项 SLRM 节 点 模 型 选 项 SLRM 节 点 设 置 选 项 SLRM 模 型 块 SLRM 模 型 设 置 Support Vector Machine 模 型 389 关 于 SVM SVM 如 何 运 行 xi

12 调 整 SVM 模 型 SVM 节 点 SVM 节 点 模 型 选 项 SVM 节 点 专 家 选 项 SVM 模 型 块 SVM 模 型 设 置 最 近 相 邻 元 素 模 型 396 KNN 节 点 KNN 节 点 目 标 选 项 KNN 节 点 设 置 KNN 模 型 块 模 型 视 图 KNN 模 型 设 置 附 录 A 注 意 事 项 414 索 引 417 xii

13 关 于 IBM SPSS Modeler 章 1 IBM SPSS Modeler 是 一 组 数 据 挖 掘 工 具, 通 过 这 些 工 具 可 以 采 用 商 业 技 术 快 速 建 立 预 测 性 模 型, 并 将 其 应 用 于 商 业 活 动, 从 而 改 进 决 策 过 程 SPSS Modeler 参 照 行 业 标 准 CRISP-DM 模 型 设 计 而 成, 可 支 持 从 数 据 到 更 优 商 业 成 果 的 整 个 数 据 挖 掘 过 程 SPSS Modeler 提 供 了 各 种 借 助 机 器 学 习 人 工 智 能 和 统 计 学 的 建 模 方 法 通 过 建 模 选 项 板 中 的 方 法, 您 可 以 根 据 数 据 生 成 新 的 信 息 以 及 开 发 预 测 模 型 每 种 方 法 各 有 所 长, 同 时 适 用 于 解 决 特 定 类 型 的 问 题 SPSS Modeler 可 以 作 为 独 立 产 品 购 买, 或 与 SPSS Modeler Server 一 起 使 用 同 时 提 供 了 大 量 其 他 选 项, 以 下 各 节 将 对 这 些 选 项 进 行 概 述 有 关 详 细 信 息, 请 参 阅 IBM SPSS Modeler Server SPSS Modeler 使 用 客 户 端 / 服 务 器 体 系 结 构 将 资 源 集 约 型 操 作 的 请 求 分 发 给 功 能 强 大 的 服 务 器 软 件, 因 而 使 大 数 据 集 的 传 输 速 度 大 大 加 快 除 了 此 处 所 列 的 产 品 和 更 新, 也 可 能 还 有 其 他 可 用 的 产 品 和 更 新 有 关 详 细 信 息, 请 参 阅 SPSS Modeler SPSS Modeler 是 具 有 完 整 功 能 的 产 品, 它 安 装 并 运 行 于 用 户 的 台 式 计 算 机 上 它 既 可 以 在 本 机 模 式 下 独 立 运 行, 也 可 以 与 IBM SPSS Modeler Server 一 起 联 机 使 用, 从 而 提 高 了 对 大 数 据 集 的 处 理 速 度 SPSS Modeler Server. SPSS Modeler Server 与 一 个 或 多 个 IBM SPSS Modeler 安 装 程 序 一 起 在 分 布 式 分 析 模 式 下 不 间 断 运 行, 这 种 运 行 方 式 大 大 提 高 了 对 大 数 据 集 的 处 理 速 度, 因 为 在 服 务 器 上 可 以 完 成 内 存 集 约 型 操 作, 且 无 需 将 数 据 下 载 至 客 户 端 计 算 机 SPSS Modeler Server 还 提 供 对 SQL 优 化 和 数 据 库 内 建 模 功 能 的 支 持, 从 而 在 性 能 和 自 动 化 方 面 带 来 更 多 优 势 要 运 行 分 析, 必 须 至 少 安 装 有 一 个 SPSS Modeler IBM SPSS Modeler 选 项 还 可 以 单 独 购 买 以 下 组 件 和 功 能 并 获 得 使 用 许 可, 以 用 于 SPSS Modeler 请 注 意, 还 可 能 提 供 其 他 产 品 或 更 新 有 关 详 细 信 息, 请 参 阅 SPSS Modeler Server 访 问 权 限, 可 针 对 大 型 数 据 集 提 供 更 高 的 可 扩 展 性 和 性 能, 并 提 供 对 SQL 优 化 以 及 数 据 库 内 建 模 功 能 的 支 持 Copyright IBM Corporation 1994,

14 2 章 1 SPSS Modeler Solution Publisher, 用 于 在 SPSS Modeler 环 境 外 执 行 实 时 或 自 动 评 分 有 关 详 细 信 息, 请 参 阅 第 2 章 中 的 IBM SPSS Modeler Solution Publisher 中 的 IBM SPSS Modeler 14.2 解 决 方 案 发 布 者 允 许 部 署 到 IBM SPSS Collaboration and Deployment Services 或 精 简 客 户 端 应 用 程 序 IBM SPSS Modeler Advantage 的 适 配 器 有 关 详 细 信 息, 请 参 阅 第 9 章 中 的 存 储 和 部 署 IBM SPSS Collaboration and Deployment Services Repository 对 象 中 的 IBM SPSS Modeler 14.2 用 户 指 南 IBM SPSS Text Analytics IBM SPSS Text Analytics 是 一 个 SPSS Modeler 完 全 集 成 内 插 式 插 件, 它 采 用 了 先 进 语 言 技 术 和 Natural Language Processing (NLP), 以 快 速 处 理 大 量 无 结 构 文 本 数 据, 抽 取 和 组 织 关 键 概 念, 以 及 将 这 些 概 念 分 为 各 种 类 别 抽 取 的 概 念 和 类 别 可 以 和 现 有 结 构 化 数 据 中 进 行 组 合 ( 例 如 人 口 统 计 学 ), 并 且 可 用 于 借 助 IBM SPSS Modeler 的 一 整 套 数 据 挖 掘 工 具 来 进 行 建 模, 以 此 实 现 更 好 更 集 中 的 决 策 文 本 挖 掘 节 点 提 供 了 概 念 类 型 建 模 以 及 交 互 式 工 作 平 台, 通 过 此 平 台, 可 以 完 成 文 本 链 接 和 聚 类 的 高 级 探 索, 创 建 自 己 的 类 别 和 改 进 语 言 资 源 模 板 支 持 多 种 导 入 格 式, 其 中 包 括 博 客 和 其 他 基 于 Web 的 资 源 还 包 括 定 制 模 板 库 和 指 定 域 的 词 典, 例 如 CRM 和 神 经 网 络 注 : 访 问 此 组 件 需 要 单 独 许 可 证 有 关 详 细 信 息, 请 参 阅 IBM SPSS Modeler 文 档 可 以 从 SPSS Modeler 的 帮 助 菜 单 中 获 取 在 线 帮 助 格 式 的 完 整 文 档 此 文 档 包 括 SPSS Modeler SPSS Modeler Server 和 SPSS Modeler Solution Publisher 的 文 档 以 及 应 用 程 序 指 南 和 其 他 支 持 材 料 每 个 产 品 的 完 整 文 档 (PDF 格 式 ) 也 位 于 每 个 产 品 DVD 的 \Documentation 文 件 夹 下 IBM SPSS Modeler 用 户 指 南 使 用 SPSS Modeler 的 一 般 使 用 介 绍, 包 括 如 何 构 建 数 据 流 处 理 缺 失 值 生 成 CLEM 表 达 式 处 理 项 目 和 报 告 以 及 将 用 于 部 署 的 流 打 包 为 IBM SPSS Collaboration and Deployment Services 预 测 应 用 程 序 或 IBM SPSS Modeler Advantage IBM SPSS Modeler 源 处 理 和 输 出 节 点 介 绍 用 于 以 不 同 的 格 式 读 取 处 理 和 输 出 数 据 的 所 有 节 点 实 际 上 这 表 示 所 有 节 点 而 非 建 模 节 点 IBM SPSS Modeler 建 模 节 点 有 关 用 于 创 建 数 据 挖 掘 模 型 的 所 有 节 点 的 描 述 IBM SPSS Modeler 可 提 供 各 种 借 助 机 器 学 习 人 工 智 能 和 统 计 学 的 建 模 方 法 有 关 详 细 信 息, 请 参 阅 第 21 页 码 第 3 章 中 的 建 模 节 点 概 述 IBM SPSS Modeler 算 法 指 南 介 绍 SPSS Modeler 中 所 用 建 模 方 法 的 数 学 基 础 IBM SPSS Modeler 应 用 程 序 指 南 本 指 南 中 的 示 例 旨 在 为 具 体 的 建 模 方 法 和 技 术 提 供 具 有 针 对 性 的 简 介 还 可 以 在 帮 助 菜 单 中 查 阅 本 指 南 的 在 线 版 本 有 关 详 细 信 息, 请 参 阅 应 用 程 序 示 例 中 的 IBM SPSS Modeler 14.2 用 户 指 南

15 3 关 于 IBM SPSS Modeler IBM SPSS Modeler 脚 本 编 写 与 自 动 化 通 过 编 写 脚 本 实 现 系 统 自 动 化 的 相 关 信 息, 包 括 用 于 操 作 节 点 和 流 的 属 性 信 息 IBM SPSS Modeler 部 署 指 南 有 关 在 IBM SPSS Collaboration and Deployment Services Deployment Manager 中 以 处 理 作 业 的 步 骤 形 式 运 行 SPSS Modeler 流 和 方 案 的 信 息 IBM SPSS Modeler CLEF 开 发 人 员 指 南 CLEF 提 供 了 将 第 三 方 程 序 ( 例 如, 数 据 处 理 例 程 或 建 模 算 法 ) 作 为 节 点 集 成 到 SPSS Modeler 的 功 能 IBM SPSS Modeler 数 据 库 内 数 据 挖 掘 指 南 有 关 如 何 利 用 数 据 库 的 功 能 通 过 第 三 方 算 法 来 改 进 性 能 并 增 强 分 析 功 能 的 信 息 IBM SPSS Modeler Server 和 性 能 指 南 有 关 如 何 配 置 和 管 理 IBM SPSS Modeler Server 的 信 息 IBM SPSS Modeler Administration Console 用 户 指 南 有 关 安 装 和 使 用 控 制 台 用 户 界 面 以 监 视 和 配 置 SPSS Modeler Server 的 信 息 控 制 台 实 现 为 Deployment Manager 应 用 程 序 的 插 件 IBM SPSS Modeler Solution Publisher 指 南 SPSS Modeler Solution Publisher 是 一 个 附 加 式 组 件, 通 过 它 组 织 可 发 布 在 标 准 SPSS Modeler 环 境 之 外 使 用 的 流 IBM SPSS Modeler CRISP-DM 指 南 借 助 CRISP-DM 方 法 进 行 SPSS Modeler 数 据 挖 掘 的 分 步 指 南 应 用 程 序 示 例 SPSS Modeler 中 的 数 据 挖 掘 工 具 可 以 帮 助 解 决 很 多 业 务 和 组 织 问 题, 应 用 程 序 示 例 将 提 供 有 关 特 定 建 模 方 法 和 技 术 的 简 要 的 针 对 性 说 明 此 处 使 用 的 数 据 集 比 某 些 数 据 挖 掘 器 管 理 的 大 量 数 据 存 储 要 小 得 多, 但 涉 及 的 概 念 和 方 法 应 可 扩 展 到 实 际 的 应 用 程 序 可 以 通 过 在 SPSS Modeler 中 的 帮 助 菜 单 中 单 击 应 用 程 序 示 例 来 访 问 示 例 数 据 文 件 和 样 本 流 安 装 在 产 品 安 装 目 录 下 的 Demos 文 件 夹 中 有 关 详 细 信 息, 请 参 阅 Demos 文 件 夹 中 的 IBM SPSS Modeler 14.2 用 户 指 南 数 据 库 建 模 示 例 请 参 阅 IBM SPSS Modeler 数 据 库 内 挖 掘 指 南 中 的 示 例 编 写 示 例 脚 本 请 参 阅 IBM SPSS Modeler 脚 本 编 写 和 自 动 化 指 南 中 的 示 例

16 4 章 1 Demos 文 件 夹 与 应 用 程 序 示 例 一 起 使 用 的 数 据 文 件 和 样 本 流 安 装 在 产 品 安 装 目 录 下 的 Demos 文 件 夹 中 可 从 Windows 的 开 始 菜 单 中 IBM SPSS Modeler 14.2 程 序 组 访 问 该 文 件 夹, 也 可 以 在 文 件 打 开 对 话 框 中 最 近 目 录 的 列 表 中 单 击 Demos 图 片 1-1 在 最 近 使 用 的 目 录 列 表 中 选 择 Demos 文 件 夹

17 建 模 简 介 章 2 模 型 是 一 组 规 则 公 式 或 方 程 式, 可 以 用 它 们 根 据 一 组 输 入 或 变 量 来 预 测 输 出 例 如, 一 家 财 务 机 构 可 根 据 对 过 往 申 请 人 的 已 知 信 息, 使 用 模 型 预 测 贷 款 申 请 人 可 能 存 在 优 良 还 是 不 良 风 险 能 够 预 测 结 果 是 预 测 性 分 析 的 中 心 目 标, 并 且 了 解 建 模 过 程 是 使 用 IBM SPSS Modeler 的 关 键 图 片 2-1 简 单 的 决 策 树 模 型 本 示 例 使 用 决 策 树 模 型, 该 模 型 使 用 一 系 列 决 策 规 则 对 记 录 进 行 分 类 ( 并 预 测 响 应 ), 例 如 : 如 果 收 入 = 中 等 并 且 卡 <5 则 -> 优 良 本 示 例 使 用 CHAID( 卡 方 自 动 交 互 效 应 检 测 ) 模 型 时, 旨 在 进 行 常 规 的 介 绍, 大 部 分 概 念 会 广 泛 应 用 于 SPSS Modeler 中 的 其 他 建 模 类 型 无 论 要 了 解 哪 种 模 型, 均 需 要 首 先 了 解 进 入 该 模 型 的 数 据 此 示 例 中 的 数 据 包 含 有 关 银 行 客 户 的 信 息 其 中 使 用 了 下 列 字 段 : 字 段 名 描 述 Credit_rating 信 用 评 价 :0= 不 良,1= 优 良,9= 丢 失 值 年 龄 Age in years 收 入 收 入 水 平 :1= 低,2= 中,3= 高 Copyright IBM Corporation 1994,

18 6 章 2 字 段 名 描 述 Credit_cards 持 有 的 信 用 卡 数 量 :1= 少 于 五 张, 2= 五 张 或 更 多 教 育 教 育 程 度 :1= 高 中,2= 大 学 Car_loans 贷 款 的 汽 车 数 量 :1= 没 有 或 一 辆, 2= 超 过 两 辆 银 行 可 维 护 一 个 包 含 银 行 贷 款 客 户 历 史 信 息, 包 括 这 些 客 户 是 正 在 还 贷 ( 信 用 评 价 = 优 良 ) 还 是 在 拖 欠 贷 款 ( 信 用 评 价 = 不 良 ) 的 数 据 库 银 行 希 望 使 用 现 有 的 数 据 建 立 一 个 模 型, 允 许 他 们 预 测 未 来 贷 款 申 请 人 拖 欠 贷 款 的 可 能 性 使 用 决 策 树 模 型, 您 可 分 析 两 组 客 户 的 特 征, 并 预 测 拖 欠 贷 款 的 可 能 性 本 示 例 使 用 了 名 为 modelingintro.str 的 流, 该 流 位 于 streams 子 文 件 夹 下 的 Demos 文 件 夹 中 数 据 文 件 是 tree_credit.sav 有 关 详 细 信 息, 请 参 阅 第 1 章 中 的 Demos 文 件 夹 中 的 IBM SPSS Modeler 14.2 用 户 指 南 我 们 来 看 一 下 流 E 从 主 菜 单 中 选 择 下 列 选 项 : 文 件 > 打 开 流 E 单 击 打 开 对 话 框 的 工 具 栏 上 的 金 色 模 型 块 图 标, 然 后 选 择 Demos 文 件 夹 E 双 击 streams 文 件 夹 E 双 击 名 为 modelingintro.str 的 文 件 构 建 流 图 片 2-2 建 模 流 要 构 建 流 以 创 建 模 型, 至 少 需 要 三 个 元 素 :

19 7 建 模 简 介 一 个 从 某 些 外 部 源 读 取 数 据 的 源 节 点, 在 本 示 例 中 为 IBM SPSS Statistics 数 据 文 件 一 个 指 定 字 段 属 性 的 源 节 点 或 类 型 节 点, 字 段 属 性 包 括 测 量 级 别 ( 字 段 包 含 的 数 据 类 型 ) 以 及 每 个 字 段 在 建 模 过 程 中 的 角 色 是 目 标 还 是 输 入 等 一 个 在 运 行 流 时 生 成 模 型 块 的 建 模 节 点 在 本 例 中, 我 们 使 用 CHAID 建 模 节 点 CHAID, 或 卡 方 自 动 交 互 效 应 检 测, 是 一 种 通 过 使 用 称 作 卡 方 统 计 量 的 特 定 统 计 类 型 识 别 决 策 树 中 的 最 优 分 割 来 构 建 决 策 树 的 分 类 方 法 如 果 在 源 节 点 中 指 定 了 测 量 级 别, 则 可 以 去 掉 单 独 的 类 型 节 点 从 功 能 上 来 说, 结 果 是 一 样 的 该 流 中 还 包 含 表 节 点 和 分 析 节 点, 创 建 模 型 块 并 将 其 添 加 到 流 中 后, 将 使 用 这 两 个 节 点 查 看 评 分 结 果 Statistics 文 件 源 节 点 从 tree_credit.sav 数 据 文 件 读 取 SPSS Statistics 格 式 数 据, 该 文 件 安 装 在 Demos 文 件 夹 中 ( 名 为 $CLEO_DEMOS 的 特 殊 变 量 用 于 引 用 位 于 当 前 IBM SPSS Modeler 安 装 下 的 该 文 件 这 样, 无 论 当 前 的 安 装 文 件 夹 或 版 本 是 什 么, 均 可 以 确 保 路 径 有 效 ) 图 片 2-3 使 用 Statistics 文 件 源 节 点 读 取 数 据 类 型 节 点 指 定 每 个 字 段 的 测 量 级 别 测 量 级 别 是 一 种 指 示 字 段 中 数 据 类 型 的 类 别 我 们 的 源 数 据 文 件 使 用 三 种 不 同 的 测 量 级 别

20 8 章 2 连 续 字 段 ( 例 如 年 龄 字 段 ) 包 含 连 续 的 数 字 值, 而 名 义 字 段 ( 例 如 信 用 评 价 字 段 ) 有 两 个 或 多 个 不 同 值, 例 如 不 良 优 良 或 无 信 用 历 史 有 序 字 段 ( 例 如 收 入 水 平 字 段 ) 用 于 描 述 具 有 顺 序 固 定 的 不 同 值 的 数 据, 在 本 例 中 为 低 中 和 高 图 片 2-4 用 类 型 节 点 设 置 目 标 和 输 入 字 段 对 于 每 个 字 段, 类 型 节 点 还 指 定 角 色, 以 指 示 每 个 字 段 在 建 模 中 扮 演 的 部 分 将 字 段 信 用 评 价 的 角 色 设 置 为 目 标, 此 字 段 指 示 指 定 的 客 户 是 否 拖 欠 贷 款 这 是 目 标, 或 者 是 要 预 测 其 值 的 字 段 对 于 其 他 字 段, 将 角 色 设 置 为 输 入 输 入 字 段 有 时 也 称 为 预 测 变 量, 或 建 模 算 法 用 其 值 来 预 测 目 标 字 段 值 的 字 段 CHAID 建 模 节 点 生 成 模 型 在 建 模 节 点 的 字 段 选 项 卡 中, 已 选 中 使 用 预 定 义 角 色, 这 意 味 着 将 按 在 类 型 节 点 中 的 指 定 使 用 目 标 和 输 入 我 们 可 以 在 此 处 更 改 字 段 角 色, 但 本 例 中 我 们 不 做 任 何 更 改 使 用 这 些 角 色

21 9 建 模 简 介 E 单 击 构 建 选 项 选 项 卡 图 片 2-5 CHAID 建 模 节 点 字 段 选 项 卡 此 处 包 含 的 选 项 可 以 用 于 指 定 要 构 建 的 模 型 类 型 由 于 我 们 想 要 一 个 全 新 的 模 型, 因 此 使 用 默 认 选 项 构 建 新 模 型 我 们 还 要 求 它 为 单 个 标 准 决 策 树 模 型, 并 且 不 包 含 任 何 增 强, 因 此 保 留 默 认 目 标 选 项 构 建 单 个 树

22 10 章 2 我 们 可 以 选 择 启 动 允 许 对 模 型 进 行 微 调 的 交 互 建 模 会 话, 本 示 例 只 使 用 默 认 设 置 生 成 模 型 来 生 成 模 型 图 片 2-6 CHAID 建 模 节 点 构 建 选 项 选 项 卡 对 于 此 示 例, 我 们 希 望 保 持 树 的 结 构 简 单, 因 此 通 过 增 加 用 于 父 节 点 和 子 节 点 的 最 小 个 案 数 限 制 树 的 增 长 E 在 构 建 选 项 选 项 卡 上, 从 左 侧 的 导 航 器 窗 格 选 择 停 止 规 则 E 选 择 使 用 绝 对 值 选 项 E 将 父 分 支 中 的 最 小 记 录 数 设 置 为 400

23 11 建 模 简 介 E 将 子 分 支 中 的 最 小 记 录 数 设 置 为 200 图 片 2-7 为 构 建 决 策 树 设 置 停 止 标 准 在 本 例 中, 我 们 可 以 使 用 所 有 其 他 默 认 选 项, 因 此 单 击 运 行 以 创 建 模 型 ( 另 外, 也 可 以 右 键 单 击 该 节 点, 然 后 从 上 下 文 菜 单 中 选 择 运 行, 或 选 择 节 点, 并 从 工 具 菜 单 中 选 择 运 行 )

24 12 章 2 浏 览 模 型 执 行 完 成 后, 模 型 块 将 添 加 到 应 用 程 序 窗 口 右 上 角 的 模 型 选 项 板 中, 它 还 会 置 于 流 工 作 区 中, 并 带 有 指 向 创 建 它 的 建 模 节 点 的 链 接 要 查 看 模 型 的 详 细 信 息, 右 键 单 击 模 型 块 并 选 择 浏 览 ( 在 模 型 选 项 板 上 ) 或 编 辑 ( 在 工 作 区 上 ) 图 片 2-8 模 型 选 项 板 对 于 CHAID 模 型 块, 模 型 选 项 卡 以 规 则 集 的 形 式 显 示 详 细 信 息, 规 则 集 实 际 上 是 可 根 据 不 同 输 入 字 段 的 值 将 各 个 记 录 分 配 给 子 节 点 的 一 组 规 则 图 片 2-9 CHAID 模 型 块 规 则 集 对 于 每 个 决 策 树 终 端 节 点 意 味 着 那 些 树 节 点 没 有 进 一 步 拆 分 返 回 优 良 或 不 良 的 预 测 值 对 于 落 在 该 节 点 内 的 记 录, 所 有 个 案 中 的 预 测 均 由 模 式 或 最 常 见 的 响 应 决 定

25 13 建 模 简 介 在 规 则 集 的 右 侧, 模 型 选 项 卡 显 示 预 测 变 量 重 要 性 图 表, 该 图 表 显 示 评 估 模 型 时 每 个 预 测 变 量 的 相 对 重 要 性 通 过 这 一 点, 我 们 看 到 收 入 水 平 在 此 个 案 中 最 显 著, 而 其 他 唯 一 显 著 的 因 子 是 信 用 卡 数 量 图 片 2-10 预 测 变 量 重 要 性 图 表

26 14 章 2 模 型 块 中 的 查 看 器 选 项 卡 以 树 的 形 式 显 示 相 同 的 模 型, 每 个 决 策 点 上 都 有 一 个 节 点 可 使 用 工 具 栏 上 的 缩 放 控 件 放 大 特 定 节 点, 或 缩 小 节 点 以 查 看 更 完 整 的 树 图 片 2-11 模 型 块 中 的 查 看 器 选 项 卡, 已 选 择 缩 小 查 看 树 的 上 部 分, 第 一 个 节 点 ( 节 点 0) 为 我 们 提 供 数 据 集 中 所 有 记 录 的 摘 要 数 据 集 中 超 过 40% 的 个 案 分 类 为 不 良 风 险 这 是 相 当 高 的 比 例, 因 此 让 我 们 看 看 树 是 否 能 为 我 们 提 供 哪 些 因 子 负 责 的 任 何 线 索 我 们 可 以 看 到 第 一 个 分 割 是 根 据 收 入 水 平 收 入 水 平 位 于 低 类 别 的 记 录 被 指 定 到 节 点 2, 并 且 看 到 此 类 别 包 含 贷 款 拖 欠 人 的 最 高 百 分 比 不 足 为 奇 我 们 可 以 很 明 显 地 了 解, 此 类 别 中 的 客 户 具 有 高 风 险 但 是, 此 类 别 中 的 16% 客 户 实 际 上 没 有 拖 欠, 因 此 预 测 并 非 始 终 准 确 没 有 模 型 能 够 预 测 每 一 个 响 应, 但 好 的 模 型 能 够 根 据 可 用 数 据 预 测 对 每 一 个 记 录 作 出 的 最 常 见 的 响 应

27 15 建 模 简 介 同 样, 如 果 我 们 查 看 高 收 入 客 户 ( 节 点 1), 我 们 看 到 绝 大 部 分 (89%) 是 优 良 风 险 但 是 在 这 些 客 户 中 10 位 中 有 超 过 1 位 也 会 拖 欠 我 们 能 精 炼 自 己 的 贷 款 标 准 以 便 将 此 处 的 风 险 最 小 化 吗? 注 意 模 型 如 何 根 据 持 有 的 信 用 卡 数 量, 将 这 些 客 户 分 成 两 个 子 类 别 ( 节 点 4 和 节 点 5) 对 于 高 收 入 客 户, 如 果 我 们 只 向 那 些 信 用 卡 少 于 5 张 的 客 户 贷 款, 则 可 以 将 我 们 的 成 功 率 从 89% 提 高 到 97% 甚 至 更 满 意 的 结 果 图 片 2-12 高 收 入 客 户 的 树 状 视 图 但 中 等 收 入 类 别 ( 节 点 3) 中 的 那 些 客 户 是 什 么 情 况? 他 们 更 加 均 匀 地 划 分 为 优 良 和 不 良 评 价 子 类 别 ( 此 情 况 中 是 节 点 6 和 7) 仍 然 能 帮 助 我 们 这 次, 只 向 那 些 信 用 卡 少 于 5 张 的 中 等 收 入 客 户 贷 款, 可 将 优 良 评 价 的 百 分 比 从 58% 提 高 到 85%, 这 是 显 著 的 改 进 图 片 2-13 中 等 收 入 客 户 的 树 状 视 图

28 16 章 2 因 此, 我 们 了 解 到 输 入 此 模 型 的 每 项 记 录 都 将 被 分 配 到 一 个 特 定 节 点, 并 且 根 据 该 节 点 最 常 见 的 响 应 分 配 优 良 或 不 良 的 预 测 值 为 各 个 记 录 分 配 预 测 值 的 这 一 过 程 称 为 评 分 通 过 对 用 于 评 估 该 模 型 的 相 同 记 录 进 行 评 分, 可 以 评 估 该 模 型 执 行 训 练 数 据 ( 我 们 知 道 结 果 的 数 据 ) 的 准 确 度 让 我 们 看 看 如 何 做 到 这 一 点 评 估 模 型 我 们 浏 览 了 模 型 以 了 解 评 分 方 式 但 是, 如 果 要 评 估 模 型 的 准 确 度, 则 需 要 对 一 些 记 录 进 行 评 分, 并 将 模 型 预 测 的 响 应 与 实 际 结 果 进 行 比 较 接 下 来 对 用 于 评 估 该 模 型 的 相 同 记 录 进 行 评 分, 以 将 观 察 到 的 响 应 与 预 测 响 应 进 行 比 较 图 片 2-14 将 模 型 块 附 加 到 输 出 节 点 用 于 模 型 评 估 E 要 查 看 分 数 或 预 测 值, 请 将 表 节 点 添 加 到 模 型 块, 然 后 双 击 表 节 点, 并 单 击 运 行 表 在 名 为 $R-Credit rating 的 字 段 中 显 示 预 测 分 数, 该 字 段 由 模 型 创 建 我 们 可 以 将 这 些 值 与 包 含 实 际 响 应 的 原 始 信 用 评 价 字 段 进 行 比 较

29 17 建 模 简 介 按 照 惯 例, 在 评 分 过 程 中 生 成 的 字 段 的 名 称 基 于 目 标 字 段, 但 是 要 加 上 标 准 前 缀, 例 如 $R- 表 示 预 测 值,$RC- 表 示 置 信 度 值 不 同 的 模 型 类 型 使 用 不 同 的 前 缀 集 置 信 度 值 是 模 型 自 己 的 评 估, 尺 度 从 0.0 到 1.0, 表 示 每 个 预 测 值 的 精 确 程 度 图 片 2-15 表 格 显 示 生 成 的 分 数 和 置 信 度 值 与 预 期 的 一 样, 预 测 值 与 大 多 数 ( 并 非 全 部 ) 记 录 的 实 际 响 应 相 匹 配 原 因 是 每 个 CHAID 终 端 节 点 均 有 混 合 响 应 预 期 值 与 最 常 见 的 响 应 相 匹 配, 但 对 于 该 节 点 中 的 其 他 响 应, 该 预 期 值 是 错 误 的 ( 记 住,16% 的 少 部 分 低 收 入 客 户 没 有 拖 欠 ) 若 要 避 免 出 现 此 情 况, 应 继 续 将 树 分 割 为 更 小 的 分 支, 直 到 每 个 节 点 都 是 不 含 混 合 响 应 的 100% 纯 节 点 为 止 即 全 部 为 优 良 或 不 良 但 是, 这 样 的 模 型 可 能 会 非 常 复 杂, 并 且 不 易 推 广 到 其 他 数 据 集 要 查 看 具 体 有 多 少 预 测 值 正 确, 我 们 可 通 读 表 格, 并 计 算 预 测 字 段 $R-Credit rating 的 值 匹 配 信 用 评 价 的 值 的 记 录 数 量 幸 运 的 是, 这 里 有 更 简 单 的 方 式 我 们 可 使 用 分 析 节 点, 它 自 动 进 行 此 项 操 作 E 将 模 型 块 连 接 到 分 析 节 点

30 18 章 2 E 双 击 分 析 节 点, 然 后 单 击 运 行 图 片 2-16 添 加 分 析 节 点 分 析 表 明,2464 个 记 录 中 有 1899 个 记 录 ( 超 过 77%) 的 模 型 预 测 值 与 实 际 响 应 相 匹 配 图 片 2-17 观 察 到 的 响 应 与 预 测 的 响 应 的 比 较 分 析 结 果 此 结 果 受 到 评 分 的 记 录 和 用 于 评 估 模 型 的 记 录 相 同 的 事 实 的 限 制 在 真 实 情 况 中, 可 使 用 分 区 节 点 将 数 据 分 割 为 培 训 和 评 估 的 单 独 示 例

31 19 建 模 简 介 通 过 使 用 一 个 样 本 分 区 生 成 模 型 并 使 用 另 一 个 样 本 对 模 型 进 行 检 验, 您 会 得 到 该 模 型 推 广 到 其 他 数 据 集 的 情 况 通 常 分 析 节 点, 可 以 针 对 已 知 道 其 实 际 结 果 的 记 录 来 检 验 模 型 下 一 阶 段 介 绍 如 何 使 用 模 型 对 我 们 不 知 道 结 果 的 记 录 进 行 评 分 例 如, 这 可 能 包 括 当 前 不 是 银 行 客 户 的 人 员, 但 他 们 是 促 销 邮 寄 的 潜 在 目 标 对 记 录 评 分 之 前, 我 们 对 用 于 评 估 模 型 的 相 同 记 录 进 行 了 评 分, 以 评 价 模 型 准 确 程 度 现 在, 我 们 要 查 看 如 何 对 和 用 于 创 建 模 型 不 同 的 记 录 集 进 行 评 分 这 是 使 用 目 标 字 段 进 行 建 模 的 目 标 : 研 究 已 知 道 其 结 果 的 记 录, 以 标 识 您 可 以 从 中 预 测 未 知 结 果 的 模 式 图 片 2-18 附 加 用 于 评 分 的 新 数 据 可 以 更 新 Statistics 文 件 源 节 点, 使 它 指 向 其 他 数 据 文 件, 也 可 以 添 加 一 个 新 的 源 节 点, 从 它 读 取 要 评 分 的 数 据 无 论 采 用 哪 种 方 式, 新 数 据 集 包 含 的 输 入 字 段 必 须 与 模 型 ( 年 龄 收 入 水 平 教 育 等 ) 所 使 用 的 相 同, 但 不 包 含 目 标 字 段 信 用 评 价 另 外, 也 可 以 将 模 型 块 添 加 到 包 含 预 期 的 输 入 字 段 的 任 何 流 中 无 论 是 读 取 文 件 还 是 数 据 库, 只 要 字 段 名 和 类 型 与 模 型 使 用 的 相 匹 配, 源 类 型 都 无 关 紧 要 也 可 以 将 模 型 块 保 存 为 单 独 的 文 件 将 模 型 导 出 为 PMML 格 式 以 用 于 其 他 支 持 此 格 式 的 应 用 程 序, 或 将 模 型 存 储 到 IBM SPSS Collaboration and Deployment Services 存 储 库 中, 这 样 可 以 在 企 业 范 围 对 模 型 进 行 部 署 评 分 和 管 理 无 论 使 用 何 种 基 础 结 构, 模 型 自 身 都 按 相 同 的 方 式 工 作 摘 要 本 示 例 演 示 创 建 评 估 模 型 以 及 对 模 型 评 分 的 基 本 步 骤

32 20 章 2 建 模 节 点 通 过 研 究 已 知 道 其 结 果 的 记 录 来 评 估 模 型, 并 创 建 模 型 块 这 有 时 称 为 训 练 模 型 可 将 模 型 块 添 加 到 包 含 预 期 字 段 的 任 何 流 中, 以 对 记 录 进 行 评 分 通 过 对 已 知 道 其 结 果 的 记 录 ( 如 现 有 客 户 ) 进 行 评 分, 可 以 评 估 模 型 的 运 行 情 况 如 果 您 对 模 型 的 运 行 情 况 感 到 满 意, 则 可 以 对 新 数 据 ( 如 准 客 户 ) 进 行 评 分, 以 预 测 他 们 的 响 应 用 于 训 练 或 评 估 模 型 的 数 据 可 以 称 为 分 析 数 据 或 历 史 数 据 ; 评 分 数 据 也 可 以 称 为 操 作 数 据

33 建 模 概 述 章 3 建 模 节 点 概 述 IBM SPSS Modeler 提 供 了 各 种 借 助 机 器 学 习 人 工 智 能 和 统 计 学 的 建 模 方 法 通 过 建 模 选 项 板 中 的 方 法, 您 可 以 根 据 数 据 生 成 新 的 信 息 以 及 开 发 预 测 模 型 每 种 方 法 各 有 所 长, 同 时 适 用 于 解 决 特 定 类 型 的 问 题 SPSS Modeler 应 用 程 序 指 南 为 上 述 多 种 方 法 提 供 了 示 例 以 及 建 模 过 程 的 一 般 介 绍 本 指 南 既 作 为 联 机 教 程 提 供, 还 有 PDF 格 式 有 关 详 细 信 息, 请 参 阅 第 1 章 中 的 应 用 程 序 示 例 中 的 IBM SPSS Modeler 14.2 用 户 指 南 建 模 方 法 划 分 为 三 种 类 别 : Classification 关 联 细 分 分 类 模 型 分 类 模 型 使 用 一 个 或 多 个 输 入 字 段 的 值 来 预 测 一 个 或 多 个 输 出 ( 或 目 标 ) 字 段 的 值 这 些 技 术 的 部 分 示 例 为 : 决 策 树 (C&R 树 QUEST CHAID 和 C5.0 算 法 ) 回 归 ( 线 性 logistic 广 义 线 性 和 Cox 回 归 算 法 ) 神 经 网 络 Support Vector Machine (SVM) 和 贝 叶 斯 网 络 分 类 模 型 可 帮 助 组 织 预 测 已 知 的 结 果, 例 如 顾 客 是 否 购 买 流 失 或 某 交 易 是 否 符 合 某 种 已 知 的 犯 罪 模 式 其 建 模 方 法 包 括 机 器 学 习 规 则 归 纳 子 组 标 识 统 计 方 法 和 多 模 型 生 成 分 类 节 点 自 动 分 类 器 节 点 用 于 创 建 和 对 比 二 元 结 果 ( 是 或 否, 流 失 或 不 流 失 等 ) 的 若 干 不 同 模 型, 使 用 户 可 以 选 择 给 定 分 析 的 最 佳 处 理 方 法 由 于 支 持 多 种 建 模 算 法, 因 此 可 以 对 用 户 希 望 使 用 的 方 法 每 种 方 法 的 特 定 选 项 以 及 对 比 结 果 的 标 准 进 行 选 择 节 点 根 据 指 定 的 选 项 生 成 一 组 模 型 并 根 据 用 户 指 定 的 标 准 排 列 最 佳 候 选 项 的 顺 序 有 关 详 细 信 息, 请 参 阅 第 81 页 码 第 5 章 中 的 自 动 分 类 器 节 点 自 动 数 值 节 点 使 用 多 种 不 同 方 法 估 计 和 对 比 模 型 的 连 续 数 字 范 围 结 果 此 节 点 和 自 动 分 类 器 节 点 的 工 作 方 式 相 同, 因 此 可 以 选 择 要 使 用 和 要 在 单 个 建 模 传 递 中 使 用 多 个 选 项 组 合 进 行 测 试 的 算 法 受 支 持 的 算 法 包 括 神 经 网 络 C&R 树 CHAID 线 性 回 归 广 义 线 性 回 归 以 及 Support Vector Machine (SVM) 可 基 于 相 关 度 相 对 错 误 或 已 用 变 量 数 对 模 型 进 行 对 比 有 关 详 细 信 息, 请 参 阅 第 90 页 码 第 5 章 中 的 自 动 数 值 节 点 Copyright IBM Corporation 1994,

34 22 章 3 分 类 和 回 归 (C&R) 树 节 点 生 成 可 用 于 预 测 或 分 类 未 来 观 测 值 的 决 策 树 该 方 法 通 过 在 每 个 步 骤 最 大 限 度 降 低 不 纯 洁 度, 使 用 递 归 分 区 来 将 训 练 记 录 分 割 为 组 如 果 节 点 中 100% 的 观 测 值 都 属 于 目 标 字 段 的 一 个 特 定 类 别, 则 树 中 的 该 节 点 将 被 认 定 为 纯 洁 目 标 和 输 入 字 段 可 以 是 数 字 范 围 或 分 类 ( 名 义 有 序 或 标 志 ); 所 有 分 割 均 为 二 元 分 割 ( 即 仅 分 割 为 两 个 子 组 ) 有 关 详 细 信 息, 请 参 阅 第 130 页 码 第 6 章 中 的 C&R 树 节 点 QUEST 节 点 可 提 供 用 于 构 建 决 策 树 的 二 元 分 类 法, 此 方 法 的 设 计 目 的 是 减 少 大 型 C&R 树 分 析 所 需 的 处 理 时 间, 同 时 也 减 少 在 分 类 树 方 法 中 发 现 的 趋 势 以 便 支 持 允 许 有 多 个 分 割 的 输 入 输 入 字 段 可 以 是 数 字 范 围 ( 连 续 ), 但 目 标 字 段 必 须 是 分 类 所 有 分 割 都 是 二 元 的 有 关 详 细 信 息, 请 参 阅 第 131 页 码 第 6 章 中 的 QUEST 节 点 CHAID 使 用 卡 方 统 计 量 来 生 成 决 策 树, 以 确 定 最 佳 的 分 割 CHAID 与 C&R 树 和 QUEST 节 点 不 同, 它 可 以 生 成 非 二 元 树, 这 意 味 着 有 些 分 割 将 有 多 于 两 个 的 分 支 目 标 和 输 入 字 段 可 以 是 数 字 范 围 ( 连 续 ) 或 分 类 Exhaustive CHAID 是 CHAID 的 修 正 版, 它 对 所 有 分 割 进 行 更 彻 底 的 检 查, 但 计 算 时 间 比 较 长 有 关 详 细 信 息, 请 参 阅 第 130 页 码 第 6 章 中 的 CHAID 节 点 C5.0 节 点 构 建 决 策 树 或 规 则 集 该 模 型 的 工 作 原 理 是 根 据 在 每 个 级 别 提 供 最 大 信 息 收 获 的 字 段 分 割 样 本 目 标 字 段 必 须 为 分 类 字 段 允 许 进 行 多 次 多 于 两 个 子 组 的 分 割 有 关 详 细 信 息, 请 参 阅 第 146 页 码 第 6 章 中 的 C5.0 节 点 决 策 列 表 节 点 可 标 识 子 组 或 段, 显 示 与 总 体 相 关 的 给 定 二 元 结 果 的 似 然 度 的 高 低 例 如, 您 或 许 在 寻 找 那 些 最 不 可 能 流 失 的 客 户 或 最 有 可 能 对 某 个 商 业 活 动 作 出 积 极 响 应 的 客 户 通 过 定 制 段 和 并 排 预 览 备 选 模 型 来 比 较 结 果, 您 可 以 将 自 己 的 业 务 知 识 体 现 在 模 型 中 决 策 列 表 模 型 由 一 组 规 则 构 成, 其 中 每 个 规 则 具 备 一 个 条 件 和 一 个 结 果 规 则 依 顺 序 应 用, 相 匹 配 的 第 一 个 规 则 将 决 定 结 果 有 关 详 细 信 息, 请 参 阅 第 188 页 码 第 9 章 中 的 决 策 表 线 性 回 归 模 型 根 据 目 标 与 一 个 或 多 个 预 测 变 量 间 的 线 性 关 系 来 预 测 连 续 目 标 有 关 详 细 信 息, 请 参 阅 第 221 页 码 第 10 章 中 的 线 性 模 型 线 性 回 归 是 一 种 通 过 拟 合 直 线 或 平 面 以 实 现 汇 总 数 据 和 预 测 的 普 通 统 计 方 法, 它 可 使 预 测 值 和 实 际 输 出 值 之 间 的 差 异 最 小 化 因 子 / 主 成 分 分 析 节 点 提 供 了 用 于 降 低 数 据 复 杂 程 度 的 强 大 数 据 缩 减 技 术 主 成 份 分 析 (PCA) 可 找 出 输 入 字 段 的 线 性 组 合, 该 组 合 最 好 地 捕 获 了 整 个 字 段 集 合 中 的 方 差, 且 组 合 中 的 各 个 成 分 相 互 正 交 ( 相 互 垂 直 ) 因 子 分 析 则 尝 试 识 别 底 层 因 素, 这 些 因 素 说 明 了 观 测 的 字 段 集 合 内 的 相 关 性 模 式 这 两 种 方 式 的 目 标 都 是 找 到 有 效 概 括 原 始 字 段 集 中 的 信 息 的 一 小 部 分 导 出 字 段 有 关 详 细 信 息, 请 参 阅 第 255 页 码 第 10 章 中 的 主 成 份 分 析 / 因 子 节 点 特 征 选 择 节 点 会 根 据 某 组 条 件 ( 例 如 缺 失 值 百 分 比 ) 筛 选 可 删 除 的 输 入 字 段 ; 对 于 保 留 的 输 入, 将 相 对 于 指 定 目 标 对 其 重 要 性 进 行 排 序 例 如, 假 如 某 个 给 定 数 据 集 有 上 千 个 潜 在 输 入, 那 么 哪 些 输 入 最 有 可 能 用 于 对 患 者 结 果 进 行 建 模 呢? 有 关 详 细 信 息, 请 参 阅 第 64 页 码 第 4 章 中 的 特 征 选 择 节 点

35 23 建 模 概 述 判 别 式 分 析 所 做 的 假 设 比 logistic 回 归 的 假 设 更 严 格, 但 在 符 合 这 些 假 设 时, 判 别 式 分 析 可 以 作 为 logistic 回 归 分 析 的 有 用 替 代 项 或 补 充 有 关 详 细 信 息, 请 参 阅 第 263 页 码 第 10 章 中 的 判 别 式 节 点 Logistic 回 归 是 一 种 统 计 方 法, 它 可 根 据 输 入 字 段 的 值 对 记 录 进 行 分 类 它 类 似 于 线 性 回 归, 但 采 用 的 是 类 别 目 标 字 段 而 非 数 字 范 围 有 关 详 细 信 息, 请 参 阅 第 239 页 码 第 10 章 中 的 逻 辑 节 点 广 义 线 性 模 型 对 一 般 线 性 模 型 进 行 了 扩 展, 这 样 因 变 量 通 过 指 定 的 关 联 函 数 与 因 子 和 协 变 量 线 性 相 关 另 外, 该 模 型 允 许 因 变 量 呈 非 正 态 分 布 它 包 括 统 计 模 型 大 部 分 的 功 能, 其 中 包 括 线 性 回 归 logistic 回 归 用 于 计 数 数 据 的 对 数 线 性 模 型 以 及 区 间 删 失 生 存 模 型 有 关 详 细 信 息, 请 参 阅 第 270 页 码 第 10 章 中 的 GenLin 节 点 使 用 Cox 回 归 节 点, 您 可 以 在 已 有 的 检 查 记 录 中 建 立 时 间 事 件 的 生 存 模 型 该 模 型 会 生 成 一 个 生 存 函 数, 该 函 数 可 预 测 在 给 定 时 间 (t) 内 对 于 所 给 定 的 输 入 变 量 值 相 关 事 件 的 发 生 概 率 有 关 详 细 信 息, 请 参 阅 第 282 页 码 第 10 章 中 的 Cox 节 点 使 用 Support Vector Machine (SVM) 节 点, 可 以 将 数 据 分 为 两 组, 而 无 需 过 度 拟 合 SVM 可 以 与 大 量 数 据 集 配 合 使 用, 如 那 些 含 有 大 量 输 入 字 段 的 数 据 集 有 关 详 细 信 息, 请 参 阅 第 391 页 码 第 15 章 中 的 SVM 节 点 通 过 贝 叶 斯 网 络 节 点, 你 可 以 利 用 对 真 实 世 界 认 知 的 判 断 力 并 结 合 所 观 察 和 记 录 的 证 据 来 构 建 概 率 模 型 该 节 点 重 点 应 用 了 树 扩 展 简 单 贝 叶 斯 (TAN) 和 马 尔 可 夫 毯 网 络, 这 些 算 法 主 要 用 于 分 类 问 题 有 关 详 细 信 息, 请 参 阅 第 165 页 码 第 7 章 中 的 贝 叶 斯 网 络 节 点 自 学 响 应 模 型 (SLRM) 节 点 可 用 于 构 建 一 个 包 含 单 个 新 观 测 值 或 少 量 新 观 测 值 的 模 型, 通 过 此 模 型, 无 需 使 用 全 部 数 据 对 模 型 进 行 重 新 训 练 即 可 对 模 型 进 行 重 新 评 估 有 关 详 细 信 息, 请 参 阅 第 381 页 码 第 14 章 中 的 SLRM 节 点 时 间 序 列 节 点 估 计 时 间 序 列 数 据 的 指 数 平 滑 模 型 单 变 量 自 回 归 整 合 移 动 平 均 (ARIMA) 模 型 和 多 变 量 ARIMA( 即 变 换 函 数 ) 模 型, 并 生 成 未 来 性 能 的 预 测 数 据 在 时 间 序 列 节 点 之 前 必 须 有 时 间 区 间 节 点 有 关 详 细 信 息, 请 参 阅 第 361 页 码 第 13 章 中 的 时 间 序 列 建 模 节 点 The k- 最 近 相 邻 元 素 (KNN) 节 点 将 新 的 个 案 关 联 到 预 测 变 量 空 间 中 与 其 最 邻 近 的 k 个 对 象 的 类 别 或 值 ( 其 中 k 为 整 数 ) 类 似 个 案 相 互 靠 近, 而 不 同 个 案 相 互 远 离 有 关 详 细 信 息, 请 参 阅 第 396 页 码 第 16 章 中 的 KNN 节 点 关 联 模 型 关 联 模 型 查 找 您 数 据 中 的 模 式, 其 中 一 个 或 多 个 实 体 ( 如 事 件 购 买 或 属 性 ) 与 一 个 或 多 个 其 他 实 体 相 关 联 这 些 模 型 构 建 定 义 这 些 关 系 的 规 则 集 数 据 中 的 字 段 可 以 作 为 输 入 和 目 标 您 可 以 手 动 查 找 这 些 关 联, 但 关 联 规 则 算 法 可 以 更 快 速 地 完 成, 并 能 探 索 更

36 24 章 3 多 复 杂 的 模 式 Apriori 和 Carma 模 型 是 使 用 此 类 算 法 的 示 例 另 一 种 类 型 的 关 联 模 型 是 序 列 检 测 模 型, 后 者 可 以 在 按 时 间 建 立 结 构 的 数 据 中 查 找 顺 序 模 式 关 联 模 型 在 预 测 多 个 结 果 时 非 常 有 用, 例 如, 购 买 了 产 品 X 的 顾 客 也 购 买 了 产 品 Y 和 Z 关 联 模 型 可 以 将 特 定 结 论 ( 如 购 买 某 些 产 品 的 决 策 ) 与 一 组 条 件 关 联 起 来 关 联 规 则 算 法 相 对 于 更 标 准 的 决 策 树 算 法 (C5.0 和 C&RT) 的 优 势 在 于, 它 可 以 找 到 任 何 属 性 间 存 在 的 关 联 决 策 树 算 法 只 使 用 单 一 结 论 来 构 建 规 则, 而 关 联 算 法 则 试 图 找 到 更 多 规 则, 且 每 个 规 则 具 有 不 同 的 结 论 关 联 节 点 Apriori 节 点 从 数 据 抽 取 一 组 规 则, 即 抽 取 信 息 内 容 最 多 的 规 则 Apriori 节 点 提 供 五 种 选 择 规 则 的 方 法 并 使 用 复 杂 的 索 引 模 式 来 高 效 地 处 理 大 数 据 集 对 于 较 大 的 问 题,Apriori 训 练 的 速 度 通 常 较 快 ; 它 对 可 保 留 的 规 则 数 量 没 有 任 何 限 制, 而 且 可 处 理 最 多 带 有 32 个 前 提 条 件 的 规 则 Apriori 要 求 输 入 和 输 出 字 段 均 为 分 类 型 字 段, 但 因 为 它 专 为 处 理 此 类 型 数 据 而 进 行 优 化, 因 而 处 理 速 度 快 得 多 有 关 详 细 信 息, 请 参 阅 第 321 页 码 第 12 章 中 的 Apriori 节 点 CARMA 模 型 在 不 要 求 用 户 指 定 输 入 或 目 标 字 段 的 情 况 下 从 数 据 抽 取 一 组 规 则 与 Apriori 不 同 的 是 :CARMA 节 点 提 供 构 建 规 则 设 置 支 持 ( 前 项 和 后 项 支 持 ), 而 不 仅 仅 是 前 项 支 持 这 就 意 味 着 生 成 的 规 则 可 以 用 于 更 多 应 用 程 序, 例 如 用 于 找 到 后 项 为 想 在 节 日 期 间 促 销 的 商 品 的 产 品 或 服 务 ( 前 项 ) 的 列 表 有 关 详 细 信 息, 请 参 阅 第 324 页 码 第 12 章 中 的 CARMA 节 点 序 列 节 点 可 发 现 连 续 数 据 或 与 时 间 有 关 的 数 据 中 的 关 联 规 则 序 列 是 一 系 列 可 能 会 以 可 预 测 顺 序 发 生 的 项 目 集 合 例 如, 一 个 购 买 了 剃 刀 和 须 后 水 的 顾 客 可 能 在 下 次 购 物 时 购 买 剃 须 膏 序 列 节 点 基 于 CARMA 关 联 规 则 算 法, 该 算 法 使 用 有 效 的 两 步 法 来 发 现 序 列 有 关 详 细 信 息, 请 参 阅 第 343 页 码 第 12 章 中 的 序 列 节 点 细 分 模 型 细 分 模 型 将 数 据 划 分 为 具 有 类 似 输 入 字 段 模 式 的 记 录 段 或 聚 类 细 分 模 型 只 对 输 入 字 段 感 兴 趣, 没 有 输 出 或 目 标 字 段 的 概 念 细 分 模 型 的 示 例 为 Kohonen 网 络 K-Means 聚 类 两 步 聚 类 和 异 常 检 测 等 在 不 知 道 特 定 结 果 的 情 况 下 ( 例 如, 需 要 识 别 新 犯 罪 模 式 或 在 客 户 群 中 识 别 利 益 群 体 时 ), 细 分 模 型 ( 也 称 为 聚 类 模 型 ) 非 常 有 用 聚 类 模 型 主 要 用 来 确 定 相 似 记 录 的 组 并 根 据 它 们 所 属 的 组 来 为 记 录 添 加 标 签 此 方 法 的 优 点 在 于, 不 用 提 前 了 解 这 些 组 及 其 特 征 就 可 以 使 用, 它 使 聚 类 模 型 ( 其 中 没 有 需 要 模 型 预 测 的 预 定 义 输 出 或 目 标 字 段 ) 区 别 于 其 他 的 建 模 技 术 对 于 这 些 模 型 来 说, 没 有 正 确 或 错 误 的 结 果 之 分 模 型 的 值 由 模 型 捕 获 数 据 中 感 兴 趣 的 分 组 并 提 供 这 些 分 组 的 有 用 说 明 信 息 的 能 力 来 确 定 聚 类 模 型 通 常 用 于 创 建 在 后 续 分 析 中 用 作 输 入 的 聚 类 或 段 ( 例 如, 将 潜 在 用 户 分 成 几 个 相 似 的 子 组 )

37 25 建 模 概 述 细 分 节 点 自 动 聚 类 节 点 估 算 和 比 较 识 别 具 有 类 似 特 征 记 录 组 的 聚 类 模 型 节 点 工 作 方 式 与 其 他 自 动 建 模 节 点 相 同, 使 您 在 一 次 建 模 运 行 中 即 可 试 验 多 个 选 项 组 合 模 型 可 使 用 基 本 测 量 进 行 比 较, 以 尝 试 过 滤 聚 类 模 型 的 有 效 性 以 及 对 其 进 行 排 序, 并 提 供 一 个 基 于 特 定 字 段 的 重 要 性 的 测 量 有 关 详 细 信 息, 请 参 阅 第 95 页 码 第 5 章 中 的 自 动 聚 类 节 点 K-Means 节 点 将 数 据 集 聚 类 到 不 同 分 组 ( 或 聚 类 ) 此 方 法 将 定 义 固 定 的 聚 类 数 量, 将 记 录 迭 代 分 配 给 聚 类, 以 及 调 整 聚 类 中 心, 直 到 进 一 步 优 化 无 法 再 改 进 模 型 k-means 节 点 作 为 一 种 非 监 督 学 习 机 制, 它 并 不 试 图 预 测 结 果, 而 是 揭 示 隐 含 在 输 入 字 段 集 中 的 模 式 有 关 详 细 信 息, 请 参 阅 第 298 页 码 第 11 章 中 的 K-Means 节 点 Kohonen 节 点 会 生 成 一 种 神 经 网 络, 此 神 经 网 络 可 用 于 将 数 据 集 聚 类 到 各 个 差 异 组 此 网 络 训 练 完 成 后, 相 似 的 记 录 应 在 输 出 映 射 中 紧 密 地 聚 集, 差 异 大 的 记 录 则 应 彼 此 远 离 您 可 以 通 过 查 看 模 型 块 中 每 个 单 元 所 捕 获 观 测 值 的 数 量 来 找 出 规 模 较 大 的 单 元 这 将 让 您 对 聚 类 的 相 应 数 量 有 所 估 计 有 关 详 细 信 息, 请 参 阅 第 293 页 码 第 11 章 中 的 Kohonen 节 点 TwoStep 节 点 使 用 两 步 聚 类 方 法 第 一 步 完 成 简 单 数 据 处 理, 以 便 将 原 始 输 入 数 据 压 缩 为 可 管 理 的 子 聚 类 集 合 第 二 步 使 用 层 级 聚 类 方 法 将 子 聚 类 一 步 一 步 合 并 为 更 大 的 聚 类 TwoStep 具 有 一 个 优 点, 就 是 能 够 为 训 练 数 据 自 动 估 计 最 佳 聚 类 数 它 可 以 高 效 处 理 混 合 的 字 段 类 型 和 大 型 的 数 据 集 有 关 详 细 信 息, 请 参 阅 第 302 页 码 第 11 章 中 的 两 步 聚 类 节 点 异 常 检 测 节 点 确 定 不 符 合 正 常 数 据 格 式 的 异 常 观 测 值 ( 离 群 值 ) 即 使 离 群 值 不 匹 配 任 何 已 知 格 式 或 用 户 不 清 楚 自 己 的 查 找 对 象, 也 可 以 使 用 此 节 点 来 确 定 离 群 值 有 关 详 细 信 息, 请 参 阅 第 70 页 码 第 4 章 中 的 异 常 检 测 节 点 数 据 库 内 数 据 挖 掘 模 型 SPSS Modeler 支 持 对 数 据 库 提 供 商 的 数 据 挖 掘 工 具 和 建 模 工 具 进 行 整 合, 其 中 包 括 Oracle Data Miner IBM DB2 InfoSphere Warehouse 和 Microsoft Analysis Services 您 可 以 使 用 SPSS Modeler 应 用 程 序 在 数 据 库 中 构 建 评 分 和 存 储 模 型 有 关 详 细 信 息, 请 参 阅 产 品 DVD 上 的 SPSS Modeler 数 据 库 内 数 据 挖 掘 指 南 IBM SPSS Statistics 模 型 如 果 您 在 计 算 机 上 拥 有 IBM SPSS Statistics 安 装 和 许 可 的 一 个 副 本, 您 可 以 从 SPSS Modeler 访 问 和 运 行 某 些 SPSS Statistics 例 程 以 构 建 模 型 和 给 模 型 评 分 有 关 详 细 信 息, 请 参 阅 第 8 章 中 的 IBM SPSS Statistics 节 点 - 概 述 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点

38 26 章 3 其 他 信 息 此 外 还 有 一 些 有 关 建 模 算 法 的 详 细 文 档 有 关 详 细 信 息, 请 参 阅 产 品 DVD 上 的 SPSS Modeler 算 法 指 南 构 建 分 割 模 型 分 割 模 型 能 够 使 用 一 个 流 为 标 志 名 义 或 连 续 输 入 字 段 的 每 个 可 能 值 构 建 单 独 的 模 型, 可 从 一 个 模 型 块 访 问 全 部 得 出 模 型 输 入 字 段 的 可 能 值 可 能 对 模 型 具 有 非 常 不 同 的 影 响 使 用 分 割 建 模, 您 可 以 容 易 地 在 流 的 一 次 执 行 中 为 每 个 可 能 的 字 段 值 构 建 最 佳 拟 合 模 型 请 注 意, 交 互 建 模 会 话 不 能 使 用 分 割 您 通 过 互 动 建 模 单 独 指 定 每 个 模 型, 而 使 用 分 割 会 自 动 构 建 多 个 模 型, 所 以 使 用 分 割 没 有 优 势 分 割 建 模 会 指 定 某 个 输 入 字 段 为 分 割 字 段 在 类 型 规 范 中 设 置 分 割 的 字 段 角 色 完 成 此 操 作 : 图 片 3-1 指 定 输 入 字 段 为 分 割 字 段 您 仅 可 将 测 量 级 别 为 标 志 名 义 有 序 或 连 续 的 字 段 指 定 为 分 割 字 段 您 可 以 将 多 个 输 入 字 段 分 配 为 分 割 字 段 但 是 这 种 情 况 下, 所 创 建 模 型 数 量 可 能 大 增 给 所 选 分 割 字 段 值 的 每 个 可 能 组 合 构 建 一 个 模 型 例 如, 如 果 三 个 输 入 字 段 指 定 为 分 割 字 段, 每 个 字 段 具 有 三 个 可 能 值, 则 结 果 会 创 建 27 个 不 同 模 型 即 使 您 指 定 一 个 或 多 个 字 段 为 分 割 字 段 后, 您 仍 可 通 过 建 模 节 点 对 话 框 上 的 复 选 框 设 置 选 择 创 建 多 个 分 割 模 型 还 是 一 个 模 型 :

39 27 建 模 概 述 图 片 3-2 选 择 构 建 分 割 模 型 如 果 定 义 了 分 割 字 段 但 未 选 择 复 选 框, 则 只 生 成 一 个 模 型 同 样, 如 果 选 择 了 复 选 框 但 未 定 义 分 割 字 段, 则 分 割 被 忽 略, 生 成 一 个 模 型 当 您 执 行 流 时, 在 后 台 为 分 割 字 段 的 每 个 可 能 值 构 建 单 独 的 模 型, 但 只 有 一 个 模 型 块 置 于 模 型 选 项 板 和 流 工 作 区 中 以 下 分 割 符 号 表 示 分 割 模 型 块 : 图 片 3-3 流 中 的 分 割 模 型 块 当 您 浏 览 分 割 模 型 块 时, 您 会 看 到 一 个 已 经 创 建 的 所 有 单 独 模 型 的 列 表 :

40 28 章 3 图 片 3-4 拆 分 模 型 浏 览 器 您 可 以 通 过 在 浏 览 器 中 双 击 块 从 列 表 中 查 看 单 个 模 型 这 样 打 开 单 个 模 型 的 标 准 浏 览 器 窗 口 当 块 位 于 工 作 区 中 时, 双 击 缩 略 图 打 开 标 准 大 小 的 图 形 有 关 详 细 信 息, 请 参 阅 第 55 页 码 拆 分 模 型 浏 览 器 一 旦 将 模 型 创 建 为 分 割 模 型 之 后, 就 不 能 删 除 其 分 割 处 理, 也 不 能 从 分 割 建 模 节 点 或 模 型 块 下 游 撤 销 分 割 示 例 一 家 全 国 销 售 商 希 望 按 照 其 全 国 每 一 家 店 铺 的 产 品 类 别 估 算 销 售 情 况 则 其 通 过 使 用 分 割 建 模, 将 其 输 入 数 据 的 店 铺 字 段 指 定 为 分 割 字 段, 这 样 能 在 一 次 操 作 中 为 每 个 店 铺 的 每 个 分 类 构 建 单 独 的 模 型 其 然 后 可 以 使 用 所 得 信 息 比 只 使 用 一 个 模 型 更 加 准 确 地 控 制 库 存 水 平 分 割 和 分 区 分 割 与 分 区 共 有 某 些 特 征, 但 其 使 用 方 式 截 然 不 同 分 区 将 数 据 集 随 机 分 成 两 部 分 或 三 部 分 : 训 练 测 试 和 ( 可 选 ) 验 证, 并 用 于 测 试 单 个 模 型 的 性 能 分 割 将 数 据 集 分 成 与 分 割 字 段 可 能 值 一 样 多 的 部 分, 并 用 于 构 建 多 个 模 型 分 区 和 分 割 工 作 方 式 彼 此 完 全 不 同 您 可 以 在 建 模 节 点 中 选 择 一 个 两 个 或 一 个 也 不 选

41 29 建 模 概 述 支 持 拆 分 模 型 的 建 模 节 点 大 量 建 模 节 点 可 创 建 分 割 模 型 例 外 的 情 况 是 自 动 聚 类 时 间 序 列 主 成 分 分 析 / 因 子 特 征 选 择 SLRM 关 联 模 型 (Apriori Carma 和 序 列 ) 聚 类 模 型 (K-Means Kohonen 两 步 和 异 常 ) Statistics 模 型 以 及 用 于 数 据 库 内 建 模 的 节 点 支 持 拆 分 建 模 的 建 模 节 点 是 : C&R 树 贝 叶 斯 网 络 QUEST GenLin CHAID KNN C5.0 Cox 神 经 网 络 自 动 分 类 器 决 策 表 自 动 数 值 回 归 Logistic 判 别 SVM 受 分 割 影 响 的 特 征 使 用 拆 分 模 型 以 各 种 方 式 影 响 大 量 IBM SPSS Modeler 特 征 此 部 分 指 导 在 流 中 使 用 拆 分 模 型 连 同 其 他 节 点

42 30 章 3 记 录 选 项 节 点 当 在 包 含 样 本 节 点 的 流 中 使 用 拆 分 模 型, 按 拆 分 字 段 分 层 记 录, 以 实 现 记 录 的 平 均 抽 样 当 您 选 择 复 杂 作 为 样 本 方 法 时, 此 选 项 可 用 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 聚 类 和 分 层 设 置 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 如 果 流 包 含 平 衡 节 点, 注 意 平 衡 适 用 于 输 入 记 录 的 整 体 集 合, 而 非 拆 分 内 的 记 录 子 集 当 通 过 汇 总 节 点 分 类 汇 总 记 录 时, 如 果 您 想 计 算 每 个 拆 分 的 汇 总, 请 将 拆 分 字 段 设 置 为 关 键 字 段 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 汇 总 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 字 段 选 项 节 点 类 型 节 点 是 指 定 将 那 个 或 哪 些 字 段 用 作 拆 分 字 段 的 地 方 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 类 型 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 注 意, 尽 管 整 体 节 点 用 于 结 合 两 个 或 多 个 模 型 块, 但 是 不 能 用 于 颠 倒 拆 分 操 作, 因 为 拆 分 模 型 包 含 在 单 个 模 型 块 内 建 模 节 点 拆 分 模 型 不 支 持 预 测 变 量 重 要 性 ( 估 算 模 型 时 预 测 变 量 输 入 字 段 的 相 对 重 要 性 ) 计 算 构 建 拆 分 模 型 时 会 忽 略 预 测 变 量 重 要 性 设 置 KNN( 最 近 相 邻 元 素 ) 节 点 只 有 在 设 置 预 测 目 标 字 段 时, 才 能 支 持 拆 分 模 型 其 他 设 置 ( 只 标 识 最 近 相 邻 元 素 ) 不 创 建 模 型 如 果 选 择 选 项 自 动 选 择 k, 每 个 拆 分 模 型 可 能 有 不 同 数 量 的 最 近 相 邻 元 素 因 此, 整 体 模 型 生 成 的 列 数 等 于 所 有 拆 分 模 型 找 到 的 最 近 相 邻 元 素 的 最 大 数 对 于 那 些 最 近 邻 元 素 数 小 于 此 最 大 值 的 拆 分 模 型, 将 有 填 充 $null 值 的 相 应 列 数 有 关 详 细 信 息, 请 参 阅 第 396 页 码 第 16 章 中 的 KNN 节 点 数 据 库 建 模 节 点 数 据 库 内 建 模 节 点 不 支 持 拆 分 模 型 模 型 块 不 可 能 从 拆 分 模 型 块 导 出 到 PMML, 因 为 块 包 含 多 个 模 型, 而 PMML 不 支 持 这 种 包 装 但 是 可 能 导 出 到 文 本 或 HTML 建 模 节 点 字 段 选 项 所 有 建 模 节 点 均 有 一 个 字 段 选 项 卡, 在 此 选 项 卡 中 指 定 的 字 段 将 用 于 构 建 模 型

43 31 建 模 概 述 图 片 3-5 C5.0 建 模 节 点 字 段 选 项 卡 在 构 建 模 型 之 前, 需 要 指 定 要 将 哪 些 字 段 用 作 目 标 和 输 入 某 些 特 殊 情 况 下, 所 有 建 模 节 点 将 采 用 上 游 的 类 型 节 点 的 字 段 信 息 如 果 正 在 使 用 类 型 节 点 选 择 输 入 和 目 标 字 段, 则 不 必 在 此 选 项 卡 上 做 任 何 更 改 ( 特 殊 情 况 包 括 序 列 节 点 和 文 本 抽 取 节 点, 这 两 个 节 点 需 要 在 建 模 节 点 中 指 定 字 段 设 置 ) 使 用 类 型 节 点 设 置 该 选 项 通 知 节 点 使 用 来 自 上 游 类 型 节 点 的 字 段 信 息 这 是 默 认 值 使 用 自 定 义 设 置 该 选 项 通 知 节 点 使 用 在 此 处 指 定 的 字 段 信 息, 而 不 是 在 任 何 上 游 类 型 节 点 中 给 出 的 字 段 信 息 选 中 此 选 项 后, 请 根 据 需 要 指 定 下 面 的 字 段 注 意 : 未 显 示 所 有 节 点 的 所 有 字 段 使 用 交 易 格 式 ( 仅 Apriori CARMA MS 关 联 规 则 ISWAssociation 和 Oracle Apriori 节 点 ) 如 果 源 数 据 为 交 易 格 式, 则 选 中 此 复 选 框 此 格 式 的 记 录 具 有 两 个 字 段, 一 个 为 ID 字 段, 一 个 为 内 容 字 段 每 条 记 录 代 表 单 个 交 易 或 单 个 项, 关 联 项 通 过 相 同 的 ID 得 以 链 接 如 果 数 据 为 表 格 格 式, 则 取 消 选 中 此 复 选 框, 表 格 格 式 中 项 目 由 独 立 标 志 代 表, 其 中 每 个 标 志 字 段 代 表 某 个 特 定 项 是 否 存 在, 且 每 个 记 录 代 表 关 联 项 的 完 整 集 合 有 关 详 细 信 息, 请 参 阅 第 320 页 码 第 12 章 中 的 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据

44 32 章 3 ID 对 于 事 务 处 理 格 式 的 数 据, 请 从 列 表 中 选 择 ID 字 段 数 字 字 段 或 符 号 字 段 可 用 作 ID 字 段 此 字 段 的 每 个 唯 一 值 都 应 该 表 明 一 个 特 定 的 分 析 单 元 例 如, 在 市 场 购 物 篮 的 应 用 中, 每 个 ID 可 能 表 示 一 个 客 户 对 于 Web 日 志 分 析 应 用, 每 个 ID 可 能 代 表 一 个 计 算 机 ( 以 IP 地 址 表 示 ) 或 一 个 用 户 ( 以 登 录 数 据 表 示 ) ID 是 连 续 的 ( 仅 Apriori 和 CARMA 节 点 ) 如 果 您 的 数 据 进 行 了 预 先 排 序, 以 便 所 有 ID 相 同 的 记 录 在 数 据 流 中 分 组 在 一 起, 那 么 选 择 此 选 项 可 以 加 快 处 理 速 度 如 果 您 的 数 据 未 经 预 先 排 序 ( 或 者 您 不 确 定 ), 请 将 此 选 项 保 持 未 选 中 状 态, 则 该 节 点 将 自 动 对 数 据 进 行 排 序 注 意 : 如 果 您 的 数 据 未 经 排 序 而 您 选 择 了 此 选 项, 则 可 能 会 在 模 型 中 得 到 无 效 结 果 内 容 指 定 模 型 的 内 容 字 段 这 些 字 段 包 含 与 关 联 建 模 有 关 的 项 目 您 可 以 指 定 多 个 标 志 字 段 ( 如 果 数 据 为 表 格 格 式 ) 或 者 一 个 名 义 字 段 ( 如 果 数 据 为 事 务 格 式 ) 目 标 对 于 需 要 一 个 或 多 个 目 标 字 段 的 模 型, 请 选 择 目 标 字 段 或 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 目 标 类 似 评 估 ( 仅 适 合 自 动 聚 类 模 型 ) 不 为 聚 类 模 型 指 定 目 标, 但 可 选 择 一 个 评 估 字 段 以 确 定 其 重 要 性 等 级 此 外, 还 可 评 估 聚 类 区 分 此 字 段 值 的 程 度, 从 而 指 示 是 否 可 使 用 聚 类 来 预 测 此 字 段 输 入 选 择 输 入 字 段 或 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 输 入 类 似 分 区 该 字 段 允 许 您 使 用 指 定 字 段 将 数 据 分 割 为 几 个 不 同 的 样 本, 分 别 用 于 模 型 构 建 过 程 中 的 训 练 测 试 和 验 证 阶 段 通 过 用 某 个 样 本 生 成 模 型 并 用 另 一 个 样 本 对 模 型 进 行 测 试, 您 可 以 预 判 出 此 模 型 对 类 似 于 当 前 数 据 的 大 型 数 据 集 的 拟 合 优 劣 如 果 已 使 用 类 型 或 分 区 节 点 定 义 了 多 个 分 区 字 段, 则 必 须 在 每 个 用 于 分 区 的 建 模 节 点 的 字 段 选 项 卡 中 选 择 一 个 分 区 字 段 ( 如 果 仅 有 一 个 分 区 字 段, 则 将 在 启 用 分 区 后 自 动 引 入 此 字 段 ) 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 同 时 请 注 意, 要 在 分 析 时 应 用 选 定 分 区, 同 样 必 须 启 用 节 点 模 型 选 项 选 项 卡 中 的 分 区 功 能 ( 取 消 此 选 项, 则 可 以 在 不 更 改 字 段 设 置 的 条 件 下 禁 用 分 区 功 能 ) 分 割 对 于 分 割 模 型, 选 择 分 割 字 段 或 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 分 割 类 似 您 仅 可 将 测 量 级 别 为 标 志 名 义 有 序 或 连 续 的 字 段 指 定 为 分 割 字 段 选 为 分 割 字 段 的 字 段 无 法 用 作 目 标 输 入 分 区 频 率 或 权 重 字 段 有 关 详 细 信 息, 请 参 阅 第 26 页 码 构 建 分 割 模 型 使 用 频 率 字 段 此 选 项 允 许 您 选 择 某 个 字 段 作 为 频 率 权 重 如 果 训 练 数 据 中 的 每 条 记 录 代 表 多 个 单 元 ( 例 如, 您 正 在 使 用 聚 合 的 数 据 ), 则 可 采 用 此 项 字 段 值 应 是 每 个 记 录 代 表 的 单 位 的 数 量 有 关 详 细 信 息, 请 参 阅 第 33 页 码 使 用 频 率 和 权 重 字 段 注 意 : 如 果 您 看 到 错 误 消 息 元 数 据 ( 在 输 入 / 输 出 字 段 上 ) 无 效, 确 保 您 已 经 指 定 了 所 有 必 填 字 段, 如 频 率 字 段 使 用 权 重 字 段 此 选 项 允 许 您 选 择 某 个 字 段 作 为 案 例 权 重 个 案 权 重 将 作 为 对 输 出 字 段 各 个 水 平 上 方 差 的 差 异 的 一 种 考 量 有 关 详 细 信 息, 请 参 阅 第 33 页 码 使 用 频 率 和 权 重 字 段 结 果 对 于 规 则 归 纳 节 点 (Apriori), 请 选 择 在 最 终 规 则 集 中 用 作 结 果 的 字 段 ( 这 对 应 于 类 型 节 点 中 角 色 为 目 标 或 双 向 的 字 段 ) 条 件 对 于 规 则 归 纳 节 点 (Apriori), 请 选 择 在 最 终 规 则 集 中 用 作 条 件 的 字 段 ( 这 对 应 于 类 型 节 点 中 角 色 为 输 入 或 双 向 的 字 段 )

45 33 建 模 概 述 某 些 模 型 的 字 段 选 项 卡 与 本 节 所 述 字 段 选 项 卡 不 同 有 关 详 细 信 息, 请 参 阅 第 344 页 码 第 12 章 中 的 序 列 节 点 字 段 选 项 有 关 详 细 信 息, 请 参 阅 第 325 页 码 第 12 章 中 的 CARMA 节 点 字 段 选 项 使 用 频 率 和 权 重 字 段 频 率 和 权 重 字 段 用 于 赋 予 某 些 记 录 高 于 其 他 记 录 的 附 加 重 要 性, 例 如, 因 为 您 知 道 一 部 分 人 未 在 训 练 数 据 ( 权 重 ) 中 表 示 出 来, 或 者 因 为 一 个 记 录 代 表 多 个 相 同 观 测 值 ( 频 率 ) 频 率 字 段 的 值 应 为 正 整 数 频 率 权 重 小 于 或 等 于 零 的 记 录 将 排 除 在 分 析 之 外 非 整 数 频 率 权 重 将 四 舍 五 入 为 最 近 的 整 数 安 全 权 重 值 应 为 正 数 但 不 一 定 是 整 数 值 案 例 权 重 小 于 或 等 于 零 的 记 录 将 排 除 在 分 析 之 外 评 分 频 率 和 权 重 字 段 频 率 和 权 重 字 段 用 于 训 练 模 型, 但 不 用 于 评 分, 因 为 每 个 记 录 的 分 数 基 于 该 记 录 的 特 征, 而 与 它 代 表 的 观 测 值 个 数 无 关 例 如, 假 设 您 拥 有 以 下 数 据 : 已 婚 Yes Yes Yes Yes No No No 已 响 应 Yes Yes Yes No Yes No No 基 于 上 表, 可 以 得 出 这 样 的 结 论 : 四 分 之 三 的 已 婚 者 对 促 销 作 出 响 应 ; 而 三 分 之 二 的 未 婚 者 对 此 未 作 出 响 应 因 此, 您 可 以 相 应 地 作 出 如 下 的 新 记 录 : 已 婚 $- 已 响 应 $RP- 已 响 应 Yes Yes 0.75 (3/4) No No 0.67 (2/3) 此 外, 还 可 以 使 用 频 率 字 段 更 加 细 致 地 存 储 训 练 数 据 : 已 婚 已 响 应 Frequency Yes Yes 3 Yes No 1 No Yes 1 No No 2

46 34 章 3 因 为 此 表 完 全 代 表 同 一 数 据 集, 因 此 可 以 构 建 相 同 的 模 型 并 仅 根 据 婚 姻 状 况 预 测 响 应 率 如 果 评 分 数 据 中 有 十 位 已 婚 者 的 记 录, 则 无 论 这 十 个 人 是 代 表 十 条 独 立 的 记 录, 还 是 频 率 为 10 的 一 个 人, 都 可 预 测 他 们 每 位 的 回 答 均 为 是 虽 然 通 常 情 况 下 权 重 不 是 整 数, 但 可 以 认 为 它 近 似 表 示 记 录 的 重 要 性 这 就 是 对 记 录 进 行 评 分 时 不 使 用 频 率 和 权 重 字 段 的 原 因 评 估 和 比 较 模 型 某 些 模 型 类 型 可 支 持 频 率 字 段, 某 些 可 支 持 权 重 字 段, 还 有 一 些 可 同 时 支 持 这 两 种 字 段 但 在 使 用 这 两 种 字 段 的 所 有 情 况 中, 它 们 仅 用 于 构 建 模 型, 在 使 用 评 估 节 点 或 分 析 节 点 对 模 型 进 行 评 估 时, 或 者 在 使 用 受 自 动 分 类 器 节 点 和 自 动 数 值 节 点 支 持 的 大 部 分 方 法 进 行 模 型 排 序 时, 均 不 考 虑 使 用 这 两 种 字 段 例 如, 在 使 用 评 估 图 表 比 较 模 型 时 将 忽 略 频 率 和 权 重 值 因 此 可 以 在 使 用 频 率 和 权 重 字 段 的 模 型 与 不 使 用 这 两 种 字 段 的 模 型 之 间 进 行 级 别 比 较 但 同 时 意 味 着, 若 要 获 得 准 确 评 估, 必 须 使 用 不 依 赖 频 率 字 段 或 权 重 字 段 且 能 准 确 代 表 总 体 的 数 据 集 在 实 际 应 用 中, 要 执 行 此 操 作, 就 要 确 保 使 用 频 率 字 段 值 或 权 重 字 段 值 始 终 为 空 或 1 的 检 验 样 本 评 估 模 型 ( 这 种 限 制 仅 适 用 于 评 估 模 型 ; 如 果 训 练 样 本 和 检 验 样 本 的 频 率 值 或 权 重 值 始 终 为 1, 则 首 次 不 必 使 用 这 两 种 字 段 ) 如 果 使 用 自 动 分 类 器 基 于 利 润 对 模 型 进 行 排 序, 则 可 考 虑 频 率, 在 这 种 情 况 下 推 荐 使 用 此 方 法 若 有 必 要, 可 以 使 用 分 区 节 点, 将 数 据 分 割 为 训 练 样 本 和 检 验 样 本 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 建 模 节 点 分 析 选 项 许 多 建 模 节 点 都 包 括 分 析 选 项 卡, 使 用 该 选 项 卡 可 获 取 预 测 变 量 重 要 性 信 息 以 及 原 始 和 调 整 后 的 倾 向 得 分

47 35 建 模 概 述 图 片 3-6 建 模 节 点 中 的 分 析 选 项 卡 模 型 评 估 计 算 预 测 变 量 重 要 性 对 于 生 成 相 应 重 要 性 测 量 的 模 型, 可 以 显 示 一 个 图 表 来 说 明 评 估 模 型 中 每 个 预 测 变 量 的 相 对 重 要 性 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 请 注 意, 对 于 某 些 模 型, 计 算 预 测 变 量 重 要 性 ( 特 别 对 较 大 数 据 集 进 行 操 作 时 ) 可 能 需 要 花 较 长 时 间, 因 此 默 认 情 况 下, 对 于 某 些 模 型, 预 测 变 量 重 要 性 均 处 于 关 闭 状 态 预 测 变 量 重 要 性 对 于 决 策 列 表 模 型 不 可 用 有 关 详 细 信 息, 请 参 阅 第 45 页 码 预 测 变 量 重 要 性 倾 向 得 分 可 以 在 建 模 节 点 中 和 模 型 块 的 设 置 选 项 卡 上 启 用 倾 向 得 分 该 功 能 仅 在 所 选 目 标 为 标 志 字 段 时 才 可 用 有 关 详 细 信 息, 请 参 阅 第 36 页 码 倾 向 得 分 计 算 原 始 的 倾 向 得 分 原 始 的 倾 向 得 分 仅 从 基 于 训 练 数 据 的 模 型 中 导 出 如 果 模 型 预 测 值 为 真 ( 将 响 应 ), 则 倾 向 与 P 相 同, 其 中 P 为 预 测 的 可 能 性 如 果 模 型 预 测 的 值 为 假, 则 计 算 出 的 倾 向 为 (1 P)

48 36 章 3 如 果 构 建 模 型 时 选 择 了 此 选 项, 则 默 认 情 况 下 将 在 模 型 块 中 启 用 倾 向 得 分 不 过, 无 论 是 否 在 建 模 节 点 中 选 择 了 原 始 倾 向 得 分, 都 可 以 始 终 在 模 型 块 中 选 择 启 用 原 始 倾 向 得 分 对 模 型 进 行 评 分 时, 原 始 倾 向 得 分 将 被 添 加 到 将 RP 字 母 附 加 到 标 准 前 缀 的 字 段 中 例 如, 如 果 预 测 位 于 名 为 $R-churn 的 字 段 中, 则 倾 向 得 分 字 段 的 名 称 将 是 $RRP-churn 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 仅 仅 基 于 由 可 能 过 度 拟 合 的 模 型 给 定 的 估 计 上, 这 样 会 导 致 过 于 乐 观 地 评 估 倾 向 调 整 后 的 倾 向 尝 试 通 过 查 看 模 型 在 检 验 或 验 证 分 区 的 性 能 或 通 过 调 整 倾 向 来 弥 补, 以 相 应 地 给 作 出 更 好 的 估 计 此 设 置 要 求 流 中 存 在 有 效 的 分 区 字 段 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 与 原 始 置 信 度 分 数 不 同, 调 整 后 的 倾 向 得 分 必 须 在 构 建 模 型 时 计 算 ; 否 则, 对 模 型 块 进 行 评 分 时 该 分 数 将 不 存 在 对 模 型 进 行 评 分 时, 在 将 AP 字 母 附 加 到 标 准 前 缀 的 字 段 中 添 加 调 整 后 的 倾 向 得 分 例 如, 如 果 预 测 位 于 名 为 $R-churn 的 字 段 中, 则 倾 向 得 分 字 段 的 名 称 将 是 $RAP-churn 调 整 后 的 倾 向 得 分 不 适 用 于 logistic 回 归 模 型 在 计 算 调 整 后 的 倾 向 得 分 时, 必 须 尚 未 平 衡 用 于 计 算 的 检 验 或 验 证 分 区 为 避 免 这 一 点, 请 确 保 在 任 何 上 游 平 衡 节 点 中 选 中 仅 平 衡 训 练 数 据 选 项 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 为 平 衡 节 点 设 置 选 项 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 此 外, 如 果 已 在 上 游 获 取 了 复 杂 样 本, 则 会 导 致 调 整 后 的 倾 向 得 分 无 效 调 整 后 的 倾 向 得 分 不 适 用 于 增 强 型 树 和 规 则 集 模 型 有 关 详 细 信 息, 请 参 阅 第 158 页 码 第 6 章 中 的 增 强 型 C5.0 模 型 基 于 对 于 有 待 计 算 的 调 整 后 的 倾 向 得 分, 流 中 必 须 存 在 一 个 分 区 字 段 可 以 指 定 是 使 用 检 验 分 区 还 是 验 证 分 区 进 行 此 计 算 为 获 取 最 佳 结 果, 检 验 或 验 证 分 区 包 含 的 记 录 数 量 应 至 少 与 用 于 训 练 原 始 模 型 的 分 区 所 包 含 的 记 录 数 相 同 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 倾 向 得 分 对 于 返 回 预 测 为 是 或 否 的 模 型, 您 除 了 可 以 要 求 标 准 预 测 和 置 信 度 值 以 外, 还 可 要 求 倾 向 得 分 倾 向 得 分 指 示 特 定 结 果 或 响 应 的 可 能 性 例 如 : 表 3-1 倾 向 得 分 客 户 要 响 应 的 倾 向 Joe Smith 35% Jane Smith 15% 倾 向 得 分 仅 适 用 于 有 标 志 目 标 的 模 型, 并 且 指 示 为 字 段 定 义 的 值 为 真 的 可 能 性, 如 在 源 节 点 或 类 型 节 点 中 指 定 的 那 样 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 指 定 标 志 的 值 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点

49 37 建 模 概 述 倾 向 得 分 与 置 信 度 得 分 倾 向 得 分 与 置 信 度 得 分 不 同, 无 论 当 前 预 测 是 是 还 是 否, 置 信 度 得 分 都 能 应 用 于 当 前 预 测 例 如, 当 预 测 为 否 时, 较 高 的 置 信 度 实 际 上 意 味 着 不 响 应 的 可 能 性 较 大 倾 向 性 得 分 避 开 此 限 制, 以 便 轻 松 比 较 所 有 记 录 例 如, 置 信 度 为 0.85 的 否 预 测 将 转 换 为 0.15( 或 1 减 0.85) 的 原 始 倾 向 表 3-2 置 信 度 得 分 客 户 预 测 置 信 度 Joe Smith 会 响 应.35 Jane Smith 不 会 响 应.85 获 得 倾 向 得 分 可 以 在 建 模 节 点 中 的 分 析 选 项 卡 或 模 型 块 中 的 设 置 选 项 卡 上 启 用 倾 向 得 分 该 功 能 仅 在 所 选 目 标 为 标 志 字 段 时 才 可 用 有 关 详 细 信 息, 请 参 阅 第 34 页 码 建 模 节 点 分 析 选 项 也 可 以 通 过 整 体 节 点 计 算 倾 向 得 分, 具 体 取 决 于 所 用 的 整 体 方 法 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 整 体 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 计 算 调 整 后 的 倾 向 得 分 计 算 调 整 后 的 倾 向 得 分 将 作 为 构 建 模 型 过 程 的 一 部 分, 否 则 没 有 可 用 的 调 整 后 的 倾 向 得 分 构 建 模 型 后, 则 可 使 用 检 验 或 验 证 分 区 中 的 数 据 对 模 型 进 行 评 分, 同 时 通 过 在 该 分 区 上 分 析 原 始 模 型 的 性 能, 构 建 一 个 提 供 调 整 后 的 倾 向 得 分 的 新 模 型 根 据 模 型 的 类 型, 可 以 使 用 两 种 方 法 之 一 来 计 算 调 整 后 的 倾 向 得 分 对 于 规 则 集 模 型 和 树 模 型, 要 生 成 调 整 后 的 倾 向 分 数, 可 通 过 重 新 计 算 每 个 树 节 点 上 每 个 类 别 的 频 率 ( 适 用 于 树 模 型 ) 或 重 新 计 算 每 个 规 则 的 支 持 和 置 信 度 ( 适 用 于 规 则 集 模 型 ) 这 样 一 来, 请 求 调 整 后 的 倾 向 得 分 时 将 使 用 与 原 始 模 型 一 起 存 储 的 新 规 则 集 模 型 或 树 模 型 每 次 将 原 始 模 型 应 用 到 新 数 据 时, 都 会 随 之 将 新 模 型 应 用 到 原 始 倾 向 分 数 以 生 成 调 整 后 的 分 数 对 于 其 他 模 型, 通 过 对 检 验 或 验 证 分 区 上 的 原 始 模 型 进 行 评 分 而 生 成 的 记 录 将 按 其 原 始 倾 向 得 分 进 行 分 级 接 着, 对 定 义 非 线 性 函 数 的 神 经 网 络 模 型 进 行 训 练, 该 函 数 从 每 个 分 级 的 平 均 原 始 倾 向 中 映 射 到 相 同 分 级 的 平 均 观 测 倾 向 中 正 如 之 前 对 树 模 型 的 说 明, 得 出 的 神 经 网 络 模 型 将 与 原 始 模 型 一 起 存 储, 并 且 在 请 求 调 整 后 的 倾 向 分 数 时 应 用 到 原 始 倾 向 得 分 关 于 测 试 分 区 中 缺 失 值 的 警 告 说 明 测 试 / 验 证 分 区 中 缺 失 输 入 值 的 处 理 方 法 根 据 模 型 而 不 同 ( 请 参 阅 各 个 模 型 评 分 算 法 以 了 解 详 细 信 息 ) 有 缺 失 输 入 值 时,C5 模 型 无 法 计 算 调 整 倾 向

50 38 章 3 模 型 块 图 片 3-7 模 型 块 模 型 块 是 模 型 的 容 器, 其 中 包 含 一 组 规 则 公 式 或 方 程 式, 它 们 代 表 在 IBM SPSS Modeler 中 模 型 构 建 操 作 的 结 果 模 型 块 的 主 要 用 途 为 对 数 据 进 行 评 分 以 生 成 预 测, 或 允 许 进 一 步 分 析 模 型 属 性 在 屏 幕 上 打 开 模 型 块 后, 可 以 查 看 有 关 模 型 的 各 类 详 细 信 息, 例 如, 在 模 型 创 建 中 输 入 字 段 的 相 对 重 要 性 要 查 看 预 测, 则 需 要 进 一 步 添 加 并 执 行 处 理 或 输 出 节 点 有 关 详 细 信 息, 请 参 阅 第 57 页 码 使 用 流 中 的 模 型 块 图 片 3-8 从 建 模 节 点 到 模 型 块 的 模 型 链 接 在 成 功 地 执 行 建 模 节 点 后, 会 在 流 工 作 区 上 放 置 对 应 的 模 型 块, 并 以 金 色 钻 石 形 图 标 表 示 ( 因 此 称 之 为 块 ) 在 流 工 作 区 上 显 示 的 模 型 块, 带 有 到 位 于 建 模 节 点 之 前 的 最 近 合 适 节 点 的 连 接 ( 实 线 ), 以 及 到 建 模 节 点 本 身 的 链 接 ( 虚 线 ) 此 外, 模 型 块 也 放 置 在 位 于 SPSS Modeler 窗 口 右 上 角 的 模 型 选 项 板 中 从 任 一 位 置 均 可 选 中 模 型 块, 并 浏 览 模 型 的 详 细 信 息 在 建 模 节 点 成 功 执 行 后, 模 型 块 始 终 位 于 模 型 选 项 板 中 可 以 设 置 用 户 选 项 来 控 制 是 否 也 将 模 型 块 置 于 流 工 作 区 上 有 关 详 细 信 息, 请 参 阅 第 12 章 中 的 设 置 通 知 选 项 中 的 IBM SPSS Modeler 14.2 用 户 指 南 以 下 主 题 提 供 了 使 用 SPSS Modeler 中 模 型 块 的 相 关 信 息 要 深 入 了 解 所 用 到 的 算 法, 请 参 阅 SPSS Modeler 算 法 指 南 ( 可 从 IBM SPSS ModelerDVD 的 \Documentation 文 件 夹 中 获 取 ) 模 型 链 接 默 认 情 况 下, 在 流 工 作 区 上 显 示 的 模 型 块 带 有 指 向 创 建 它 的 建 模 节 点 的 链 接 这 在 具 有 多 个 模 型 块 的 复 杂 流 中 特 别 有 用, 它 使 您 能 够 识 别 将 被 每 个 建 模 节 点 更 新 的 模 型 块 每 个 链 接 包 含 一 个 指 示 当 建 模 节 点 执 行 时 是 否 替 换 模 型 的 符 号 有 关 详 细 信 息, 请 参 阅 第 40 页 码 替 换 模 型 定 义 和 删 除 模 型 链 接 您 可 以 在 工 作 区 上 手 动 定 义 和 删 除 模 型 链 接 在 定 义 新 的 链 接 后, 光 标 将 变 成 链 接 光 标

51 39 建 模 概 述 图 片 3-9 链 接 光 标 定 义 新 链 接 ( 上 下 文 菜 单 ) E 右 键 单 击 要 作 为 链 接 起 点 的 建 模 节 点 E 从 上 下 文 菜 单 中 选 择 定 义 模 型 链 接 E 单 击 要 作 为 链 接 终 点 的 模 型 块 定 义 新 链 接 ( 主 菜 单 ) E 单 击 要 作 为 链 接 起 点 的 建 模 节 点 E 在 主 菜 单 中, 选 择 : 编 辑 > 节 点 > 定 义 模 型 链 接 E 单 击 要 作 为 链 接 终 点 的 模 型 块 删 除 现 有 链 接 ( 上 下 文 菜 单 ) E 右 键 单 击 位 于 链 接 终 点 的 模 型 块 E 从 上 下 文 菜 单 中 选 择 删 除 模 型 链 接 或 者 : E 右 键 单 击 位 于 链 接 中 部 的 符 号 E 从 上 下 文 菜 单 中 选 择 删 除 链 接 删 除 现 有 链 接 ( 主 菜 单 ) E 单 击 要 删 除 其 链 接 的 建 模 节 点 或 模 型 块 E 在 主 菜 单 中, 选 择 : 编 辑 > 节 点 > 删 除 模 型 链 接 复 制 和 粘 贴 模 型 链 接 如 果 复 制 了 带 链 接 的 模 型 块, 但 未 包 括 其 建 模 节 点, 则 当 将 其 粘 贴 到 同 一 流 中 时, 粘 贴 后 的 模 型 块 将 具 有 到 建 模 节 点 的 链 接 新 链 接 具 有 与 原 始 链 接 相 同 的 模 型 替 换 状 态 ( 请 参 阅 替 换 模 型 第 40 页 码 ):

52 40 章 3 图 片 3-10 复 制 和 粘 贴 带 有 链 接 的 模 型 块 如 果 将 模 型 块 连 同 其 链 接 的 建 模 节 点 一 起 复 制 和 粘 贴, 则 不 论 对 象 复 制 到 同 一 流 还 是 新 流 中, 都 会 保 留 链 接 : 图 片 3-11 复 制 和 粘 贴 带 有 链 接 的 模 型 块 注 意 : 如 果 复 制 了 带 链 接 的 模 型 块, 但 未 包 括 其 建 模 节 点, 则 当 将 其 粘 贴 到 新 流 中 ( 或 不 包 含 建 模 节 点 的 超 节 点 中 ) 时, 链 接 将 被 破 坏, 并 且 只 会 粘 贴 模 型 块 模 型 链 接 和 超 节 点 如 果 定 义 超 节 点 包 含 链 接 模 型 的 建 模 节 点 或 模 型 块 ( 但 未 同 时 包 含 ), 链 接 将 被 破 坏 展 开 超 节 点 不 会 恢 复 链 接, 只 能 通 过 撤 销 创 建 超 节 点 来 完 成 此 操 作 替 换 模 型 您 可 以 选 择 在 重 新 执 行 创 建 模 型 块 的 建 模 节 点 时 是 否 替 换 ( 即 更 新 ) 现 有 模 型 块 如 果 关 闭 替 换 选 项, 则 重 新 执 行 建 模 节 点 时 将 创 建 新 的 模 型 块 注 意 : 替 换 模 型 不 同 于 刷 新 模 型, 它 是 指 在 方 案 中 更 新 模 型 有 关 详 细 信 息, 请 参 阅 第 9 章 中 的 模 型 刷 新 中 的 IBM SPSS Modeler 14.2 用 户 指 南 每 个 从 建 模 节 点 到 模 型 块 的 链 接 包 含 一 个 指 示 当 建 模 节 点 重 新 执 行 时 是 否 替 换 模 型 的 符 号

53 41 建 模 概 述 图 片 3-12 模 型 替 换 处 于 打 开 的 模 型 链 接 初 始 显 示 链 接 时, 模 型 替 换 处 于 打 开, 并 通 过 链 接 中 的 小 旭 日 形 符 号 指 示 在 此 状 态 下, 重 新 执 行 位 于 链 接 一 端 的 建 模 节 点 就 会 更 新 另 一 端 的 模 型 块 图 片 3-13 模 型 替 换 处 于 关 闭 的 模 型 链 接 如 果 模 型 替 换 处 于 关 闭, 则 链 接 符 号 替 换 为 灰 色 点 在 此 状 态 下, 重 新 执 行 位 于 链 接 一 端 的 建 模 节 点 会 在 工 作 区 上 新 增 一 个 更 新 后 的 模 型 块 在 任 一 情 况 下, 在 模 型 选 项 卡 中 是 更 新 现 有 模 型 块 还 是 新 增 模 型 块, 取 决 于 替 换 原 有 模 型 系 统 选 项 的 设 置 有 关 详 细 信 息, 请 参 阅 第 12 章 中 的 设 置 通 知 选 项 中 的 IBM SPSS Modeler 14.2 用 户 指 南 ). 执 行 顺 序 当 执 行 具 有 包 含 模 型 块 的 多 个 分 支 的 流 时, 首 先 对 流 进 行 评 估, 以 确 保 先 执 行 模 型 替 换 处 于 打 开 的 分 支, 然 后 再 执 行 使 用 结 果 模 型 块 的 任 何 分 支 如 果 您 的 需 求 更 为 复 杂, 则 可 通 过 脚 本 手 动 设 置 执 行 顺 序 更 改 模 型 替 换 设 置 要 更 改 模 型 替 换 设 置 : E 右 键 单 击 链 接 上 的 符 号 E 根 据 情 况 选 择 打 开 ( 关 闭 ) 模 型 替 换 注 意 : 在 模 型 链 接 上 的 模 型 替 换 设 置 将 覆 盖 在 用 户 选 项 对 话 框 的 通 知 选 项 卡 上 的 设 置 ( 工 具 > 选 项 > 用 户 选 项 ) 模 型 选 项 板 模 型 选 项 板 ( 位 于 管 理 器 窗 口 模 型 选 项 卡 中 ) 允 许 您 以 各 种 方 式 使 用 检 查 和 修 改 模 型 块

54 42 章 3 图 片 3-14 模 型 选 项 板 右 键 单 击 模 型 选 项 板 中 的 模 型 块, 打 开 带 有 以 下 选 项 的 上 下 文 菜 单 : 图 片 3-15 模 型 块 上 下 文 菜 单 添 加 到 流 将 模 型 块 添 加 到 当 前 活 动 流 如 果 流 中 存 在 选 定 节 点, 当 可 以 连 接 时, 模 型 块 将 连 接 到 选 定 节 点, 否 则 链 接 到 最 近 的 可 能 节 点 如 果 创 建 模 型 的 建 模 节 点 仍 然 在 流 中, 则 显 示 的 模 型 块 将 带 有 到 建 模 节 点 的 链 接 浏 览 打 开 模 型 块 的 模 型 浏 览 器 重 命 名 并 注 解 允 许 重 命 名 模 型 块 和 / 或 修 改 模 型 块 的 注 解 生 成 建 模 节 点 如 果 要 修 改 或 更 新 某 个 模 型 块, 但 无 法 使 用 用 于 创 建 该 模 型 的 流, 则 可 以 使 用 此 选 项 与 创 建 原 始 模 型 相 同 的 选 项 来 重 新 生 成 一 个 建 模 节 点 保 存 模 型, 将 模 型 另 存 为 将 此 模 型 块 保 存 到 外 部 生 成 模 型 (.gm) 二 进 制 文 件 存 储 模 型 在 IBM SPSS Collaboration and Deployment Services Repository 中 保 存 模 型 块 有 关 详 细 信 息, 请 参 阅 第 9 章 中 的 关 于 IBM SPSS Collaboration and Deployment Services Repository 中 的 IBM SPSS Modeler 14.2 用 户 指 南 导 出 PMML 以 预 测 模 型 标 记 语 言 (PMML) 格 式 导 出 模 型 块, 其 可 用 于 IBM SPSS Modeler 之 外 的 新 数 据 评 分 导 出 PMML 对 所 有 生 成 的 模 型 节 点 可 用 注 意 : 需 要 IBM SPSS Modeler Server 许 可 证 才 能 使 用 此 功 能 有 关 详 细 信 息, 请 参 阅 第 12 章 中 的 设 置 PMML 导 出 选 项 中 的 IBM SPSS Modeler 14.2 用 户 指 南

55 43 建 模 概 述 添 加 到 工 程 保 存 模 型 块 并 将 其 添 加 到 当 前 工 程 在 类 别 选 项 卡 上, 模 型 块 将 添 加 到 生 成 的 模 型 文 件 夹 中 在 CRISP-DM 选 项 卡 上, 此 节 点 将 被 添 加 到 默 认 工 程 阶 段 ( 请 参 阅 设 置 默 认 工 程 阶 段 以 获 取 更 改 默 认 工 程 阶 段 的 相 关 信 息 ) 删 除 从 选 项 板 中 删 除 此 模 型 块 图 片 3-16 模 型 选 项 板 上 下 文 菜 单 右 键 单 击 模 型 选 项 板 中 的 未 占 用 区 域, 打 开 带 有 以 下 选 项 的 上 下 文 菜 单 : 打 开 模 型 载 入 之 前 在 SPSS Modeler 中 创 建 的 模 型 块 检 索 模 型 从 IBM SPSS Collaboration and Deployment Services 存 储 库 检 索 保 存 的 模 型 载 入 选 项 板 从 外 部 文 件 载 入 保 存 的 模 型 选 项 板 检 索 选 项 板 从 IBM SPSS Collaboration and Deployment Services 存 储 库 检 索 保 存 的 模 型 选 项 板 保 存 选 项 板 将 模 型 选 项 板 的 所 有 内 容 保 存 到 外 部 生 成 模 型 选 项 板 (.gen) 文 件 存 储 选 项 板 将 模 型 选 项 板 的 所 有 内 容 保 存 到 IBM SPSS Collaboration and Deployment Services 存 储 库 中 清 除 选 项 板 从 选 项 板 中 删 除 所 有 模 型 块 将 选 项 板 添 加 到 工 程 保 存 模 型 选 项 板 并 将 其 添 加 到 当 前 工 程 在 类 别 选 项 卡 上, 模 型 块 将 添 加 到 生 成 的 模 型 文 件 夹 中 在 CRISP-DM 选 项 卡 上, 此 节 点 将 被 添 加 到 默 认 工 程 阶 段 导 入 PMML 从 外 部 文 件 载 入 模 型 可 以 打 开 浏 览 由 IBM SPSS Statistics 或 其 他 支 持 此 格 式 的 应 用 程 序 所 创 建 的 PMML 模 型 并 对 其 进 行 计 分 有 关 详 细 信 息, 请 参 阅 导 入 和 导 出 PMML 模 型 中 的 IBM SPSS Modeler 14.2 用 户 指 南 浏 览 模 型 块 使 用 模 型 块 浏 览 器 可 以 检 查 和 使 用 模 型 结 果 在 浏 览 器 中, 您 可 以 保 存 打 印 或 导 出 生 成 模 型, 检 查 模 型 摘 要, 查 看 或 编 辑 模 型 注 释 对 于 某 些 类 型 的 模 型 块, 还 可 以 生 成 新 的 节 点, 例 如 过 滤 节 点 或 规 则 集 节 点 对 于 某 些 模 型, 您 还 可 以 查 看 模 型 参 数, 如 规 则 或 聚 类 中 心 对 于 某 些 类 型 的 模 型 ( 基 于 树 的 模 型 和 聚 类 模 型 ), 您 可 以 查 看 其 模 型 结 构 的 图 表 显 示 使 用 模 型 块 浏 览 器 的 控 件 如 下 所 述

56 44 章 3 菜 单 文 件 菜 单 所 有 模 型 块 均 有 一 个 文 件 菜 单, 其 中 包 括 以 下 选 项 的 子 集 : 保 存 节 点 将 模 型 块 保 存 到 某 个 节 点 (.nod) 文 件 存 储 节 点 在 IBM SPSS Collaboration and Deployment Services 存 储 库 中 保 存 模 型 块 页 眉 和 页 脚 允 许 从 模 型 块 打 印 时 对 页 面 的 页 眉 和 页 脚 进 行 编 辑 页 面 设 置 允 许 从 模 型 块 打 印 时 更 改 页 面 设 置 打 印 预 览 显 示 模 型 块 的 打 印 预 览 从 子 菜 单 中 选 择 要 预 览 的 信 息 打 印 打 印 模 型 块 的 内 容 从 子 菜 单 中 选 择 要 打 印 的 信 息 打 印 视 图 打 印 当 前 视 图 或 所 有 视 图 导 出 文 本 将 模 型 块 内 容 导 出 到 某 个 文 本 文 件 从 子 菜 单 中 选 择 要 导 出 的 信 息 导 出 HTML 将 模 型 块 内 容 导 出 到 HTML 文 件 从 子 菜 单 中 选 择 要 导 出 的 信 息 导 出 PMML 以 预 测 模 型 标 记 语 言 (PMML) 格 式 导 出 模 型, 导 出 的 文 件 可 在 其 它 PMML 兼 容 软 件 中 使 用 注 意 : 需 要 IBM SPSS Modeler Server 许 可 证 才 能 使 用 此 功 能 有 关 详 细 信 息, 请 参 阅 第 12 章 中 的 设 置 PMML 导 出 选 项 中 的 IBM SPSS Modeler 14.2 用 户 指 南 导 出 SQL 以 SQL( 结 构 化 查 询 语 言 ) 格 式 导 出 模 型, 导 出 的 文 件 可 在 其 它 数 据 库 中 编 辑 使 用 注 意 : SQL 导 出 仅 在 以 下 模 型 中 可 用 :C5 C&RT CHAID QUEST 线 性 回 归 Logistic 回 归 神 经 网 络 主 成 分 分 析 / 因 子 以 及 决 策 列 表 模 型 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 支 持 SQL 生 成 的 节 点 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南 生 成 菜 单 多 数 模 型 块 还 具 有 一 个 生 成 菜 单, 通 过 此 菜 单 可 以 生 成 基 于 模 型 块 的 新 节 点 此 菜 单 中 的 可 用 选 项 取 决 于 您 所 浏 览 模 型 的 类 型 请 查 看 具 体 的 模 型 块 类 型, 以 详 细 了 解 您 可 从 特 定 模 型 中 生 成 的 内 容 视 图 菜 单 在 模 型 块 的 模 型 选 项 卡 上, 此 菜 单 允 许 您 显 示 或 隐 藏 在 当 前 模 式 下 可 用 的 各 类 直 观 表 示 工 具 栏 要 使 全 部 工 具 栏 可 用, 可 从 常 规 工 具 栏 中 选 择 编 辑 模 式 ( 画 笔 图 标 ) 预 览 按 钮 某 些 模 型 块 具 有 预 览 按 钮, 允 许 您 查 看 模 型 数 据 的 样 本, 包 括 由 建 模 过 程 创 建 的 额 外 字 段 默 认 显 示 的 行 数 为 10, 不 过 可 以 在 流 属 性 中 更 改 此 值 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 设 置 流 选 项 中 的 IBM SPSS Modeler 14.2 用 户 指 南 添 加 到 当 前 工 程 按 钮 保 存 模 型 块 并 将 其 添 加 到 当 前 工 程 在 类 别 选 项 卡 上, 模 型 块 将 添 加 到 生 成 的 模 型 文 件 夹 中 在 CRISP-DM 选 项 卡 上, 此 节 点 将 被 添 加 到 默 认 工 程 阶 段 ( 请 参 阅 设 置 默 认 工 程 阶 段 以 获 取 更 改 默 认 工 程 阶 段 的 相 关 信 息 ) 模 型 块 概 要 / 信 息 模 型 块 的 概 要 选 项 卡 或 信 息 视 图 显 示 了 关 于 字 段 构 建 设 置 和 模 型 评 估 过 程 的 信 息 结 果 以 树 状 视 图 显 示, 通 过 单 击 指 定 项 可 以 扩 展 或 合 并 树 状 视 图

57 45 建 模 概 述 分 析 显 示 模 型 相 关 信 息 具 体 详 细 信 息 因 模 型 类 型 而 异, 这 些 信 息 可 在 每 种 模 型 块 的 相 应 章 节 中 找 到 此 外, 如 果 已 执 行 附 加 到 该 建 模 节 点 的 分 析 节 点, 则 还 会 在 此 部 分 显 示 该 分 析 中 的 信 息 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 分 析 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 字 段 列 出 构 建 模 型 时 用 作 目 标 和 输 入 的 字 段 对 于 分 割 模 型, 也 列 出 确 定 分 割 的 字 段 构 建 设 置 / 选 项 包 含 有 关 在 构 建 模 型 中 使 用 的 设 置 的 信 息 训 练 概 要 显 示 模 型 类 型 用 于 创 建 模 型 的 流 模 型 创 建 者 模 型 构 建 完 成 时 间 和 模 型 构 建 所 用 时 间 预 测 变 量 重 要 性 通 常, 您 将 需 要 将 建 模 工 作 专 注 于 最 重 要 的 预 测 变 量 字 段, 并 考 虑 删 除 或 忽 略 那 些 最 不 重 要 的 变 量 预 测 变 量 重 要 性 图 表 可 以 在 模 型 估 计 中 指 示 每 个 预 测 变 量 的 相 对 重 要 性, 从 而 帮 助 您 实 现 这 一 点 由 于 它 们 是 相 对 值, 因 此 显 示 的 所 有 预 测 变 量 的 值 总 和 为 1.0 预 测 变 量 的 重 要 性 与 模 型 精 确 性 无 关 它 只 与 每 个 预 测 变 量 在 预 测 中 的 重 要 性 有 关, 而 不 涉 及 预 测 是 否 精 确

58 46 章 3 图 片 3-17 预 测 变 量 重 要 性 图 表 预 测 变 量 重 要 性 对 于 可 生 成 相 应 重 要 性 统 计 标 准 的 模 型 可 用, 包 括 神 经 网 络 模 型 决 策 树 (C&R 树 C5.0 CHAID 和 QUEST) 贝 叶 斯 网 络 模 型 判 别 式 模 型 SVM 和 SLRM 模 型 线 性 和 logistic 回 归 模 型 广 义 线 性 模 型 以 及 最 近 相 邻 元 素 (KNN) 模 型 对 于 这 些 模 型 中 的 大 部 分 而 言, 可 以 在 建 模 节 点 的 分 析 选 项 卡 上 启 用 预 测 变 量 重 要 性 有 关 详 细 信 息, 请 参 阅 第 34 页 码 建 模 节 点 分 析 选 项 有 关 KNN 模 型, 请 参 阅 相 邻 元 素 第 400 页 码 注 意 : 拆 分 模 型 不 支 持 预 测 变 量 重 要 性 构 建 拆 分 模 型 时 会 忽 略 预 测 变 量 重 要 性 设 置 有 关 详 细 信 息, 请 参 阅 第 26 页 码 构 建 分 割 模 型

59 47 建 模 概 述 计 算 预 测 变 量 重 要 性 所 用 的 时 间 远 远 大 于 建 构 模 型 的 用 时, 特 别 当 使 用 较 大 数 据 集 时 对 于 SVM 和 logistic 回 归 模 型, 计 算 变 量 重 要 性 的 用 时 比 对 其 他 模 型 执 行 此 操 作 的 用 时 都 要 长, 所 以 默 认 情 况 下 这 两 种 模 型 均 禁 用 此 功 能 使 用 一 个 包 含 许 多 预 测 变 量 的 数 据 集 时, 使 用 特 征 选 择 节 点 进 行 初 始 筛 选 可 以 较 快 地 生 成 结 果 ( 请 参 阅 以 下 内 容 ) 如 果 适 用, 可 以 从 检 验 分 区 计 算 出 预 测 变 量 重 要 性 否 则, 就 使 用 训 练 数 据 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 预 测 变 量 重 要 性 也 适 用 于 SLRM 模 型, 但 需 要 使 用 SLRM 算 法 进 行 计 算 有 关 详 细 信 息, 请 参 阅 第 385 页 码 第 14 章 中 的 SLRM 模 型 块 可 以 使 用 IBM SPSS Modeler 的 图 表 工 具 进 行 交 互 编 辑, 并 保 存 图 表 还 可 以 根 据 预 测 变 量 重 要 性 图 表 中 的 信 息 生 成 过 滤 节 点 有 关 详 细 信 息, 请 参 阅 第 47 页 码 基 于 重 要 性 过 滤 变 量 预 测 变 量 重 要 性 和 特 征 选 择 在 某 些 情 况 下, 模 型 块 中 显 示 的 预 测 变 量 重 要 性 图 表 可 能 似 乎 给 出 与 特 征 选 择 节 点 相 似 的 结 果 当 特 征 选 择 基 于 每 个 输 入 字 段 与 特 定 目 标 ( 与 其 他 输 入 无 关 ) 的 关 系 强 度 对 输 入 字 段 进 行 排 序 时, 预 测 变 量 重 要 性 图 表 将 显 示 此 特 定 模 型 中 各 个 输 入 的 相 对 重 要 性 因 此, 在 筛 选 输 入 时 使 用 特 征 选 择 可 能 较 为 保 守 例 如, 如 果 工 作 职 务 和 工 作 类 别 与 薪 资 的 关 系 强 度 相 同, 特 征 选 择 就 会 指 示 这 两 者 都 很 重 要 但 在 建 模 时, 还 需 考 虑 交 互 性 和 相 关 性 这 样, 当 两 个 输 入 的 大 部 分 信 息 都 相 同 时, 您 可 能 会 发 现 仅 使 用 了 两 个 输 入 之 一 在 实 际 应 用 中, 特 征 选 择 对 预 筛 选 最 有 用, 特 别 是 处 理 包 含 大 量 变 量 的 较 大 数 据 集 时, 而 预 测 变 量 重 要 性 在 微 调 模 型 时 更 为 有 用 基 于 重 要 性 过 滤 变 量 还 可 以 根 据 预 测 变 量 重 要 性 图 表 中 的 信 息 生 成 过 滤 节 点 标 记 要 包 括 在 图 表 上 的 预 测 变 量 ( 若 适 用 ), 然 后 从 菜 单 中 选 择 : 生 成 > 过 滤 节 点 ( 预 测 变 量 重 要 性 ) 或 > 字 段 选 择 ( 预 测 变 量 重 要 性 ) 图 片 3-18 基 于 重 要 性 过 滤 预 测 变 量 变 量 的 最 大 数 包 括 或 排 除 等 于 指 定 数 字 的 最 重 要 预 测 变 量 重 要 性 大 于 包 括 或 排 除 所 有 相 对 重 要 性 高 于 指 定 值 的 预 测 变 量

60 48 章 3 整 体 模 型 整 体 模 型 提 供 了 有 关 整 体 中 的 组 件 模 型 和 整 体 性 能 的 信 息 图 片 3-19 模 型 摘 要 视 图 主 ( 独 立 视 图 ) 工 具 栏 允 许 您 选 择 使 用 整 体 或 参 考 模 型 来 进 行 评 分 如 果 使 用 整 体 进 行 评 分, 您 还 可 以 选 择 组 合 规 则 这 些 更 改 不 需 要 重 新 执 行 模 型 ; 但 是, 这 些 选 择 将 保 存 到 模 型 ( 块 ) 以 供 评 分 和 / 或 下 游 模 型 评 估 它 们 也 会 影 响 从 整 体 查 看 器 导 出 的 PMML 组 合 规 则 在 对 整 体 评 分 时, 此 规 则 用 于 组 合 来 自 基 本 模 型 的 预 测 值, 以 计 算 整 体 得 分 值 可 以 使 用 投 票 最 高 概 率 或 最 高 平 均 概 率 来 组 合 分 类 目 标 的 整 体 预 测 值 投 票 选 择 在 基 本 模 型 中 最 常 具 有 最 高 概 率 的 类 别 最 高 概 率 选 择 在 所 有 基 本 模 型 中 达 到 单 一 最 高 概 率 的 类 别 最 高 平 均 概 率 选 择 当 类 别 概 率 在 基 本 模 型 中 取 平 均 值 时 具 有 最 高 值 的 类 别 可 以 通 过 对 来 自 基 本 模 型 的 预 测 值 取 平 均 值 或 中 位 数, 对 连 续 目 标 的 整 体 预 测 值 进 行 组 合

61 49 建 模 概 述 默 认 值 取 自 在 建 模 过 程 中 生 成 的 指 定 更 改 组 合 规 则 会 重 新 计 算 模 型 精 确 性 并 更 新 模 型 精 确 性 的 所 有 视 图 也 会 更 新 预 测 变 量 重 要 性 图 表 如 果 选 择 参 考 模 型 用 于 评 分, 则 此 控 件 将 被 禁 用 显 示 所 有 组 合 规 则 选 择 该 选 项 时, 所 有 可 用 组 合 规 则 的 结 果 将 显 示 在 模 型 质 量 图 表 中 组 件 模 型 精 确 性 图 表 也 将 更 新 以 显 示 每 种 投 票 方 式 的 参 考 线 模 型 摘 要 图 片 3-20 模 型 摘 要 视 图 模 型 摘 要 视 图 是 整 体 质 量 和 差 异 性 的 快 照 摘 要

62 50 章 3 质 量 该 图 表 显 示 与 参 考 模 型 和 navie 模 型 相 比 较 的 最 终 模 型 精 确 性 精 确 性 越 大, 模 型 越 好 的 格 式 ; 最 佳 模 型 将 具 有 最 高 精 确 性 对 于 分 类 目 标, 精 确 性 就 是 预 测 值 与 观 测 值 匹 配 的 记 录 百 分 比 对 于 连 续 目 标, 精 确 性 为 1 减 去 预 测 中 的 平 均 绝 对 误 差 ( 预 测 值 的 绝 对 平 均 值 减 去 观 测 值 ) 与 预 测 值 范 围 ( 最 大 预 测 值 减 去 最 小 预 测 值 ) 的 比 率 对 于 bagging 整 体, 参 考 模 型 是 构 建 在 整 个 培 训 分 区 上 的 标 准 模 型 对 于 boosted 整 体, 参 考 模 型 是 第 一 个 组 件 模 型 如 果 未 构 建 模 型, 则 由 Naive 模 型 代 表 精 确 性, 并 将 所 有 记 录 分 配 给 模 态 类 别 不 会 为 连 续 目 标 计 算 Naive 模 型 差 异 性 该 图 表 显 示 用 于 构 建 整 体 的 组 件 模 型 间 的 观 点 差 异 性, 以 越 大 则 差 异 性 越 大 格 式 表 示 这 是 一 种 基 本 模 型 间 预 测 差 异 程 度 的 测 量 差 异 性 对 boosted 整 体 模 型 不 可 用, 同 时 也 不 会 对 连 续 目 标 显 示 预 测 变 量 重 要 性 图 片 3-21 预 测 变 量 重 要 性 视 图 通 常, 您 将 需 要 将 建 模 工 作 专 注 于 最 重 要 的 预 测 变 量 字 段, 并 考 虑 删 除 或 忽 略 那 些 最 不 重 要 的 变 量 预 测 变 量 重 要 性 图 表 可 以 在 模 型 估 计 中 指 示 每 个 预 测 变 量 的 相 对 重 要 性, 从 而 帮 助 您 实 现 这 一 点 由 于 它 们 是 相 对 值, 因 此 显 示 的 所 有 预 测 变 量 的 值 总 和 为 1.0 预 测 变 量 的 重 要 性 与 模 型 精 确 性 无 关 它 只 与 每 个 预 测 变 量 在 预 测 中 的 重 要 性 有 关, 而 不 涉 及 预 测 是 否 精 确

63 51 建 模 概 述 预 测 变 量 重 要 性 对 所 有 整 体 模 型 均 不 可 用 预 测 变 量 集 在 组 件 模 型 之 间 可 能 会 有 所 不 同, 但 可 以 为 至 少 在 一 个 组 件 模 型 中 使 用 的 预 测 变 量 计 算 重 要 性 预 测 变 量 频 率 图 片 3-22 预 测 变 量 频 率 视 图 由 于 选 择 的 建 模 方 法 或 预 测 变 量 选 择 不 同, 预 测 变 量 集 在 组 件 模 型 间 也 可 能 不 同 预 测 变 量 频 率 图 是 一 个 点 图, 显 示 了 预 测 变 量 在 整 体 组 件 模 型 中 的 分 布 每 个 点 代 表 包 含 预 测 变 量 的 一 个 或 多 个 组 件 模 型 预 测 变 量 绘 制 在 y 轴 上, 并 以 频 率 的 降 序 排 序 ; 因 此, 最 顶 端 的 是 在 最 多 组 件 模 型 中 使 用 的 预 测 变 量, 而 最 低 端 的 是 在 最 少 组 件 模 型 中 使 用 的 预 测 变 量 将 显 示 排 在 前 10 位 的 预 测 变 量 出 现 频 率 最 高 的 预 测 变 量 通 常 是 最 重 要 的 此 图 对 于 使 预 测 变 量 集 在 组 件 模 型 间 保 持 一 致 的 方 法 没 用

64 52 章 3 组 件 模 型 精 确 性 图 片 3-23 组 件 模 型 精 确 性 视 图 该 图 表 是 组 件 模 型 预 测 精 确 性 的 点 图 每 个 点 代 表 在 y 轴 上 绘 制 了 精 确 性 水 平 的 一 个 或 多 个 组 件 模 型 悬 停 在 任 意 点 上 可 获 得 对 应 的 单 独 组 件 模 型 的 信 息 参 考 线 该 图 显 示 整 体 的 颜 色 编 码 线 以 及 参 考 模 型 和 naïve 模 型 对 应 于 要 用 于 评 分 的 模 型 的 线 的 旁 边 会 显 示 一 个 复 选 标 记 互 动 该 图 表 会 在 您 更 改 组 合 规 则 时 更 新 Boosted 整 体 为 boosted 整 体 显 示 一 个 线 图

65 53 建 模 概 述 图 片 3-24 整 体 精 确 性 视 图,boosted 整 体

66 54 章 3 组 件 模 型 详 细 信 息 图 片 3-25 组 件 模 型 详 细 信 息 视 图 该 表 显 示 关 于 组 件 模 型 的 信 息, 按 行 列 出 默 认 情 况 下, 组 件 模 型 按 模 型 编 号 的 升 序 排 序 您 可 以 按 任 意 列 的 值 对 这 些 行 进 行 升 序 或 降 序 排 序 模 型 代 表 组 件 模 型 创 建 顺 序 的 数 字 精 确 性 百 分 比 形 式 的 整 体 精 确 性 方 法 建 模 方 法 预 测 变 量 组 件 模 型 中 使 用 的 预 测 变 量 数 模 型 大 小 模 型 大 小 取 决 于 建 模 方 法 : 对 于 树 模 型, 它 是 树 中 节 点 的 数 量 ; 对 于 线 性 模 型, 它 是 系 数 的 数 量 ; 对 于 神 经 网 络, 它 是 神 经 元 的 数 量 记 录 训 练 样 本 中 输 入 记 录 的 加 权 数 量

67 55 建 模 概 述 自 动 数 据 准 备 图 片 3-26 自 动 数 据 准 备 视 图 此 视 图 显 示 在 自 动 数 据 准 备 (ADP) 步 骤 中 排 除 了 哪 些 字 段, 以 及 转 换 字 段 的 派 生 方 式 等 信 息 对 于 每 个 转 换 或 排 除 字 段, 在 此 表 中 列 出 了 字 段 名 在 分 析 中 的 角 色, 以 及 ADP 步 骤 所 采 取 的 操 作 这 些 字 段 按 其 名 称 的 字 母 升 序 排 列 操 作 Trim outliers( 如 果 显 示 ) 表 示 位 于 截 断 值 ( 平 均 值 的 3 个 标 准 差 ) 之 外 的 连 续 预 测 变 量 值 被 设 为 截 断 值 分 割 模 型 的 模 型 块 分 割 模 型 的 模 型 块 可 以 访 问 分 割 创 建 的 所 有 单 独 模 型 分 割 模 型 块 包 含 : 创 建 的 所 有 拆 分 模 型 列 表, 连 同 每 个 模 型 的 统 计 量 集 合 有 关 整 体 模 型 的 信 息 从 拆 分 模 型 列 表 中, 您 可 以 打 开 单 个 模 型 以 进 一 步 检 查 拆 分 模 型 浏 览 器 模 型 选 项 卡 列 出 块 中 包 含 的 所 有 模 型, 以 各 种 形 式 提 供 有 关 拆 分 模 型 的 统 计 量 它 有 以 下 两 种 一 般 形 式, 具 体 取 决 于 建 模 节 点

68 56 章 3 图 片 3-27 拆 分 模 型 浏 览 器 排 序 方 式 使 用 此 列 表 选 择 列 出 模 型 的 顺 序 您 可 以 根 据 任 何 显 示 列 的 值 将 列 表 按 升 序 或 降 序 排 序 或 者, 单 击 列 标 题, 按 该 列 将 列 表 排 序 默 认 是 总 精 确 性 的 降 序 显 示 / 隐 藏 列 菜 单 单 击 此 按 钮, 以 显 示 菜 单, 以 便 选 择 单 个 列 以 显 示 或 隐 藏 查 看 如 果 您 正 在 使 用 分 区, 您 可 以 选 择 查 看 培 训 数 据 或 测 试 数 据 的 结 果 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 对 于 每 个 拆 分, 详 细 信 息 显 示 如 下 : 图 形 指 示 此 模 型 数 据 分 布 的 缩 略 图 当 块 位 于 工 作 区 中 时, 双 击 缩 略 图 打 开 标 准 大 小 的 图 形 模 型 模 型 类 型 图 标 双 击 图 标 打 开 此 特 定 分 割 的 模 型 块 分 割 字 段 建 模 节 点 中 指 定 为 分 割 字 段 的 字 段 及 其 各 个 可 能 值 分 割 中 记 录 数 此 特 定 分 割 中 涉 及 的 记 录 数 使 用 的 字 段 编 号 基 于 所 用 输 入 字 段 的 数 量 排 序 拆 分 模 型 总 准 确 度 (%) 在 该 拆 分 中 与 记 录 总 数 有 关 的 拆 分 模 型 正 确 预 测 出 的 记 录 百 分 比

69 57 建 模 概 述 图 片 3-28 拆 分 模 型 查 看 器 拆 分 列 标 题 显 示 用 于 创 建 拆 分 的 字 段, 而 单 元 格 则 是 拆 分 值 双 击 任 意 拆 分 打 开 模 型 查 看 器 以 用 于 该 拆 分 的 建 模 精 确 性 百 分 比 形 式 的 整 体 精 确 性 模 型 大 小 模 型 大 小 取 决 于 建 模 方 法 : 对 于 树 模 型, 它 是 树 中 节 点 的 数 量 ; 对 于 线 性 模 型, 它 是 系 数 的 数 量 ; 对 于 神 经 网 络, 它 是 神 经 元 的 数 量 记 录 训 练 样 本 中 输 入 记 录 的 加 权 数 量 使 用 流 中 的 模 型 块 模 型 块 置 于 流 中, 允 许 您 对 新 数 据 进 行 评 分 并 生 成 新 节 点 计 分 数 据 允 许 使 用 从 模 型 构 建 中 获 得 的 数 据 来 创 建 新 记 录 的 预 测 要 查 看 评 分 结 果, 需 要 为 模 型 块 添 加 终 端 节 点 ( 即 处 理 或 输 出 节 点 ) 并 执 行 终 端 节 点 对 于 某 些 模 型 而 言, 还 可 从 模 型 块 中 获 得 有 关 预 测 质 量 的 其 他 信 息, 例 如 置 信 度 值 或 到 聚 类 中 心 的 距 离 生 成 新 节 点 时 允 许 基 于 生 成 模 型 的 结 构 来 方 便 地 创 建 新 节 点 例 如, 执 行 输 入 字 段 选 择 的 多 数 模 型 允 许 生 成 过 滤 节 点, 此 过 滤 节 点 仅 传 递 模 型 所 标 识 的 重 要 输 入 字 段 使 用 模 型 块 对 数 据 进 行 评 分 E 将 模 型 块 连 接 到 向 其 传 递 数 据 的 数 据 源 或 流

70 58 章 3 图 片 3-29 使 用 模 型 块 评 分 E 将 一 个 或 多 个 处 理 或 输 出 节 点 ( 如 表 或 分 析 节 点 ) 添 加 或 连 接 到 模 型 块 E 执 行 模 型 块 中 的 某 个 下 游 节 点 注 意 : 不 能 使 用 非 精 练 规 则 节 点 对 数 据 进 行 计 分 要 对 基 于 关 联 规 则 模 型 的 数 据 进 行 计 分, 请 使 用 非 精 练 规 则 节 点 来 生 成 规 则 集 模 型 块, 并 使 用 规 则 集 模 型 块 进 行 计 分 有 关 详 细 信 息, 请 参 阅 第 338 页 码 第 12 章 中 的 从 关 联 模 型 块 生 成 规 则 集 使 用 模 型 块 生 成 处 理 节 点 E 在 此 选 项 板 中 浏 览 模 型, 或 者 在 流 工 作 区 中 编 辑 模 型 E 在 模 型 块 浏 览 器 窗 口 的 生 成 菜 单 中 选 择 所 需 节 点 类 型 可 用 选 项 将 因 模 型 块 类 型 的 不 同 而 有 所 不 同 请 查 看 具 体 的 模 型 块 类 型, 以 详 细 了 解 您 可 从 特 定 模 型 中 生 成 的 内 容 重 新 生 成 建 模 节 点 如 果 要 修 改 或 更 新 某 个 模 型 块, 但 无 法 使 用 用 于 创 建 该 模 型 的 流, 则 可 以 使 用 与 创 建 原 始 模 型 相 同 的 选 项 来 重 新 生 成 一 个 建 模 节 点 E 要 重 新 构 建 模 型, 右 键 单 击 模 型 选 项 板 中 的 模 型, 然 后 选 择 生 成 建 模 节 点 E 此 外, 当 浏 览 模 型 时, 请 选 择 生 成 菜 单 中 的 生 成 建 模 节 点 多 数 情 况 下, 重 新 生 成 的 建 模 节 点 应 与 创 建 原 始 模 型 的 建 模 节 点 在 功 能 上 一 致 对 决 策 树 模 型 而 言, 还 可 以 将 交 互 式 会 话 过 程 中 的 其 它 设 置 存 储 到 节 点, 重 新 生 成 建 模 节 点 的 过 程 中 将 启 用 使 用 树 型 指 令 选 项

71 59 建 模 概 述 对 于 决 策 列 表 模 型 而 言, 将 启 用 使 用 保 存 的 交 互 会 话 信 息 选 项 有 关 详 细 信 息, 请 参 阅 第 192 页 码 第 9 章 中 的 决 策 列 表 模 型 选 项 对 于 时 间 序 列 模 型 而 言, 将 启 用 使 用 现 有 模 型 继 续 评 估 选 项, 使 用 该 选 项 可 以 重 新 生 成 包 含 当 前 数 据 的 原 有 模 型 有 关 详 细 信 息, 请 参 阅 第 364 页 码 第 13 章 中 的 时 间 序 列 模 型 选 项 导 入 和 导 出 PMML 模 型 PMML( 也 称 为 预 测 模 型 标 记 语 言 ) 是 一 种 XML 格 式, 用 于 描 述 数 据 挖 掘 和 统 计 模 型, 包 括 模 型 的 输 入 用 于 为 数 据 挖 掘 准 备 数 据 的 变 换, 以 及 定 义 模 型 自 身 的 参 数 IBM SPSS Modeler 可 导 入 和 导 出 PMML, 使 得 其 能 够 与 其 他 支 持 此 格 式 的 应 用 程 序 ( 如 IBM SPSS Statistics) 共 享 模 型 注 意 : 需 要 IBM SPSS Modeler Server 许 可 证 才 能 导 出 PMML 有 关 PMML 的 详 细 信 息, 请 参 阅 数 据 挖 掘 组 网 站 ( 导 出 模 型 PMML 导 出 支 持 大 多 数 模 型 类 型, 这 些 模 型 类 型 生 成 在 SPSS Modeler 中 有 关 详 细 信 息, 请 参 阅 支 持 PMML 的 模 型 类 型 中 的 IBM SPSS Modeler 14.2 用 户 指 南 E 右 键 单 击 模 型 调 色 板 上 的 模 型 块 ( 或 者, 双 击 工 作 区 上 的 模 型 块 并 选 择 文 件 菜 单 ) E 在 菜 单 上, 单 击 导 出 PMML 图 片 3-30 以 PMML 格 式 导 出 模 型 E 在 导 出 ( 或 保 存 ) 对 话 框 中, 指 定 此 模 型 的 目 标 目 录 及 唯 一 名 称 注 意 : 可 在 用 户 选 项 对 话 框 中 为 PMML 导 出 更 改 选 项 在 主 菜 单 中, 单 击 : 工 具 > 选 项 > 用 户 选 项 然 后 单 击 PMML 选 项 卡

72 60 章 3 有 关 详 细 信 息, 请 参 阅 第 14.2 用 户 指 南 12 章 中 的 设 置 PMML 导 出 选 项 中 的 IBM SPSS Modeler 导 入 以 PMML 格 式 保 存 的 模 型 以 PMML 格 式 从 SPSS Modeler 或 其 他 应 用 程 序 中 导 出 的 模 型 可 以 导 入 到 模 型 调 色 板 中 有 关 详 细 信 息, 请 参 阅 支 持 PMML 的 模 型 类 型 中 的 IBM SPSS Modeler 14.2 用 户 指 南 E 在 模 型 调 色 板 上, 右 键 单 击 调 色 板 并 从 菜 单 中 选 择 导 入 PMML 图 片 3-31 以 PMML 格 式 导 入 模 型 E 选 择 要 导 入 的 文 件 并 按 需 要 为 变 量 标 签 指 定 选 项 E 单 击 打 开

73 61 建 模 概 述 图 片 3-32 为 使 用 PMML 格 式 保 存 的 模 型 选 择 XML 文 件 如 果 模 型 中 存 在 变 量 标 签, 则 使 用 这 些 标 签 PMML 可 为 数 据 字 典 中 的 变 量 同 时 指 定 变 量 名 和 变 量 标 签 ( 例 如 Referrer ID, 简 称 RefID) 如 果 在 最 初 导 出 的 PMML 中 存 在 变 量 标 签, 则 选 中 此 选 项 可 以 使 用 这 些 变 量 标 签 如 果 已 选 中 变 量 标 签 选 项 但 在 PMML 中 没 有 变 量 标 签, 则 按 常 规 使 用 变 量 名 支 持 PMML 的 模 型 类 型 PMML 导 出 SPSS Modeler 模 型 在 IBM SPSS Modeler 中 创 建 的 下 列 模 型 都 可 导 出 为 PMML 4.0 格 式 : C&R 树 QUEST CHAID 线 性 回 归 神 经 网 络

74 62 章 3 C5.0 Logistic 回 归 Genlin SVM 贝 叶 斯 网 络 Apriori Carma 序 列 K-Means Kohonen 两 步 KNN Statistics 模 型 在 SPSS Modeler 中 创 建 的 下 列 模 型 都 可 导 出 为 PMML 3.2 格 式 : 决 策 表 数 据 库 本 地 模 型 对 于 使 用 数 据 库 本 地 算 法 生 成 的 模 型, 仅 在 IBM InfoSphere Warehouse 模 型 中 可 使 用 PMML 导 出 无 法 导 出 使 用 Microsoft 的 Analysis Services 或 Oracle Data Miner 创 建 的 模 型 另 外 请 注 意, 以 PMML 格 式 导 出 的 IBM 模 型 无 法 重 新 导 入 到 SPSS Modeler 中 有 关 详 细 信 息, 请 参 阅 第 2 章 中 的 数 据 库 建 模 概 述 中 的 IBM SPSS Modeler 14.2 数 据 库 内 数 据 挖 掘 指 南 PMML 导 入 SPSS Modeler 可 以 导 入 并 评 分 由 所 有 IBM SPSS Statistics 产 品 的 当 前 版 本 生 成 的 PMML 模 型, 包 括 从 SPSS Modeler 导 出 的 模 型 和 由 SPSS Statistics 17.0 或 以 后 版 本 生 成 的 模 型 或 转 换 PMML 这 实 质 上 意 味 着 评 分 引 擎 可 评 分 的 任 何 PMML, 以 下 除 外 : 无 法 导 入 Apriori CARMA 及 异 常 检 测 模 型 将 PMML 模 型 导 入 到 SPSS Modeler 中 后, 虽 然 可 以 对 其 进 行 评 分, 但 不 能 进 行 浏 览 ( 注 意, 其 中 包 括 最 初 从 SPSS Modeler 中 导 出 的 模 型 为 避 免 此 限 制, 可 将 模 型 按 生 成 的 模 型 文 件 (*.gm) 导 出 而 不 是 按 PMML 导 出 ) 以 PMML 格 式 导 出 的 IBM InfoSphere Warehouse 模 型 无 法 再 导 入 在 导 入 时 会 执 行 有 限 的 验 证, 但 在 试 图 对 模 型 评 分 时 会 执 行 全 面 验 证 因 此 有 可 能 导 入 成 功, 但 评 分 却 失 败 或 产 生 不 正 确 的 结 果 非 精 练 模 型 非 精 炼 模 型 包 含 从 数 据 中 抽 出 的 信 息, 但 并 不 用 于 直 接 生 成 预 测 即 这 些 模 型 不 能 添 加 到 流 非 精 练 的 模 型 在 生 成 模 型 选 项 板 上 显 示 为 未 打 磨 的 钻 石

75 63 建 模 概 述 图 片 3-33 非 精 练 模 型 的 图 标 要 查 看 非 精 练 规 则 模 型 的 详 细 信 息, 右 键 单 击 模 型, 然 后 选 择 上 下 文 菜 单 中 的 浏 览 像 其 他 在 IBM SPSS Modeler 中 生 成 的 模 型 一 样, 各 种 选 项 卡 将 提 供 所 创 建 模 型 的 相 关 概 要 和 规 则 信 息 生 成 节 点 生 成 菜 单 允 许 您 基 于 规 则 创 建 新 节 点 选 择 节 点 生 成 选 择 节 点 来 选 择 当 前 选 定 规 则 所 要 应 用 的 记 录 如 果 未 选 择 任 何 规 则, 此 选 项 则 禁 用 规 则 集 生 成 规 则 集 节 点 预 测 单 个 目 标 字 段 的 值 有 关 详 细 信 息, 请 参 阅 第 338 页 码 第 12 章 中 的 从 关 联 模 型 块 生 成 规 则 集

76 筛 选 模 型 章 4 筛 选 字 段 和 记 录 分 析 的 预 备 阶 段 中 可 以 使 用 多 个 建 模 节 点 来 查 找 对 建 模 最 有 用 的 字 段 和 记 录 可 使 用 特 征 选 择 节 点 来 按 照 重 要 性 筛 选 字 段 并 为 之 排 序, 以 及 使 用 异 常 检 测 节 点 来 查 找 不 符 合 正 常 数 据 已 知 模 式 的 异 常 记 录 特 征 选 择 节 点 会 根 据 某 组 条 件 ( 例 如 缺 失 值 百 分 比 ) 筛 选 可 删 除 的 输 入 字 段 ; 对 于 保 留 的 输 入, 将 相 对 于 指 定 目 标 对 其 重 要 性 进 行 排 序 例 如, 假 如 某 个 给 定 数 据 集 有 上 千 个 潜 在 输 入, 那 么 哪 些 输 入 最 有 可 能 用 于 对 患 者 结 果 进 行 建 模 呢? 有 关 详 细 信 息, 请 参 阅 第 64 页 码 特 征 选 择 节 点 异 常 检 测 节 点 确 定 不 符 合 正 常 数 据 格 式 的 异 常 观 测 值 ( 离 群 值 ) 即 使 离 群 值 不 匹 配 任 何 已 知 格 式 或 用 户 不 清 楚 自 己 的 查 找 对 象, 也 可 以 使 用 此 节 点 来 确 定 离 群 值 有 关 详 细 信 息, 请 参 阅 第 70 页 码 异 常 检 测 节 点 注 意 : 异 常 检 测 并 不 考 虑 任 何 特 定 的 目 标 ( 相 关 ) 字 段, 也 不 考 虑 这 些 字 段 是 否 与 正 在 预 测 的 模 式 相 关, 只 是 通 过 基 于 模 型 中 所 选 字 段 集 的 聚 类 分 析 确 定 异 常 记 录 或 观 测 值 由 于 上 述 原 因, 您 可 能 想 将 异 常 检 测 与 特 征 选 择 或 字 段 筛 选 和 排 序 的 其 他 方 法 结 合 使 用 例 如, 您 可 以 使 用 特 征 选 择 来 确 定 与 某 个 特 定 目 标 相 关 的 最 重 要 的 字 段, 然 后 使 用 异 常 检 测 寻 找 针 对 这 些 字 段 而 言 最 异 常 的 记 录 ( 另 外 一 个 方 法 是 构 建 一 个 决 策 树 模 型, 然 后 将 所 有 错 误 分 类 的 记 录 视 为 可 能 的 异 常 进 行 检 查 但 是 此 方 法 很 难 用 于 进 行 大 批 量 的 复 制 和 自 动 化 ) 特 征 选 择 节 点 数 据 挖 掘 问 题 可 能 包 括 成 百 甚 至 上 千 个 可 用 作 输 入 的 备 选 字 段 从 而 花 费 大 量 的 时 间 和 精 力 来 检 查 模 型 究 竟 应 该 包 含 哪 些 字 段 或 变 量 为 了 缩 小 选 择 范 围, 可 以 使 用 特 征 选 择 算 法 来 识 别 对 某 给 定 分 析 最 为 重 要 的 字 段 例 如, 如 果 你 试 着 根 据 多 种 因 素 来 预 测 患 者 结 果, 那 么 哪 些 因 素 最 为 重 要 呢? 特 征 选 择 由 以 下 三 个 步 骤 组 成 : 筛 选 删 除 不 重 要 或 有 问 题 的 输 入 记 录 或 个 案 ( 例 如 输 入 字 段 含 有 过 多 缺 失 值, 或 者 输 入 字 段 的 变 异 太 大 或 太 少 而 变 得 无 用 ) 秩 对 剩 余 输 入 进 行 排 序 并 根 据 重 要 性 进 行 分 级 选 择 识 别 在 后 续 模 型 中 使 用 的 功 能 子 集, 例 如 通 过 仅 保 留 最 重 要 的 输 入, 过 滤 或 排 除 所 有 其 它 输 入 当 下, 许 多 组 织 的 数 据 均 已 超 载, 因 此 简 化 和 加 快 建 模 过 程 是 特 征 选 择 的 根 本 优 势 通 过 将 注 意 力 迅 速 集 中 到 最 重 要 的 字 段 上, 可 以 降 低 所 需 的 计 算 量, 并 且 可 以 方 便 地 找 到 因 某 种 原 因 被 忽 略 的 小 而 重 要 的 关 系, 最 终 获 得 更 简 单 精 确 和 易 于 解 释 的 模 型 通 过 减 少 模 型 中 的 字 段 数 量, 可 以 减 少 评 分 时 间 以 及 未 来 迭 代 中 所 收 集 的 数 据 量 Copyright IBM Corporation 1994,

77 65 筛 选 模 型 减 少 字 段 数 量 特 别 有 利 于 Logistic 回 归 这 样 的 模 型 ( 字 段 数 量 限 制 在 350 个 ) 示 例 有 个 电 话 公 司 拥 有 一 个 数 据 仓 库, 该 数 据 仓 库 包 含 5000 名 公 司 客 户 对 某 次 促 销 活 动 的 响 应 的 信 息 数 据 包 含 有 客 户 年 龄 职 业 收 入 电 话 使 用 情 况 的 统 计 数 据 等 大 量 数 据 三 个 目 标 字 段 表 示 客 户 是 否 对 三 个 报 价 做 出 响 应 该 公 司 想 利 用 这 些 数 据 来 预 测 哪 些 客 户 最 可 能 在 将 来 对 类 似 报 价 做 出 响 应 有 关 详 细 信 息, 请 参 阅 第 10 章 中 的 筛 选 预 测 变 量 ( 特 征 选 择 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 要 求 单 个 目 标 字 段 ( 其 角 色 设 置 为 目 标 ), 以 及 要 根 据 目 标 进 行 筛 选 或 排 序 的 多 个 输 入 字 段 目 标 和 输 入 字 段 均 具 有 连 续 ( 数 值 范 围 ) 或 分 类 的 测 量 级 别 特 征 选 择 模 型 设 置 模 型 选 项 卡 上 的 设 置 含 有 标 准 模 型 选 项 以 及 用 于 调 整 输 入 字 段 筛 选 条 件 的 设 置 选 项 图 片 4-1 特 征 选 择 的 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 筛 选 输 入 字 段 筛 选 就 是 剔 除 不 提 供 关 于 输 入 / 目 标 关 系 的 任 何 有 用 信 息 的 输 入 或 观 测 值 筛 选 选 项 只 依 据 在 问 题 中 使 用 字 段 的 属 性, 而 不 考 虑 该 字 段 针 对 于 选 定 目 标 字 段 的 预 测 能 力 被 筛 选 出 来 的 字 段 将 不 参 与 有 关 输 入 排 序 的 计 算, 同 时 还 可 选 择 将 这 些 字 段 过 滤 掉, 或 是 从 用 于 建 模 的 数 据 中 删 除 可 根 据 以 下 标 准 筛 选 字 段 : 缺 失 值 的 最 大 百 分 比 筛 选 具 有 过 多 缺 失 值 的 字 段, 用 占 记 录 总 数 的 百 分 比 来 表 示 缺 失 值 百 分 比 大 的 字 段 几 乎 不 提 供 任 何 预 测 信 息

78 66 章 4 单 个 类 别 中 的 记 录 最 大 百 分 比 筛 选 相 对 于 记 录 总 数 而 言 同 个 类 别 中 具 有 过 多 记 录 的 字 段 例 如, 如 果 数 据 库 中 95% 的 客 户 开 同 一 类 型 的 车, 则 此 信 息 无 助 于 区 分 客 户 任 何 超 过 指 定 最 大 值 的 字 段 都 将 被 筛 选 掉 此 选 项 仅 适 用 于 分 类 字 段 表 示 为 记 录 百 分 比 的 最 大 类 别 数 筛 选 掉 相 对 于 记 录 总 数 而 言 具 有 过 多 类 别 的 字 段 如 果 很 高 百 分 比 的 类 别 只 含 有 一 个 观 测 值, 则 该 字 段 用 处 有 限 例 如, 如 果 每 名 客 户 都 戴 不 同 的 帽 子, 则 此 信 息 在 建 立 行 为 模 式 模 型 时 就 不 太 可 能 有 用 此 选 项 仅 适 用 于 分 类 字 段 最 小 变 异 系 数 筛 选 变 异 系 数 小 于 或 等 于 指 定 最 小 值 的 字 段 此 度 量 值 是 输 入 字 段 标 准 偏 差 与 输 入 字 段 均 值 之 间 的 比 值 如 果 此 值 接 近 0, 则 变 量 值 的 变 异 性 就 不 高 此 选 项 仅 适 用 于 连 续 ( 数 字 范 围 ) 字 段 最 小 标 准 差 筛 选 标 准 差 小 于 或 等 于 指 定 最 小 值 的 字 段 此 选 项 仅 适 用 于 连 续 ( 数 字 范 围 ) 字 段 带 有 缺 失 数 据 的 记 录 目 标 字 段 具 有 缺 失 值 或 所 有 输 入 都 具 有 缺 失 值 的 记 录 或 观 测 值 将 被 从 用 于 排 序 的 计 算 式 中 排 除 特 征 选 择 选 项 选 项 选 项 卡 用 于 指 定 在 模 型 块 中 选 择 或 排 除 输 入 字 段 的 默 认 设 置 然 后 可 以 将 模 型 添 加 到 流, 以 选 择 用 于 后 续 模 型 构 建 的 字 段 子 集 或 者, 也 可 以 通 过 在 生 成 模 型 后 在 模 型 浏 览 器 中 选 择 或 弃 选 其 他 字 段, 以 覆 盖 这 些 设 置 但 是, 默 认 设 置 下, 无 需 更 多 修 改 即 可 应 用 模 型 块, 这 点 在 脚 本 编 写 方 面 特 别 有 用 有 关 详 细 信 息, 请 参 阅 第 68 页 码 特 征 选 择 模 型 结 果 图 片 4-2 特 征 选 择 的 选 项 选 项 卡 可 用 选 项 有 :

79 67 筛 选 模 型 所 有 已 排 序 字 段 根 据 字 段 的 重 要 一 般 或 不 重 要 的 排 序 等 级 来 选 择 字 段 可 编 辑 每 项 排 序 的 标 签 及 用 于 指 派 记 录 的 排 序 等 级 的 截 断 值 前 几 个 字 段 请 根 据 重 要 性 选 择 前 n 个 字 段 重 要 性 大 于 请 选 择 重 要 性 大 于 指 定 值 的 所 有 字 段 不 管 如 何 选 择, 目 标 字 段 总 是 被 保 留 重 要 性 排 序 选 项 均 为 分 类 字 段 所 有 输 入 和 目 标 均 为 分 类 字 段 时, 可 以 依 据 以 下 任 何 一 个 度 量 来 排 列 重 要 性 顺 序 : Pearson 卡 方 无 需 现 有 关 系 的 强 度 或 方 向 即 可 检 验 目 标 和 输 入 的 独 立 性 似 然 比 卡 方 与 Pearson 卡 方 类 似, 也 用 于 检 验 目 标 - 输 入 的 独 立 性 Cramer s V 关 联 的 基 于 Pearson 卡 方 统 计 量 的 度 量 值 范 围 为 0 到 1,0 表 示 无 关 联,1 表 示 完 全 关 联 Lambda 一 个 关 联 的 度 量, 反 映 变 量 用 于 预 测 目 标 值 时 错 误 减 少 的 比 例 值 为 1 表 示 输 入 字 段 完 美 地 预 测 了 目 标, 值 为 0 则 表 示 输 入 未 提 供 目 标 的 任 何 有 用 信 息 部 分 为 分 类 字 段 当 部 分 但 并 非 所 有 输 入 为 分 类 字 段 且 目 标 也 为 分 类 字 段 时, 可 根 据 Pearson 或 似 然 比 卡 方 进 行 重 要 性 排 序 ( 除 非 所 有 输 入 均 为 分 类 变 量, 否 则 Cramer s V 和 lambda 均 不 可 用 ) 分 类 与 连 续 针 对 连 续 目 标 来 为 分 类 输 入 排 序 或 与 之 相 反 的 情 形 时 ( 即 其 中 之 一 为 分 类 字 段, 但 不 能 两 者 均 为 分 类 字 段 ), 则 使 用 F 统 计 量 两 者 均 为 连 续 字 段 针 对 连 续 目 标 来 为 连 续 输 入 排 序 时, 将 使 用 基 于 相 关 系 数 的 t 统 计 量 特 征 选 择 模 型 块 特 征 选 择 模 型 块 显 示 每 个 输 入 相 对 于 选 定 目 标 的 重 要 性 ( 遵 循 特 征 选 择 节 点 的 排 序 ) 排 序 前 已 筛 选 掉 的 所 有 字 段 也 将 被 列 出 有 关 详 细 信 息, 请 参 阅 第 64 页 码 特 征 选 择 节 点 运 行 含 有 特 特 征 选 择 型 块 的 流 时, 模 型 行 为 将 如 同 过 滤 器, 仅 保 留 模 型 选 项 卡 上 当 前 选 中 的 输 入 例 如, 可 以 选 择 评 定 为 重 要 的 所 有 字 段 ( 默 认 选 项 之 一 ) 或 在 模 型 选 项 卡 上 手 动 选 择 一 个 字 段 子 集 不 管 如 何 选 择, 目 标 字 段 总 是 被 保 留 所 有 其 他 字 段 将 被 排 除 过 滤 仅 基 于 字 段 名 称 ; 例 如, 如 果 选 择 年 龄 和 收 入, 则 匹 配 其 中 一 个 名 称 的 任 何 字 段 都 将 被 保 留 该 模 型 不 是 基 于 新 数 据 更 新 字 段 排 序, 而 只 是 根 据 选 定 的 名 称 来 过 滤 字 段 所 以, 将 模 型 应 用 到 新 的 或 更 新 过 的 数 据 时 应 多 加 注 意 存 有 疑 问 时, 最 好 重 新 生 成 模 型

80 68 章 4 特 征 选 择 模 型 结 果 特 征 选 择 模 型 块 的 模 型 选 项 卡 在 顶 部 窗 格 显 示 所 有 输 入 的 排 序 和 重 要 性, 且 可 以 通 过 左 栏 中 的 复 选 框 选 择 用 于 过 滤 的 字 段 运 行 流 时, 将 只 保 留 选 中 的 字 段 其 他 字 段 将 被 丢 弃 默 认 选 择 是 基 于 模 型 构 建 节 点 中 指 定 的 选 项, 但 可 以 根 据 需 要 选 择 或 弃 选 其 他 字 段 底 部 窗 格 列 出 依 据 缺 失 值 百 分 比 或 建 模 节 点 中 指 定 的 其 他 标 准 而 从 排 序 中 排 除 的 输 入 与 其 他 排 序 字 段 一 样, 可 以 通 过 左 栏 复 选 框 来 选 择 包 含 或 丢 弃 这 些 字 段 有 关 详 细 信 息, 请 参 阅 第 65 页 码 特 征 选 择 模 型 设 置 图 片 4-3 特 征 选 择 模 型 结 果

81 69 筛 选 模 型 要 按 照 排 序 字 段 名 称 重 要 性 或 任 何 其 他 显 示 的 列 来 排 列 该 列 表 的 顺 序, 可 单 击 列 标 题 如 果 要 使 用 工 具 栏, 则 可 以 从 排 序 方 式 列 表 选 择 需 要 的 项, 并 使 用 向 上 和 向 下 箭 头 来 更 改 排 序 方 向 可 使 用 工 具 栏 来 选 中 或 弃 选 所 有 字 段 和 访 问 选 中 字 段 对 话 框, 可 在 该 对 话 框 上 根 据 排 序 或 重 要 性 来 选 择 字 段 也 可 以 按 住 Shift 和 Ctrl 键 并 单 击 字 段, 以 选 择 更 多 的 字 段, 并 使 用 空 格 键 来 切 换 选 定 的 字 段 组 有 关 详 细 信 息, 请 参 阅 第 69 页 码 按 照 重 要 性 选 择 字 段 将 输 入 评 定 为 重 要 一 般 和 不 重 要 的 阈 值 显 示 在 表 格 下 方 的 注 释 中 这 些 值 在 建 模 节 点 中 指 定 有 关 详 细 信 息, 请 参 阅 第 66 页 码 特 征 选 择 选 项 按 照 重 要 性 选 择 字 段 使 用 特 征 选 择 模 型 块 对 数 据 进 行 评 分 时, 由 排 序 或 筛 选 字 段 选 中 的 所 有 字 段 都 将 被 保 留, 如 左 栏 复 选 框 所 示 其 他 字 段 将 被 丢 弃 要 更 改 选 择, 可 以 使 用 工 具 栏 访 问 选 中 字 段 对 话 框, 并 在 该 对 话 框 上 根 据 排 序 或 重 要 性 来 选 择 字 段 图 片 4-4 选 中 字 段 对 话 框 所 有 标 记 字 段 选 择 标 记 为 重 要 一 般 和 不 重 要 的 所 有 字 段 前 几 个 字 段 用 于 根 据 重 要 性 选 择 前 n 个 字 段 重 要 性 大 于 请 选 择 重 要 性 大 于 指 定 阈 值 的 所 有 字 段 从 特 征 选 择 模 型 中 生 成 过 滤 器 可 根 据 特 征 选 择 模 型 的 结 果, 生 成 一 个 或 多 个 过 滤 节 点, 该 节 点 根 据 相 对 于 指 定 目 标 的 重 要 性 包 含 或 排 除 字 段 子 集 虽 然 模 型 块 也 可 以 用 于 过 滤, 但 使 用 此 方 法 可 以 在 不 复 制 或 不 修 改 模 型 的 情 况 下 自 由 地 尝 试 不 同 的 字 段 子 集 不 管 是 选 择 包 含 还 是 选 择 排 除, 过 滤 时 将 总 是 保 留 目 标 字 段

82 70 章 4 图 片 4-5 生 成 过 滤 节 点 包 含 / 排 除 可 选 择 包 含 或 排 除 字 段 例 如 包 含 前 10 个 字 段 或 排 除 所 有 标 记 为 不 重 要 的 字 段 选 定 字 段 包 含 或 排 除 表 中 中 当 前 选 定 的 所 有 字 段 所 有 标 记 字 段 选 择 标 记 为 重 要 一 般 和 不 重 要 的 所 有 字 段 前 几 个 字 段 用 于 根 据 重 要 性 选 择 前 n 个 字 段 重 要 性 大 于 请 选 择 重 要 性 大 于 指 定 阈 值 的 所 有 字 段 异 常 检 测 节 点 异 常 检 测 模 型 用 于 识 别 数 据 中 的 离 群 值 或 异 常 观 测 值 与 存 储 有 关 异 常 观 测 值 的 规 则 的 其 他 建 模 方 法 不 同, 异 常 检 测 模 型 存 储 有 关 正 常 行 为 的 信 息 因 此 即 使 在 离 群 值 不 符 合 任 何 已 知 模 式 的 情 况 下, 异 常 检 测 模 型 也 使 识 别 离 群 值 成 为 可 能, 在 新 模 式 可 能 不 断 涌 现 的 应 用 ( 如 缺 陷 检 测 ) 中, 该 模 型 可 能 尤 其 有 用 异 常 检 测 是 一 种 不 受 监 督 的 方 法, 这 就 意 味 着 它 不 需 要 包 含 已 知 缺 陷 观 测 值 的 训 练 数 据 集 作 为 开 始 点 识 别 离 群 值 的 传 统 方 法 通 常 是 一 次 检 查 一 个 或 两 个 变 量, 而 异 常 检 测 可 以 检 查 大 量 字 段 以 识 别 相 似 记 录 所 属 的 聚 类 或 对 等 组 然 后, 可 将 每 个 记 录 与 其 对 等 组 中 的 其 他 记 录 进 行 比 较, 以 识 别 出 可 能 的 异 常 值 观 测 值 与 正 常 中 心 值 离 得 越 远, 它 越 有 可 能 是 异 常 观 测 值 例 如, 该 算 法 可 能 会 将 记 录 聚 合 为 三 个 不 同 的 聚 类, 并 对 离 任 何 一 个 聚 类 的 中 心 值 较 远 的 那 些 记 录 进 行 标 记

83 71 筛 选 模 型 图 片 4-6 使 用 聚 类 识 别 潜 在 异 常 每 个 记 录 都 指 定 了 一 个 异 常 指 数, 该 指 数 是 组 偏 差 指 数 与 该 观 测 值 所 属 聚 类 中 平 均 值 的 比 此 指 数 的 值 越 大, 观 测 值 与 平 均 值 的 偏 差 就 越 大 通 常 情 况 下, 异 常 指 数 值 小 于 1 甚 至 小 于 1.5 的 观 测 值 都 不 会 被 视 为 异 常 值, 因 为 该 偏 差 与 平 均 值 相 同 或 者 只 是 大 一 点 但 是, 指 数 值 大 于 2 的 观 测 值 有 可 能 是 异 常 观 测 值, 因 为 该 偏 差 至 少 是 平 均 值 的 两 倍 异 常 检 测 是 一 种 探 索 性 方 法, 它 是 为 对 应 该 进 行 进 一 步 分 析 的 可 能 异 常 观 测 值 或 记 录 进 行 快 速 检 测 而 设 计 的 这 些 观 测 值 应 视 为 疑 似 异 常 值, 在 进 行 进 一 步 检 查 后, 可 以 证 明 它 们 是 或 不 是 真 正 的 异 常 值 您 可 能 会 发 现 某 个 记 录 完 全 有 效, 但 无 法 选 择 从 数 据 中 将 其 筛 选 出 来 用 于 模 型 构 建 另 外, 如 果 算 法 重 复 检 测 出 虚 假 异 常 值, 则 可 能 表 示 数 据 收 集 过 程 中 存 在 错 误 或 假 象 注 意 : 异 常 检 测 并 不 考 虑 任 何 特 定 的 目 标 ( 相 关 ) 字 段, 也 不 考 虑 这 些 字 段 是 否 与 正 在 预 测 的 模 式 相 关, 只 是 通 过 基 于 模 型 中 所 选 字 段 集 的 聚 类 分 析 确 定 异 常 记 录 或 观 测 值 由 于 上 述 原 因, 您 可 能 想 将 异 常 检 测 与 特 征 选 择 或 字 段 筛 选 和 排 序 的 其 他 方 法 结 合 使 用 例 如, 您 可 以 使 用 特 征 选 择 来 确 定 与 某 个 特 定 目 标 相 关 的 最 重 要 的 字 段, 然 后 使 用 异 常 检 测 寻 找 针 对 这 些 字 段 而 言 最 异 常 的 记 录 ( 另 外 一 个 方 法 是 构 建 一 个 决 策 树 模 型, 然 后 将 所 有 错 误 分 类 的 记 录 视 为 可 能 的 异 常 进 行 检 查 但 是 此 方 法 很 难 用 于 进 行 大 批 量 的 复 制 和 自 动 化 ) 示 例 在 筛 选 可 能 存 在 农 业 发 展 补 贴 诈 骗 的 案 例 时, 异 常 检 测 可 用 于 发 现 悖 于 常 态 的 偏 差, 突 出 显 示 那 些 异 常 的 值 得 进 一 步 研 究 的 记 录 特 别 值 得 关 注 的 是 那 些 看 起 来 相 对 农 场 类 型 和 规 模 而 言 要 求 过 多 ( 或 过 少 ) 补 助 金 的 补 贴 申 请 要 求 一 个 或 多 个 输 入 字 段 注 意 : 只 有 通 过 使 用 源 或 类 型 节 点 将 角 色 设 置 为 输 入 的 字 段 才 能 用 作 输 入 目 标 字 段 ( 角 色 设 置 为 目 标 或 双 向 ) 将 被 忽 略

84 72 章 4 强 度 通 过 标 记 不 符 合 已 知 规 则 集, 而 不 是 符 合 已 知 规 则 集 的 观 测 值, 异 常 检 测 模 型 即 使 在 观 测 值 不 符 合 先 前 已 知 的 样 式 时 也 能 确 定 异 常 观 测 值 当 与 特 征 选 择 组 合 使 用 时, 异 常 检 测 可 以 用 于 筛 选 大 量 数 据, 以 更 快 地 确 定 最 有 用 的 记 录 异 常 检 测 模 型 选 项 图 片 4-7 异 常 检 测 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 确 定 异 常 截 断 值 的 根 据 指 定 用 于 确 定 标 记 异 常 的 截 断 值 的 方 法 可 用 选 项 有 : 最 小 异 常 索 引 等 级 指 定 标 记 异 常 的 最 小 截 断 值 达 到 或 超 过 此 阈 值 的 记 录 将 被 标 记 训 练 数 据 中 最 异 常 记 录 百 分 比 自 动 设 置 一 个 阈 值, 其 水 平 标 记 为 训 练 数 据 中 记 录 的 指 定 百 分 比 所 得 出 的 截 断 值 作 为 参 数 包 含 在 模 型 中 注 意 : 此 选 项 决 定 截 断 值 的 设 置 方 式, 而 不 是 决 定 评 分 期 间 被 标 记 记 录 的 百 分 比 实 际 评 分 结 果 可 能 根 据 数 据 的 不 同 而 有 所 不 同 训 练 数 据 中 异 常 记 录 的 数 量 自 动 设 置 一 个 阈 值, 其 水 平 标 记 为 训 练 数 据 中 记 录 的 指 定 数 量 所 得 出 的 临 界 值 作 为 参 数 包 含 在 模 型 中 注 意 : 此 选 项 决 定 截 断 值 的 设 置 方 式, 而 不 是 决 定 评 分 期 间 被 标 记 记 录 的 具 体 数 量 实 际 评 分 结 果 可 能 根 据 数 据 的 不 同 而 有 所 不 同 注 意 : 不 管 如 何 确 定 截 断 值, 都 不 会 影 响 每 条 记 录 报 告 的 潜 在 异 常 索 引 值 它 只 是 在 对 模 型 进 行 估 算 和 评 分 时 指 定 将 记 录 标 记 为 异 常 的 阈 值 如 果 想 稍 后 检 查 更 大 或 更 小 数 量 的 记 录, 则 可 以 使 用 选 择 节 点 来 根 据 异 常 索 引 值 ($O-AnomalyIndex > X) 确 定 记 录 子 集

85 73 筛 选 模 型 要 报 告 的 异 常 字 段 数 指 定 要 报 告 的 异 常 字 段 数, 报 告 中 说 明 记 录 被 标 记 为 异 常 的 原 因 将 报 告 最 异 常 字 段, 最 异 常 字 段 指 的 是 与 记 录 所 属 聚 类 的 字 段 标 准 偏 差 最 大 的 字 段 异 常 检 测 专 家 选 项 要 指 定 缺 失 值 和 其 他 设 置 的 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家 图 片 4-8 异 常 检 测 专 家 选 项 卡 调 整 系 数 用 于 平 衡 在 计 算 距 离 时 赋 予 连 续 ( 数 字 范 围 ) 和 分 类 字 段 的 相 对 权 重 的 数 值 值 越 大, 连 续 字 段 的 影 响 也 越 大 它 必 须 为 非 0 值 自 动 计 算 对 等 组 数 异 常 检 测 可 用 于 快 速 分 析 大 量 可 能 的 解 决 方 案, 以 选 择 训 练 数 据 的 最 佳 对 等 组 数 可 通 过 设 置 对 等 组 的 最 大 数 和 最 小 数 来 扩 大 或 缩 小 数 值 范 围 较 大 的 值 可 使 系 统 在 更 大 范 围 内 搜 索 可 能 的 解 决 方 案, 但 是, 消 耗 的 处 理 时 间 也 随 之 增 加 指 定 对 等 组 数 如 果 知 道 模 型 中 应 包 含 聚 类 的 数 量, 请 选 中 此 选 项 并 输 入 对 等 组 数 一 般 而 言, 选 中 此 选 项 可 提 高 性 能 噪 声 水 平 和 比 率 这 两 个 设 置 决 定 了 两 阶 段 聚 类 期 间 离 群 值 的 处 理 方 式 第 一 阶 段 将 使 用 聚 类 特 征 (CF) 树 来 将 数 据 从 大 量 零 散 记 录 浓 缩 成 可 管 理 数 量 的 聚 类 该 树 基 于 相 似 性 度 量 值 构 建, 树 的 某 个 节 点 中 记 录 过 多 时, 它 将 分 裂 子 节 点 第 二 阶 段 将 从 CF 树 的 终 端 节 点 开 始 创 建 分 层 聚 类 第 一 阶 段 时 开 启 噪 声 处 理, 第 二 阶 段 时 则 关 闭 第 一 阶 段 噪 声 聚 类 中 的 观 测 值 将 被 分 配 到 第 二 阶 段 的 常 规 聚 类 中 噪 声 水 平 指 定 值 必 须 处 于 0 到 0.5 之 间 此 设 置 只 有 在 以 下 情 况 中 才 有 用 :CF 树 在 增 长 期 间 被 充 满, 即 该 树 的 叶 节 点 无 法 接 收 更 多 的 观 测 值 且 叶 节 点 无 法 分 裂

86 74 章 4 如 果 CF 树 被 充 满 且 噪 声 水 平 设 置 为 0, 则 阈 值 将 增 大 且 CF 树 将 用 所 有 观 测 值 重 新 生 长 最 终 聚 类 之 后, 不 能 分 配 到 聚 类 的 变 量 标 记 为 离 群 值 离 群 值 聚 类 将 被 赋 予 一 个 识 别 号 1 离 群 值 聚 类 不 包 含 在 聚 类 数 的 计 数 中 ; 也 就 是 说, 如 果 指 定 n 个 聚 类 和 噪 声 处 理, 则 算 法 将 输 出 n 个 聚 类 和 一 个 噪 声 聚 类 实 际 应 用 中, 增 大 此 值 可 使 算 法 更 有 可 能 将 异 常 记 录 匹 配 到 树, 而 不 是 将 它 们 分 配 到 独 立 的 离 群 值 聚 类 如 果 CF 树 被 充 满 且 噪 声 水 平 大 于 0, 则 CF 树 将 在 稀 疏 叶 片 中 的 所 有 数 据 放 到 其 自 身 的 噪 声 叶 片 后 重 新 生 长 如 果 叶 片 中 的 观 测 值 数 量 与 最 大 叶 片 中 的 观 测 值 数 量 的 比 率 小 于 噪 声 水 平, 则 该 叶 片 将 被 认 定 为 稀 疏 叶 片 树 创 建 完 成 后, 可 能 的 话, 离 群 值 将 被 放 置 在 CF 树 中 如 果 未 放 在 树 中, 第 二 步 聚 类 中 的 离 群 值 将 被 丢 弃 噪 声 比 指 定 分 配 给 用 于 噪 声 缓 冲 的 组 件 的 内 存 量 此 值 必 须 处 于 0.0 到 0.5 之 间 如 果 将 特 定 观 测 值 插 入 树 的 叶 片 后, 所 产 生 的 紧 性 小 于 阈 值, 叶 片 将 不 再 分 裂 如 果 紧 性 超 过 阈 值, 叶 片 将 分 裂, 结 果 将 把 另 一 个 小 聚 类 添 加 到 CF 树 实 际 上, 提 高 此 设 置 值 将 可 能 导 致 算 法 容 易 更 快 速 地 创 建 较 简 单 的 树 为 缺 失 值 归 因 对 于 连 续 字 段, 请 用 字 段 均 值 代 替 缺 失 值 对 于 分 类 字 段, 不 同 缺 失 值 类 别 将 被 组 合 为 一 个 有 效 分 类 进 行 处 理 如 果 取 消 选 中 此 选 项, 则 任 何 带 有 缺 失 值 的 记 录 都 将 从 分 析 中 剔 除 异 常 检 测 模 型 块 异 常 检 测 模 型 块 含 有 异 常 检 测 模 型 捕 获 的 所 有 信 息 以 及 有 关 训 练 数 据 和 估 算 过 程 的 信 息 运 行 含 有 异 常 检 测 模 型 块 的 流 时, 若 干 新 字 段 将 按 照 模 型 块 中 设 置 选 项 卡 上 的 选 择 添 加 到 流 中 有 关 详 细 信 息, 请 参 阅 第 77 页 码 异 常 检 测 模 型 设 置 新 字 段 名 称 基 于 模 型 名 称, 并 带 有 前 缀 $O, 如 下 表 之 概 括 : $O-Anomaly 指 明 记 录 是 否 异 常 的 标 志 字 段 $O-AnomalyIndex 记 录 的 异 常 索 引 值 $O-PeerGroup 指 定 记 录 分 配 到 哪 个 对 等 组 $O-Field-n $O-FieldImpact-n 与 聚 类 标 准 偏 差 最 大 的 第 n 个 异 常 字 段 的 名 称 字 段 的 变 量 偏 差 指 数 此 值 衡 量 与 记 录 分 配 到 的 聚 类 字 段 标 准 的 偏 差 也 可 以 选 择 抑 止 非 异 常 记 录 的 得 分, 以 使 结 果 更 易 于 读 取

87 75 筛 选 模 型 图 片 4-9 抑 制 非 异 常 记 录 的 评 分 结 果 异 常 检 测 模 型 详 细 信 息 已 生 成 异 常 检 测 模 型 的 模 型 选 项 卡 显 示 模 型 中 对 等 组 的 有 关 信 息

88 76 章 4 图 片 4-10 异 常 检 测 模 型 块 详 细 信 息 注 意 : 报 告 的 对 等 组 大 小 和 统 计 信 息 是 基 于 训 练 数 据 的 估 算 值, 即 使 在 同 样 的 数 据 上 运 行, 可 能 也 与 实 际 评 分 结 果 稍 微 有 点 不 同 异 常 检 测 模 型 概 要 异 常 检 测 模 型 块 的 概 要 选 项 卡 显 示 字 段 构 建 设 置 和 估 算 过 程 的 有 关 信 息 同 时 还 显 示 对 等 组 数 量 以 及 用 于 将 记 录 标 记 为 异 常 的 截 断 值

89 77 筛 选 模 型 图 片 4-11 异 常 检 测 模 型 块 概 要 异 常 检 测 模 型 设 置 设 置 选 项 卡 用 于 指 定 对 模 型 块 进 行 评 分 的 选 项

90 78 章 4 图 片 4-12 异 常 检 测 模 型 块 的 评 分 选 项 使 用 以 下 方 式 表 示 异 常 记 录 指 定 输 出 中 异 常 记 录 的 处 理 方 式 标 志 和 指 数 创 建 标 志 字 段, 模 型 中 包 含 的 任 何 记 录 超 过 截 断 值 时, 记 录 的 标 志 字 段 将 被 设 置 为 真 同 时 将 单 独 使 用 一 个 字 段 中 报 告 每 条 记 录 的 异 常 索 引 有 关 详 细 信 息, 请 参 阅 第 72 页 码 异 常 检 测 模 型 选 项 仅 标 志 创 建 标 志 字 段, 但 不 报 告 每 条 记 录 的 异 常 索 引 仅 指 数 报 告 异 常 索 引 但 不 创 建 标 志 字 段 要 报 告 的 异 常 字 段 数 指 定 要 报 告 的 异 常 字 段 数, 报 告 中 说 明 记 录 被 标 记 为 异 常 的 原 因 将 报 告 最 异 常 字 段, 最 异 常 字 段 指 的 是 与 记 录 所 属 聚 类 的 字 段 标 准 偏 差 最 大 的 字 段 丢 弃 记 录. 选 择 此 选 项, 以 从 流 丢 弃 所 有 非 异 常 记 录, 以 便 在 下 游 节 点 中 集 中 关 注 于 潜 在 异 常 此 外, 也 可 以 丢 弃 所 有 异 常 记 录, 以 便 将 后 续 分 析 限 制 在 那 些 没 有 被 模 型 标 记 为 潜 在 异 常 的 记 录 上 注 意 : 由 于 取 整 造 成 的 轻 微 差 异, 即 使 在 同 样 的 数 据 上 运 行, 评 分 期 间 被 标 记 记 录 的 实 际 数 量 也 可 能 与 训 练 模 型 期 间 的 情 况 有 所 不 同

91 自 动 建 模 节 点 章 5 自 动 建 模 节 点 估 算 和 比 较 多 个 不 同 的 建 模 方 法, 使 您 在 一 次 建 模 运 行 中 即 可 尝 试 各 种 方 法 您 可 以 选 择 所 使 用 的 建 模 算 法, 以 及 每 个 建 模 算 法 的 具 体 选 项, 包 括 可 能 互 斥 的 组 合 例 如, 您 无 需 为 神 经 网 络 选 择 快 速 动 态 或 修 剪 之 中 的 某 个 方 式, 完 全 可 以 全 部 尝 试 节 点 研 究 选 项 的 每 个 可 能 组 合, 根 据 您 指 定 的 测 量 为 每 个 候 选 模 型 排 序, 并 保 存 最 佳 模 型 用 于 评 分 或 将 来 的 分 析 您 可 以 根 据 分 析 需 要 从 三 个 自 动 建 模 节 点 中 进 行 选 择 : 自 动 分 类 器 节 点 用 于 创 建 和 对 比 二 元 结 果 ( 是 或 否, 流 失 或 不 流 失 等 ) 的 若 干 不 同 模 型, 使 用 户 可 以 选 择 给 定 分 析 的 最 佳 处 理 方 法 由 于 支 持 多 种 建 模 算 法, 因 此 可 以 对 用 户 希 望 使 用 的 方 法 每 种 方 法 的 特 定 选 项 以 及 对 比 结 果 的 标 准 进 行 选 择 节 点 根 据 指 定 的 选 项 生 成 一 组 模 型 并 根 据 用 户 指 定 的 标 准 排 列 最 佳 候 选 项 的 顺 序 有 关 详 细 信 息, 请 参 阅 第 81 页 码 自 动 分 类 器 节 点 自 动 数 值 节 点 使 用 多 种 不 同 方 法 估 计 和 对 比 模 型 的 连 续 数 字 范 围 结 果 此 节 点 和 自 动 分 类 器 节 点 的 工 作 方 式 相 同, 因 此 可 以 选 择 要 使 用 和 要 在 单 个 建 模 传 递 中 使 用 多 个 选 项 组 合 进 行 测 试 的 算 法 受 支 持 的 算 法 包 括 神 经 网 络 C&R 树 CHAID 线 性 回 归 广 义 线 性 回 归 以 及 Support Vector Machine (SVM) 可 基 于 相 关 度 相 对 错 误 或 已 用 变 量 数 对 模 型 进 行 对 比 有 关 详 细 信 息, 请 参 阅 第 90 页 码 自 动 数 值 节 点 自 动 聚 类 节 点 估 算 和 比 较 识 别 具 有 类 似 特 征 记 录 组 的 聚 类 模 型 节 点 工 作 方 式 与 其 他 自 动 建 模 节 点 相 同, 使 您 在 一 次 建 模 运 行 中 即 可 试 验 多 个 选 项 组 合 模 型 可 使 用 基 本 测 量 进 行 比 较, 以 尝 试 过 滤 聚 类 模 型 的 有 效 性 以 及 对 其 进 行 排 序, 并 提 供 一 个 基 于 特 定 字 段 的 重 要 性 的 测 量 有 关 详 细 信 息, 请 参 阅 第 95 页 码 自 动 聚 类 节 点 最 佳 模 型 保 存 在 一 个 复 合 模 型 块 中, 可 对 其 进 行 浏 览 和 比 较, 并 选 择 评 分 中 使 用 哪 个 模 型 只 有 对 于 二 元 名 义 和 数 字 目 标, 您 才 可 以 选 择 多 个 评 分 模 型, 并 将 得 分 组 合 在 一 个 模 型 整 体 中 通 过 结 合 多 个 模 型 的 预 测, 可 以 避 免 单 个 模 型 的 局 限 性, 使 所 得 的 整 体 准 确 性 通 常 比 从 任 一 模 型 中 获 得 的 准 确 性 要 高 您 还 可 以 选 择 向 下 浏 览 结 果, 或 为 要 使 用 或 进 一 步 探 索 的 所 有 单 独 模 型 生 成 建 模 节 点 或 模 型 块 模 型 和 执 行 时 间 根 据 模 型 的 数 据 集 和 数 量, 自 动 建 模 节 点 执 行 时 间 可 能 为 数 小 时 或 甚 至 更 长 在 选 择 选 项 时, 请 注 意 正 在 生 成 的 模 型 个 数 如 果 现 实 条 件 允 许, 您 可 能 希 望 将 建 模 运 行 的 时 间 安 排 在 夜 晚 或 周 末, 因 为 此 时 对 系 统 资 源 的 需 求 可 能 比 较 小 必 要 的 话, 可 以 使 用 分 区 节 点 或 样 本 节 点 减 少 包 括 在 初 始 训 练 传 递 中 的 记 录 数 一 旦 将 选 择 限 制 在 几 个 生 成 的 候 选 模 型 内, 就 可 以 恢 复 全 部 数 据 集 有 关 详 细 信 息, 请 参 阅 样 本 节 点 或 Copyright IBM Corporation 1994,

92 80 章 5 要 减 少 输 入 字 段 数, 请 使 用 特 征 选 择 有 关 详 细 信 息, 请 参 阅 第 64 页 码 第 4 章 中 的 特 征 选 择 节 点 或 者, 可 以 使 用 初 始 建 模 运 行 来 识 别 需 要 进 一 步 探 索 的 字 段 和 选 项 例 如, 如 果 性 能 最 佳 的 模 型 似 乎 都 使 用 了 相 同 的 三 个 字 段, 则 有 力 地 说 明 这 些 字 段 值 得 保 留 您 还 可 以 限 制 评 估 任 一 模 型 所 需 的 时 间 并 且 指 定 用 于 过 滤 和 排 序 模 型 的 评 估 尺 度 自 动 建 模 节 点 算 法 设 置 对 于 每 个 模 型 类 型, 可 以 使 用 默 认 设 置, 或 为 每 个 模 型 类 型 选 择 选 项 这 些 特 定 选 项 类 似 于 独 立 建 模 节 点 中 可 用 的 选 项, 不 同 之 处 在 于 并 非 只 能 选 择 一 种 设 置 而 是 大 多 数 情 况 下 可 以 根 据 应 用 需 要 选 择 多 种 例 如, 如 果 对 比 神 经 网 络 节 点, 可 以 选 择 几 种 不 同 的 训 练 方 法, 并 且 尝 试 具 有 随 机 种 子 和 不 具 有 随 机 种 子 的 每 种 方 法 选 定 选 项 的 所 有 可 能 组 合 都 将 使 用, 从 而 使 得 在 单 次 遍 历 中 生 成 许 多 不 同 模 型 变 得 更 容 易 但 是, 使 用 时 要 小 心, 因 为 选 择 多 个 设 置 会 引 起 模 型 数 非 常 快 速 地 增 加 图 片 5-1 为 自 动 建 模 选 择 算 法 设 置 要 为 每 个 模 型 类 型 选 择 选 项 : E 在 自 动 建 模 节 点 上, 选 择 专 家 选 项 卡 E 单 击 模 型 类 型 的 模 型 参 数 列 E 从 下 拉 菜 单 中, 选 择 指 定

93 81 自 动 建 模 节 点 E 在 算 法 设 置 对 话 框 上, 从 选 项 列 中 选 择 选 项 注 意 : 在 算 法 设 置 对 话 框 的 专 家 选 项 卡 上 提 供 了 进 一 步 的 选 项 自 动 建 模 节 点 停 止 规 则 为 自 动 建 模 节 点 指 定 的 停 止 规 则 不 仅 与 节 点 所 构 建 的 个 别 模 型 的 停 止 有 关, 还 与 所 有 节 点 执 行 有 关 图 片 5-2 正 在 停 止 规 则 总 执 行 时 间 限 制 ( 仅 神 经 网 络 K-Means Kohonen TwoStep SVM KNN Bayes Net 和 C&R 模 型 ) 在 指 定 小 时 数 后 停 止 执 行 所 有 在 该 时 间 点 之 前 ( 包 括 该 点 ) 生 成 的 模 型 都 将 包 括 在 模 型 块 中, 但 这 之 后 不 会 再 生 成 模 型 生 成 有 效 的 模 型 后 立 即 停 止 当 模 型 传 递 了 所 有 在 丢 弃 选 项 卡 ( 自 动 分 类 器 或 自 动 聚 类 节 点 的 ) 和 模 型 选 项 卡 ( 自 动 数 值 节 点 的 ) 上 指 定 的 标 准 时 将 停 止 执 行 有 关 详 细 信 息, 请 参 阅 第 87 页 码 自 动 分 类 器 节 点 丢 弃 选 项 有 关 详 细 信 息, 请 参 阅 第 99 页 码 自 动 聚 类 节 点 丢 弃 选 项 自 动 分 类 器 节 点 自 动 分 类 器 节 点 使 用 多 种 不 同 方 法 估 算 和 比 较 名 义 ( 集 合 ) 或 二 元 ( 是 / 否 ) 目 标 的 模 型, 使 您 在 一 次 建 模 运 行 中 即 可 尝 试 各 种 方 法 您 可 以 选 择 所 用 算 法, 并 试 验 选 项 的 多 个 组 合 例 如, 您 无 需 为 神 经 网 络 选 择 快 速 动 态 或 修 剪 之 中 的 某 个 方 式, 完 全 可 以 全 部 尝 试 节 点 研 究 选 项 的 每 个 可 能 组 合, 根 据 您 指 定 的 测 量 为 每 个 候 选 模 型 排 序, 并 保 存 最 佳 模 型 用 于 评 分 或 将 来 的 分 析 有 关 详 细 信 息, 请 参 阅 第 79 页 码 自 动 建 模 节 点

94 82 章 5 图 片 5-3 自 动 分 类 器 建 模 结 果 示 例 零 售 公 司 拥 有 追 踪 以 前 营 销 活 动 中 向 特 定 客 户 报 价 的 历 史 数 据 公 司 现 在 希 望 通 过 向 每 个 客 户 提 供 合 适 的 报 价, 来 获 取 更 多 的 利 润 显 示 要 求 一 个 测 量 级 别 为 名 义 或 标 志 ( 角 色 设 置 为 目 标 ) 的 目 标 字 段 和 至 少 一 个 输 入 字 段 ( 角 色 设 置 为 输 入 ) 对 于 标 志 字 段, 假 定 为 目 标 字 段 定 义 的 真 值 表 示 计 算 利 润 提 升 和 相 关 统 计 量 时 的 匹 配 项 输 入 字 段 的 测 量 级 别 可 以 是 连 续 或 分 类, 但 具 有 限 制, 即 某 些 输 入 可 能 不 适 合 一 些 模 型 类 型 例 如, 在 C&R 树 CHAID 和 QUEST 模 型 中 用 作 输 入 的 有 序 字 段 必 须 是 数 字 存 储 类 型 ( 而 不 是 字 符 串 ), 如 果 指 定 了 其 他 类 型, 将 被 这 些 模 型 忽 略 类 似 地, 在 某 些 情 况 下 可 对 连 续 输 入 字 段 进 行 分 级 这 和 使 用 单 个 建 模 节 点 时 的 要 求 一 样 ; 例 如, 不 管 是 从 贝 叶 斯 网 络 节 点 还 是 自 动 分 类 器 节 点 生 成, 贝 叶 斯 网 络 模 型 都 以 同 样 的 方 式 工 作 频 数 和 加 权 字 段 频 数 和 加 权 用 于 增 强 某 些 记 录 的 重 要 性, 以 超 过 其 他 记 录, 原 因 可 能 是 用 户 知 道 构 建 数 据 集 省 略 父 总 体 的 一 部 分 ( 加 权 ) 或 一 个 记 录 代 表 一 个 相 同 观 测 值 数 ( 频 数 ) 等 如 果 指 定 了 频 数 字 段, 则 可 以 将 其 用 于 C&R 树 CHAID QUEST 决 策 列 表 和 贝 叶 斯 网 络 模 型 加 权 字 段 可 用 于 C&RT CHAID 和 C5.0 模 型 其 他 模 型 类 型 将 省 略 这 些 字 段 并 以 任 意 方 式 构 建 模 型 频 数 和 加 权 字 段 仅 用 于 模 型 构 建, 并 且 在 评 估 和 评 分 模 型 时 不 予 以 考 虑 有 关 详 细 信 息, 请 参 阅 第 33 页 码 第 3 章 中 的 使 用 频 率 和 权 重 字 段 支 持 的 模 型 类 型 支 持 的 模 型 类 型 包 括 神 经 网 络 C&R 树 QUEST CHAID C5.0 Logistic 回 归 决 策 列 表 贝 叶 斯 网 络 判 别 式 最 近 邻 元 素 和 SVM 有 关 详 细 信 息, 请 参 阅 第 84 页 码 自 动 分 类 器 节 点 专 家 选 项

95 83 自 动 建 模 节 点 自 动 分 类 器 节 点 模 型 选 项 使 用 自 动 分 类 器 节 点 的 模 型 选 项 卡 可 以 指 定 要 创 建 的 模 型 数 和 用 于 比 较 模 型 的 标 准 图 片 5-4 自 动 分 类 器 节 点 : 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 模 型 排 序 依 据 指 定 用 于 比 较 和 排 序 模 型 的 标 准 选 项 包 括 总 体 精 确 性 ROC 曲 线 下 的 区 域 利 润 提 升 和 字 段 的 数 量 请 注 意, 无 论 在 此 处 选 定 哪 些 尺 度, 所 有 这 些 尺 度 都 能 在 汇 总 报 告 中 使 用 注 意 : 对 于 名 义 ( 集 合 ) 目 标, 排 序 限 制 为 总 体 精 确 性 或 字 段 数 计 算 利 润 提 升 和 相 关 统 计 量 时, 将 假 定 目 标 字 段 定 义 为 真 值 以 表 示 匹 配 项

96 84 章 5 模 型 排 序 方 式 如 果 正 在 使 用 分 区, 则 可 以 指 定 基 于 训 练 数 据 集 排 序 或 是 基 于 检 验 数 据 集 排 序 对 于 大 型 数 据 集, 使 用 分 区 对 模 型 进 行 预 筛 选 将 大 大 提 高 执 行 能 力 要 使 用 的 模 型 数 指 定 要 在 节 点 生 成 的 模 型 块 中 列 出 的 最 大 模 型 数 按 照 指 定 的 排 序 标 准 将 顺 次 列 出 排 序 靠 前 的 模 型 注 意, 增 加 此 最 大 模 型 数 将 减 缓 执 行 速 度 允 许 的 最 大 值 为 100 计 算 预 测 变 量 重 要 性 对 于 生 成 相 应 重 要 性 测 量 的 模 型, 可 以 显 示 一 个 图 表 来 说 明 评 估 模 型 中 每 个 预 测 变 量 的 相 对 重 要 性 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 请 注 意, 预 测 变 量 重 要 性 可 能 会 增 加 计 算 某 些 模 型 所 需 的 时 间, 如 果 仅 仅 希 望 对 许 多 不 同 的 模 型 进 行 广 泛 对 比, 则 不 建 议 评 估 变 量 重 要 性 将 分 析 限 制 在 要 进 一 步 探 索 的 几 个 模 型 上 会 更 有 用 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 利 润 标 准 注 意 : 仅 适 合 标 志 目 标 利 润 等 于 每 个 记 录 的 收 入 减 去 该 记 录 的 成 本 也 就 是 说, 分 位 数 的 利 润 就 是 位 于 该 分 位 数 内 的 所 有 记 录 的 利 润 总 和 这 里 假 定 利 润 仅 应 用 于 匹 配 项, 但 成 本 可 应 用 于 所 有 的 记 录 成 本 指 定 与 每 个 记 录 相 关 联 的 成 本 您 可 以 选 择 固 定 或 可 变 成 本 对 于 固 定 成 本, 请 指 定 成 本 值 对 于 可 变 成 本, 请 单 击 字 段 选 择 器 按 钮, 将 某 个 字 段 选 择 为 成 本 字 段 收 入 指 定 与 表 示 匹 配 项 的 每 个 记 录 相 关 联 的 收 入 您 可 以 选 择 固 定 或 可 变 成 本 对 于 固 定 收 入, 请 指 定 收 入 值 对 于 可 变 收 入, 请 单 击 字 段 选 择 器 按 钮, 将 某 个 字 段 选 择 为 收 入 字 段 加 权 如 果 数 据 中 的 记 录 代 表 多 个 单 元, 则 可 以 使 用 频 数 加 权 调 整 结 果 使 用 固 定 或 可 变 加 权, 指 定 与 每 个 记 录 相 关 联 的 加 权 对 于 固 定 加 权, 请 指 定 加 权 值 ( 每 个 记 录 的 单 元 数 ) 对 于 可 变 加 权, 请 单 击 字 段 选 择 器 按 钮, 将 某 个 字 段 选 择 为 加 权 字 段 提 升 标 准 注 意 : 仅 适 合 标 志 目 标 指 定 提 升 计 算 使 用 的 百 分 位 数 注 意, 在 比 较 结 果 时 也 可 以 更 改 此 值 有 关 详 细 信 息, 请 参 阅 第 100 页 码 自 动 模 型 块 自 动 分 类 器 节 点 专 家 选 项 使 用 自 动 分 类 器 节 点 的 专 家 选 项 卡, 可 以 应 用 分 区 ( 如 果 可 用 ) 选 择 使 用 的 算 法 及 指 定 停 止 规 则

97 85 自 动 建 模 节 点 图 片 5-5 自 动 分 类 器 节 点 : 专 家 选 项 卡 已 使 用 模 型 使 用 左 侧 列 中 的 复 选 框 选 择 要 在 比 较 中 包 括 的 模 型 类 型 ( 算 法 ) 选 择 的 类 型 越 多, 创 建 的 模 型 就 会 越 多, 且 处 理 的 时 间 就 会 越 长 模 型 类 型 列 出 可 用 的 算 法 ( 请 参 阅 下 面 的 内 容 ) 模 型 参 数 对 于 每 个 模 型 类 型, 可 以 使 用 默 认 设 置, 或 选 择 指 定 为 每 个 模 型 类 型 选 择 选 项 这 些 特 定 选 项 类 似 于 独 立 建 模 节 点 中 可 用 的 选 项, 不 同 之 处 在 于 可 以 选 择 多 个 选 项 或 组 合 例 如, 比 较 神 经 网 络 模 型 时, 与 其 选 择 六 种 训 练 方 法 之 一, 还 不 如 一 次 选 中 全 部 六 种 方 法 以 在 一 次 传 递 中 训 练 六 种 模 型 模 型 数 列 出 基 于 当 前 设 置 为 每 个 算 法 生 成 的 模 型 数 当 组 合 选 项 时, 模 型 数 会 激 增, 因 此 强 烈 建 议 密 切 关 注 该 模 型 数, 尤 其 在 使 用 大 型 数 据 集 时 限 制 单 模 型 最 长 构 建 时 间 ( 仅 K-Means Kohonen TwoStep SVM KNN Bayes Net 和 决 策 列 表 模 型 ) 为 任 意 一 个 模 型 设 置 最 长 时 间 限 制 例 如, 如 果 由 于 某 些 复 杂 的 交 互 效 应, 某 个 特 定 模 型 所 需 的 训 练 时 间 长 得 出 乎 意 料, 则 您 大 概 不 希 望 它 使 得 整 个 的 建 模 运 行 停 滞 注 意 : 如 果 目 标 为 名 义 ( 集 合 ) 字 段, 决 策 列 表 选 项 不 可 用

98 86 章 5 支 持 的 算 法 神 经 网 络 节 点 使 用 的 模 型 是 对 人 类 大 脑 处 理 信 息 的 方 式 简 化 了 的 模 型 此 模 型 通 过 模 拟 大 量 类 似 于 神 经 元 的 抽 象 形 式 的 互 连 简 单 处 理 单 元 而 运 行 神 经 网 络 是 功 能 强 大 的 一 般 函 数 估 计 器, 只 需 要 最 少 的 统 计 或 数 学 知 识 就 可 以 对 其 进 行 训 练 或 应 用 C5.0 节 点 构 建 决 策 树 或 规 则 集 该 模 型 的 工 作 原 理 是 根 据 在 每 个 级 别 提 供 最 大 信 息 收 获 的 字 段 分 割 样 本 目 标 字 段 必 须 为 分 类 字 段 允 许 进 行 多 次 多 于 两 个 子 组 的 分 割 有 关 详 细 信 息, 请 参 阅 第 146 页 码 第 6 章 中 的 C5.0 节 点 分 类 和 回 归 (C&R) 树 节 点 生 成 可 用 于 预 测 或 分 类 未 来 观 测 值 的 决 策 树 该 方 法 通 过 在 每 个 步 骤 最 大 限 度 降 低 不 纯 洁 度, 使 用 递 归 分 区 来 将 训 练 记 录 分 割 为 组 如 果 节 点 中 100% 的 观 测 值 都 属 于 目 标 字 段 的 一 个 特 定 类 别, 则 树 中 的 该 节 点 将 被 认 定 为 纯 洁 目 标 和 输 入 字 段 可 以 是 数 字 范 围 或 分 类 ( 名 义 有 序 或 标 志 ); 所 有 分 割 均 为 二 元 分 割 ( 即 仅 分 割 为 两 个 子 组 ) 有 关 详 细 信 息, 请 参 阅 第 130 页 码 第 6 章 中 的 C&R 树 节 点 QUEST 节 点 可 提 供 用 于 构 建 决 策 树 的 二 元 分 类 法, 此 方 法 的 设 计 目 的 是 减 少 大 型 C&R 树 分 析 所 需 的 处 理 时 间, 同 时 也 减 少 在 分 类 树 方 法 中 发 现 的 趋 势 以 便 支 持 允 许 有 多 个 分 割 的 输 入 输 入 字 段 可 以 是 数 字 范 围 ( 连 续 ), 但 目 标 字 段 必 须 是 分 类 所 有 分 割 都 是 二 元 的 有 关 详 细 信 息, 请 参 阅 第 131 页 码 第 6 章 中 的 QUEST 节 点 CHAID 使 用 卡 方 统 计 量 来 生 成 决 策 树, 以 确 定 最 佳 的 分 割 CHAID 与 C&R 树 和 QUEST 节 点 不 同, 它 可 以 生 成 非 二 元 树, 这 意 味 着 有 些 分 割 将 有 多 于 两 个 的 分 支 目 标 和 输 入 字 段 可 以 是 数 字 范 围 ( 连 续 ) 或 分 类 Exhaustive CHAID 是 CHAID 的 修 正 版, 它 对 所 有 分 割 进 行 更 彻 底 的 检 查, 但 计 算 时 间 比 较 长 有 关 详 细 信 息, 请 参 阅 第 130 页 码 第 6 章 中 的 CHAID 节 点 Logistic 回 归 是 一 种 统 计 方 法, 它 可 根 据 输 入 字 段 的 值 对 记 录 进 行 分 类 它 类 似 于 线 性 回 归, 但 采 用 的 是 类 别 目 标 字 段 而 非 数 字 范 围 有 关 详 细 信 息, 请 参 阅 第 239 页 码 第 10 章 中 的 逻 辑 节 点 决 策 列 表 节 点 可 标 识 子 组 或 段, 显 示 与 总 体 相 关 的 给 定 二 元 结 果 的 似 然 度 的 高 低 例 如, 您 或 许 在 寻 找 那 些 最 不 可 能 流 失 的 客 户 或 最 有 可 能 对 某 个 商 业 活 动 作 出 积 极 响 应 的 客 户 通 过 定 制 段 和 并 排 预 览 备 选 模 型 来 比 较 结 果, 您 可 以 将 自 己 的 业 务 知 识 体 现 在 模 型 中 决 策 列 表 模 型 由 一 组 规 则 构 成, 其 中 每 个 规 则 具 备 一 个 条 件 和 一 个 结 果 规 则 依 顺 序 应 用, 相 匹 配 的 第 一 个 规 则 将 决 定 结 果 有 关 详 细 信 息, 请 参 阅 第 188 页 码 第 9 章 中 的 决 策 表 通 过 贝 叶 斯 网 络 节 点, 你 可 以 利 用 对 真 实 世 界 认 知 的 判 断 力 并 结 合 所 观 察 和 记 录 的 证 据 来 构 建 概 率 模 型 该 节 点 重 点 应 用 了 树 扩 展 简 单 贝 叶 斯 (TAN) 和 马 尔 可 夫 毯 网 络, 这 些 算 法 主 要 用 于 分 类 问 题 有 关 详 细 信 息, 请 参 阅 第 165 页 码 第 7 章 中 的 贝 叶 斯 网 络 节 点 判 别 式 分 析 所 做 的 假 设 比 logistic 回 归 的 假 设 更 严 格, 但 在 符 合 这 些 假 设 时, 判 别 式 分 析 可 以 作 为 logistic 回 归 分 析 的 有 用 替 代 项 或 补 充 有 关 详 细 信 息, 请 参 阅 第 263 页 码 第 10 章 中 的 判 别 式 节 点

99 87 自 动 建 模 节 点 The k- 最 近 相 邻 元 素 (KNN) 节 点 将 新 的 个 案 关 联 到 预 测 变 量 空 间 中 与 其 最 邻 近 的 k 个 对 象 的 类 别 或 值 ( 其 中 k 为 整 数 ) 类 似 个 案 相 互 靠 近, 而 不 同 个 案 相 互 远 离 有 关 详 细 信 息, 请 参 阅 第 396 页 码 第 16 章 中 的 KNN 节 点 使 用 Support Vector Machine (SVM) 节 点, 可 以 将 数 据 分 为 两 组, 而 无 需 过 度 拟 合 SVM 可 以 与 大 量 数 据 集 配 合 使 用, 如 那 些 含 有 大 量 输 入 字 段 的 数 据 集 有 关 详 细 信 息, 请 参 阅 第 391 页 码 第 15 章 中 的 SVM 节 点 误 分 类 损 失 在 某 些 环 境 中, 特 定 错 误 类 别 的 成 本 高 于 其 他 错 误 的 成 本 例 如, 将 高 风 险 信 贷 申 请 人 分 类 为 低 风 险 申 请 人 ( 一 种 错 误 类 别 ) 的 成 本 高 于 将 低 风 险 申 请 人 分 类 为 高 风 险 申 请 人 ( 另 一 种 错 误 类 别 ) 的 成 本 使 用 误 分 类 成 本 可 指 定 不 同 类 别 的 预 测 错 误 的 相 对 重 要 性 误 分 类 成 本 在 本 质 上 指 应 用 于 特 定 结 果 的 权 重 这 些 权 重 可 化 为 模 型 中 的 因 子, 并 可 能 在 实 际 上 更 改 预 测 ( 作 为 避 免 高 成 本 错 误 的 一 种 方 式 ) 除 C5.0 模 型 之 外, 在 对 模 型 进 行 评 分 时, 误 分 类 成 本 是 不 适 用 的 ; 在 使 用 自 动 分 类 器 节 点 评 估 图 表 或 分 析 节 点 对 模 型 进 行 排 序 或 比 较 时, 误 分 类 成 本 也 不 予 以 考 虑 将 成 本 计 算 在 内 的 模 型 不 比 不 将 成 本 计 算 在 内 的 模 型 产 生 的 误 差 小, 这 样 的 模 型 不 会 也 不 可 能 按 照 总 体 精 确 性 排 序 到 任 何 更 高 的 级 别, 但 是 在 实 际 应 用 中, 这 样 的 模 型 执 行 的 结 果 可 能 更 好, 因 为 它 有 一 个 内 置 的 偏 差, 从 而 有 利 于 将 错 误 的 成 本 降 低 成 本 矩 阵 显 示 了 预 测 类 别 和 实 际 类 别 的 每 个 可 能 的 组 合 的 成 本 默 认 情 况 下, 所 有 误 分 类 成 本 都 设 置 为 1.0 要 输 入 自 定 义 成 本 值, 可 选 择 使 用 误 分 类 成 本 并 将 自 定 义 值 输 入 到 成 本 矩 阵 中 要 更 改 误 分 类 成 本, 可 选 择 与 所 需 的 预 测 值 和 实 际 值 的 组 合 对 应 的 单 元 格, 清 除 此 单 元 格 内 现 有 的 内 容, 然 后 为 其 输 入 所 需 的 成 本 成 本 不 会 自 动 均 摊 例 如, 如 果 将 A 误 分 类 为 B 的 成 本 设 置 为 2.0, 则 将 B 误 分 类 为 A 的 成 本 将 仍 是 默 认 值 1.0, 除 非 也 明 确 地 对 它 进 行 更 改 自 动 分 类 器 节 点 丢 弃 选 项 使 用 自 动 分 类 器 节 点 的 丢 弃 选 项 卡, 可 以 自 动 丢 弃 不 符 合 特 定 标 准 的 模 型 这 些 模 型 将 不 会 列 在 汇 总 报 告 中

100 88 章 5 图 片 5-6 自 动 分 类 器 节 点 : 丢 弃 选 项 卡 可 以 为 总 准 确 性 指 定 最 小 阈 值, 为 模 型 中 使 用 的 变 量 数 指 定 最 大 阈 值 此 外, 对 于 标 志 目 标, 可 以 为 提 升 利 润 和 曲 线 下 方 区 域 指 定 最 小 阈 值, 提 升 和 利 润 由 在 模 型 选 项 卡 上 指 定 的 内 容 所 确 定 有 关 详 细 信 息, 请 参 阅 第 83 页 码 自 动 分 类 器 节 点 模 型 选 项 或 者, 可 以 将 节 点 配 置 为 在 首 次 生 成 满 足 所 有 指 定 标 准 的 模 型 时 停 止 执 行 有 关 详 细 信 息, 请 参 阅 第 81 页 码 自 动 建 模 节 点 停 止 规 则 自 动 分 类 器 节 点 设 置 选 项 自 动 分 类 器 节 点 的 设 置 选 项 卡 允 许 您 预 配 置 块 上 可 用 的 得 分 时 间 选 项

101 89 自 动 建 模 节 点 图 片 5-7 自 动 分 类 器 节 点 : 设 置 选 项 卡 整 体 方 法 对 于 目 标, 您 可 以 从 以 下 整 体 方 法 选 择 : 投 票 置 信 度 加 权 投 票 原 始 倾 向 加 权 投 票 ( 仅 适 用 于 标 志 目 标 ) 赢 得 最 高 置 信 度 平 均 原 始 倾 向 ( 仅 适 用 于 标 志 目 标 ) 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 整 体 节 点 设 置 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 如 果 约 束 投 票, 请 使 用 以 下 选 项 选 择 值 根 据 投 票 方 法, 可 以 指 定 解 决 投 票 同 数 的 方 法 : 随 机 选 择 随 机 选 择 其 中 一 个 同 数 值 最 高 置 信 度 选 择 使 用 最 高 置 信 度 进 行 预 测 的 同 数 值 请 注 意, 该 置 信 度 值 无 需 与 所 有 预 测 值 的 最 高 置 信 度 值 相 同 原 始 倾 向 ( 仅 适 合 标 志 目 标 ) 使 用 最 大 绝 对 倾 向 预 测 的 同 数 值, 其 中 绝 对 倾 向 的 计 算 方 法 如 下 : abs(0.5 - propensity) * 2

102 90 章 5 自 动 数 值 节 点 自 动 数 值 节 点 使 用 多 种 不 同 方 法 估 算 和 比 较 模 型 得 出 连 续 数 字 范 围 结 果, 使 您 在 一 次 运 行 中 即 可 尝 试 各 种 方 法 您 可 以 选 择 所 用 算 法, 并 试 验 选 项 的 多 个 组 合 例 如, 可 以 使 用 神 经 网 络 线 性 回 归 C&RT 和 CHAID 模 型 预 测 住 房 值, 以 查 看 哪 种 模 型 的 性 能 最 好, 并 且 可 以 尝 试 逐 步 前 进 和 后 退 回 归 法 的 不 同 组 合 节 点 研 究 选 项 的 每 个 可 能 组 合, 根 据 您 指 定 的 测 量 为 每 个 候 选 模 型 排 序, 并 保 存 最 佳 模 型 用 于 评 分 或 将 来 的 分 析 有 关 详 细 信 息, 请 参 阅 第 79 页 码 自 动 建 模 节 点 图 片 5-8 自 动 数 值 结 果 示 例 市 Õþ 当 局 需 要 更 准 确 地 估 计 房 地 产 税 以 及 无 需 检 查 每 个 属 性 就 可 以 按 需 要 调 整 特 定 属 性 的 值 使 用 自 动 数 值 节 点, 分 析 师 能 产 生 和 对 比 许 多 基 于 构 建 类 型 近 邻 大 小 和 其 他 已 知 因 素 来 预 测 属 性 值 的 模 型 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 属 性 值 ( 自 动 数 值 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 要 求 一 个 目 标 字 段 ( 角 色 设 置 为 目 标 ) 和 至 少 一 个 输 入 字 段 ( 角 色 设 置 为 输 入 ) 目 标 必 须 为 连 续 ( 数 值 范 围 ) 字 段, 如 年 龄 或 收 入 输 入 字 段 可 以 是 连 续 或 分 类, 但 具 有 限 制, 即 某 些 输 入 可 能 不 适 合 一 些 模 型 类 型 例 如,C&R 树 模 型 能 将 分 类 字 符 串 字 段 作 为 输 入 使 用, 而 线 性 回 归 模 型 不 能 使 用 这 些 字 段 并 将 在 指 定 这 些 字 段 后 省 略 它 们 这 和 使 用 单 独 建 模 节 点 时 的 要 求 相 同 例 如, 不 管 CHAID 模 型 是 在 CHAID 节 点 中 还 是 在 自 动 数 值 节 点 中 生 成, 其 工 作 方 式 都 相 同 频 数 和 加 权 字 段 频 数 和 加 权 用 于 增 强 某 些 记 录 的 重 要 性, 以 超 过 其 他 记 录, 原 因 可 能 是 用 户 知 道 构 建 数 据 集 省 略 父 总 体 的 一 部 分 ( 加 权 ) 或 一 个 记 录 代 表 一 个 相 同 观 测 值 数 ( 频 数 ) 等 如 果 指 定 频 数 字 段, 它 就 可 以 用 于 C&R 树 和 CHAID 算 法 加 权 字 段 可 用 于 C&RT CHAID 回 归 和 GenLin 算 法 其 他 模 型 类 型 将 省 略 这 些 字 段 并 以 任 意 方 式 构 建

103 91 自 动 建 模 节 点 模 型 频 数 和 加 权 字 段 仅 用 于 模 型 构 建, 并 且 在 评 估 和 评 分 模 型 时 不 予 以 考 虑 有 关 详 细 信 息, 请 参 阅 第 33 页 码 第 3 章 中 的 使 用 频 率 和 权 重 字 段 支 持 的 模 型 类 型 支 持 的 模 型 类 型 包 括 神 经 网 络 C&R 树 CHAID 回 归 GenLin 最 近 相 邻 元 素 和 SVM 有 关 详 细 信 息, 请 参 阅 第 92 页 码 自 动 数 值 节 点 专 家 选 项 自 动 数 值 节 点 模 型 选 项 使 用 自 动 数 值 节 点 的 模 型 选 项 卡 可 以 指 定 要 保 存 的 模 型 数, 以 及 用 于 比 较 模 型 的 标 准 图 片 5-9 自 动 数 值 节 点 : 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 模 型 排 序 依 据 指 定 用 于 比 较 模 型 的 标 准

104 92 章 5 相 关 每 条 记 录 的 观 测 值 和 模 型 预 测 的 值 之 间 的 Pearson 相 关 性 相 关 性 是 两 种 变 量 之 间 的 线 性 关 联 尺 度, 值 越 接 近 1 说 明 变 量 之 间 的 关 系 越 强 ( 相 关 性 的 值 在 1 和 +1 之 间, 1 代 表 完 全 负 关 系,+1 代 表 完 全 正 关 系 值 为 0 表 示 无 线 性 关 系, 但 具 有 负 相 关 性 的 模 型 将 排 在 最 后 ) 字 段 数 模 型 中 用 作 预 测 变 量 的 字 段 的 数 量 在 某 些 情 况 下, 选 择 使 用 较 少 字 段 的 模 型 可 简 化 数 据 准 备 过 程 并 提 高 性 能 相 对 错 误 相 对 错 误 是 模 型 预 测 值 的 观 测 值 的 方 差 与 平 均 值 的 观 测 值 方 差 的 比 率 在 实 际 应 用 的 角 度, 它 对 比 模 型 相 对 于 空 或 截 距 模 型 ( 仅 返 回 目 标 字 段 的 平 均 值 作 为 预 测 值 ) 的 性 能 对 于 好 的 模 型, 此 值 应 小 于 1, 说 明 此 模 型 比 空 模 型 更 精 确 相 对 错 误 大 于 1 的 模 型 不 如 空 模 型 精 确, 因 此 这 样 的 模 型 没 有 意 义 对 于 线 性 回 归 模 型, 相 对 错 误 等 同 于 相 关 性 的 平 方 并 且 未 添 加 任 何 新 的 信 息 对 于 非 线 性 模 型, 相 对 错 误 与 相 关 性 无 关 并 且 为 评 估 模 型 性 能 提 供 了 附 加 尺 度 模 型 排 序 方 式 如 果 正 在 使 用 分 区, 则 可 以 指 定 基 于 训 练 分 区 排 序 还 是 基 于 测 试 分 区 排 序 对 于 大 型 数 据 集, 使 用 分 区 对 模 型 进 行 预 筛 选 将 大 大 提 高 执 行 能 力 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 要 使 用 的 模 型 数 指 定 要 在 节 点 生 成 的 模 型 块 中 显 示 的 最 大 模 型 数 按 照 指 定 的 排 序 标 准 将 顺 次 列 出 排 序 靠 前 的 模 型 增 加 此 限 制 可 以 对 比 更 多 模 型 的 结 果, 但 是 可 能 会 降 低 性 能 允 许 的 最 大 值 为 100 计 算 预 测 变 量 重 要 性 对 于 生 成 相 应 重 要 性 测 量 的 模 型, 可 以 显 示 一 个 图 表 来 说 明 评 估 模 型 中 每 个 预 测 变 量 的 相 对 重 要 性 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 请 注 意, 预 测 变 量 重 要 性 可 能 会 增 加 计 算 某 些 模 型 所 需 的 时 间, 如 果 仅 仅 希 望 对 许 多 不 同 的 模 型 进 行 广 泛 对 比, 则 不 建 议 评 估 变 量 重 要 性 将 分 析 限 制 在 要 进 一 步 探 索 的 几 个 模 型 上 会 更 有 用 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 在 下 列 情 况 下 不 保 存 模 型 指 定 相 关 性 相 对 错 误 和 所 用 字 段 数 的 临 界 值 无 法 满 足 这 些 标 准 中 的 任 意 一 个 的 模 型 将 被 丢 弃, 并 且 不 会 在 汇 总 报 告 中 列 出 相 关 小 于 要 包 含 在 汇 总 报 告 中 的 模 型 的 最 小 相 关 性 ( 按 绝 对 值 ) 所 用 字 段 数 大 于 要 包 含 的 任 意 模 型 要 使 用 的 字 段 的 最 大 数 相 对 错 误 大 于 要 包 含 的 任 意 模 型 的 最 大 相 对 错 误 或 者, 可 以 将 节 点 配 置 为 在 首 次 生 成 满 足 所 有 指 定 标 准 的 模 型 时 停 止 执 行 有 关 详 细 信 息, 请 参 阅 第 81 页 码 自 动 建 模 节 点 停 止 规 则 自 动 数 值 节 点 专 家 选 项 使 用 自 动 数 值 节 点 的 专 家 选 项 卡 可 以 选 择 要 使 用 和 要 指 定 停 止 规 则 的 算 法 和 选 项

105 93 自 动 建 模 节 点 图 片 5-10 自 动 数 值 节 点 : 专 家 选 项 卡 已 使 用 模 型 使 用 左 侧 列 中 的 复 选 框 选 择 要 在 比 较 中 包 括 的 模 型 类 型 ( 算 法 ) 选 择 的 类 型 越 多, 创 建 的 模 型 就 会 越 多, 且 处 理 的 时 间 就 会 越 长 模 型 类 型 列 出 可 用 的 算 法 ( 请 参 阅 下 面 的 内 容 ) 模 型 参 数 对 于 每 个 模 型 类 型, 可 以 使 用 默 认 设 置, 或 选 择 指 定 为 每 个 模 型 类 型 选 择 选 项 这 些 特 定 选 项 类 似 于 独 立 建 模 节 点 中 可 用 的 选 项, 不 同 之 处 在 于 可 以 选 择 多 个 选 项 或 组 合 例 如, 比 较 神 经 网 络 模 型 时, 与 其 选 择 六 种 训 练 方 法 之 一, 还 不 如 一 次 选 中 全 部 六 种 方 法 以 在 一 次 传 递 中 训 练 六 种 模 型 模 型 数 列 出 基 于 当 前 设 置 为 每 个 算 法 生 成 的 模 型 数 当 组 合 选 项 时, 模 型 数 会 激 增, 因 此 强 烈 建 议 密 切 关 注 该 模 型 数, 尤 其 在 使 用 大 型 数 据 集 时 限 制 单 模 型 最 长 构 建 时 间 ( 仅 K-Means Kohonen TwoStep SVM KNN Bayes Net 和 决 策 列 表 模 型 ) 为 任 意 一 个 模 型 设 置 最 长 时 间 限 制 例 如, 如 果 由 于 某 些 复 杂 的 交 互 效 应, 某 个 特 定 模 型 所 需 的 训 练 时 间 长 得 出 乎 意 料, 则 您 大 概 不 希 望 它 使 得 整 个 的 建 模 运 行 停 滞 支 持 的 算 法 神 经 网 络 节 点 使 用 的 模 型 是 对 人 类 大 脑 处 理 信 息 的 方 式 简 化 了 的 模 型 此 模 型 通 过 模 拟 大 量 类 似 于 神 经 元 的 抽 象 形 式 的 互 连 简 单 处 理 单 元 而 运 行 神 经 网 络 是 功 能 强 大 的 一 般 函 数 估 计 器, 只 需 要 最 少 的 统 计 或 数 学 知 识 就 可 以 对 其 进 行 训 练 或 应 用

106 94 章 5 分 类 和 回 归 (C&R) 树 节 点 生 成 可 用 于 预 测 或 分 类 未 来 观 测 值 的 决 策 树 该 方 法 通 过 在 每 个 步 骤 最 大 限 度 降 低 不 纯 洁 度, 使 用 递 归 分 区 来 将 训 练 记 录 分 割 为 组 如 果 节 点 中 100% 的 观 测 值 都 属 于 目 标 字 段 的 一 个 特 定 类 别, 则 树 中 的 该 节 点 将 被 认 定 为 纯 洁 目 标 和 输 入 字 段 可 以 是 数 字 范 围 或 分 类 ( 名 义 有 序 或 标 志 ); 所 有 分 割 均 为 二 元 分 割 ( 即 仅 分 割 为 两 个 子 组 ) 有 关 详 细 信 息, 请 参 阅 第 130 页 码 第 6 章 中 的 C&R 树 节 点 CHAID 使 用 卡 方 统 计 量 来 生 成 决 策 树, 以 确 定 最 佳 的 分 割 CHAID 与 C&R 树 和 QUEST 节 点 不 同, 它 可 以 生 成 非 二 元 树, 这 意 味 着 有 些 分 割 将 有 多 于 两 个 的 分 支 目 标 和 输 入 字 段 可 以 是 数 字 范 围 ( 连 续 ) 或 分 类 Exhaustive CHAID 是 CHAID 的 修 正 版, 它 对 所 有 分 割 进 行 更 彻 底 的 检 查, 但 计 算 时 间 比 较 长 有 关 详 细 信 息, 请 参 阅 第 130 页 码 第 6 章 中 的 CHAID 节 点 线 性 回 归 是 一 种 通 过 拟 合 直 线 或 平 面 以 实 现 汇 总 数 据 和 预 测 的 普 通 统 计 方 法, 它 可 使 预 测 值 和 实 际 输 出 值 之 间 的 差 异 最 小 化 广 义 线 性 模 型 对 一 般 线 性 模 型 进 行 了 扩 展, 这 样 因 变 量 通 过 指 定 的 关 联 函 数 与 因 子 和 协 变 量 线 性 相 关 另 外, 该 模 型 允 许 因 变 量 呈 非 正 态 分 布 它 包 括 统 计 模 型 大 部 分 的 功 能, 其 中 包 括 线 性 回 归 logistic 回 归 用 于 计 数 数 据 的 对 数 线 性 模 型 以 及 区 间 删 失 生 存 模 型 有 关 详 细 信 息, 请 参 阅 第 270 页 码 第 10 章 中 的 GenLin 节 点 The k- 最 近 相 邻 元 素 (KNN) 节 点 将 新 的 个 案 关 联 到 预 测 变 量 空 间 中 与 其 最 邻 近 的 k 个 对 象 的 类 别 或 值 ( 其 中 k 为 整 数 ) 类 似 个 案 相 互 靠 近, 而 不 同 个 案 相 互 远 离 有 关 详 细 信 息, 请 参 阅 第 396 页 码 第 16 章 中 的 KNN 节 点 使 用 Support Vector Machine (SVM) 节 点, 可 以 将 数 据 分 为 两 组, 而 无 需 过 度 拟 合 SVM 可 以 与 大 量 数 据 集 配 合 使 用, 如 那 些 含 有 大 量 输 入 字 段 的 数 据 集 有 关 详 细 信 息, 请 参 阅 第 391 页 码 第 15 章 中 的 SVM 节 点 线 性 回 归 模 型 根 据 目 标 与 一 个 或 多 个 预 测 变 量 间 的 线 性 关 系 来 预 测 连 续 目 标 有 关 详 细 信 息, 请 参 阅 第 221 页 码 第 10 章 中 的 线 性 模 型 自 动 数 值 节 点 设 置 选 项 自 动 数 值 节 点 的 设 置 选 项 卡 允 许 您 预 配 置 块 上 可 用 的 得 分 时 间 选 项

107 95 自 动 建 模 节 点 图 片 5-11 自 动 数 值 节 点 : 设 置 选 项 卡 计 算 标 准 误 对 于 连 续 ( 数 值 范 围 ) 目 标, 默 认 情 况 下 会 运 行 标 准 误 计 算 以 计 算 测 量 或 估 算 值 与 真 值 之 间 的 差 值 ; 并 显 示 这 些 估 算 值 的 相 近 匹 配 程 度 自 动 聚 类 节 点 自 动 聚 类 节 点 估 算 和 比 较 识 别 具 有 类 似 特 征 记 录 组 的 聚 类 模 型 节 点 工 作 方 式 与 其 他 自 动 建 模 节 点 相 同, 使 您 在 一 次 建 模 运 行 中 即 可 试 验 多 个 选 项 组 合 模 型 可 使 用 基 本 测 量 进 行 比 较, 以 尝 试 过 滤 聚 类 模 型 的 有 效 性 以 及 对 其 进 行 排 序, 并 提 供 一 个 基 于 特 定 字 段 的 重 要 性 的 测 量 聚 类 模 型 常 常 用 于 识 别 在 后 续 分 析 中 可 用 作 输 入 的 组 例 如, 您 可 能 希 望 基 于 如 收 入 的 统 计 特 征 来 针 对 客 户 群, 或 基 于 客 户 过 去 购 买 的 服 务 而 针 对 客 户 群 可 以 在 不 了 解 客 户 群 及 其 特 征 的 情 况 下 进 行 此 操 作 您 可 能 不 知 道 要 寻 找 多 少 个 客 户 群, 或 该 用 什 么 特 征 去 定 义 客 户 群 聚 类 模 型 常 称 作 不 受 监 督 的 学 习 模 型, 因 为 其 不 使 用 目 标 字 段, 且 不 返 回 可 估 算 为 真 或 假 的 具 体 预 测 聚 类 模 型 的 值 由 模 型 捕 获 数 据 中 感 兴 趣 的 分 组 并 提 供 这 些 分 组 的 有 用 说 明 信 息 的 能 力 来 确 定 有 关 详 细 信 息, 请 参 阅 第 292 页 码 第 11 章 中 的 聚 类 模 型

108 96 章 5 图 片 5-12 自 动 聚 类 结 果 要 求 定 义 兴 趣 特 征 的 一 个 或 多 个 字 段 聚 类 模 型 使 用 目 标 字 段 的 方 式 与 其 他 模 型 不 同, 因 为 其 不 作 出 能 被 评 估 为 真 或 假 的 特 定 预 测 相 反, 其 用 于 识 别 可 能 相 关 的 个 案 组 例 如, 您 无 法 使 用 预 测 给 定 客 户 会 流 失 还 是 对 预 订 作 出 积 极 响 应 的 聚 类 模 型 但 您 可 以 使 用 基 于 客 户 对 此 类 事 物 的 倾 向 性 将 客 户 分 组 的 聚 类 模 型 也 不 使 用 加 权 和 频 率 字 段 评 估 字 段 虽 然 不 使 用 目 标, 您 可 以 指 定 在 比 较 模 型 中 使 用 的 一 个 或 多 个 评 估 字 段 可 通 过 测 量 聚 类 区 分 这 些 字 段 的 好 坏 情 况 来 评 估 聚 类 模 型 的 有 效 性 支 持 的 模 型 类 型 支 持 模 型 类 型 包 括 两 步 K 均 值 及 Kohonen 类 型 自 动 聚 类 节 点 模 型 选 项 使 用 自 动 聚 类 节 点 的 模 型 选 项 卡 可 以 指 定 要 保 存 的 模 型 数, 以 及 用 于 比 较 模 型 的 标 准

109 97 自 动 建 模 节 点 图 片 5-13 自 动 聚 类 节 点 : 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 模 型 排 序 依 据 指 定 用 于 比 较 和 排 序 模 型 的 标 准 Silhouette 索 引 测 量 聚 类 结 合 和 分 离 有 关 详 细 信 息, 请 参 阅 下 面 的 Silhouette 排 序 测 量 聚 类 数 模 型 中 的 聚 类 数 最 小 聚 类 的 大 小 最 小 聚 类 的 大 小 最 大 聚 类 的 大 小 最 大 聚 类 的 大 小 最 小 / 最 大 聚 类 最 小 聚 类 与 最 大 聚 类 的 大 小 比 率 重 要 性 字 段 选 项 卡 上 的 评 估 字 段 的 重 要 性 注 意 只 有 在 评 估 字 段 已 指 定 时, 才 能 计 算 模 型 排 序 方 式 如 果 正 在 使 用 分 区, 则 可 以 指 定 基 于 训 练 数 据 集 排 序 或 是 基 于 检 验 数 据 集 排 序 对 于 大 型 数 据 集, 使 用 分 区 对 模 型 进 行 预 筛 选 将 大 大 提 高 执 行 能 力 要 保 留 的 模 型 数 指 定 要 在 节 点 生 成 的 块 中 列 出 的 最 大 模 型 数 按 照 指 定 的 排 序 标 准 将 顺 次 列 出 排 序 靠 前 的 模 型 注 意, 增 加 此 最 大 模 型 数 将 减 缓 执 行 速 度 允 许 的 最 大 值 为 100

110 98 章 5 Silhouette 排 序 测 量 默 认 排 序 测 量,Silhouette, 默 认 值 为 0, 这 是 因 为 小 于 0 的 值 ( 即 负 值 ) 表 示 其 分 配 的 聚 类 中 的 观 测 值 与 点 之 间 的 平 均 距 离 大 于 观 测 值 与 另 一 个 聚 类 中 点 的 最 小 平 均 距 离 因 此, 具 有 负 Silhouette 值 的 模 型 可 以 安 全 地 丢 弃 排 序 测 量 实 际 上 为 修 改 的 silhouette 系 数, 它 结 合 了 聚 类 结 合 ( 偏 向 包 含 紧 密 结 合 聚 类 的 模 型 ) 和 聚 类 分 离 ( 偏 向 包 含 高 度 分 离 聚 类 的 模 型 ) 的 概 念 平 均 Silhouette 系 数 是 在 所 有 观 测 值 上 的 简 单 平 均, 每 个 单 独 观 测 值 应 用 下 列 计 算 : (B - A) / max(a, B) 其 中 A 为 从 观 测 值 到 其 所 属 聚 类 的 矩 心 的 距 离,B 为 从 观 测 值 到 每 个 其 他 聚 类 矩 心 的 最 小 距 离 Silhouette 系 数 ( 及 其 平 均 值 ) 大 小 在 -1( 表 示 极 差 的 模 型 ) 与 1( 表 示 极 好 的 模 型 ) 之 间 可 以 在 总 体 观 测 值 级 别 上 求 平 均 值 ( 得 到 总 体 Silhouette), 也 可 在 聚 类 级 别 上 求 平 均 值 ( 得 到 聚 类 Silhouette) 距 离 可 以 使 用 Euclidean 距 离 进 行 计 算 自 动 聚 类 节 点 专 家 选 项 使 用 自 动 聚 类 节 点 的 专 家 选 项 卡, 可 以 应 用 分 区 ( 如 果 可 用 ) 选 择 使 用 的 算 法 及 指 定 停 止 规 则 图 片 5-14 自 动 聚 类 节 点 : 专 家 选 项 卡

111 99 自 动 建 模 节 点 已 使 用 模 型 使 用 左 侧 列 中 的 复 选 框 选 择 要 在 比 较 中 包 括 的 模 型 类 型 ( 算 法 ) 选 择 的 类 型 越 多, 创 建 的 模 型 就 会 越 多, 且 处 理 的 时 间 就 会 越 长 模 型 类 型 列 出 可 用 的 算 法 ( 请 参 阅 下 面 的 内 容 ) 模 型 参 数 对 于 每 个 模 型 类 型, 可 以 使 用 默 认 设 置, 或 选 择 指 定 为 每 个 模 型 类 型 选 择 选 项 这 些 特 定 选 项 类 似 于 独 立 建 模 节 点 中 可 用 的 选 项, 不 同 之 处 在 于 可 以 选 择 多 个 选 项 或 组 合 例 如, 比 较 神 经 网 络 模 型 时, 与 其 选 择 六 种 训 练 方 法 之 一, 还 不 如 一 次 选 中 全 部 六 种 方 法 以 在 一 次 传 递 中 训 练 六 种 模 型 模 型 数 列 出 基 于 当 前 设 置 为 每 个 算 法 生 成 的 模 型 数 当 组 合 选 项 时, 模 型 数 会 激 增, 因 此 强 烈 建 议 密 切 关 注 该 模 型 数, 尤 其 在 使 用 大 型 数 据 集 时 限 制 单 模 型 最 长 构 建 时 间 ( 仅 K-Means Kohonen TwoStep SVM KNN Bayes Net 和 决 策 列 表 模 型 ) 为 任 意 一 个 模 型 设 置 最 长 时 间 限 制 例 如, 如 果 由 于 某 些 复 杂 的 交 互 效 应, 某 个 特 定 模 型 所 需 的 训 练 时 间 长 得 出 乎 意 料, 则 您 大 概 不 希 望 它 使 得 整 个 的 建 模 运 行 停 滞 支 持 的 算 法 K-Means 节 点 将 数 据 集 聚 类 到 不 同 分 组 ( 或 聚 类 ) 此 方 法 将 定 义 固 定 的 聚 类 数 量, 将 记 录 迭 代 分 配 给 聚 类, 以 及 调 整 聚 类 中 心, 直 到 进 一 步 优 化 无 法 再 改 进 模 型 k-means 节 点 作 为 一 种 非 监 督 学 习 机 制, 它 并 不 试 图 预 测 结 果, 而 是 揭 示 隐 含 在 输 入 字 段 集 中 的 模 式 有 关 详 细 信 息, 请 参 阅 第 298 页 码 第 11 章 中 的 K-Means 节 点 Kohonen 节 点 会 生 成 一 种 神 经 网 络, 此 神 经 网 络 可 用 于 将 数 据 集 聚 类 到 各 个 差 异 组 此 网 络 训 练 完 成 后, 相 似 的 记 录 应 在 输 出 映 射 中 紧 密 地 聚 集, 差 异 大 的 记 录 则 应 彼 此 远 离 您 可 以 通 过 查 看 模 型 块 中 每 个 单 元 所 捕 获 观 测 值 的 数 量 来 找 出 规 模 较 大 的 单 元 这 将 让 您 对 聚 类 的 相 应 数 量 有 所 估 计 有 关 详 细 信 息, 请 参 阅 第 293 页 码 第 11 章 中 的 Kohonen 节 点 TwoStep 节 点 使 用 两 步 聚 类 方 法 第 一 步 完 成 简 单 数 据 处 理, 以 便 将 原 始 输 入 数 据 压 缩 为 可 管 理 的 子 聚 类 集 合 第 二 步 使 用 层 级 聚 类 方 法 将 子 聚 类 一 步 一 步 合 并 为 更 大 的 聚 类 TwoStep 具 有 一 个 优 点, 就 是 能 够 为 训 练 数 据 自 动 估 计 最 佳 聚 类 数 它 可 以 高 效 处 理 混 合 的 字 段 类 型 和 大 型 的 数 据 集 有 关 详 细 信 息, 请 参 阅 第 302 页 码 第 11 章 中 的 两 步 聚 类 节 点 自 动 聚 类 节 点 丢 弃 选 项 使 用 自 动 聚 类 节 点 的 丢 弃 选 项 卡, 可 以 自 动 丢 弃 不 满 足 某 些 条 件 的 模 型 这 些 模 型 将 不 会 列 在 模 型 块 中

112 100 章 5 图 片 5-15 自 动 聚 类 节 点 : 丢 弃 选 项 卡 自 动 模 型 块 您 可 以 指 定 最 小 silhouette 值 聚 类 数 聚 类 大 小 和 模 型 中 所 用 评 估 字 段 的 重 要 性 应 根 据 建 模 节 点 中 的 指 定 来 决 定 Silhouette 以 及 聚 类 的 数 量 和 大 小 有 关 详 细 信 息, 请 参 阅 第 96 页 码 自 动 聚 类 节 点 模 型 选 项 或 者, 可 以 将 节 点 配 置 为 在 首 次 生 成 满 足 所 有 指 定 标 准 的 模 型 时 停 止 执 行 有 关 详 细 信 息, 请 参 阅 第 81 页 码 自 动 建 模 节 点 停 止 规 则 执 行 自 动 建 模 节 点 时, 节 点 评 估 每 个 可 能 选 项 组 合 的 候 选 模 型, 基 于 您 指 定 的 测 量 为 每 个 候 选 模 型 排 序, 并 将 最 佳 模 型 保 存 在 复 合 自 动 模 型 块 中 此 模 型 块 实 际 上 包 含 该 节 点 生 成 的 一 个 或 多 个 模 型 的 集 合, 其 中 模 型 可 单 独 被 浏 览 或 选 中 用 于 评 分 每 个 模 型 列 有 模 型 类 型 和 构 建 时 间, 以 及 适 合 该 模 型 类 型 的 多 个 其 他 测 量 可 以 按 照 这 些 列 中 的 任 意 一 列 对 表 进 行 排 序, 以 便 快 速 确 定 最 关 注 的 模 型

113 101 自 动 建 模 节 点 图 片 5-16 自 动 数 值 结 果 要 浏 览 任 何 一 个 单 独 的 模 型 块, 请 双 击 模 型 块 图 标 然 后, 可 以 从 这 里 生 成 该 模 型 的 建 模 节 点 到 流 工 作 区, 或 生 成 模 型 块 副 本 到 模 型 选 项 板 使 用 缩 略 图 图 形 可 以 快 速 而 直 观 地 评 估 每 个 模 型 类 型, 总 结 如 下 可 以 双 击 缩 略 图 生 成 标 准 大 小 的 图 形 标 准 大 小 的 散 点 图 可 以 最 多 显 示 1000 个 点 并 且 会 在 数 据 集 包 含 更 多 点 时 基 于 样 本 ( 仅 对 于 散 点 图, 图 表 每 显 示 一 次 就 重 新 生 成 一 次, 所 以 上 游 数 据 中 的 任 意 更 改 ( 例 如 在 未 选 中 设 置 随 机 数 种 子 时 更 新 随 机 样 本 或 分 区 ) 在 每 次 重 新 绘 制 散 点 图 时 都 会 反 映 出 来 ) 使 用 工 具 栏 在 模 型 选 项 卡 上 显 示 或 隐 藏 特 定 的 列 或 更 改 用 于 对 表 排 序 的 列 ( 也 可 以 通 过 单 击 列 标 题 更 改 排 序 列 ) 使 用 删 除 按 钮 以 永 久 删 除 任 何 未 用 的 模 型 要 重 新 为 列 排 序, 请 单 击 列 标 题 并 将 该 列 拖 放 到 所 需 位 置 如 果 正 在 使 用 分 区, 则 可 选 择 查 看 可 应 用 的 训 练 分 区 或 检 验 分 区 的 结 果 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 特 定 的 列 取 决 于 要 对 比 的 模 型 的 类 型, 下 文 已 详 细 列 出 二 元 目 标 对 于 二 元 模 型, 缩 略 图 图 表 显 示 实 际 值 的 分 布 和 与 预 测 值 的 交 叠, 来 快 速 直 观 地 表 示 每 个 类 别 中 正 确 预 测 的 记 录 条 数 排 序 标 准 与 自 动 分 类 器 建 模 节 点 中 的 选 项 匹 配 有 关 详 细 信 息, 请 参 阅 第 83 页 码 自 动 分 类 器 节 点 模 型 选 项

114 102 章 5 对 于 最 大 利 润, 还 会 报 告 产 生 的 最 大 数 的 百 分 位 数 对 于 累 积 提 升, 可 以 使 用 工 具 栏 更 改 选 定 的 百 分 位 数 名 义 目 标 对 于 名 义 ( 集 合 ) 模 型, 缩 略 图 图 表 显 示 实 际 值 的 分 布 和 与 预 测 值 的 交 叠, 来 快 速 直 观 地 表 示 每 个 类 别 中 正 确 预 测 的 记 录 条 数 排 序 标 准 与 自 动 分 类 器 建 模 节 点 中 的 选 项 匹 配 有 关 详 细 信 息, 请 参 阅 第 83 页 码 自 动 分 类 器 节 点 模 型 选 项 连 续 目 标 对 于 连 续 ( 数 值 范 围 ) 模 型, 将 根 据 每 个 模 型 的 观 测 值 预 测 图 形 散 点, 从 而 快 速 直 观 地 表 示 模 型 之 间 的 相 关 性 对 于 好 的 模 型, 点 应 趋 向 于 聚 集 在 对 角 线 周 围, 而 不 是 在 整 个 图 形 中 随 机 分 布 排 序 标 准 与 自 动 数 值 建 模 节 点 中 的 选 项 匹 配 有 关 详 细 信 息, 请 参 阅 第 91 页 码 自 动 数 值 节 点 模 型 选 项 聚 类 目 标 对 于 聚 类 模 型, 将 根 据 每 个 模 型 的 聚 类 计 算 图 形 散 点, 从 而 快 速 直 观 地 表 示 聚 类 分 布 排 序 标 准 与 自 动 聚 类 建 模 节 点 中 的 选 项 匹 配 有 关 详 细 信 息, 请 参 阅 第 96 页 码 自 动 聚 类 节 点 模 型 选 项 选 择 评 分 模 型 使 用? 列 可 选 择 评 分 中 使 用 的 模 型 对 于 二 元 名 义 和 数 字 目 标, 您 可 以 选 择 多 个 评 分 模 型, 并 将 得 分 组 合 在 一 个 整 体 模 型 块 中 通 过 结 合 多 个 模 型 的 预 测, 可 以 避 免 单 个 模 型 的 局 限 性, 使 所 得 的 整 体 准 确 性 通 常 比 从 任 一 模 型 中 获 得 的 准 确 性 要 高 对 于 聚 类 模 型, 一 次 只 能 选 择 一 个 评 分 模 型 默 认 情 况 下, 首 先 选 择 顶 级 模 型 生 成 节 点 和 模 型 可 以 从 复 合 自 动 模 型 块 的 构 建 位 置 生 成 其 副 本, 或 自 动 建 模 节 点 例 如, 当 您 没 有 从 中 构 建 自 动 模 型 块 的 原 始 流 时, 这 可 能 非 常 有 用 此 外, 还 可 以 为 自 动 模 型 块 中 列 出 的 任 何 单 独 模 型 生 成 模 型 块 或 建 模 节 点 自 动 建 模 块 E E 从? 生 成? 菜 单 中, 选 择 模 型 至 选 项 板 将 自 动 模 型 块 添 加 到 模 型 选 项 板 上 可 对 生 成 的 模 型 进 行 保 存, 或 者 在 不 重 新 运 行 流 的 情 况 下 使 用 它 或 者, 可 以 从 生 成 菜 单 中 选 择 生 成 建 模 节 点 以 便 将 建 模 节 点 添 加 到 流 工 作 区 可 以 不 用 重 复 完 整 的 建 模 运 行, 而 使 用 此 节 点 重 新 估 计 选 定 的 模 型

115 103 自 动 建 模 节 点 单 独 模 型 块 E 在 模 型 菜 单 中, 双 击 所 需 的 单 独 模 型 块 块 副 本 在 新 的 对 话 框 中 打 开 E 从 新 对 话 框 中 的 生 成 菜 单 中, 选 择 模 型 至 选 项 板 将 单 独 建 模 块 添 加 到 模 型 选 项 板 上 E 或 者, 可 以 从 新 对 话 框 中 的 生 成 菜 单 中 选 择 生 成 建 模 节 点 以 便 将 单 独 建 模 节 点 添 加 到 流 工 作 区 生 成 评 估 图 表 对 于 二 元 模 型, 可 以 生 成 评 估 图 表 以 直 观 评 价 和 对 比 每 个 模 型 的 性 能 评 估 图 表 不 适 用 于 自 动 数 值 或 自 动 聚 类 节 点 生 成 的 模 型 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 评 估 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 图 片 5-17 具 有 最 佳 线 和 基 线 的 响 应 图 表 ( 累 积 ) E 在 自 动 分 类 器 自 动 模 型 块 的 使 用? 列 下, 选 择 要 评 估 的 模 型 E 从 生 成 菜 单 中, 选 择 评 估 图 表

116 104 章 5 图 片 5-18 生 成 评 估 图 表 E 选 择 图 表 类 型 和 其 他 需 要 的 选 项 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 评 估 散 点 图 选 项 卡 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 评 估 图 形 在 自 动 模 型 块 的 模 型 选 项 卡 上, 可 以 向 下 浏 览 以 显 示 所 示 每 个 模 型 的 单 独 图 形 对 于 自 动 分 类 器 和 自 动 数 值 块, 图 形 选 项 卡 同 时 显 示 反 映 所 有 模 型 组 合 结 果 的 图 形 和 预 测 变 量 重 要 性 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 对 于 自 动 分 类 器, 则 显 示 分 布 图 ; 而 对 于 自 动 数 值 则 显 示 多 重 散 点 图 ( 也 称 为 散 点 图 ) 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 通 用 图 形 节 点 功 能 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 图 片 5-19 自 动 数 值 - 自 动 模 型 块 中 整 体 模 型 的 多 重 散 点 图 形

117 决 策 树 章 6 决 策 树 模 型 决 策 树 模 型 允 许 您 开 发 分 类 系 统, 此 分 类 系 统 可 以 基 于 一 组 决 策 规 则 来 预 测 或 分 类 未 来 的 观 测 值 如 果 将 数 据 分 成 您 关 注 的 类 别 ( 例 如, 高 风 险 和 低 风 险 贷 款 用 户 和 非 用 户 投 票 人 和 非 投 票 人 或 细 菌 类 型 ), 则 您 可 以 使 用 自 己 的 数 据 来 构 建 规 则, 借 此 对 新 案 例 或 旧 案 例 进 行 准 确 性 最 大 的 分 类 例 如, 可 以 基 于 年 龄 和 其 他 因 素 构 建 对 信 用 风 险 或 购 买 意 向 进 行 分 类 的 树 图 片 6-1 交 互 树 窗 口 此 方 法 ( 有 时 称 为 规 则 归 纳 ) 有 若 干 优 点 首 先, 浏 览 树 的 同 时 可 以 明 显 地 看 出 模 型 背 后 的 推 论 过 程 这 与 其 它 黑 箱 建 模 技 术 不 同 的 地 方, 在 其 它 黑 箱 建 模 技 术 中, 你 很 难 了 解 其 内 部 逻 辑 Copyright IBM Corporation 1994,

118 106 章 6 图 片 6-2 购 买 车 的 简 单 决 策 树 其 次, 此 过 程 将 在 其 规 则 中 自 动 包 含 仅 能 真 正 影 响 决 策 的 属 性 不 会 提 高 树 的 准 确 性 的 属 性 将 被 忽 略 此 方 法 可 获 得 非 常 有 用 的 数 据 信 息, 并 且 可 用 于 在 培 训 其 他 学 习 方 法 ( 如 神 经 网 络 ) 之 前 将 数 据 缩 减 到 相 关 字 段 决 策 树 模 块 可 转 换 成 if-then 规 则 的 集 合 ( 规 则 集 ), 在 多 数 情 况 下 此 规 则 集 以 更 为 复 杂 的 形 式 显 示 信 息 决 策 树 表 示 法 可 以 让 您 知 道 数 据 属 性 是 如 何 将 总 体 分 割 或 分 区 成 与 问 题 相 关 的 子 集 规 则 集 表 示 法 可 以 让 您 知 道 特 定 项 目 组 与 具 体 结 论 是 如 何 关 联 的 例 如, 以 下 规 则 就 给 出 了 关 于 值 得 购 买 的 一 组 汽 车 的 概 要 : IF tested = 'yes' AND mileage = 'low' THEN -> 'BUY'. 树 构 建 算 法 四 种 算 法 可 用 于 执 行 分 类 和 段 分 析 这 些 算 法 的 执 行 内 容 基 本 相 同 - 检 查 数 据 集 中 的 所 有 字 段, 以 找 出 一 个 字 段, 该 字 段 可 通 过 将 数 据 分 割 成 若 干 子 组 实 现 最 佳 分 类 或 预 测 此 过 程 将 重 复 应 用 以 将 子 组 分 割 成 越 来 越 小 的 单 位, 直 到 树 结 束 生 长 ( 由 特 定 的 停 止 条 件 所 定 义 ) 构 建 树 的 过 程 中 所 用 的 目 标 和 输 入 字 段 可 以 是 连 续 ( 数 字 范 围 ) 或 分 类 ( 这 取 决 于 所 采 用 的 算 法 ) 如 果 使 用 的 是 连 续 目 标, 则 生 成 回 归 树 ; 如 果 使 用 的 是 分 类 目 标, 则 生 成 分 类 树 分 类 和 回 归 (C&R) 树 节 点 生 成 可 用 于 预 测 或 分 类 未 来 观 测 值 的 决 策 树 该 方 法 通 过 在 每 个 步 骤 最 大 限 度 降 低 不 纯 洁 度, 使 用 递 归 分 区 来 将 训 练 记 录 分 割 为 组 如 果 节 点 中 100% 的 观 测 值 都 属 于 目 标 字 段 的 一 个 特 定 类 别, 则 树 中 的 该 节 点 将 被 认 定 为 纯 洁 目 标 和 输 入 字 段 可 以 是 数 字 范 围 或 分 类 ( 名 义 有 序 或 标 志 ); 所 有 分 割 均 为 二 元 分 割 ( 即 仅 分 割 为 两 个 子 组 ) 有 关 详 细 信 息, 请 参 阅 第 130 页 码 C&R 树 节 点

119 107 决 策 树 CHAID 使 用 卡 方 统 计 量 来 生 成 决 策 树, 以 确 定 最 佳 的 分 割 CHAID 与 C&R 树 和 QUEST 节 点 不 同, 它 可 以 生 成 非 二 元 树, 这 意 味 着 有 些 分 割 将 有 多 于 两 个 的 分 支 目 标 和 输 入 字 段 可 以 是 数 字 范 围 ( 连 续 ) 或 分 类 Exhaustive CHAID 是 CHAID 的 修 正 版, 它 对 所 有 分 割 进 行 更 彻 底 的 检 查, 但 计 算 时 间 比 较 长 有 关 详 细 信 息, 请 参 阅 第 130 页 码 CHAID 节 点 QUEST 节 点 可 提 供 用 于 构 建 决 策 树 的 二 元 分 类 法, 此 方 法 的 设 计 目 的 是 减 少 大 型 C&R 树 分 析 所 需 的 处 理 时 间, 同 时 也 减 少 在 分 类 树 方 法 中 发 现 的 趋 势 以 便 支 持 允 许 有 多 个 分 割 的 输 入 输 入 字 段 可 以 是 数 字 范 围 ( 连 续 ), 但 目 标 字 段 必 须 是 分 类 所 有 分 割 都 是 二 元 的 有 关 详 细 信 息, 请 参 阅 第 131 页 码 QUEST 节 点 C5.0 节 点 构 建 决 策 树 或 规 则 集 该 模 型 的 工 作 原 理 是 根 据 在 每 个 级 别 提 供 最 大 信 息 收 获 的 字 段 分 割 样 本 目 标 字 段 必 须 为 分 类 字 段 允 许 进 行 多 次 多 于 两 个 子 组 的 分 割 有 关 详 细 信 息, 请 参 阅 第 146 页 码 C5.0 节 点 基 于 树 的 分 析 的 一 般 用 法 以 下 为 一 些 基 于 树 的 分 析 的 若 干 用 法 : 分 段 识 别 出 可 能 成 为 特 定 分 类 的 成 员 的 人 员 层 次 将 案 例 归 入 若 干 类 别 中 的 一 种, 例 如 高 中 和 低 风 险 组 预 测 创 建 规 则 并 用 其 预 测 未 来 事 件 预 测 还 可 能 意 味 着 尝 试 将 预 测 属 性 与 连 续 变 量 值 相 关 联 数 据 缩 减 和 变 量 筛 选 从 大 型 变 量 集 合 中 选 择 有 用 的 预 测 变 量 子 集 以 构 建 正 式 的 参 数 模 型 交 互 识 别 识 别 那 些 只 适 用 于 具 体 子 组 的 关 系 并 在 正 式 的 参 数 模 型 中 指 定 这 些 关 系 类 别 合 并 和 带 状 化 连 续 变 量 对 组 预 测 变 量 类 别 和 连 续 变 量 以 信 息 丢 失 最 少 的 方 式 进 行 重 编 码 交 互 树 构 建 器 可 以 自 动 生 成 树 模 型, 然 后 运 用 算 法 选 择 每 一 级 的 最 佳 分 割, 也 可 以 使 用 交 互 树 构 建 器 来 控 制 模 型 的 生 成, 并 在 保 存 模 型 块 之 前 运 用 专 业 知 识 精 练 或 简 化 树 E 创 建 流 并 添 加 以 下 任 一 决 策 树 节 点 :C&R 树 CHAID 或 QUEST 注 意 :C5.0 树 不 支 持 使 用 交 互 树 构 建 E 打 开 节 点, 在 字 段 选 项 卡 上, 选 择 目 标 和 预 测 变 量 字 段, 并 在 需 要 时 指 定 其 他 模 型 选 项 有 关 具 体 说 明, 请 参 阅 各 树 构 建 节 点 文 档 E 在 构 建 选 项 选 项 卡 的 目 标 面 板 上, 选 择 启 动 交 互 会 话 E 单 击 运 行 以 启 动 树 构 建 器

120 108 章 6 图 片 6-3 交 互 树 构 建 器 窗 口 其 中 显 示 了 从 根 节 点 开 始 的 当 前 树 可 以 逐 层 编 辑 和 修 剪 树, 并 在 生 成 一 个 或 多 个 模 型 之 前 访 问 收 益 风 险 和 相 关 的 信 息 注 释 使 用 C&R 树 CHAID 和 QUEST 节 点 时, 模 型 中 使 用 的 所 有 有 序 字 段 的 存 储 类 型 都 必 须 是 数 字 ( 而 非 字 符 串 ) 必 要 的 话, 可 以 使 用 重 新 分 类 节 点 对 存 储 类 型 进 行 转 换 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 重 新 对 节 点 分 类 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 还 可 以 选 择 使 用 分 区 字 段 将 数 据 分 隔 到 训 练 样 本 和 测 试 样 本 中 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 作 为 使 用 树 构 建 器 的 另 一 种 替 代 方 法, 也 可 以 直 接 从 建 模 节 点 中 生 成 树 模 型 或 其 他 IBM SPSS Modeler 模 型 有 关 详 细 信 息, 请 参 阅 第 127 页 码 直 接 构 建 树 模 型 生 成 和 修 剪 树 使 用 树 构 建 器 的 查 看 器 选 项 卡 可 以 查 看 从 根 节 点 开 始 的 当 前 树

121 109 决 策 树 E 要 生 成 树, 请 从 菜 单 中 选 择 : 树 > 生 长 树 系 统 将 通 过 递 归 分 割 每 个 分 支 直 到 符 合 一 个 或 多 个 停 止 标 准 来 构 建 树 然 后, 可 根 据 使 用 的 建 模 方 法 在 每 个 分 割 处 自 动 选 择 最 合 适 的 预 测 变 量 E 也 可 以 选 择 生 成 树 的 第 一 层 添 加 一 个 层 E 要 在 一 个 特 定 节 点 下 添 加 分 支, 可 选 择 该 节 点, 然 后 选 择 生 成 分 支 E 要 选 择 某 个 分 割 所 使 用 的 预 测 变 量, 请 选 择 所 需 的 节 点, 然 后 选 择 使 用 自 定 义 分 割 生 成 分 支 有 关 详 细 信 息, 请 参 阅 第 110 页 码 定 义 自 定 义 分 割 E 要 修 剪 分 支, 可 选 择 某 个 节 点, 然 后 选 择 移 除 分 支 以 清 除 所 选 择 的 节 点 E 要 移 除 树 的 最 底 层, 可 选 择 移 除 第 一 层 E 仅 对 于 C&R 树 和 QUEST 树, 可 选 择 生 成 树 和 修 剪 根 据 成 本 复 杂 性 算 法 ( 此 算 法 可 根 据 终 端 节 点 数 调 整 风 险 评 估 ) 进 行 修 剪, 通 常 会 生 成 一 个 较 简 单 的 树 有 关 详 细 信 息, 请 参 阅 第 130 页 码 C&R 树 节 点 在 查 看 器 选 项 卡 上 读 取 分 割 规 则 图 片 6-4 查 看 器 选 项 卡 上 显 示 的 分 割 规 则 查 看 查 看 器 选 项 卡 上 的 分 割 规 则 时, 方 括 号 表 示 临 界 值 包 含 在 范 围 中, 而 圆 括 号 表 示 临 界 值 不 包 含 在 范 围 中 因 此, 表 达 式 (23,37] 表 示 从 23( 不 含 ) 到 37( 含 ); 即 从 23 以 上 到 37 在 模 型 选 项 卡 上, 相 同 的 情 况 显 示 为 : Age > 23 and Age <= 37 中 断 树 增 长 要 中 断 树 增 长 操 作 ( 例 如, 如 果 此 操 作 所 用 的 时 间 比 预 期 的 长 ), 可 单 击 工 具 栏 上 的 停 止 执 行 按 钮

122 110 章 6 图 片 6-5 停 止 执 行 按 钮 此 按 钮 仅 在 树 增 长 期 间 启 用 它 会 使 当 前 的 增 长 操 作 停 止 在 其 当 前 点 上, 保 留 所 有 已 添 加 的 节 点, 但 不 保 存 所 做 的 更 改, 也 不 关 闭 该 窗 口 树 构 建 器 将 保 持 打 开 状 态, 以 便 生 成 模 型 更 新 指 令, 或 在 需 要 时 以 适 当 的 格 式 导 出 输 出 定 义 自 定 义 分 割 通 过 定 义 分 割 对 话 框, 可 以 选 择 预 测 变 量 并 为 每 个 分 割 指 定 条 件 E 在 树 构 建 器 的 查 看 器 选 项 卡 上 选 择 一 个 节 点, 然 后 从 菜 单 中 选 择 : 树 > 使 用 自 定 义 分 割 生 成 分 支 图 片 6-6 定 义 分 割 对 话 框 E 从 下 拉 列 表 中 选 择 所 需 的 预 测 变 量, 或 单 击 预 测 变 量 按 钮, 以 查 看 每 个 预 测 变 量 的 详 细 信 息 有 关 详 细 信 息, 请 参 阅 第 111 页 码 查 看 预 测 变 量 详 细 信 息 E 可 接 受 为 每 个 分 割 选 择 的 默 认 条 件, 或 选 择 自 定 义 为 分 割 指 定 适 当 的 条 件 对 于 连 续 ( 数 值 范 围 ) 的 预 测 变 量, 可 以 使 用 编 辑 范 围 值 字 段 以 指 定 落 在 每 个 新 节 点 中 的 值 的 范 围 对 于 分 类 预 测 变 量, 可 使 用 编 辑 集 合 值 或 编 辑 有 序 值 字 段, 以 指 定 映 射 到 每 个 新 节 点 的 特 定 值 ( 如 果 是 有 序 预 测 变 量, 则 指 定 值 的 范 围 )

123 111 决 策 树 E 选 择 生 成, 使 用 选 定 的 预 测 变 量 重 新 生 成 分 支 在 不 考 虑 停 止 规 则 的 情 况 下, 通 常 可 使 用 任 何 预 测 变 量 分 割 树 唯 一 的 例 外 情 况 是 当 节 点 是 纯 节 点 ( 即 所 有 观 测 值 都 落 在 相 同 的 目 标 类 中, 从 而 没 有 可 分 割 的 观 测 值 ), 或 所 选 择 的 预 测 变 量 是 常 数 ( 即 没 有 可 分 割 的 预 测 变 量 ) 时 无 法 分 割 树 缺 失 值 信 息 仅 对 于 CHAID 树, 如 果 给 定 的 预 测 变 量 中 有 缺 失 值, 则 可 以 在 定 义 自 定 义 分 割 时 选 择 将 这 些 缺 失 值 分 配 给 特 定 的 子 节 点 ( 对 于 C&R 树 和 QUEST, 可 使 用 代 用 项 按 算 法 中 所 定 义 的 方 式 处 理 缺 失 值 有 关 详 细 信 息, 请 参 阅 第 111 页 码 分 割 的 详 细 信 息 和 代 用 项 ) 查 看 预 测 变 量 详 细 信 息 选 择 预 测 变 量 对 话 框 中 显 示 了 可 用 于 当 前 分 割 的 预 测 变 量 ( 有 时 称 为 代 替 变 量 ) 的 统 计 量 图 片 6-7 选 择 预 测 变 量 对 话 框 对 于 CHAID 和 Exhaustive CHAID, 列 出 了 每 个 分 类 预 测 变 量 的 卡 方 统 计 量 ; 如 果 预 测 变 量 是 数 字 范 围 类 型, 则 显 示 F 统 计 量 卡 方 统 计 量 可 用 来 测 量 目 标 字 段 与 分 割 字 段 的 不 相 关 程 度 较 高 的 卡 方 统 计 量 通 常 与 较 低 的 概 率 有 关, 这 意 味 着 两 个 字 段 间 不 相 关 的 机 率 较 低 - 表 示 此 分 割 情 况 良 好 这 里 也 将 自 由 度 包 括 在 内, 因 为 自 由 度 考 虑 了 以 下 事 实, 即 与 双 向 分 割 相 比, 三 向 分 割 更 易 具 有 较 高 的 统 计 量 和 较 低 的 概 率 对 于 C&R 树 和 QUEST, 显 示 了 每 个 预 测 变 量 的 改 进 值 如 果 使 用 此 预 测 变 量, 则 改 进 值 越 大, 父 节 点 和 子 节 点 间 的 纯 度 差 异 越 大 ( 纯 节 点 指 其 中 所 有 的 观 测 值 都 落 在 一 个 目 标 类 别 中 的 节 点 ; 树 中 的 杂 质 越 少, 此 模 型 拟 合 数 据 的 效 果 就 越 好 ) 换 句 话 说, 较 高 的 改 进 值 通 常 表 示 对 此 类 型 的 树 进 行 了 有 用 的 分 割 所 使 用 的 杂 质 测 量 在 树 构 建 节 点 中 指 定 分 割 的 详 细 信 息 和 代 用 项 可 在 查 看 器 选 项 卡 中 选 择 任 意 节 点, 然 后 选 择 位 于 工 具 栏 右 侧 的 分 割 信 息 按 钮 查 看 有 关 该 节 点 的 分 割 详 细 信 息 此 时 将 显 示 所 使 用 的 分 割 规 则 及 相 关 的 统 计 量 对 于 C&R 树 分 类 树, 将 显 示 改 进 值 和 关 联 值 关 联 值 可 用 于 测 量 代 用 项 与 原 始 分 割 字 段 间 的 一 致 性, 其 中 最 佳 代 用 项 通 常 是 对 分 割 字 段 模 拟 得 最 像 的 字 段 对 于 C&R 树 和 QUEST, 也 列 出 了 所 有 用 于 代 替 原 始 预 测 变 量 的 代 用 项

124 112 章 6 图 片 6-8 显 示 分 割 信 息 的 交 互 树 构 建 器 窗 口 E 要 编 辑 选 定 节 点 的 分 割, 可 单 击 位 于 代 用 项 面 板 左 侧 的 图 标 以 打 开 定 义 分 割 对 话 框 ( 作 为 快 捷 方 式, 可 以 在 单 击 图 标 选 择 代 用 项 作 为 原 始 分 割 字 段 之 前, 从 列 表 中 选 择 此 代 用 项 ) 代 用 项 如 果 适 用, 则 会 针 对 所 选 节 点 显 示 主 要 分 割 字 段 的 所 有 代 用 项 代 用 项 是 在 给 定 记 录 的 主 要 预 测 变 量 值 缺 失 时 使 用 的 替 代 字 段 给 定 分 割 允 许 的 最 大 代 用 项 数 在 树 构 建 节 点 中 指 定, 但 实 际 数 量 取 决 于 训 练 数 据 一 般 来 讲, 缺 失 数 据 越 多, 可 能 使 用 的 代 用 项 越 多 对 于 其 他 决 策 树 模 型, 此 选 项 卡 为 空 注 : 要 在 模 型 中 包 含 代 用 项, 必 须 在 训 练 阶 段 对 其 进 行 标 识 如 果 训 练 样 本 没 有 缺 失 值, 则 不 会 标 识 任 何 代 用 项 ; 在 测 试 或 评 分 过 程 中 遇 到 的 具 有 缺 失 值 的 所 有 记 录 将 自 动 落 入 记 录 数 最 大 的 子 节 点 如 果 在 测 试 或 评 分 过 程 中 预 期 出 现 缺 失 值, 请 确 保 值 在 训 练 样 本 中 也 处 于 缺 失 状 态 代 用 项 对 于 CHAID 树 不 可 用 虽 然 CHAID 树 中 不 使 用 代 用 项, 但 当 定 义 自 定 义 分 割 时, 仍 可 选 择 将 这 些 代 用 项 分 配 给 特 定 的 子 节 点 有 关 详 细 信 息, 请 参 阅 第 110 页 码 定 义 自 定 义 分 割

125 113 决 策 树 自 定 义 树 状 视 图 在 树 构 建 器 的 查 看 器 选 项 卡 中 显 示 当 前 的 树 默 认 情 况 下, 将 展 开 树 中 所 有 的 分 支, 但 也 可 以 按 照 需 要 展 开 和 折 叠 分 支 并 自 定 义 其 他 设 置 图 片 6-9 由 左 至 右 分 别 显 示 分 割 规 则 详 细 信 息 节 点 图 形 和 标 签 的 视 图 单 击 父 节 点 右 下 角 的 减 号 ( ) 隐 藏 其 所 有 子 节 点 单 击 父 节 点 右 下 角 的 加 号 (+) 显 示 其 子 节 点 使 用 视 图 菜 单 或 工 具 栏 更 改 树 的 方 向 ( 由 上 至 下 由 左 至 右 或 由 右 至 左 )

126 114 章 6 单 击 主 工 具 栏 上 的 显 示 字 段 和 值 标 签 按 钮 可 以 显 示 或 隐 藏 字 段 和 值 标 签 使 用 放 大 镜 按 钮 放 大 或 缩 小 视 图, 或 单 击 工 具 栏 右 侧 的 树 状 图 按 钮 查 看 完 整 的 树 图 表 如 果 正 在 使 用 分 区 字 段, 则 可 在 树 状 视 图 的 训 练 分 区 和 测 试 分 区 之 间 进 行 交 换 ( 选 择 视 图 > 分 区 ) 显 示 测 试 样 本 时, 可 以 查 看 但 不 能 编 辑 树 ( 将 在 窗 口 右 下 角 的 状 态 栏 中 显 示 当 前 分 区 ) 单 击 分 割 信 息 按 钮 ( 工 具 栏 最 右 侧 的 i 按 钮 ) 以 查 看 当 前 分 割 的 详 细 信 息 有 关 详 细 信 息, 请 参 阅 第 111 页 码 分 割 的 详 细 信 息 和 代 用 项 将 在 每 个 节 点 中 显 示 统 计 量 图 形 或 同 时 显 示 两 者 ( 请 参 阅 下 文 ) 显 示 统 计 量 和 图 形 节 点 统 计 量 对 于 分 类 目 标 字 段, 每 个 节 点 中 的 表 可 显 示 每 个 分 类 中 的 记 录 数 和 百 分 比 以 及 该 节 点 代 表 的 整 个 样 本 的 百 分 比 对 于 连 续 ( 数 值 范 围 ) 目 标 字 段, 该 表 可 显 示 目 标 字 段 的 平 均 值 标 准 差 记 录 数 和 预 测 值 节 点 图 形 对 于 分 类 目 标 字 段, 图 形 为 目 标 字 段 的 每 个 类 别 中 的 百 分 比 条 形 图 表 中 每 行 的 前 面 是 一 个 颜 色 样 本, 其 对 应 的 颜 色 表 示 该 节 点 图 形 中 的 每 个 目 标 字 段 类 别 对 于 连 续 ( 数 值 范 围 ) 目 标 字 段, 该 图 形 可 显 示 该 节 点 中 记 录 的 目 标 字 段 的 直 方 图 Gains 收 益 选 项 卡 可 显 示 树 中 所 有 终 端 节 点 的 统 计 量 收 益 可 用 于 测 量 给 定 节 点 上 的 平 均 值 或 比 例 与 总 平 均 值 之 间 的 差 异 大 小 一 般 来 说, 此 差 异 越 大, 作 为 决 策 工 具 的 树 就 越 有 效 例 如, 某 个 节 点 的 指 数 或 提 升 值 为 148% 表 示, 该 节 点 中 的 记 录 落 在 目 标 类 别 中 的 可 能 性 大 概 是 其 作 为 一 个 整 体 用 于 数 据 集 的 可 能 性 的 1.5 倍 对 于 C&R 树 和 指 定 过 度 拟 合 集 的 QUEST 节 点, 显 示 两 组 统 计 信 息 : 树 生 长 组 - 移 除 过 度 拟 合 集 的 培 训 样 本 过 度 拟 合 集 对 于 其 他 C&R 树 和 QUEST 交 互 树 以 及 所 有 CHAID 交 互 树, 只 显 示 树 生 长 组 统 计 信 息 图 片 6-10 收 益 选 项 卡 使 用 收 益 选 项 卡 可 以 执 行 下 列 操 作 : 显 示 每 个 节 点 统 计 量 累 积 数 统 计 量 或 分 位 数 统 计 量

127 115 决 策 树 显 示 收 益 或 利 润 将 视 图 在 表 和 图 表 间 进 行 交 换 选 择 目 标 类 别 ( 仅 分 类 目 标 ) 根 据 指 数 百 分 比 对 表 按 升 序 或 降 序 排 序 如 果 显 示 的 是 多 个 分 区 的 统 计 量, 则 通 常 将 排 序 应 用 于 训 练 样 本 而 不 是 测 试 样 本 一 般 来 说, 在 收 益 表 中 选 定 的 内 容 也 会 在 树 状 视 图 中 得 到 更 新, 反 之 亦 然 例 如, 如 果 在 表 中 选 择 某 个 行, 则 也 会 在 树 中 选 中 相 应 的 节 点 分 类 收 益 对 于 分 类 树 ( 指 使 用 分 类 目 标 变 量 的 树 ), 从 收 益 指 数 百 分 比 可 看 出 每 个 节 点 上 给 定 目 标 类 别 的 比 例 与 总 比 例 间 的 差 异 有 多 大 依 次 显 示 节 点 统 计 量 在 此 视 图 的 表 中, 将 为 每 个 终 端 节 点 显 示 一 行 例 如, 如 果 直 邮 活 动 的 总 响 应 是 10%, 但 有 20% 的 记 录 落 在 节 点 X 内 并 且 做 出 积 极 的 响 应, 则 该 节 点 的 指 数 百 分 比 应 为 200%, 表 示 该 组 中 的 响 应 者 进 行 购 买 的 可 能 性 大 概 是 总 人 数 的 两 倍 对 于 C&R 树 和 指 定 过 度 拟 合 集 的 QUEST 节 点, 显 示 两 组 统 计 信 息 : 树 生 长 组 - 移 除 过 度 拟 合 集 的 培 训 样 本 过 度 拟 合 集 对 于 其 他 C&R 树 和 QUEST 交 互 树 以 及 所 有 CHAID 交 互 树, 只 显 示 树 生 长 组 统 计 信 息 图 片 6-11 依 次 显 示 节 点 收 益 统 计 量 节 点 当 前 节 点 的 ID( 显 示 在 查 看 器 选 项 卡 上 ) 节 点 :n 该 节 点 上 的 总 记 录 数 节 点 (%) 数 据 集 中 所 有 落 在 该 节 点 上 的 记 录 的 百 分 比 收 益 :n 落 在 该 节 点 上 的 选 定 目 标 类 别 的 记 录 数 换 句 话 说, 在 数 据 集 的 所 有 落 在 目 标 类 别 的 记 录 中, 有 多 少 记 录 落 在 该 节 点? 收 益 (%) 在 整 个 数 据 集 中, 所 有 落 在 该 节 点 的 目 标 类 别 中 的 记 录 的 百 分 比

128 116 章 6 响 应 (%) 落 在 当 前 节 点 的 目 标 类 别 中 的 记 录 的 百 分 比 该 上 下 文 中 的 响 应 有 时 也 称 为 匹 配 项 指 数 (%) 当 前 节 点 的 响 应 百 分 比, 可 表 述 为 响 应 百 分 比 相 对 于 整 个 数 据 集 的 百 分 比 例 如, 指 数 值 为 300% 表 示 该 节 点 中 的 记 录 落 在 目 标 类 别 中 的 可 能 性 大 概 是 其 作 为 一 个 整 体 用 于 数 据 集 的 可 能 性 的 三 倍 累 积 统 计 量 在 累 积 视 图 中, 表 的 每 行 显 示 一 个 节 点, 但 统 计 量 是 累 积 的, 并 按 指 数 百 分 比 以 升 序 或 降 序 顺 序 排 序 例 如, 如 果 按 降 序 排 序, 则 首 先 列 出 指 数 百 分 比 最 高 的 节 点, 并 且 接 下 来 的 行 中 的 统 计 量 是 对 该 行 及 上 面 的 行 的 累 积 数 图 片 6-12 以 指 数 百 分 比 的 降 序 顺 序 排 序 的 累 积 收 益 随 着 所 添 加 节 点 的 响 应 百 分 比 越 来 越 低, 累 积 指 数 百 分 比 将 逐 行 降 低 最 后 一 行 的 累 积 指 数 通 常 是 100%, 因 为 此 时 将 包 括 整 个 数 据 集 分 位 数 在 此 视 图 中, 表 中 的 每 一 行 都 表 示 一 个 分 位 数 而 不 是 节 点 分 位 数 可 以 是 四 分 位 数 (4) 五 分 位 数 (5) 十 分 位 数 (10) 二 十 分 位 数 (20) 或 百 分 位 数 (100) 如 果 需 要 多 个 节 点 以 补 足 此 百 分 比 ( 例 如, 如 果 显 示 四 分 位 数 时, 而 前 两 个 节 点 包 含 的 观 测 值 不 到 所 有 观 测 值 的 50%), 则 可 在 一 个 分 位 数 中 列 出 多 个 节 点 可 以 对 表 的 其 余 部 分 进 行 累 积, 且 与 累 积 视 图 的 解 释 方 式 相 同 图 片 6-13 以 指 数 百 分 比 的 降 序 顺 序 列 出 显 示 四 分 位 数 的 收 益

129 117 决 策 树 分 类 利 润 和 投 资 回 报 率 对 于 分 类 树, 收 益 统 计 量 也 可 按 利 润 和 投 资 回 报 率 显 示 通 过 定 义 利 润 对 话 框 可 以 为 每 个 类 别 指 定 收 入 和 支 出 E 在 收 益 选 项 卡 上, 单 击 工 具 栏 上 的 利 润 按 钮 ( 标 记 为 $/$) 访 问 该 对 话 框 图 片 6-14 定 义 利 润 对 话 框 E 为 目 标 字 段 的 每 个 类 别 输 入 收 入 和 支 出 值 例 如, 如 果 为 每 个 客 户 邮 寄 报 价 的 成 本 是 $0.48, 而 从 接 受 三 个 月 的 订 阅 的 积 极 响 应 中 获 得 的 收 入 是 $9.95, 则 每 个 no 响 应 将 花 费 $0.48, 而 每 个 yes 响 应 将 赚 取 $9.47 ( 计 算 方 式 为 ) 在 收 益 表 中, 利 润 的 计 算 方 式 为 终 端 节 点 的 每 个 记 录 中 的 总 收 入 减 去 支 出 投 资 回 报 率 为 某 个 节 点 的 总 利 润 除 以 总 支 出 注 释 利 润 值 仅 影 响 在 收 益 表 中 显 示 的 平 均 利 润 和 投 资 回 报 率, 可 以 明 确 查 看 统 计 量, 尤 其 适 合 查 看 利 润 但 它 们 不 影 响 树 模 型 的 基 础 结 构 不 应 将 利 润 与 误 分 类 损 失 相 混 淆, 误 分 类 损 失 在 树 构 建 节 点 中 指 定, 且 可 化 为 模 型 中 的 因 子 ( 作 为 避 免 高 成 本 错 误 的 一 种 方 式 ) 在 两 个 交 互 树 构 建 会 话 之 间 不 会 保 留 利 润 说 明 回 归 收 益 对 于 回 归 树, 可 以 选 择 依 次 显 示 节 点 视 图 累 积 节 点 视 图 和 分 位 数 视 图 表 中 可 显 示 平 均 值 只 有 在 分 位 数 视 图 中 才 可 使 用 图 表 收 益 图 表 在 收 益 选 项 卡 上, 图 表 可 作 为 表 的 替 代 项 显 示 E 在 收 益 选 项 卡 上, 选 择 分 位 数 图 标 ( 工 具 栏 从 左 数 第 三 个 图 标 ) ( 对 于 依 次 显 示 节 点 统 计 量 或 累 积 统 计 量, 不 可 使 用 图 表 ) E 选 择 图 表 图 标 E 按 照 需 要 从 下 拉 列 表 中 选 择 所 显 示 的 单 位 ( 百 分 位 数 十 分 位 数 等 等 )

130 118 章 6 E 选 择 收 益 响 应 或 提 升 更 改 所 显 示 的 测 量 量 收 益 图 表 收 益 图 绘 制 的 是 表 中 收 益 (%) 列 值 的 散 点 图 收 益 定 义 为 每 个 增 量 中 匹 配 项 数 与 树 中 匹 配 项 总 数 的 比 例, 它 使 用 下 列 等 式 : ( 增 量 中 匹 配 项 数 / 匹 配 项 总 数 )x 100% 图 片 6-15 收 益 图 该 图 有 效 说 明 了 您 需 要 撒 出 多 大 范 围 的 网 络, 才 能 获 取 树 中 所 有 匹 配 项 的 给 定 百 分 比 对 角 线 绘 制 的 是 整 个 样 本 的 预 期 响 应 ( 如 果 未 使 用 模 型 的 话 ) 这 种 情 况 下, 响 应 率 应 该 为 常 量, 因 为 一 个 人 响 应 的 可 能 性 与 另 一 个 人 相 同 为 了 使 您 的 收 益 加 倍, 您 需 要 询 问 两 倍 数 量 的 人 曲 线 表 明 通 过 将 那 些 秩 ( 基 于 收 益 排 序 ) 位 于 较 高 百 分 比 的 人 员 包 括 在 内, 您 可 以 使 得 响 应 得 到 多 大 程 度 的 改 善 例 如, 包 括 最 高 的 50% 可 能 会 网 罗 超 过 70% 的 正 面 响 应 该 曲 线 越 陡, 收 益 越 高 提 升 图 表 提 升 图 表 对 表 中 指 数 (%) 列 中 的 值 进 行 了 绘 制 此 图 表 将 每 个 增 量 中 具 有 积 极 响 应 的 记 录 的 百 分 比 与 训 练 数 据 集 中 具 有 积 极 响 应 的 记 录 的 总 百 分 比 作 了 比 较, 其 方 程 式 为 : ( 增 量 中 具 有 积 极 响 应 的 记 录 / 增 量 中 的 记 录 )/( 具 有 积 极 响 应 的 总 记 录 数 / 总 记 录 数 )

131 119 决 策 树 图 片 6-16 增 益 图 响 应 图 表 响 应 图 表 对 表 中 响 应 (%) 列 中 的 值 进 行 了 绘 制 响 应 是 增 量 中 具 有 积 极 响 应 的 记 录 的 百 分 比, 其 方 程 式 为 : ( 增 量 中 具 有 积 极 响 应 的 记 录 / 增 量 中 的 记 录 ) x 100%

132 120 章 6 图 片 6-17 响 应 图 表 基 于 收 益 的 选 择 使 用 基 于 收 益 的 选 择 对 话 框, 可 以 根 据 指 定 的 规 则 或 阈 值 自 动 选 择 具 有 最 佳 ( 或 最 差 ) 收 益 的 终 端 节 点 然 后 可 以 根 据 该 选 择 生 成 一 个 选 择 节 点

133 121 决 策 树 图 片 6-18 基 于 收 益 的 选 择 对 话 框 E 在 收 益 选 项 卡 上, 选 择 依 次 显 示 节 点 视 图 或 累 积 视 图, 然 后 选 择 该 选 择 所 基 于 的 目 标 类 别 ( 该 选 择 基 于 当 前 的 表 显 示, 不 可 用 于 分 位 数 视 图 ) E 从 收 益 选 项 卡 的 菜 单 中 选 择 以 下 项 : 编 辑 > 选 择 终 端 节 点 > 基 于 收 益 的 选 择 仅 选 择 可 以 选 择 匹 配 节 点 或 不 匹 配 节 点 例 如, 选 择 前 100 个 记 录 以 外 的 所 有 节 点 收 益 信 息 匹 配 基 于 当 前 目 标 类 别 的 收 益 统 计 量 的 匹 配 节 点, 包 括 : 其 收 益 响 应 或 提 升 ( 指 数 ) 与 指 定 的 阈 值 相 匹 配 的 节 点 例 如, 响 应 大 于 或 等 于 50% 基 于 目 标 类 别 的 收 益 的 顶 部 n 个 节 点 上 限 为 指 定 记 录 数 的 顶 部 节 点 上 限 为 指 定 训 练 数 据 百 分 比 的 顶 部 节 点 E 单 击 确 定 更 新 查 看 器 选 项 卡 上 的 选 择 E 要 根 据 查 看 器 选 项 卡 上 的 当 前 选 择 新 建 选 择 节 点, 请 从 生 成 菜 单 中 选 择 选 择 节 点 有 关 详 细 信 息, 请 参 阅 第 126 页 码 生 成 过 滤 节 点 和 选 择 节 点 注 意 : 因 为 实 际 上 选 择 的 是 节 点 而 不 是 记 录 或 百 分 比, 因 此 通 常 不 可 能 取 得 与 选 择 标 准 完 全 匹 配 的 结 果 系 统 选 择 上 限 为 指 定 等 级 的 完 整 节 点 例 如, 如 果 选 择 顶 部 12 个 观 测 值, 而 第 一 个 节 点 中 有 10 个 观 测 值, 第 二 个 节 点 中 有 2 个 观 测 值, 则 将 只 选 择 第 一 个 节 点 风 险 风 险 指 任 意 等 级 上 误 分 类 的 机 率 风 险 选 项 卡 可 显 示 某 点 的 风 险 评 估 和 ( 分 类 输 出 的 ) 误 分 类 表

134 122 章 6 图 片 6-19 分 类 目 标 的 误 分 类 表 对 于 数 字 预 测, 风 险 是 每 个 终 端 节 点 上 的 合 并 方 差 评 估 对 于 分 类 预 测, 风 险 是 错 误 分 类 观 测 值 的 比 例, 可 根 据 任 意 先 验 分 布 或 误 分 类 损 失 进 行 调 整 保 存 树 模 型 和 结 果 可 以 用 以 下 多 种 方 式 保 存 或 导 出 交 互 树 构 建 会 话 的 结 果 : 基 于 当 前 树 生 成 模 型 ( 生 成 > 生 成 模 型 ) 保 存 用 于 生 成 当 前 树 的 指 令 下 次 执 行 树 构 建 节 点 时, 将 自 动 重 新 生 成 当 前 树 ( 包 括 已 定 义 的 任 何 自 定 义 分 割 ) 导 出 模 型 收 益 和 风 险 信 息 有 关 详 细 信 息, 请 参 阅 第 125 页 码 导 出 模 型 收 益 和 风 险 信 息 通 过 树 构 建 器 或 树 模 型 块, 可 以 执 行 下 列 操 作 : 根 据 当 前 的 树 生 成 过 滤 节 点 或 选 择 节 点 有 关 详 细 信 息, 请 参 阅 第 126 页 码 生 成 过 滤 节 点 和 选 择 节 点 生 成 一 个 规 则 集 块, 该 节 点 将 树 结 构 表 示 成 一 组 定 义 了 树 的 终 端 分 支 的 规 则 有 关 详 细 信 息, 请 参 阅 第 126 页 码 从 决 策 树 中 生 成 规 则 集

135 123 决 策 树 此 外, 还 可 以 按 PMML 格 式 导 出 模 型 ( 仅 限 于 树 模 型 块 ) 有 关 详 细 信 息, 请 参 阅 第 41 页 码 第 3 章 中 的 模 型 选 项 板 如 果 模 型 包 含 定 制 分 割, 则 不 会 在 导 出 的 PMML 中 保 留 此 信 息 ( 保 留 分 割, 但 不 保 留 它 是 定 制 分 割 而 不 是 通 过 算 法 选 择 的 分 割 这 一 事 实 ) 基 于 当 前 树 的 所 选 部 分 生 成 图 形 注 : 这 仅 在 块 附 加 到 流 中 的 其 他 节 点 时 才 有 效 有 关 详 细 信 息, 请 参 阅 第 158 页 码 生 成 图 形 注 意 : 不 能 保 存 交 互 树 本 身 为 了 避 免 丢 失 所 执 行 的 操 作, 请 在 关 闭 树 构 建 器 窗 口 之 前 生 成 模 型 和 / 或 更 新 树 指 令 从 树 构 建 器 生 成 模 型 要 基 于 当 前 树 生 成 模 型, 可 从 树 构 建 器 菜 单 中 选 择 以 下 项 : 生 成 > 模 型 图 片 6-20 生 成 决 策 树 模 型 您 可 以 从 下 列 选 项 中 进 行 选 择 : 模 型 名 称 可 以 指 定 自 定 义 名 称 或 根 据 建 模 节 点 的 名 称 自 动 生 成 模 型 名 称 创 建 节 点 位 置 可 以 在 工 作 区 GM 选 项 板 或 同 时 在 这 两 者 上 添 加 节 点 包 括 树 指 令 要 在 生 成 模 型 中 包 括 来 自 当 前 树 的 指 令, 选 择 此 选 项 这 允 许 您 在 需 要 时 重 新 生 成 树 有 关 详 细 信 息, 请 参 阅 第 123 页 码 树 生 长 指 令 树 生 长 指 令 对 于 C&R 树 CHAID 和 QUEST 模 型, 树 指 令 可 指 定 生 成 树 ( 一 次 一 级 ) 的 条 件 每 当 从 节 点 中 启 动 交 互 树 构 建 器 时, 都 会 应 用 指 令 指 令 可 作 为 一 种 最 安 全 的 方 法 用 来 重 新 生 成 在 以 前 的 交 互 会 话 中 创 建 的 树 有 关 详 细 信 息, 请 参 阅 第 125 页 码 更 新 树 指 令 也 可 以 手 动 编 辑 指 令, 但 操 作 时 需 要 格 外 小 心 指 令 与 其 所 描 述 的 树 结 构 高 度 相 关 因 此, 对 原 始 数 据 或 建 模 选 项 的 任 何 更 改 都 可 能 会 导 致 以 前 有 效 的 一 组 指 令 失 效 例 如, 如 果 CHAID 算 法 基 于 更 新 的 数 据 将 双 向 分 割 更 改 为 三 向 分 割, 则 基 于 以 前 的 双 向 分 割 的 所 有 指 令 都 将 失 效 注 意 : 如 果 选 择 直 接 生 成 模 型 ( 不 使 用 树 构 建 器 ), 则 将 忽 略 所 有 的 树 指 令 编 辑 指 令 E 要 查 看 或 编 辑 已 保 存 的 指 令, 请 打 开 树 构 建 节 点, 并 选 择 构 建 选 项 选 项 卡 的 目 标 面 板

136 124 章 6 E 选 择 启 动 交 互 会 话 以 启 用 控 件, 选 中 使 用 树 指 令, 然 后 单 击 指 令 图 片 6-21 树 生 长 指 令 指 令 语 法 指 令 可 指 定 从 根 节 点 开 始 生 成 树 的 条 件 例 如, 生 成 树 的 第 一 层 : Grow Node Index 0 Children 1 2 由 于 未 指 定 任 何 预 测 变 量, 算 法 将 选 择 最 佳 分 割 注 意, 通 常 必 须 在 根 节 点 (Index 0) 上 进 行 第 一 次 分 割, 且 必 须 指 定 两 个 子 节 点 的 索 引 值 ( 在 本 例 中 为 1 和 2) 除 非 已 首 先 生 成 创 建 节 点 2 的 根 节 点, 否 则 指 定 Grow Node Index 2 Children 3 4 是 无 效 的 要 生 成 树, 请 使 用 : 生 长 树 要 生 成 并 修 剪 树 ( 仅 C&R 树 ), 请 使 用 : Grow_And_Prune Tree 要 为 连 续 预 测 变 量 指 定 自 定 义 分 割, 请 使 用 : Grow Node Index 0 Children 1 2 Spliton ( "EDUCATE", Interval ( NegativeInfinity, 12.5) Interval ( 12.5, Infinity )) 对 具 有 两 个 值 的 名 义 预 测 变 量 进 行 分 割, 可 使 用 :

137 125 决 策 树 Grow Node Index 2 Children 3 4 Spliton ( "GENDER", Group( "0.0" )Group( "1.0" )) 对 具 有 多 个 值 的 名 义 预 测 变 量 进 行 分 割, 可 使 用 : Grow Node Index 6 Children 7 8 Spliton ( "ORGS", Group( "2.0","4.0" ) Group( "0.0","1.0","3.0","6.0" )) 对 有 序 预 测 变 量 进 行 分 割, 可 使 用 : Grow Node Index 4 Children 5 6 Spliton ( "CHILDS", Interval ( NegativeInfinity, 1.0) Interval ( 1.0, Infinity )) 注 意 : 指 定 自 定 义 分 割 时, 字 段 名 和 值 (EDUCATE GENDER 和 CHILDS 等 等 ) 都 区 分 大 小 写 CHAID 树 的 指 令 CHAID 树 的 指 令 对 数 据 或 模 型 中 的 更 改 非 常 敏 感, 因 为 这 些 指 令 与 C&R 树 和 QUEST 中 的 不 同, 它 们 不 只 能 使 用 二 元 分 割 例 如, 下 面 的 语 法 看 起 来 很 有 效, 但 如 果 算 法 将 根 节 点 分 割 为 两 个 以 上 的 子 节 点 时, 这 些 语 法 将 失 效 : Grow Node Index 0 Children 1 2 Grow Node Index 1 Children 3 4 对 于 CHAID, 节 点 0 可 能 具 有 3 个 或 4 个 子 节 点, 这 种 情 况 将 使 上 述 第 二 行 语 法 失 效 在 脚 本 中 使 用 指 令 也 可 使 用 三 重 引 号 将 指 令 嵌 入 到 脚 本 中 有 关 详 细 信 息, 请 参 阅 第 块 中 的 IBM SPSS Modeler 14.2 脚 本 编 写 和 自 动 化 指 南 3 章 中 的 文 字 文 本 更 新 树 指 令 要 保 留 在 交 互 树 构 建 会 话 中 执 行 的 操 作, 可 以 保 存 用 于 生 成 当 前 树 的 指 令 与 保 存 不 能 进 一 步 编 辑 的 模 型 块 不 同 的 是, 保 存 指 令 可 以 按 树 的 当 前 状 态 重 新 生 成 树 以 进 一 步 进 行 编 辑 E 要 更 新 指 令, 请 从 树 构 建 器 菜 单 中 选 择 以 下 项 : 文 件 > 更 新 指 令 指 令 保 存 在 用 于 创 建 树 (C&R 树 QUEST 或 CHAID) 的 建 模 节 点 中, 并 可 用 于 重 新 生 成 当 前 树 有 关 详 细 信 息, 请 参 阅 第 123 页 码 树 生 长 指 令 导 出 模 型 收 益 和 风 险 信 息 可 以 从 树 构 建 器 中 根 据 需 要 以 文 本 HTML 或 图 像 格 式 导 出 模 型 收 益 和 风 险 统 计 量 E 在 树 构 建 器 窗 口 中, 选 择 要 导 出 的 选 项 卡 或 视 图

138 126 章 6 E 从 菜 单 中 选 择 : 文 件 > 导 出 E 根 据 需 要 选 择 文 本 HTML 或 图 形, 并 从 子 菜 单 中 选 择 要 导 出 的 特 定 项 目 在 适 用 的 情 况 下, 导 出 基 于 当 前 的 选 择 导 出 文 本 或 HTML 格 式 可 以 为 训 练 分 区 或 测 试 分 区 ( 如 果 已 定 义 ) 导 出 收 益 统 计 量 或 风 险 统 计 量 导 出 基 于 收 益 选 项 卡 上 的 当 前 选 择 - 例 如, 可 以 选 择 依 次 显 示 节 点 统 计 量 累 积 统 计 量 或 分 位 数 统 计 量 导 出 图 形 可 以 导 出 在 查 看 器 选 项 卡 上 显 示 的 当 前 树, 或 为 训 练 分 区 或 测 试 分 区 ( 如 果 已 定 义 ) 导 出 收 益 图 表 可 用 的 格 式 包 括.JPEG.PNG 和.BMP 对 于 收 益, 导 出 基 于 收 益 选 项 卡 上 的 当 前 选 择 ( 仅 当 显 示 图 表 时 可 用 ) 生 成 过 滤 节 点 和 选 择 节 点 E 在 树 构 建 器 窗 口 中, 或 在 浏 览 决 策 树 模 型 块 时, 从 菜 单 中 选 择 以 下 项 : 生 成 > 过 滤 节 点 或 > 选 择 节 点 过 滤 节 点 生 成 的 节 点 可 过 滤 当 前 树 未 使 用 的 任 何 字 段 此 方 法 可 以 快 速 削 减 数 据 集, 使 其 仅 包 括 那 些 算 法 选 择 为 重 要 字 段 的 字 段 如 果 此 决 策 树 节 点 的 上 游 存 在 类 型 节 点, 则 过 滤 模 型 块 将 传 递 所 有 角 色 为 目 标 的 字 段 选 择 节 点 生 成 的 节 点 可 选 择 所 有 落 在 当 前 节 点 中 的 记 录 此 选 项 需 要 在 查 看 器 选 项 卡 中 选 择 一 个 或 多 个 树 分 支 该 模 型 块 位 于 流 工 作 区 中 从 决 策 树 中 生 成 规 则 集 生 成 的 规 则 集 模 型 块 可 作 为 定 义 树 的 终 端 分 支 的 一 组 规 则 来 表 示 树 的 结 构 通 常, 规 则 集 可 保 留 完 整 的 决 策 树 中 的 大 部 分 重 要 信 息, 但 其 使 用 的 模 型 比 较 简 单 最 重 要 的 区 别 是, 使 用 规 则 集 时, 可 以 为 任 意 特 定 记 录 应 用 多 个 规 则, 也 可 以 不 应 用 任 何 规 则 例 如, 可 以 看 到 所 有 预 测 结 果 为 否 的 规 则, 紧 随 其 后 是 所 有 预 测 为 是 的 规 则 如 果 应 用 多 个 规 则, 则 每 个 规 则 将 根 据 与 此 规 则 关 联 的 置 信 度 获 得 一 个 加 权 投 票, 并 通 过 组 合 应 用 到 所 讨 论 记 录 的 所 有 规 则 的 加 权 投 票 来 确 定 最 终 的 预 测 如 果 没 有 规 则 可 应 用, 则 会 将 默 认 预 测 分 配 到 该 记 录 仅 可 从 具 有 分 类 目 标 字 段 的 树 ( 不 是 回 归 树 ) 中 生 成 规 则 集 E 在 树 构 建 器 窗 口 中, 或 在 浏 览 决 策 树 模 型 块 时, 从 菜 单 中 选 择 以 下 项 : 生 成 > 规 则 集

139 127 决 策 树 图 片 6-22 生 成 规 则 集 对 话 框 规 则 集 名 称 可 以 指 定 新 的 规 则 集 模 型 块 的 名 称 创 建 节 点 位 置 控 制 新 的 规 则 集 模 型 块 的 位 置 选 择 工 作 区 GM 选 项 板 或 两 者 最 小 实 例 指 定 在 规 则 集 模 型 块 中 保 留 的 最 小 实 例 数 ( 已 应 用 规 则 的 记 录 数 ) 支 持 度 小 于 指 定 值 的 规 则 不 会 包 括 在 新 的 规 则 集 中 最 小 置 信 度 指 定 则 集 模 型 块 中 要 保 留 的 规 则 的 最 小 置 信 度 置 信 度 小 于 指 定 值 的 规 则 不 会 包 括 在 新 的 规 则 集 中 直 接 构 建 树 模 型 作 为 使 用 交 互 式 树 构 建 器 的 另 一 种 替 代 方 法, 也 可 以 在 运 行 流 时 直 接 从 节 点 中 构 建 决 策 树 模 型 这 与 多 数 其 他 模 型 构 建 节 点 一 致 对 于 交 互 树 构 建 器 所 不 支 持 的 C5.0 树 模 型 来 说, 这 是 唯 一 可 以 使 用 的 方 法 E 创 建 流 并 添 加 其 中 一 个 决 策 树 节 点 - C&R 树 CHAID QUEST 或 C5.0

140 128 章 6 图 片 6-23 直 接 构 建 C5.0 树 E 对 于 C&R 树 QUEST 或 CHAID, 在 构 建 选 项 选 项 卡 的 目 标 面 板 上, 选 择 一 个 主 目 标 如 果 您 选 择 构 建 单 个 树, 请 确 保 将 模 式 设 为 生 成 模 型 对 于 C5.0, 在 模 型 选 项 卡 上, 将 输 出 类 型 设 为 决 策 树 E 选 择 目 标 字 段 和 预 测 变 量 字 段, 并 在 需 要 时 指 定 其 他 模 型 选 项 有 关 具 体 说 明, 请 参 阅 各 树 构 建 节 点 文 档 E 运 行 流 以 生 成 模 型 注 释 决 策 树 节 点 使 用 此 方 法 生 成 树 时, 会 忽 略 树 生 长 指 令 无 论 使 用 交 互 模 式 还 是 直 接 模 式, 这 两 种 创 建 决 策 树 的 方 法 最 终 都 会 生 成 相 似 的 模 型 只 需 考 虑 希 望 在 此 过 程 中 执 行 多 大 程 度 的 控 制 IBM SPSS Modeler 中 的 决 策 树 节 点 提 供 对 前 面 介 绍 的 树 构 建 算 法 的 访 问 : C&R 树 QUEST CHAID C5.0

141 129 决 策 树 有 关 详 细 信 息, 请 参 阅 第 105 页 码 决 策 树 模 型 这 些 算 法 的 共 同 点 是 它 们 都 通 过 将 数 据 递 归 分 割 成 越 来 越 小 的 子 组, 从 而 构 建 决 策 树 不 过, 有 一 些 重 要 的 不 同 之 处 : 输 入 字 段 输 入 字 段 ( 预 测 变 量 ) 可 以 是 任 何 以 下 类 型 ( 测 量 级 别 ): 连 续 分 类 标 志 名 义 或 有 序 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 测 量 级 别 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 目 标 字 段 仅 可 指 定 一 个 目 标 字 段 对 于 C&R 树 和 CHAID, 目 标 可 以 是 连 续 分 类 标 志 名 义 或 有 序 对 于 QUEST, 它 可 以 是 分 类 标 志 或 名 义 对 于 C5.0, 目 标 可 以 是 标 志 名 义 或 有 序 分 割 类 型 C&R 树 和 QUEST 仅 支 持 二 元 分 割 ( 即, 每 个 树 节 点 不 能 分 割 成 两 个 以 上 的 分 支 ) 相 反,CHAID 和 C5.0 支 持 一 次 分 割 成 两 个 以 上 的 分 支 用 于 分 割 的 方 法 不 同 算 法 在 用 于 确 定 分 割 的 标 准 上 有 所 不 同 C&R 树 在 预 测 分 类 输 出 时 使 用 离 差 测 量 ( 默 认 为 Gini 系 数, 不 过 您 可 以 进 行 更 改 ) 对 于 分 类 目 标, 使 用 最 小 平 方 差 方 法 CHAID 使 用 卡 方 检 验 ;QUEST 对 分 类 预 测 变 量 使 用 卡 方 检 验, 对 连 续 输 入 使 用 方 差 分 析 对 于 C5.0, 使 用 一 个 信 息 理 论 度 量, 信 息 收 益 比 率 缺 失 值 处 理 所 有 算 法 均 允 许 预 测 变 量 字 段 缺 失 值, 但 它 们 使 用 不 同 的 缺 失 值 处 理 方 法 C&R 树 和 QUEST 根 据 需 要 使 用 替 代 预 测 字 段, 以 确 保 具 有 缺 失 值 的 记 录 在 训 练 期 间 通 过 树 CHAID 将 缺 失 值 作 为 单 独 的 类 别, 并 允 许 在 树 构 建 过 程 中 使 用 它 们 C5.0 使 用 切 分 方 法, 将 记 录 的 某 个 切 分 部 分 从 节 点 ( 基 于 具 有 缺 失 值 的 字 段 进 行 分 割 ) 向 下 传 递 到 每 个 树 分 支 修 剪 C&R 树 QUEST 和 C5.0 提 供 的 选 项 允 许 完 全 生 成 树, 然 后 删 除 对 于 树 的 精 确 性 没 有 显 著 贡 献 的 底 层 分 割 以 进 行 修 剪 不 过, 所 有 决 策 树 算 法 均 允 许 您 控 制 最 小 子 组 大 小, 这 有 助 于 避 免 数 据 记 录 过 少 的 分 支 交 互 树 构 建 C&R 树 QUEST 和 CHAID 提 供 了 启 动 交 互 式 会 话 的 选 项 这 允 许 您 在 创 建 模 型 之 前 构 建 树 ( 一 次 一 级 ) 编 辑 分 割 并 修 剪 树 C5.0 未 提 供 交 互 式 选 项 先 验 概 率 C&R 树 和 QUEST 支 持 在 预 测 分 类 目 标 字 段 时 为 类 别 指 定 先 验 概 率 先 验 概 率 是 对 总 体 ( 从 中 可 提 取 训 练 数 据 ) 中 的 每 个 目 标 分 类 的 总 相 对 频 率 的 估 计 换 句 话 说, 先 验 概 率 是 对 预 测 值 有 任 何 了 解 之 前 对 每 个 可 能 的 目 标 值 的 概 率 估 计 CHAID 和 C5.0 不 支 持 指 定 先 验 概 率 规 则 集 对 于 具 有 分 类 目 标 字 段 的 模 型, 决 策 树 节 点 提 供 了 以 规 则 集 形 式 创 建 模 型 的 选 项, 这 有 时 比 复 杂 决 策 树 更 容 易 解 释 对 C&R 树 QUEST 和 CHAID, 您 可 以 从 交 互 式 会 话 中 生 成 规 则 集 ; 对 于 C5.0, 可 以 在 建 模 节 点 上 指 定 此 选 项 此 外, 所 有 决 策 树 模 型 均 允 许 您 从 模 型 块 生 成 规 则 集 有 关 详 细 信 息, 请 参 阅 第 126 页 码 从 决 策 树 中 生 成 规 则 集

142 130 章 6 C&R 树 节 点 分 类 和 回 归 (C&R) 树 节 点 是 一 种 基 于 树 的 分 类 和 预 测 方 法 与 C5.0 类 似, 此 方 法 可 使 用 递 归 分 区 将 训 练 记 录 分 割 为 具 有 相 似 输 出 字 段 值 的 段 可 通 过 检 查 输 入 字 段 找 到 最 佳 分 割 来 启 动 C&R 树, 并 根 据 由 分 割 导 致 的 纯 度 指 数 降 低 情 况 进 行 测 量 分 割 可 定 义 两 个 子 组, 其 中 每 个 子 组 随 后 又 被 分 割 为 两 个 子 组, 依 此 类 推, 直 到 触 发 其 中 一 个 停 止 标 准 为 止 所 有 分 割 都 是 二 元 的 ( 仅 有 两 个 子 组 ) 修 剪 通 过 C&R 树 的 选 项 可 以 首 先 生 成 树, 然 后 根 据 成 本 复 杂 性 算 法 ( 该 算 法 可 根 据 终 端 节 点 数 调 整 风 险 评 估 ) 修 剪 树 通 过 此 方 法 ( 此 方 法 可 以 使 树 在 长 大 后 再 根 据 更 复 杂 的 标 准 进 行 修 剪 ) 可 生 成 交 叉 验 证 属 性 更 佳 的 小 型 树 增 加 终 端 节 点 数 通 常 会 降 低 当 前 ( 训 练 ) 数 据 的 风 险, 但 当 模 型 扩 展 为 适 用 不 可 见 数 据 时, 实 际 的 风 险 可 能 会 更 大 假 设 在 一 种 极 端 的 情 况 下, 训 练 集 合 中 的 每 个 记 录 都 有 一 个 单 独 的 终 端 节 点 此 时 的 风 险 评 估 可 能 是 0%, 因 为 每 个 记 录 都 落 在 了 它 自 己 的 节 点 内, 但 对 于 不 可 见 的 ( 测 试 ) 数 据, 误 分 类 的 风 险 几 乎 肯 定 大 于 0 成 本 复 杂 性 测 量 将 试 图 弥 补 这 种 风 险 示 例 某 有 线 电 视 公 司 委 托 进 行 市 场 研 究, 来 确 定 有 意 预 订 有 线 电 视 交 互 服 务 的 用 户 使 用 研 究 中 得 来 的 数 据 可 创 建 流, 其 中 的 目 标 字 段 为 有 意 预 订 有 线 电 视 服 务, 预 测 变 量 字 段 则 包 括 年 龄 性 别 教 育 收 入 类 别 每 天 看 电 视 的 时 间 和 子 女 数 通 过 将 C&R 树 节 点 应 用 到 流, 可 以 预 测 并 对 响 应 分 类 以 获 得 活 动 的 最 高 响 应 率 要 求 要 训 练 C&R 树 模 型, 需 要 一 个 或 多 个 输 入 字 段 和 唯 一 一 个 目 标 字 段 目 标 和 输 入 字 段 可 以 是 连 续 ( 数 值 范 围 ) 或 分 类 设 置 为 双 向 或 无 的 字 段 将 忽 略 必 须 将 模 型 中 使 用 的 字 段 的 类 型 完 全 实 例 化, 且 模 型 中 使 用 的 所 有 有 序 ( 有 序 集 合 ) 字 段 的 存 储 类 型 必 须 是 数 值 ( 而 不 是 字 符 串 ) 必 要 的 话, 可 以 使 用 重 新 分 类 节 点 对 存 储 类 型 进 行 转 换 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 重 新 对 节 点 分 类 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 强 度 对 于 所 存 在 的 问 题, 例 如 缺 失 数 据 和 大 量 字 段,C&R 树 模 型 十 分 稳 健 这 些 模 型 通 常 不 需 要 花 费 很 长 的 训 练 时 间 用 于 估 计 此 外,C&R 树 模 型 与 某 些 其 他 模 型 类 型 相 比 似 乎 更 容 易 理 解 - 源 自 模 型 的 规 则 解 释 起 来 更 简 明 易 懂 与 C5.0 不 同 的 是,C&R 树 可 同 时 兼 容 连 续 字 段 和 分 类 输 出 字 段 CHAID 节 点 CHAID 或 卡 方 自 动 交 互 效 应 检 测 是 一 种 通 过 使 用 卡 方 统 计 量 识 别 最 优 分 割 来 构 建 决 策 树 的 分 类 方 法 CHAID 首 先 检 查 每 个 输 入 字 段 和 结 果 之 间 的 交 叉 列 表, 然 后 使 用 卡 方 独 立 性 测 试 来 检 验 显 著 性 如 果 以 上 多 个 关 系 具 有 显 著 的 统 计 意 义, 则 CHAID 将 选 择 最 重 要 (p 值 最 小 ) 的 输 入 字 段 如 果 输 入 具 有 两 个 以 上 的 类 别, 将 会 对 这 些 类 别 进 行 比 较, 然 后 将 结 果 中 未 显 示 出 差 异 的 类 别 合 并 在 一 起 此 操 作 通 过 将 显 示 的 显 著 性 差 异 最 低 的 类 别 对 相 继 合 并 在 一 起 来 实 现 当 所 有 剩 余 类 别 在 指 定 的 检 验 级 别 上 存 在 差 异 时, 此 类 别 合 并 过 程 将 终 止 对 于 名 义 输 入 字 段, 可 以 合 并 任 何 类 别 ; 对 于 有 序 集 合, 只 能 合 并 连 续 的 类 别 Exhaustive CHAID 是 CHAID 的 修 正 版, 它 可 对 每 个 预 测 变 量 的 所 有 可 能 分 割 进 行 更 彻 底 的 检 查, 但 计 算 时 间 比 较 长

143 131 决 策 树 要 求 目 标 和 输 入 字 段 可 以 是 连 续 字 段, 也 可 以 是 分 类 字 段 ; 节 点 在 每 一 层 上 都 可 以 分 割 为 两 个 或 多 个 子 组 模 型 中 使 用 的 所 有 顺 序 字 段 的 存 储 类 型 都 必 须 是 数 字 类 型 ( 不 是 字 符 串 ) 必 要 的 话, 可 以 使 用 重 新 分 类 节 点 对 存 储 类 型 进 行 转 换 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 重 新 对 节 点 分 类 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 强 度 CHAID 与 C&R 树 和 QUEST 节 点 不 一 样, 它 可 以 生 成 非 二 元 树, 这 意 味 着 有 些 分 割 将 有 多 于 两 个 的 分 支 因 此, 与 二 元 生 成 方 法 相 比,CHAID 倾 向 于 创 建 范 围 更 广 的 树 CHAID 可 使 用 各 种 类 型 的 输 入, 并 且 可 接 受 观 测 值 加 权 和 频 率 变 量 QUEST 节 点 QUEST, 或 称 快 速 无 偏 倚 高 效 率 统 计 树, 是 一 种 用 于 构 建 决 策 树 的 二 元 分 类 法 开 发 此 方 法 的 一 个 主 要 目 的 是 减 少 包 含 很 多 变 量 或 观 测 值 的 大 型 C&R 树 分 析 所 需 的 处 理 时 间 QUEST 的 第 二 个 目 的 是 减 少 在 分 类 树 法 中 发 现 的 趋 势 以 便 支 持 允 许 有 多 个 分 割 的 输 入, 即 连 续 ( 数 值 范 围 ) 输 入 或 具 有 多 个 类 别 的 输 入 QUEST 可 基 于 显 著 性 检 验 使 用 序 列 规 则 来 评 估 节 点 上 的 输 入 字 段 为 了 进 行 选 择, 可 能 需 要 对 节 点 的 每 个 输 入 执 行 一 次 尽 可 能 简 单 的 检 验 与 C&R 树 不 同, 所 有 的 分 割 都 不 用 检 查, 而 与 C&R 树 和 CHAID 都 不 同 的 是, 在 评 估 输 入 字 段 以 供 选 择 时 不 会 检 验 类 别 组 合 因 此 可 加 快 分 析 的 速 度 通 过 使 用 由 目 标 类 别 形 成 的 组 中 选 定 的 输 入 来 运 行 二 次 判 别 分 析 可 以 确 定 分 割 使 用 此 方 法 可 再 次 使 速 度 较 穷 举 搜 索 (C&R 树 ) 得 到 提 高 以 便 确 定 最 优 分 割 要 求 输 入 字 段 可 以 是 连 续 ( 数 值 范 围 ) 的, 但 目 标 字 段 必 须 是 分 类 的 所 有 分 割 都 是 二 元 的 不 能 使 用 加 权 字 段 模 型 中 使 用 的 所 有 有 序 ( 有 序 集 合 ) 字 段 的 存 储 类 型 都 必 须 是 数 字 类 型 ( 不 是 字 符 串 ) 必 要 的 话, 可 以 使 用 重 新 分 类 节 点 对 存 储 类 型 进 行 转 换 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 重 新 对 节 点 分 类 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 强 度 与 CHAID 相 似 但 与 C&R 树 不 同 的 是,QUEST 可 使 用 统 计 检 验 确 定 是 否 使 用 输 入 字 段 QUEST 还 可 将 输 入 的 选 择 与 分 割 问 题 分 开, 分 别 为 其 应 用 不 同 的 标 准 不 过 在 CHAID 中, 确 定 变 量 选 择 的 统 计 检 验 结 果 还 可 生 成 分 割 同 样,C&R 树 也 可 采 用 杂 质 更 改 测 量 在 选 择 输 入 字 段 的 同 时 确 定 分 割 决 策 树 节 点 字 段 选 项 在 字 段 选 项 卡 上, 可 以 选 择 是 要 使 用 在 上 游 节 点 中 定 义 的 字 段 角 色 设 置, 还 是 手 动 进 行 字 段 分 配

144 132 章 6 图 片 6-24 C&R 树 节 点, 字 段 选 项 卡 使 用 预 定 义 角 色 此 选 项 使 用 上 游 类 型 节 点 ( 或 上 游 源 节 点 的 类 型 选 项 卡 ) 的 角 色 设 置 ( 目 标 预 测 变 量 等 等 ) 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 设 置 字 段 角 色 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 使 用 自 定 义 字 段 分 配 如 果 您 要 在 此 屏 幕 中 手 动 分 配 目 标 预 测 变 量 和 其 他 角 色, 请 选 择 此 项 字 段 使 用 箭 头 按 钮 可 以 从 列 表 中 将 项 目 手 动 分 配 到 屏 幕 右 侧 的 各 类 角 色 字 段 图 标 表 示 每 个 角 色 字 段 的 有 效 测 量 级 别 单 击 全 部 按 钮 可 以 选 择 列 表 中 的 所 有 字 段, 或 单 击 单 独 的 测 量 级 别 按 钮 以 选 择 具 有 此 测 量 级 别 的 所 有 字 段 目 标 选 择 单 个 字 段 作 为 预 测 目 标 预 测 变 量 ( 输 入 ) 选 择 一 个 或 多 个 字 段 作 为 预 测 输 入 分 析 权 重 ( 仅 CHAID 和 C&RT) 要 使 用 字 段 作 为 个 案 权 重, 在 此 处 指 定 个 案 权 重 将 作 为 对 输 出 字 段 各 个 水 平 上 方 差 的 差 异 的 一 种 考 量 有 关 详 细 信 息, 请 参 阅 第 33 页 码 第 3 章 中 的 使 用 频 率 和 权 重 字 段

145 133 决 策 树 决 策 树 节 点 构 建 选 项 通 过 构 建 选 项 选 项 卡, 您 可 以 设 置 构 建 模 型 的 所 有 选 项 当 然, 您 只 需 单 击 运 行 按 钮, 即 可 采 用 所 有 默 认 选 项 来 构 建 模 型 ; 不 过, 通 常 您 需 要 根 据 具 体 用 途 自 定 义 构 建 选 项 您 可 以 在 此 选 择 是 构 建 新 模 型 还 是 更 新 现 有 模 型 您 还 可 以 设 置 节 点 的 主 目 标 : 构 建 标 准 模 型 构 建 具 有 增 强 精 确 性 或 稳 定 性 的 模 型, 还 是 构 建 用 于 大 型 数 据 集 的 模 型 图 片 6-25 C&R 树 节 点, 构 建 选 项 选 项 卡 您 希 望 做 什 么? 新 建 模 型 ( 默 认 ) 每 次 运 行 包 含 此 建 模 结 点 的 流 时, 就 会 创 建 一 个 全 新 模 型 继 续 训 练 现 有 模 型 默 认 情 况 下, 每 当 执 行 一 个 建 模 节 点 时, 就 会 创 建 一 个 完 整 的 新 模 型 如 果 选 中 该 选 项, 则 会 继 续 训 练 该 节 点 成 功 生 成 的 最 后 一 个 模 型 这 样 就 可 以 在 无 需 访 问 原 始 数 据 的 情 况 下 更 新 或 刷 新 现 有 的 模 型, 并 可 能 会 显 著 提 升 性 能, 这 是 因 为 只 有 新 的 或 更 新 后 的 记 录 被 反 馈 到 流 中 上 一 个 模 型 的 详 细 信 息 与 建 模 节 点 存 储 在 一 起, 这 样 即 使 先 前 的 模 型 块 在 流 或 模 型 选 项 板 中 不 再 可 用 的 情 况 下, 也 可 以 使 用 该 选 项

146 134 章 6 注 意 : 此 选 项 仅 当 您 选 择 为 超 大 型 数 据 集 创 建 模 型 作 为 目 标 时 才 会 激 活 您 的 主 要 目 标 是 什 么? 构 建 单 个 树 创 建 单 个 标 准 决 策 树 模 型 一 般 来 说, 与 使 用 其 他 目 标 选 项 构 建 的 模 型 相 比, 标 准 模 型 更 易 于 解 释, 并 能 更 快 地 进 行 评 分 众 数 指 定 用 于 构 建 模 型 的 方 法 生 成 模 型 可 在 运 行 流 时 自 动 创 建 模 型 启 动 交 互 会 话 可 打 开 树 构 建 器, 通 过 该 构 建 器 可 在 创 建 模 型 块 之 前 构 建 树 ( 一 次 一 级 ) 编 辑 分 割 并 按 照 需 要 进 行 修 剪 使 用 树 指 令 选 中 此 选 项 可 指 定 从 节 点 中 生 成 交 互 树 时 所 应 用 的 指 令 例 如, 可 以 指 定 第 一 级 分 割 和 第 二 级 分 割, 当 启 动 树 构 建 器 时 会 自 动 应 用 这 些 分 割 还 可 以 保 存 交 互 树 构 建 会 话 中 的 指 令, 以 便 将 来 重 新 创 建 树 时 使 用 有 关 详 细 信 息, 请 参 阅 第 125 页 码 更 新 树 指 令 增 强 模 型 准 确 性 ( 推 进 ) 如 果 您 要 使 用 一 种 名 为 推 进 的 特 殊 方 法 来 提 高 模 型 准 确 率, 请 选 择 此 项 推 进 的 工 作 原 理 是 在 序 列 中 构 建 多 个 模 型 第 一 个 模 型 按 常 规 方 式 进 行 构 建 构 建 第 二 个 模 型 时, 将 焦 点 集 中 于 由 第 一 个 模 型 误 分 类 的 记 录 构 建 第 三 个 模 型 时, 将 焦 点 集 中 于 第 二 个 模 型 的 错 误, 依 此 类 推 最 后, 通 过 将 整 个 模 型 集 应 用 到 观 测 值, 并 使 用 加 权 投 票 过 程 将 单 独 的 预 测 组 合 为 一 个 总 预 测 来 分 类 观 测 值 推 进 可 以 显 著 提 高 决 策 树 模 型 的 准 确 性, 但 也 需 要 更 长 的 训 练 时 间 增 强 模 型 稳 定 性 (bagging) 如 果 您 要 使 用 一 种 名 为 bagging(bootstrap 汇 总 ) 的 特 殊 方 法 来 提 高 模 型 稳 定 性 并 避 免 过 度 拟 合, 请 选 择 此 项 此 选 项 创 建 多 个 模 型 并 加 以 合 并, 从 而 获 得 更 可 靠 的 预 测 结 果 与 标 准 模 型 相 比, 通 过 此 选 项 获 得 的 模 型 需 要 更 长 的 构 建 与 评 分 时 间 为 超 大 型 数 据 集 创 建 模 型 如 果 您 的 数 据 集 过 大, 而 无 法 使 用 任 何 上 述 目 标 选 项 构 建 模 型, 请 选 择 此 项 此 选 项 将 数 据 划 分 为 较 小 的 数 据 块, 并 在 每 个 块 上 构 建 模 型 这 将 自 动 选 择 最 准 确 的 模 型, 并 合 并 成 单 个 模 型 块 如 果 您 在 此 屏 幕 上 选 择 继 续 训 练 现 有 模 型 选 项, 可 以 执 行 增 量 式 模 型 更 新 注 意 : 此 选 项 适 合 大 型 数 据 集, 需 要 到 IBM SPSS Modeler Server 的 连 接 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 连 接 到 IBM SPSS Modeler Server 中 的 IBM SPSS Modeler 14.2 用 户 指 南 决 策 树 节 点 - 基 本 您 可 在 此 指 定 有 关 如 何 构 建 决 策 树 的 基 本 选 项

147 135 决 策 树 图 片 6-26 决 策 树 基 本 选 项 树 生 长 算 法 ( 仅 CHAID) 选 择 您 要 使 用 的 CHAID 算 法 类 型 Exhaustive CHAID 是 CHAID 的 修 正 版, 它 可 对 每 个 预 测 变 量 的 所 有 可 能 分 割 进 行 更 彻 底 的 检 查, 但 计 算 时 间 比 较 长 最 大 树 深 度 指 定 根 节 点 以 下 的 最 大 级 数 ( 递 归 分 割 样 本 的 次 数 ) 默 认 值 为 5; 选 择 自 定 义, 输 入 值 以 指 定 其 他 级 数 修 剪 ( 仅 C&RT 和 QUEST) 修 剪 树 以 防 止 过 拟 合 修 剪 包 括 删 除 对 于 树 的 精 确 性 没 有 显 著 贡 献 的 底 层 分 割 修 剪 有 助 于 简 化 树, 使 树 更 容 易 被 理 解, 在 某 些 情 况 下 还 可 提 高 广 义 性 如 果 需 要 完 整 的 未 经 修 剪 的 树, 请 保 持 此 项 处 于 未 选 中 状 态 最 大 风 险 差 值 ( 标 准 误 ): 通 过 此 选 项 可 指 定 更 自 由 的 修 剪 规 则 标 准 误 规 则 使 算 法 能 够 选 择 最 简 单 的 树, 该 树 的 风 险 评 估 接 近 于 ( 但 也 可 能 大 于 ) 风 险 最 小 的 子 树 的 风 险 评 估 此 值 表 示 在 风 险 评 估 中 已 修 剪 树 和 风 险 最 小 的 树 之 间 所 允 许 的 风 险 评 估 差 异 大 小 例 如, 如 果 指 定 2, 则 将 选 择 其 风 险 评 估 (2 标 准 误 ) 大 于 完 整 树 的 风 险 评 估 的 树

148 136 章 6 最 大 代 用 项 代 用 项 是 用 于 处 理 缺 失 值 的 方 法 对 于 树 中 的 每 个 分 割, 算 法 都 会 对 与 选 定 的 分 割 字 段 最 相 似 的 输 入 字 段 进 行 识 别 这 些 被 识 别 的 字 段 就 是 该 分 割 的 代 用 项 当 必 须 对 某 个 记 录 进 行 分 类, 但 此 记 录 中 的 分 割 字 段 中 具 有 缺 失 值 时, 可 以 使 用 代 用 项 字 段 的 值 填 补 此 分 割 增 加 此 设 置 将 可 以 更 加 灵 活 地 处 理 缺 失 值, 但 也 会 导 致 内 存 使 用 量 和 训 练 时 间 增 加 决 策 树 节 点 - 停 止 规 则 图 片 6-27 停 止 规 则 的 选 项 这 些 选 项 可 控 制 树 的 构 建 方 式 停 止 规 则 可 确 定 何 时 停 止 分 割 树 的 特 定 分 支 设 置 最 小 分 支 大 小 可 阻 止 通 过 分 割 创 建 非 常 小 的 子 组 如 果 节 点 ( 父 ) 中 要 分 割 的 记 录 数 小 于 指 定 值, 则 父 分 支 中 的 最 小 记 录 数 将 阻 止 进 行 分 割 如 果 由 分 割 创 建 的 任 意 分 支 ( 子 ) 中 的 记 录 数 小 于 指 定 值, 则 子 分 支 中 的 最 小 记 录 数 将 阻 止 进 行 分 割 使 用 百 分 比 可 指 定 总 训 练 数 据 的 百 分 比 大 小 使 用 绝 对 值 可 按 绝 对 记 录 数 指 定 大 小

149 137 决 策 树 决 策 树 节 点 - 整 体 图 片 6-28 整 体 的 选 项 这 些 设 置 决 定 了 在 目 标 中 请 求 boosting bagging 或 超 大 型 数 据 集 时 发 生 的 整 体 行 为 对 选 定 目 标 不 适 用 的 选 项 将 被 忽 略 Bagging 和 大 型 数 据 集 在 对 整 体 评 分 时, 此 规 则 用 于 组 合 来 自 基 本 模 型 的 预 测 值, 以 计 算 整 体 得 分 值 分 类 目 标 的 默 认 组 合 规 则 可 以 通 过 投 票 最 高 概 率 或 最 高 平 均 值 概 率 来 对 分 类 目 标 的 整 体 预 测 值 进 行 组 合 投 票 选 择 在 基 本 模 型 中 最 常 具 有 最 高 概 率 的 类 别 最 高 概 率 选 择 在 所 有 基 本 模 型 中 取 得 单 个 最 高 概 率 的 类 别 最 高 平 均 值 概 率 选 择 在 基 本 模 型 中 对 类 别 概 率 取 平 均 值 时 具 有 最 高 值 的 类 别 连 续 目 标 的 默 认 组 合 规 则 可 以 通 过 对 来 自 基 本 模 型 的 预 测 值 取 平 均 值 或 中 位 数, 对 连 续 目 标 的 整 体 预 测 值 进 行 组 合 注 意, 如 果 以 增 强 模 型 精 确 性 为 目 标, 则 组 合 规 则 选 择 将 被 忽 略 Boosting 方 法 始 终 使 用 加 权 大 多 数 投 票 来 对 分 类 目 标 进 行 评 分, 而 使 用 加 权 中 位 数 对 连 续 目 标 进 行 评 分

150 138 章 6 Boosting 和 Bagging 当 以 增 强 模 型 精 确 性 或 稳 定 性 为 目 标 时, 指 定 要 构 建 的 基 本 模 型 数 ; 对 于 bagging 方 法, 此 为 bootstrap 样 本 数 它 应 为 正 整 数 C&R 树 和 QUEST 节 点 - 成 本 和 先 验 图 片 6-29 设 置 误 分 类 成 本 和 先 验 概 率 误 分 类 损 失 在 某 些 环 境 中, 特 定 错 误 类 别 的 成 本 高 于 其 他 错 误 的 成 本 例 如, 将 高 风 险 信 贷 申 请 人 分 类 为 低 风 险 申 请 人 ( 一 种 错 误 类 别 ) 的 成 本 高 于 将 低 风 险 申 请 人 分 类 为 高 风 险 申 请 人 ( 另 一 种 错 误 类 别 ) 的 成 本 使 用 误 分 类 成 本 可 指 定 不 同 类 别 的 预 测 错 误 的 相 对 重 要 性 误 分 类 成 本 在 本 质 上 指 应 用 于 特 定 结 果 的 权 重 这 些 权 重 可 化 为 模 型 中 的 因 子, 并 可 能 在 实 际 上 更 改 预 测 ( 作 为 避 免 高 成 本 错 误 的 一 种 方 式 ) 除 C5.0 模 型 之 外, 在 对 模 型 进 行 评 分 时, 误 分 类 成 本 是 不 适 用 的 ; 在 使 用 自 动 分 类 器 节 点 评 估 图 表 或 分 析 节 点 对 模 型 进 行 排 序 或 比 较 时, 误 分 类 成 本 也 不 予 以 考 虑 将 成 本 计 算 在 内 的 模 型 不 比 不 将 成 本 计 算 在 内 的 模 型 产 生 的 误 差 小, 这 样 的 模 型 不 会 也 不 可 能 按 照 总 体 精 确 性 排 序 到 任 何 更 高 的 级 别, 但 是 在 实 际 应 用 中, 这 样 的 模 型 执 行 的 结 果 可 能 更 好, 因 为 它 有 一 个 内 置 的 偏 差, 从 而 有 利 于 将 错 误 的 成 本 降 低

151 139 决 策 树 成 本 矩 阵 显 示 了 预 测 类 别 和 实 际 类 别 的 每 个 可 能 的 组 合 的 成 本 默 认 情 况 下, 所 有 误 分 类 成 本 都 设 置 为 1.0 要 输 入 自 定 义 成 本 值, 可 选 择 使 用 误 分 类 成 本 并 将 自 定 义 值 输 入 到 成 本 矩 阵 中 要 更 改 误 分 类 成 本, 可 选 择 与 所 需 的 预 测 值 和 实 际 值 的 组 合 对 应 的 单 元 格, 清 除 此 单 元 格 内 现 有 的 内 容, 然 后 为 其 输 入 所 需 的 成 本 成 本 不 会 自 动 均 摊 例 如, 如 果 将 A 误 分 类 为 B 的 成 本 设 置 为 2.0, 则 将 B 误 分 类 为 A 的 成 本 将 仍 是 默 认 值 1.0, 除 非 也 明 确 地 对 它 进 行 更 改 先 验 通 过 这 些 选 项 可 以 在 预 测 分 类 目 标 字 段 时 为 分 类 指 定 先 验 概 率 先 验 概 率 是 对 总 体 ( 从 中 可 提 取 训 练 数 据 ) 中 的 每 个 目 标 分 类 的 总 相 对 频 率 的 估 计 换 句 话 说, 先 验 概 率 是 对 预 测 值 有 任 何 了 解 之 前 对 每 个 可 能 的 目 标 值 的 概 率 估 计 有 三 种 方 法 用 来 设 置 先 验 概 率 : 基 于 训 练 数 据 这 是 默 认 选 项 先 验 概 率 基 于 训 练 数 据 中 分 类 的 相 对 频 率 对 于 所 有 类 都 相 等 所 有 分 类 的 先 验 概 率 都 定 义 为 1/k, 其 中 k 是 目 标 分 类 数 自 定 义 可 以 自 己 指 定 先 验 概 率 对 于 所 有 类, 都 将 先 验 概 率 的 初 值 设 置 为 相 等 可 以 将 单 个 分 类 的 概 率 调 整 为 用 户 定 义 的 值 要 调 整 特 定 分 类 的 概 率, 可 在 表 中 对 应 于 所 需 分 类 的 概 率 单 元 格 中, 先 清 除 其 内 容, 然 后 输 入 所 需 的 值 所 有 分 类 的 先 验 概 率 之 和 应 为 1.0( 概 率 约 束 ) 如 果 权 重 之 和 不 为 1.0, 将 出 现 一 个 警 告, 显 示 带 有 自 动 标 准 化 这 些 值 的 选 项 此 自 动 调 整 操 作 可 在 强 制 执 行 概 率 约 束 时 保 留 分 类 中 的 比 例 通 过 单 击 标 准 化 按 钮, 可 在 任 何 时 间 执 行 此 调 整 将 表 中 所 有 分 类 重 置 为 相 同 的 值, 可 单 击 均 衡 按 钮 使 用 误 分 类 成 本 调 整 先 验 通 过 此 选 项 可 以 根 据 误 分 类 成 本 ( 在 成 本 选 项 卡 中 指 定 ) 调 整 先 验 概 率 从 而 可 为 使 用 两 分 杂 质 测 量 的 树 将 损 失 信 息 直 接 合 并 到 树 生 成 过 程 中 ( 未 选 中 此 选 项 时, 损 失 信 息 仅 用 于 为 基 于 两 分 测 量 的 树 分 类 记 录 和 计 算 风 险 评 估 )

152 140 章 6 CHAID 节 点 - 成 本 图 片 6-30 在 CHAID 节 点 中 的 误 分 类 成 本 在 某 些 环 境 中, 特 定 错 误 类 别 的 成 本 高 于 其 他 错 误 的 成 本 例 如, 将 高 风 险 信 贷 申 请 人 分 类 为 低 风 险 申 请 人 ( 一 种 错 误 类 别 ) 的 成 本 高 于 将 低 风 险 申 请 人 分 类 为 高 风 险 申 请 人 ( 另 一 种 错 误 类 别 ) 的 成 本 使 用 误 分 类 成 本 可 指 定 不 同 类 别 的 预 测 错 误 的 相 对 重 要 性 误 分 类 成 本 在 本 质 上 指 应 用 于 特 定 结 果 的 权 重 这 些 权 重 可 化 为 模 型 中 的 因 子, 并 可 能 在 实 际 上 更 改 预 测 ( 作 为 避 免 高 成 本 错 误 的 一 种 方 式 ) 除 C5.0 模 型 之 外, 在 对 模 型 进 行 评 分 时, 误 分 类 成 本 是 不 适 用 的 ; 在 使 用 自 动 分 类 器 节 点 评 估 图 表 或 分 析 节 点 对 模 型 进 行 排 序 或 比 较 时, 误 分 类 成 本 也 不 予 以 考 虑 将 成 本 计 算 在 内 的 模 型 不 比 不 将 成 本 计 算 在 内 的 模 型 产 生 的 误 差 小, 这 样 的 模 型 不 会 也 不 可 能 按 照 总 体 精 确 性 排 序 到 任 何 更 高 的 级 别, 但 是 在 实 际 应 用 中, 这 样 的 模 型 执 行 的 结 果 可 能 更 好, 因 为 它 有 一 个 内 置 的 偏 差, 从 而 有 利 于 将 错 误 的 成 本 降 低 成 本 矩 阵 显 示 了 预 测 类 别 和 实 际 类 别 的 每 个 可 能 的 组 合 的 成 本 默 认 情 况 下, 所 有 误 分 类 成 本 都 设 置 为 1.0 要 输 入 自 定 义 成 本 值, 可 选 择 使 用 误 分 类 成 本 并 将 自 定 义 值 输 入 到 成 本 矩 阵 中 要 更 改 误 分 类 成 本, 可 选 择 与 所 需 的 预 测 值 和 实 际 值 的 组 合 对 应 的 单 元 格, 清 除 此 单 元 格 内 现 有 的 内 容, 然 后 为 其 输 入 所 需 的 成 本 成 本 不 会 自 动 均 摊 例 如, 如 果 将 A 误 分 类 为 B 的 成 本 设 置 为 2.0, 则 将 B 误 分 类 为 A 的 成 本 将 仍 是 默 认 值 1.0, 除 非 也 明 确 地 对 它 进 行 更 改

153 141 决 策 树 C&R 树 节 点 - 高 级 使 用 高 级 选 项 可 对 树 构 建 过 程 进 行 微 调 图 片 6-31 设 置 C&R 树 节 点 的 高 级 选 项 最 小 杂 质 改 变 指 定 最 小 杂 质 改 变 以 便 在 树 中 创 建 新 的 分 割 杂 质 指 由 树 定 义 的 子 组 在 每 个 组 中 所 具 有 的 输 出 字 段 值 的 广 度 对 于 分 类 目 标, 如 果 节 点 中 100% 的 观 测 值 都 落 在 目 标 字 段 的 特 定 类 别 中, 则 该 节 点 被 认 为 是 纯 节 点 树 构 建 的 目 的 是 创 建 具 有 相 似 输 出 值 的 子 组 - 换 句 话 说, 是 为 了 减 少 每 个 节 点 中 的 杂 质 如 果 某 个 分 支 的 最 佳 分 割 按 小 于 指 定 值 的 数 量 减 少 杂 质, 则 不 会 进 行 此 分 割 分 类 目 标 的 杂 质 测 量 对 于 分 类 目 标 字 段, 指 定 用 于 测 量 树 的 杂 质 的 方 法 ( 对 于 连 续 目 标, 将 忽 略 此 选 项, 而 通 常 会 使 用 最 小 平 方 差 杂 质 测 量 ) 吉 尼 是 基 于 分 支 的 类 别 归 属 概 率 的 一 般 杂 质 测 量 两 分 是 强 调 二 元 分 割 并 更 有 可 能 导 致 从 分 割 中 生 成 大 小 近 似 相 同 的 分 支 的 杂 质 测 量 有 序 添 加 了 额 外 的 限 制, 即 只 有 连 续 的 目 标 类 才 可 以 组 成 一 组, 此 选 项 仅 适 用 于 顺 序 目 标 如 果 对 于 名 义 目 标 选 中 此 选 项, 将 默 认 使 用 标 准 的 两 分 测 量

154 142 章 6 防 止 过 度 拟 合 集 合 该 算 法 在 内 部 将 记 录 划 分 为 模 型 构 建 集 合 和 防 止 过 度 拟 合 集 合, 后 者 作 为 独 立 的 数 据 记 录 集, 用 于 跟 踪 训 练 过 程 中 的 错 误, 以 防 止 该 方 法 对 数 据 中 的 几 率 变 异 进 行 建 模 指 定 记 录 的 百 分 比 默 认 值 为 30 重 复 结 果 设 置 随 机 种 子 允 许 您 复 制 分 析 指 定 一 个 整 数, 或 单 击 生 成, 这 将 产 生 一 个 介 于 1 与 之 间 ( 包 括 1 和 ) 的 伪 随 机 整 数 QUEST 节 点 - 高 级 使 用 高 级 选 项 可 对 树 构 建 过 程 进 行 微 调 图 片 6-32 设 置 QUEST 节 点 的 高 级 选 项 用 于 分 割 的 显 著 性 水 平 指 定 用 于 分 割 节 点 的 显 著 性 水 平 (alpha) 该 值 必 须 位 于 0 和 1 之 间 值 越 小, 生 成 的 树 的 节 点 也 会 越 少 防 止 过 度 拟 合 集 合 该 算 法 在 内 部 将 记 录 划 分 为 模 型 构 建 集 合 和 防 止 过 度 拟 合 集 合, 后 者 作 为 独 立 的 数 据 记 录 集, 用 于 跟 踪 训 练 过 程 中 的 错 误, 以 防 止 该 方 法 对 数 据 中 的 几 率 变 异 进 行 建 模 指 定 记 录 的 百 分 比 默 认 值 为 30

155 143 决 策 树 重 复 结 果 设 置 随 机 种 子 允 许 您 复 制 分 析 指 定 一 个 整 数, 或 单 击 生 成, 这 将 产 生 一 个 介 于 1 与 之 间 ( 包 括 1 和 ) 的 伪 随 机 整 数 CHAID 节 点 - 高 级 使 用 高 级 选 项 可 对 树 构 建 过 程 进 行 微 调 图 片 6-33 设 置 CHAID 节 点 的 高 级 选 项 用 于 分 割 的 显 著 性 水 平 指 定 用 于 分 割 节 点 的 显 著 性 水 平 (alpha) 该 值 必 须 位 于 0 和 1 之 间 值 越 小, 生 成 的 树 的 节 点 也 会 越 少 用 于 合 并 的 显 著 性 水 平 指 定 用 于 合 并 类 别 的 显 著 性 水 平 (alpha) 该 值 必 须 大 于 0 并 小 于 或 等 于 1 为 阻 止 对 类 别 进 行 任 何 合 并, 可 将 值 指 定 为 1 对 于 连 续 目 标, 这 意 味 着 最 终 树 中 变 量 的 类 别 数 与 指 定 的 时 间 间 隔 数 相 匹 配 此 选 项 对 于 Exhaustive CHAID 不 适 用 使 用 Bonferroni 方 法 调 整 显 著 性 值 检 验 预 测 变 量 的 各 种 类 别 组 合 时 调 整 显 著 相 关 值 显 著 相 关 值 可 基 于 检 验 次 数 进 行 调 整, 而 检 验 次 数 直 接 与 预 测 变 量 的 类 别 数 及 测 量 等 级 相 关 通 常 需 要 选 中 此 选 项, 因 为 它 可 以 更 好 地 控 制 假 阳 性 错 误 率 禁 用 此 选 项 将 提 高 您 的 分 析 能 力 以 找 到 真 差 分, 但 以 增 加 假 阳 性 率 为 代 价 建 议 您 禁 用 此 选 项, 尤 其 对 于 较 小 的 样 本

156 144 章 6 在 节 点 内 允 许 重 新 分 割 合 并 类 别 CHAID 算 法 试 图 合 并 类 别 以 生 成 最 简 单 的 树 来 描 述 模 型 如 果 选 中 此 选 项, 且 合 并 后 的 结 果 能 够 比 较 好 地 描 述 模 型, 则 可 重 新 分 割 已 合 并 的 类 别 类 别 目 标 的 卡 方 值 对 于 类 别 目 标, 可 指 定 用 于 计 算 卡 方 统 计 量 的 方 法 Pearson 此 方 法 提 供 更 快 的 计 算, 但 是 对 于 小 样 本 应 该 谨 慎 使 用 它 似 然 比 此 方 法 与 Pearson 方 法 相 比 更 加 稳 健, 但 计 算 时 间 比 较 长 对 于 小 样 本, 这 是 首 选 的 方 法 对 于 连 续 目 标, 通 常 使 用 此 方 法 期 望 单 元 格 频 率 的 最 小 更 改 ( 为 名 义 模 型 和 行 效 应 顺 序 模 型 ) 估 计 单 元 格 频 率 时, 迭 代 过 程 (epsilon) 用 于 对 最 优 估 计 ( 在 特 定 分 割 的 卡 方 检 验 中 使 用 ) 进 行 收 敛 Epsilon 可 确 定 必 须 对 迭 代 进 行 多 大 的 更 改 才 可 使 其 继 续 ; 如 果 对 最 后 一 个 迭 代 的 更 改 小 于 指 定 的 值, 则 迭 代 将 停 止 如 果 因 算 法 中 存 在 问 题 而 无 法 收 敛, 则 可 以 增 加 该 值 或 增 加 最 大 迭 代 次 数, 直 到 发 生 收 敛 为 止 收 敛 的 最 大 迭 代 次 数 无 论 是 否 已 进 行 收 敛 都 指 定 停 止 前 的 最 大 迭 代 次 数 重 复 结 果 设 置 随 机 种 子 允 许 您 复 制 分 析 指 定 一 个 整 数, 或 单 击 生 成, 这 将 产 生 一 个 介 于 1 与 之 间 ( 包 括 1 和 ) 的 伪 随 机 整 数 决 策 树 节 点 模 型 选 项 在 模 型 选 项 选 项 卡 上, 您 可 以 选 择 是 指 定 模 型 名 称, 还 是 自 动 生 成 名 称 您 还 可 以 选 择 获 得 预 测 变 量 重 要 性 信 息, 以 及 标 志 目 标 的 原 始 和 调 整 倾 向 得 分

157 145 决 策 树 图 片 6-34 设 置 决 策 树 节 点 的 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 模 型 评 估 计 算 预 测 变 量 重 要 性 对 于 生 成 相 应 重 要 性 测 量 的 模 型, 可 以 显 示 一 个 图 表 来 说 明 评 估 模 型 中 每 个 预 测 变 量 的 相 对 重 要 性 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 请 注 意, 对 于 某 些 模 型, 计 算 预 测 变 量 重 要 性 ( 特 别 对 较 大 数 据 集 进 行 操 作 时 ) 可 能 需 要 花 较 长 时 间, 因 此 默 认 情 况 下, 对 于 某 些 模 型, 预 测 变 量 重 要 性 均 处 于 关 闭 状 态 预 测 变 量 重 要 性 对 于 决 策 列 表 模 型 不 可 用 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 倾 向 得 分 可 以 在 建 模 节 点 中 和 模 型 块 的 设 置 选 项 卡 上 启 用 倾 向 得 分 该 功 能 仅 在 所 选 目 标 为 标 志 字 段 时 才 可 用 有 关 详 细 信 息, 请 参 阅 第 36 页 码 第 3 章 中 的 倾 向 得 分

158 146 章 6 C5.0 节 点 计 算 原 始 的 倾 向 得 分 原 始 的 倾 向 得 分 仅 从 基 于 训 练 数 据 的 模 型 中 导 出 如 果 模 型 预 测 值 为 真 ( 将 响 应 ), 则 倾 向 与 P 相 同, 其 中 P 为 预 测 的 可 能 性 如 果 模 型 预 测 的 值 为 假, 则 计 算 出 的 倾 向 为 (1 P) 如 果 构 建 模 型 时 选 择 了 此 选 项, 则 默 认 情 况 下 将 在 模 型 块 中 启 用 倾 向 得 分 不 过, 无 论 是 否 在 建 模 节 点 中 选 择 了 原 始 倾 向 得 分, 都 可 以 始 终 在 模 型 块 中 选 择 启 用 原 始 倾 向 得 分 对 模 型 进 行 评 分 时, 原 始 倾 向 得 分 将 被 添 加 到 将 RP 字 母 附 加 到 标 准 前 缀 的 字 段 中 例 如, 如 果 预 测 位 于 名 为 $R-churn 的 字 段 中, 则 倾 向 得 分 字 段 的 名 称 将 是 $RRP-churn 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 仅 仅 基 于 由 可 能 过 度 拟 合 的 模 型 给 定 的 估 计 上, 这 样 会 导 致 过 于 乐 观 地 评 估 倾 向 调 整 后 的 倾 向 尝 试 通 过 查 看 模 型 在 检 验 或 验 证 分 区 的 性 能 或 通 过 调 整 倾 向 来 弥 补, 以 相 应 地 给 作 出 更 好 的 估 计 此 设 置 要 求 流 中 存 在 有 效 的 分 区 字 段 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 与 原 始 置 信 度 分 数 不 同, 调 整 后 的 倾 向 得 分 必 须 在 构 建 模 型 时 计 算 ; 否 则, 对 模 型 块 进 行 评 分 时 该 分 数 将 不 存 在 对 模 型 进 行 评 分 时, 在 将 AP 字 母 附 加 到 标 准 前 缀 的 字 段 中 添 加 调 整 后 的 倾 向 得 分 例 如, 如 果 预 测 位 于 名 为 $R-churn 的 字 段 中, 则 倾 向 得 分 字 段 的 名 称 将 是 $RAP-churn 调 整 后 的 倾 向 得 分 不 适 用 于 logistic 回 归 模 型 在 计 算 调 整 后 的 倾 向 得 分 时, 必 须 尚 未 平 衡 用 于 计 算 的 检 验 或 验 证 分 区 为 避 免 这 一 点, 请 确 保 在 任 何 上 游 平 衡 节 点 中 选 中 仅 平 衡 训 练 数 据 选 项 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 为 平 衡 节 点 设 置 选 项 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 此 外, 如 果 已 在 上 游 获 取 了 复 杂 样 本, 则 会 导 致 调 整 后 的 倾 向 得 分 无 效 调 整 后 的 倾 向 得 分 不 适 用 于 增 强 型 树 和 规 则 集 模 型 有 关 详 细 信 息, 请 参 阅 第 158 页 码 增 强 型 C5.0 模 型 基 于 对 于 有 待 计 算 的 调 整 后 的 倾 向 得 分, 流 中 必 须 存 在 一 个 分 区 字 段 可 以 指 定 是 使 用 检 验 分 区 还 是 验 证 分 区 进 行 此 计 算 为 获 取 最 佳 结 果, 检 验 或 验 证 分 区 包 含 的 记 录 数 量 应 至 少 与 用 于 训 练 原 始 模 型 的 分 区 所 包 含 的 记 录 数 相 同 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 该 节 点 使 用 C5.0 算 法 构 建 决 策 树 或 规 则 集 C5.0 模 型 的 工 作 原 理 是 根 据 提 供 最 大 信 息 增 益 的 字 段 分 割 样 本 然 后 通 常 会 根 据 不 同 的 字 段 再 次 分 割 由 第 一 次 分 割 定 义 的 每 个 子 样 本, 且 此 过 程 会 重 复 下 去 直 到 无 法 继 续 分 割 子 样 本 最 后, 将 重 新 检 查 最 底 层 分 割, 并 删 除 或 修 剪 对 模 型 值 没 有 显 著 贡 献 的 分 割 注 意 :C5.0 节 点 只 能 预 测 分 类 目 标 分 析 包 含 分 类 ( 名 义 或 有 序 ) 字 段 的 数 据 时, 与 11.0 版 以 前 的 C5.0 版 本 相 比 将 类 别 组 合 在 一 起 的 可 能 性 大 C5.0 可 以 生 成 两 种 模 型 决 策 树 是 对 由 算 法 建 立 的 分 割 的 简 单 描 述 每 个 终 端 ( 或 叶 ) 节 点 可 描 述 训 练 数 据 的 特 定 子 集, 而 训 练 数 据 中 的 每 个 观 测 值 都 完 全 属 于 树 中 的 某 个 终 端 节 点 换 句 话 说, 对 于 在 决 策 树 中 显 示 的 任 何 特 定 数 据 记 录, 仅 可 能 有 一 个 预 测

159 147 决 策 树 反 过 来, 规 则 集 则 是 尝 试 对 单 个 记 录 进 行 预 测 的 一 组 规 则 规 则 集 源 自 决 策 树, 并 且 在 某 种 程 度 上 表 示 在 决 策 树 中 建 立 的 经 简 化 或 提 取 的 信 息 版 本 通 常, 规 则 集 可 保 留 完 整 的 决 策 树 中 的 大 部 分 重 要 信 息, 但 其 使 用 的 模 型 比 较 简 单 由 于 规 则 集 的 这 种 工 作 方 式, 其 属 性 与 决 策 树 的 属 性 不 同 最 重 要 的 区 别 是, 使 用 规 则 集 时, 可 以 为 任 意 特 定 记 录 应 用 多 个 规 则, 也 可 以 不 应 用 任 何 规 则 如 果 应 用 多 个 规 则, 则 每 个 规 则 将 根 据 与 此 规 则 关 联 的 置 信 度 获 得 一 个 加 权 投 票, 并 通 过 组 合 应 用 到 所 讨 论 记 录 的 所 有 规 则 的 加 权 投 票 来 确 定 最 终 的 预 测 如 果 没 有 规 则 可 应 用, 则 会 将 默 认 预 测 分 配 到 该 记 录 示 例 医 学 研 究 员 已 收 集 了 一 组 患 有 同 一 疾 病 的 患 者 的 数 据 在 治 疗 过 程 中, 每 位 患 者 均 对 五 种 药 物 中 的 一 种 有 明 显 反 应 可 以 使 用 C5.0 模 型 连 同 其 他 节 点 来 为 以 后 患 有 同 一 疾 病 的 患 者 寻 找 最 适 合 其 的 药 物 有 关 详 细 信 息, 请 参 阅 第 9 章 中 的 药 物 治 疗 ( 勘 察 表 /C5.0) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 要 求 要 训 练 C5.0 模 型, 必 须 有 一 个 分 类 ( 即 名 义 或 有 序 ) 目 标 字 段 和 一 个 或 多 个 任 意 类 型 的 输 入 字 段 设 置 为 双 向 或 无 的 字 段 将 忽 略 必 须 对 模 型 中 使 用 的 字 段 的 类 型 完 全 实 例 化 还 可 以 指 定 加 权 字 段 强 度 对 于 所 存 在 的 问 题, 例 如 缺 失 数 据 和 大 量 输 入 字 段,C5.0 模 型 十 分 稳 健 这 些 模 型 通 常 不 需 要 花 费 很 长 的 训 练 时 间 用 于 估 计 此 外,C5.0 模 型 与 某 些 其 他 模 型 类 型 相 比 似 乎 更 容 易 理 解, 因 为 源 自 模 型 的 规 则 解 释 起 来 更 简 明 易 懂 C5.0 还 提 供 功 能 强 大 的 推 进 方 法 来 提 高 分 类 的 准 确 性 注 : 启 用 并 行 处 理 有 益 于 提 高 C5.0 模 型 构 建 速 度 有 关 详 细 信 息, 请 参 阅 第 中 的 设 置 优 化 选 项 中 的 IBM SPSS Modeler 14.2 用 户 指 南 12 章

160 148 章 6 C5.0 节 点 模 型 选 项 图 片 6-35 C5.0 节 点 模 型 选 项 模 型 名 称 指 定 要 生 成 的 模 型 的 名 称 自 动 选 中 此 选 项 将 根 据 目 标 字 段 名 称 自 动 生 成 模 型 名 称 这 是 默 认 值 自 定 义 选 中 此 选 项 可 以 为 由 此 节 点 创 建 的 模 型 块 指 定 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 输 出 类 型 在 此 指 定 希 望 结 果 模 型 块 是 决 策 树 还 是 规 则 集 群 体 字 符 如 果 选 中 此 选 项,C5.0 将 试 图 组 合 输 出 字 段 中 具 有 相 似 样 式 的 符 号 值 如 果 未 选 中 此 选 项,C5.0 将 为 用 于 分 割 父 节 点 的 符 号 字 段 的 每 个 值 创 建 一 个 子 节 点 例 如, 如 果 C5.0 分 割 的 是 颜 色 字 段 ( 其 值 为 红 色 绿 色 和 蓝 色 ), 则 它 将 默 认 创 建 一 个 三 向 分 割 但 是, 如 果 选 中 此 选 项, 且 颜 色 = 红 色 的 记 录 与 颜 色 = 蓝 色 的 记 录 非 常 相 似, 则 C5.0 将 创 建 一 个 双 向 分 割, 其 中 所 有 绿 色 记 录 在 一 个 组 中, 而 所 有 蓝 色 记 录 连 同 所 有 红 色 记 录 在 另 一 个 组 中 使 用 推 进 C5.0 算 法 有 一 个 特 殊 的 方 法 用 于 提 高 其 准 确 率, 称 为 推 进 它 的 工 作 原 理 是 在 序 列 中 构 建 多 个 模 型 第 一 个 模 型 按 常 规 方 式 进 行 构 建 构 建 第 二 个 模 型 时, 将 焦 点 集 中 于 由 第 一 个 模 型 误 分 类 的 记 录 构 建 第 三 个 模 型 时, 将 焦 点 集 中 于 第 二 个

161 149 决 策 树 模 型 的 错 误, 依 此 类 推 最 后, 通 过 将 整 个 模 型 集 应 用 到 观 测 值, 并 使 用 加 权 投 票 过 程 将 单 独 的 预 测 组 合 为 一 个 总 预 测 来 分 类 观 测 值 推 进 可 以 显 著 提 高 C5.0 模 型 的 准 确 性, 但 也 需 要 更 长 的 训 练 时 间 通 过 尝 试 次 数 选 项 可 以 控 制 在 推 进 模 型 过 程 中 使 用 的 模 型 数 目 此 功 能 基 于 对 Freund & Schapire 的 研 究, 使 用 其 中 的 专 有 改 进 功 能 可 以 更 好 地 处 理 噪 声 数 据 交 互 验 证 如 果 选 中 此 选 项,C5.0 将 使 用 一 组 模 型 ( 根 据 训 练 数 据 的 子 集 构 建 ) 来 估 计 某 个 模 型 ( 根 据 全 部 数 据 集 构 建 ) 的 准 确 性 如 果 数 据 集 太 小 以 致 于 无 法 将 其 分 割 为 传 统 的 训 练 集 合 和 测 试 集 合, 此 选 项 非 常 有 用 在 计 算 准 确 性 评 估 后, 交 互 验 证 模 型 将 被 丢 弃 可 以 指 定 用 于 交 互 验 证 的 折 叠 次 数 或 模 型 数 注 意, 在 IBM SPSS Modeler 以 前 的 版 本 中, 构 建 模 型 和 交 互 验 证 模 型 是 两 个 单 独 的 操 作 在 当 前 的 版 本 中, 则 无 需 执 行 单 独 的 模 型 构 建 步 骤 模 型 构 建 和 交 互 验 证 将 同 时 执 行 众 数 对 于 简 单 训 练, 大 部 分 C5.0 参 数 都 自 动 设 置 专 家 训 练 允 许 您 更 直 接 地 控 制 训 练 参 数 简 单 模 式 选 项 支 持 默 认 情 况 下,C5.0 将 试 图 生 成 尽 可 能 精 确 的 树 在 某 些 情 况 下, 此 操 作 可 能 会 导 致 过 度 拟 合, 从 而 在 将 此 模 型 应 用 于 新 数 据 时 导 致 性 能 偏 低 选 择 普 遍 性 以 使 用 受 此 问 题 影 响 较 小 的 算 法 设 置 注 意 : 选 中 普 遍 性 选 项 后, 不 能 保 证 所 构 建 模 型 的 通 用 性 一 定 会 比 其 他 模 型 好 当 普 遍 性 问 题 比 较 严 重 时, 通 常 可 使 用 保 留 检 验 样 本 验 证 模 型 预 期 的 噪 声 (%) 指 定 训 练 集 合 中 噪 声 数 据 或 错 误 数 据 的 预 期 比 例 专 家 模 式 选 项 修 剪 严 重 性 确 定 对 决 策 树 或 规 则 集 的 修 剪 程 度 增 加 该 值 可 获 得 一 个 更 简 洁 的 小 型 树 减 小 该 值 可 获 得 一 个 更 精 确 的 树 此 设 置 仅 影 响 本 地 修 剪 ( 请 参 阅 下 面 的 使 用 全 局 修 剪 ) 每 个 子 分 支 的 最 小 记 录 数 可 使 用 子 组 的 大 小 限 制 树 的 任 何 分 支 中 的 分 割 数 仅 当 两 个 或 多 个 生 成 的 子 分 支 中 至 少 包 含 从 训 练 集 合 得 到 的 这 一 最 小 记 录 数 时, 才 可 分 割 树 的 分 支 默 认 值 为 2 增 加 该 值 有 助 于 防 止 使 用 噪 声 数 据 进 行 过 度 训 练 使 用 全 局 修 剪 分 两 个 阶 段 修 剪 树 : 第 一 个 阶 段 是 本 地 修 剪, 此 时 将 检 查 子 树 并 折 叠 分 支 以 提 高 模 型 的 准 确 性 第 二 个 阶 段 是 全 局 修 剪, 在 此 阶 段 中 将 把 树 视 作 一 个 整 体 并 折 叠 虚 弱 的 子 树 默 认 情 况 下 将 执 行 全 局 修 剪 要 忽 略 全 局 修 剪 阶 段, 请 取 消 选 中 此 选 项 辨 别 属 性 如 果 选 中 此 选 项,C5.0 将 在 开 始 构 建 模 型 之 前 检 查 预 测 变 量 的 有 效 性 如 果 发 现 不 相 关 的 预 测 变 量, 则 会 将 其 从 模 型 构 建 过 程 中 排 除 此 选 项 对 于 具 有 许 多 预 测 变 量 字 段 的 模 型 非 常 有 用, 并 且 有 助 于 防 止 过 度 拟 合 注 : 启 用 并 行 处 理 有 益 于 提 高 C5.0 模 型 构 建 速 度 有 关 详 细 信 息, 请 参 阅 第 中 的 设 置 优 化 选 项 中 的 IBM SPSS Modeler 14.2 用 户 指 南 12 章

162 150 章 6 决 策 树 模 型 块 决 策 树 模 型 块 表 示 用 于 预 测 特 定 输 出 字 段 的 树 结 构, 该 树 结 构 可 由 以 下 决 策 树 建 模 节 点 之 一 发 现 :IBM SPSS Modeler 以 前 版 本 中 的 C&R 树 CHAID QUEST C5.0 或 构 建 规 则 ) 树 模 型 可 以 直 接 从 树 构 建 节 点 中 生 成, 也 可 以 从 交 互 树 构 建 器 中 间 接 生 成 有 关 详 细 信 息, 请 参 阅 第 107 页 码 交 互 树 构 建 器 评 分 树 模 型 运 行 包 含 树 模 型 块 的 流 时, 特 定 的 结 果 取 决 于 树 的 类 型 对 于 分 类 树 ( 分 类 目 标 ), 会 将 两 个 新 字 段 ( 其 中 分 别 包 含 每 个 记 录 的 预 测 值 和 置 信 度 ) 添 加 到 数 据 中 预 测 取 决 于 为 其 分 配 记 录 的 终 端 节 点 的 使 用 最 频 繁 的 类 别 ; 如 果 在 给 定 节 点 中 大 多 数 响 应 为 是, 则 对 分 配 到 该 节 点 的 所 有 记 录 的 预 测 也 为 是 对 于 回 归 树, 仅 生 成 预 测 值 ; 而 不 会 分 配 置 信 度 另 外, 对 于 CHAID QUEST 和 C&R 树 模 型, 也 可 以 添 加 表 示 节 点 ID 的 附 加 字 段, 每 个 记 录 都 将 分 配 到 此 节 点 中 新 的 字 段 名 称 将 通 过 为 模 型 名 称 添 加 前 缀 生 成 对 于 C&R 树 CHAID 和 QUEST, 预 测 字 段 的 前 缀 是 $R-, 置 信 度 字 段 的 前 缀 是 $RC-, 节 点 标 识 符 字 段 的 前 缀 是 $RI- 对 于 C5.0 树, 预 测 字 段 的 前 缀 是 $C-, 置 信 度 字 段 的 前 缀 是 $CC- 如 果 存 在 多 个 树 模 型 节 点, 则 必 要 时 可 在 新 字 段 名 称 的 前 缀 中 添 加 数 字 以 进 行 区 分 - 例 如,$R1- $RC1- 和 $R2- 等 等 使 用 树 模 型 块 可 以 多 种 方 式 保 存 或 导 出 与 模 型 相 关 的 信 息 注 意 : 其 中 的 许 多 选 项 也 适 用 于 树 构 建 器 窗 口 通 过 树 构 建 器 或 树 模 型 块, 可 以 执 行 下 列 操 作 : 根 据 当 前 的 树 生 成 过 滤 节 点 或 选 择 节 点 有 关 详 细 信 息, 请 参 阅 第 126 页 码 生 成 过 滤 节 点 和 选 择 节 点 生 成 一 个 规 则 集 块, 该 节 点 将 树 结 构 表 示 成 一 组 定 义 了 树 的 终 端 分 支 的 规 则 有 关 详 细 信 息, 请 参 阅 第 126 页 码 从 决 策 树 中 生 成 规 则 集 此 外, 还 可 以 按 PMML 格 式 导 出 模 型 ( 仅 限 于 树 模 型 块 ) 有 关 详 细 信 息, 请 参 阅 第 41 页 码 第 3 章 中 的 模 型 选 项 板 如 果 模 型 包 含 定 制 分 割, 则 不 会 在 导 出 的 PMML 中 保 留 此 信 息 ( 保 留 分 割, 但 不 保 留 它 是 定 制 分 割 而 不 是 通 过 算 法 选 择 的 分 割 这 一 事 实 ) 基 于 当 前 树 的 所 选 部 分 生 成 图 形 注 : 这 仅 在 块 附 加 到 流 中 的 其 他 节 点 时 才 有 效 有 关 详 细 信 息, 请 参 阅 第 158 页 码 生 成 图 形 仅 在 增 强 型 C5.0 模 型 中, 可 以 选 择 单 一 决 策 树 ( 工 作 区 ) 或 单 一 决 策 树 (GM 选 项 板 ) 以 根 据 当 前 选 定 的 规 则 创 建 一 个 新 的 规 则 集 有 关 详 细 信 息, 请 参 阅 第 158 页 码 增 强 型 C5.0 模 型 注 意 : 虽 然 构 建 规 则 节 点 已 由 C&R 树 节 点 所 替 代, 但 现 有 流 中 最 初 使 用 构 建 规 则 节 点 创 建 的 决 策 树 节 点 仍 可 正 常 工 作

163 151 决 策 树 单 个 树 模 型 块 如 果 在 建 模 节 点 上 选 择 构 建 单 个 树 作 为 主 目 标, 则 结 果 模 型 块 包 含 下 列 选 项 卡 Tab 描 述 其 他 信 息 模 型 显 示 定 义 模 型 的 规 则 有 关 详 细 信 息, 请 参 阅 第 151 页 码 决 策 树 模 型 规 则 查 看 器 显 示 模 型 的 树 视 图 有 关 详 细 信 息, 请 参 阅 第 154 页 码 决 策 树 模 型 查 看 器 摘 要 设 置 注 解 显 示 有 关 字 段 构 建 设 置 和 模 型 评 估 过 程 的 信 息 允 许 您 指 定 模 型 评 分 期 间 的 置 信 度 与 SQL 生 成 相 关 选 项 允 许 您 添 加 描 述 性 注 解, 指 定 自 定 义 名 称, 添 加 工 具 提 示 文 本, 以 及 指 定 模 型 的 搜 索 关 键 字 有 关 详 细 信 息, 请 参 阅 第 44 页 码 第 3 章 中 的 模 型 块 概 要 / 信 息 有 关 详 细 信 息, 请 参 阅 第 155 页 码 决 策 树 / 规 则 集 模 型 块 设 置 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 注 解 中 的 IBM SPSS Modeler 14.2 用 户 指 南 决 策 树 模 型 规 则 决 策 树 模 型 块 的 模 型 选 项 卡 显 示 定 义 该 模 型 的 规 则 此 外, 还 可 以 显 示 预 测 变 量 重 要 性 的 图 形 和 包 含 有 关 历 史 频 率 和 代 用 项 信 息 的 第 三 个 面 板 注 意 : 如 果 您 在 CHAID 节 点 构 建 选 项 选 项 卡 ( 目 标 面 板 ) 上 选 中 为 超 大 型 数 据 集 创 建 模 型 选 项, 则 模 型 选 项 卡 只 显 示 树 规 则 详 细 信 息

164 152 章 6 图 片 6-36 决 策 树 模 型 块 树 规 则 左 侧 面 板 显 示 了 条 件 列 表, 这 些 条 件 定 义 算 法 发 现 的 数 据 的 分 区 - 本 质 上 是 一 系 列 规 则, 可 基 于 不 同 预 测 变 量 的 值 将 单 个 记 录 分 配 给 子 节 点 决 策 树 基 于 输 入 字 段 值 的 对 数 据 进 行 递 归 分 区 数 据 分 区 称 为 分 支 初 始 分 支 ( 有 时 称 为 根 ) 包 含 所 有 数 据 记 录 根 将 根 据 特 定 输 入 字 段 的 值 被 分 成 若 干 子 集 或 子 分 支 每 个 子 分 支 可 以 进 一 步 分 割 成 次 级 子 分 支, 次 级 子 分 支 还 可 进 一 步 分 割, 如 此 类 推 不 再 分 割 的 分 支 是 树 的 最 底 层 分 支 这 样 的 分 支 称 为 终 端 分 支 ( 或 叶 片 ) 规 则 浏 览 器 显 示 了 输 入 值, 输 入 值 定 义 了 每 个 分 区 或 分 支 以 及 这 些 分 割 中 记 录 的 输 出 字 段 值 概 要 有 关 使 用 模 型 浏 览 器 的 一 般 信 息, 请 参 阅 浏 览 模 型 块 对 于 基 于 数 值 型 字 段 的 分 割, 分 支 将 以 下 行 所 示 的 形 式 显 示 : fieldname relation value [summary] 这 里 的 relation 是 数 值 型 关 系 例 如, 由 revenue 字 段 大 于 100 的 值 所 定 义 的 分 支 将 显 示 为 如 下 形 式 : revenue > 100 [summary]

165 153 决 策 树 对 于 基 于 符 号 型 字 段 的 分 割, 分 支 将 以 下 行 所 示 的 形 式 显 示 : fieldname = value [summary] or fieldname in [values] [summary] 这 里 的 values 表 示 定 义 分 支 的 字 段 值 例 如, 包 含 region 字 段 值 为 North West 或 South 的 记 录 的 分 支 将 以 如 下 形 式 表 示 : region in ["North" "West" "South"] [summary] 终 端 分 支 也 将 进 行 预 测, 同 时 会 在 规 则 条 件 的 尾 部 添 加 箭 头 和 预 测 值 例 如, 定 义 时 revenue > 100 且 预 测 输 出 字 段 值 为 high 的 叶 片 将 显 示 如 下 : revenue > 100 [Mode:high] high 数 值 型 和 符 号 型 输 出 字 段 的 分 支 概 要 定 义 有 所 不 同 对 于 含 有 数 值 型 输 出 字 段 的 树, 分 支 的 平 均 值 便 是 概 要, 分 支 的 效 应 便 是 分 支 平 均 值 与 其 父 分 支 平 均 值 的 差 对 于 含 有 符 号 型 输 出 字 段 的 树, 分 支 中 记 录 的 中 位 数 ( 或 出 现 频 率 最 高 的 值 ) 便 是 概 要 要 完 全 描 述 分 支, 需 要 包 含 定 义 分 支 的 条 件 以 及 定 义 树 中 更 深 层 分 割 的 条 件 例 如, 在 树 中 : revenue > 100 region = "North" region in ["South" "East" "West"] revenue <= 200 第 二 行 所 表 示 的 分 支 由 条 件 revenue > 100 和 region = North 进 行 定 义 如 果 单 击 工 具 栏 上 的 显 示 实 例 / 置 信 度, 则 每 条 规 则 还 将 显 示 其 所 适 用 的 记 录 数 ( 实 例 数 ) 和 规 则 为 真 的 录 所 占 的 比 例 ( 置 信 度 ) 预 测 变 量 重 要 性 另 外, 模 型 选 项 卡 上 还 可 能 显 示 表 示 评 估 模 型 时 每 个 预 测 变 量 相 对 重 要 性 的 图 表 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 注 意, 只 有 在 生 成 模 型 之 前 选 中 分 析 选 项 卡 上 的 计 算 预 测 变 量 重 要 性, 才 可 以 使 用 此 图 表 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 其 他 模 型 信 息 如 果 单 击 工 具 栏 中 的 显 示 其 他 信 息 面 板, 您 将 在 窗 口 底 部 看 到 显 示 选 定 规 则 详 细 信 息 的 面 板 信 息 面 板 包 含 三 个 选 项 卡 图 片 6-37 信 息 面 板 上 显 示 的 代 用 项 历 史 此 选 项 卡 追 踪 从 根 节 点 至 选 定 节 点 的 分 割 条 件 从 而 给 出 了 一 个 条 件 列 表, 据 此 可 以 判 断 出 记 录 何 时 分 配 给 了 选 定 节 点 所 有 条 件 均 为 真 的 记 录 将 分 配 给 此 节 点

166 154 章 6 频 率 对 于 含 符 号 目 标 字 段 的 模 型 而 言, 此 选 项 卡 ( 为 每 个 可 能 的 目 标 值 ) 显 示 了 分 配 给 包 含 目 标 值 ( 训 练 数 据 中 ) 节 点 的 记 录 数 还 将 显 示 频 率 图 ( 显 示 为 最 多 三 位 小 数 的 百 分 比 ) 对 于 含 数 值 型 目 标 的 模 型, 此 选 项 卡 为 空 代 用 项 如 果 适 用, 则 会 针 对 所 选 节 点 显 示 主 要 分 割 字 段 的 所 有 代 用 项 代 用 项 是 在 给 定 记 录 的 主 要 预 测 变 量 值 缺 失 时 使 用 的 替 代 字 段 给 定 分 割 允 许 的 最 大 代 用 项 数 在 树 构 建 节 点 中 指 定, 但 实 际 数 量 取 决 于 训 练 数 据 一 般 来 讲, 缺 失 数 据 越 多, 可 能 使 用 的 代 用 项 越 多 对 于 其 他 决 策 树 模 型, 此 选 项 卡 为 空 注 : 要 在 模 型 中 包 含 代 用 项, 必 须 在 训 练 阶 段 对 其 进 行 标 识 如 果 训 练 样 本 没 有 缺 失 值, 则 不 会 标 识 任 何 代 用 项 ; 在 测 试 或 评 分 过 程 中 遇 到 的 具 有 缺 失 值 的 所 有 记 录 将 自 动 落 入 记 录 数 最 大 的 子 节 点 如 果 在 测 试 或 评 分 过 程 中 预 期 出 现 缺 失 值, 请 确 保 值 在 训 练 样 本 中 也 处 于 缺 失 状 态 代 用 项 对 于 CHAID 树 不 可 用 决 策 树 模 型 查 看 器 决 策 树 模 型 块 的 查 看 器 选 项 卡 类 似 于 树 构 建 器 中 的 显 示 主 要 的 区 别 是 当 浏 览 模 型 块 时, 无 法 生 成 或 修 改 树 两 个 组 件 中 用 于 查 看 和 自 定 义 显 示 的 其 他 选 项 都 类 似 有 关 详 细 信 息, 请 参 阅 第 113 页 码 自 定 义 树 状 视 图 注 意 : 对 于 您 在 构 建 选 项 选 项 卡 的 目 标 面 板 上 选 中 为 超 大 型 数 据 集 创 建 模 型 选 项 时 构 建 的 CHAID 模 型 块, 不 显 示 查 看 器 选 项 卡 图 片 6-38 带 树 映 射 窗 口 的 决 策 树 查 看 器 选 项 卡

167 155 决 策 树 查 看 查 看 器 选 项 卡 上 的 分 割 规 则 时, 方 括 号 表 示 临 界 值 包 含 在 范 围 中, 而 圆 括 号 表 示 临 界 值 不 包 含 在 范 围 中 因 此, 表 达 式 (23,37] 表 示 从 23( 不 含 ) 到 37( 含 ); 即 从 23 以 上 到 37 在 模 型 选 项 卡 上, 相 同 的 情 况 显 示 为 : Age > 23 and Age <= 37 图 片 6-39 查 看 器 选 项 卡 上 显 示 的 分 割 规 则 决 策 树 / 规 则 集 模 型 块 设 置 使 用 决 策 树 或 规 则 集 模 型 块 的 设 置 选 项 卡, 可 以 在 模 型 评 分 期 间 为 置 信 度 及 SQL 生 成 指 定 选 项 只 有 将 模 型 块 添 加 到 流 之 后, 此 选 项 卡 才 可 用

168 156 章 6 图 片 6-40 决 策 树 模 型 块 设 置 计 算 置 信 度 选 中 此 选 项 以 便 在 评 分 操 作 中 包 括 置 信 度 在 数 据 库 中 评 分 模 型 时, 排 除 置 信 度 有 助 于 生 成 更 有 效 的 SQL 不 会 为 回 归 树 分 配 置 信 度 注 意 : 如 果 您 在 CHAID 模 型 构 建 选 项 选 项 卡 的 方 法 面 板 上 选 中 为 超 大 型 数 据 集 创 建 模 型 选 项, 此 复 选 框 仅 在 名 义 或 标 志 分 类 目 标 的 模 型 块 中 可 用 计 算 原 始 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回 是 或 否 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 除 了 这 些 得 分, 还 有 其 他 在 评 分 过 程 中 生 成 的 预 测 值 和 置 信 度 值 注 意 : 如 果 您 在 CHAID 模 型 构 建 选 项 选 项 卡 的 方 法 窗 格 上 选 中 为 超 大 型 数 据 集 创 建 模 型 选 项, 此 复 选 框 仅 在 标 志 分 类 目 标 的 模 型 块 中 可 用 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 得 分 仅 依 赖 于 训 练 数 据, 并 且 由 于 许 多 模 型 过 度 拟 合 此 数 据 的 倾 向, 该 得 分 可 能 会 过 度 优 化 调 整 后 的 倾 向 会 尝 试 通 过 针 对 检 验 或 验 证 分 区 对 模 型 性 能 进 行 评 估 进 行 弥 补 此 选 项 要 求 在 流 中 定 义 分 区 字 段 并 且 在 生 成 模 型 之 前 在 建 模 节 点 中 启 用 调 整 的 倾 向 得 分 注 意 : 调 整 后 的 倾 向 得 分 不 适 用 于 增 强 型 树 和 规 则 集 模 型 有 关 详 细 信 息, 请 参 阅 第 158 页 码 增 强 型 C5.0 模 型 规 则 ID 对 于 CHAID QUEST 和 C&R 树 模 型, 此 选 项 可 在 得 分 输 出 中 添 加 表 示 终 端 节 点 ID 的 字 段, 每 个 记 录 都 将 分 配 到 此 终 端 节 点 中 注 意 : 选 中 此 选 项 时,SQL 生 成 不 可 用

169 157 决 策 树 生 成 此 模 型 的 SQL 使 用 数 据 库 中 的 数 据 时,SQL 代 码 可 传 回 到 数 据 库 中 执 行, 从 而 大 大 提 高 许 多 操 作 的 处 理 速 度 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 SQL 优 化 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南 选 中 下 列 其 中 一 个 选 项 可 启 用 或 禁 用 SQL 生 成 不 生 成 选 中 此 选 项 为 模 型 禁 用 SQL 生 成 在 无 缺 失 值 支 持 的 情 况 下 生 成 选 中 此 选 项 可 以 启 用 SQL 生 成, 而 不 必 经 常 处 理 缺 失 值 如 果 在 评 分 观 测 值 时 遇 到 缺 失 值, 则 此 选 项 会 将 预 测 设 置 为 Null 值 ($null$) 注 意 : 此 选 项 对 于 CHAID 模 型 不 适 用 对 于 其 他 模 型 类 型, 此 选 项 仅 适 用 于 决 策 树 ( 而 非 规 则 集 ) 在 缺 失 值 支 持 的 情 况 下 生 成 对 于 CHAID QUEST 和 C&R 树 模 型, 可 在 支 持 全 部 缺 失 值 的 情 况 下 启 用 SQL 生 成 因 此, 生 成 SQL 意 味 着 已 按 模 型 中 指 定 的 方 式 处 理 缺 失 值 例 如,C&R 树 可 使 用 代 用 项 规 则 和 最 大 子 退 回 注 意 : 对 于 C5.0 模 型, 此 选 项 仅 适 用 于 规 则 集 ( 而 非 决 策 树 )

170 158 章 6 增 强 型 C5.0 模 型 图 片 6-41 增 强 型 C5.0 模 型 块 模 型 选 项 卡 创 建 增 强 型 C5.0 模 型 ( 规 则 集 或 决 策 树 ) 时, 实 际 上 创 建 了 一 组 相 关 模 型 增 强 型 C5.0 模 型 的 模 型 规 则 浏 览 器 可 显 示 位 于 层 次 顶 层 的 模 型 的 列 表, 以 及 每 个 模 型 的 估 计 准 确 性 和 增 强 型 模 型 整 体 的 总 体 准 确 性 要 检 查 特 定 模 型 的 规 则 或 分 割, 可 选 择 并 根 据 在 单 模 型 中 扩 展 规 则 或 分 支 的 方 式 扩 展 该 模 型 也 可 以 从 增 强 型 模 型 集 中 提 取 特 定 的 模 型 并 创 建 恰 好 包 含 此 模 型 的 新 规 则 集 模 型 块 要 从 增 强 型 C5.0 模 型 中 创 建 新 的 规 则 集, 可 选 择 所 需 规 则 集 或 树, 并 从 生 成 菜 单 中 选 择 单 一 决 策 树 (GM 选 项 板 ) 或 单 一 决 策 树 ( 工 作 区 ) 生 成 图 形 树 节 点 提 供 了 大 量 信 息, 但 对 商 业 用 户 来 说, 它 可 能 并 不 始 终 是 一 种 方 便 访 问 的 格 式 要 使 提 供 的 数 据 便 于 纳 入 商 业 报 表 和 演 示 文 稿, 您 可 生 成 所 选 数 据 的 图 形 例 如, 从 模 型 块 的 模 型 或 查 看 器 选 项 卡, 或 从 交 互 树 的 查 看 器 选 项 卡, 您 可 以 生 成 树 的 选 定 部 分 的 图 形, 因 此 只 创 建 选 定 树 或 分 支 节 点 中 个 案 的 图 形

171 159 决 策 树 注 意 : 当 模 型 块 附 加 到 流 中 的 其 他 节 点 时, 您 只 能 从 模 型 块 生 成 图 形 生 成 图 形 第 一 步 是 选 择 要 显 示 在 图 形 上 的 信 息 : 在 块 的 模 型 选 项 卡 上, 展 开 左 侧 窗 格 中 的 条 件 和 规 则 列 表, 并 选 择 所 需 的 一 项 在 块 的 查 看 器 选 项 卡 上, 展 开 分 支 列 表, 并 选 择 所 需 的 节 点 在 交 互 树 的 查 看 器 选 项 卡 上, 展 开 分 支 列 表, 并 选 择 所 需 的 节 点 注 意 : 您 无 法 选 择 两 个 查 看 器 选 项 卡 上 的 顶 部 节 点 不 管 您 选 择 以 何 种 方 式 显 示 数 据, 创 建 图 形 的 方 式 都 是 相 同 的 : E 从 生 成 菜 单 选 择 图 形 ( 从 选 择 ); 或 者 在 查 看 器 选 项 卡 上 单 击 左 下 角 处 的 图 形 ( 从 选 择 ) 按 钮 显 示 图 形 板 基 本 选 项 卡 图 片 6-42 图 形 板 节 点 对 话 框, 基 本 选 项 卡 注 意 : 当 您 以 此 方 式 显 示 图 形 板 时, 只 有 基 本 和 详 细 选 项 卡 可 用 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 图 形 板 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点

172 160 章 6 E 使 用 基 本 或 详 细 选 项 卡 设 置 指 定 在 图 形 上 显 示 的 详 细 信 息 E 单 击 确 定 生 成 图 形 图 片 6-43 从 图 形 板 基 本 选 项 卡 生 成 的 直 方 图 图 形 标 题 标 识 所 包 含 的 选 定 节 点 或 规 则 用 于 推 进 bagging 和 超 大 型 数 据 集 的 模 型 块 如 果 在 建 模 节 点 上 选 择 增 强 模 型 准 确 性 ( 推 进 ) 增 强 模 型 稳 定 性 (bagging) 或 为 超 大 型 数 据 集 创 建 模 型 作 为 主 目 标, 则 IBM SPSS Modeler 会 构 建 多 个 模 型 的 整 体 有 关 详 细 信 息, 请 参 阅 第 48 页 码 第 3 章 中 的 整 体 模 型 结 果 模 型 块 包 含 下 列 选 项 卡 模 型 选 项 卡 提 供 模 型 的 多 个 不 同 视 图 Tab 视 图 描 述 其 他 信 息 模 型 模 型 概 要 显 示 整 体 质 量 和 ( 增 强 型 有 关 详 细 信 息, 请 参 阅 第 模 型 与 连 续 目 标 除 外 ) 多 49 页 码 第 3 章 中 的 模 样 性 概 要, 多 样 性 是 对 不 同 模 型 之 间 预 测 结 果 变 化 情 况 的 测 量 型 摘 要 预 测 变 量 重 要 性 显 示 一 个 图 表, 以 指 示 在 估 计 模 型 时 所 使 用 的 各 个 预 测 变 量 ( 输 入 字 段 ) 的 相 对 重 要 性 有 关 详 细 信 息, 请 参 阅 第 50 页 码 第 3 章 中 的 预 测 变 量 重 要 性

173 161 决 策 树 Tab 视 图 描 述 其 他 信 息 设 置 预 测 变 量 频 率 组 件 模 型 准 确 性 组 件 模 型 详 细 信 息 信 息 显 示 一 个 图 表, 以 显 在 一 组 模 型 中 与 每 个 预 测 变 量 配 合 使 用 的 相 对 频 率 图 表 绘 制 整 体 中 每 个 不 同 模 型 的 预 测 准 确 性 图 表 显 示 整 体 中 每 个 不 同 模 型 的 相 关 信 息 显 示 有 关 字 段 构 建 设 置 和 模 型 评 估 过 程 的 信 息 允 许 您 在 评 分 操 作 中 包 括 置 信 度 注 解 允 许 您 添 加 描 述 性 注 解, 指 定 自 定 义 名 称, 添 加 工 具 提 示 文 本, 以 及 指 定 模 型 的 搜 索 关 键 字 有 关 详 细 信 息, 请 参 阅 第 51 页 码 第 3 章 中 的 预 测 变 量 频 率 有 关 详 细 信 息, 请 参 阅 第 54 页 码 第 3 章 中 的 组 件 模 型 详 细 信 息 有 关 详 细 信 息, 请 参 阅 第 44 页 码 第 3 章 中 的 模 型 块 概 要 / 信 息 有 关 详 细 信 息, 请 参 阅 第 155 页 码 决 策 树 / 规 则 集 模 型 块 设 置 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 注 解 中 的 IBM SPSS Modeler 14.2 用 户 指 南 规 则 集 模 型 块 规 则 集 模 型 块 表 示 用 于 预 测 特 定 输 出 字 段 的 规 则, 该 规 则 可 由 Apriori 中 的 关 联 规 则 建 模 节 点 发 现, 也 可 由 C&R 树 CHAID QUEST 或 C5.0 中 的 任 一 树 构 建 节 点 发 现 对 于 关 联 规 则, 必 须 从 非 精 练 规 则 块 中 生 成 规 则 集 对 于 树, 可 以 从 树 构 建 器 C5.0 模 型 构 建 节 点 或 任 何 树 模 型 块 中 生 成 规 则 集 与 非 精 练 规 则 块 不 同, 可 将 规 则 集 块 放 置 在 流 中 以 生 成 预 测 运 行 包 含 规 则 集 块 的 流 时, 会 将 两 个 新 字 段 ( 其 中 分 别 包 含 每 个 记 录 的 预 测 值 和 置 信 度 ) 添 加 到 流 中 新 的 字 段 名 称 将 通 过 为 模 型 名 称 添 加 前 缀 生 成 对 于 关 联 规 则 集, 预 测 字 段 的 前 缀 是 $A-, 置 信 度 字 段 的 前 缀 是 $AC- 对 于 C5.0 规 则 集, 预 测 字 段 的 前 缀 是 $C-, 置 信 度 字 段 的 前 缀 是 $CC- 对 于 C&R 树 规 则 集, 预 测 字 段 的 前 缀 是 $R-, 置 信 度 字 段 的 前 缀 是 $RC- 在 一 个 序 列 ( 可 预 测 相 同 的 输 出 字 段 ) 中 具 有 多 个 规 则 集 块 的 流 中, 新 的 字 段 名 称 将 包 括 数 字 前 缀, 以 便 将 这 些 名 称 区 别 开 来 流 中 的 第 一 个 关 联 规 则 集 块 将 使 用 普 通 的 名 称, 第 二 个 节 点 将 使 用 以 $A1- 和 $AC1- 开 头 的 名 称, 第 三 个 节 点 使 用 以 $A2- 和 $AC2- 开 头 的 名 称, 依 此 类 推 如 何 应 用 规 则 从 关 联 规 则 中 生 成 的 规 则 集 与 其 他 模 型 块 不 同, 因 为 对 于 任 何 特 定 记 录, 都 可 以 生 成 多 个 预 测, 且 这 些 预 测 可 能 并 不 一 致 可 使 用 两 种 方 法 从 规 则 集 中 生 成 预 测 注 意 : 不 论 选 择 哪 种 方 法, 从 决 策 树 中 生 成 的 规 则 集 都 会 返 回 相 同 的 结 果, 因 为 从 决 策 树 中 生 成 的 规 则 会 相 互 排 斥 投 票 此 方 法 试 图 组 合 对 应 用 到 记 录 的 所 有 规 则 的 预 测 对 于 每 个 记 录, 会 检 查 所 有 的 规 则, 并 使 用 应 用 于 该 记 录 的 每 个 规 则 生 成 一 个 预 测 和 一 个 关 联 置 信 度 为 每 个 输 出 值 计 算 置 信 度 图 表 的 总 和, 具 有 最 大 置 信 度 总 和 的 值 将 被 选 作 最 终 预 测 最 终 预 测 的 置 信 度 是 该 值 ( 由 应 用 于 该 记 录 的 规 则 数 划 分 ) 的 置 信 度 总 和 第 一 个 匹 配 项 此 方 法 仅 按 顺 序 测 试 规 则, 应 用 到 记 录 的 第 一 个 规 则 也 即 用 于 生 成 预 测 的 规 则

174 162 章 6 可 在 流 选 项 中 控 制 所 使 用 的 方 法 有 关 详 细 信 息, 请 参 阅 第 的 IBM SPSS Modeler 14.2 用 户 指 南 5 章 中 的 设 置 流 选 项 中 生 成 节 点 通 过 生 成 菜 单, 可 基 于 规 则 集 创 建 新 节 点 过 滤 节 点 创 建 新 的 过 滤 节 点 以 过 滤 规 则 集 中 的 规 则 所 不 使 用 的 字 段 选 择 节 点 创 建 新 的 选 择 节 点 来 选 择 选 定 规 则 要 应 用 的 记 录 生 成 的 节 点 将 选 择 所 应 用 规 则 的 所 有 条 件 均 为 真 的 记 录 此 选 项 需 要 选 定 一 个 规 则 规 则 追 踪 节 点 创 建 可 计 算 字 段 的 新 超 节 点, 用 来 表 示 对 每 个 记 录 进 行 预 测 时 所 使 用 的 规 则 当 使 用 第 一 个 匹 配 方 法 评 估 规 则 集 时, 仅 用 一 个 表 明 将 触 发 第 一 个 规 则 的 符 号 来 表 示 当 使 用 投 票 方 法 评 估 规 则 集 时, 则 用 一 个 显 示 投 票 机 制 的 输 入 的 复 杂 字 符 串 来 表 示 单 一 决 策 树 ( 工 作 区 )/ 单 一 决 策 树 (GM 选 项 板 ) 根 据 当 前 选 定 的 规 则 创 建 一 个 新 规 则 集 块 仅 适 用 于 增 强 型 C5.0 模 型 有 关 详 细 信 息, 请 参 阅 第 158 页 码 增 强 型 C5.0 模 型 模 型 到 调 色 板 将 模 型 返 回 到 模 型 选 项 板 当 有 同 事 发 给 您 包 含 模 型 的 流 而 不 是 模 型 本 身 时, 该 功 能 很 有 用 注 意 : 规 则 集 块 中 的 设 置 和 汇 总 选 项 卡 与 决 策 树 模 型 中 的 这 两 个 选 项 卡 完 全 相 同 规 则 集 模 型 选 项 卡 规 则 集 块 的 模 型 选 项 卡 中 显 示 由 算 法 从 数 据 中 提 取 的 规 则 列 表

175 163 决 策 树 图 片 6-44 规 则 集 模 型 块, 模 型 选 项 卡 规 则 按 后 项 ( 预 测 类 别 ) 划 分, 并 按 下 列 格 式 显 示 : 如 果 antecedent_1 andantecedent_2... andantecedent_n thenpredicted value

176 164 章 6 其 中 consequent 和 antecedent_1 - antecedent_n 都 是 条 件 该 规 则 可 解 释 为 对 于 antecedent_1 - antecedent_n 都 为 真 的 记 录,consequent 也 可 能 为 真 如 果 单 击 工 具 栏 上 的 显 示 实 例 / 置 信 度 按 钮, 则 每 个 规 则 还 将 显 示 有 关 应 用 该 规 则 的 条 件 为 真 的 记 录 的 数 目 信 息 ( 实 例 ), 及 整 个 规 则 为 真 的 记 录 的 比 例 信 息 ( 置 信 度 ) 注 意, 对 于 C5.0 规 则 集, 置 信 度 的 计 算 方 式 有 些 不 同 C5.0 使 用 下 列 公 式 计 算 规 则 的 置 信 度 : (1 + number of records where rule is correct) / (2 + number of records for which the rule's antecedents are true) 这 一 置 信 度 估 计 计 算 方 式 可 调 整 从 决 策 树 中 生 成 规 则 ( 即 C5.0 创 建 规 则 集 时 所 执 行 的 操 作 ) 的 过 程 从 AnswerTree 3.0 中 导 入 工 程 IBM SPSS Modeler 可 使 用 标 准 的 文 件 > 打 开 对 话 框 导 入 在 AnswerTree 3.0 或 3.1 中 保 存 的 工 程, 示 例 如 下 : E 从 SPSS Modeler 菜 单 中 选 择 : 文 件 > 打 开 流 E 从 文 件 类 型 下 拉 列 表 中 选 择 AT 工 程 文 件 (*.atp, *.ats) 使 用 下 列 节 点 将 导 入 的 每 个 工 程 转 换 到 SPSS Modeler 流 中 : 一 个 源 节 点, 它 可 定 义 所 使 用 的 数 据 源 ( 例 如,IBM SPSS Statistics 数 据 文 件 或 数 据 库 源 ) 对 于 工 程 中 的 每 个 树 ( 可 能 有 多 个 树 ), 将 创 建 一 个 类 型 节 点, 该 节 点 可 为 每 个 字 段 ( 变 量 ) 定 义 属 性, 包 括 类 型 角 色 ( 对 于 预 测 变 量 字 段 为 输 入, 对 于 预 测 字 段 为 输 出 ) 缺 失 值 及 其 他 选 项 对 于 工 程 中 的 每 个 树, 将 创 建 一 个 分 区 节 点, 该 节 点 可 将 数 据 分 区 为 训 练 样 本 或 测 试 样 本, 还 将 创 建 一 个 树 构 建 节 点, 该 节 点 可 定 义 生 成 树 (C&R 树 QUEST 或 CHAID 节 点 ) 的 参 数 E 要 查 看 生 成 的 树, 请 运 行 该 流 注 释 不 能 将 在 SPSS Modeler 中 生 成 的 决 策 树 导 出 到 AnswerTree 中 ; 从 AnswerTree 导 入 SPSS Modeler 是 一 个 单 向 过 程 将 工 程 导 入 到 SPSS Modeler 时, 无 法 保 留 在 AnswerTree 中 定 义 的 利 润

177 贝 叶 斯 网 络 模 型 章 7 贝 叶 斯 网 络 节 点 通 过 贝 叶 斯 网 络 节 点, 您 可 以 利 用 对 真 实 世 界 认 知 的 判 断 力 并 结 合 所 观 察 和 记 录 的 证 据, 通 过 使 用 看 似 不 相 关 的 属 性 建 立 事 件 发 生 的 几 率, 从 而 构 建 概 率 模 型 该 节 点 重 点 应 用 了 树 扩 展 简 单 贝 叶 斯 (TAN) 和 马 尔 可 夫 毯 网 络, 这 些 算 法 主 要 用 于 分 类 问 题 贝 叶 斯 网 络 可 用 于 在 许 多 不 同 的 情 况 下 进 行 预 测, 示 例 如 下 : 选 择 违 约 风 险 较 低 的 贷 款 时 机 根 据 传 感 器 输 入 数 据 和 现 有 记 录, 估 算 设 备 是 否 需 要 维 修 增 加 零 配 件 或 更 换 借 助 在 线 故 障 排 除 工 具 解 决 客 户 问 题 实 时 诊 断 并 排 除 移 动 电 话 网 络 故 障 评 估 研 发 项 目 的 潜 在 风 险 和 回 报, 以 在 最 佳 时 机 集 中 资 源 贝 叶 斯 网 络 是 一 种 图 形 模 型, 可 显 示 数 据 集 中 的 变 量 ( 通 常 称 之 为 节 点 ) 以 及 概 率, 还 可 以 显 示 这 些 变 量 之 间 的 条 件 和 独 立 性 贝 叶 斯 网 络 可 呈 现 节 点 之 间 的 因 果 关 系 ; 但 是, 网 络 中 的 链 接 ( 也 称 为 arcs) 没 有 必 要 呈 现 直 接 因 果 关 系 例 如, 当 指 出 是 否 存 在 某 些 症 状 并 提 供 其 他 的 相 关 数 据 时, 如 果 图 形 中 所 显 示 的 症 状 和 疾 病 之 间 的 概 率 独 立 性 属 实, 则 贝 叶 斯 网 络 可 用 来 计 算 患 者 患 有 某 种 特 殊 疾 病 的 几 率 这 种 网 络 非 常 稳 健, 即 使 在 信 息 缺 失 时, 也 可 以 利 用 现 有 的 任 何 信 息 作 出 最 佳 预 测 标 准 的 基 础 贝 叶 斯 网 络 示 例 由 Lauritzen 和 Spiegelhalter 于 1988 年 创 建 该 网 络 示 例 是 一 种 简 化 的 网 络 版 本, 通 常 称 作 Asia 模 型, 医 生 可 用 它 来 诊 断 新 患 者 的 病 情, 所 有 链 接 的 方 向 可 大 体 指 示 因 果 关 系 每 个 节 点 代 表 与 患 者 状 况 相 关 的 一 个 方 面, 例 如 吸 烟 表 示 这 些 患 者 确 为 吸 烟 者, 而 VisitAsia 表 示 他 们 最 近 是 否 去 过 亚 洲 概 率 关 系 由 所 有 节 点 之 间 的 链 接 指 示, 例 如, 吸 烟 会 增 大 患 者 患 有 支 气 管 炎 和 肺 癌 的 几 率, 而 年 龄 仅 与 肺 癌 的 患 病 率 相 关 同 样 地, 肺 部 x 光 检 查 的 异 常 结 果 可 能 是 由 肺 结 核 或 肺 癌 引 起 同 时, 如 果 患 者 本 身 患 有 肺 结 核 或 肺 癌, 则 其 更 有 可 能 呈 现 出 呼 吸 短 促 ( 呼 吸 困 难 ) 的 症 状 Copyright IBM Corporation 1994,

178 166 章 7 图 片 7-1 Lauritzen 和 Spegelhalter 的 Asia 网 络 示 例 以 下 是 您 有 可 能 决 定 使 用 贝 叶 斯 网 络 的 几 点 原 因 : 它 可 帮 助 您 了 解 因 果 关 系 由 此, 您 可 以 了 解 出 现 问 题 的 地 方 并 可 预 测 任 何 干 涉 可 能 引 发 的 后 果 该 网 络 可 提 供 避 免 数 据 过 度 拟 合 的 有 效 方 法 可 以 轻 松 地 观 测 到 所 涉 及 关 系 的 清 晰 视 图 要 求 目 标 字 段 必 须 为 分 类 且 测 量 级 别 为 名 义 有 序 或 标 志 输 入 内 容 可 以 为 任 何 类 型 的 字 段 连 续 ( 数 值 范 围 ) 输 入 字 段 将 自 动 分 级 ; 但 是, 如 果 分 布 出 现 不 对 称, 则 可 使 用 贝 叶 斯 网 络 节 点 之 前 的 分 级 节 点 对 字 段 进 行 手 动 分 级, 从 而 获 得 更 佳 的 效 果 例 如, 在 主 管 字 段 与 贝 叶 斯 网 络 节 点 目 标 字 段 相 同 的 位 置 处, 使 用 最 优 分 级 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 级 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 示 例 一 位 银 行 分 析 师 希 望 能 够 预 测 可 能 拖 欠 偿 还 贷 款 的 客 户 或 潜 在 客 户 您 可 使 用 贝 叶 斯 网 络 模 型 标 识 最 有 可 能 拖 欠 还 款 的 客 户 的 特 征, 并 由 此 构 建 几 种 不 同 类 型 的 模 型, 以 确 定 哪 种 类 型 可 以 最 好 地 预 测 潜 在 的 贷 款 拖 欠 者 有 关 详 细 信 息, 请 参 阅 第 18 章 中 的 预 测 贷 款 拖 欠 者 ( 贝 叶 斯 网 络 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 示 例 一 位 电 信 运 营 商 希 望 减 少 中 断 服 务 ( 又 称 为 流 失 ) 的 客 户 数 量, 并 使 用 上 一 个 月 的 数 据 对 模 型 每 月 进 行 更 新 您 可 以 使 用 贝 叶 斯 网 络 模 型 标 识 最 有 可 能 流 失 的 客 户 的 特 征, 然 后 每 月 使 用 新 数 据 继 续 训 练 该 模 型 有 关 详 细 信 息, 请 参 阅 第 19 章 中 的 每 个 月 重 新 训 练 模 型 ( 贝 叶 斯 网 络 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南

179 167 贝 叶 斯 网 络 模 型 贝 叶 斯 网 络 节 点 模 型 选 项 图 片 7-2 贝 叶 斯 网 络 节 点 : 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 为 每 个 分 割 构 建 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 分 区 该 字 段 允 许 您 使 用 指 定 字 段 将 数 据 分 割 为 几 个 不 同 的 样 本, 分 别 用 于 模 型 构 建 过 程 中 的 训 练 测 试 和 验 证 阶 段 通 过 用 某 个 样 本 生 成 模 型 并 用 另 一 个 样 本 对 模 型 进 行 测 试, 您 可 以 预 判 出 此 模 型 对 类 似 于 当 前 数 据 的 大 型 数 据 集 的 拟 合 优 劣 如 果 已 使 用 类 型 或 分 区 节 点 定 义 了 多 个 分 区 字 段, 则 必 须 在 每 个 用 于 分 区 的 建 模 节 点 的 字 段 选 项 卡 中 选 择 一 个 分 区 字 段 ( 如 果 仅 有 一 个 分 区 字 段, 则 将 在 启 用 分 区 后 自 动 引 入 此 字 段 ) 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 同 时 请 注 意, 要 在 分 析 时 应 用 选 定 分 区, 同 样 必 须 启 用 节 点 模 型 选 项 选 项 卡 中 的 分 区 功 能 ( 取 消 此 选 项, 则 可 以 在 不 更 改 字 段 设 置 的 条 件 下 禁 用 分 区 功 能 )

180 168 章 7 分 割 对 于 分 割 模 型, 选 择 分 割 字 段 或 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 分 割 类 似 您 仅 可 将 测 量 级 别 为 标 志 名 义 有 序 或 连 续 的 字 段 指 定 为 分 割 字 段 选 为 分 割 字 段 的 字 段 无 法 用 作 目 标 输 入 分 区 频 率 或 权 重 字 段 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 继 续 训 练 现 有 模 型 如 果 选 择 此 选 项, 则 在 模 型 块 模 型 选 项 卡 上 显 示 的 结 果, 将 在 每 次 运 行 模 型 时 重 新 生 成 和 更 新 例 如, 如 果 已 为 现 有 模 型 添 加 新 的 或 更 新 的 数 据 源, 则 需 要 执 行 此 操 作 注 意 : 此 操 作 只 能 更 新 现 有 网 络, 而 不 能 添 加 或 删 除 节 点 或 连 接 每 次 重 新 训 练 模 型 时, 网 络 的 形 状 都 将 保 持 不 变, 只 会 更 改 条 件 概 率 和 预 测 变 量 重 要 性 如 果 新 数 据 与 旧 数 据 大 致 相 似 也 无 妨, 因 为 您 所 期 望 的 是 关 注 相 同 的 内 容 ; 但 是, 如 果 您 希 望 检 查 或 更 新 重 要 的 内 容 ( 针 对 其 重 要 程 度 ), 则 需 要 构 建 新 模 型, 即 构 建 新 网 络 结 构 类 型 选 择 构 建 贝 叶 斯 网 络 时 使 用 的 结 构 : TAN 树 扩 展 朴 素 贝 叶 斯 模 型 (TAN) 可 创 建 简 单 的 贝 叶 斯 网 络 模 型, 它 是 一 种 基 于 标 准 朴 素 贝 叶 斯 模 型 的 改 进 模 型 这 是 由 于 该 模 型 允 许 每 一 个 预 测 变 量 除 了 依 赖 于 目 标 变 量 之 外, 还 依 赖 于 其 他 预 测 变 量, 由 此 增 加 分 类 的 准 确 度 马 尔 可 夫 覆 盖 可 以 在 包 含 目 标 变 量 的 父 项 子 项 及 其 子 项 的 父 项 的 数 据 集 中 选 择 节 点 集 马 尔 可 夫 覆 盖 基 本 上 标 识 了 需 要 预 测 目 标 变 量 的 网 络 中 的 所 有 变 量 用 户 认 为 这 种 构 建 网 络 的 方 法 更 为 准 确 ; 但 是, 当 处 理 大 型 数 据 集 时, 由 于 所 包 含 的 变 量 数 较 多, 所 以 可 能 会 消 耗 许 多 处 理 时 间 要 减 少 处 理 工 作 量, 可 以 使 用 专 家 选 项 卡 上 的 特 征 选 择 选 项, 选 择 与 目 标 变 量 有 重 大 相 关 性 的 变 量 包 括 特 征 选 择 预 处 理 步 骤 选 择 该 框, 您 可 以 使 用 专 家 选 项 卡 上 的 特 征 选 择 选 项 参 数 学 习 方 法 对 于 值 为 其 父 项 值 的 每 个 节 点 来 说, 贝 叶 斯 网 络 参 数 是 指 条 件 概 率 有 两 种 可 能 的 选 择, 您 可 以 用 来 控 制 估 算 节 点 ( 此 处 父 项 值 已 知 ) 间 条 件 概 率 表 这 一 任 务 最 大 似 然 法 使 用 大 型 数 据 集 时, 请 选 择 此 框 这 是 默 认 选 项 对 小 单 元 格 计 数 的 贝 叶 斯 调 整 对 于 较 小 的 数 据 集, 可 能 存 在 模 型 过 度 拟 合 的 风 险 以 及 出 现 大 量 零 计 数 的 可 能 性 选 中 此 选 项 可 通 过 应 用 平 滑 来 减 少 任 何 零 计 数 以 及 不 可 靠 的 估 计 结 果 带 来 的 影 响, 从 而 解 决 这 些 问 题

181 169 贝 叶 斯 网 络 模 型 贝 叶 斯 网 络 节 点 专 家 选 项 图 片 7-3 贝 叶 斯 网 络 节 点 : 专 家 选 项 卡 使 用 节 点 专 家 选 项 可 微 调 模 型 构 建 过 程 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家 缺 失 值 默 认 情 况 下,IBM SPSS Modeler 将 仅 使 用 对 于 模 型 中 使 用 的 所 有 字 段 均 具 有 有 效 值 的 记 录 ( 这 种 方 式 有 时 称 为 缺 失 值 的 成 列 删 除 ) 如 果 有 很 多 缺 失 数 据, 您 可 能 会 发 现 这 种 方 式 去 除 的 记 录 过 多, 剩 余 记 录 不 足 以 生 成 较 好 的 模 型 在 这 种 情 况 下, 您 可 以 取 消 选 中 仅 使 用 完 整 记 录 选 项 SPSS Modeler 随 后 将 尝 试 使 用 尽 可 能 多 的 信 息 对 模 型 进 行 估 计, 其 中 包 括 部 分 字 段 存 在 缺 失 值 的 记 录 ( 这 种 方 式 有 时 称 为 缺 失 值 的 成 对 删 除 ) 但 在 某 些 情 形 下, 以 这 种 方 式 使 用 不 完 整 记 录 可 能 会 在 模 型 的 估 计 过 程 中 产 生 计 算 问 题 追 加 所 有 概 率 指 定 是 否 将 输 出 字 段 每 个 类 别 的 概 率 添 加 到 该 节 点 所 处 理 的 每 个 记 录 如 果 未 选 中 此 选 项, 则 仅 添 加 预 测 类 别 的 概 率 独 立 性 检 验 一 种 独 立 评 估 检 验, 可 估 计 两 个 变 量 中 成 对 的 观 测 值 是 否 彼 此 独 立 请 从 以 下 可 用 选 项 中 选 择 要 使 用 的 检 验 类 型 : 似 然 比 通 过 计 算 两 种 不 同 假 设 下 结 果 概 率 的 最 大 值 之 间 的 比 率 来 检 验 目 标 - 预 测 变 量 的 独 立 性 Pearson 卡 方 通 过 使 用 原 假 设 ( 所 观 察 事 件 的 相 对 出 现 频 率 遵 循 特 定 的 频 率 分 布 ) 来 检 验 目 标 - 预 测 变 量 的 独 立 性

182 170 章 7 贝 叶 斯 网 络 模 型 可 在 检 验 对 之 外 使 用 附 加 变 量 执 行 独 立 性 的 条 件 检 验 此 外, 模 型 不 仅 可 以 研 究 目 标 和 预 测 变 量 之 间 的 关 系, 还 可 研 究 预 测 变 量 自 身 之 间 的 关 系 注 意 : 只 有 在 模 型 选 项 卡 上 选 中 马 尔 可 夫 覆 盖 的 包 括 特 征 选 择 预 处 理 步 骤 或 结 构 类 型 时, 才 能 使 用 独 立 性 检 验 选 项 显 著 性 水 平 可 以 与 独 立 性 检 验 设 置 结 合 使 用, 通 过 此 选 项, 您 可 以 在 执 行 检 验 时 设 置 要 使 用 的 分 隔 值 该 值 越 小, 网 络 中 的 链 接 就 越 少 ; 默 认 水 平 值 为 0.01 注 意 : 只 有 在 模 型 选 项 卡 上 选 中 马 尔 可 夫 覆 盖 的 包 括 特 征 选 择 预 处 理 步 骤 或 结 构 类 型 时, 才 能 使 用 该 选 项 最 大 条 件 集 大 小 该 算 法 可 用 于 创 建 马 尔 可 夫 覆 盖 结 构, 它 可 使 用 增 加 大 小 的 条 件 集 执 行 独 立 性 检 验, 并 从 网 络 中 删 除 不 需 要 的 链 接 由 于 包 含 大 量 条 件 变 量 的 检 验 需 要 更 多 的 时 间 和 内 存 进 行 处 理, 因 此 您 可 以 限 制 要 包 括 的 变 量 数 目 在 处 理 众 多 变 量 间 具 有 较 强 独 立 性 的 数 据 时, 这 种 操 作 非 常 有 用 但 请 注 意, 最 终 形 成 的 网 络 可 能 包 含 一 些 多 余 链 接 指 定 执 行 独 立 性 检 验 时 要 使 用 的 条 件 变 量 的 最 大 数 目 默 认 设 置 为 5 注 意 : 只 有 在 模 型 选 项 卡 上 选 中 马 尔 可 夫 覆 盖 的 包 括 特 征 选 择 预 处 理 步 骤 或 结 构 类 型 时, 才 能 使 用 该 选 项 功 能 选 择 使 用 这 些 选 项, 您 可 以 限 制 在 处 理 模 型 时 所 使 用 的 输 入 量 以 加 速 模 型 构 建 过 程 由 于 在 创 建 马 尔 可 夫 覆 盖 结 构 时 存 在 大 量 的 潜 在 输 入, 因 此 该 操 作 特 别 有 用 ; 通 过 此 项 操 作, 您 可 以 选 择 与 目 标 变 量 有 重 大 关 联 的 输 入 注 意 : 只 有 在 模 型 选 项 卡 上 选 中 包 括 特 征 选 择 预 处 理 步 骤 时, 才 能 使 用 特 征 选 择 选 项 始 终 选 择 输 入 通 过 使 用 字 段 选 择 器 ( 文 本 字 段 右 侧 的 按 钮 ), 从 数 据 集 中 选 择 在 构 建 贝 叶 斯 网 络 模 型 时 始 终 使 用 的 字 段 注 意, 请 始 终 选 择 目 标 字 段 最 大 输 入 量 在 数 据 集 中 指 定 构 建 贝 叶 斯 网 络 模 型 时 要 使 用 的 总 输 入 量 您 可 以 输 入 的 最 大 数 目 为 数 据 集 中 的 总 输 入 量 注 意 : 如 果 在 总 是 选 择 输 入 中 选 择 的 字 段 数 超 过 最 大 输 入 量 的 值, 则 会 显 示 一 条 错 误 消 息

183 171 贝 叶 斯 网 络 模 型 贝 叶 斯 网 络 模 型 块 图 片 7-4 贝 叶 斯 网 络 及 关 联 预 测 变 量 重 要 性 模 型 详 细 信 息 注 意 : 如 果 在 模 型 选 项 卡 中 选 中 了 继 续 训 练 现 有 参 数, 则 会 在 每 次 重 新 生 成 模 型 时 更 新 模 型 块 模 型 选 项 卡 上 显 示 的 信 息 模 型 块 模 型 选 项 卡 分 为 两 个 窗 格 : 左 窗 格 基 本 该 视 图 包 含 节 点 网 络 图, 可 显 示 目 标 与 其 最 重 要 预 测 变 量 之 间 的 关 系, 以 及 预 测 变 量 自 身 之 间 的 关 系 各 预 测 变 量 的 重 要 性 可 通 过 其 颜 色 的 深 浅 显 示 ; 颜 色 越 深 表 示 变 量 越 重 要, 反 之 亦 然 当 您 将 鼠 标 指 针 悬 停 在 节 点 上 时, 弹 出 式 工 具 提 示 中 会 显 示 代 表 范 围 的 节 点 的 分 级 值 可 以 使 用 IBM SPSS Modeler 的 图 表 工 具 进 行 交 互 编 辑, 并 保 存 图 表 例 如, 可 以 在 其 他 应 用 程 序 如 MS Word 中 使 用 图 表 提 示 : 如 果 网 络 包 含 大 量 节 点, 则 可 以 点 击 某 个 节 点, 然 后 拖 动 它 以 使 图 形 更 加 清 晰 分 布 该 视 图 将 以 微 型 图 形 的 格 式 显 示 网 络 中 各 个 节 点 的 条 件 概 率 将 鼠 标 悬 停 在 图 形 上 方, 可 在 弹 出 式 工 具 提 示 中 显 示 图 形 值

184 172 章 7 右 窗 格 预 测 变 量 重 要 性 这 将 显 示 一 个 图 表, 以 指 示 在 估 计 模 型 时 所 使 用 的 各 个 预 测 变 量 的 相 对 重 要 性 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 条 件 概 率 当 在 左 窗 格 中 选 择 了 某 个 节 点 或 微 型 分 布 图 时, 右 窗 格 则 会 显 示 相 关 的 条 件 概 率 表 该 表 包 含 各 个 节 点 值 的 条 件 概 率 值, 以 及 各 节 点 的 父 节 点 中 的 值 组 合 此 外, 该 表 还 包 含 为 每 个 记 录 值 和 父 节 点 中 各 个 值 组 合 所 观 测 的 记 录 数 量 贝 叶 斯 网 络 模 型 设 置 在 贝 叶 斯 网 络 模 型 块 的 设 置 选 项 卡 中 可 指 定 选 项 以 修 改 已 构 建 的 模 型 例 如, 可 以 通 过 贝 叶 斯 网 络 节 点 使 用 相 同 的 数 据 和 设 置 构 建 几 个 不 同 的 模 型, 然 后 使 用 每 个 模 型 中 的 此 选 项 卡 对 设 置 稍 做 修 改 以 查 看 其 对 结 果 的 影 响 注 意 : 只 有 将 模 型 块 添 加 到 流 中 之 后, 此 选 项 卡 才 可 用 图 片 7-5 贝 叶 斯 网 络 模 型 的 设 置 选 项 卡 计 算 原 始 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回? 是? 或? 否? 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 除 了 这 些 得 分, 还 有 其 他 在 评 分 过 程 中 生 成 的 预 测 值 和 置 信 度 值 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 得 分 仅 依 赖 于 训 练 数 据, 并 且 由 于 许 多 模 型 过 度 拟 合 此 数 据 的 倾 向, 该 得 分 可 能 会 过 度 优 化 调 整 后 的 倾 向 会 尝 试 通 过 针 对 检 验 或 验 证 分 区 对 模 型 性 能 进 行 评 估 进 行 弥 补 此 选 项 要 求 在 流 中 定 义 分 区 字 段 并 且 在 生 成 模 型 之 前 在 建 模 节 点 中 启 用 调 整 的 倾 向 得 分 追 加 所 有 概 率 指 定 是 否 将 输 出 字 段 每 个 类 别 的 概 率 添 加 到 该 节 点 所 处 理 的 每 个 记 录 如 果 未 选 中 此 选 项, 则 仅 添 加 预 测 类 别 的 概 率 此 复 选 框 的 默 认 设 置 由 建 模 节 点 的 专 家 选 项 卡 上 的 相 应 复 选 框 确 定 有 关 详 细 信 息, 请 参 阅 第 169 页 码 贝 叶 斯 网 络 节 点 专 家 选 项

185 173 贝 叶 斯 网 络 模 型 贝 叶 斯 网 络 模 型 摘 要 图 片 7-6 贝 叶 斯 网 络 模 型 的 摘 要 选 项 卡 模 型 块 的 汇 总 选 项 卡 显 示 了 有 关 模 型 的 下 列 信 息 : 模 型 本 身 ( 分 析 ) 模 型 中 使 用 的 字 段 ( 字 段 ) 构 建 模 型 时 使 用 的 设 置 ( 构 建 设 置 ) 和 模 型 训 练 ( 训 练 概 要 ) 当 第 一 次 浏 览 此 节 点 时, 汇 总 选 项 卡 的 结 果 是 折 叠 起 来 的 要 查 看 感 兴 趣 的 结 果, 可 使 用 项 目 左 侧 的 展 开 控 件 展 开 项 目, 或 单 击 全 部 展 开 按 钮 显 示 所 有 结 果 当 结 束 对 项 目 的 查 看 时, 为 了 隐 藏 结 果, 可 使 用 展 开 控 件 折 叠 要 隐 藏 的 特 定 结 果, 或 单 击 全 部 折 叠 按 钮 折 叠 所 有 结 果 分 析 显 示 指 定 模 型 的 相 关 信 息 字 段 列 出 构 建 模 型 时 用 作 目 标 和 输 入 的 字 段 构 建 设 置 包 含 有 关 在 构 建 模 型 中 使 用 的 设 置 的 信 息 训 练 概 要 显 示 模 型 类 型 用 于 创 建 模 型 的 流 模 型 创 建 者 模 型 构 建 完 成 时 间 和 模 型 构 建 所 用 时 间

186 神 经 网 络 章 8 神 经 网 络 可 以 近 似 多 种 预 测 模 型, 而 对 模 型 结 构 和 假 设 只 有 最 小 需 求 关 系 形 式 在 学 习 过 程 中 确 定 如 果 目 标 与 预 测 变 量 间 的 线 性 关 系 适 当, 神 经 网 络 结 果 会 非 常 接 近 传 统 线 性 模 型 的 结 果 如 果 非 线 性 关 系 更 为 适 当, 神 经 网 络 会 自 动 接 近 正 确 的 模 型 结 构 伴 随 这 种 灵 活 性 的 缺 点 是 神 经 网 络 往 往 不 太 容 易 解 释 因 此, 如 果 您 试 图 解 释 生 成 目 标 与 预 测 变 量 间 关 系 的 底 层 过 程, 最 好 使 用 更 传 统 的 统 计 模 型 不 过, 如 果 模 型 的 可 解 释 性 并 不 重 要, 您 可 以 使 用 神 经 网 络 以 获 得 良 好 的 预 测 结 果 图 片 8-1 字 段 选 项 卡 字 段 要 求 必 须 至 少 有 一 个 目 标 和 一 个 输 入 设 为 两 者 或 无 的 字 段 将 被 忽 略 对 目 标 或 预 测 变 量 ( 输 入 ) 没 有 测 量 级 别 限 制 有 关 详 细 信 息, 请 参 阅 第 30 页 码 第 3 章 中 的 建 模 节 点 字 段 选 项 神 经 网 络 模 型 神 经 网 络 是 神 经 系 统 运 转 方 式 的 简 单 模 型 其 基 本 单 元 是 神 经 元, 通 常 将 其 组 织 到 层 中, 如 下 面 的 图 所 示 Copyright IBM Corporation 1994,

187 175 神 经 网 络 图 片 8-2 神 经 网 络 的 结 构 神 经 网 络 是 模 拟 人 类 大 脑 处 理 信 息 方 式 的 简 化 模 型 此 模 型 通 过 模 拟 大 量 类 似 于 神 经 元 的 抽 象 形 式 的 互 连 处 理 单 元 而 运 行 这 些 处 理 单 元 都 位 于 层 中 通 常 在 神 经 网 络 中 有 三 个 部 分 : 一 个 输 入 层, 其 中 的 单 元 表 示 输 入 字 段 ; 一 个 或 多 个 隐 藏 层 ; 一 个 输 出 层, 带 有 一 个 或 多 个 表 示 目 标 字 段 的 单 元 这 些 单 元 通 过 可 变 的 连 接 强 度 ( 或 权 重 ) 连 接 输 入 数 据 显 示 在 第 一 层, 其 值 从 每 个 神 经 元 传 播 到 下 一 层 的 每 个 神 经 元 最 终 从 输 出 层 中 输 出 结 果 该 网 络 可 通 过 以 下 过 程 进 行 学 习, 即 检 查 单 个 记 录, 然 后 为 每 个 记 录 生 成 预 测, 并 且 当 生 成 的 预 测 不 正 确 时, 对 权 重 进 行 调 整 在 满 足 一 个 或 多 个 停 止 标 准 之 前, 此 过 程 会 不 断 重 复, 而 网 络 会 持 续 提 高 其 预 测 准 确 度 最 初, 所 有 的 权 重 都 是 随 机 生 成 的, 并 且 从 网 络 输 出 的 结 果 很 可 能 没 有 意 义 的 网 络 可 通 过 训 练 来 学 习 向 该 网 络 重 复 应 用 已 知 道 结 果 的 示 例, 并 将 网 络 给 出 的 结 果 与 已 知 的 结 果 进 行 比 较 从 此 比 较 中 得 出 的 信 息 会 传 递 回 网 络, 并 逐 渐 改 变 权 重 随 着 训 练 的 进 行, 该 网 络 对 已 知 结 果 的 复 制 会 变 得 越 来 越 准 确 一 旦 训 练 完 毕, 就 可 以 将 网 络 应 用 到 未 知 结 果 的 未 来 案 例 中 对 遗 存 流 使 用 神 经 网 络 IBM SPSS Modeler 版 本 14 引 入 了 新 的 神 经 网 络 节 点, 支 持 推 进 和 bagging 技 术, 并 可 针 对 大 型 数 据 集 进 行 优 化 在 此 发 行 版 中, 包 含 旧 节 点 的 现 有 流 仍 然 可 以 构 建 模 型 并 对 其 评 分 不 过, 在 将 来 的 发 行 版 中 将 去 掉 这 一 支 持, 因 此 建 议 您 从 现 在 起 使 用 新 的 版 本 从 版 本 13 以 后, 带 有 未 知 值 的 字 段 ( 即, 在 培 训 数 据 中 不 存 在 值 ) 不 再 被 自 动 处 理 为 缺 失 值, 而 使 用 $null$ 值 来 进 行 评 分 因 此, 如 果 您 要 在 版 本 13 或 以 后 版 本 中 使 用 旧 的 (13 以 前 版 本 ) 神 经 网 络 模 型, 以 便 在 对 字 段 进 行 评 分 时 将 未 知 值 处 理 为 非 空 值, 则 应 将 未 知 值 标 记 为 缺 失 值 ( 例 如, 使 用 类 型 节 点 )

188 176 章 8 目 标 图 片 8-3 目 标 设 置 您 希 望 做 什 么? 构 建 新 的 模 型 构 建 全 新 的 模 型 这 是 该 节 点 的 常 用 操 作 继 续 训 练 现 有 模 型 继 续 训 练 此 节 点 成 功 生 成 的 最 后 一 个 模 型 这 样 就 可 以 在 无 需 访 问 原 始 数 据 的 情 况 下 更 新 或 刷 新 现 有 的 模 型, 并 可 能 会 显 著 提 升 性 能, 因 为 只 有 新 的 或 更 新 后 的 记 录 被 传 入 流 中 上 一 个 模 型 的 详 细 信 息 与 建 模 节 点 存 储 在 一 起, 这 样 即 使 先 前 的 模 型 块 在 流 或 模 型 选 项 板 中 不 再 可 用 的 情 况 下, 也 可 以 使 用 该 选 项 注 意 : 在 启 用 此 选 项 后, 字 段 和 构 建 选 项 选 项 卡 上 的 所 有 其 他 控 件 将 被 禁 用 您 的 主 要 目 标 是 什 么? 创 建 标 准 模 型 此 方 法 将 构 建 单 个 模 型, 以 使 用 预 测 变 量 来 预 测 目 标 一 般 来 说, 与 推 进 bagged 或 大 数 据 集 整 体 模 型 相 比, 标 准 模 型 更 易 于 解 释, 并 能 更 快 地 进 行 评 分 增 强 模 型 准 确 性 ( 推 进 ) 此 方 法 采 用 推 进 方 式 构 建 整 体 模 型, 这 将 生 成 一 系 列 模 型 以 获 得 更 精 确 的 预 测 结 果 与 标 准 模 型 相 比, 此 整 体 模 型 需 要 更 长 的 构 建 与 评 分 时 间 推 进 方 法 产 生 一 系 列 成 分 模 型, 其 中 每 个 模 型 在 整 个 数 据 集 上 构 建 在 构 建 每 个 后 续 成 分 模 型 之 前, 将 根 据 前 一 成 分 模 型 的 残 差 对 记 录 进 行 加 权 具 有 较 大 残 差 的 个 案 将 被 给 予 较 高 的 分 析 权 重, 因 此 下 一 个 成 分 模 型 将 较 好 地 侧 重 于 这 些 记 录

189 177 神 经 网 络 这 些 成 分 模 型 共 同 构 成 一 个 整 体 模 型 该 整 体 模 型 采 用 组 合 规 则 对 新 记 录 进 行 评 分 可 用 的 规 则 取 决 于 目 标 的 测 量 级 别 增 强 模 型 稳 定 性 (bagging) 此 方 法 采 用 bagging(bootstrap 汇 总 ) 方 式 构 建 整 体 模 型, 这 将 生 成 多 个 模 型 以 获 得 更 可 靠 的 预 测 结 果 与 标 准 模 型 相 比, 此 整 体 模 型 需 要 更 长 的 构 建 与 评 分 时 间 Bootstrap 汇 总 (bagging) 通 过 对 原 始 数 据 集 进 行 放 回 抽 样, 产 生 训 练 数 据 集 的 副 本 这 将 创 建 大 小 与 原 始 数 据 集 相 同 的 bootstrap 样 本 然 后, 在 每 个 副 本 上 构 建 成 分 模 型 这 些 成 分 模 型 共 同 构 成 一 个 整 体 模 型 该 整 体 模 型 采 用 组 合 规 则 对 新 记 录 进 行 评 分 可 用 的 规 则 取 决 于 目 标 的 测 量 级 别 创 建 适 用 于 大 型 数 据 集 ( 需 要 IBM SPSS Modeler Server) 的 模 型 此 方 法 将 数 据 集 划 分 为 多 个 单 独 数 据 块, 以 构 建 整 体 模 型 如 果 您 的 数 据 集 过 大, 而 无 法 构 建 上 述 任 何 模 型 或 进 行 增 量 式 建 模, 请 选 择 此 项 与 标 准 模 型 相 比, 此 选 项 的 构 建 时 间 较 短, 但 评 分 时 间 更 长 该 选 项 需 要 SPSS Modeler Server 连 接 如 果 存 在 多 个 目 标, 则 此 方 法 将 只 创 建 标 准 模 型, 而 不 考 虑 所 选 的 目 标 基 本 图 片 8-4 基 本 设 置 神 经 网 络 模 型 此 类 模 型 确 定 神 经 网 络 如 何 通 过 隐 藏 层 将 预 测 变 量 连 接 到 目 标 多 层 感 知 器 (MLP) 允 许 构 建 较 为 复 杂 的 关 系, 但 代 价 是 更 长 的 训 练 与 评 分 时 间 径 向 基 函 数 (RBF) 可 以 缩 短 训 练 与 评 分 时 间, 但 与 MLP 相 比 其 预 测 能 力 要 差 些 隐 藏 层 神 经 网 络 的 隐 藏 层 包 含 无 法 观 察 到 的 单 元 每 个 隐 藏 单 元 的 值 均 为 预 测 变 量 的 某 个 函 数 ; 函 数 的 确 切 形 式 部 分 取 决 于 网 络 类 型 多 层 感 知 器 可 以 有 一 个 或 两 个 隐 藏 层 ; 径 向 基 函 数 可 以 有 一 个 隐 藏 层

190 178 章 8 自 动 计 算 单 元 数 此 选 项 构 建 具 有 单 个 隐 藏 层 的 网 络, 并 计 算 隐 藏 层 中 的 最 佳 单 元 数 自 定 义 单 元 数 此 选 项 允 许 您 指 定 每 个 隐 藏 层 中 的 单 元 数 第 一 个 隐 藏 层 必 须 至 少 有 一 个 单 元 如 果 为 第 二 个 隐 藏 层 指 定 0 个 单 元, 则 会 构 建 具 有 单 个 隐 藏 层 的 多 层 感 知 器 注 意 : 在 选 择 值 时, 应 确 保 节 点 数 不 超 过 连 续 预 测 变 量 数 加 上 所 有 分 类 ( 标 志 名 义 和 有 序 ) 预 测 变 量 间 的 类 别 总 数 之 和 停 止 规 则 图 片 8-5 停 止 规 则 设 置 这 些 规 则 用 于 确 定 何 时 停 止 训 练 多 层 感 知 器 网 络 ; 如 果 使 用 径 向 基 函 数, 将 忽 略 这 些 设 置 训 练 在 持 续 至 少 一 个 周 期 ( 数 据 传 递 ) 后, 可 以 按 照 下 列 条 件 被 停 止 使 用 最 长 训 练 时 间 ( 每 个 成 分 模 型 ) 选 择 是 否 指 定 算 法 运 行 的 最 大 分 钟 数 请 指 定 一 个 大 于 0 的 数 字 当 构 建 整 体 模 型 时, 此 为 其 中 每 个 成 分 模 型 的 允 许 训 练 时 间 请 注 意, 为 了 完 成 当 前 周 期, 训 练 可 能 会 比 指 定 的 时 间 限 制 延 长 一 点 自 定 义 最 大 训 练 周 期 数 允 许 的 最 大 训 练 周 期 数 如 果 超 过 最 大 周 期 数, 则 停 止 训 练 指 定 大 于 0 的 整 数 使 用 最 小 精 确 性 如 果 使 用 此 选 项, 训 练 则 会 一 直 继 续, 直 到 达 到 指 定 的 精 确 性 这 种 情 况 可 能 永 远 不 会 出 现, 但 您 可 以 随 时 中 断 训 练, 以 截 止 到 目 前 所 达 到 的 最 佳 精 确 性 保 存 该 网 络 如 果 每 个 周 期 后 防 止 过 度 拟 合 集 合 中 错 误 未 出 现 减 少, 训 练 错 误 的 相 对 变 化 较 小, 或 当 前 训 练 错 误 的 比 率 相 对 于 初 始 错 误 较 低, 训 练 算 法 也 会 停 止

191 179 神 经 网 络 整 体 图 片 8-6 整 体 设 置 这 些 设 置 决 定 了 在 目 标 中 请 求 boosting bagging 或 超 大 型 数 据 集 时 发 生 的 整 体 行 为 对 选 定 目 标 不 适 用 的 选 项 将 被 忽 略 Bagging 和 大 型 数 据 集 在 对 整 体 评 分 时, 此 规 则 用 于 组 合 来 自 基 本 模 型 的 预 测 值, 以 计 算 整 体 得 分 值 分 类 目 标 的 默 认 组 合 规 则 可 以 通 过 投 票 最 高 概 率 或 最 高 平 均 值 概 率 来 对 分 类 目 标 的 整 体 预 测 值 进 行 组 合 投 票 选 择 在 基 本 模 型 中 最 常 具 有 最 高 概 率 的 类 别 最 高 概 率 选 择 在 所 有 基 本 模 型 中 取 得 单 个 最 高 概 率 的 类 别 最 高 平 均 值 概 率 选 择 在 基 本 模 型 中 对 类 别 概 率 取 平 均 值 时 具 有 最 高 值 的 类 别 连 续 目 标 的 默 认 组 合 规 则 可 以 通 过 对 来 自 基 本 模 型 的 预 测 值 取 平 均 值 或 中 位 数, 对 连 续 目 标 的 整 体 预 测 值 进 行 组 合 注 意, 如 果 以 增 强 模 型 精 确 性 为 目 标, 则 组 合 规 则 选 择 将 被 忽 略 Boosting 方 法 始 终 使 用 加 权 大 多 数 投 票 来 对 分 类 目 标 进 行 评 分, 而 使 用 加 权 中 位 数 对 连 续 目 标 进 行 评 分 Boosting 和 Bagging 当 以 增 强 模 型 精 确 性 或 稳 定 性 为 目 标 时, 指 定 要 构 建 的 基 本 模 型 数 ; 对 于 bagging 方 法, 此 为 bootstrap 样 本 数 它 应 为 正 整 数

192 180 章 8 高 级 图 片 8-7 高 级 设 置 高 级 设 置 允 许 用 户 控 制 与 其 他 设 置 组 不 完 全 吻 合 的 选 项 防 止 过 度 拟 合 集 合 神 经 网 络 方 法 在 内 部 将 记 录 划 分 为 模 型 构 建 集 合 和 防 止 过 度 拟 合 集 合, 后 者 作 为 独 立 的 数 据 记 录 集, 用 于 跟 踪 训 练 过 程 中 的 错 误, 以 防 止 该 方 法 对 数 据 中 的 几 率 变 异 进 行 建 模 指 定 记 录 的 百 分 比 默 认 值 为 30 重 复 结 果 设 置 随 机 种 子 允 许 您 复 制 分 析 指 定 一 个 整 数, 或 单 击 生 成, 这 将 产 生 一 个 介 于 1 与 之 间 ( 包 括 1 和 ) 的 伪 随 机 整 数 默 认 情 况 下, 使 用 种 子 来 复 制 分 析 预 测 变 量 缺 失 值 这 将 指 定 如 何 处 理 缺 失 值 成 列 删 除 将 在 预 测 变 量 上 存 在 缺 失 值 的 记 录 从 模 型 构 建 中 排 除 插 补 缺 失 值 将 替 换 预 测 变 量 中 的 缺 失 值, 并 在 分 析 中 使 用 这 些 记 录 连 续 字 段 会 插 补 最 小 与 最 大 观 测 值 的 平 均 值 ; 分 类 字 段 则 插 补 最 常 出 现 的 类 别 请 注 意, 在 字 段 选 项 卡 指 定 的 任 何 其 他 字 段 上 均 具 有 缺 失 值 的 记 录 始 终 会 从 模 型 构 建 中 排 除

193 181 神 经 网 络 模 型 选 项 图 片 8-8 模 型 选 项 选 项 卡 模 型 名 称 可 以 基 于 目 标 字 段 来 自 动 生 成 模 型 名 称, 或 指 定 自 定 义 名 称 自 动 生 成 的 名 称 为 目 标 字 段 名 如 果 存 在 多 个 目 标, 则 模 型 名 称 将 由 这 些 字 段 名 按 顺 序 排 列 组 成, 且 字 段 名 之 间 通 过 与 (&) 符 号 连 接 例 如, 如 果 目 标 分 别 为 field1 field2 和 field3, 则 模 型 名 称 为 :field1 & field2 & field3 可 用 于 评 分 在 对 模 型 评 分 时, 应 生 成 此 组 中 的 选 定 项 目 在 对 模 型 评 分 时, 始 终 会 计 算 预 测 值 ( 适 合 所 有 目 标 ) 和 置 信 度 ( 适 合 分 类 目 标 ) 计 算 的 置 信 度 可 以 基 于 预 测 值 的 概 率 ( 最 高 预 测 概 率 ) 或 最 高 预 测 概 率 与 第 二 高 预 测 概 率 之 间 的 差 值 分 类 目 标 的 预 测 概 率 这 将 生 成 分 类 目 标 的 预 测 概 率 为 每 个 类 别 创 建 一 个 字 段 标 志 目 标 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回 是 或 否 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 该 模 型 产 生 原 始 倾 向 得 分 ; 如 果 分 区 处 于 有 效, 则 模 型 还 会 根 据 测 试 分 区 产 生 调 整 后 的 倾 向 得 分 有 关 详 细 信 息, 请 参 阅 第 36 页 码 第 3 章 中 的 倾 向 得 分

194 182 章 8 模 型 摘 要 图 片 8-9 神 经 网 络 模 型 摘 要 视 图 模 型 摘 要 视 图 是 神 经 网 络 预 测 或 分 类 精 确 性 的 快 照 摘 要 模 型 摘 要 此 表 标 识 目 标 已 训 练 的 神 经 网 络 类 型 停 止 训 练 的 停 止 规 则 ( 已 训 练 多 层 感 知 器 网 络 时 显 示 ), 以 及 网 络 的 每 个 隐 藏 层 中 的 神 经 元 数 神 经 网 络 质 量 此 图 表 显 示 最 终 模 型 的 精 确 性, 数 值 越 大 越 好 对 于 分 类 目 标, 它 仅 仅 是 预 测 值 与 观 测 值 相 符 的 记 录 百 分 比 对 于 连 续 目 标, 它 等 于 1 减 去 预 测 结 果 中 的 绝 对 平 均 误 差 ( 预 测 值 减 去 观 测 值 的 绝 对 值 的 平 均 值 ) 与 预 测 值 范 围 ( 最 大 预 测 值 减 去 最 小 预 测 值 ) 的 比 率 多 个 目 标 如 果 存 在 多 个 目 标, 则 每 个 目 标 显 示 在 表 的 目 标 行 中 在 图 表 中 显 示 的 精 确 性 是 单 独 目 标 精 确 性 的 平 均 值

195 183 神 经 网 络 预 测 变 量 重 要 性 图 片 8-10 预 测 变 量 重 要 性 视 图 通 常, 您 将 需 要 将 建 模 工 作 专 注 于 最 重 要 的 预 测 变 量 字 段, 并 考 虑 删 除 或 忽 略 那 些 最 不 重 要 的 变 量 预 测 变 量 重 要 性 图 表 可 以 在 模 型 估 计 中 指 示 每 个 预 测 变 量 的 相 对 重 要 性, 从 而 帮 助 您 实 现 这 一 点 由 于 它 们 是 相 对 值, 因 此 显 示 的 所 有 预 测 变 量 的 值 总 和 为 1.0 预 测 变 量 的 重 要 性 与 模 型 精 确 性 无 关 它 只 与 每 个 预 测 变 量 在 预 测 中 的 重 要 性 有 关, 而 不 涉 及 预 测 是 否 精 确 多 个 目 标 如 果 存 在 多 个 目 标, 则 每 个 目 标 显 示 在 单 独 图 表 中, 并 提 供 有 目 标 下 拉 列 表, 以 控 制 显 示 哪 个 目 标

196 184 章 8 按 已 观 测 进 行 预 测 图 片 8-11 按 已 观 测 进 行 预 测 视 图 对 于 连 续 目 标, 这 将 显 示 一 个 分 级 散 点 图, 其 中 预 测 值 位 于 垂 直 轴 上, 而 观 测 值 位 于 水 平 轴 上 多 个 目 标 如 果 存 在 多 个 连 续 目 标, 则 每 个 目 标 显 示 在 单 独 图 表 中, 并 提 供 有 目 标 下 拉 列 表, 以 控 制 显 示 哪 个 目 标 分 类 图 片 8-12 分 类 视 图, 行 百 分 比 样 式

197 185 神 经 网 络 对 于 分 类 目 标, 这 将 在 一 个 热 图 中 显 示 已 观 测 与 已 预 测 值 的 交 叉 分 类, 以 及 整 体 正 确 百 分 比 表 样 式 有 多 种 不 同 的 显 示 样 式, 可 以 从 样 式 下 拉 列 表 中 访 问 这 些 样 式 行 百 分 比 这 将 在 单 元 格 中 显 示 行 百 分 比 ( 单 元 格 计 数 表 示 为 行 总 数 的 百 分 比 ) 这 是 默 认 值 单 元 格 计 数 这 将 在 单 元 格 中 显 示 单 元 格 计 数 热 图 中 的 阴 影 仍 然 基 于 行 百 分 比 热 图 这 将 只 显 示 阴 影, 不 会 在 单 元 格 中 显 示 值 压 缩 这 将 不 会 在 单 元 格 中 显 示 行 或 列 标 题, 也 不 会 显 示 值 它 在 目 标 具 有 较 多 类 别 时 非 常 有 用 缺 失 如 果 任 何 记 录 在 目 标 上 具 有 缺 失 值, 则 它 们 会 显 示 在 所 有 有 效 行 下 方 的 ( 缺 失 ) 行 中 具 有 缺 失 值 的 记 录 对 整 体 正 确 百 分 比 没 有 贡 献 多 个 目 标 如 果 存 在 多 个 分 类 目 标, 则 每 个 目 标 显 示 在 单 独 表 中, 并 提 供 有 目 标 下 拉 列 表, 以 控 制 显 示 哪 个 目 标 大 型 表 如 果 显 示 的 目 标 具 有 超 过 100 个 类 别, 则 不 会 显 示 表

198 186 章 8 网 络 图 片 8-13 网 络 视 图, 输 入 位 于 左 侧, 效 果 样 式 这 将 显 示 神 经 网 络 的 图 形 表 示 图 表 样 式 有 两 种 不 同 的 显 示 样 式, 可 以 从 样 式 下 拉 列 表 中 访 问 这 些 样 式 效 果 这 会 在 图 表 中 将 每 个 预 测 变 量 与 目 标 显 示 为 单 个 节 点, 不 论 测 量 尺 度 是 连 续 还 是 分 类 这 是 默 认 值 系 数 这 将 为 分 类 预 测 变 量 与 目 标 显 示 多 个 指 示 节 点 在 系 数 样 式 图 表 中, 连 接 线 条 根 据 估 计 的 键 结 值 显 示 为 不 同 颜 色 图 表 方 向 默 认 情 况 下, 输 入 位 于 网 络 图 表 中 的 左 侧, 而 目 标 位 于 右 侧 通 过 工 具 栏 控 件 可 以 更 改 图 表 方 向, 以 使 输 入 位 于 顶 部, 目 标 位 于 底 部, 反 之 亦 可 预 测 变 量 重 要 性 在 图 表 中, 连 接 线 条 根 据 预 测 变 量 的 重 要 性 进 行 加 权, 粗 线 条 表 示 重 要 性 较 高 在 工 具 栏 中 提 供 有 一 个 预 测 变 量 重 要 性 滑 块, 以 控 制 在 网 络 图 表 中 显 示 哪 些 预 测 变 量 这 不 会 改 变 模 型, 只 是 帮 助 您 重 点 关 注 最 重 要 的 预 测 变 量 多 个 目 标 如 果 存 在 多 个 目 标, 所 有 目 标 都 将 显 示 在 图 表 中

199 187 神 经 网 络 设 置 图 片 8-14 设 置 选 项 卡 在 对 模 型 评 分 时, 应 生 成 此 选 项 卡 中 的 选 定 项 目 在 对 模 型 评 分 时, 始 终 会 计 算 预 测 值 ( 适 合 所 有 目 标 ) 和 置 信 度 ( 适 合 分 类 目 标 ) 计 算 的 置 信 度 可 以 基 于 预 测 值 的 概 率 ( 最 高 预 测 概 率 ) 或 最 高 预 测 概 率 与 第 二 高 预 测 概 率 之 间 的 差 值 分 类 目 标 的 预 测 概 率 这 将 生 成 分 类 目 标 的 预 测 概 率 为 每 个 类 别 创 建 一 个 字 段 标 志 目 标 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回 是 或 否 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 该 模 型 产 生 原 始 倾 向 得 分 ; 如 果 分 区 处 于 有 效, 则 模 型 还 会 根 据 测 试 分 区 产 生 调 整 后 的 倾 向 得 分 有 关 详 细 信 息, 请 参 阅 第 36 页 码 第 3 章 中 的 倾 向 得 分 生 成 此 模 型 的 SQL 使 用 数 据 库 中 的 数 据 时,SQL 代 码 可 传 回 到 数 据 库 中 执 行, 从 而 大 大 提 高 许 多 操 作 的 处 理 速 度 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 SQL 优 化 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南

200 决 策 表 章 9 Decision List 模 型 标 识 了 子 组 或 段, 即, 显 示 了 与 整 体 样 本 相 关 的 二 值 (yes 或 no) 结 果 的 似 然 度 的 高 低 例 如, 您 或 许 在 寻 找 那 些 最 不 可 能 流 失 的 客 户 或 最 有 可 能 对 某 个 商 业 活 动 作 出 积 极 响 应 的 客 户 通 过 Decision List Viewer 可 以 实 现 对 模 型 的 完 全 控 制, 它 允 许 您 编 辑 段 添 加 自 己 的 业 务 规 则 指 定 每 个 段 的 评 分 方 式, 以 及 采 用 其 他 多 种 方 式 对 所 有 段 的 匹 配 比 例 进 行 优 化 因 此, 它 尤 其 适 用 于 生 成 邮 件 列 表, 或 确 定 作 为 特 定 活 动 目 标 的 记 录 此 外, 还 可 以 使 用 多 个 挖 掘 任 务 对 不 同 建 模 方 法 进 行 组 合, 例 如, 确 定 同 一 模 型 中 性 能 较 高 和 较 低 的 段, 并 根 据 需 要 在 评 分 阶 段 包 含 或 排 除 每 个 段 图 片 9-1 决 策 列 表 模 型 段 规 则 和 条 件 模 型 由 段 列 表 组 成, 每 个 段 由 选 择 匹 配 记 录 的 规 则 进 行 定 义 给 定 的 规 则 可 以 有 多 个 条 件, 例 如 : Copyright IBM Corporation 1994,

201 189 决 策 表 RFM_SCORE > 10 and MONTHS_CURRENT <= 9 规 则 的 列 表 顺 序 即 为 应 用 顺 序, 第 一 个 匹 配 规 则 将 决 定 给 定 记 录 的 输 出 结 果 如 果 单 独 采 用, 则 规 则 或 条 件 可 能 会 发 生 重 叠, 但 规 则 的 顺 序 排 除 了 二 义 性 如 果 规 则 不 匹 配, 则 记 录 将 会 分 配 给 其 余 规 则 完 全 控 制 评 分 Decision List Viewer 允 许 您 查 看 修 改 和 重 组 段, 并 且 可 以 评 分 为 目 的 来 选 择 包 含 或 排 除 段 例 如, 您 可 以 选 择 在 未 来 报 价 中 排 除 某 组 客 户 和 包 含 其 他 客 户, 并 且 可 以 立 即 查 看 这 对 于 整 体 匹 配 率 的 影 响 Decision List 模 型 为 被 包 含 的 段 返 回 得 分 Yes, 为 其 它 段 ( 包 括 剩 余 段 ) 返 回 $null$ 对 评 分 的 这 种 直 接 控 制 使 得 Decision List 模 型 成 为 生 成 邮 件 发 送 清 单 的 理 想 工 具, 而 这 些 模 型 被 广 泛 应 用 于 客 户 关 系 管 理 中, 包 括 呼 叫 中 心 或 市 场 应 用 方 面 图 片 9-2 决 策 列 表 模 型

202 190 章 9 挖 掘 任 务 测 量 和 选 择 建 模 过 程 由 挖 掘 任 务 实 现 每 项 挖 掘 任 务 可 以 有 效 地 启 动 一 次 新 的 建 模, 并 且 会 返 回 一 组 新 的 备 选 模 型 默 认 任 务 基 于 Decision List 节 点 的 初 始 规 范, 您 可 以 定 义 任 意 数 量 的 自 定 义 任 务 还 可 以 重 复 应 用 任 务, 例 如, 您 可 以 在 整 个 训 练 集 合 中 运 行 高 概 率 搜 索, 然 后 在 剩 余 集 合 中 运 行 低 概 率 搜 索 来 除 去 性 能 较 低 的 段 图 片 9-3 创 建 挖 掘 任 务 数 据 选 择 您 可 以 定 义 数 据 选 择 和 自 定 义 模 型 测 量 以 进 行 模 型 构 建 和 评 估 例 如, 可 以 在 挖 掘 任 务 中 指 定 数 据 选 择 以 裁 剪 模 型, 使 之 符 合 具 体 区 域 的 要 求, 并 且 可 以 创 建 自 定 义 测 量 以 评 估 其 就 整 个 国 家 范 围 而 言 的 性 能 优 劣 不 同 于 挖 掘 任 务 的 是, 测 量 并 不 改 变 底 层 模 型 而 是 以 其 它 视 角 对 其 性 能 进 行 评 估

203 191 决 策 表 图 片 9-4 创 建 数 据 选 择 添 加 您 的 业 务 知 识 通 过 微 调 或 扩 展 算 法 识 别 的 段,Decision List Viewer 允 许 您 将 业 务 知 识 并 入 模 型 您 可 以 编 辑 模 型 所 生 成 的 段 或 添 加 基 于 指 定 规 则 的 其 它 段 然 后 可 以 应 用 更 改 并 预 览 结 果 图 片 9-5 指 定 规 则 要 了 解 更 多 详 情,Excel 动 态 链 接 允 许 您 将 数 据 导 出 到 Excel, 用 这 些 数 据 可 以 在 Excel 中 创 建 演 示 图 表 和 计 算 定 制 测 量 ( 例 如 综 合 利 润 和 ROI), 您 可 在 构 建 模 型 的 同 时 在 Decision List Viewer 中 查 看 这 些 自 定 义 测 量 示 例 某 金 融 机 构 的 市 场 部 门 希 望 通 过 向 每 个 客 户 提 供 最 适 合 他 的 报 价 在 未 来 的 商 业 竞 争 中 获 取 更 有 益 的 结 果 使 用 决 策 列 表 模 型 可 以 根 据 以 前 的 销 售 活 动, 识 别 会 对 当 前 活 动 积 极 响 应 的 客 户 应 具 备 哪 些 特 征, 并 根 据 识 别 的 结 果 生 成 邮 件 发 送 清 单 有 关 详 细 信 息, 请 参 阅 第 12 章 中 的 对 客 户 响 应 建 模 ( 决 策 列 表 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南

204 192 章 9 要 求 一 个 表 示 要 预 测 的 二 元 结 果 ( 是 / 否 ) 且 测 量 级 别 为 标 志 或 名 义 的 分 类 目 标 字 段 和 至 少 一 个 输 入 字 段 当 目 标 字 段 类 型 为 名 义 时, 必 须 手 动 选 择 一 个 值 作 为 匹 配 或 响 应 ; 所 有 其 他 值 集 中 在 一 起 作 为 不 匹 配 还 可 以 指 定 一 个 可 选 的 频 数 字 段 连 续 日 期 / 时 间 字 段 将 被 忽 略 使 用 在 建 模 节 点 的 专 家 选 项 卡 上 指 定 的 算 法 对 连 续 数 字 范 围 的 输 入 自 动 分 级 为 了 更 好 地 控 制 分 级, 可 添 加 上 游 分 级 节 点 并 使 用 已 分 级 的 字 段 作 为 测 量 级 别 为 有 序 的 输 入 决 策 列 表 模 型 选 项 图 片 9-6 决 策 列 表 节 点 : 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点

205 193 决 策 表 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 众 数 指 定 用 于 构 建 模 型 的 方 法 生 成 模 型 运 行 节 点 时 自 动 在 模 型 选 项 板 上 生 成 模 型 可 将 生 成 的 模 型 添 加 到 流 中 以 便 评 分, 但 是 此 模 型 无 法 继 续 编 辑 启 动 交 互 会 话 打 开 Decision List Viewer 交 互 建 模 ( 输 出 ) 窗 口, 您 可 选 取 多 个 选 项 并 重 复 应 用 具 有 不 同 设 置 的 算 法 以 逐 渐 构 建 或 修 改 模 型 有 关 详 细 信 息, 请 参 阅 第 197 页 码 Decision List Viewer 使 用 保 存 的 交 互 会 话 信 息 使 用 以 前 保 存 的 设 置 启 动 交 互 会 话 可 以 使 用 Decision List Viewer 中 的 生 成 菜 单 ( 用 于 创 建 模 型 或 建 模 节 点 ) 或 文 件 菜 单 ( 用 于 更 新 从 中 启 动 会 话 的 节 点 ) 保 存 交 互 设 置 目 标 值 指 定 表 示 要 建 模 的 结 果 的 目 标 字 段 的 值 例 如, 如 果 目 标 字 段 流 失 编 码 为 0 = no 和 1 = yes, 指 定 1 可 标 识 指 明 哪 些 记 录 可 能 流 失 的 规 则 查 找 段 表 示 搜 索 目 标 变 量 是 否 应 该 查 找 出 现 的 高 概 率 或 低 概 率 查 找 和 排 除 这 些 段 可 能 对 于 改 善 您 的 模 型 非 常 有 帮 助, 当 剩 下 的 段 为 低 概 率 段 时 尤 其 有 用 最 大 分 段 数 指 定 要 返 回 的 最 大 段 数 创 建 顶 部 的 N 个 段, 其 中 最 好 的 段 是 概 率 最 高 的 段, 如 果 多 个 模 型 具 有 相 同 的 概 率, 则 为 覆 盖 率 最 高 的 段 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 最 小 段 大 小 下 面 的 两 个 设 置 指 定 最 小 段 大 小 两 个 值 中 的 较 大 者 优 先 例 如, 如 果 百 分 比 值 等 于 比 绝 对 值 高 的 数 字, 则 百 分 比 设 置 优 先 以 上 一 个 段 的 百 分 比 表 示 (%) 以 记 录 的 百 分 比 指 定 最 小 组 大 小 允 许 的 最 小 设 置 为 0; 允 许 的 最 大 设 置 为 99.9 以 绝 对 值 表 示 (N) 以 记 录 的 绝 对 数 指 定 最 小 组 大 小 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 段 规 则 最 大 属 性 数 指 定 每 个 段 规 则 的 最 大 条 件 数 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 允 许 重 新 使 用 属 性 如 果 启 用, 则 每 个 周 期 可 以 使 用 所 有 属 性, 即 使 以 前 的 周 期 已 使 用 过 这 些 属 性 段 的 条 件 是 在 周 期 内 构 建 的, 每 个 周 期 都 会 增 加 一 个 新 条 件 周 期 数 使 用 最 大 属 性 数 设 置 定 义 新 条 件 的 置 信 区 间 (%) 指 定 用 于 检 验 段 显 著 性 的 置 信 水 平 此 设 置 在 返 回 的 段 数 ( 如 果 存 在 ) 以 及 每 个 段 规 则 的 条 件 数 中 具 有 非 常 重 要 的 作 用 值 越 高, 返 回 的 结 果 集 越 小 允 许 的 最 小 设 置 为 50; 允 许 的 最 大 设 置 为 99.9

206 194 章 9 决 策 列 表 节 点 专 家 选 项 图 片 9-7 决 策 列 表 节 点 : 专 家 选 项 卡 使 用 专 家 选 项 可 调 整 模 型 构 建 过 程 分 级 方 法 用 于 对 连 续 字 段 进 行 间 隔 的 方 式 ( 相 等 计 数 或 相 等 宽 度 ) 图 条 数 要 为 连 续 字 段 创 建 的 间 隔 数 允 许 的 最 小 设 置 为 2; 没 有 最 大 设 置 模 型 搜 索 宽 度 每 个 周 期 可 用 于 下 一 周 期 的 最 大 模 型 结 果 数 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 规 则 搜 索 宽 度 每 个 周 期 可 用 于 下 一 周 期 的 最 大 规 则 结 果 数 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 间 隔 合 并 因 子 段 与 其 相 邻 段 合 并 时 必 须 增 加 的 最 小 量 允 许 的 最 小 设 置 为 1.01; 没 有 最 大 设 置

207 195 决 策 表 允 许 条 件 中 使 用 缺 失 值 True 表 示 允 许 规 则 中 的 IS MISSING 检 验 丢 弃 中 间 结 果 如 果 为 True, 则 只 返 回 搜 索 过 程 的 最 终 结 果 最 终 结 果 是 不 在 搜 索 过 程 中 进 行 任 何 进 一 步 细 化 的 结 果 如 果 为 False, 则 还 要 返 回 中 间 结 果 最 大 替 代 值 数 指 定 运 行 挖 掘 任 务 后 可 以 返 回 的 最 大 替 代 值 数 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 注 意, 挖 掘 任 务 将 只 返 回 替 代 值 的 实 际 数 量, 最 大 为 指 定 的 最 大 数 量 例 如, 如 果 最 大 数 量 设 为 100, 但 只 找 到 3 个 替 代 值, 则 只 显 示 这 3 个 替 代 值 决 策 列 表 模 型 块 模 型 包 括 一 个 段 列 表, 每 个 段 都 由 规 则 进 行 定 义, 从 而 可 以 选 择 匹 配 的 记 录 在 生 成 模 型 前 可 轻 松 查 看 或 修 改 这 些 段, 并 选 择 包 括 哪 些 段 或 不 包 括 哪 些 段 用 于 评 分 时, 决 策 列 表 模 型 对 于 包 含 的 段 返 回 是, 对 于 所 有 其 他 段 ( 包 括 余 数 ) 返 回 $null$ 对 评 分 的 这 种 直 接 控 制 使 得 决 策 列 表 模 型 成 为 生 成 邮 件 发 送 清 单 的 理 想 工 具, 而 这 些 模 型 被 广 泛 应 用 于 客 户 关 系 管 理 中, 包 括 呼 叫 中 心 或 市 场 应 用 方 面 图 片 9-8 决 策 列 表 模 型 块 运 行 包 含 决 策 列 表 模 型 的 流 时, 节 点 将 添 加 三 个 新 字 段, 包 括 得 分 字 段, 其 中 对 于 包 含 的 字 段 得 分 为 1( 表 示 是 ), 对 于 不 包 含 的 字 段 得 分 为 $null, 用 于 其 中 含 有 记 录 的 段 的 概 率 ( 匹 配 率 ) 字 段, 及 段 的 ID 编 号 字 段 新 字 段 的 名 称 来 自 正 在 预 测 的 输 出 字 段 的 名 称, 前 缀 为 $D- 表 示 得 分 字 段, 前 缀 为 $DP- 表 示 概 率 字 段, 前 缀 为 $DI- 表 示 段 的 ID

208 196 章 9 按 照 构 建 模 型 时 指 定 的 目 标 值 对 模 型 进 行 评 分 可 以 手 动 去 除 某 些 段 以 便 使 它 们 的 得 分 为 $null$ 例 如, 如 果 运 行 低 概 率 搜 索 以 查 找 低 于 平 均 匹 配 率 的 段, 则 这 些 低 匹 配 率 段 的 得 分 将 为 是, 除 非 您 手 动 去 除 这 些 段 如 果 必 要, 可 以 使 用 导 出 节 点 或 过 滤 节 点 将 空 值 重 新 编 码 为 否 PMML 使 用 第 一 个 匹 配 选 择 标 准 可 将 决 策 列 表 模 型 评 分 为 PMML RuleSetModel 但 是, 希 望 所 有 的 规 则 具 有 相 同 的 得 分 为 允 许 对 目 标 字 段 或 目 标 值 进 行 更 改, 可 将 多 个 规 则 集 模 型 存 储 到 一 个 文 件 中 按 顺 序 进 行 应 用, 无 法 与 第 一 个 模 型 匹 配 的 案 例 将 传 递 到 第 二 个 模 型, 依 此 类 推 算 法 名 称 DecisionList 用 于 表 示 此 非 标 准 的 行 为, 且 仅 具 有 该 名 称 的 规 则 集 模 型 可 被 识 别 为 决 策 列 表 模 型 并 如 上 所 述 进 行 评 分 决 策 列 表 模 型 块 设 置 通 过 决 策 列 表 模 型 块 的 设 置 选 项 卡, 您 可 以 获 取 倾 向 得 分, 还 可 以 启 用 或 禁 用 SQL 优 化 只 有 将 模 型 块 添 加 到 流 之 后, 才 可 以 使 用 此 选 项 卡 图 片 9-9 决 策 列 表 模 型 块 设 置 计 算 原 始 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回? 是? 或? 否? 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 除 了 这 些 得 分, 还 有 其 他 在 评 分 过 程 中 生 成 的 预 测 值 和 置 信 度 值 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 得 分 仅 依 赖 于 训 练 数 据, 并 且 由 于 许 多 模 型 过 度 拟 合 此 数 据 的 倾 向, 该 得 分 可 能 会 过 度 优 化 调 整 后 的 倾 向 会 尝 试 通 过 针 对 检 验 或 验 证 分 区 对 模 型 性 能 进 行 评 估 进 行 弥 补 此 选 项 要 求 在 流 中 定 义 分 区 字 段 并 且 在 生 成 模 型 之 前 在 建 模 节 点 中 启 用 调 整 的 倾 向 得 分

209 197 决 策 表 生 成 此 模 型 的 SQL 使 用 数 据 库 中 的 数 据 时,SQL 代 码 可 传 回 到 数 据 库 中 执 行, 从 而 大 大 提 高 许 多 操 作 的 处 理 速 度 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 SQL 优 化 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南 Decision List Viewer 基 于 任 务 的 Decision List Viewer 图 形 界 面 简 单 易 用, 可 消 除 模 型 构 建 过 程 的 复 杂 性, 使 您 免 于 接 触 数 据 挖 掘 技 术 的 低 层 详 细 信 息, 并 且 可 以 将 全 部 精 力 投 入 到 需 要 用 户 参 与 的 分 析 内 容 上, 如 设 置 目 标 选 择 目 标 组 分 析 结 果, 以 及 选 择 最 优 模 型 图 片 9-10 决 策 列 表 交 互 查 看 器 工 作 模 型 窗 格 工 作 模 型 窗 格 将 显 示 当 前 模 型, 包 括 挖 掘 任 务 和 适 用 于 该 工 作 模 型 的 其 他 操 作

210 198 章 9 图 片 9-11 工 作 模 型 窗 格 ID 标 识 连 续 段 顺 序 模 型 段 根 据 其 ID 号 按 顺 序 进 行 计 算 段 规 则 提 供 段 名 称 和 已 定 义 的 段 条 件 默 认 情 况 下, 段 名 称 是 字 段 名 或 条 件 中 使 用 的 连 接 字 段 名 ( 以 逗 号 为 分 隔 符 ) 得 分 表 示 要 预 测 的 字 段, 假 定 其 值 与 其 他 字 段 的 值 ( 预 测 变 量 ) 有 关 注 意 : 以 下 选 项 可 切 换 为 通 过 组 织 模 型 测 量 对 话 框 显 示 涉 及 范 围 该 饼 图 直 观 地 标 识 出 每 个 段 的 涉 及 范 围 与 整 个 涉 及 范 围 的 对 比 情 况 涉 及 范 围 (n) 列 出 每 个 段 相 对 于 整 个 涉 及 范 围 的 涉 及 范 围 量 频 率 列 出 收 到 的 相 对 于 涉 及 范 围 的 匹 配 项 的 数 量 例 如, 如 果 涉 及 范 围 为 79, 频 数 为 50, 则 表 示 在 79 个 之 中 有 50 个 对 所 选 段 进 行 了 响 应 概 率 指 明 段 的 概 率 例 如, 如 果 涉 及 范 围 为 79, 频 数 为 50, 则 表 示 该 段 的 概 率 为 63.29%(50 除 以 79) 错 误 指 明 段 的 错 误 窗 格 底 部 的 信 息 显 示 整 个 模 型 的 涉 及 范 围 频 数 和 概 率 工 作 模 型 工 具 栏 工 作 模 型 窗 格 的 工 具 栏 提 供 了 以 下 功 能 注 意 : 右 键 单 击 模 型 段 也 可 访 问 其 中 某 些 功 能

211 199 决 策 表 表 9-1 工 作 模 型 工 具 栏 按 钮 启 动 生 成 新 的 型 对 话 框, 该 对 话 框 提 供 用 于 创 建 新 模 型 块 的 选 项 保 存 交 互 会 话 的 当 前 状 态 这 会 将 决 策 列 表 建 模 节 点 更 新 为 当 前 设 置, 包 括 挖 掘 任 务 模 型 快 照 数 据 选 择 和 自 定 义 测 量 量 要 将 会 话 恢 复 至 此 状 态, 选 中 建 模 节 点 的 模 型 选 项 卡 中 的 使 用 保 存 的 会 话 信 息 对 话 框, 然 后 单 击 运 行 显 示 组 织 模 型 测 量 对 话 框 有 关 详 细 信 息, 请 参 阅 第 213 页 码 组 织 模 型 测 量 显 示 组 织 数 据 选 择 对 话 框 有 关 详 细 信 息, 请 参 阅 第 207 页 码 组 织 数 据 选 择 显 示 快 照 选 项 卡 有 关 详 细 信 息, 请 参 阅 第 201 页 码 快 照 选 项 卡 显 示 替 代 选 项 卡 有 关 详 细 信 息, 请 参 阅 第 199 页 码 替 代 选 项 卡 获 取 当 前 模 型 结 构 的 快 照 快 照 显 示 在 快 照 选 项 卡 中, 通 常 用 于 模 型 比 较 启 动 插 入 段 对 话 框, 该 对 话 框 提 供 用 于 创 建 新 模 型 段 的 选 项 启 动 编 辑 段 规 则 对 话 框, 该 对 话 框 提 供 的 选 项 可 用 于 将 条 件 添 加 到 模 型 段, 或 更 改 先 前 定 义 的 模 型 段 条 件 在 模 型 层 次 中 将 所 选 段 上 移 在 模 型 层 次 中 将 所 选 段 下 移 删 除 所 选 段 在 模 型 中 包 括 / 排 除 所 选 段 的 情 况 之 间 进 行 切 换 排 除 时, 段 结 果 将 计 入 余 数 不 同 于 删 除 段 的 是, 排 除 段 允 许 您 选 择 重 新 激 活 段 替 代 选 项 卡 单 击 查 找 段 生 成 替 代 选 项 卡, 该 选 项 卡 将 针 对 工 作 模 型 窗 格 中 的 选 定 模 型 或 段 列 出 所 有 替 代 挖 掘 结 果 E 要 将 替 代 模 型 提 升 为 工 作 模 型, 突 出 显 示 所 需 替 代 模 型 并 单 击 加 载 ; 则 替 代 模 型 显 示 在 工 作 模 型 窗 格 中 注 意 : 只 有 当 您 已 在 决 策 列 表 建 模 节 点 专 家 选 项 卡 上 设 置 了 最 大 替 代 值 数 时, 才 会 显 示 替 代 选 项 卡 以 创 建 多 个 替 代 值

212 200 章 9 图 片 9-12 替 代 选 项 卡 每 个 已 生 成 的 模 型 替 代 项 会 显 示 特 定 的 模 型 信 息 : 名 称 每 个 替 代 模 型 都 有 顺 序 编 号 第 一 个 替 代 项 通 常 包 含 最 佳 结 果 目 标 指 明 目 标 值 例 如 :1, 等 于 真 段 数 替 代 模 型 中 所 使 用 的 段 规 则 数 涉 及 范 围 替 代 模 型 的 涉 及 范 围 频 率 相 对 于 涉 及 范 围 的 匹 配 项 的 数 量

213 201 决 策 表 概 率 指 明 替 代 模 型 的 概 率 百 分 比 注 意 : 替 代 结 果 不 会 随 模 型 保 存 ; 结 果 只 在 活 动 会 话 中 有 效 快 照 选 项 卡 快 照 是 模 型 在 特 定 时 间 点 的 视 图 例 如, 如 果 您 需 要 将 另 一 个 替 代 模 型 载 入 工 作 模 型 窗 格 但 不 希 望 失 去 当 前 模 型 的 相 关 工 作, 则 可 以 获 取 模 型 快 照 快 照 选 项 卡 将 列 出 在 任 意 数 量 的 工 作 模 型 状 态 下 手 动 获 取 的 所 有 模 型 快 照 注 意 : 快 照 将 随 模 型 保 存 我 们 建 议 在 您 加 载 首 个 模 型 时 执 行 快 照 该 快 照 用 于 保 存 原 始 模 型 结 构, 从 而 确 保 您 可 随 时 返 回 原 始 模 型 状 态 生 成 的 快 照 名 称 显 示 为 时 间 戳, 指 示 其 生 成 时 间 创 建 模 型 快 照 E 选 择 要 在 工 作 模 型 窗 格 中 显 示 的 适 当 的 模 型 / 替 代 项 E 对 该 工 作 模 型 进 行 必 要 的 更 改 E 单 击 执 行 快 照 此 时 将 在 快 照 选 项 卡 中 显 示 一 个 新 快 照

214 202 章 9 图 片 9-13 快 照 选 项 卡 名 称 快 照 名 称 您 可 以 双 击 快 照 名 称 对 其 进 行 更 改 目 标 指 明 目 标 值 例 如 :1, 等 于 真 段 数 模 型 中 所 使 用 的 段 规 则 数 涉 及 范 围 模 型 的 涉 及 范 围 频 率 相 对 于 涉 及 范 围 的 匹 配 项 的 数 量 概 率 指 明 模 型 的 概 率 百 分 比 E 要 将 快 照 提 升 为 工 作 模 型, 突 出 显 示 所 需 快 照 并 单 击 加 载 ; 则 快 照 模 型 显 示 在 工 作 模 型 窗 格 中 E 可 通 过 以 下 方 法 删 除 快 照 : 单 击 删 除, 或 右 键 单 击 快 照, 然 后 在 菜 单 中 选 择 删 除

215 203 决 策 表 使 用 Decision List Viewer 将 以 最 佳 方 式 预 测 客 户 响 应 和 行 为 的 模 型 是 通 过 多 个 阶 段 进 行 构 建 的 启 动 Decision List Viewer 时, 工 作 模 型 将 填 入 已 定 义 的 模 型 段 和 测 量 量, 并 且 准 备 就 绪, 等 待 您 启 动 挖 掘 任 务 根 据 需 要 修 改 段 / 测 量 量, 并 生 成 新 的 模 型 或 建 模 节 点 您 可 添 加 一 个 或 多 个 段 规 则, 直 到 获 得 满 意 的 模 型 可 以 通 过 运 行 挖 掘 任 务 或 使 用 编 辑 段 规 则 功 能 为 模 型 添 加 段 规 则 在 模 型 构 建 过 程 中, 您 可 以 对 模 型 的 性 能 进 行 评 估, 方 法 是 根 据 测 量 数 据 验 证 模 型 在 图 表 中 对 图 形 进 行 可 视 化 处 理, 或 生 成 自 定 义 Excel 测 量 量 肯 定 模 型 的 质 量 后, 您 可 以 生 成 新 模 型 并 将 其 置 于 IBM SPSS Modeler 工 作 区 或 模 型 选 项 板 中 挖 掘 任 务 挖 掘 任 务 是 确 定 新 规 则 生 成 方 式 的 参 数 的 集 合 其 中 某 些 参 数 是 可 以 选 择 的, 以 便 为 您 提 供 使 模 型 适 应 新 状 况 的 灵 活 性 任 务 由 任 务 模 板 ( 类 型 ) 目 标 和 构 建 选 择 ( 挖 掘 数 据 集 ) 组 成 下 列 各 部 分 详 细 介 绍 各 种 挖 掘 任 务 操 作 : 运 行 挖 掘 任 务 创 建 和 编 辑 挖 掘 任 务 组 织 数 据 选 择 运 行 挖 掘 任 务 Decision List Viewer 允 许 您 为 模 型 手 动 添 加 段 规 则, 方 法 是 运 行 挖 掘 任 务 或 在 模 型 之 间 复 制 和 粘 贴 段 规 则 挖 掘 任 务 包 含 有 关 如 何 生 成 新 段 规 则 的 信 息 ( 数 据 挖 掘 参 数 设 置, 如 搜 索 策 略 源 属 性 搜 索 宽 度 置 信 水 平 等 ) 待 预 测 的 客 户 行 为, 以 及 要 调 查 的 数 据 挖 掘 任 务 的 目 标 是 搜 索 可 能 的 最 佳 段 规 则 要 通 过 运 行 挖 掘 任 务 生 成 模 型 段 规 则, 请 执 行 下 列 操 作 : E 单 击 余 数 行 如 果 工 作 模 型 窗 格 中 已 有 显 示 的 段, 您 也 可 以 选 择 其 中 某 一 个, 根 据 所 选 段 查 找 其 他 规 则 选 择 余 数 或 段 之 后, 可 采 用 下 列 方 法 之 一 生 成 模 型 或 替 代 模 型 : 从 工 具 菜 单 选 择 查 找 段 右 键 单 击 余 数 行 / 段, 然 后 选 择 查 找 段 单 击 工 作 模 型 窗 格 上 的 查 找 段 按 钮 在 任 务 处 理 过 程 中, 进 度 将 在 工 作 区 底 部 显 示, 并 在 任 务 完 成 时 提 示 您 任 务 完 成 所 用 的 时 间 完 全 取 决 于 挖 掘 任 务 的 复 杂 性 以 及 数 据 集 的 大 小 如 果 结 果 中 只 有 一 个 模 型, 则 任 务 完 成 后 它 将 立 即 显 示 在 工 作 模 型 窗 格 上 ; 但 是, 如 果 结 果 包 含 多 个 模 型, 则 模 型 显 示 在 替 代 选 项 卡 上 注 意 : 任 务 结 果 将 为 : 完 成 并 更 新 模 型 或 完 成 但 不 更 新 模 型 抑 或 失 败 可 以 重 复 查 找 新 段 规 则 的 过 程, 直 到 不 再 有 新 规 则 添 加 到 模 型 中 这 表 示 已 找 到 所 有 有 意 义 的 客 户 组

216 204 章 9 可 以 对 任 何 现 有 的 模 型 段 运 行 挖 掘 任 务 如 果 对 任 务 的 结 果 不 满 意, 您 可 以 选 择 对 同 一 模 型 段 启 动 另 一 个 挖 掘 任 务 此 操 作 将 基 于 所 选 段 提 供 找 到 的 其 他 规 则 位 于 所 选 段 下 方 的 段 ( 即, 在 所 选 段 之 后 添 加 到 模 型 的 段 ) 将 被 新 段 替 代, 因 为 每 个 段 都 取 决 于 其 前 项 创 建 和 编 辑 挖 掘 任 务 挖 掘 任 务 是 搜 索 组 成 数 据 模 型 的 规 则 集 合 的 机 制 除 所 选 模 板 中 定 义 的 搜 索 条 件 外, 任 务 还 会 定 义 目 标 ( 激 发 分 析 的 实 际 问 题, 如 有 多 少 客 户 可 能 对 邮 件 做 出 响 应 ), 并 标 识 要 使 用 的 数 据 集 挖 掘 任 务 的 目 标 是 搜 索 可 能 的 最 佳 模 型 创 建 挖 掘 任 务 要 创 建 挖 掘 任 务, 请 执 行 下 列 操 作 : E 选 择 要 在 其 中 挖 掘 其 他 段 条 件 的 段 E E 单 击 设 置 此 时 将 打 开 创 建 / 编 辑 挖 掘 任 务 对 话 框 该 对 话 框 提 供 用 于 定 义 挖 掘 任 务 的 选 项 进 行 必 要 的 更 改 并 单 击 确 定 返 回 到 工 作 模 型 窗 格 Decision List Viewer 使 用 默 认 设 置 运 行 每 个 任 务, 直 到 选 择 了 替 代 任 务 或 设 置 E 单 击 查 找 段 以 启 动 选 定 段 上 的 挖 掘 任 务 编 辑 挖 掘 任 务 创 建 / 编 辑 挖 掘 任 务 对 话 框 提 供 的 选 项 可 用 于 定 义 新 的 挖 掘 任 务 或 编 辑 现 有 挖 掘 任 务 可 用 于 挖 掘 任 务 的 大 部 分 参 数 与 决 策 列 表 节 点 中 提 供 的 参 数 类 似 例 外 显 示 如 下 有 关 详 细 信 息, 请 参 阅 第 192 页 码 决 策 列 表 模 型 选 项

217 205 决 策 表 图 片 9-14 创 建 / 编 辑 挖 掘 任 务 对 话 框 加 载 设 置 : 当 您 创 建 了 多 个 挖 掘 任 务 时, 选 择 所 需 任 务 新 建... 单 击 以 基 于 当 前 显 示 任 务 的 设 置 新 建 挖 掘 任 务 Target 目 标 字 段 : 表 示 要 预 测 的 字 段, 假 定 其 值 与 其 他 字 段 的 值 ( 预 测 变 量 ) 有 关 目 标 值 指 定 表 示 要 建 模 的 结 果 的 目 标 字 段 的 值 例 如, 如 果 目 标 字 段 流 失 编 码 为 0 = no 和 1 = yes, 指 定 1 可 标 识 指 明 哪 些 记 录 可 能 流 失 的 规 则 简 单 设 置 最 大 替 代 值 数 指 定 运 行 挖 掘 任 务 后 将 显 示 的 替 代 值 数 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置

218 206 章 9 专 家 设 置 编 辑... 打 开 编 辑 高 级 参 数 对 话 框, 您 可 在 其 中 定 义 高 级 设 置 有 关 详 细 信 息, 请 参 阅 第 206 页 码 编 辑 高 级 参 数 Data 构 建 选 择 提 供 的 选 项 用 于 指 定 Decision List Viewer 应 对 其 进 行 分 析 以 查 找 新 规 则 的 评 估 尺 度 列 出 的 评 估 尺 度 在 组 织 数 据 选 择 对 话 框 中 进 行 创 建 / 编 辑 可 用 字 段 提 供 显 示 所 有 字 段 或 手 动 选 择 要 显 示 的 字 段 的 选 项 编 辑... 如 果 已 选 择 自 定 义 选 项, 会 打 开 自 定 义 可 用 字 段 对 话 框, 您 可 在 其 中 选 择 通 过 挖 掘 任 务 找 到 的 可 用 作 段 属 性 的 字 段 有 关 详 细 信 息, 请 参 阅 第 207 页 码 自 定 义 可 用 字 段 编 辑 高 级 参 数 图 片 9-15 高 级 参 数 编 辑 高 级 参 数 对 话 框 提 供 以 下 配 置 选 项 分 级 方 法 用 于 对 连 续 字 段 进 行 间 隔 的 方 式 ( 相 等 计 数 或 相 等 宽 度 ) 图 条 数 要 为 连 续 字 段 创 建 的 间 隔 数 允 许 的 最 小 设 置 为 2; 没 有 最 大 设 置 模 型 搜 索 宽 度 每 个 周 期 可 用 于 下 一 周 期 的 最 大 模 型 结 果 数 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 规 则 搜 索 宽 度 每 个 周 期 可 用 于 下 一 周 期 的 最 大 规 则 结 果 数 允 许 的 最 小 设 置 为 1; 没 有 最 大 设 置 间 隔 合 并 因 子 段 与 其 相 邻 段 合 并 时 必 须 增 加 的 最 小 量 允 许 的 最 小 设 置 为 1.01; 没 有 最 大 设 置 允 许 条 件 中 使 用 缺 失 值 True 表 示 允 许 规 则 中 的 IS MISSING 检 验 丢 弃 中 间 结 果 如 果 为 True, 则 只 返 回 搜 索 过 程 的 最 终 结 果 最 终 结 果 是 不 在 搜 索 过 程 中 进 行 任 何 进 一 步 细 化 的 结 果 如 果 为 False, 则 还 要 返 回 中 间 结 果

219 207 决 策 表 自 定 义 可 用 字 段 图 片 9-16 自 定 义 可 用 字 段 对 话 框 使 用 自 定 义 可 用 字 段 对 话 框, 可 以 选 择 通 过 挖 掘 任 务 找 到 的 可 用 作 段 属 性 的 字 段 可 用 列 出 当 前 可 用 作 段 属 性 的 字 段 要 从 列 表 中 删 除 字 段, 请 选 择 适 当 的 字 段, 然 后 单 击 删 除 >> 此 时 所 选 字 段 将 从 可 用 列 表 移 至 不 可 用 列 表 不 可 用 列 出 不 可 用 作 段 属 性 的 字 段 要 将 字 段 包 括 在 可 用 列 表 中, 请 选 择 适 当 的 字 段, 然 后 单 击 << 添 加 此 时 所 选 字 段 将 从 不 可 用 列 表 移 至 可 用 列 表 组 织 数 据 选 择 通 过 组 织 数 据 选 择 ( 挖 掘 数 据 集 ), 可 以 指 定 Decision List Viewer 应 对 哪 些 评 估 尺 度 进 行 分 析 以 查 找 新 规 则, 并 选 择 要 用 作 尺 度 基 准 的 数 据 选 择 要 组 织 数 据 选 择, 请 执 行 下 列 操 作 : E 从 工 具 菜 单 中 选 择 组 织 数 据 选 择, 或 右 键 单 击 某 个 段 并 选 择 该 选 项 此 时 将 打 开 组 织 数 据 选 择 对 话 框

220 208 章 9 图 片 9-17 组 织 数 据 选 择 对 话 框 注 意 : 组 织 数 据 选 择 对 话 框 也 可 用 于 编 辑 或 删 除 现 有 的 数 据 选 择 E 单 击 添 加 新 的 数 据 选 择 按 钮 此 时 会 将 一 个 新 的 数 据 选 择 条 目 添 加 到 现 有 的 表 中 E 单 击 名 称 并 输 入 适 当 的 选 择 名 称 E 单 击 分 区 并 选 择 适 当 的 分 区 类 型 E 单 击 条 件 并 选 择 适 当 的 条 件 选 项 如 果 选 择 指 定, 则 会 打 开 指 定 选 择 条 件 对 话 框, 其 中 包 含 定 义 特 定 字 段 条 件 的 选 项 图 片 9-18 指 定 选 择 条 件 对 话 框 E 定 义 适 当 的 条 件, 然 后 单 击 确 定 通 过 创 建 / 编 辑 挖 掘 任 务 对 话 框 中 的 构 建 选 择 下 拉 列 表 可 访 问 这 些 数 据 选 择 使 用 该 列 表 可 选 择 用 于 特 定 挖 掘 任 务 的 评 估 尺 度

221 209 决 策 表 段 规 则 通 过 运 行 基 于 任 务 模 板 的 挖 掘 任 务, 可 以 查 找 模 型 段 规 则 您 可 以 使 用 插 入 段 或 编 辑 段 规 则 功 能 手 动 为 模 型 添 加 段 规 则 如 果 选 择 挖 掘 新 的 段 规 则, 结 果 ( 如 果 有 ) 将 在 交 互 列 表 对 话 框 的 查 看 器 选 项 卡 中 显 示 通 过 从 模 型 作 品 集 对 话 框 中 选 择 替 代 结 果, 并 单 击 加 载, 可 以 快 速 精 练 您 的 模 型 这 样, 您 可 以 尝 试 不 同 结 果, 直 到 准 备 好 构 建 出 准 确 描 述 最 佳 目 标 组 的 模 型 插 入 段 您 可 以 使 用 插 入 段 功 能 手 动 为 模 型 添 加 段 规 则 要 将 段 规 则 条 件 添 加 到 模 型, 请 执 行 下 列 操 作 : E 在 交 互 列 表 对 话 框 中, 选 择 您 要 添 加 新 段 的 位 置 新 段 将 直 接 插 在 所 选 段 的 上 方 E 在 编 辑 菜 单 中, 选 择 插 入 段 或 通 过 右 键 单 击 段 访 问 此 选 项 此 时 将 打 开 插 入 段 对 话 框, 通 过 该 对 话 框 可 插 入 新 的 段 规 则 条 件 E 单 击 插 入 此 时 将 打 开 插 入 条 件 对 话 框, 通 过 该 对 话 框 可 以 定 义 新 规 则 条 件 的 属 性 E 从 下 拉 列 表 中 选 择 字 段 和 运 算 符 注 意 : 如 果 选 择 不 在 运 算 符, 则 所 选 条 件 将 作 为 排 除 条 件, 并 在 插 入 规 则 对 话 框 中 显 示 为 红 色 例 如, 当 条 件 region = 'TOWN' 显 示 为 红 色 时, 表 示 结 果 集 中 不 包 括 TOWN E 输 入 一 个 或 多 个 值, 或 者 单 击 插 入 值 图 标, 以 显 示 插 入 值 对 话 框 对 话 框 允 许 您 选 择 为 选 定 字 段 定 义 的 值 例 如, 字 段 已 婚 将 提 供 值 是 和 否 E 单 击 确 定 返 回 插 入 段 对 话 框 再 次 单 击 确 定 将 所 创 建 的 段 添 加 到 模 型 中 此 时 该 新 段 将 显 示 在 指 定 的 模 型 位 置 编 辑 段 规 则 使 用 编 辑 段 规 则 功 能, 可 以 添 加 更 改 或 删 除 段 规 则 条 件 要 更 改 段 规 则 条 件, 请 执 行 下 列 操 作 : E 选 择 要 编 辑 的 模 型 段

222 210 章 9 E 从 编 辑 菜 单 选 择 编 辑 段 规 则, 或 右 键 单 击 规 则 以 访 问 此 选 项 此 时 将 打 开 编 辑 段 规 则 对 话 框 E 选 择 适 当 的 条 件, 然 后 单 击 编 辑 此 时 将 打 开 编 辑 条 件 对 话 框, 通 过 该 对 话 框 可 以 定 义 所 选 规 则 条 件 的 属 性 E 从 下 拉 列 表 中 选 择 字 段 和 运 算 符 注 意 : 如 果 选 择 不 在 运 算 符, 则 所 选 条 件 将 作 为 排 除 条 件, 并 在 编 辑 段 规 则 对 话 框 中 显 示 为 红 色 例 如, 当 条 件 region = 'TOWN' 显 示 为 红 色 时, 表 示 结 果 集 中 不 包 括 TOWN E 输 入 一 个 或 多 个 值, 或 单 击 插 入 值 按 钮 以 显 示 插 入 值 对 话 框 对 话 框 允 许 您 选 择 为 选 定 字 段 定 义 的 值 例 如, 字 段 已 婚 将 提 供 值 是 和 否 E 单 击 确 定 返 回 到 编 辑 段 规 则 对 话 框 再 次 单 击 确 定 返 回 工 作 模 型 此 时 所 选 择 的 段 将 与 更 新 的 规 则 条 件 一 起 显 示 删 除 段 规 则 条 件 要 删 除 段 规 则 条 件, 请 执 行 下 列 操 作 : E 选 择 包 含 要 删 除 的 规 则 条 件 的 模 型 段 E 从 编 辑 单 中 选 择 编 辑 段 规 则, 或 右 键 单 击 段 以 访 问 此 选 项 此 时 将 打 开 编 辑 段 规 则 对 话 框, 您 可 在 其 中 删 除 一 个 或 多 个 段 规 则 条 件 E 选 择 适 当 的 规 则 条 件, 然 后 单 击 删 除 E 单 击 确 定 删 除 一 个 或 多 个 段 规 则 条 件 将 使 工 作 模 型 窗 格 刷 新 其 测 量 度 量 复 制 段 Decision List Viewer 为 您 提 供 了 一 种 复 制 模 型 段 的 简 便 方 法 如 果 要 将 一 个 模 型 中 的 段 应 用 于 另 一 个 模 型 时, 只 需 将 该 段 从 一 个 模 型 复 制 ( 或 剪 切 ) 并 粘 贴 到 另 一 个 模 型 中 即 可 此 外, 您 还 可 以 从 替 代 预 览 窗 格 中 显 示 的 模 型 复 制 段 并 将 其 粘 贴 到 工 作 模 型 窗 格 中 显 示 的 模 型 中 这 些 剪 切 复 制 和 粘 贴 功 能 使 用 系 统 剪 贴 板 存 储 或 检 索 临 时 数 据 这 意 味 着 将 在 剪 贴 板 中 复 制 条 件 和 目 标 剪 贴 板 内 容 不 仅 仅 保 留 用 于 Decision List Viewer, 也 可 以 粘 贴 在 其 他 应 用 程 序 中 例 如, 在 文 本 编 辑 器 中 粘 贴 剪 贴 板 内 容 时, 会 以 XML 格 式 粘 贴 条 件 和 目 标 要 复 制 或 剪 切 模 型 段, 请 执 行 下 列 操 作 : E 选 择 要 在 其 他 模 型 中 使 用 的 模 型 段 E 从 编 辑 菜 单 中 选 择 复 制 ( 或 剪 切 ), 或 右 键 单 击 模 型 段 并 选 择 复 制 或 剪 切 E 打 开 适 当 的 模 型 ( 将 在 其 中 粘 贴 模 型 段 的 模 型 )

223 211 决 策 表 E 选 择 某 个 模 型 段, 然 后 单 击 粘 贴 注 意 : 除 了 剪 切 复 制 和 粘 贴 命 令 外, 还 可 以 使 用 组 合 键 :Ctrl+X Ctrl+C 和 Ctrl+V 复 制 ( 剪 切 ) 的 段 将 插 入 先 前 选 择 的 模 型 段 上 方 粘 贴 的 段 和 下 方 段 的 测 量 量 将 重 新 计 算 注 意 : 此 过 程 中 的 两 个 模 型 必 须 以 同 一 基 础 模 型 模 板 为 基 准, 并 包 含 相 同 的 目 标, 否 则 将 显 示 错 误 消 息 替 代 模 型 当 有 多 个 结 果 时, 替 代 选 项 卡 显 示 每 个 挖 掘 任 务 的 结 果 每 个 结 果 包 含 所 选 数 据 中 与 目 标 最 接 近 匹 配 的 条 件, 以 及 所 有 相 当 匹 配 的 替 代 项 显 示 的 替 代 项 总 数 取 决 于 分 析 过 程 中 采 用 的 搜 索 条 件 要 查 看 替 代 模 型, 请 执 行 下 列 操 作 : E E 单 击 替 代 选 项 卡 上 的 替 代 模 型 在 替 代 预 览 窗 格 中, 替 代 模 型 段 显 示 或 替 代 当 前 模 型 段 要 在 工 作 模 型 窗 格 中 使 用 替 代 模 型, 在 替 代 预 览 窗 格 中 选 择 模 型 并 单 击 加 载, 或 在 替 代 选 项 卡 上 右 键 单 击 替 代 模 型 名 称 并 选 择 加 载 注 意 : 生 成 新 模 型 时, 不 会 保 存 替 代 模 型 自 定 义 模 型 数 据 不 是 静 态 的 客 户 会 迁 移 结 婚 和 更 换 工 作 产 品 会 随 之 失 去 市 场 焦 点 并 作 废 Decision List Viewer 为 商 业 用 户 提 供 了 方 便 迅 速 地 使 模 型 适 应 新 状 况 的 灵 活 性 您 可 通 过 编 辑 设 置 优 先 级 删 除 或 停 用 特 定 模 型 段 来 更 改 模 型 为 段 设 置 优 先 级 您 可 选 择 任 意 顺 序, 对 模 型 规 则 进 行 排 列 默 认 情 况 下, 模 型 段 按 优 先 级 顺 序 显 示, 第 一 个 段 具 有 最 高 优 先 级 当 您 为 一 个 或 多 个 段 指 定 不 同 的 优 先 级 时, 模 型 会 发 生 相 应 的 更 改 您 可 以 根 据 需 要 通 过 将 段 移 至 较 高 或 较 低 的 优 先 级 位 置 来 更 改 模 型 要 为 模 型 段 设 置 优 先 级, 请 执 行 下 列 操 作 : E 选 择 要 为 其 指 定 不 同 优 先 级 的 模 型 段 E 单 击 工 作 模 型 窗 格 工 具 栏 中 的 两 个 箭 头 按 钮 之 一, 将 所 选 模 型 段 在 列 表 中 上 移 或 下 移 设 置 优 先 级 后, 会 重 新 计 算 先 前 的 所 有 评 估 结 果, 并 显 示 新 值 删 除 段 要 删 除 一 个 或 多 个 段, 请 执 行 下 列 操 作 :

224 212 章 9 E 选 择 模 型 段 E 从 编 辑 菜 单 中 选 择 删 除 段, 或 在 工 作 模 型 窗 格 的 工 具 栏 中 单 击 删 除 按 钮 测 量 量 将 针 对 修 改 后 的 模 型 重 新 计 算, 模 型 也 会 发 生 相 应 的 更 改 排 除 段 在 搜 索 特 定 组 时, 您 可 能 会 将 一 部 分 模 型 段 作 为 商 业 操 作 的 基 准 部 署 模 型 时, 您 可 能 会 选 择 排 除 模 型 中 的 某 些 段 排 除 的 段 作 为 空 值 进 行 评 分 排 除 某 个 段 并 不 代 表 不 使 用 该 段, 而 是 从 邮 件 列 表 中 排 除 与 该 规 则 匹 配 的 所 有 记 录 该 规 则 仍 在 应 用, 但 方 式 不 同 要 排 除 特 定 的 模 型 段, 请 执 行 下 列 操 作 : E 在 工 作 模 型 窗 格 中 选 择 一 个 段 E 在 工 作 模 型 窗 格 的 工 具 栏 中 单 击 切 换 段 排 除 按 钮 此 时 将 在 所 选 段 的 所 选 目 标 列 中 显 示 已 排 除 注 意 : 与 删 除 的 段 不 同, 已 排 除 的 段 在 最 终 模 型 中 仍 可 供 重 复 使 用 已 排 除 的 段 仍 将 影 响 图 表 结 果 更 改 目 标 值 使 用 更 改 目 标 值 对 话 框, 可 以 更 改 当 前 目 标 字 段 的 目 标 值 与 工 作 模 型 具 有 不 同 目 标 值 的 快 照 和 会 话 结 果 会 通 过 将 该 行 的 表 背 景 变 为 黄 色 进 行 标 识 这 表 示 该 快 照 / 会 话 结 果 已 过 时 创 建 / 编 辑 挖 掘 任 务 对 话 框 将 显 示 当 前 工 作 模 型 的 目 标 值 该 目 标 值 不 会 随 挖 掘 任 务 保 存, 而 是 取 自 工 作 模 型 的 值 当 您 将 某 个 与 当 前 工 作 模 型 具 有 不 同 目 标 值 的 已 保 存 模 型 提 升 为 工 作 模 型 ( 例 如, 通 过 编 辑 替 代 结 果 或 编 辑 快 照 副 本 ) 时, 已 保 存 模 型 的 目 标 值 将 更 改 为 工 作 模 型 的 目 标 值 ( 工 作 模 型 窗 格 中 显 示 的 目 标 值 不 会 更 改 ) 模 型 度 量 将 根 据 新 目 标 重 新 计 算 生 成 新 的 型 生 成 新 模 型 对 话 框 提 供 的 选 项 可 用 于 命 名 模 型 并 选 择 创 建 新 节 点 的 位 置 模 型 名 称 选 择 自 定 义 可 调 整 自 动 生 成 的 名 称, 或 为 流 工 作 区 中 显 示 的 节 点 创 建 唯 一 名 称 创 建 节 点 位 置 选 择 工 作 区 会 将 新 模 型 置 于 工 作 区 中 ; 选 择 GM 选 项 板 会 将 新 模 型 置 于 模 型 选 项 板 中 ; 选 择 两 者 会 将 新 模 型 同 时 置 于 工 作 区 和 模 型 选 项 板 中 包 括 交 互 会 话 状 态 如 果 启 用 此 选 项, 则 会 在 生 成 的 模 型 中 保 留 交 互 会 话 状 态 稍 后 根 据 模 型 生 成 建 模 节 点 时, 该 状 态 将 继 续 传 递 并 用 于 初 始 化 交 互 会 话 无 论 是 否 选 择 此 选 项, 模 型 本 身 对 新 数 据 的 评 分 方 式 都 是 相 同 的 如 果 未 选 择 此 选 项, 模 型 仍 然 可 以 创 建 构 建 节 点, 但 该 节 点 将 更 为 一 般 化, 它 会 启 动 新 的 交 互 会 话 而 不 是 从 原 有 会 话 停

225 213 决 策 表 止 的 位 置 继 续 前 进 如 果 更 改 节 点 设 置 但 以 保 存 的 某 种 状 态 执 行, 则 会 忽 略 已 更 改 的 设 置 以 采 用 保 存 状 态 的 设 置 注 意 : 标 准 度 量 是 唯 一 随 模 型 保 留 的 度 量 其 他 度 量 将 保 留 在 交 互 状 态 生 成 的 模 型 不 会 显 示 已 保 存 的 交 互 挖 掘 任 务 状 态 启 动 Decision List Viewer 时, 它 会 显 示 通 过 查 看 器 所 做 的 初 始 设 置 有 关 详 细 信 息, 请 参 阅 第 58 页 码 第 3 章 中 的 重 新 生 成 建 模 节 点 模 型 评 估 成 功 的 建 模 需 要 在 生 产 环 境 中 执 行 实 施 之 前 进 行 谨 慎 的 模 型 评 估 Decision List Viewer 提 供 了 可 用 于 评 估 模 型 实 际 应 用 效 果 的 多 种 统 计 测 量 量 和 商 业 测 量 量 其 中 包 括 收 益 图 表 和 与 Excel 的 全 面 互 操 作, 从 而 实 现 成 本 / 收 益 方 案 的 模 拟, 以 便 评 估 部 署 的 作 用 您 可 采 用 以 下 方 式 评 估 自 己 的 模 型 : 使 用 Decision List Viewer 中 提 供 的 预 定 义 的 统 计 测 量 量 和 商 业 模 型 测 量 量 ( 概 率 频 数 ) 评 估 从 Microsoft Excel 中 导 入 的 测 量 量 使 用 收 益 图 表 对 模 型 进 行 可 视 化 处 理 组 织 模 型 测 量 Decision List Viewer 提 供 了 用 于 定 义 按 列 计 算 并 显 示 的 测 量 量 的 选 项 每 个 段 可 包 括 默 认 的 涉 及 范 围 频 数 概 率 和 错 误 等 测 量 量, 按 列 显 示 此 外, 您 也 可 以 创 建 将 按 列 显 示 的 新 测 量 量 定 义 模 型 测 量 要 为 模 型 添 加 测 量 量 或 定 义 现 有 的 测 量 量, 请 执 行 下 列 操 作 : E 从 工 具 菜 单 中 选 择 组 织 模 型 测 量, 或 右 键 单 击 模 型 以 选 择 此 选 项 此 时 将 打 开 组 织 模 型 测 量 对 话 框

226 214 章 9 图 片 9-19 组 织 模 型 测 量 对 话 框 E 单 击 添 加 新 的 模 型 测 量 按 钮 ( 位 于 显 示 列 右 侧 ) 此 时 将 在 表 中 显 示 一 个 新 的 测 量 量 E E 提 供 测 量 量 名 称, 并 选 择 适 当 的 类 型 显 示 选 项 和 选 择 显 示 列 指 示 是 否 为 工 作 模 型 显 示 测 量 定 义 现 有 测 量 量 时, 请 选 择 适 当 的 度 量 和 选 择, 并 指 定 该 度 量 是 否 将 在 工 作 模 型 中 显 示 单 击 确 定 返 回 Decision List Viewer 工 作 区 如 果 已 选 中 新 测 量 的 显 示 列, 则 会 为 工 作 模 型 显 示 该 新 测 量 Excel 中 的 自 定 义 度 量 有 关 详 细 信 息, 请 参 阅 第 215 页 码 Excel 中 的 评 估 刷 新 测 量 在 某 些 特 定 情 况 下, 可 能 需 要 重 新 计 算 模 型 测 量, 例 如 对 一 组 新 客 户 应 用 现 有 模 型 时 要 重 新 计 算 ( 刷 新 ) 模 型 测 量, 请 执 行 下 列 操 作 : 在 编 辑 菜 单 中 选 择 刷 新 所 有 测 量 量 或 按 F5 此 时 将 重 新 计 算 所 有 测 量 量, 并 针 对 工 作 模 型 显 示 新 值

227 215 决 策 表 Excel 中 的 评 估 Decision List Viewer 可 与 Microsoft Excel 集 成, 使 您 可 以 在 模 型 构 建 过 程 中 直 接 使 用 自 己 的 值 计 算 和 利 润 公 式, 以 模 拟 成 本 / 收 益 方 案 与 Excel 的 链 接 使 您 可 以 将 数 据 导 出 至 Excel( 数 据 在 其 中 可 用 于 创 建 演 示 图 表 ) 计 算 自 定 义 测 量 量 ( 如 复 杂 利 润 和 ROI 测 量 量 ), 并 且 可 以 在 构 建 模 型 时 通 过 Decision List Viewer 查 看 这 些 测 量 量 有 关 详 细 信 息, 请 参 阅 第 12 章 中 的 使 用 Excel 计 算 自 定 义 测 量 量 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 注 意 : 要 使 用 Excel 电 子 表 格, 必 须 由 CRM 分 析 专 家 针 对 Decision List Viewer 与 Microsoft Excel 的 同 步 定 义 配 置 信 息 该 配 置 包 含 于 Excel 电 子 表 格 文 件 中, 用 于 指 明 Decision List Viewer 与 Excel 之 间 相 互 传 输 的 信 息 以 下 步 骤 仅 在 已 安 装 MS Excel 的 情 况 下 有 效 如 果 未 安 装 Excel, 则 不 会 显 示 使 模 型 与 Excel 同 步 的 选 项 要 使 模 型 与 MS Excel 同 步, 请 执 行 下 列 操 作 : E 打 开 模 型, 运 行 交 互 会 话, 并 从 工 具 菜 单 中 选 择 组 织 模 型 测 量 E E E 为 计 算 Excel 中 的 自 定 义 测 量 量 选 项 选 择 是 此 时 将 激 活 工 作 簿 字 段, 您 可 在 其 中 选 择 预 先 配 置 的 Excel 工 作 簿 模 板 单 击 连 接 到 Excel 按 钮 此 时 将 打 开 打 开 对 话 框, 您 可 在 其 中 导 航 至 预 先 配 置 的 模 板 在 本 地 或 网 络 文 件 系 统 中 的 位 置 选 择 适 当 的 Excel 模 板, 然 后 单 击 打 开 此 时 将 启 动 所 选 的 Excel 模 板 ; 使 用 Windows 任 务 栏 ( 或 按 Alt+Tab) 返 回 到 选 择 自 定 义 测 量 的 输 入 对 话 框 E 在 Excel 模 板 中 定 义 的 度 量 名 称 与 模 型 度 量 名 称 之 间 选 择 适 当 的 映 射, 然 后 单 击 确 定 建 立 链 接 后,Excel 将 立 即 采 用 预 先 配 置 的 Excel 模 板 启 动, 该 模 板 以 电 子 表 格 显 示 模 型 规 则 Excel 中 的 计 算 结 果 在 Decision List Viewer 中 显 示 为 新 列 注 意 : 保 存 模 型 时, 不 会 保 留 Excel 度 量 ; 度 量 只 在 活 动 会 话 中 有 效 但 是, 您 可 以 创 建 包 括 Excel 度 量 的 快 照 在 快 照 视 图 中 保 存 的 Excel 度 量 仅 适 用 于 历 史 比 较, 在 重 新 打 开 时 不 会 刷 新 有 关 详 细 信 息, 请 参 阅 第 201 页 码 快 照 选 项 卡 Excel 度 量 不 会 在 快 照 中 显 示, 直 到 重 新 建 立 与 Excel 模 板 的 连 接 为 止 MS Excel 集 成 设 置 Decision List Viewer 与 Microsoft Excel 的 集 成 是 通 过 使 用 预 先 配 置 的 Excel 电 子 表 格 模 板 实 现 的 该 模 板 由 以 下 三 个 工 作 表 组 成 : 模 型 测 量 显 示 导 入 的 Decision List Viewer 测 量 量 自 定 义 Excel 测 量 量, 以 及 计 算 总 计 ( 在 设 置 工 作 表 中 定 义 ) 设 置 提 供 用 于 基 于 导 入 的 Decision List Viewer 测 量 量 和 自 定 义 Excel 测 量 量 生 成 计 算 的 变 量 配 置 提 供 用 于 指 定 从 Decision List Viewer 导 入 哪 些 测 量 量 以 及 用 于 定 义 自 定 义 Excel 测 量 量 的 选 项

228 216 章 9 警 告 : 配 置 工 作 表 的 结 构 已 严 格 定 义 请 勿 编 辑 绿 色 阴 影 区 域 中 的 任 何 单 元 来 自 模 型 的 度 量 指 明 在 计 算 中 使 用 哪 些 Decision List Viewer 度 量 导 入 到 模 型 的 度 量 指 明 哪 些 Excel 生 成 的 度 量 将 被 返 回 Decision List Viewer Excel 生 成 的 度 量 在 Decision List Viewer 中 显 示 为 新 的 测 量 量 列 注 意 : 生 成 新 模 型 时, 模 型 不 会 保 留 Excel 度 量 ; 度 量 只 在 活 动 会 话 中 有 效 更 改 模 型 测 量 下 列 示 例 演 示 如 何 通 过 多 种 方 法 更 改 模 型 测 量 : 更 改 现 有 测 量 从 模 型 导 入 其 他 标 准 测 量 将 其 他 自 定 义 测 量 导 出 到 模 型 更 改 现 有 测 量 E 打 开 模 板 并 选 择 配 置 工 作 表 E 通 过 突 出 显 示 并 重 写 名 称 或 说 明 来 编 辑 任 何 名 称 或 说 明 请 注 意, 如 果 要 更 改 测 量 ( 例 如, 为 了 提 示 用 户 概 率 而 非 频 数 ), 只 需 更 改 来 自 模 型 的 度 量 中 的 名 称 和 说 明 该 名 称 和 说 明 随 后 将 显 示 在 模 型 中 并 且 用 户 可 以 选 择 要 映 射 的 恰 当 测 量 从 模 型 导 入 其 他 标 准 测 量 E 打 开 模 板 并 选 择 配 置 工 作 表 E 从 菜 单 中 选 择 : 工 具 > 保 护 > 不 受 保 护 的 表 单 E 选 择 A5 单 元 格, 该 单 元 格 有 黄 色 阴 影 且 包 含 结 束 字 E 从 菜 单 中 选 择 : 插 入 > 行 (W) E 在 新 测 量 的 名 称 和 说 明 中 键 入 相 应 内 容 例 如, 错 误 和 段 的 相 关 错 误 E E 在 C5 单 元 格 中 输 入 公 式 =COLUMN( Model Measures!N3) 在 D5 单 元 格 中 输 入 公 式 =ROW( Model Measures!N3)+1 这 些 公 式 会 使 新 的 测 量 显 示 在 模 型 测 量 工 作 表 的 N 列 中, 此 列 目 前 为 空 E 从 菜 单 中 选 择 : 工 具 > 保 护 > 保 护 表 单 E 单 击 确 定 E 在 模 型 测 量 工 作 表 中, 确 保 N3 单 元 格 已 将 错 误 作 为 新 列 的 标 题 E 选 择 整 个 N 列

229 217 决 策 表 E 从 菜 单 中 选 择 : 格 式 > 单 元 格 E 默 认 情 况 下, 所 有 单 元 均 有 一 个 一 般 数 字 类 别 单 击 百 分 比 可 更 改 数 字 显 示 的 方 式 此 方 法 可 帮 助 您 检 查 Excel 中 的 数 字 ; 此 外, 也 提 供 给 您 另 外 一 种 使 用 数 字 的 方 法, 例 如 可 将 数 字 用 作 图 表 的 输 出 E 单 击 确 定 E 将 电 子 表 格 保 存 为 Excel 2003 模 板, 该 模 板 具 有 唯 一 的 名 称 且 文 件 扩 展 名 为.xlt 为 了 易 于 定 位 新 模 板, 建 议 您 将 其 保 存 在 本 地 或 网 络 文 件 系 统 上 的 预 先 配 置 的 模 板 中 将 其 他 自 定 义 测 量 导 出 到 模 型 E 打 开 之 前 示 例 中 已 添 加 错 误 列 的 模 板 ; 选 择 配 置 工 作 表 E 从 菜 单 中 选 择 : 工 具 > 保 护 > 不 受 保 护 的 表 单 E 选 择 A14 单 元 格, 该 单 元 格 有 黄 色 阴 影 且 包 含 结 束 字 E 从 菜 单 中 选 择 : 插 入 > 行 (W) E 在 新 测 量 的 名 称 和 说 明 中 键 入 相 应 内 容 例 如, 定 比 变 换 错 误 和 应 用 于 Excel 错 误 的 定 比 变 换 E E 在 C14 单 元 格 中 输 入 公 式 =COLUMN( Model Measures!O3) 在 D14 单 元 格 中 输 入 公 式 =ROW( Model Measures!O3)+1 这 些 公 式 指 定 O 列 将 提 供 模 型 的 新 测 量 E 选 择 设 置 工 作 表 E 在 A17 单 元 格 中 输 入 说 明 - 定 比 变 化 错 误 E 在 B17 单 元 格 中 输 入 10 的 定 比 变 换 因 子 E 在 模 型 测 量 工 作 表 中, 在 O3 单 元 格 中 输 入 说 明 定 比 变 换 错 误 作 为 新 列 的 标 题 E E 在 O4 单 元 格 中 输 入 公 式 =N4*Settings!$B$17 选 择 O4 单 元 格 的 右 下 角 并 将 其 向 下 拖 动 到 O22 单 元 格, 以 将 公 式 复 制 到 每 一 个 单 元 格 中 E 从 菜 单 中 选 择 : 工 具 > 保 护 > 保 护 表 单 E 单 击 确 定 E 将 电 子 表 格 保 存 为 Excel 2003 模 板, 该 模 板 具 有 唯 一 的 名 称 且 文 件 扩 展 名 为.xlt 为 了 易 于 定 位 新 模 板, 建 议 您 将 其 保 存 在 本 地 或 网 络 文 件 系 统 上 的 预 先 配 置 的 模 板 中 当 使 用 该 模 板 连 接 Excel 时, 错 误 值 可 用 作 新 的 自 定 义 测 量

230 218 章 9 对 模 型 进 行 可 视 化 处 理 了 解 模 型 作 用 的 最 佳 方 式 是 对 其 进 行 可 视 化 处 理 使 用 收 益 图 表, 可 以 通 过 研 究 多 个 替 代 项 的 实 际 效 果 深 入 掌 握 有 关 模 型 商 业 收 益 和 技 术 收 益 的 有 价 值 的 日 常 信 息 收 益 图 表 部 分 显 示 了 某 个 模 型 在 随 机 决 策 过 程 中 的 收 益, 并 可 于 存 在 替 代 模 型 时 实 现 对 多 个 图 表 的 直 接 比 较 收 益 图 表 收 益 图 绘 制 的 是 表 中 收 益 % 列 值 的 散 点 图 收 益 定 义 为 每 个 增 量 中 匹 配 项 数 与 树 中 匹 配 项 总 数 的 比 例, 它 使 用 下 列 等 式 : ( 增 量 中 匹 配 项 数 / 匹 配 项 总 数 )x 100% 收 益 图 表 有 效 地 为 您 说 明 需 要 怎 样 的 撒 网 广 度 才 能 捕 获 树 中 所 有 匹 配 项 的 给 定 百 分 比 斜 线 绘 制 整 个 样 本 在 未 使 用 模 型 的 情 况 下 的 预 期 响 应 这 种 情 况 下, 响 应 率 应 该 为 常 量, 因 为 一 个 人 响 应 的 可 能 性 与 另 一 个 人 相 同 为 了 使 您 的 收 益 加 倍, 您 需 要 询 问 两 倍 数 量 的 人 曲 线 表 明 通 过 将 那 些 秩 ( 基 于 收 益 排 序 ) 位 于 较 高 百 分 比 的 人 员 包 括 在 内, 您 可 以 使 得 响 应 得 到 多 大 程 度 的 改 善 例 如, 包 括 最 高 的 50% 可 能 会 网 罗 超 过 70% 的 正 面 响 应 该 曲 线 越 陡, 收 益 越 高 图 片 9-20 收 益 选 项 卡 要 查 看 收 益 图 表, 请 执 行 下 列 操 作 : E 打 开 包 含 决 策 列 表 节 点 的 流, 并 从 该 节 点 启 动 一 个 交 互 会 话 E 单 击 收 益 选 项 卡 根 据 指 定 的 分 区, 您 会 看 到 一 个 或 两 个 图 表 ( 例 如, 如 果 同 时 为 模 型 测 量 定 义 了 训 练 分 区 和 检 验 分 区, 则 会 显 示 两 个 图 表 ) 默 认 情 况 下, 图 表 会 显 示 为 段 您 可 以 将 图 表 切 换 为 分 位 数 显 示, 方 法 是 选 择 分 位 数, 然 后 在 下 拉 菜 单 中 选 择 适 当 的 分 位 数 方 法 注 意 : 有 关 使 用 图 形 的 信 息, 请 参 阅 编 辑 直 观 表 示

231 219 决 策 表 图 表 选 项 图 表 选 项 功 能 提 供 的 选 项 可 用 于 选 择 以 图 表 显 示 哪 些 模 型 和 快 照 绘 制 哪 些 分 区, 以 及 是 否 显 示 段 标 签 图 片 9-21 图 表 选 项 对 话 框 要 绘 制 的 模 型 当 前 模 型 允 许 您 选 择 要 以 图 表 显 示 的 模 型 您 可 以 选 择 工 作 模 型 或 任 何 已 创 建 的 快 照 模 型 要 绘 制 的 分 区 左 侧 图 的 分 区 该 下 拉 列 表 提 供 显 示 所 有 已 定 义 分 区 或 所 有 数 据 的 选 项 右 侧 图 的 分 区 该 下 拉 列 表 提 供 显 示 所 有 已 定 义 分 区 所 有 数 据 或 仅 显 示 左 侧 图 表 的 选 项 如 果 选 择 只 绘 制 左 侧 图, 则 仅 显 示 左 侧 图 表 显 示 段 标 签 如 果 启 用 此 选 项, 则 会 在 图 表 中 显 示 全 部 的 段 标 签

232 统 计 模 型 章 10 统 计 模 型 使 用 数 学 方 程 式 对 从 数 据 中 提 取 的 信 息 进 行 编 码 在 某 些 情 况 下, 统 计 建 模 技 术 能 非 常 快 速 地 提 供 合 适 的 模 型 甚 至 对 于 那 些 只 有 更 加 灵 活 的 机 器 学 习 技 术 ( 例 如 神 经 网 络 ) 才 能 最 终 给 出 更 好 结 果 的 问 题, 仍 然 可 以 将 统 计 模 型 作 为 基 线 预 测 模 型 以 判 断 更 先 进 技 术 的 性 能 以 下 为 可 用 的 统 计 建 模 节 点 线 性 回 归 模 型 根 据 目 标 与 一 个 或 多 个 预 测 变 量 间 的 线 性 关 系 来 预 测 连 续 目 标 有 关 详 细 信 息, 请 参 阅 第 221 页 码 线 性 模 型 Logistic 回 归 是 一 种 统 计 方 法, 它 可 根 据 输 入 字 段 的 值 对 记 录 进 行 分 类 它 类 似 于 线 性 回 归, 但 采 用 的 是 类 别 目 标 字 段 而 非 数 字 范 围 有 关 详 细 信 息, 请 参 阅 第 239 页 码 逻 辑 节 点 因 子 / 主 成 分 分 析 节 点 提 供 了 用 于 降 低 数 据 复 杂 程 度 的 强 大 数 据 缩 减 技 术 主 成 份 分 析 (PCA) 可 找 出 输 入 字 段 的 线 性 组 合, 该 组 合 最 好 地 捕 获 了 整 个 字 段 集 合 中 的 方 差, 且 组 合 中 的 各 个 成 分 相 互 正 交 ( 相 互 垂 直 ) 因 子 分 析 则 尝 试 识 别 底 层 因 素, 这 些 因 素 说 明 了 观 测 的 字 段 集 合 内 的 相 关 性 模 式 这 两 种 方 式 的 目 标 都 是 找 到 有 效 概 括 原 始 字 段 集 中 的 信 息 的 一 小 部 分 导 出 字 段 有 关 详 细 信 息, 请 参 阅 第 255 页 码 主 成 份 分 析 / 因 子 节 点 判 别 式 分 析 所 做 的 假 设 比 logistic 回 归 的 假 设 更 严 格, 但 在 符 合 这 些 假 设 时, 判 别 式 分 析 可 以 作 为 logistic 回 归 分 析 的 有 用 替 代 项 或 补 充 有 关 详 细 信 息, 请 参 阅 第 263 页 码 判 别 式 节 点 广 义 线 性 模 型 对 一 般 线 性 模 型 进 行 了 扩 展, 这 样 因 变 量 通 过 指 定 的 关 联 函 数 与 因 子 和 协 变 量 线 性 相 关 另 外, 该 模 型 允 许 因 变 量 呈 非 正 态 分 布 它 包 括 统 计 模 型 大 部 分 的 功 能, 其 中 包 括 线 性 回 归 logistic 回 归 用 于 计 数 数 据 的 对 数 线 性 模 型 以 及 区 间 删 失 生 存 模 型 有 关 详 细 信 息, 请 参 阅 第 270 页 码 GenLin 节 点 使 用 Cox 回 归 节 点, 您 可 以 在 已 有 的 检 查 记 录 中 建 立 时 间 事 件 的 生 存 模 型 该 模 型 会 生 成 一 个 生 存 函 数, 该 函 数 可 预 测 在 给 定 时 间 (t) 内 对 于 所 给 定 的 输 入 变 量 值 相 关 事 件 的 发 生 概 率 有 关 详 细 信 息, 请 参 阅 第 282 页 码 Cox 节 点 线 性 节 点 线 性 回 归 是 一 种 常 用 统 计 方 法, 它 可 根 据 数 值 输 入 字 段 的 值 对 记 录 进 行 分 类 线 性 回 归 拟 合 将 预 测 输 出 值 与 实 际 输 出 值 之 间 的 差 异 最 小 化 的 直 线 或 平 面 Copyright IBM Corporation 1994,

233 221 统 计 模 型 图 片 10-1 简 单 线 性 回 归 图 要 求 在 线 性 回 归 模 型 中 只 能 使 用 数 值 字 段 必 须 有 且 仅 有 一 个 目 标 字 段 ( 角 色 设 置 为 目 标 ), 但 可 以 有 一 个 或 多 个 预 测 变 量 ( 角 色 设 置 为 输 入 ) 角 色 为 两 者 或 无 的 字 段 将 被 忽 略, 就 像 对 待 非 数 值 字 段 一 样 ( 如 有 必 要, 可 以 使 用 导 出 节 点 对 非 数 字 字 段 进 行 重 新 编 码 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 使 用 派 生 节 点 对 值 进 行 重 新 编 码 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 ) 强 度 线 性 回 归 模 型 相 对 简 单, 用 来 形 成 预 测 的 数 学 公 司 易 于 解 释 由 于 线 性 回 归 是 一 种 由 来 已 久 的 统 计 方 法, 因 此 线 性 回 归 模 型 的 属 性 已 广 为 人 所 熟 知 而 且 线 性 模 型 训 练 起 来 也 非 常 快 线 性 节 点 提 供 了 可 排 除 方 程 式 中 无 意 义 输 入 字 段 的 自 动 字 段 选 择 方 法 注 意 : 对 于 目 标 字 段 为 类 别 ( 如 yes/no 或 churn/don t churn) 而 非 连 续 范 围 的 情 况, 可 以 将 Logistic 回 归 用 作 替 代 方 法 Logistic 回 归 还 支 持 非 数 值 输 入, 因 而 无 需 对 这 些 字 段 进 行 重 新 编 码 有 关 详 细 信 息, 请 参 阅 第 239 页 码 逻 辑 节 点 线 性 模 型 线 性 模 型 根 据 目 标 与 一 个 或 多 个 预 测 变 量 间 的 线 性 关 系 来 预 测 连 续 目 标 线 性 模 型 相 对 简 单, 用 于 评 分 的 数 学 公 式 也 易 于 解 释 这 些 模 型 的 属 性 比 较 好 理 解, 与 同 一 数 据 集 上 的 其 他 模 型 类 型 ( 如 神 经 网 络 或 决 策 树 ) 相 比 能 够 非 常 快 速 构 建 示 例 在 调 查 业 主 保 险 理 赔 方 面 拥 有 有 限 资 源 的 保 险 公 司 希 望 构 建 一 个 模 型 来 估 计 理 赔 成 本 通 过 在 服 务 中 心 部 署 该 模 型, 客 服 代 表 可 以 在 接 听 客 户 电 话 的 同 时 输 入 理 赔 信 息, 并 立 即 获 得 基 于 以 往 数 据 的 预 期 成 本

234 222 章 10 图 片 10-2 字 段 选 项 卡 字 段 要 求 必 须 有 一 个 目 标 和 至 少 一 个 输 入 默 认 情 况 下, 不 使 用 带 两 者 或 无 预 定 义 角 色 的 字 段 目 标 必 须 为 连 续 ( 刻 度 ) 对 预 测 变 量 ( 输 入 ) 没 有 测 量 级 别 限 制 分 类 ( 标 记 名 义 有 序 ) 字 段 用 作 模 型 中 的 因 子, 同 时 连 续 字 段 用 作 协 变 量 有 关 详 细 信 息, 请 参 阅 第 30 页 码 第 3 章 中 的 建 模 节 点 字 段 选 项

235 223 统 计 模 型 目 标 图 片 10-4 目 标 设 置 您 希 望 做 什 么? 构 建 新 的 模 型 构 建 全 新 的 模 型 这 是 该 节 点 的 常 用 操 作 继 续 训 练 现 有 模 型 继 续 训 练 此 节 点 成 功 生 成 的 最 后 一 个 模 型 这 样 就 可 以 在 无 需 访 问 原 始 数 据 的 情 况 下 更 新 或 刷 新 现 有 的 模 型, 并 可 能 会 显 著 提 升 性 能, 因 为 只 有 新 的 或 更 新 后 的 记 录 被 传 入 流 中 上 一 个 模 型 的 详 细 信 息 与 建 模 节 点 存 储 在 一 起, 这 样 即 使 先 前 的 模 型 块 在 流 或 模 型 选 项 板 中 不 再 可 用 的 情 况 下, 也 可 以 使 用 该 选 项 注 意 : 在 启 用 此 选 项 后, 字 段 和 构 建 选 项 选 项 卡 上 的 所 有 其 他 控 件 将 被 禁 用 您 的 主 要 目 标 是 什 么? 创 建 标 准 模 型 此 方 法 将 构 建 单 个 模 型, 以 使 用 预 测 变 量 来 预 测 目 标 一 般 来 说, 与 推 进 bagged 或 大 数 据 集 整 体 模 型 相 比, 标 准 模 型 更 易 于 解 释, 并 能 更 快 地 进 行 评 分 增 强 模 型 准 确 性 ( 推 进 ) 此 方 法 采 用 推 进 方 式 构 建 整 体 模 型, 这 将 生 成 一 系 列 模 型 以 获 得 更 精 确 的 预 测 结 果 与 标 准 模 型 相 比, 此 整 体 模 型 需 要 更 长 的 构 建 与 评 分 时 间 推 进 方 法 产 生 一 系 列 成 分 模 型, 其 中 每 个 模 型 在 整 个 数 据 集 上 构 建 在 构 建 每 个 后 续 成 分 模 型 之 前, 将 根 据 前 一 成 分 模 型 的 残 差 对 记 录 进 行 加 权 具 有 较 大 残 差 的 个 案 将 被 给 予 较 高 的 分 析 权 重, 因 此 下 一 个 成 分 模 型 将 较 好 地 侧 重 于 这 些 记 录

236 224 章 10 这 些 成 分 模 型 共 同 构 成 一 个 整 体 模 型 该 整 体 模 型 采 用 组 合 规 则 对 新 记 录 进 行 评 分 可 用 的 规 则 取 决 于 目 标 的 测 量 级 别 增 强 模 型 稳 定 性 (bagging) 此 方 法 采 用 bagging(bootstrap 汇 总 ) 方 式 构 建 整 体 模 型, 这 将 生 成 多 个 模 型 以 获 得 更 可 靠 的 预 测 结 果 与 标 准 模 型 相 比, 此 整 体 模 型 需 要 更 长 的 构 建 与 评 分 时 间 Bootstrap 汇 总 (bagging) 通 过 对 原 始 数 据 集 进 行 放 回 抽 样, 产 生 训 练 数 据 集 的 副 本 这 将 创 建 大 小 与 原 始 数 据 集 相 同 的 bootstrap 样 本 然 后, 在 每 个 副 本 上 构 建 成 分 模 型 这 些 成 分 模 型 共 同 构 成 一 个 整 体 模 型 该 整 体 模 型 采 用 组 合 规 则 对 新 记 录 进 行 评 分 可 用 的 规 则 取 决 于 目 标 的 测 量 级 别 创 建 适 用 于 大 型 数 据 集 ( 需 要 IBM SPSS Modeler Server) 的 模 型 此 方 法 将 数 据 集 划 分 为 多 个 单 独 数 据 块, 以 构 建 整 体 模 型 如 果 您 的 数 据 集 过 大, 而 无 法 构 建 上 述 任 何 模 型 或 进 行 增 量 式 建 模, 请 选 择 此 项 与 标 准 模 型 相 比, 此 选 项 的 构 建 时 间 较 短, 但 评 分 时 间 更 长 该 选 项 需 要 SPSS Modeler Server 连 接 基 本 图 片 10-5 基 本 设 置 自 动 准 备 数 据 该 选 项 允 许 在 内 部 转 换 目 标 和 预 测 变 量, 以 使 模 型 的 预 测 能 力 最 大 化 ; 将 保 存 模 型 的 任 何 转 换 并 应 用 到 新 数 据 用 于 评 分 转 换 字 段 的 原 始 版 本 将 从 模 型 中 排 除 默 认 情 况 下, 执 行 以 下 自 动 数 据 准 备 日 期 与 时 间 处 理 每 个 日 期 预 测 变 量 被 转 换 成 新 的 连 续 预 测 变 量, 其 中 包 含 自 参 考 日 期 ( ) 以 来 经 过 的 时 间 每 个 时 间 预 测 变 量 被 转 换 成 新 的 连 续 预 测 变 量, 其 中 包 含 自 参 考 时 间 (00:00:00) 以 来 经 过 的 时 间

237 225 统 计 模 型 调 整 测 量 级 别 具 有 少 于 5 个 不 同 值 的 连 续 预 测 变 量 将 被 重 新 设 计 成 有 序 预 测 变 量 具 有 多 于 10 个 不 同 值 的 有 序 预 测 变 量 将 被 重 新 设 计 成 连 续 预 测 变 量 离 群 值 处 理 如 果 连 续 预 测 变 量 的 值 位 于 截 断 值 ( 平 均 值 的 3 个 标 准 差 ) 之 外, 则 将 其 设 为 截 断 值 缺 失 值 处 理 名 义 预 测 变 量 的 缺 失 值 被 替 换 为 训 练 分 区 的 众 数 有 序 预 测 变 量 的 缺 失 值 被 替 换 为 训 练 分 区 的 中 位 数 连 续 预 测 变 量 的 缺 失 值 被 替 换 为 训 练 分 区 的 平 均 值 受 监 督 的 合 并 这 将 减 少 与 目 标 关 联 的 需 处 理 的 字 段 数, 得 到 更 简 约 的 模 型 通 过 输 入 与 目 标 间 的 关 系 可 以 确 定 类 似 的 类 别 无 显 著 差 异 ( 即 p 值 大 于 0.1) 的 类 别 则 被 合 并 如 果 所 有 类 别 合 并 为 一 个 类 别, 则 字 段 的 原 始 和 派 生 版 本 将 从 模 型 中 排 除, 因 为 它 们 没 有 作 为 预 测 变 量 的 值 置 信 水 平 此 为 用 于 在 系 数 视 图 中 计 算 模 型 系 数 的 区 间 估 计 值 的 置 信 水 平 指 定 一 个 大 于 0 且 小 于 100 的 值 默 认 值 为 95 模 型 选 择 图 片 10-6 模 型 选 择 设 置

238 226 章 10 模 型 选 择 方 法 选 择 一 种 模 型 选 择 方 法 ( 下 面 将 详 细 介 绍 ) 或 包 括 所 有 预 测 变 量, 后 者 简 单 地 输 入 所 有 可 用 预 测 变 量 作 为 主 效 应 模 型 项 默 认 使 用 前 向 逐 步 前 向 逐 步 选 择 在 开 始 时 模 型 中 没 有 任 何 效 应, 然 后 在 每 个 步 骤 中 添 加 和 删 除 效 应, 直 到 根 据 逐 步 选 择 标 准 不 能 再 添 加 或 删 除 效 应 为 止 纳 入 / 移 除 标 准 此 为 用 于 决 定 是 将 某 个 效 应 添 加 到 还 是 剔 除 出 模 型 的 统 计 量 信 息 准 则 (AICC) 基 于 模 型 中 给 定 训 练 集 合 的 似 然 估 计, 并 可 调 整 以 惩 罚 过 度 复 杂 模 型 F 统 计 量 基 于 有 关 模 型 错 误 改 进 情 况 的 某 个 统 计 量 检 验 调 整 R 方 基 于 训 练 集 合 的 拟 合 度, 并 可 调 整 以 惩 罚 过 度 复 杂 模 型 防 止 过 度 拟 合 准 则 (ASE) 基 于 防 止 过 度 拟 合 集 的 拟 合 度 ( 平 均 方 差, 或 ASE) 防 止 过 度 拟 合 集 是 不 用 于 训 练 模 型 且 大 约 为 原 始 数 据 集 30% 的 随 机 子 样 本 如 果 选 择 了 F 统 计 量 以 外 的 标 准, 则 在 每 步 中 将 对 应 于 选 择 标 准 的 最 大 正 增 长 的 效 应 添 加 到 模 型 对 应 于 标 准 中 减 少 情 况 的 任 何 模 型 效 应 将 被 移 除 如 果 选 择 了 F 统 计 量 作 为 标 准, 则 在 每 步 中 将 具 有 低 于 指 定 阈 值 ( 纳 入 p 值 小 于 此 值 的 效 应 ) 的 最 小 p 值 的 效 应 添 加 到 模 型 默 认 值 为 0.05 任 何 具 有 大 于 指 定 阈 值 移 除 p 值 大 于 此 值 的 效 应 的 p 值 的 模 型 效 应 将 被 移 除 默 认 值 为 0.10 自 定 义 最 终 模 型 中 的 最 大 效 应 数 默 认 情 况 下, 所 有 可 用 效 应 都 将 被 输 入 模 型 中 或 者, 如 果 逐 步 选 择 算 法 在 具 有 指 定 最 大 效 应 数 的 某 个 步 骤 结 束, 则 此 算 法 将 以 当 前 效 应 集 合 结 束 自 定 义 最 大 步 骤 数 逐 步 选 择 算 法 在 达 到 特 定 步 骤 数 后 停 止 此 值 默 认 为 可 用 效 应 数 的 3 倍 或 者, 指 定 一 个 正 整 数 作 为 最 大 步 骤 数 最 佳 子 集 选 择 这 将 检 查 所 有 可 能 的 模 型, 或 至 少 检 查 可 能 模 型 的 较 大 子 集 ( 大 于 前 向 逐 步 方 法 ), 以 选 择 满 足 相 应 标 准 的 最 佳 子 集 信 息 准 则 (AICC) 基 于 模 型 中 给 定 训 练 集 合 的 似 然 估 计, 并 可 调 整 以 惩 罚 过 度 复 杂 模 型 调 整 R 方 基 于 训 练 集 合 的 拟 合 度, 并 可 调 整 以 惩 罚 过 度 复 杂 模 型 防 止 过 度 拟 合 准 则 (ASE) 基 于 防 止 过 度 拟 合 集 的 拟 合 度 ( 平 均 方 差, 或 ASE) 防 止 过 度 拟 合 集 是 不 用 于 训 练 模 型 且 大 约 为 原 始 数 据 集 30% 的 随 机 子 样 本 选 择 具 有 最 大 标 准 值 的 模 型 作 为 最 佳 模 型 注 意 : 与 向 前 逐 步 选 择 相 比, 最 佳 子 集 选 择 涉 及 更 密 集 的 计 算 在 与 boosting bagging 或 超 大 型 数 据 集 配 合 执 行 最 佳 子 集 时, 花 费 的 时 间 比 使 用 向 前 逐 步 选 择 构 建 标 准 模 型 要 长 得 多

239 227 统 计 模 型 整 体 图 片 10-7 整 体 设 置 这 些 设 置 决 定 了 在 目 标 中 请 求 boosting bagging 或 超 大 型 数 据 集 时 发 生 的 整 体 行 为 对 选 定 目 标 不 适 用 的 选 项 将 被 忽 略 Bagging 和 大 型 数 据 集 在 对 整 体 评 分 时, 此 规 则 用 于 组 合 来 自 基 本 模 型 的 预 测 值, 以 计 算 整 体 得 分 值 连 续 目 标 的 默 认 组 合 规 则 可 以 通 过 对 来 自 基 本 模 型 的 预 测 值 取 平 均 值 或 中 位 数, 对 连 续 目 标 的 整 体 预 测 值 进 行 组 合 注 意, 如 果 以 增 强 模 型 精 确 性 为 目 标, 则 组 合 规 则 选 择 将 被 忽 略 Boosting 方 法 始 终 使 用 加 权 大 多 数 投 票 来 对 分 类 目 标 进 行 评 分, 而 使 用 加 权 中 位 数 对 连 续 目 标 进 行 评 分 Boosting 和 Bagging 当 以 增 强 模 型 精 确 性 或 稳 定 性 为 目 标 时, 指 定 要 构 建 的 基 本 模 型 数 ; 对 于 bagging 方 法, 此 为 bootstrap 样 本 数 它 应 为 正 整 数

240 228 章 10 高 级 图 片 10-8 高 级 设 置 重 复 结 果 设 置 随 机 种 子 允 许 您 复 制 分 析 随 机 数 生 成 器 用 于 选 择 哪 个 记 录 在 过 度 拟 合 集 中 指 定 一 个 整 数, 或 单 击 生 成, 这 将 产 生 一 个 介 于 1 与 之 间 ( 包 括 1 和 ) 的 伪 随 机 整 数 默 认 值 为 模 型 选 项 图 片 10-9 模 型 选 项 选 项 卡 模 型 名 称 可 以 基 于 目 标 字 段 来 自 动 生 成 模 型 名 称, 或 指 定 自 定 义 名 称 自 动 生 成 的 名 称 为 目 标 字 段 名 请 注 意, 在 对 模 型 评 分 时, 始 终 会 计 算 预 测 值 新 字 段 的 名 称 为 目 标 字 段 的 名 称, 加 上 前 缀 $L- 例 如, 对 于 名 为 sales 的 目 标 字 段, 新 字 段 将 命 名 为 $L-sales

241 229 统 计 模 型 模 型 摘 要 图 片 模 型 摘 要 视 图 模 型 摘 要 视 图 是 模 型 及 其 拟 合 的 快 照 一 览 摘 要 表 该 表 标 识 一 些 高 级 模 型 设 置, 包 括 : 目 标 名 称, 在 字 段 选 项 卡 上 指 定 ; 是 否 执 行 自 动 数 据 准 备, 在 基 本 设 置 中 指 定 ; 模 型 选 择 方 法 和 选 择 标 准, 在 模 型 选 择 设 置 中 指 定 还 显 示 了 最 终 模 型 的 选 择 标 准 值, 并 以 较 小 较 佳 的 格 式 显 示 图 表 此 图 表 显 示 最 终 模 型 的 精 确 性, 数 值 越 大 越 好 对 于 最 终 模 型, 此 值 为 100 调 整 后 的 R 2

242 230 章 10 自 动 数 据 准 备 图 片 自 动 数 据 准 备 视 图 此 视 图 显 示 在 自 动 数 据 准 备 (ADP) 步 骤 中 排 除 了 哪 些 字 段, 以 及 转 换 字 段 的 派 生 方 式 等 信 息 对 于 每 个 转 换 或 排 除 字 段, 在 此 表 中 列 出 了 字 段 名 在 分 析 中 的 角 色, 以 及 ADP 步 骤 所 采 取 的 操 作 这 些 字 段 按 其 名 称 的 字 母 升 序 排 列 对 每 个 字 段 可 能 执 行 的 操 作 包 括 : 导 出 持 续 时 间 : 月 份 以 月 为 单 位, 计 算 从 包 含 日 期 的 字 段 值 到 当 前 系 统 日 期 所 经 过 的 时 间 导 出 持 续 时 间 : 小 时 以 小 时 为 单 位, 计 算 从 包 含 时 间 的 字 段 值 到 当 前 系 统 时 间 所 经 过 的 时 间 将 测 量 级 别 从 连 续 改 为 有 序 将 不 到 5 个 唯 一 值 的 连 续 字 段 重 新 设 计 为 有 序 字 段 将 测 量 级 别 从 有 序 改 为 连 续 将 超 过 10 个 唯 一 值 的 有 序 字 段 重 新 设 计 为 连 续 字 段 删 除 离 群 值 如 果 连 续 预 测 变 量 的 值 位 于 截 断 值 ( 平 均 值 的 3 个 标 准 差 ) 之 外, 则 将 其 设 为 截 断 值 替 换 缺 失 值 分 别 使 用 众 数 中 位 数 和 平 均 值 替 换 名 义 字 段 有 序 字 段 和 连 续 字 段 的 缺 失 值 合 并 类 别 以 最 大 化 与 目 标 的 关 联 根 据 输 入 与 目 标 间 的 关 系 确 定 类 似 的 预 测 变 量 类 别 无 显 著 差 异 ( 即 p 值 大 于 0.05) 的 类 别 则 被 合 并 排 除 常 量 预 测 变 量 / 在 离 群 值 处 理 之 后 / 在 合 并 类 别 之 后 删 除 具 有 单 个 值 的 预 测 变 量, 可 能 在 执 行 其 他 ADP 操 作 之 后

243 231 统 计 模 型 预 测 变 量 重 要 性 图 片 预 测 变 量 重 要 性 视 图 通 常, 您 将 需 要 将 建 模 工 作 专 注 于 最 重 要 的 预 测 变 量 字 段, 并 考 虑 删 除 或 忽 略 那 些 最 不 重 要 的 变 量 预 测 变 量 重 要 性 图 表 可 以 在 模 型 估 计 中 指 示 每 个 预 测 变 量 的 相 对 重 要 性, 从 而 帮 助 您 实 现 这 一 点 由 于 它 们 是 相 对 值, 因 此 显 示 的 所 有 预 测 变 量 的 值 总 和 为 1.0 预 测 变 量 的 重 要 性 与 模 型 精 确 性 无 关 它 只 与 每 个 预 测 变 量 在 预 测 中 的 重 要 性 有 关, 而 不 涉 及 预 测 是 否 精 确

244 232 章 10 按 已 观 测 进 行 预 测 图 片 按 已 观 测 进 行 预 测 视 图 这 将 显 示 一 个 分 级 散 点 图, 其 中 预 测 值 位 于 垂 直 轴 上, 而 观 测 值 位 于 水 平 轴 上 理 想 情 况 下, 该 点 应 在 45 度 线 上 ; 您 可 以 从 该 视 图 上 判 断 出 任 何 被 模 型 预 测 为 较 差 的 纪 录

245 233 统 计 模 型 残 差 图 片 残 差 视 图, 直 方 图 样 式 这 将 显 示 模 型 残 差 的 诊 断 图 表 图 表 样 式 有 多 种 不 同 的 显 示 样 式, 可 以 从 样 式 下 拉 列 表 中 访 问 这 些 样 式 直 方 图 此 为 学 生 化 残 差 的 分 级 直 方 图, 并 带 有 正 态 分 布 交 叠 线 性 模 型 假 设 残 差 具 有 正 态 分 布, 因 此 理 想 情 况 下 直 方 图 应 相 当 接 近 平 滑 线 P-P 图 此 为 分 级 概 率 - 概 率 (P-P) 图, 将 学 生 化 残 差 与 正 态 分 布 进 行 对 比 如 果 绘 制 点 的 坡 度 比 正 态 线 更 平 缓, 则 残 差 显 示 出 比 正 态 分 布 更 显 著 的 变 异 性 ; 如 果 更 陡 峭, 则 残 差 的 变 异 性 低 于 正 态 分 布 如 果 绘 制 点 呈 S 型 曲 线, 则 残 差 为 偏 斜 分 布

246 234 章 10 离 群 值 图 片 离 群 值 视 图 此 表 列 出 对 模 型 施 加 过 度 影 响 的 记 录, 并 显 示 记 录 ID( 如 果 在 字 段 选 项 卡 上 指 定 ) 目 标 值, 以 及 Cook 距 离 Cook 距 离 是 在 特 定 记 录 从 模 型 系 数 的 计 算 中 排 除 的 情 况 下, 所 有 记 录 的 残 差 变 化 幅 度 的 测 量 较 大 的 Cook 距 离 表 示 在 排 除 记 录 后 系 数 会 发 生 显 著 变 化, 因 此 应 被 视 为 有 一 定 影 响 应 仔 细 检 查 有 影 响 的 记 录, 以 确 定 是 在 模 型 估 计 中 给 予 较 低 权 重, 按 照 特 定 可 接 受 阈 值 截 断 离 群 值, 还 是 彻 底 移 除 有 影 响 的 记 录

247 235 统 计 模 型 效 应 图 片 效 应 视 图, 图 表 样 式 此 视 图 显 示 模 型 中 每 个 效 应 的 大 小 样 式 有 多 种 不 同 的 显 示 样 式, 可 以 从 样 式 下 拉 列 表 中 访 问 这 些 样 式 图 表 在 此 图 表 中, 将 按 预 测 变 量 重 要 性 递 减 顺 序, 从 上 到 下 排 列 显 示 效 应 在 图 表 中, 连 接 线 条 根 据 效 应 的 显 著 性 进 行 加 权, 粗 线 条 表 示 较 显 著 的 效 应 (p 值 较 小 ) 悬 停 在 连 接 线 条 上 将 显 示 工 具 提 示, 以 指 示 效 应 的 p 值 和 重 要 性 这 是 默 认 值 表 此 为 总 体 模 型 与 单 独 模 型 效 应 的 ANOVA 表 各 个 效 应 将 按 预 测 变 量 重 要 性 递 减 顺 序, 从 上 到 下 排 列 显 示 注 意, 在 默 认 情 况 下, 此 表 处 于 折 叠 状 态, 只 显 示 总 体 模 型 结 果 要 查 看 单 独 模 型 效 应 的 结 果, 在 表 中 单 击 校 正 的 模 型 单 元 格 预 测 变 量 重 要 性 提 供 有 一 个 预 测 变 量 重 要 性 滑 块, 以 控 制 在 视 图 中 显 示 哪 些 预 测 变 量 这 不 会 改 变 模 型, 只 是 帮 助 您 重 点 关 注 最 重 要 的 预 测 变 量 默 认 显 示 前 10 个 效 应 显 著 性 提 供 有 一 个 显 著 性 滑 块, 以 便 在 按 预 测 变 量 重 要 性 显 示 效 应 的 基 础 上, 进 一 步 控 制 在 视 图 中 显 示 哪 些 效 应 显 著 性 值 大 于 滑 块 值 的 效 应 将 被 隐 藏 这 不 会 改 变 模 型, 只 是 帮 助 您 重 点 关 注 最 重 要 的 效 应 默 认 情 况 下 此 值 为 1.00, 因 此 不 会 根 据 显 著 性 来 过 滤 效 应

248 236 章 10 系 数 图 片 系 数 视 图, 图 表 样 式 此 视 图 显 示 模 型 中 每 个 系 数 的 值 注 意, 由 于 因 子 ( 分 类 预 测 变 量 ) 在 模 型 内 部 经 过 指 示 符 编 码, 因 此 包 含 因 子 的 效 应 通 常 具 有 多 个 关 联 系 数 ; 每 种 类 别 一 个 关 联 系 数, 但 对 应 于 冗 余 ( 参 考 ) 参 数 的 类 别 除 外 样 式 有 多 种 不 同 的 显 示 样 式, 可 以 从 样 式 下 拉 列 表 中 访 问 这 些 样 式 图 表 在 此 图 表 中, 首 先 显 示 截 距, 然 后 按 预 测 变 量 重 要 性 递 减 顺 序, 从 上 到 下 排 列 显 示 效 应 在 包 含 因 子 的 效 应 中, 系 数 按 照 数 据 值 的 升 序 进 行 排 列 在 图 表 中, 连 接 线 条 根 据 系 数 的 显 著 性 ( 参 见 图 表 键 ) 而 具 有 不 同 颜 色, 粗 线 条 表 示 较

249 237 统 计 模 型 显 著 的 系 数 (p 值 较 小 ) 悬 停 在 连 接 线 条 上 将 显 示 工 具 提 示, 以 指 示 与 参 数 关 联 的 效 应 的 系 数 值 p 值 和 重 要 性 这 是 默 认 样 式 表 这 将 显 示 单 独 模 型 系 数 的 值 显 著 性 检 验, 以 及 置 信 区 间 在 截 距 后 面, 各 个 效 应 将 按 预 测 变 量 重 要 性 递 减 顺 序, 从 上 到 下 排 列 显 示 在 包 含 因 子 的 效 应 中, 系 数 按 照 数 据 值 的 升 序 进 行 排 列 注 意, 在 默 认 情 况 下, 此 表 处 于 折 叠 状 态, 只 显 示 每 个 模 型 参 数 的 系 数 显 著 性 和 重 要 性 要 查 看 标 准 误 t 统 计 量 和 置 信 区 间, 在 表 中 单 击 系 数 单 元 格 悬 停 在 表 中 的 模 型 参 数 名 称 上, 将 显 示 工 具 提 示, 以 指 示 参 数 名 称 与 参 数 关 联 的 效 应 以 及 与 模 型 参 数 关 联 的 值 标 签 ( 对 于 分 类 预 测 变 量 ) 当 自 动 数 据 准 备 合 并 分 类 预 测 变 量 的 相 似 类 别 时, 这 尤 其 适 合 用 于 查 看 新 创 建 的 类 别 预 测 变 量 重 要 性 提 供 有 一 个 预 测 变 量 重 要 性 滑 块, 以 控 制 在 视 图 中 显 示 哪 些 预 测 变 量 这 不 会 改 变 模 型, 只 是 帮 助 您 重 点 关 注 最 重 要 的 预 测 变 量 默 认 显 示 前 10 个 效 应 显 著 性 提 供 有 一 个 显 著 性 滑 块, 以 便 在 按 预 测 变 量 重 要 性 显 示 系 数 的 基 础 上, 进 一 步 控 制 在 视 图 中 显 示 哪 些 系 数 显 著 性 值 大 于 滑 块 值 的 系 数 将 被 隐 藏 这 不 会 改 变 模 型, 只 是 帮 助 您 重 点 关 注 最 重 要 的 系 数 默 认 情 况 下 此 值 为 1.00, 因 此 不 会 根 据 显 著 性 来 过 滤 系 数 估 计 平 均 值 图 片 估 计 平 均 值 视 图

250 238 章 10 只 为 显 著 的 预 测 变 量 显 示 这 些 图 表 在 图 表 中, 目 标 的 模 型 估 计 值 位 于 垂 直 轴 上, 预 测 变 量 的 每 个 值 位 于 水 平 轴 上, 所 有 其 他 预 测 变 量 保 持 恒 定 它 提 供 了 有 关 每 个 预 测 变 量 系 数 在 目 标 上 的 效 应 的 直 观 表 示, 非 常 有 用 注 意 : 如 果 没 有 显 著 的 预 测 变 量, 则 不 会 生 成 估 计 平 均 值 模 型 构 建 摘 要 图 片 模 型 构 建 摘 要 视 图, 前 向 逐 步 算 法 如 果 在 模 型 选 择 设 置 中 选 择 了 无 以 外 的 模 型 选 择 算 法, 这 将 提 供 有 关 模 型 构 建 过 程 的 一 些 详 细 信 息 前 向 逐 步 如 果 选 择 算 法 为 前 向 逐 步, 此 表 将 显 示 逐 步 选 择 算 法 中 的 最 近 10 步 对 于 其 中 每 个 步 骤, 显 示 在 此 步 骤 上 选 择 标 准 的 值 与 模 型 中 的 效 应 这 允 许 您 了 解 每 个 步 骤 对 模 型 的 贡 献 大 小 每 列 允 许 您 对 行 进 行 排 序, 因 此 可 以 方 便 地 看 到 在 给 定 步 骤 上 模 型 中 有 哪 些 效 应 最 佳 子 集 如 果 选 择 算 法 为 最 佳 子 集, 此 表 将 显 示 前 10 个 模 型 对 于 每 个 模 型, 显 示 选 择 标 准 的 值 与 模 型 中 的 效 应 您 可 以 从 中 了 解 这 些 最 佳 模 型 的 稳 定 性 ; 如 果 它 们 倾 向 于 具 有 存 在 少 量 差 异 的 相 似 效 应, 那 么 您 可 以 充 分 确 信 它 们 的 确 是 最 佳 模 型 ; 如 果 它 们 倾 向 于 具 有 迥 异 的 效 应, 那 么 某 些 效 应 可 能 太 相 似, 需 要 进 行 合 并 ( 或 删 除 一 些 ) 每 列 允 许 您 对 行 进 行 排 序, 因 此 可 以 方 便 地 看 到 在 给 定 步 骤 上 模 型 中 有 哪 些 效 应

251 239 统 计 模 型 设 置 图 片 设 置 选 项 卡 逻 辑 节 点 请 注 意, 在 对 模 型 评 分 时, 始 终 会 计 算 预 测 值 新 字 段 的 名 称 为 目 标 字 段 的 名 称, 加 上 前 缀 $L- 例 如, 对 于 名 为 sales 的 目 标 字 段, 新 字 段 将 命 名 为 $L-sales 生 成 此 模 型 的 SQL 使 用 数 据 库 中 的 数 据 时,SQL 代 码 可 传 回 到 数 据 库 中 执 行, 从 而 大 大 提 高 许 多 操 作 的 处 理 速 度 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 SQL 优 化 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南 Logistic 回 归 ( 也 称 为 名 义 回 归 ) 是 一 种 用 于 依 据 输 入 字 段 的 值 对 记 录 进 行 分 类 的 统 计 技 术 这 种 技 术 与 线 性 回 归 类 似, 但 用 分 类 目 标 字 段 代 替 了 数 值 字 段 同 时 支 持 二 项 模 型 ( 用 于 具 有 两 种 离 散 类 别 的 目 标 ) 和 多 项 模 型 ( 用 于 具 有 两 种 以 上 类 别 的 目 标 ) Logistic 回 归 的 工 作 原 理 是 构 建 一 组 方 程 式, 使 输 入 字 段 值 与 每 个 输 入 字 段 类 别 所 关 联 的 概 率 相 关 生 成 模 型 后, 便 可 以 用 它 来 估 计 新 数 据 的 概 率 对 于 每 条 记 录, 将 计 算 每 种 可 能 输 出 类 别 的 归 属 概 率 具 有 最 高 概 率 的 目 标 类 别 将 被 指 定 为 该 记 录 的 预 测 输 出 值 二 项 模 型 示 例 某 电 信 服 务 提 供 商 希 望 了 解 流 失 到 竞 争 对 手 那 里 的 客 户 数 量 使 用 服 务 利 用 率 数 据, 可 以 创 建 二 项 模 型 以 预 测 哪 些 客 户 有 可 能 转 向 其 他 提 供 商, 并 自 定 义 服 务 以 保 留 尽 可 能 多 的 客 户 采 用 二 项 模 型 的 原 因 是 目 标 分 为 两 种 不 同 类 别 ( 可 能 转 向 或 可 能 不 转 向 ) 有 关 详 细 信 息, 请 参 阅 第 14 章 中 的 电 信 客 户 流 失 ( 二 项 Logistic 回 归 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 注 意 : 字 符 串 字 段 的 大 小 必 须 限 制 为 8 个 字 符 ( 仅 适 用 于 二 项 模 型 ) 如 有 必 要, 可 使 用 重 新 分 类 节 点 对 较 长 的 字 符 串 进 行 重 新 编 码 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 重 新 对 节 点 分 类 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 有 关 详 细 信 息, 请 参 阅 第 11 章 中 的 减 少 输 入 数 据 字 符 串 长 度 ( 重 新 分 类 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 多 项 模 型 示 例 电 信 提 供 商 按 照 服 务 用 途 模 式 划 分 客 户 群, 将 客 户 分 类 成 四 组 通 过 使 用 人 口 统 计 数 据 预 测 组 成 员, 可 以 创 建 多 项 模 型, 从 而 将 预 期 客 户 分 为 几 组, 然 后 针 对 各 个 客 户 自 定 义 服 务 有 关 详 细 信 息, 请 参 阅 第 13 章 中 的 电 信 业 客 户 分 类 ( 多 项 Logistic 回 归 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南

252 240 章 10 要 求 一 个 或 多 个 输 入 字 段 和 唯 一 一 个 具 有 两 个 或 多 个 类 别 的 分 类 目 标 字 段 对 于 二 项 模 型, 目 标 必 须 具 有 标 志 测 量 级 别 于 多 项 模 型, 目 标 可 以 具 有 标 志, 或 名 义 的 测 量 级 别, 以 及 两 个 或 多 个 类 别 设 置 为 双 向 或 无 的 字 段 将 忽 略 必 须 对 模 型 中 使 用 的 字 段 的 类 型 完 全 实 例 化 强 度 Logistic 回 归 模 型 通 常 相 当 准 确 它 们 可 处 理 符 号 和 数 字 类 型 的 输 入 字 段 它 们 可 以 给 出 所 有 目 标 类 别 的 预 测 概 率, 从 而 能 够 轻 松 识 别 出 第 二 最 佳 推 测 值 当 组 成 员 关 系 是 真 正 分 类 字 段 时,Logistic 模 型 最 为 有 效 ; 如 果 组 成 员 关 系 基 于 连 续 范 围 字 段 的 值 ( 例 如, 高 IQ 与 低 IQ), 则 应 考 虑 使 用 线 性 回 归, 以 利 用 整 个 范 围 的 值 所 提 供 的 更 丰 富 的 信 息 Logistic 模 型 也 可 以 执 行 自 动 字 段 选 择, 但 其 他 方 式 ( 如 树 模 型 或 特 征 选 择 ) 在 对 大 型 数 据 集 执 行 此 操 作 时 可 能 更 迅 速 最 后, 由 于 Logistic 模 型 被 很 多 分 析 人 员 和 数 据 挖 掘 人 员 所 熟 知, 因 此 他 们 可 能 会 将 其 用 作 比 较 其 他 建 模 技 术 的 基 准 处 理 大 型 数 据 集 时, 可 以 禁 用 高 级 输 出 选 项 似 然 比 检 验, 从 而 显 著 提 高 性 能 有 关 详 细 信 息, 请 参 阅 第 247 页 码 Logistic 回 归 高 级 输 出 Logistic 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 过 程 指 定 是 创 建 二 项 模 型 还 是 创 建 多 项 模 型 对 话 框 中 提 供 的 选 项 会 因 所 选 建 模 过 程 的 类 型 而 异 二 项 式 当 目 标 字 段 是 具 有 两 个 离 散 ( 二 分 ) 值 ( 如 是 / 否 启 动 / 关 闭 或 男 / 女 ) 的 标 志 或 名 义 字 段 时 使 用 多 项 式 当 目 标 字 段 是 具 有 两 个 以 上 值 的 名 义 字 段 时, 应 使 用 此 选 项 可 以 指 定 主 效 应 全 析 因 或 自 定 义 在 等 式 中 包 含 常 量 此 选 项 用 于 确 定 结 果 方 程 式 是 否 将 包 含 常 数 项 在 大 多 数 情 况 下, 应 将 此 选 项 保 持 为 选 中 状 态

253 241 统 计 模 型 二 项 模 型 图 片 Logistic 节 点 : 二 项 模 型 选 项 对 于 二 项 模 型, 可 用 的 方 法 和 选 项 如 下 : 方 法 指 定 要 用 于 构 建 Logistic 回 归 模 型 的 方 法 按 Enter 键 这 是 默 认 方 法, 可 将 所 有 项 直 接 输 入 方 程 式 构 建 模 型 时 不 进 行 字 段 选 择 前 进 法 字 段 选 择 的 前 进 法 通 过 逐 步 向 前 移 动 来 构 建 模 型 采 用 这 种 方 法, 初 始 模 型 是 最 简 单 的 模 型, 只 能 向 模 型 中 添 加 常 量 和 项 每 个 步 骤 会 对 尚 未 纳 入 到 模 型 中 的 项 进 行 检 验, 看 它 们 对 模 型 的 改 进 起 多 大 作 用, 然 后 将 其 中 的 最 佳 项 添 加 到 模 型 中 当 无 法 再 添 加 任 何 项 或 最 佳 备 选 项 无 法 对 模 型 产 生 足 够 的 改 进 时, 最 终 模 型 便 已 生 成 后 退 法 从 本 质 上 说, 后 退 法 与 前 进 法 是 相 反 的 但 采 用 这 种 方 法 时, 初 始 模 型 包 含 作 为 预 测 变 量 的 所 有 项, 只 能 从 模 型 中 删 除 项 对 模 型 贡 献 较 小 的 模 型 项 将 被 逐 一 删 除, 直 到 无 法 再 删 除 任 何 项 而 不 对 模 型 功 能 造 成 重 大 损 害, 从 而 生 成 最 终 模 型 分 类 输 入 列 出 标 识 为 分 类 字 段 的 字 段, 即 具 有 标 志 名 义 或 有 序 的 测 量 级 别 可 以 为 每 个 分 类 字 段 指 定 对 比 和 基 准 类 别

254 242 章 10 字 段 名 此 列 包 含 分 类 输 入 的 字 段 名 称, 并 预 填 入 了 数 据 中 的 所 有 标 志 值 和 名 义 值 要 向 此 列 中 添 加 连 续 输 入 字 段 或 数 值 输 入 字 段, 请 单 击 列 表 右 边 的 添 加 字 段 图 标, 然 后 选 择 所 需 输 入 字 段 对 比 分 类 字 段 的 回 归 系 数 的 解 释 取 决 于 所 用 的 对 比 对 比 决 定 如 何 设 定 假 设 检 验 以 比 较 估 计 均 值 例 如, 如 果 已 知 某 个 分 类 字 段 具 有 隐 含 顺 序 ( 如 模 式 或 分 组 ), 则 可 以 使 用 对 比 为 该 顺 序 建 模 可 用 的 对 比 如 下 : 指 示 符 这 些 对 比 指 示 类 别 成 员 资 格 是 否 存 在 这 是 默 认 方 法 简 单 将 预 测 字 段 的 每 个 类 别 ( 参 考 类 别 除 外 ) 与 参 考 类 别 进 行 比 较 差 分 将 预 测 字 段 的 每 个 类 别 ( 第 一 个 类 别 除 外 ) 与 前 面 类 别 的 平 均 效 果 进 行 比 较 也 称 为 逆 Helmert 对 比 Helmert 将 预 测 字 段 的 每 个 类 别 ( 最 后 一 个 类 别 除 外 ) 与 后 续 类 别 的 平 均 效 果 进 行 比 较 重 复 将 预 测 字 段 的 每 个 类 别 ( 第 一 个 类 别 除 外 ) 与 前 一 个 类 别 进 行 比 较 多 项 式 正 交 多 项 式 对 比 假 设 类 别 均 匀 分 布 多 项 式 对 比 仅 适 用 于 数 值 字 段 偏 差 将 预 测 字 段 的 每 个 类 别 ( 参 考 类 别 除 外 ) 与 总 体 效 果 进 行 比 较 基 准 类 别 指 定 如 何 针 对 所 选 对 比 类 型 确 定 参 考 类 别 选 择 第 一 个 使 用 输 入 字 段 的 第 一 个 类 别 ( 按 字 母 顺 序 排 列 ), 或 选 择 最 后 一 个 使 用 最 后 一 个 类 别 默 认 值 为 第 一 个 注 意 : 如 果 对 比 设 置 为 差 分 Helmert 重 复 或 多 项 式, 此 字 段 将 不 可 用 每 个 字 段 对 整 体 响 应 影 响 的 估 计, 可 以 计 算 为 其 他 各 个 类 别 相 对 于 参 考 类 别 的 似 然 增 量 或 减 量 这 有 助 于 确 定 比 较 有 可 能 给 出 特 定 响 应 的 字 段 和 值 基 准 类 别 在 输 出 中 显 示 为 0.0 这 是 因 为 将 其 与 自 己 进 行 比 较 会 产 生 空 的 结 果 所 有 其 他 类 别 均 显 示 为 与 基 准 类 别 相 关 的 方 程 式 有 关 详 细 信 息, 请 参 阅 第 250 页 码 Logistic 模 型 块 详 细 信 息

255 243 统 计 模 型 多 项 模 型 图 片 Logistic 节 点 : 多 项 模 型 选 项 对 于 多 项 模 型, 可 用 的 方 法 和 选 项 如 下 : 方 法 指 定 要 用 于 构 建 Logistic 回 归 模 型 的 方 法 按 Enter 键 这 是 默 认 方 法, 可 将 所 有 项 直 接 输 入 方 程 式 构 建 模 型 时 不 进 行 字 段 选 择 逐 步 法 顾 名 思 义, 逐 步 字 段 选 择 法 就 是 分 步 构 建 方 程 式 初 始 模 型 是 可 能 的 最 简 单 模 型, 其 方 程 式 中 不 含 任 何 模 型 项 ( 除 常 量 外 ) 在 每 个 步 骤 中, 对 尚 未 添 加 到 模 型 的 项 进 行 评 估, 如 果 其 中 的 最 佳 项 能 够 显 著 增 加 模 型 预 测 能 力, 则 将 该 项 添 加 到 模 型 中 此 外, 还 会 重 新 评 估 当 前 包 含 在 模 型 中 的 项, 以 确 定 能 否 在 不 对 模 型 功 能 造 成 重 大 减 损 的 情 况 下 删 除 其 中 任 何 项 如 果 可 以, 则 会 将 其 删 除 然 后 重 复 此 过 程, 添 加 并 / 或 删 除 其 他 项 当 无 法 再 添 加 任 何 项 来 改 进 模 型 且 无 法 再 删 除 任 何 项 而 不 对 模 型 功 能 造 成 减 损 时, 最 终 模 型 便 已 生 成 前 进 法 字 段 选 择 的 前 进 法 与 分 步 构 建 模 型 的 逐 步 法 类 似 但 采 用 这 种 方 法 时, 初 始 模 型 是 最 简 单 的 模 型, 只 能 向 模 型 中 添 加 常 量 和 项 每 个 步 骤 会 对 尚 未 纳 入 到 模 型 中 的 项 进 行 检 验, 看 它 们 对 模 型 的 改 进 起 多 大 作 用, 然 后 将 其 中 的 最 佳 项 添 加 到 模 型 中 当 无 法 再 添 加 任 何 项 或 最 佳 备 选 项 无 法 对 模 型 产 生 足 够 的 改 进 时, 最 终 模 型 便 已 生 成

256 244 章 10 后 退 法 从 本 质 上 说, 后 退 法 与 前 进 法 是 相 反 的 但 采 用 这 种 方 法 时, 初 始 模 型 包 含 作 为 预 测 变 量 的 所 有 项, 只 能 从 模 型 中 删 除 项 对 模 型 贡 献 较 小 的 模 型 项 将 被 逐 一 删 除, 直 到 无 法 再 删 除 任 何 项 而 不 对 模 型 功 能 造 成 重 大 损 害, 从 而 生 成 最 终 模 型 后 退 逐 步 法 从 本 质 上 说, 后 退 逐 步 法 与 逐 步 法 是 相 反 的 采 用 这 种 方 法 时, 初 始 模 型 将 包 含 作 为 预 测 变 量 的 所 有 项 每 个 步 骤 会 评 估 模 型 中 的 项, 并 且 将 可 以 删 除 而 不 对 模 型 功 能 造 成 重 大 减 损 的 项 删 除 此 外, 还 会 对 先 前 删 除 的 项 进 行 重 新 评 估, 以 确 定 其 中 的 最 佳 项 是 否 对 模 型 的 预 测 功 能 起 到 显 著 作 用 如 果 是, 则 会 将 其 重 新 添 加 到 模 型 中 当 无 法 再 删 除 任 何 项 而 不 对 模 型 功 能 造 成 重 大 减 损 且 无 法 再 添 加 任 何 项 以 改 进 模 型 时, 最 终 模 型 便 已 生 成 注 意 : 自 动 方 法 ( 包 括 逐 步 法 前 进 法 和 后 退 法 ) 是 适 应 性 强 的 学 习 方 法, 并 且 特 别 容 易 过 度 拟 合 训 练 数 据 使 用 这 些 方 法 时, 用 新 数 据 或 使 用 分 区 节 点 创 建 的 保 留 测 试 样 本 对 结 果 模 型 的 有 效 性 进 行 验 证 尤 为 重 要 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 目 标 的 基 准 类 别 指 定 如 何 确 定 参 考 类 别 这 将 用 作 对 目 标 中 所 有 其 他 类 别 的 回 归 方 程 式 进 行 估 计 的 基 准 选 择 第 一 个 使 用 当 前 目 标 字 段 的 第 一 个 类 别 ( 按 字 母 顺 序 排 列 ), 或 选 择 最 后 一 个 使 用 最 后 一 个 类 别 或 者, 可 以 选 择 指 定 以 选 择 特 定 类 别, 并 从 列 表 中 选 择 所 需 的 值 可 以 在 类 型 节 点 中 为 每 个 字 段 定 义 可 用 值 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 使 用 值 对 话 框 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 通 常 应 将 关 注 程 度 最 低 的 类 别 指 定 为 基 准 类 别, 例 如 低 价 促 销 产 品 然 后 再 以 相 对 方 式 将 其 他 类 别 与 该 基 准 类 别 相 关, 从 而 确 定 什 么 使 它 们 更 有 可 能 自 成 类 别 这 有 助 于 确 定 比 较 有 可 能 给 出 特 定 响 应 的 字 段 和 值 基 准 类 别 在 输 出 中 显 示 为 0.0 这 是 因 为 将 其 与 自 己 进 行 比 较 会 产 生 空 的 结 果 所 有 其 他 类 别 均 显 示 为 与 基 准 类 别 相 关 的 方 程 式 有 关 详 细 信 息, 请 参 阅 第 250 页 码 Logistic 模 型 块 详 细 信 息 模 型 类 型 用 于 定 义 模 型 中 的 项 的 选 项 共 有 三 种 主 效 应 模 型 仅 分 别 包 括 各 个 输 入 字 段, 而 不 检 验 输 入 字 段 之 间 的 交 互 效 应 ( 乘 法 效 应 ) 全 析 因 模 型 包 括 所 有 交 互 效 应, 以 及 输 入 字 段 主 效 应 全 析 因 模 型 捕 获 复 杂 关 系 的 能 力 较 强, 但 也 比 较 难 以 解 释, 而 且 更 有 可 能 出 现 过 度 拟 合 情 况 由 于 有 可 能 出 现 大 量 可 能 组 合, 因 此 对 于 全 析 因 模 型, 自 动 字 段 选 择 方 法 ( 进 入 法 以 外 的 方 法 ) 处 于 禁 用 状 态 自 定 义 模 型 仅 包 括 您 指 定 的 项 ( 主 效 应 和 交 互 效 应 ) 选 择 此 选 项 时, 应 使 用 模 型 项 列 表 在 模 型 中 添 加 或 删 除 项 模 型 项 构 建 自 定 义 模 型 时, 将 需 要 明 确 指 定 模 型 中 的 项 此 列 表 显 示 了 模 型 项 的 当 前 集 合 模 型 项 列 表 右 边 的 按 钮 可 用 于 添 加 或 删 除 模 型 项 E 要 将 项 添 加 到 模 型 中, 请 单 击 添 加 新 的 模 型 项 按 钮 E 要 删 除 项, 请 选 定 所 需 项, 然 后 单 击 删 除 选 定 模 型 项 按 钮 将 项 添 加 到 Logistic 回 归 模 型 在 请 求 Logistic 回 归 模 型 时, 可 以 通 过 单 击 Logistic 回 归 模 型 选 项 卡 中 的 添 加 新 的 模 型 项 按 钮 将 项 添 加 到 模 型 中 此 时 将 打 开 一 个 新 的 对 话 框, 您 可 在 其 中 指 定 项

257 245 统 计 模 型 图 片 Logistic 回 归 新 建 项 对 话 框 要 添 加 的 项 类 型 有 几 种 将 项 添 加 到 模 型 的 方 法, 具 体 取 决 于 在 可 用 字 段 列 表 中 对 输 入 字 段 的 选 择 单 向 交 互 效 应 插 入 表 示 所 有 选 定 字 段 的 交 互 效 应 的 项 主 效 应 针 对 每 个 选 定 的 输 入 字 段 插 入 一 个 主 效 应 项 ( 该 字 段 本 身 ) 所 有 双 向 交 互 效 应 针 对 每 个 可 能 的 选 定 输 入 字 段 对 插 入 一 个 双 向 交 互 效 应 项 ( 输 入 字 段 的 积 ) 例 如, 如 果 已 在 可 用 字 段 列 表 中 选 定 输 入 字 段 A B 和 C, 此 方 法 将 插 入 项 A * B A * C 和 B * C 所 有 三 向 交 互 效 应 针 对 每 个 可 能 的 选 定 输 入 字 段 组 合 ( 一 次 取 三 个 ) 插 入 一 个 三 向 交 互 效 应 项 ( 输 入 字 段 的 积 ) 例 如, 如 果 已 在 可 用 字 段 列 表 中 选 定 输 入 字 段 A B C 和 D, 此 方 法 将 插 入 项 A * B * C A *B*D A*C*D 和 B*C*D 所 有 四 向 交 互 效 应 针 对 每 个 可 能 的 选 定 输 入 字 段 组 合 ( 一 次 取 四 个 ) 插 入 一 个 四 向 交 互 效 应 项 ( 输 入 字 段 的 积 ) 例 如, 如 果 已 在 可 用 字 段 列 表 中 选 定 输 入 字 段 A B C D 和 E, 此 方 法 将 插 入 项 A * B * C * D A * B * C * E A * B * D * E A * C * D * E 和 B * C * D * E 可 用 字 段 列 出 要 用 于 构 造 模 型 项 的 可 用 输 入 字 段 预 览 根 据 上 述 所 选 字 段 和 项 类 型, 显 示 单 击 插 入 时 将 添 加 到 模 型 中 的 项 插 入 将 项 插 入 模 型 ( 根 据 当 前 选 择 的 字 段 和 项 类 型 ) 并 关 闭 对 话 框 Logistic 节 点 专 家 选 项 如 果 具 备 Logistic 回 归 的 深 入 知 识, 则 可 以 使 用 专 家 选 项 对 训 练 过 程 进 行 调 整 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家

258 246 章 10 图 片 Logistic 回 归 专 家 选 项 卡 尺 度 ( 仅 限 多 项 模 型 ) 您 可 以 指 定 将 用 于 更 正 参 数 协 方 差 矩 阵 的 估 计 值 的 离 差 尺 度 值 Pearson 使 用 Pearson 卡 方 统 计 量 估 计 尺 度 值 偏 差 使 用 偏 差 函 数 ( 似 然 比 卡 方 ) 统 计 量 估 计 尺 度 值 您 也 可 以 指 定 自 己 的 用 户 定 义 尺 度 值 必 须 是 正 数 值 追 加 所 有 概 率 如 果 选 中 此 选 项, 则 会 将 输 出 字 段 的 每 个 类 别 的 概 率 添 加 到 节 点 所 处 理 的 每 个 记 录 中 如 果 未 选 中 此 选 项, 则 仅 添 加 预 测 类 别 的 概 率 例 如, 包 含 具 有 三 个 类 别 的 多 项 模 型 结 果 的 表 将 包 括 五 个 新 列 一 个 列 将 列 出 预 测 正 确 的 结 果 的 概 率, 第 二 个 列 将 显 示 该 预 测 准 确 或 失 误 的 概 率, 第 三 个 列 将 显 示 每 个 类 别 的 预 测 失 误 或 准 确 的 概 率 有 关 详 细 信 息, 请 参 阅 第 250 页 码 Logistic 模 型 块 注 意 : 对 于 二 项 模 型, 此 选 项 始 终 处 于 选 中 状 态 奇 异 性 容 许 误 差 指 定 用 于 检 查 异 常 值 的 容 差 收 敛 这 些 选 项 可 用 于 控 制 模 型 收 敛 的 参 数 当 您 执 行 模 型 时, 收 敛 设 置 将 控 制 重 复 运 行 不 同 参 数 以 观 察 其 拟 合 程 度 的 次 数 参 数 的 尝 试 次 数 越 多, 结 果 将 越 接 近 ( 即, 结 果 将 会 收 敛 ) 有 关 详 细 信 息, 请 参 阅 第 246 页 码 Logistic 回 归 收 敛 选 项 输 出 通 过 这 些 选 项, 可 以 请 求 将 出 现 在 由 节 点 构 建 的 模 型 块 的 高 级 输 出 中 的 附 加 统 计 量 有 关 详 细 信 息, 请 参 阅 第 247 页 码 Logistic 回 归 高 级 输 出 步 进 这 些 选 项 可 用 于 控 制 采 用 逐 步 前 进 后 退 或 后 退 逐 步 估 计 法 添 加 和 删 除 字 段 的 标 准 ( 如 果 已 选 择 进 入 法, 该 按 钮 将 处 于 禁 用 状 态 ) 有 关 详 细 信 息, 请 参 阅 第 249 页 码 Logistic 回 归 步 进 选 项 Logistic 回 归 收 敛 选 项 您 可 设 置 用 于 Logistic 回 归 模 型 估 计 的 收 敛 参 数

259 247 统 计 模 型 图 片 Logistic 回 归 收 敛 选 项 最 大 迭 代 次 数 指 定 用 于 估 计 模 型 的 最 大 迭 代 次 数 最 大 步 骤 对 分 逐 步 二 分 法 是 Logistic 回 归 用 于 处 理 估 计 过 程 中 的 复 杂 情 况 的 一 种 技 术 在 通 常 情 况 下, 应 使 用 默 认 设 置 对 数 似 然 估 计 收 敛 如 果 对 数 似 然 的 相 对 变 化 小 于 此 值, 迭 代 将 停 止 如 果 值 为 0, 则 不 使 用 该 标 准 参 数 收 敛 如 果 参 数 的 绝 对 变 化 或 相 对 变 化 小 于 此 值, 迭 代 将 停 止 如 果 值 为 0, 则 不 使 用 该 标 准 Delta( 仅 用 于 多 项 模 型 ) 可 以 指 定 要 添 加 到 每 个 空 单 元 格 ( 输 入 字 段 和 输 出 字 段 值 的 组 合 ) 的 值, 该 值 介 于 0 和 1 之 间 当 相 对 于 数 据 中 的 记 录 数 有 许 多 可 能 的 字 段 值 组 合 时, 此 值 有 助 于 估 计 算 法 处 理 数 据 默 认 值 为 0 Logistic 回 归 高 级 输 出 选 择 要 在 回 归 模 型 块 的 高 级 输 出 中 显 示 的 可 选 输 出 要 查 看 高 级 输 出, 请 浏 览 模 型 块 并 单 击 高 级 选 项 卡 有 关 详 细 信 息, 请 参 阅 第 254 页 码 Logistic 模 型 块 高 级 输 出 二 项 式 选 项 图 片 Logistic 回 归 二 项 输 出 选 项

260 248 章 10 选 择 要 为 模 型 生 成 的 输 出 的 类 型 有 关 详 细 信 息, 请 参 阅 第 254 页 码 Logistic 模 型 块 高 级 输 出 显 示 选 择 是 要 在 每 个 步 骤 中 显 示 结 果 还 是 等 到 所 有 步 骤 均 已 完 成 时 再 显 示 结 果 exp(b) 的 CI 选 择 表 达 式 中 每 个 系 数 ( 显 示 为 Beta) 的 置 信 区 间 指 定 置 信 区 间 的 水 平 ( 默 认 值 为 95%) 残 差 诊 断 请 求 残 差 的 观 测 值 诊 断 表 离 群 值 极 限 ( 标 准 差 ) 仅 列 出 这 样 的 残 差 观 测 值 : 所 列 变 量 的 绝 对 标 准 化 值 至 少 与 您 指 定 的 值 一 样 大 默 认 值 为 2 全 部 个 案 在 残 差 的 观 测 值 诊 断 表 中 包 括 所 有 观 测 值 注 意 : 由 于 此 选 项 将 列 出 每 个 输 入 记 录, 因 此 可 能 在 报 告 中 产 生 异 常 巨 大 的 表, 其 中 每 个 记 录 占 一 行 分 类 标 准 值 此 选 项 可 用 于 确 定 对 观 测 值 进 行 分 类 的 分 割 点 具 有 大 于 分 类 界 限 值 的 预 测 值 的 个 案 被 分 类 为 正, 具 有 小 于 分 类 界 限 值 的 预 测 值 的 个 案 分 类 为 负 要 更 改 默 认 值, 请 输 入 一 个 0.01 到 0.99 之 间 的 值 多 项 选 项 图 片 Logistic 回 归 : 多 项 输 出 选 项 选 择 要 为 模 型 生 成 的 输 出 的 类 型 有 关 详 细 信 息, 请 参 阅 第 254 页 码 Logistic 模 型 块 高 级 输 出 注 意 : 选 择 似 然 比 检 验 选 项 会 大 大 增 加 构 建 Logistic 回 归 模 型 所 需 的 处 理 时 间 如 果 模 型 构 建 时 间 过 长, 可 以 考 虑 禁 用 此 选 项, 或 利 用 Wald 统 计 量 和 得 分 统 计 量 有 关 详 细 信 息, 请 参 阅 第 249 页 码 Logistic 回 归 步 进 选 项 迭 代 历 史 间 隔 选 择 在 高 级 输 出 中 打 印 迭 代 状 态 的 分 步 间 隔 置 信 区 间 方 程 式 中 系 数 的 置 信 区 间 指 定 置 信 区 间 的 水 平 ( 默 认 值 为 95%)

261 249 统 计 模 型 Logistic 回 归 步 进 选 项 图 片 Logistic 回 归 步 进 标 准 模 型 中 的 项 数 ( 仅 用 于 多 项 模 型 ) 可 以 指 定 模 型 中 的 最 小 项 数 ( 针 对 后 退 法 和 后 退 逐 步 法 模 型 ) 和 最 大 项 数 ( 针 对 前 进 法 和 逐 步 法 模 型 ) 如 果 指 定 大 于 0 的 最 小 值, 模 型 将 包 括 该 数 量 的 项, 即 使 根 据 统 计 标 准 应 将 其 中 某 些 项 删 除 也 是 如 此 对 于 前 进 法 逐 步 法 和 进 入 法 模 型, 将 忽 略 最 小 值 设 置 如 果 指 定 最 大 值, 可 能 会 省 略 模 型 中 的 某 些 项, 即 使 根 据 统 计 标 准 应 将 其 选 中 也 是 如 此 对 于 后 退 法 后 退 逐 步 法 和 进 入 法 模 型, 将 忽 略 指 定 最 大 值 设 置 纳 入 标 准 ( 仅 适 用 于 多 项 模 型 ) 选 择 得 分 以 最 大 化 处 理 速 度 似 然 比 选 项 可 能 会 稍 微 多 提 供 一 些 有 力 的 估 计 值, 但 所 需 的 计 算 时 间 较 长 默 认 设 置 是 使 用 得 分 统 计 量 移 除 标 准 选 择 似 然 比 可 得 到 更 稳 健 的 模 型 要 缩 短 构 建 模 型 所 需 的 时 间, 可 以 尝 试 选 择 Wald 但 是, 如 果 数 据 中 有 完 全 或 半 完 全 分 隔 ( 可 使 用 模 型 块 的 高 级 选 项 卡 确 定 ),Wald 统 计 量 将 变 得 极 不 可 靠, 不 应 采 用 默 认 设 置 是 使 用 似 然 比 统 计 量 对 于 二 项 模 型, 还 有 附 加 选 项 条 件 此 选 项 提 供 以 基 于 条 件 参 数 估 计 值 的 似 然 比 统 计 量 的 概 率 为 依 据 的 移 除 检 验 标 准 的 显 著 性 阈 值 使 用 此 选 项 可 基 于 每 个 字 段 关 联 的 统 计 概 率 (p 值 ) 指 定 选 择 标 准 仅 当 关 联 的 p 值 小 于 纳 入 标 准 值 时, 才 会 将 字 段 添 加 到 模 型 中 ; 仅 当 p 值 大 于 剔 出 标 准 值 时, 才 会 将 字 段 删 除 纳 入 标 准 值 必 须 小 于 剔 出 标 准 值 纳 入 或 移 除 的 要 求 ( 仅 适 用 于 多 项 模 型 ) 对 于 某 些 应 用 程 序, 除 非 模 型 也 包 含 交 互 效 应 项 所 涉 及 字 段 的 低 阶 项, 否 则 将 交 互 效 应 项 添 加 到 模 型 中 在 数 学 上 是 没 有 意 Òuc1å 摹 例 如, 除 非 A 和 B 也 纳 入 到 模 型 中, 否 则 将 A * B 纳 入 到 模 型 中 没 有 意 义 使 用 这 些 选 项, 可 以 确 定 如 何 在 逐 步 模 型 项 选 择 过 程 中 处 理 这 些 依 赖 关 系

262 250 章 10 用 于 离 散 效 果 的 层 次 仅 当 相 关 字 段 的 低 阶 效 应 ( 涉 及 较 少 字 段 的 主 效 应 或 交 互 效 应 ) 均 已 进 入 模 型 中 时, 高 阶 效 应 ( 涉 及 较 多 字 段 的 交 互 效 应 ) 才 会 进 入 模 型, 而 且 只 要 高 阶 效 应 仍 在 模 型 中, 便 不 会 删 除 涉 及 相 同 字 段 的 低 阶 效 应 此 选 项 仅 适 用 于 分 类 字 段 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 测 量 级 别 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 用 于 所 有 效 果 的 层 次 此 选 项 的 工 作 原 理 与 上 一 选 项 相 同, 但 它 适 用 于 所 有 输 入 字 段 用 于 所 有 效 果 的 容 器 仅 当 效 应 中 包 含 的 所 有 效 应 也 纳 入 到 模 型 中 时, 该 效 应 才 能 纳 入 到 模 型 中 此 选 项 与 用 于 所 有 效 果 的 层 次 选 项 类 似, 只 是 连 续 字 段 的 处 理 方 式 略 有 不 同 要 让 一 个 效 应 包 含 另 一 个 效 应, 被 包 含 ( 低 阶 ) 效 应 必 须 包 括 包 含 ( 高 阶 ) 效 应 中 涉 及 的 所 有 连 续 字 段, 且 被 包 含 效 应 的 分 类 字 段 必 须 是 包 含 效 应 中 离 散 字 段 的 子 集 例 如, 如 果 A 和 B 是 分 类 字 段,X 是 连 续 字 段, 那 么 项 A * B * X 将 包 含 项 A * X 和 B * X 无 没 有 任 何 强 制 关 系 ; 模 型 中 项 的 添 加 和 删 除 是 各 自 独 立 的 Logistic 模 型 块 Logistic 模 型 块 表 示 由 Logistic 节 点 估 计 的 方 程 式 其 中 包 含 Logistic 回 归 模 型 捕 获 的 所 有 信 息, 以 及 有 关 模 型 结 构 和 性 能 的 信 息 这 种 类 型 的 方 程 式 也 可 以 通 过 其 他 模 型 ( 如 Oracle SVM) 生 成 运 行 包 含 logistic 模 型 块 的 流 时, 该 节 点 可 添 加 包 含 模 型 预 测 和 关 联 概 率 在 内 的 两 个 新 字 段 新 字 段 的 名 称 来 自 正 被 预 测 的 输 出 字 段 的 名 称, 前 缀 $L- 表 示 预 测 类 别, 前 缀 $LP- 表 示 相 关 概 率 例 如, 对 于 名 为 colorpref 的 输 出 字 段, 新 字 段 将 命 名 为 $L-colorpref 和 $LP-colorpref 此 外, 如 果 在 Logistic 节 点 中 选 中 了 追 加 所 有 概 率 选 项, 则 会 针 对 输 出 字 段 的 每 个 类 别 添 加 一 个 附 加 字 段, 其 中 包 含 属 于 每 个 记 录 对 应 类 别 的 概 率 这 些 附 加 字 段 基 于 输 出 字 段 的 值 进 行 命 名, 带 有 前 缀 $LP- 例 如, 如 果 colorpref 的 合 法 值 为 Red Green 和 Blue, 则 会 添 加 以 下 三 个 新 字 段 :$LP-Red $LP-Green 和 $LP-Blue 生 成 过 滤 节 点 使 用 生 成 菜 单 可 以 创 建 新 的 过 滤 节 点, 用 于 根 据 模 型 结 果 传 递 输 入 字 段 因 多 重 共 线 性 而 从 模 型 中 删 除 的 字 段 以 及 模 型 中 未 使 用 的 字 段 将 被 生 成 的 节 点 过 滤 Logistic 模 型 块 详 细 信 息 对 于 多 项 模 型,Logistic 模 型 块 中 的 模 型 选 项 卡 有 一 个 分 割 显 示, 在 左 侧 窗 格 中 显 示 模 型 方 程 式, 在 右 侧 窗 格 中 显 示 预 测 变 量 重 要 性 而 二 项 模 型 的 选 项 卡 中 只 显 示 预 测 变 量 重 要 性 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 模 型 方 程 式 对 于 多 项 模 型, 左 窗 格 显 示 为 logistic 回 归 模 型 估 计 的 实 际 方 程 式 在 目 标 字 段 中, 除 基 准 类 别 之 外, 每 种 类 别 均 有 一 个 方 程 式 这 些 方 程 式 以 树 格 式 显 示 这 种 类 型 的 方 程 式 也 可 以 通 过 某 些 其 他 模 型 ( 如 Oracle SVM) 生 成

263 251 统 计 模 型 图 片 显 示 预 测 变 量 重 要 性 的 Logistic 块 模 型 详 细 信 息 等 式 用 于 显 示 用 于 在 给 定 一 组 预 测 变 量 值 的 情 况 下 推 导 出 目 标 类 别 概 率 的 回 归 方 程 式 目 标 字 段 的 最 后 一 个 类 别 将 被 视 为 基 准 类 别 ; 显 示 的 方 程 式 将 针 对 一 组 特 定 预 测 变 量 值 给 出 其 他 类 别 相 对 于 基 准 类 别 的 对 数 优 势 比 给 定 预 测 变 量 模 式 的 每 个 类 别 的 预 测 概 率 根 据 这 些 对 数 优 势 比 值 推 导 得 出 如 何 计 算 概 率 每 个 方 程 式 会 计 算 一 个 特 定 目 标 类 别 相 对 于 基 准 类 别 的 对 数 优 势 比 对 数 优 势 比 ( 也 称 为 对 数 ) 是 指 定 目 标 类 别 相 对 于 基 准 类 别 的 概 率 比, 并 对 结 果 取 自 然 对 数 对 于 基 准 类 别, 类 别 相 对 于 自 身 的 优 势 比 为 1.0, 因 此 其 对 数 优 势 比 为 0 可 以 将 这 种 情 况 视 为 基 准 类 别 的 隐 含 方 程 式, 其 中 所 有 系 数 均 为 0 要 根 据 特 定 目 标 类 别 的 对 数 优 势 比 推 导 出 概 率, 需 要 取 该 类 别 的 方 程 式 计 算 的 logit 值, 并 应 用 以 下 公 式 :

264 252 章 10 P(group i ) = exp(g i ) / k exp(g k ) 其 中 g 是 计 算 的 对 数 优 势 比,i 是 类 别 参 考 号,k 为 1 至 目 标 类 别 数 之 间 的 数 字 预 测 变 量 重 要 性 另 外, 模 型 选 项 卡 上 还 可 能 显 示 表 示 评 估 模 型 时 每 个 预 测 变 量 相 对 重 要 性 的 图 表 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 注 意, 只 有 在 生 成 模 型 之 前 选 中 分 析 选 项 卡 上 的 计 算 预 测 变 量 重 要 性, 才 可 以 使 用 此 图 表 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 注 意 : 与 其 他 类 型 的 模 型 相 比, 计 算 logistic 回 归 的 预 测 变 量 重 要 性 所 用 时 间 更 长, 所 以 默 认 情 况 下, 在 分 析 选 项 卡 中 不 选 中 预 测 变 量 重 要 性 选 中 该 选 项 可 能 会 降 低 性 能, 对 大 数 据 集 尤 为 明 显 Logistic 模 型 块 概 要 Logistic 回 归 模 型 的 概 要 显 示 用 于 生 成 该 模 型 的 字 段 和 设 置 此 外, 如 果 已 执 行 附 加 到 该 建 模 节 点 的 分 析 节 点, 则 还 会 在 此 部 分 显 示 该 分 析 中 的 信 息 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 分 析 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 有 关 使 用 模 型 浏 览 器 的 一 般 信 息, 请 参 阅 浏 览 模 型 块 第 43 页 码 图 片 Logistic 回 归 模 型 块 : 汇 总 选 项 卡

265 253 统 计 模 型 Logistic 模 型 块 设 置 Logistic 模 型 块 中 的 设 置 选 项 卡 用 于 指 定 模 型 评 分 过 程 中 的 置 信 度 概 率 倾 向 得 分 和 SQL 生 成 选 项 该 选 项 卡 仅 在 已 将 模 型 块 添 加 到 流 中 之 后 才 可 用, 而 且 可 以 根 据 模 型 和 目 标 的 类 型 显 示 不 同 选 项 图 片 具 有 名 义 目 标 的 多 项 模 型 的 设 置 多 项 模 型 对 于 多 项 模 型, 可 用 的 选 项 如 下 : 计 算 置 信 度 指 定 是 否 在 评 分 时 计 算 置 信 度 计 算 原 始 倾 向 得 分 ( 仅 适 用 于 标 志 目 标 ) 只 有 对 于 具 有 标 志 目 标 的 模 型, 才 可 以 请 求 原 始 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 的 似 然 值 为 真 的 结 果 除 此 之 外, 标 准 预 测 及 置 信 值 也 是 如 此 调 整 后 的 倾 向 得 分 不 可 用 有 关 详 细 信 息, 请 参 阅 第 34 页 码 第 3 章 中 的 建 模 节 点 分 析 选 项 追 加 所 有 概 率 指 定 是 否 将 输 出 字 段 每 个 类 别 的 概 率 添 加 到 该 节 点 所 处 理 的 每 个 记 录 如 果 未 选 中 此 选 项, 则 仅 添 加 预 测 类 别 的 概 率 例 如, 对 于 具 有 三 种 类 别 的 名 义 目 标, 得 分 输 出 针 对 三 种 类 别 的 每 一 种 仅 包 括 一 列, 其 中 第 四 列 指 示 任 何 时 候 预 测 类 别 的 概 率 例 如, 如 果 类 别 红 色 绿 色 和 蓝 色 的 概 率 分 别 是 和 0.1, 则 预 测 类 将 为 红 色, 其 中 概 率 为 0.6 生 成 此 模 型 的 SQL 使 用 数 据 库 中 的 数 据 时,SQL 代 码 可 传 回 到 数 据 库 中 执 行, 从 而 大 大 提 高 许 多 操 作 的 处 理 速 度 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 SQL 优 化 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南 注 意 : 对 于 多 项 模 型, 如 果 已 选 中 追 加 所 有 概 率, 则 SQL 生 成 不 可 用 ; 或 者, 对 于 具 有 名 义 目 标 的 模 型, 如 果 选 中 计 算 置 信 度, 则 SQL 生 成 不 可 用 仅 仅 对 具 有 标 志 目 标 的 多 项 模 型, 支 持 具 有 置 信 度 计 算 的 SQL 生 成 SQL 生 成 不 适 用 于 二 项 模 型

266 254 章 10 二 项 模 型 对 于 二 项 模 型, 始 终 启 用 置 信 度 和 概 率, 并 且 用 于 禁 用 这 两 个 选 项 的 设 置 不 可 用 SQL 生 成 不 适 用 于 二 项 模 型 对 于 二 项 模 型, 唯 一 可 以 更 改 的 设 置 是 计 算 原 始 倾 向 得 分 的 功 能 正 如 之 前 针 对 多 项 模 型 的 说 明, 这 一 项 内 容 适 用 于 只 具 有 标 志 目 标 的 模 型 有 关 详 细 信 息, 请 参 阅 第 34 页 码 第 3 章 中 的 建 模 节 点 分 析 选 项 Logistic 模 型 块 高 级 输 出 图 片 Logistic 回 归 方 程 式 节 点 高 级 选 项 卡 示 例 Logistic 回 归 ( 也 称 为 名 义 回 归 ) 的 高 级 输 出 将 提 供 有 关 估 计 模 型 及 其 性 能 的 详 细 信 息 高 级 输 出 包 含 的 大 部 分 信 息 技 术 含 量 很 高, 需 要 具 备 Logistic 回 归 分 析 方 面 的 广 泛 知 识 才 能 正 确 理 解 该 输 出

267 255 统 计 模 型 警 告 指 明 结 果 中 存 在 的 任 何 警 告 或 潜 在 问 题 个 案 处 理 摘 要 列 出 由 模 型 中 的 每 个 符 号 字 段 处 理 和 细 分 的 记 录 数 步 骤 概 要 ( 可 选 ) 列 出 在 采 用 自 动 字 段 选 择 的 情 况 下, 模 型 创 建 的 每 个 步 骤 添 加 或 删 除 的 效 应 注 意 : 仅 针 对 逐 步 法 前 进 法 后 退 法 或 后 退 逐 步 法 显 示 此 选 项 迭 代 历 史 ( 可 选 ) 显 示 每 n 次 迭 代 的 参 数 估 计 值 的 迭 代 历 史 ( 从 初 始 估 计 值 开 始 ), 其 中 n 是 打 印 间 隔 值 默 认 设 置 是 打 印 每 次 迭 代 (n=1) 模 型 拟 合 信 息 ( 多 项 模 型 ) 显 示 该 模 型 ( 最 终 模 型 ) 相 对 于 其 中 所 有 参 数 系 数 均 为 0( 仅 有 截 距 ) 的 模 型 的 似 然 比 检 验 分 类 ( 可 选 ) 显 示 输 出 字 段 预 测 值 和 实 际 值 的 百 分 比 矩 阵 拟 合 优 度 卡 方 统 计 量 ( 可 选 ) 显 示 Pearson 和 似 然 比 卡 方 统 计 量 这 些 统 计 量 可 检 验 模 型 对 训 练 数 据 的 总 体 拟 合 度 Hosmer-Lemeshow 拟 合 优 度 ( 可 选 ) 显 示 将 观 测 值 分 组 为 风 险 的 十 分 位 数 并 对 每 个 十 分 位 数 内 的 观 测 概 率 与 预 期 概 率 进 行 比 较 的 结 果 此 拟 合 优 度 统 计 量 比 多 项 模 型 中 采 用 的 传 统 拟 合 优 度 统 计 量 更 为 稳 健, 尤 其 适 用 于 具 有 连 续 协 变 量 的 模 型 和 小 样 本 的 研 究 伪 R 平 方 ( 可 选 ) 显 示 模 型 拟 合 度 的 Cox 和 Snell Nagelkerke 和 McFadden R 平 方 度 量 这 些 统 计 量 在 某 些 方 面 与 线 性 回 归 中 的 R 平 方 统 计 量 类 似 单 调 性 测 量 ( 可 选 ) 显 示 数 据 中 一 致 对 不 一 致 对 和 约 束 对 的 数 量, 以 及 每 种 对 占 总 对 数 的 百 分 比 此 表 中 还 显 示 Somers 的 D Goodman 和 Kruskal 的 Gamma Kendall 的 tau-a 以 及 协 调 索 引 C 信 息 标 准 ( 可 选 ) 显 示 AIC 信 息 准 则 和 Schwarz BIC 信 息 准 则 似 然 比 检 验 ( 可 选 ) 显 示 模 型 效 应 系 数 是 否 在 统 计 上 不 等 于 0 的 统 计 量 检 验 有 意 义 的 输 入 字 段 是 输 出 的 显 著 性 水 平 很 低 ( 标 示 为 Sig.) 的 输 入 字 段 参 数 估 计 ( 可 选 ) 显 示 方 程 式 系 数 这 些 系 数 的 检 验 衍 生 自 标 示 为 Exp(B) 的 系 数 的 优 势 比 及 其 置 信 区 间 的 估 计 值 渐 近 协 方 差 / 相 关 矩 阵 ( 可 选 ) 显 示 系 数 估 计 值 的 渐 近 协 方 差 和 / 或 相 关 性 已 观 测 到 的 频 数 和 预 测 的 频 数 ( 可 选 ) 对 于 每 个 协 变 量 模 式, 为 每 个 输 出 字 段 的 值 显 示 已 观 测 到 的 频 数 和 预 测 的 频 数 此 表 可 能 很 大, 对 于 具 有 数 字 输 入 字 段 的 模 型 来 说 尤 其 如 此 如 果 结 果 表 太 大 无 法 应 用, 则 将 省 略 该 表, 并 显 示 一 条 警 告 主 成 份 分 析 / 因 子 节 点 因 子 / 主 成 分 分 析 节 点 提 供 了 用 于 降 低 数 据 复 杂 程 度 的 强 大 数 据 缩 减 技 术 该 技 术 提 供 以 下 两 种 相 似 但 不 同 的 方 法 主 成 分 分 析 (PCA) 可 找 出 能 在 整 个 字 段 集 中 最 好 地 捕 获 方 差 的 输 入 字 段 的 线 性 组 合, 其 中 成 分 相 互 正 交 ( 垂 直 ) 主 成 分 分 析 集 中 关 注 所 有 方 差, 包 括 共 享 方 差 和 独 有 方 差 因 子 分 析 尝 试 找 出 可 解 释 一 组 被 观 测 字 段 中 的 相 关 模 式 的 基 本 概 念 或 因 子 因 子 分 析 只 集 中 关 注 共 享 方 差 估 计 模 型 时 不 考 虑 特 定 字 段 独 有 的 方 差 因 子 / 主 成 分 分 析 节 点 提 供 几 种 因 子 分 析 方 法

268 256 章 10 这 两 种 方 式 的 目 标 都 是 找 到 有 效 概 括 原 始 字 段 集 中 的 信 息 的 一 小 部 分 导 出 字 段 要 求 主 成 分 分 析 因 子 模 型 中 只 能 使 用 数 值 字 段 要 估 计 因 子 分 析 或 主 成 分 分 析, 需 要 一 个 或 多 个 角 色 设 置 为 输 入 字 段 的 字 段 角 色 设 置 为 目 标 双 向 或 无 的 字 段 将 被 忽 略, 就 像 对 待 非 数 值 字 段 一 样 强 度 因 子 分 析 和 主 成 分 分 析 可 以 在 不 牺 牲 太 多 信 息 内 容 的 情 况 下 有 效 降 低 数 据 复 杂 程 度 这 些 技 术 可 帮 助 您 构 建 更 稳 健 的 模 型, 并 实 现 比 原 始 输 入 字 段 更 高 的 执 行 速 度 主 成 分 分 析 / 因 子 节 点 模 型 选 项 图 片 主 成 分 分 析 (PCA)/ 因 子 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 提 取 方 法 指 定 要 用 于 数 据 降 维 的 方 法 主 成 分 这 是 默 认 方 法, 将 使 用 主 成 分 分 析 来 找 出 概 括 输 入 字 段 的 成 分 未 加 权 最 小 二 乘 此 因 子 分 析 方 法 的 工 作 原 理 是 找 出 最 有 能 力 重 现 输 入 字 段 之 间 关 系 ( 相 关 ) 模 式 的 因 子 集 合 广 义 最 小 二 乘 此 因 子 分 析 方 法 与 未 加 权 最 小 二 乘 方 法 类 似, 区 别 在 于 它 利 用 加 权 降 低 具 有 大 量 独 有 ( 非 共 享 ) 方 差 的 字 段 的 重 要 程 度 最 大 似 然 法 此 因 子 分 析 方 法 将 产 生 最 有 可 能 生 成 输 入 字 段 中 观 测 到 的 关 系 ( 相 关 ) 模 式 的 因 子 方 程 式, 它 以 对 这 些 关 系 的 形 式 的 假 定 为 基 础 特 别 是, 该 方 法 假 定 训 练 数 据 服 从 多 元 正 态 分 布 主 轴 因 子 法 此 因 子 分 析 方 法 与 主 成 分 方 法 十 分 类 似, 区 别 在 于 它 只 集 中 关 注 共 享 方 差

269 257 统 计 模 型 Alpha 因 子 法 此 因 子 分 析 方 法 将 分 析 中 的 字 段 视 为 潜 在 输 入 字 段 范 围 内 的 样 本 它 会 将 因 子 的 统 计 可 靠 性 最 大 化 映 像 因 子 法 此 因 子 分 析 方 法 使 用 数 据 估 计 来 隔 离 通 用 方 差, 并 找 出 描 述 该 方 差 的 因 子 主 成 份 分 析 (PCA)/ 因 子 节 点 专 家 选 项 如 果 具 备 因 子 分 析 和 主 成 分 分 析 的 深 入 知 识, 则 可 以 使 用 专 家 选 项 对 训 练 过 程 进 行 调 整 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家 图 片 主 成 分 分 析 (PCA)/ 因 子 专 家 选 项 卡 缺 失 值 默 认 情 况 下,IBM SPSS Modeler 将 仅 使 用 对 于 模 型 中 使 用 的 所 有 字 段 均 具 有 有 效 值 的 记 录 ( 这 种 方 式 有 时 称 为 缺 失 值 的 成 列 删 除 ) 如 果 有 很 多 缺 失 数 据, 您 可 能 会 发 现 这 种 方 式 去 除 的 记 录 过 多, 剩 余 记 录 不 足 以 生 成 较 好 的 模 型 在 这 类 情 况 下, 可 以 取 消 选 中 仅 使 用 完 整 记 录 选 项 然 后,SPSS Modeler 将 尝 试 使 用 尽 可 能 多 的 信 息 估 计 模 型, 包 括 其 中 一 些 字 段 具 有 缺 失 值 的 记 录 ( 这 种 方 式 有 时 称 为 缺 失 值 的 成 对 删 除 ) 但 在 某 些 情 形 下, 以 这 种 方 式 使 用 不 完 整 记 录 可 能 会 在 模 型 的 估 计 过 程 中 产 生 计 算 问 题 字 段 指 定 估 计 模 型 时 是 使 用 输 入 字 段 的 相 关 矩 阵 ( 默 认 设 置 ) 还 是 使 用 其 协 方 差 矩 阵 收 敛 的 最 大 迭 代 次 数 指 定 用 于 估 计 模 型 的 最 大 迭 代 次 数 提 取 因 子 选 择 要 从 输 入 字 段 中 提 取 的 因 子 数 的 方 法 共 有 两 种

270 258 章 10 特 征 值 超 出 此 选 项 将 保 留 特 征 值 大 于 指 定 标 准 的 所 有 因 子 或 成 分 特 征 值 用 于 度 量 每 个 因 子 或 成 分 概 括 输 入 字 段 集 合 中 方 差 的 能 力 使 用 相 关 矩 阵 时, 模 型 将 保 留 特 征 值 大 于 指 定 值 的 所 有 因 子 或 成 分 使 用 协 方 差 矩 阵 时, 标 准 是 指 定 的 乘 以 平 均 特 征 值 该 尺 度 变 换 使 此 选 项 对 于 两 种 类 型 的 矩 阵 具 有 类 似 的 意 义 最 大 数 此 选 项 将 保 留 指 定 数 量 的 因 子 或 成 分, 按 特 征 值 的 降 序 排 列 换 言 之, 将 保 留 n 个 最 高 特 征 值 所 对 应 的 因 子 或 成 分, 其 中 n 为 指 定 标 准 默 认 提 取 标 准 为 五 个 因 子 / 成 分 成 分 / 因 子 矩 阵 格 式 这 些 选 项 用 于 控 制 因 子 矩 阵 ( 对 应 主 成 分 分 析 模 型 为 成 分 矩 阵 ) 的 格 式 按 值 进 行 排 序 如 果 选 中 此 选 项, 则 会 按 数 字 顺 序 对 模 型 输 出 中 的 因 子 载 入 进 行 排 序 隐 藏 小 于 如 果 选 中 此 选 项, 则 会 在 矩 阵 中 隐 藏 低 于 指 定 阈 值 的 得 分, 以 便 于 查 看 矩 阵 中 的 模 式 旋 转 这 些 选 项 可 用 于 控 制 模 型 的 旋 转 方 法 有 关 详 细 信 息, 请 参 阅 第 258 页 码 主 成 分 分 析 (PCA)/ 因 子 节 点 旋 转 选 项 主 成 分 分 析 (PCA)/ 因 子 节 点 旋 转 选 项 图 片 主 成 分 分 析 (PCA)/ 因 子 旋 转 选 项 许 多 情 况 下, 对 保 留 的 因 子 集 合 进 行 数 学 旋 转 可 提 高 其 实 用 性, 尤 其 可 以 降 低 其 解 释 难 度 选 择 一 种 旋 转 方 法 : 无 旋 转 这 是 默 认 选 项 不 使 用 旋 转 Varimax 这 种 正 交 旋 转 方 法 可 将 每 个 因 子 上 载 荷 较 高 的 字 段 的 数 量 降 至 最 低 它 简 化 了 因 子 的 解 释 过 程 斜 交 旋 转 斜 交 ( 非 正 交 ) 旋 转 的 方 法 当 Delta 等 于 0( 默 认 值 ) 时, 解 将 采 用 斜 交 法 delta 负 得 越 厉 害, 因 子 的 斜 交 度 越 低 要 覆 盖 默 认 的 delta 值 0, 请 输 入 小 于 等 于 0.8 的 数 Quartimax 这 种 正 交 旋 转 方 法 可 将 解 释 每 个 字 段 所 需 的 因 子 的 数 量 降 至 最 低 它 简 化 了 被 观 测 字 段 的 解 释 过 程 Equamax 这 种 旋 转 方 法 是 Varimax 法 与 Quartimax 法 的 组 合, 前 者 用 于 简 化 因 子, 后 者 用 于 简 化 字 段 可 将 某 个 因 子 上 载 荷 较 高 的 字 段 数 量 和 解 释 某 个 字 段 所 需 的 因 子 数 量 降 至 最 低 Promax 这 种 斜 交 旋 转 方 法 允 许 因 子 之 间 相 关 它 计 算 起 来 比 斜 交 旋 转 更 快, 因 此 适 用 于 大 型 数 据 集 Kappa 用 于 控 制 解 的 倾 斜 度 ( 因 子 相 关 的 程 度 )

271 259 统 计 模 型 主 成 分 分 析 (PCA)/ 因 子 模 型 块 主 成 分 分 析 (PCA)/ 因 子 模 型 块 表 示 由 主 成 分 分 析 (PCA)/ 因 子 节 点 创 建 的 因 子 分 析 和 主 成 分 分 析 (PCA) 模 型 其 中 包 含 被 训 练 模 型 捕 获 的 所 有 信 息, 以 及 有 关 模 型 性 能 和 特 征 的 信 息 当 您 运 行 包 含 因 子 方 程 式 模 型 的 流 时, 节 点 会 为 模 型 中 的 每 个 因 子 或 成 分 添 加 一 个 新 字 段 新 字 段 的 名 称 来 自 模 型 名 称, 加 上 前 缀 $F- 和 后 缀 -n, 其 中 n 是 因 子 或 成 分 的 编 号 例 如, 如 果 模 型 名 为 Factor 且 包 含 三 个 因 子, 新 字 段 将 命 名 为 $F-Factor-1 $F-Factor-2 和 $F-Factor-3 为 更 好 地 了 解 因 子 模 型 的 编 码 内 容, 可 以 进 一 步 执 行 一 些 下 游 分 析 查 看 因 子 模 型 结 果 的 一 种 实 用 方 法 是 使 用 统 计 量 节 点 查 看 因 子 与 输 入 字 段 之 间 的 相 关 性 这 种 方 法 可 显 示 哪 些 输 入 字 段 对 哪 些 因 子 的 载 荷 较 重, 并 帮 助 您 发 现 因 子 是 否 具 有 潜 在 的 意 义 或 解 释 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 统 计 量 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 您 还 可 以 使 用 高 级 输 出 中 提 供 的 信 息 对 因 子 模 型 进 行 评 估 要 查 看 高 级 输 出, 请 单 击 模 型 块 浏 览 器 的 高 级 选 项 卡 高 级 输 出 包 含 大 量 详 细 信 息, 适 合 于 在 因 子 分 析 或 主 成 分 分 析 方 面 具 有 广 泛 知 识 的 用 户 有 关 详 细 信 息, 请 参 阅 第 262 页 码 主 成 分 分 析 / 因 子 模 型 块 高 级 输 出 主 成 分 分 析 / 因 子 模 型 块 方 程 式 因 子 模 型 快 的 模 型 选 项 卡 显 示 每 个 因 子 的 因 子 得 分 方 程 式 因 子 或 成 分 的 得 分 是 通 过 将 每 个 输 入 字 段 值 乘 以 其 系 数 并 将 结 果 相 加 计 算 得 出 的

272 260 章 10 图 片 主 成 分 分 析 (PCA)/ 因 子 模 型 块 模 型 选 项 卡 主 成 分 分 析 / 因 子 模 型 块 概 要 因 子 模 型 的 概 要 选 项 卡 显 示 因 子 / 主 成 分 分 析 模 型 中 保 留 的 因 子 数, 以 及 有 关 用 于 生 成 模 型 的 字 段 和 设 置 的 其 他 信 息 有 关 详 细 信 息, 请 参 阅 第 43 页 码 第 3 章 中 的 浏 览 模 型 块

273 261 统 计 模 型 图 片 因 子 方 程 式 节 点 概 要 选 项 卡 示 例

274 262 章 10 主 成 分 分 析 / 因 子 模 型 块 高 级 输 出 图 片 因 子 方 程 式 节 点 高 级 选 项 卡 示 例 因 子 分 析 的 高 级 输 出 提 供 有 关 所 估 计 模 型 及 其 性 能 的 详 细 信 息 高 级 输 出 中 包 含 的 大 部 分 信 息 技 术 含 量 很 高, 需 要 具 备 因 子 分 析 方 面 的 广 泛 知 识 才 能 正 确 理 解 该 输 出 警 告 指 明 结 果 中 存 在 的 任 何 警 告 或 潜 在 问 题 公 因 子 方 差 显 示 因 子 或 成 分 占 每 个 字 段 的 方 差 的 比 例 初 始 给 出 整 个 因 子 集 合 ( 以 与 输 入 字 段 相 同 数 量 的 因 子 开 始 的 模 型 ) 的 公 因 子 方 差, 提 取 给 出 基 于 保 留 因 子 集 的 公 因 子 方 差 解 释 的 总 方 差 显 示 能 被 模 型 中 因 子 解 释 的 总 方 差 初 始 特 征 值 显 示 可 由 整 个 初 始 因 子 集 解 释 的 方 差 提 取 载 入 平 方 和 显 示 由 模 型 中 保 留 的 因 子 解 释 的 方 差 旋 转 载 入 平 方 和 显 示 由 旋 转 因 子 解 释 的 方 差 请 注 意, 对 于 斜 交 旋 转, 旋 转 载 入 平 方 和 仅 显 示 载 入 平 方 和, 而 不 显 示 方 差 百 分 比 因 子 ( 或 成 分 ) 矩 阵 显 示 输 入 字 段 与 非 旋 转 因 子 之 间 的 相 关 性 旋 转 因 子 ( 或 成 分 ) 矩 阵 显 示 输 入 字 段 与 正 交 旋 转 的 旋 转 因 子 之 间 的 相 关 性 模 式 矩 阵 显 示 输 入 字 段 与 斜 交 旋 转 的 旋 转 因 子 之 间 的 偏 相 关 结 构 矩 阵 显 示 输 入 字 段 与 斜 交 旋 转 的 旋 转 因 子 之 间 的 简 单 相 关 性 因 子 相 关 矩 阵 显 示 斜 交 旋 转 的 因 子 之 间 的 相 关 性

275 263 统 计 模 型 判 别 式 节 点 判 别 式 分 析 用 于 为 组 成 员 关 系 构 建 预 测 模 型 该 模 型 由 一 个 判 别 函 数 组 成 ( 如 果 有 两 个 以 上 组, 则 由 一 组 判 别 函 数 组 成 ), 判 别 函 数 是 预 测 变 量 的 线 性 组 合, 提 供 组 之 间 的 最 佳 判 别 这 些 函 数 通 过 组 成 员 关 系 已 知 的 观 测 值 样 本 生 成 ; 然 后, 可 以 将 这 些 函 数 应 用 于 具 有 预 测 变 量 测 量 值 但 组 成 员 关 系 未 知 的 新 观 测 值 示 例 根 据 使 用 数 据, 电 信 公 司 可 以 用 判 别 式 分 析 对 用 户 进 行 分 组 此 操 作 使 电 信 公 司 可 对 潜 在 的 用 户 进 行 评 分, 并 确 定 哪 些 用 户 最 有 可 能 属 于 最 有 价 值 的 组 有 关 详 细 信 息, 请 参 阅 第 22 章 中 的 电 信 客 户 分 类 ( 判 别 式 分 析 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 要 求 您 需 要 一 个 或 多 个 输 入 字 段, 且 只 需 要 一 个 目 标 字 段 目 标 必 须 为 带 有 字 符 串 或 整 数 存 储 的 分 类 字 段 ( 测 量 级 别 为 标 志 或 名 义 ) ( 如 有 必 要, 可 以 使 用 过 滤 节 点 或 导 出 节 点 转 换 存 储 类 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 使 用 填 充 节 点 进 行 存 储 类 型 转 换 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 ) 将 忽 略 设 置 为 双 向 或 无 的 字 段 必 须 对 模 型 中 使 用 的 字 段 的 类 型 完 全 实 例 化 强 度 判 别 式 分 析 和 Logistic 回 归 都 是 适 用 于 分 类 的 模 型 然 而, 判 别 式 分 析 会 对 输 入 字 段 进 行 更 多 的 假 设 例 如, 假 设 这 些 字 段 为 正 态 分 布 且 为 连 续, 则 当 满 足 这 些 要 求 时 它 们 能 提 供 更 好 的 结 果, 尤 其 是 当 样 本 量 比 较 小 时 判 别 式 节 点 模 型 选 项 图 片 判 别 式 节 点 对 话 框 : 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称

276 264 章 10 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 方 法 下 列 选 项 用 于 向 模 型 中 输 入 预 测 变 量 : 按 Enter 键 这 是 默 认 方 法, 可 将 所 有 项 直 接 输 入 方 程 式 不 能 显 著 增 加 模 型 预 测 能 力 的 项 将 不 被 添 加 逐 步 法 初 始 模 型 可 能 是 最 简 单 的 模 型, 其 方 程 式 中 不 含 任 何 模 型 项 ( 除 常 量 外 ) 在 每 个 步 骤 中, 对 尚 未 添 加 到 模 型 的 项 进 行 评 估, 如 果 其 中 的 最 佳 项 能 够 显 著 增 加 模 型 预 测 能 力, 则 将 该 项 添 加 到 模 型 中 注 意 : 逐 步 法 对 训 练 数 据 有 强 烈 地 过 度 拟 合 的 趋 势 当 使 用 这 些 方 法 时, 用 保 留 测 试 样 本 或 新 数 据 对 结 果 模 型 的 有 效 性 进 行 验 证 尤 其 重 要 判 别 式 节 点 专 家 选 项 如 果 对 判 别 式 分 析 有 详 尽 了 解, 可 用 专 家 选 项 调 整 训 练 过 程 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 中 将 模 式 设 置 为 专 家 图 片 判 别 式 节 点 对 话 框 : 专 家 选 项 先 验 概 率 此 选 项 决 定 是 否 根 据 已 有 的 组 成 员 知 识 调 整 分 类 系 数

277 265 统 计 模 型 所 有 组 均 相 等 假 定 所 有 组 的 先 验 概 率 均 相 等 ; 此 选 项 对 系 数 没 有 影 响 根 据 组 大 小 计 算 样 本 中 观 测 到 的 组 大 小 决 定 组 成 员 的 先 验 概 率 例 如, 如 果 分 析 中 包 括 的 观 测 值 有 50% 属 于 第 一 组,25% 属 于 第 二 组,25% 属 于 第 三 组, 则 会 调 整 分 类 系 数, 以 提 高 第 一 组 成 员 相 对 于 其 他 两 组 成 员 的 似 然 性 使 用 协 方 差 矩 阵 您 可 以 选 择 使 用 组 内 协 方 差 矩 阵 或 类 协 方 差 矩 阵 对 观 测 值 进 行 分 类 组 内. 汇 聚 的 组 内 协 方 差 矩 阵 用 来 对 个 案 分 类 独 立 组. 分 组 协 方 差 矩 阵 用 于 分 类 由 于 分 类 基 于 判 别 函 数 ( 而 非 基 于 原 始 变 量 ), 因 此 该 选 项 并 不 总 是 等 同 于 二 次 判 别 输 出 通 过 这 些 选 项, 可 以 请 求 将 显 示 在 由 节 点 构 建 的 模 型 块 的 高 级 输 出 中 的 附 加 统 计 量 有 关 详 细 信 息, 请 参 阅 第 265 页 码 判 别 式 节 点 输 出 选 项 步 进 通 过 这 些 选 项, 可 以 使 用 逐 步 评 估 法 对 添 加 和 删 除 字 段 的 标 准 进 行 控 制 ( 如 果 已 选 择 进 入 法, 该 按 钮 将 处 于 禁 用 状 态 ) 有 关 详 细 信 息, 请 参 阅 第 267 页 码 判 别 式 节 点 步 进 选 项 判 别 式 节 点 输 出 选 项 图 片 判 别 式 节 点 高 级 输 出 选 项 选 择 要 在 Logistic 回 归 模 型 块 的 高 级 输 出 中 显 示 的 可 选 输 出 要 查 看 高 级 输 出, 请 浏 览 模 型 块 并 单 击 高 级 选 项 卡 有 关 详 细 信 息, 请 参 阅 第 268 页 码 判 别 式 模 型 块 高 级 输 出 描 述 性 统 计 量 可 用 的 选 项 有 均 值 ( 包 括 标 准 差 ) 单 变 量 ANOVA 和 Box s M 检 验 均 值. 显 示 自 变 量 的 总 均 值 组 均 值 和 标 准 差

278 266 章 10 单 变 量 ANOVA. 每 个 自 变 量 的 组 均 值 的 等 同 性 执 行 单 因 子 方 差 分 析 检 验 Box's M. 组 协 方 差 矩 阵 的 等 同 性 检 验 对 于 足 够 大 的 样 本, 不 显 著 的 p 值 表 示 断 定 矩 阵 不 同 的 证 据 不 足 该 检 验 对 于 偏 离 多 变 量 正 态 性 很 敏 感 函 数 系 数 可 用 的 选 项 有 Fisher 分 类 系 数 和 非 标 准 化 系 数 Fisher. 显 示 可 以 直 接 用 于 分 类 的 Fisher 分 类 函 数 系 数 为 每 个 组 获 得 一 组 单 独 的 分 类 函 数 系 数, 将 一 个 个 案 分 配 给 该 组, 该 个 案 对 此 组 具 有 最 大 判 别 分 数 ( 分 类 函 数 值 ) 未 标 准 化. 显 示 未 标 准 化 的 判 别 函 数 系 数 矩 阵 自 变 量 系 数 的 可 用 矩 阵 为 类 内 相 关 矩 阵 类 内 协 方 差 矩 阵 类 协 方 差 矩 阵 和 总 协 方 差 矩 阵 组 内 相 关. 显 示 汇 聚 的 组 内 相 关 矩 阵, 获 取 该 矩 阵 的 方 法 是 在 计 算 相 关 性 之 前, 求 得 所 有 组 的 单 个 协 方 差 矩 阵 的 平 均 值 类 内 协 方 差. 显 示 汇 聚 的 组 内 协 方 差 矩 阵, 该 矩 阵 与 总 协 方 差 矩 阵 可 能 不 同 获 取 该 矩 阵 的 方 法 是, 求 得 所 有 组 的 单 个 协 方 差 矩 阵 的 平 均 值 组 协 方 差. 显 示 每 个 组 的 分 离 协 方 差 矩 阵 总 协 方 差. 显 示 来 自 所 有 个 案 的 协 方 差 矩 阵, 就 好 像 它 们 来 自 一 个 样 本 一 样 分 类 下 列 输 出 属 于 分 类 结 果 个 案 结 果. 为 每 个 个 案 显 示 实 际 组 的 代 码 预 测 组 后 验 概 率 和 判 别 得 分 摘 要 表. 基 于 判 别 分 析, 正 确 地 和 不 正 确 地 指 定 给 每 个 组 的 个 案 数 有 时 称 为 混 乱 矩 阵 不 考 虑 该 个 案 时 的 分 类. 分 析 中 的 每 个 个 案 由 除 该 个 案 之 外 的 所 有 个 案 生 成 的 函 数 来 进 行 分 类 这 也 称 为 U 方 法 区 域 图. 用 于 基 于 函 数 值 将 个 案 分 类 到 组 的 边 界 图 其 个 数 对 应 于 个 案 分 类 到 的 组 数 每 个 组 的 均 值 在 其 边 界 内 用 一 个 星 号 表 示 如 果 只 有 一 个 判 别 函 数, 则 该 图 不 会 显 示 合 并 组. 创 建 前 两 个 判 别 函 数 值 的 所 有 组 散 点 图 如 果 只 有 一 个 函 数, 则 转 而 显 示 一 个 直 方 图 分 组. 创 建 前 两 个 判 别 函 数 值 的 分 组 散 点 图 如 果 只 有 一 个 函 数, 则 转 而 显 示 直 方 图 逐 步 法 步 骤 汇 总 显 示 执 行 每 个 步 骤 后 所 有 变 量 的 统 计 量 ; 成 对 距 离 的 F 值 显 示 每 两 个 组 中 成 对 F 比 的 矩 阵 F 比 可 用 于 组 之 间 马 氏 距 离 的 显 著 性 检 验

279 267 统 计 模 型 判 别 式 节 点 步 进 选 项 图 片 判 别 式 节 点 逐 步 法 选 项 方 法 选 择 要 用 于 输 入 或 删 除 新 变 量 的 统 计 量 可 用 替 代 选 项 有 Wilks 的 lambda 无 法 解 释 的 方 差 马 氏 距 离 最 小 F 比 以 及 Rao 的 V 使 用 Rao 的 V 时, 可 以 为 要 输 入 的 变 量 指 定 V 的 最 小 增 量 Wilk 的 lambda. 一 种 用 于 逐 步 判 别 分 析 的 变 量 选 择 方 法, 它 基 于 变 量 能 在 多 大 程 度 上 降 低 Wilks 的 lambda 来 选 择 要 输 入 到 方 程 中 的 变 量 在 每 一 步, 均 是 输 入 能 使 总 体 Wilks 的 lambda 最 小 的 变 量 无 法 解 释 的 方 差. 在 每 一 步 中 输 入 使 组 间 未 解 释 变 动 合 计 最 小 的 变 量 马 氏 距 离. 自 变 量 上 个 案 的 值 与 所 有 个 案 的 平 均 值 相 异 程 度 的 测 量 大 的 Mahalanobis 距 离 表 示 个 案 在 一 个 或 多 个 自 变 量 上 具 有 极 值 最 小 F 比. 一 种 逐 步 分 析 中 的 变 量 选 择 方 法, 它 基 于 使 从 组 间 Mahalanobis 距 离 计 算 得 到 的 F 比 最 大 Rao 的 V. 组 均 值 之 间 的 差 分 的 测 量 也 称 为 Lawley-Hotelling 轨 迹 在 每 一 步, 能 使 Rao 的 V 增 加 最 大 的 变 量 被 选 进 来 选 择 此 选 项 之 后, 请 输 入 要 进 入 分 析, 变 量 必 须 具 有 的 最 小 值 标 准 可 用 替 代 选 项 为 使 用 F 值 和 使 用 F 的 概 率 输 入 用 于 输 入 和 删 除 变 量 的 值 使 用 F 值. 如 果 变 量 的 F 值 大 于 输 入 值, 则 该 变 量 输 入 模 型, 如 果 F 值 小 于 剔 除 值, 则 该 变 量 从 模 型 中 移 去 输 入 值 必 须 大 于 剔 除 值, 且 两 者 均 必 须 为 正 数 要 将 更 多 的 变 量 选 入 到 模 型 中, 请 降 低 输 入 值 要 将 更 多 的 变 量 从 模 型 中 移 去, 请 增 大 剔 除 值 使 用 F 的 概 率. 如 果 变 量 的 F 值 的 显 著 性 水 平 小 于 输 入 值, 则 将 该 变 量 选 入 到 模 型 中, 如 果 该 显 著 性 水 平 大 于 剔 除 值, 则 将 该 变 量 从 模 型 中 移 去 输 入 值 必 须 小 于 剔 除 值, 且 两 者 均 必 须 为 正 数 要 将 更 多 的 变 量 选 入 到 模 型 中, 请 增 加 输 入 值 要 将 更 多 的 变 量 从 模 型 中 移 去, 请 降 低 剔 除 值 判 别 式 模 型 块 判 别 式 模 型 块 表 示 由 判 别 式 节 点 估 计 的 方 程 式 这 些 方 程 式 包 含 由 判 别 式 模 型 所 捕 获 的 所 有 信 息 及 有 关 模 型 结 构 和 性 能 的 信 息

280 268 章 10 当 运 行 包 含 判 别 式 模 型 块 的 流 时, 该 节 点 可 添 加 包 含 模 型 预 测 和 关 联 概 率 的 两 个 新 字 段 新 字 段 的 名 称 来 自 正 在 预 测 的 输 出 字 段 的 名 称, 前 缀 为 $D- 表 示 预 测 的 类 别, 前 缀 为 $DP- 表 示 关 联 的 概 率 例 如, 对 于 名 称 为 colorpref 的 输 出 字 段, 新 字 段 的 名 称 应 是 $D-colorpref 和 $DP-colorpref 生 成 过 滤 节 点 使 用 生 成 菜 单 可 以 创 建 新 的 过 滤 节 点, 用 于 根 据 模 型 结 果 传 递 输 入 字 段 预 测 变 量 重 要 性 另 外, 模 型 选 项 卡 上 还 可 能 显 示 表 示 评 估 模 型 时 每 个 预 测 变 量 相 对 重 要 性 的 图 表 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 注 意, 只 有 在 生 成 模 型 之 前 选 中 分 析 选 项 卡 上 的 计 算 预 测 变 量 重 要 性, 才 可 以 使 用 此 图 表 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 判 别 式 模 型 块 高 级 输 出 图 片 判 别 式 模 型 块 : 高 级 选 项 卡 判 别 式 分 析 的 高 级 输 出 给 出 了 有 关 估 计 模 型 及 其 性 能 的 详 细 信 息 在 高 级 输 出 中 包 含 的 多 数 信 息 具 有 很 强 的 技 术 性, 需 要 具 有 广 泛 的 判 别 式 分 析 方 面 的 知 识 才 能 够 对 此 输 出 作 出 正 确 地 解 释 有 关 详 细 信 息, 请 参 阅 第 265 页 码 判 别 式 节 点 输 出 选 项

281 269 统 计 模 型 判 别 式 模 型 块 设 置 通 过 判 别 式 模 型 块 中 的 设 置 选 项 卡, 您 可 以 在 对 模 型 进 行 评 分 时 获 取 倾 向 得 分 此 选 项 卡 在 只 带 有 标 志 目 标 的 模 型 中 提 供, 并 且 仅 在 已 将 模 型 块 添 加 到 流 中 后 可 用 图 片 判 别 式 模 型 块, 标 志 目 标 的 设 置 选 项 卡 计 算 原 始 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回? 是? 或? 否? 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 除 了 这 些 得 分, 还 有 其 他 在 评 分 过 程 中 生 成 的 预 测 值 和 置 信 度 值 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 得 分 仅 依 赖 于 训 练 数 据, 并 且 由 于 许 多 模 型 过 度 拟 合 此 数 据 的 倾 向, 该 得 分 可 能 会 过 度 优 化 调 整 后 的 倾 向 会 尝 试 通 过 针 对 检 验 或 验 证 分 区 对 模 型 性 能 进 行 评 估 进 行 弥 补 此 选 项 要 求 在 流 中 定 义 分 区 字 段 并 且 在 生 成 模 型 之 前 在 建 模 节 点 中 启 用 调 整 的 倾 向 得 分 判 别 式 模 型 块 汇 总 判 别 式 模 型 块 的 汇 总 选 项 卡 显 示 了 用 于 生 成 模 型 的 字 段 和 设 置 此 外, 如 果 已 执 行 附 加 到 该 建 模 节 点 的 分 析 节 点, 则 还 会 在 此 部 分 显 示 该 分 析 中 的 信 息 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 分 析 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 有 关 使 用 模 型 浏 览 器 的 一 般 信 息, 请 参 阅 浏 览 模 型 块 第 43 页 码

282 270 章 10 图 片 判 别 式 模 型 块 : 汇 总 选 项 卡 GenLin 节 点 广 义 线 性 模 型 扩 展 了 一 般 线 性 模 型, 使 因 变 量 通 过 指 定 的 链 接 函 数 与 因 子 和 协 变 量 线 性 相 关 而 且, 该 模 型 还 允 许 因 变 量 为 非 正 态 分 布 它 涵 盖 了 广 泛 使 用 的 统 计 模 型, 如 用 于 正 态 分 布 响 应 的 线 性 回 归 用 于 二 进 制 数 据 的 logistic 模 型 用 于 计 数 数 据 的 对 数 线 性 模 型 用 于 区 间 删 失 生 存 数 据 的 互 补 重 对 数 模 型 以 及 使 用 其 非 常 通 用 的 模 型 公 式 的 其 他 许 多 统 计 模 型 示 例 运 输 公 司 可 以 使 用 广 义 线 性 模 型, 对 在 不 同 期 间 建 造 的 一 些 轮 船 类 型 的 损 坏 统 计 采 用 泊 松 回 归, 其 结 果 模 型 可 帮 助 确 定 哪 些 轮 船 类 型 最 容 易 损 坏 有 关 详 细 信 息, 请 参 阅 第 24 章 中 的 使 用 泊 松 回 归 来 分 析 船 只 损 坏 率 ( 广 义 线 性 模 型 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 汽 车 保 险 公 司 可 以 使 用 广 义 线 性 模 型, 对 汽 车 损 坏 理 赔 采 用 gamma 回 归, 其 结 果 模 型 可 帮 助 确 定 对 理 赔 额 度 贡 献 最 大 的 因 素 有 关 详 细 信 息, 请 参 阅 第 25 章 中 的 将 Gamma 回 归 拟 合 至 汽 车 保 险 理 赔 ( 广 义 线 性 模 型 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 医 疗 研 究 人 员 可 以 使 用 广 义 线 性 模 型, 对 间 隔 检 查 生 存 数 据 采 用 互 补 双 对 数 回 归, 以 预 测 医 疗 条 件 再 次 出 现 的 时 间 有 关 详 细 信 息, 请 参 阅 第 23 章 中 的 分 析 区 间 型 删 失 的 生 存 数 据 ( 广 义 线 性 模 型 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 广 义 线 性 模 型 的 工 作 原 理 是 构 建 一 个 方 程 式, 从 而 使 输 入 字 段 值 与 输 出 字 段 值 关 联 起 来 生 成 模 型 后, 便 可 以 将 其 用 于 为 新 数 据 估 值 对 于 每 条 记 录, 将 计 算 每 种 可 能 输 出 类 别 的 归 属 概 率 具 有 最 高 概 率 的 目 标 类 别 将 被 指 定 为 该 记 录 的 预 测 输 出 值

283 271 统 计 模 型 要 求 您 需 要 一 个 或 多 个 输 入 字 段, 同 时 有 且 仅 有 一 个 具 有 两 个 或 多 个 类 别 的 目 标 字 段 ( 其 测 量 级 别 可 以 为 连 续 或 标 记 ) 必 须 对 模 型 中 使 用 的 字 段 的 类 型 完 全 实 例 化 强 度 广 义 线 性 模 型 极 为 灵 活, 但 选 择 模 型 结 构 的 过 程 并 未 自 动 化, 因 此 您 需 要 对 数 据 有 一 定 的 了 解 ( 这 在 黑 盒 算 法 中 是 不 需 要 的 ) GenLin 节 点 字 段 选 项 图 片 GenLin 节 点 对 话 框, 字 段 选 项 卡 除 建 模 节 点 的 字 段 选 项 卡 通 常 提 供 的 目 标 输 入 和 分 区 等 自 定 义 选 项 外 ( 请 参 阅 建 模 节 点 字 段 选 项 第 30 页 码 ),GenLin 节 点 还 提 供 以 下 附 加 功 能 使 用 加 权 字 段 尺 度 参 数 是 与 响 应 方 差 相 关 的 估 计 模 型 参 数 尺 度 权 重 是 已 知 值, 可 能 因 观 察 值 的 不 同 而 异 如 果 指 定 了 刻 度 权 重 变 量, 则 对 每 个 观 察 值, 都 会 用 与 响 应 方 差 相 关 的 尺 度 参 数 除 以 该 尺 度 权 重 变 量 分 析 中 不 会 使 用 尺 度 权 重 值 小 于 等 于 0 或 缺 失 的 记 录

284 272 章 10 目 标 字 段 表 示 一 组 试 验 中 发 生 的 事 件 的 数 量 如 果 响 应 是 一 组 试 验 中 发 生 的 事 件 的 数 量, 目 标 字 段 将 包 含 该 事 件 数 量, 您 可 选 择 包 含 试 验 次 数 的 附 加 变 量 或 者, 如 果 试 验 数 在 所 有 主 体 中 都 相 同, 则 可 以 使 用 固 定 值 指 定 试 验 对 于 每 条 记 录, 试 验 次 数 应 大 于 或 等 于 事 件 数 量 事 件 应 为 非 负 整 数, 试 验 应 为 正 整 数 GenLin 节 点 模 型 选 项 图 片 GenLin 节 点 对 话 框, 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 模 型 类 型 有 两 个 选 项 用 于 要 构 造 的 模 型 类 型 仅 主 效 应 使 模 型 仅 分 别 包 括 各 个 输 入 字 段, 而 不 检 验 输 入 字 段 之 间 的 交 互 效 应 ( 乘 法 效 应 ) 主 效 应 和 所 有 双 向 交 互 包 括 所 有 双 向 交 互 以 及 输 入 字 段 主 效 应

285 273 统 计 模 型 偏 移 量 偏 移 量 项 是 一 个 结 构 预 测 变 量 它 的 系 数 不 通 过 模 型 估 计 而 假 定 其 值 为 1; 因 此, 偏 移 量 的 值 只 与 因 变 量 的 线 性 预 测 变 量 简 单 相 加 这 对 于 泊 松 回 归 模 型 尤 其 有 用, 在 这 种 模 型 中, 每 个 观 测 值 对 于 相 关 事 件 可 以 具 有 不 同 的 揭 示 级 别 例 如, 为 各 个 驾 驶 员 的 事 故 率 建 模 时, 有 三 年 驾 驶 经 验 的 驾 驶 员 在 一 次 事 故 中 的 过 错 率 与 有 25 年 驾 驶 经 验 的 驾 驶 员 在 一 次 事 故 中 的 过 错 率 存 在 重 大 差 别 如 果 将 驾 驶 员 经 历 纳 入 偏 移 项, 则 事 故 数 可 以 建 模 为 泊 松 响 应 注 意 : 如 果 使 用 变 量 偏 移 量, 则 指 定 字 段 不 应 同 时 也 用 作 输 出 如 果 需 要, 可 在 上 游 源 节 点 或 类 型 节 点 中 将 偏 移 量 字 段 的 角 色 设 置 为 无 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 设 置 字 段 角 色 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 标 志 目 标 的 基 准 类 别 对 于 二 元 响 应, 您 可 以 为 因 变 量 选 择 参 考 类 别 这 样 可 能 会 影 响 某 些 输 出, 如 参 数 估 计 值 和 保 存 值, 但 应 该 不 会 改 变 模 型 拟 合 度 例 如, 如 果 二 元 响 应 的 值 为 0 和 1: 默 认 情 况 下, 该 过 程 会 使 得 最 后 一 个 ( 值 最 高 的 ) 类 别 ( 即 1) 成 为 参 考 类 别 在 此 种 情 况 下, 模 型 保 存 的 概 率 会 估 计 出 给 定 观 测 值 采 用 值 0 的 几 率, 参 数 估 计 应 解 释 为 与 类 别 0 的 似 然 相 关 如 果 将 第 一 个 ( 值 最 低 的 ) 类 别 ( 即 0) 指 定 为 参 考 类 别, 则 模 型 保 存 的 概 率 会 估 计 出 给 定 观 测 值 采 用 值 1 的 几 率 如 果 指 定 自 定 义 类 别 而 且 变 量 定 义 了 标 签, 则 可 以 通 过 从 列 表 中 选 择 值 来 设 置 参 考 类 别 这 样 在 指 定 模 型 过 程 中 可 能 比 较 方 便, 您 不 必 确 切 记 得 某 个 特 定 变 量 是 如 何 编 码 的 在 模 型 中 包 含 截 距 模 型 中 通 常 包 含 截 距 如 果 您 可 以 假 设 数 据 穿 过 原 点, 则 可 以 排 除 截 距 GenLin 节 点 专 家 选 项 如 果 具 备 广 义 线 性 模 型 的 深 入 知 识, 则 可 以 使 用 专 家 选 项 对 训 练 过 程 进 行 微 调 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 中 将 模 式 设 置 为 专 家

286 274 章 10 图 片 Genlin 节 点 对 话 框, 专 家 选 项 卡 目 标 字 段 分 布 和 连 接 函 数 分 布 此 选 项 指 定 因 变 量 的 分 布 能 够 指 定 非 正 态 分 布 和 非 恒 等 链 接 函 数 是 广 义 线 性 模 型 相 对 于 一 般 线 性 模 型 的 重 大 改 进 存 在 许 多 可 能 的 分 布 - 链 接 函 数 组 合, 其 中 有 若 干 组 合 可 适 用 于 任 何 给 定 的 数 据 集, 因 此 您 可 以 根 据 先 验 理 论 考 虑 的 事 项 或 哪 个 组 合 看 起 来 拟 合 得 最 好 来 指 导 您 的 选 择 二 项 此 分 布 仅 适 用 于 表 示 二 元 响 应 或 事 件 数 的 变 量 Gamma 此 分 布 适 用 于 具 有 向 更 大 正 值 偏 斜 的 正 尺 度 值 的 变 量 如 果 某 个 数 据 值 小 于 等 于 0 或 者 缺 失, 则 在 分 析 中 不 使 用 相 应 的 观 测 值 逆 高 斯 此 分 布 适 用 于 具 有 向 更 大 正 值 偏 斜 的 正 尺 度 值 的 变 量 如 果 某 个 数 据 值 小 于 等 于 0 或 者 缺 失, 则 在 分 析 中 不 使 用 相 应 的 观 测 值

287 275 统 计 模 型 负 二 项 此 分 布 可 视 为 观 测 到 k 次 成 功 所 需 进 行 的 试 验 次 数, 它 适 用 于 具 有 非 负 整 数 值 的 变 量 如 果 某 个 数 据 值 为 非 整 数 小 于 0 或 者 缺 失, 则 在 分 析 中 不 使 用 相 应 的 观 测 值 负 二 项 式 分 布 辅 助 参 数 的 固 定 值 可 以 是 大 于 等 于 0 的 任 何 值 辅 助 参 数 设 置 为 0 时, 使 用 此 分 布 相 当 于 使 用 泊 松 分 布 正 态 此 分 布 适 用 于 其 值 围 绕 中 心 值 ( 均 值 ) 呈 对 称 钟 形 分 布 的 尺 度 变 量 因 变 量 必 须 是 数 值 型 泊 松 此 分 布 可 视 为 某 个 相 关 事 件 在 某 个 固 定 时 段 的 发 生 次 数, 它 适 用 于 具 有 非 负 整 数 值 的 变 量 如 果 某 个 数 据 值 为 非 整 数 小 于 0 或 者 缺 失, 则 在 分 析 中 不 使 用 相 应 的 观 测 值 Tweedie 该 分 布 适 用 于 可 以 由 泊 松 分 布 和 伽 玛 分 布 混 合 表 示 的 变 量 ; 从 某 种 意 义 上 说 该 分 布 属 于 混 合 型 分 布, 是 因 为 该 分 布 同 时 具 有 连 续 分 布 ( 采 用 非 负 实 数 值 ) 和 离 散 分 布 ( 正 概 率 群 位 于 单 个 值 0 上 ) 的 属 性 因 变 量 必 须 为 数 字, 且 数 据 值 大 于 等 于 0 如 果 数 据 值 小 于 0 或 者 缺 失, 则 在 分 析 中 将 不 使 用 相 应 的 观 测 值 Tweedie 分 布 参 数 的 固 定 值 可 以 为 大 于 1 且 小 于 2 的 任 意 数 字 多 项 式 此 分 布 适 用 于 表 示 顺 序 响 应 的 变 量 因 变 量 可 以 为 数 字 或 字 符 串, 且 至 少 有 两 个 不 同 的 有 效 数 据 值 连 接 函 数 链 接 函 数 是 允 许 进 行 模 型 估 计 的 因 变 量 的 变 换 可 用 链 接 函 数 如 下 : 恒 等 式 f(x)=x 不 对 因 变 量 进 行 变 换 此 链 接 函 数 可 用 于 任 何 分 布 互 补 重 对 数 f(x)=log( log(1 x)) 此 函 数 仅 适 用 于 二 项 分 布 累 积 Cauchit f(x) = tan(π (x 0.5)), 应 用 于 响 应 的 每 一 个 类 别 的 累 积 概 率 此 函 数 仅 适 用 于 多 项 分 布 累 积 互 补 双 对 数 f(x)=ln( ln(1 x)), 适 用 于 每 个 响 应 类 别 的 累 积 概 率 此 函 数 仅 适 用 于 多 项 分 布 累 积 分 对 数 f(x)=ln(x / (1 x)), 应 用 于 响 应 的 每 一 个 类 别 的 累 积 概 率 此 函 数 仅 适 用 于 多 项 分 布 累 积 负 重 对 数 f(x) = ln( ln(x)), 应 用 于 响 应 的 每 一 个 类 别 的 累 积 概 率 此 函 数 仅 适 用 于 多 项 分 布 累 积 probit f(x)=φ 1 (x), 适 用 于 每 个 响 应 类 别 的 累 积 概 率, 其 中 Φ 1 是 逆 标 准 正 态 累 积 分 布 函 数 此 函 数 仅 适 用 于 多 项 分 布 对 数 f(x)=log(x) 此 链 接 函 数 可 用 于 任 何 分 布 对 数 补 码 f(x)=log(1 x) 此 函 数 仅 适 用 于 二 项 分 布 分 对 数 f(x)=log(x / (1 x)) 此 函 数 仅 适 用 于 二 项 分 布 负 二 项 f(x)=log(x / (x+k 1 )), 其 中 k 是 负 二 项 分 布 的 辅 助 参 数 此 函 数 仅 适 用 于 负 二 项 分 布 负 重 对 数 f(x)= log( log(x)) 此 函 数 仅 适 用 于 二 项 分 布 优 势 幂 f(x)=[(x/(1 x)) α 1]/α, 如 果 α 0. f(x)=log(x), 如 果 α=0. α 为 必 需 的 数 字 指 定, 且 必 须 为 实 数 此 函 数 仅 适 用 于 二 项 分 布

288 276 章 10 概 率 值 f(x)=φ 1 (x), 其 中 Φ 1 是 逆 标 准 正 态 累 积 分 布 函 数 此 函 数 仅 适 用 于 二 项 分 布 幂 f(x)=x α, 如 果 α 0. f(x)=log(x), 如 果 α=0. α 为 必 需 的 数 字 指 定, 且 必 须 为 实 数 此 链 接 函 数 可 用 于 任 何 分 布 参 数 通 过 此 组 中 的 控 件, 可 以 在 选 中 某 些 分 布 选 项 时 指 定 参 数 值 负 二 项 式 的 参 数 对 于 负 二 项 式 分 布, 选 择 以 指 定 一 个 值 或 允 许 系 统 提 供 估 计 值 Tweedie 参 数 对 于 Tweedie 分 布, 给 固 定 值 指 定 在 1.0 与 2.0 之 间 的 一 个 数 字 参 数 估 计 通 过 此 组 中 的 控 件, 可 以 指 定 估 计 方 法, 以 及 为 参 数 估 计 提 供 初 始 值 方 法 您 可 以 选 择 参 数 估 计 方 法 您 可 以 选 择 Newton-Raphson 方 法 Fisher 评 分 方 法 或 混 合 方 法, 在 混 合 方 法 中, 首 先 会 执 行 Fisher 评 分 迭 代, 然 后 再 切 换 到 Newton-Raphson 方 法 如 果 在 该 混 合 方 法 的 Fisher 评 分 阶 段, 在 达 到 最 大 Fisher 迭 代 次 数 之 前 实 现 了 收 敛, 则 该 算 法 将 继 续 执 行 Newton-Raphson 方 法 尺 度 参 数 方 法 您 可 以 选 择 尺 度 参 数 估 计 方 法 最 大 似 然 法 可 联 合 估 计 尺 度 参 数 和 模 型 效 应 ; 请 注 意, 如 果 响 应 具 有 负 二 项 式 泊 松 或 二 项 式 分 布, 则 此 选 项 无 效 偏 差 和 Pearson 卡 方 选 项 根 据 这 些 统 计 量 的 值 估 计 尺 度 参 数 另 外, 您 还 可 以 为 尺 度 参 数 指 定 固 定 值 协 方 差 矩 阵 基 于 模 型 的 估 计 是 Hessian 矩 阵 的 广 义 逆 负 矩 阵 健 壮 性 ( 也 称 为 Huber/White/sandwich) 估 计 是 改 正 的 基 于 模 型 的 估 计, 即 使 错 误 地 指 定 了 方 差 和 关 联 函 数, 也 能 提 供 对 协 方 差 的 一 致 估 计 迭 代 这 些 选 项 可 用 于 控 制 模 型 收 敛 的 参 数 有 关 详 细 信 息, 请 参 阅 第 276 页 码 广 义 线 性 模 型 迭 代 输 出 通 过 这 些 选 项, 可 以 请 求 将 显 示 在 由 节 点 构 建 的 模 型 块 的 高 级 输 出 中 的 附 加 统 计 量 有 关 详 细 信 息, 请 参 阅 第 278 页 码 广 义 线 性 模 型 高 级 输 出 异 常 值 容 差 异 常 ( 或 非 可 逆 ) 矩 阵 具 有 线 性 相 关 列, 这 样 可 能 会 导 致 估 计 算 法 出 现 严 重 问 题 即 使 是 近 似 异 常 的 矩 阵 也 可 能 导 致 糟 糕 的 结 果, 因 此 该 过 程 会 将 决 定 因 子 小 于 容 差 的 矩 阵 视 为 异 常 矩 阵 请 指 定 一 个 正 值 广 义 线 性 模 型 迭 代 您 可 设 置 用 于 对 广 义 线 性 模 型 进 行 估 计 的 收 敛 参 数

289 277 统 计 模 型 图 片 广 义 线 性 模 型 的 迭 代 选 项 迭 代 最 大 迭 代 次 数 算 法 将 执 行 的 最 大 迭 代 次 数 指 定 一 个 非 负 整 数 最 大 逐 步 二 分 法 每 次 迭 代 时, 步 长 都 会 缩 短 一 半, 直 到 对 数 似 然 增 加 或 达 到 最 大 步 长 二 分 请 指 定 一 个 正 整 数 检 查 数 据 点 的 分 离 如 果 选 中, 该 算 法 将 执 行 检 验, 以 确 保 参 数 估 计 具 有 唯 一 值 如 果 该 过 程 能 够 生 成 正 确 分 类 每 个 观 测 值 的 模 型, 则 对 数 据 点 进 行 分 离 此 选 项 可 用 于 二 元 格 式 的 二 项 式 响 应 收 敛 标 准 参 数 收 敛 如 果 选 中, 该 算 法 会 在 参 数 估 计 值 的 绝 对 或 相 对 变 化 小 于 指 定 值 ( 该 值 必 须 为 正 ) 的 迭 代 之 后 停 止 对 数 似 然 收 敛 如 果 选 中, 该 算 法 会 在 对 数 似 然 函 数 中 的 绝 对 或 相 对 变 化 小 于 指 定 值 ( 该 值 必 须 为 正 ) 的 迭 代 之 后 停 止 Hessian 收 敛 对 于 绝 对 指 定, 如 果 基 于 Hessian 收 敛 的 统 计 量 小 于 指 定 的 正 值, 则 认 为 是 收 敛 的 对 于 相 对 指 定, 如 果 统 计 量 小 于 指 定 正 值 与 对 数 似 然 绝 对 值 的 乘 积, 则 认 为 是 收 敛 的

290 278 章 10 广 义 线 性 模 型 高 级 输 出 图 片 广 义 线 性 模 型 的 高 级 输 出 选 项 选 择 要 在 广 义 线 性 模 型 块 的 高 级 输 出 中 显 示 的 可 选 输 出 要 查 看 高 级 输 出, 请 浏 览 模 型 块 并 单 击 高 级 选 项 卡 有 关 详 细 信 息, 请 参 阅 第 280 页 码 GenLin 模 型 块 高 级 输 出 可 用 输 出 如 下 : 观 测 值 处 理 概 要 显 示 分 析 以 及 相 关 数 据 概 要 表 中 所 包 括 和 排 除 的 观 测 值 的 数 量 和 百 分 比 描 述 性 统 计 量 显 示 关 于 因 变 量 协 变 量 和 因 子 的 描 述 性 统 计 量 和 摘 要 信 息 模 型 信 息 显 示 数 据 集 名 称 因 变 量 或 事 件 和 试 验 变 量 偏 移 变 量 尺 度 权 重 变 量 概 率 分 布 和 链 接 函 数 拟 合 优 度 统 计 量 显 示 偏 差 和 定 比 变 换 偏 差 Pearson 卡 方 和 定 比 变 换 Pearson 卡 方 对 数 似 然 AIC 信 息 准 则 有 限 样 本 校 正 (AICC) 贝 叶 斯 信 息 准 则 (BIC) 和 相 容 AIC (CAIC) 模 型 摘 要 统 计 量 显 示 模 型 拟 合 检 验, 包 括 模 型 拟 合 公 用 检 验 的 似 然 比 统 计 量 以 及 每 个 效 应 的 类 型 I 或 III 对 比 的 统 计 量 参 数 估 计 值 显 示 参 数 估 计 值 以 及 对 应 的 检 验 统 计 量 和 置 信 区 间 除 原 始 参 数 估 计 值 外, 还 可 以 显 示 取 幂 的 参 数 估 计 值 参 数 估 计 值 的 协 方 差 矩 阵 显 示 估 计 参 数 的 协 方 差 矩 阵 参 数 估 计 值 的 相 关 矩 阵 显 示 估 计 参 数 的 相 关 矩 阵 对 比 系 数 (L) 矩 阵 显 示 默 认 效 应 的 对 比 系 数, 如 果 在 EM 均 值 选 项 卡 上 请 求 了, 则 还 会 显 示 估 计 边 缘 均 值 的 对 比 系 数

291 279 统 计 模 型 一 般 可 估 函 数 显 示 用 于 生 成 对 比 系 数 (L) 矩 阵 的 矩 阵 迭 代 历 史 显 示 参 数 估 计 值 和 对 数 似 然 的 迭 代 历 史, 输 出 梯 度 向 量 和 Hessian 矩 阵 的 最 终 值 迭 代 历 史 表 从 第 0 次 迭 代 ( 初 始 估 计 值 ) 开 始 每 隔 n 次 迭 代 显 示 参 数 估 计 值, 其 中 n 为 输 出 间 隔 的 值 如 果 请 求 显 示 迭 代 历 史, 则 无 论 n 为 多 少 都 会 显 示 最 后 一 次 迭 代 Lagrange 乘 数 检 验 显 示 用 于 针 对 标 准 伽 玛 和 逆 高 斯 分 布 评 估 尺 度 参 数 有 效 性 的 拉 格 朗 日 乘 数 检 验 统 计 量, 该 参 数 使 用 偏 差 或 Pearson 卡 方 计 算 得 出, 或 设 置 为 固 定 值 对 于 负 二 项 式 分 布, 它 检 验 固 定 辅 助 参 数 模 型 效 应 分 析 类 型 指 定 要 生 成 的 分 析 的 类 型 类 型 I 分 析 一 般 适 用 于 您 有 先 验 理 由 对 模 型 中 的 预 测 变 量 进 行 排 序 的 情 况, 而 类 型 III 则 适 用 于 更 一 般 的 情 况 Wald 或 似 然 比 统 计 量 是 根 据 卡 方 统 计 量 组 中 的 选 择 而 计 算 的 置 信 区 间 请 指 定 大 于 50 小 于 100 的 置 信 水 平 Wald 区 间 基 于 这 样 的 假 设, 参 数 为 渐 近 正 态 分 布 ; 剖 面 似 然 置 信 区 间 更 准 确, 但 可 能 计 算 花 费 高 昂 剖 面 似 然 置 信 区 间 的 误 差 等 级 是 用 于 停 止 计 算 置 信 区 间 的 迭 代 算 法 的 条 件 对 数 似 然 函 数 此 选 项 控 制 对 数 似 然 函 数 的 显 示 格 式 完 整 的 函 数 包 括 一 个 相 对 于 参 数 估 计 值 来 说 不 变 的 附 加 项 ; 它 对 参 数 估 计 没 有 影 响, 在 某 些 软 件 产 品 中 不 显 示 GenLin 模 型 块 GenLin 模 型 块 表 示 由 GenLin 节 点 估 计 的 方 程 式 这 些 方 程 式 包 含 由 模 型 所 捕 获 的 所 有 信 息 及 有 关 模 型 结 构 和 性 能 的 信 息 当 您 运 行 包 含 GenLin 模 型 块 的 流 时, 该 节 点 会 添 加 一 些 新 字 段, 这 些 字 段 的 内 容 取 决 于 目 标 字 段 的 性 质 : 标 志 目 标 添 加 的 字 段 包 含 预 测 类 别 和 相 关 概 率, 以 及 每 个 类 别 的 概 率 前 两 个 新 字 段 的 名 称 派 生 自 所 预 测 的 输 出 字 段 的 名 称, 前 缀 $G- 表 示 预 测 类 别, 前 缀 $GP- 表 示 相 关 概 率 例 如, 对 于 名 为 default 的 输 出 字 段, 新 字 段 将 命 名 为 $G-default 和 $GP-default 后 两 个 附 加 字 段 基 于 输 出 字 段 的 值 进 行 命 名, 带 有 前 缀 $GP- 例 如, 如 果 default 的 有 效 值 为 Yes 和 No, 则 新 字 段 会 以 $GP-Yes 和 $GP-No 命 名 连 续 目 标 添 加 的 字 段 包 含 预 测 均 值 和 标 准 误 连 续 目 标, 表 示 一 系 列 试 验 中 发 生 的 事 件 的 数 量 添 加 的 字 段 包 含 预 测 均 值 和 标 准 误 生 成 过 滤 节 点 使 用 生 成 菜 单 可 以 创 建 新 的 过 滤 节 点, 用 于 根 据 模 型 结 果 传 递 输 入 字 段 预 测 变 量 重 要 性 另 外, 模 型 选 项 卡 上 还 可 能 显 示 表 示 评 估 模 型 时 每 个 预 测 变 量 相 对 重 要 性 的 图 表 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 注 意, 只 有 在 生 成 模 型 之 前 选 中 分 析 选 项 卡 上 的 计 算 预 测 变 量 重 要 性, 才 可 以 使 用 此 图 表 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性

292 280 章 10 GenLin 模 型 块 高 级 输 出 图 片 GenLin 模 型 块, 高 级 选 项 卡 广 义 线 性 模 型 的 高 级 输 出 可 提 供 有 关 估 计 模 型 及 其 性 能 的 详 细 信 息 高 级 输 出 中 包 含 的 大 部 分 信 息 的 技 术 性 含 量 都 很 高, 需 要 进 行 此 类 分 析 所 需 的 丰 富 知 识 才 能 够 对 此 输 出 作 出 正 确 解 释 有 关 详 细 信 息, 请 参 阅 第 278 页 码 广 义 线 性 模 型 高 级 输 出 GenLin 模 型 块 设 置 使 用 GenLin 模 型 块 的 设 置 选 项 卡, 您 可 以 在 对 模 型 进 行 评 分 时 获 取 倾 向 得 分 此 选 项 卡 在 只 带 有 标 志 目 标 的 模 型 中 提 供, 并 且 仅 在 已 将 模 型 块 添 加 到 流 中 后 可 用

293 281 统 计 模 型 图 片 GenLin 模 型 块, 标 志 目 标 的 设 置 选 项 卡 计 算 原 始 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回? 是? 或? 否? 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 除 了 这 些 得 分, 还 有 其 他 在 评 分 过 程 中 生 成 的 预 测 值 和 置 信 度 值 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 得 分 仅 依 赖 于 训 练 数 据, 并 且 由 于 许 多 模 型 过 度 拟 合 此 数 据 的 倾 向, 该 得 分 可 能 会 过 度 优 化 调 整 后 的 倾 向 会 尝 试 通 过 针 对 检 验 或 验 证 分 区 对 模 型 性 能 进 行 评 估 进 行 弥 补 此 选 项 要 求 在 流 中 定 义 分 区 字 段 并 且 在 生 成 模 型 之 前 在 建 模 节 点 中 启 用 调 整 的 倾 向 得 分 GenLin 模 型 块 汇 总 GenLin 模 型 块 的 汇 总 选 项 卡 显 示 了 用 于 生 成 模 型 的 字 段 和 设 置 此 外, 如 果 已 执 行 附 加 到 该 建 模 节 点 的 分 析 节 点, 则 还 会 在 此 部 分 显 示 该 分 析 中 的 信 息 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 分 析 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 有 关 使 用 模 型 浏 览 器 的 一 般 信 息, 请 参 阅 浏 览 模 型 块 第 43 页 码

294 282 章 10 图 片 GenLin 模 型 块, 汇 总 选 项 卡 Cox 节 点 Cox 回 归 可 为 时 间 事 件 数 据 构 建 预 测 模 型 该 模 型 会 生 成 一 个 生 存 函 数, 该 函 数 可 预 测 在 给 定 时 间 t 内 对 于 所 给 定 的 预 测 变 量 值 相 关 事 件 的 发 生 概 率 从 观 测 主 项 对 生 存 函 数 的 形 状 以 及 预 测 变 量 的 回 归 系 数 进 行 评 估 ; 然 后 可 以 将 该 模 型 应 用 于 具 有 预 测 变 量 测 量 的 新 案 例 中 请 注 意, 已 删 失 主 项 ( 即 观 测 期 没 有 经 历 相 关 事 件 的 主 项 ) 的 相 关 信 息 对 于 评 估 模 型 十 分 有 用 示 例 作 为 减 少 客 户 流 失 计 划 的 一 部 分, 电 信 公 司 对 建 模 流 失 时 间 很 感 兴 趣, 以 便 确 定 客 户 快 速 切 换 到 其 他 服 务 的 相 关 因 素 为 此, 随 机 选 取 了 一 些 客 户 样 本, 和 他 们 作 为 客 户 所 花 费 的 时 间 ( 无 论 他 们 是 否 仍 为 活 动 客 户 ) 以 及 从 数 据 库 中 抽 取 的 各 种 人 口 统 计 字 段 有 关 详 细 信 息, 请 参 阅 第 27 章 中 的 将 Cox 回 归 用 于 客 户 流 失 时 间 模 型 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 要 求 您 需 要 一 个 或 多 个 输 入 字 段, 只 需 一 个 目 标 字 段, 且 必 须 在 Cox 节 点 中 指 定 生 存 时 间 字 段 应 对 目 标 字 段 进 行 编 码, 使 得 false 值 表 示 生 存 时 间, true 值 表 示 所 关 注 事 件 已 发 生 ; 目 标 字 段 的 测 量 级 别 必 须 为 标 志, 且 带 有 字 符 串 或 整 数 存 储 ( 如 有 必 要, 可 以 使 用 过 滤 节 点 或 导 出 节 点 转 换 存 储 类 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 使 用 填 充 节 点 进 行 存 储 类 型 转 换 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 ) 将 忽 略 设 置 为 双 向 或 无 的 字 段 必 须 对 模 型 中 使 用 的 字 段 的 类 型 完 全 实 例 化 生 存 时 间 可 以 是 任 意 数 字 字 段

295 283 统 计 模 型 日 期 & 时 间 日 期 和 时 间 字 段 不 能 直 接 用 于 定 义 生 存 时 间 ; 如 果 有 日 期 和 时 间 字 段, 则 应 根 据 输 入 研 究 的 日 期 和 观 测 日 期 之 间 的 差 值, 使 用 这 些 字 段 创 建 包 含 生 存 时 间 的 字 段 有 关 详 细 信 息, 请 参 阅 第 7 章 中 的 时 间 和 日 期 的 处 理 中 的 IBM SPSS Modeler 14.2 用 户 指 南 Kaplan-Meier 分 析 可 以 在 没 有 输 入 字 段 的 情 况 下 执 行 Cox 回 归 这 等 效 于 Kaplan-Meier 分 析 Cox 节 点 字 段 选 项 图 片 Cox 节 点 对 话 框, 字 段 选 项 卡 生 存 时 间 选 择 数 值 字 段 ( 测 量 级 别 为 连 续 的 字 段 ) 以 使 节 点 可 执 行 生 存 时 间 表 示 所 预 测 记 录 的 寿 命 例 如, 当 模 型 化 客 户 流 失 时 间 时, 它 可 能 是 记 录 客 户 在 组 织 内 的 时 间 长 度 的 字 段 客 户 加 入 公 司 或 离 开 公 司 的 日 期 不 会 影 响 该 模 型 ; 只 有 客 户 工 龄 的 持 续 时 间 与 其 相 关 生 存 时 间 为 无 单 位 的 持 续 时 间 您 必 须 确 保 输 入 字 段 与 生 存 时 间 相 匹 配 例 如, 在 按 月 测 量 流 失 的 研 究 中, 您 可 将 月 销 售 量 而 非 年 销 售 量 用 作 输 入 如 果 您 的 数 据 具 有 开 始 日 期 和 结 束 日 期 而 不 是 持 续 时 间, 您 必 须 在 Cox 代 码 上 游 将 这 些 日 期 重 新 编 码 为 持 续 时 间 此 对 话 框 中 的 剩 余 字 段 是 整 个 IBM SPSS Modeler 中 通 用 的 标 准 字 段 有 关 详 细 信 息, 请 参 阅 第 30 页 码 第 3 章 中 的 建 模 节 点 字 段 选 项

296 284 章 10 Cox 节 点 模 型 选 项 图 片 Cox 节 点 对 话 框, 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 方 法 下 列 选 项 用 于 向 模 型 中 输 入 预 测 变 量 : 按 Enter 键 这 是 默 认 方 法, 可 将 所 有 项 直 接 输 入 模 型 构 建 模 型 时 不 进 行 字 段 选 择 逐 步 法 顾 名 思 义, 逐 步 字 段 选 择 法 就 是 分 步 构 建 模 型 初 始 模 型 可 能 是 最 简 单 的 模 型, 其 模 型 中 不 含 任 何 模 型 项 ( 除 常 量 外 ) 在 每 个 步 骤 中, 对 尚 未 添 加 到 模 型 的 项 进 行 评 估, 如 果 其 中 的 最 佳 项 能 够 显 著 增 加 模 型 预 测 能 力, 则 将 该 项 添 加 到 模 型 中 此 外, 还 会 重 新 评 估 当 前 包 含 在 模 型 中 的 项, 以 确 定 能 否 在 不 对 模 型 功 能 造 成 重 大 减 损 的 情 况 下 删 除 其 中 任 何 项 如 果 可 以, 则 会 将 其 删 除 然 后 重 复 此 过 程, 添 加 并 / 或 删 除 其 他 项 当 无 法 再 添 加 任 何 项 来 改 进 模 型 且 无 法 再 删 除 任 何 项 而 不 对 模 型 功 能 造 成 减 损 时, 最 终 模 型 便 已 生 成 后 退 逐 步 法 从 本 质 上 说, 后 退 逐 步 法 与 逐 步 法 是 相 反 的 采 用 这 种 方 法 时, 初 始 模 型 将 包 含 作 为 预 测 变 量 的 所 有 项 每 个 步 骤 会 评 估 模 型 中 的 项, 并 且 将 可 以 删 除 而 不 对 模 型 功 能 造 成 重 大 减 损 的 项 删 除 此 外, 还 会 对 先 前 删 除 的 项 进 行 重 新 评

297 285 统 计 模 型 估, 以 确 定 其 中 的 最 佳 项 是 否 对 模 型 的 预 测 功 能 起 到 显 著 作 用 如 果 是, 则 会 将 其 重 新 添 加 到 模 型 中 当 无 法 再 删 除 任 何 项 而 不 对 模 型 功 能 造 成 重 大 减 损 且 无 法 再 添 加 任 何 项 以 改 进 模 型 时, 最 终 模 型 便 已 生 成 注 意 : 自 动 方 法 ( 包 括 逐 步 法 和 后 退 逐 步 法 ) 是 适 应 性 强 的 学 习 方 法, 并 且 特 别 容 易 过 度 拟 合 训 练 数 据 使 用 这 些 方 法 时, 用 新 数 据 或 使 用 分 区 节 点 创 建 的 保 留 测 试 样 本 对 结 果 模 型 的 有 效 性 进 行 验 证 尤 为 重 要 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 组 指 定 组 字 段 会 导 致 节 点 为 每 个 字 段 类 别 计 算 单 独 的 模 型 该 字 段 可 以 是 存 储 类 型 为 字 符 串 或 整 数 的 分 类 字 段 ( 标 志 或 名 义 ) 模 型 类 型 用 于 定 义 模 型 中 的 项 的 选 项 共 有 两 种 主 效 应 模 型 仅 分 别 包 括 各 个 输 入 字 段, 而 不 检 验 输 入 字 段 之 间 的 交 互 效 应 ( 乘 法 效 应 ) 自 定 义 模 型 仅 包 括 您 指 定 的 项 ( 主 效 应 和 交 互 效 应 ) 选 择 此 选 项 时, 应 使 用 模 型 项 列 表 在 模 型 中 添 加 或 删 除 项 模 型 项 构 建 自 定 义 模 型 时, 将 需 要 明 确 指 定 模 型 中 的 项 此 列 表 显 示 了 模 型 项 的 当 前 集 合 模 型 项 列 表 右 边 的 按 钮 可 用 于 添 加 或 删 除 模 型 项 E 要 将 项 添 加 到 模 型 中, 请 单 击 添 加 新 的 模 型 项 按 钮 E 要 删 除 项, 请 选 定 所 需 项, 然 后 单 击 删 除 选 定 模 型 项 按 钮 将 项 添 加 到 Cox 回 归 模 型 在 请 求 自 定 义 模 型 时, 可 以 通 过 单 击 模 型 选 项 卡 中 的 添 加 新 的 模 型 项 按 钮 将 各 项 添 加 到 模 型 中 此 时 将 打 开 一 个 新 的 对 话 框, 您 可 在 其 中 指 定 项 图 片 新 建 项 对 话 框 要 添 加 的 项 类 型 有 几 种 将 项 添 加 到 模 型 的 方 法, 具 体 取 决 于 在 可 用 字 段 列 表 中 对 输 入 字 段 的 选 择

298 286 章 10 单 向 交 互 效 应 插 入 表 示 所 有 选 定 字 段 的 交 互 效 应 的 项 主 效 应 针 对 每 个 选 定 的 输 入 字 段 插 入 一 个 主 效 应 项 ( 该 字 段 本 身 ) 所 有 双 向 交 互 效 应 针 对 每 个 可 能 的 选 定 输 入 字 段 对 插 入 一 个 双 向 交 互 效 应 项 ( 输 入 字 段 的 积 ) 例 如, 如 果 已 在 可 用 字 段 列 表 中 选 定 输 入 字 段 A B 和 C, 此 方 法 将 插 入 项 A * B A * C 和 B * C 所 有 三 向 交 互 效 应 针 对 每 个 可 能 的 选 定 输 入 字 段 组 合 ( 一 次 取 三 个 ) 插 入 一 个 三 向 交 互 效 应 项 ( 输 入 字 段 的 积 ) 例 如, 如 果 已 在 可 用 字 段 列 表 中 选 定 输 入 字 段 A B C 和 D, 此 方 法 将 插 入 项 A * B * C A *B*D A*C*D 和 B*C*D 所 有 四 向 交 互 效 应 针 对 每 个 可 能 的 选 定 输 入 字 段 组 合 ( 一 次 取 四 个 ) 插 入 一 个 四 向 交 互 效 应 项 ( 输 入 字 段 的 积 ) 例 如, 如 果 已 在 可 用 字 段 列 表 中 选 定 输 入 字 段 A B C D 和 E, 此 方 法 将 插 入 项 A * B * C * D A * B * C * E A * B * D * E A * C * D * E 和 B * C * D * E 可 用 字 段 列 出 要 用 于 构 造 模 型 项 的 可 用 输 入 字 段 请 注 意, 列 表 中 可 能 包 含 非 法 输 入 字 段, 因 此 务 必 确 保 所 有 的 模 型 项 都 只 包 含 输 入 字 段 预 览 根 据 上 述 所 选 字 段 和 项 类 型, 显 示 单 击 插 入 时 将 添 加 到 模 型 中 的 项 插 入 将 项 插 入 模 型 ( 根 据 当 前 选 择 的 字 段 和 项 类 型 ) 并 关 闭 对 话 框 Cox 节 点 专 家 选 项 图 片 Cox 节 点 对 话 框, 专 家 选 项 卡 收 敛 这 些 选 项 可 用 于 控 制 模 型 收 敛 的 参 数 当 您 执 行 模 型 时, 收 敛 设 置 将 控 制 重 复 运 行 不 同 参 数 以 观 察 其 拟 合 程 度 的 次 数 参 数 的 尝 试 次 数 越 多, 结 果 将 越 接 近 ( 即, 结 果 将 会 收 敛 ) 有 关 详 细 信 息, 请 参 阅 第 287 页 码 Cox 节 点 收 敛 标 准 输 出 通 过 这 些 选 项, 可 以 请 求 将 显 示 在 由 节 点 构 建 的 生 成 模 型 的 高 级 输 出 中 的 附 加 统 计 量 和 散 点 图 ( 包 括 生 存 曲 线 ) 有 关 详 细 信 息, 请 参 阅 第 287 页 码 Cox 节 点 高 级 输 出 选 项

299 287 统 计 模 型 步 进 通 过 这 些 选 项, 可 以 使 用 逐 步 评 估 法 对 添 加 和 删 除 字 段 的 标 准 进 行 控 制 ( 如 果 已 选 择 进 入 法, 该 按 钮 将 处 于 禁 用 状 态 ) 有 关 详 细 信 息, 请 参 阅 第 288 页 码 Cox 节 点 步 进 标 准 Cox 节 点 收 敛 标 准 图 片 Cox 回 归 收 敛 标 准 对 话 框 最 大 迭 代 次 数 允 许 您 指 定 模 型 的 最 大 迭 代 次 数, 用 于 控 制 过 程 求 解 的 时 间 对 数 似 然 估 计 收 敛 如 果 对 数 似 然 的 相 对 变 化 小 于 此 值, 迭 代 将 停 止 如 果 值 为 0, 则 不 使 用 该 标 准 参 数 收 敛 如 果 参 数 的 绝 对 变 化 或 相 对 变 化 小 于 此 值, 迭 代 将 停 止 如 果 值 为 0, 则 不 使 用 该 标 准 Cox 节 点 高 级 输 出 选 项 图 片 Cox 回 归 高 级 输 出 对 话 框

300 288 章 10 统 计 量 您 可 以 获 得 模 型 参 数 的 统 计 量, 包 括 exp(b) 的 置 信 区 间 和 估 计 值 的 相 关 性 您 可 以 在 每 一 步 或 者 仅 在 最 后 一 步 请 求 这 些 统 计 量 显 示 基 线 函 数 允 许 您 显 示 协 变 量 均 值 下 的 基 线 风 险 函 数 和 累 积 生 存 图 图 有 助 于 评 估 估 计 的 模 型 和 解 释 结 果 您 可 以 对 生 存 函 数 危 险 函 数 负 对 数 累 积 生 存 函 数 的 对 数 和 1 减 去 生 存 函 数 绘 图 生 存 函 数. 在 线 性 刻 度 上 显 示 累 积 生 存 函 数 危 险 函 数 (H). 在 线 性 刻 度 上 显 示 累 积 风 险 函 数 对 数 减 对 数 在 将 ln(-ln) 转 换 应 用 于 估 计 值 后 显 示 累 积 生 存 估 计 值 1 减 去 生 存 函 数 (M). 以 线 性 尺 度 绘 制 1 减 生 存 函 数 为 每 个 值 绘 制 单 独 线 此 选 项 仅 适 用 于 分 类 字 段 用 于 散 点 图 的 值 由 于 这 些 函 数 取 决 于 预 测 变 量 的 值, 因 此 您 必 须 使 用 预 测 变 量 的 常 数 值 绘 制 函 数 与 时 间 的 比 值 默 认 情 况 下, 将 使 用 各 个 预 测 变 量 的 平 均 数 作 为 常 数 值, 但 您 可 以 使 用 网 格 为 散 点 图 输 入 自 己 的 值 对 于 分 类 输 入, 使 用 指 示 符 编 码, 因 此 每 个 类 别 都 具 有 回 归 系 数 ( 最 后 一 个 类 别 除 外 ) 因 此, 分 类 输 入 具 有 每 个 指 示 符 对 比 度 的 平 均 值, 等 于 类 别 中 对 应 于 指 示 符 对 比 度 的 观 测 值 比 例 Cox 节 点 步 进 标 准 图 片 Cox 回 归 步 进 标 准 对 话 框 移 除 标 准 选 择 似 然 比 可 得 到 更 稳 健 的 模 型 要 缩 短 构 建 模 型 所 需 的 时 间, 可 以 尝 试 选 择 Wald 还 有 附 加 选 项 条 件, 此 选 项 提 供 以 基 于 条 件 参 数 估 计 值 的 似 然 比 统 计 量 的 概 率 为 依 据 的 移 除 检 验 标 准 的 显 著 性 阈 值 使 用 此 选 项 可 基 于 每 个 字 段 关 联 的 统 计 概 率 (p 值 ) 指 定 选 择 标 准 仅 当 关 联 的 p 值 小 于 纳 入 标 准 值 时, 才 会 将 字 段 添 加 到 模 型 中 ; 仅 当 p 值 大 于 剔 出 标 准 值 时, 才 会 将 字 段 删 除 纳 入 标 准 值 必 须 小 于 剔 出 标 准 值

301 289 统 计 模 型 Cox 节 点 设 置 选 项 图 片 Cox 节 点 对 话 框, 设 置 选 项 卡 以 未 来 时 间 预 测 生 存 时 间 指 定 一 个 或 多 个 未 来 时 间 即 在 未 发 生 终 端 事 件 的 情 况 下, 无 论 每 个 观 测 值 是 否 可 能 至 少 在 此 时 间 长 度 ( 从 现 在 开 始 ) 内 生 存, 都 将 在 每 个 时 间 值 为 每 条 记 录 预 测 生 存 时 间, 一 个 时 间 值 对 应 一 个 预 测 值 请 注 意, 生 存 时 间 为 目 标 字 段 的 false 值 规 则 区 间 生 存 时 间 值 从 指 定 的 时 间 区 间 和 要 对 其 评 分 的 时 段 数 生 成 例 如, 如 果 请 求 3 个 时 段, 时 间 区 间 为 2, 则 对 未 来 时 间 的 生 存 时 间 将 为 2 4 和 6 以 相 同 时 间 值 评 估 每 条 记 录 时 间 字 段 在 所 选 的 时 间 字 段 中 为 每 条 记 录 提 供 生 存 时 间 ( 生 成 一 个 预 测 字 段 ), 因 此 可 以 在 不 同 的 时 间 评 估 各 条 记 录 过 去 生 存 时 间 将 目 前 为 止 记 录 的 生 存 时 间 指 定 为 一 个 字 段 例 如, 将 现 有 客 户 的 保 有 期 作 为 一 个 字 段 在 未 来 时 间 对 生 存 的 似 然 进 行 评 分 取 决 于 过 去 生 存 时 间 注 意 : 未 来 和 过 去 生 存 时 间 的 值 必 须 在 用 于 训 练 模 型 的 数 据 中 的 生 存 时 间 范 围 内 时 间 超 出 此 范 围 的 记 录 将 标 记 为 空 追 加 所 有 概 率 指 定 是 否 将 输 出 字 段 每 个 类 别 的 概 率 添 加 到 该 节 点 所 处 理 的 每 个 记 录 如 果 未 选 中 此 选 项, 则 仅 添 加 预 测 类 别 的 概 率 为 每 个 未 来 时 间 计 算 概 率 计 算 累 积 风 险 函 数 指 定 是 否 将 累 积 风 险 的 值 添 加 到 每 条 记 录 中 为 每 个 未 来 时 间 计 算 累 积 风 险 Cox 模 型 块 Cox 回 归 模 型 表 示 由 Cox 节 点 所 估 计 的 方 程 式 这 些 方 程 式 包 含 由 模 型 所 捕 获 的 所 有 信 息 及 有 关 模 型 结 构 和 性 能 的 信 息

302 290 章 10 运 行 包 含 生 成 的 Cox 回 归 模 型 的 流 时, 该 节 点 可 添 加 包 含 模 型 预 测 和 关 联 概 率 在 内 的 两 个 新 字 段 新 字 段 的 名 称 派 生 自 所 预 测 的 输 出 字 段 的 名 称, 前 缀 $C- 表 示 预 测 类 别, 前 缀 $CP- 表 示 相 关 概 率 后 缀 为 未 来 时 间 区 间 的 数 量 或 定 义 时 间 区 间 的 时 间 字 段 的 名 称 例 如, 对 于 名 为 churn 的 输 出 字 段, 以 及 以 规 则 区 间 定 义 的 两 个 未 来 时 间 区 间, 新 字 段 命 名 为 $C-churn-1 $CP-churn-1 $C-churn-2 和 $CP-churn-2 如 果 使 用 时 间 字 段 tenure 定 义 未 来 时 间, 则 新 字 段 为 $C-churn_tenure 和 $CP-churn_tenure 如 果 在 Cox 节 点 中 选 中 了 追 加 所 有 概 率 设 置 选 项, 则 会 针 对 每 个 未 来 时 间 添 加 两 个 附 加 字 段, 其 中 包 含 每 条 记 录 生 存 和 失 败 的 概 率 这 些 附 加 字 段 基 于 输 出 字 段 的 值 进 行 命 名, 其 中 前 缀 $CP-<false value>- 表 示 生 存 的 概 率,$CP-<true value>- 表 示 事 件 已 发 生 的 概 率, 后 缀 为 未 来 时 间 区 间 的 数 量 例 如, 对 于 false 值 为 0, true 值 为 1 的 输 出 字 段 和 以 规 则 区 间 定 义 的 两 个 未 来 时 间 区 间, 新 字 段 命 名 为 $CP-0-1 $CP-1-1 $CP-0-2 和 $CP-1-2 如 果 使 用 单 个 时 间 字 段 tenure 定 义 未 来 时 间, 由 于 存 在 单 个 的 未 来 区 间, 则 新 字 段 为 $CP-0-1 和 $CP-1-1 如 果 在 Cox 节 点 中 选 中 了 计 算 累 积 风 险 函 数 设 置 选 项, 则 会 针 对 每 个 未 来 时 间 添 加 附 加 字 段, 其 中 包 含 每 条 记 录 的 累 计 风 险 函 数 这 些 附 加 字 段 基 于 输 出 字 段 的 名 称 进 行 命 名, 前 缀 为 $CH-, 后 缀 为 未 来 时 间 区 间 的 数 量 或 定 义 时 间 区 间 的 时 间 字 段 的 名 称 例 如, 对 于 名 为 churn 的 输 出 字 段, 以 及 以 规 则 区 间 定 义 的 两 个 未 来 时 间 区 间, 新 字 段 命 名 为 $CH-churn-1 和 $CH-churn-2 如 果 使 用 时 间 字 段 tenure 定 义 未 来 时 间, 则 新 字 段 为 $CH-churn-1 Cox 回 归 输 出 设 置 块 的 设 置 选 项 卡 与 模 型 节 点 的 设 置 选 项 卡 包 含 相 同 的 控 件 块 控 件 的 默 认 值 由 模 型 节 点 中 设 置 的 值 决 定 有 关 详 细 信 息, 请 参 阅 第 289 页 码 Cox 节 点 设 置 选 项 Cox 回 归 高 级 输 出 Cox 回 归 的 高 级 输 出 可 提 供 有 关 所 估 计 模 型 及 其 性 能 的 详 细 信 息, 其 中 包 括 生 存 曲 线 高 级 输 出 中 包 含 的 大 部 分 信 息 的 技 术 含 量 都 很 高, 需 要 具 备 Cox 回 归 方 面 的 广 泛 知 识 才 能 正 确 理 解 该 输 出

303 291 统 计 模 型 图 片 Cox 模 型 块, 高 级 选 项 卡

304 聚 类 模 型 章 11 聚 类 模 型 主 要 用 来 确 定 相 似 记 录 的 组 并 根 据 它 们 所 属 的 组 来 为 记 录 添 加 标 签 不 需 事 先 了 解 组 信 息 及 组 特 征 即 可 完 成 该 操 作 事 实 上, 甚 至 无 法 确 切 知 道 要 查 找 多 少 个 组 这 点 将 聚 类 模 型 与 其 他 机 器 学 习 方 法 区 别 开 来 即 不 存 在 供 模 型 预 测 的 预 定 义 输 出 或 目 标 字 段 由 于 不 存 在 用 于 判 断 模 型 的 分 类 效 果 的 外 部 标 准, 因 而 这 些 模 型 通 常 被 称 作 不 受 监 督 学 习 模 型 对 于 这 些 模 型 而 言, 不 存 在 对 或 错 的 答 案 模 型 的 值 由 模 型 捕 获 数 据 中 感 兴 趣 的 分 组 并 提 供 这 些 分 组 的 有 用 说 明 信 息 的 能 力 来 确 定 聚 类 方 法 基 于 对 记 录 间 距 离 和 聚 类 间 距 离 的 测 量 将 记 录 指 派 给 聚 类 时 将 尽 量 缩 短 属 于 同 一 个 聚 类 的 记 录 之 间 的 距 离 图 片 11-1 简 单 聚 类 模 型 提 供 有 三 种 聚 类 方 法 : K-Means 节 点 将 数 据 集 聚 类 到 不 同 分 组 ( 或 聚 类 ) 此 方 法 将 定 义 固 定 的 聚 类 数 量, 将 记 录 迭 代 分 配 给 聚 类, 以 及 调 整 聚 类 中 心, 直 到 进 一 步 优 化 无 法 再 改 进 模 型 k-means 节 点 作 为 一 种 非 监 督 学 习 机 制, 它 并 不 试 图 预 测 结 果, 而 是 揭 示 隐 含 在 输 入 字 段 集 中 的 模 式 有 关 详 细 信 息, 请 参 阅 第 298 页 码 K-Means 节 点 TwoStep 节 点 使 用 两 步 聚 类 方 法 第 一 步 完 成 简 单 数 据 处 理, 以 便 将 原 始 输 入 数 据 压 缩 为 可 管 理 的 子 聚 类 集 合 第 二 步 使 用 层 级 聚 类 方 法 将 子 聚 类 一 步 一 步 合 并 为 更 大 的 聚 类 TwoStep 具 有 一 个 优 点, 就 是 能 够 为 训 练 数 据 自 动 估 计 最 佳 聚 类 数 它 可 以 高 效 处 理 混 合 的 字 段 类 型 和 大 型 的 数 据 集 有 关 详 细 信 息, 请 参 阅 第 302 页 码 两 步 聚 类 节 点 Copyright IBM Corporation 1994,

305 293 聚 类 模 型 Kohonen 节 点 会 生 成 一 种 神 经 网 络, 此 神 经 网 络 可 用 于 将 数 据 集 聚 类 到 各 个 差 异 组 此 网 络 训 练 完 成 后, 相 似 的 记 录 应 在 输 出 映 射 中 紧 密 地 聚 集, 差 异 大 的 记 录 则 应 彼 此 远 离 您 可 以 通 过 查 看 模 型 块 中 每 个 单 元 所 捕 获 观 测 值 的 数 量 来 找 出 规 模 较 大 的 单 元 这 将 让 您 对 聚 类 的 相 应 数 量 有 所 估 计 有 关 详 细 信 息, 请 参 阅 第 293 页 码 Kohonen 节 点 通 常 使 用 聚 类 模 型 来 创 建 聚 类 或 段, 然 后 将 聚 类 或 段 用 作 后 续 分 析 的 输 入 常 见 例 子 如 营 销 人 员 常 使 用 市 场 分 段 来 将 整 个 市 场 划 分 为 多 个 类 似 的 子 组 每 个 市 场 分 段 都 有 自 己 的 特 征, 该 特 性 将 影 响 到 针 对 该 分 段 的 市 场 营 销 努 力 是 否 能 取 得 成 功 如 果 您 使 用 数 据 挖 掘 来 优 化 市 场 营 销 战 略, 通 常 可 以 通 过 识 别 合 适 的 市 场 分 段 和 在 预 测 模 型 中 使 用 分 段 信 息 来 显 著 改 进 模 型 Kohonen 节 点 Kohonen 网 络 是 一 种 执 行 聚 类 的 神 经 网 络 类 型, 也 称 为 knet 或 自 组 织 映 射 如 果 在 开 始 时 没 有 分 组 的 相 关 信 息, 则 可 使 用 此 类 型 的 网 络 将 数 据 集 聚 类 到 有 明 显 区 别 的 不 同 分 组 对 记 录 进 行 分 组, 以 便 组 或 聚 类 中 的 记 录 趋 于 相 似, 而 不 同 组 中 的 记 录 则 有 所 差 异 基 本 单 元 为 神 经 元, 神 经 元 将 分 作 两 层 : 输 入 层 和 输 出 层 ( 又 称 为 输 出 映 射 ) 所 有 输 入 神 经 元 都 和 所 有 输 出 神 经 元 相 连 接, 这 些 连 接 有 与 其 相 关 的 强 度 或 权 重 训 练 过 程 中, 每 个 单 元 会 与 所 有 其 它 单 元 进 行 竞 争 以 赢 得 每 条 记 录 输 出 映 射 是 神 经 元 的 二 维 网 络 ( 单 元 之 间 无 连 接 ) A 3 4 映 射 显 示 如 下 ( 虽 然 一 般 情 况 下 映 射 比 这 要 大 ) 图 片 11-2 Kohonen 网 络 的 结 构 输 入 数 据 会 显 示 在 输 入 层, 相 应 值 将 传 播 到 输 出 层 响 应 最 强 的 输 出 神 经 元 将 称 为 胜 利 者 并 且 会 成 为 输 入 的 结 果 最 初 的 权 重 随 机 产 生 如 果 某 个 单 元 赢 得 一 条 记 录, 则 其 权 重 ( 与 其 附 近 单 元 的 权 重 一 起 统 称 为 近 邻 ) 将 作 调 整 以 尽 可 能 地 与 此 条 记 录 的 预 测 变 量 值 的 模 式 相 匹 配 显 示 所 有 输 入 记 录, 并 且 权 重 将 相 应 更 新 将 重 复 此 过 程, 直 到 变 化 非 常 小 为 止 当 进 行 训 练 时, 网 格 单 元 的 权 重 将 作 调 整 从 而 形 成 聚 类 的 一 个 二 维 映 射 ( 所 以 会 有 术 语 自 组 织 映 射 )

306 294 章 11 此 网 络 训 练 完 成 后, 相 似 的 记 录 应 在 输 出 映 射 中 紧 密 地 聚 集, 差 异 很 大 的 记 录 则 应 彼 此 远 离 与 IBM SPSS Modeler 中 的 大 多 数 学 习 方 法 不 同 的 是,Kohonen 网 络 不 使 用 目 标 字 段 这 种 没 有 目 标 字 段 的 学 习 称 为 无 监 督 学 习 Kohonen 网 络 试 图 揭 示 输 入 字 段 集 中 的 模 式 而 不 是 预 测 结 果 通 常,Kohonen 网 络 最 终 会 形 成 几 个 汇 总 许 多 观 测 数 据 的 单 元 ( 强 单 元 ), 以 及 几 个 实 际 不 对 应 任 何 观 测 数 据 的 单 元 ( 弱 单 元 ) 强 单 元 ( 有 时 也 包 括 网 格 中 与 其 邻 近 的 其 他 单 元 ) 代 表 可 能 的 聚 类 中 心 Kohonen 网 络 的 另 一 种 用 途 是 降 维 二 维 网 格 的 空 间 特 性 可 提 供 从 k 个 原 始 预 测 变 量 到 保 留 了 原 始 预 测 变 量 中 相 似 性 关 系 的 两 个 派 生 特 征 的 映 射 在 某 些 情 况 下, 此 方 法 的 作 用 与 因 子 分 析 或 主 成 分 分 析 的 作 用 相 同 请 注 意, 计 算 输 出 网 格 默 认 大 小 的 方 法 与 SPSS Modeler 以 前 的 版 本 相 比 已 发 生 了 变 化 通 常, 新 方 法 将 生 成 更 小 的 输 出 层, 这 些 输 出 层 训 练 起 来 更 快 且 通 用 性 更 强 如 果 您 发 现 使 用 默 认 大 小 得 到 的 结 果 不 理 想, 可 以 尝 试 在 专 家 选 项 卡 上 增 加 输 出 网 格 的 大 小 有 关 详 细 信 息, 请 参 阅 第 296 页 码 Kohonen 节 点 专 家 选 项 要 求 要 训 练 Kohonen 网 络, 您 需 要 一 个 或 多 个 角 色 设 置 为 输 入 的 字 段 角 色 设 置 为 目 标 两 者 或 无 的 字 段 将 被 忽 略 强 度 构 建 Kohonen 网 络 模 型 不 需 要 有 组 成 员 关 系 数 据 您 甚 至 不 需 要 知 道 要 寻 找 的 组 的 个 数 Kohonen 网 络 刚 开 始 会 有 大 量 的 单 元, 随 着 训 练 的 进 行, 这 些 单 元 会 向 数 据 中 的 自 然 聚 类 集 中 可 通 过 查 看 模 型 块 中 每 个 单 元 捕 获 的 观 测 值 数 来 识 别 强 单 元, 进 而 了 解 适 当 的 聚 类 数 Kohonen 节 点 模 型 选 项 图 片 11-3 Kohonen 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称

307 295 聚 类 模 型 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 继 续 训 练 现 有 模 型 默 认 情 况 下, 每 次 执 行 Kohonen 节 点 时, 就 会 创 建 一 个 全 新 的 网 络 如 果 选 中 此 选 项, 则 会 继 续 训 练 该 节 点 成 功 生 成 的 最 后 一 个 网 络 显 示 反 馈 图 形 如 果 选 中 此 选 项, 则 会 在 训 练 期 间 显 示 二 维 数 组 的 直 观 表 示 每 个 节 点 的 强 度 用 颜 色 表 示 红 色 表 示 聚 集 了 许 多 记 录 的 单 元 ( 强 单 元 ), 白 色 表 示 聚 集 的 记 录 较 少 或 没 有 记 录 的 单 元 ( 弱 单 元 ) 如 果 构 建 模 型 所 花 费 的 时 间 相 对 较 短, 能 不 会 显 示 反 馈 注 意, 此 功 能 会 减 慢 训 练 进 度 要 加 快 训 练 进 度, 请 取 消 选 中 此 选 项 图 片 11-4 Kohonen 反 馈 图 形 停 止 于 默 认 停 止 标 准 会 基 于 内 部 参 数 停 止 训 练 也 可 以 指 定 时 间 作 为 停 止 标 准 以 分 钟 为 单 位 输 入 网 络 训 练 的 时 间 设 置 随 机 数 种 子 如 果 不 设 置 随 机 数 种 子, 则 每 次 执 行 节 点 时 用 于 初 始 化 网 络 权 重 的 随 机 值 的 序 列 都 会 不 同 这 将 导 致 即 使 节 点 设 置 和 数 据 值 都 完 全 相 同, 节 点 也 会 在 不 同 的 运 行 中 创 建 不 同 的 模 型 通 过 选 择 该 选 项, 可 以 将 随 机 种 子 设 置 为 特 定 值, 从 而 使 结 果 模 型 具 有 精 确 的 可 再 现 性 特 定 的 随 机 种 子 通 常 会 生 成 相 同 的 随 机 值 序 列, 在 这 种 情 况 下 执 行 节 点 通 常 会 产 生 相 同 的 生 成 模 型 注 : 为 从 数 据 库 中 读 取 的 记 录 选 择 设 置 随 机 数 种 子 选 项 时, 可 能 在 抽 样 前 需 要 使 用 排 序 节 点 以 确 保 每 次 执 行 节 点 时 能 得 到 相 同 的 结 果 这 是 因 为 随 机 种 子 依 赖 于 记 录 的 顺 序, 而 在 关 系 数 据 库 中 不 能 保 证 记 录 具 有 这 种 顺 序 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 排 序 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 注 意 : 如 果 要 在 模 型 中 包 括 名 义 ( 集 合 ) 字 段, 但 在 构 建 模 型 时 遇 到 内 存 问 题, 或 构 建 模 型 所 需 的 时 间 太 长, 则 可 以 考 虑 重 新 编 码 大 型 集 合 字 段 以 减 少 值 的 数 量, 或 考 虑 使 用 值 较 少 的 其 他 字 段 作 为 该 大 型 集 合 的 代 理 例 如, 如 果 包 含 个 别 产 品 值 的 product_id 字 段 出 现 问 题, 可 以 考 虑 将 其 从 模 型 中 删 除 并 改 为 添 加 信 息 不 是 很 详 细 的 product_category 字 段 代 替 优 化 根 据 您 的 具 体 需 求, 选 择 为 了 提 高 建 模 性 能 而 设 计 的 选 项

308 296 章 11 选 择 速 度 可 指 示 算 法 从 不 使 用 磁 盘 溢 出, 以 便 提 高 性 能 选 择 内 存 可 指 示 算 法 在 合 适 的 时 候, 以 牺 牲 某 些 速 度 为 代 价 使 用 磁 盘 溢 出 此 选 项 默 认 为 选 中 状 态 注 : 以 分 布 式 模 式 运 行 时, 此 设 置 可 能 会 被 options.cfg 中 指 定 的 管 理 员 选 项 覆 盖 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 使 用 options.cfg 文 件 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南 追 加 聚 类 标 签 默 认 对 新 模 型 选 中 此 选 项, 但 对 从 较 早 版 本 的 IBM SPSS Modeler 加 载 的 模 型 取 消 选 中 该 选 项 会 创 建 一 个 由 K-Means 和 两 步 聚 类 节 点 共 同 创 建 的 相 同 类 型 的 分 类 得 分 字 段 在 计 算 不 同 模 型 类 型 的 排 序 测 量 量 时, 该 字 符 串 字 段 用 于 自 动 聚 类 节 点 有 关 详 细 信 息, 请 参 阅 第 95 页 码 第 5 章 中 的 自 动 聚 类 节 点 Kohonen 节 点 专 家 选 项 对 于 对 Kohonen 网 有 详 尽 了 解 的 用 户, 可 使 用 专 家 选 项 对 训 练 过 程 进 行 微 调 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家 图 片 11-5 Kohonen 专 家 选 项 宽 度 和 长 度 将 二 维 输 出 图 的 大 小 ( 宽 度 和 长 度 ) 指 定 为 每 个 维 上 的 输 出 单 元 数 学 习 速 率 衰 减 选 择 线 性 或 指 数 学 习 速 率 衰 减 学 习 速 率 是 随 时 间 递 减 的 加 权 因 子, 使 得 网 络 可 以 从 数 据 的 大 尺 度 特 征 开 始 进 行 编 码, 然 后 逐 渐 集 中 于 更 细 微 的 数 据 信 息 阶 段 1 和 阶 段 2 Kohonen 网 络 训 练 分 为 两 个 阶 段 阶 段 1 是 粗 略 估 计 阶 段, 用 于 捕 获 数 据 中 的 大 致 模 式 阶 段 2 是 调 整 阶 段, 用 于 调 整 图 以 便 为 数 据 更 精 细 的 特 征 建 模 每 个 阶 段 都 有 以 下 三 个 参 数 :

309 297 聚 类 模 型 近 邻 设 置 近 邻 的 起 始 大 小 ( 半 径 ) 此 参 数 确 定 在 训 练 期 间 与 赢 得 单 元 一 起 被 更 新 的 邻 近 单 元 数 在 阶 段 1, 近 邻 大 小 以 阶 段 1 近 邻 为 起 始 值, 然 后 减 少 到 ( 阶 段 2 近 邻 + 1) 在 阶 段 2, 近 邻 大 小 起 始 为 阶 段 2 近 邻, 然 后 减 少 到 1.0 阶 段 1 近 邻 应 大 于 阶 段 2 近 邻 初 始 Eta 为 学 习 速 率 eta 设 置 起 始 值 在 阶 段 1,eta 起 始 为 阶 段 1 初 始 Eta, 然 后 减 少 到 阶 段 2 初 始 Eta 在 阶 段 2,eta 起 始 为 阶 段 2 初 始 Eta, 然 后 减 少 到 0 阶 段 1 初 始 Eta 应 大 于 阶 段 2 初 始 Eta 周 期 为 训 练 的 每 个 阶 段 设 置 周 期 数 每 个 阶 段 均 会 进 行 指 定 次 数 的 数 据 处 理 Kohonen 模 型 块 Kohonen 模 型 块 包 含 由 经 过 训 练 的 Kohonen 网 络 捕 获 的 所 有 信 息, 还 包 含 有 关 网 络 体 系 结 构 的 信 息 当 运 行 包 含 Kohonen 模 型 块 的 流 时, 节 点 将 添 加 两 个 新 字 段, 这 两 个 字 段 包 含 Kohonen 输 出 网 格 中 对 该 记 录 反 应 最 强 烈 的 单 元 的 X 坐 标 和 Y 坐 标 新 字 段 名 得 自 模 型 名 称, 即 在 模 型 名 称 前 加 上 前 缀 $KX- 和 $KY- 例 如, 如 果 模 型 名 称 为 Kohonen, 则 新 字 段 的 名 称 应 是 $KX-Kohonen 和 $KY-Kohonen 为 了 更 好 地 了 解 Kohonen 网 络 编 码 的 内 容, 可 单 击 模 型 块 浏 览 器 上 的 模 型 选 项 卡 此 时 会 显 示 聚 类 查 看 器, 提 供 聚 类 字 段 和 重 要 性 等 级 的 图 形 表 示 有 关 详 细 信 息, 请 参 阅 第 306 页 码 聚 类 浏 览 器 - 模 型 选 项 卡 如 果 更 愿 意 以 网 格 形 式 显 现 聚 类, 则 可 以 通 过 使 用 散 点 图 节 点 绘 制 $KX- 和 $KY- 字 段 来 查 看 Kohonen 网 络 的 结 果 ( 应 在 散 点 图 节 点 中 选 择 X-Agitation 和 Y-Agitation 以 防 止 每 个 单 元 的 记 录 彼 此 覆 盖 ) 在 散 点 图 中, 也 可 以 交 叠 符 号 字 段 以 调 查 Kohonen 网 络 是 如 何 聚 类 数 据 的 深 入 了 解 Kohonen 网 络 的 另 一 个 有 力 方 法 是 使 用 规 则 归 纳 来 揭 示 用 于 区 分 通 过 网 络 发 现 的 聚 类 的 特 征 有 关 详 细 信 息, 请 参 阅 第 146 页 码 第 6 章 中 的 C5.0 节 点 有 关 使 用 模 型 浏 览 器 的 一 般 信 息, 请 参 阅 浏 览 模 型 块 Kohonen 模 型 汇 总 Kohonen 模 型 块 的 汇 总 选 项 卡 显 示 有 关 网 络 的 体 系 结 构 或 拓 扑 结 构 的 信 息 二 维 Kohonen 特 征 图 ( 输 出 层 ) 的 长 度 和 宽 度 显 示 为 $KX-model_name 和 $KY-model_name 对 于 输 入 层 和 输 出 层, 将 列 出 该 层 的 单 元 数

310 298 章 11 图 片 11-6 Kohonen 模 型 块 : 汇 总 选 项 卡 K-Means 节 点 K-Means 节 点 提 供 一 种 进 行 聚 类 分 析 的 方 法 它 可 以 用 于 在 最 初 不 知 道 有 哪 些 组 时, 将 数 据 集 聚 类 为 不 同 的 组 与 IBM SPSS Modeler 中 的 大 多 数 学 习 方 法 不 同 的 是, K-Means 模 型 不 使 用 目 标 字 段 这 种 没 有 目 标 字 段 的 学 习 称 为 无 监 督 学 习 K-Means 模 型 试 图 揭 示 输 入 字 段 集 的 模 式 而 不 是 预 测 结 果 对 记 录 进 行 分 组, 以 使 一 个 组 或 聚 类 中 的 记 录 彼 此 相 似, 而 不 同 组 中 的 记 录 则 互 不 相 同 K-Means 的 工 作 原 理 是 根 据 数 据 定 义 一 组 起 始 聚 类 中 心 然 后 根 据 记 录 的 输 入 字 段 值, 将 每 个 记 录 分 配 到 与 其 最 相 似 的 聚 类 中 在 分 配 完 所 有 记 录 后, 更 新 聚 类 中 心 以 反 映 分 配 到 每 个 聚 类 的 新 记 录 集 然 后 再 次 检 查 记 录, 以 确 定 是 否 应 将 这 些 记 录 重 新 分 配 到 不 同 的 聚 类 中, 这 个 记 录 分 配 / 聚 类 迭 代 过 程 将 一 直 持 续, 直 到 达 到 最 大 迭 代 次 数 或 一 次 迭 代 与 下 次 迭 代 之 间 的 改 变 不 超 过 指 定 阈 值 为 止 注 意 : 得 到 的 模 型 一 定 程 度 上 取 决 于 训 练 数 据 的 顺 序 重 排 数 据 顺 序 并 重 新 构 建 模 型 有 可 能 得 到 不 同 的 聚 类 模 型 要 求 要 训 练 K-Means 模 型, 您 需 要 一 个 或 多 个 角 色 设 置 为 输 入 的 字 段 角 色 设 置 为 输 出 两 者 或 无 的 字 段 将 被 忽 略 强 度 构 建 K-Means 模 型 不 需 要 有 组 成 员 关 系 数 据 通 常,K-Means 模 型 是 进 行 大 型 数 据 集 聚 类 的 最 快 方 法

311 299 聚 类 模 型 K-Means 节 点 模 型 选 项 图 片 11-7 K-Means 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 指 定 的 聚 类 数 指 定 要 生 成 的 聚 类 数 默 认 值 为 5 生 成 距 离 字 段 如 果 选 中 此 选 项, 则 模 型 块 将 包 括 一 个 字 段, 该 字 段 包 含 每 个 记 录 与 所 分 配 到 的 聚 类 的 中 心 之 间 的 距 离 聚 类 标 签 为 生 成 的 聚 类 成 员 关 系 字 段 的 值 指 定 格 式 聚 类 成 员 关 系 可 表 示 为 具 有 指 定 标 签 前 缀 的 字 符 串 ( 例 如,"Cluster 1" "Cluster 2" 等 等 ), 也 可 以 表 示 为 数 值 注 意 : 如 果 要 在 模 型 中 包 括 名 义 ( 集 合 ) 字 段, 但 在 构 建 模 型 时 遇 到 内 存 问 题, 或 构 建 模 型 所 需 的 时 间 太 长, 则 可 以 考 虑 重 新 编 码 大 型 集 合 字 段 以 减 少 值 的 数 量, 或 考 虑 使 用 值 较 少 的 其 他 字 段 作 为 该 大 型 集 合 的 代 理 例 如, 如 果 包 含 个 别 产 品 值 的 product_id 字 段 出 现 问 题, 可 以 考 虑 将 其 从 模 型 中 删 除 并 改 为 添 加 信 息 不 是 很 详 细 的 product_category 字 段 代 替 优 化 根 据 您 的 具 体 需 求, 选 择 为 了 提 高 建 模 性 能 而 设 计 的 选 项

312 300 章 11 选 择 速 度 可 指 示 算 法 从 不 使 用 磁 盘 溢 出, 以 便 提 高 性 能 选 择 内 存 可 指 示 算 法 在 合 适 的 时 候, 以 牺 牲 某 些 速 度 为 代 价 使 用 磁 盘 溢 出 此 选 项 默 认 为 选 中 状 态 注 : 以 分 布 式 模 式 运 行 时, 此 设 置 可 能 会 被 options.cfg 中 指 定 的 管 理 员 选 项 覆 盖 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 使 用 options.cfg 文 件 中 的 IBM SPSS Modeler Server 14.2 管 理 和 性 能 指 南 K-Means 节 点 专 家 选 项 对 于 对 k-means 聚 类 有 详 尽 了 解 的 用 户, 可 使 用 专 家 选 项 对 训 练 过 程 进 行 微 调 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家 图 片 11-8 K-Means 专 家 选 项 停 止 于 指 定 训 练 模 型 时 要 使 用 的 停 止 标 准 默 认 停 止 标 准 为 20 次 迭 代 或 差 异 < , 以 先 满 足 的 标 准 为 准 选 中 自 定 义 可 指 定 自 己 的 停 止 标 准 最 大 迭 代 次 数 使 用 此 选 项 可 在 指 定 的 迭 代 次 数 后 停 止 模 型 训 练 差 异 容 忍 度 使 用 此 选 项 可 在 某 次 迭 代 的 聚 类 中 心 中 的 最 大 差 异 小 于 指 定 的 水 平 时 停 止 模 型 训 练 集 合 编 码 值 指 定 0 到 1.0 之 间 的 值 用 于 对 作 为 数 值 字 段 组 的 集 合 字 段 进 行 重 新 编 码 默 认 值 是 0.5 的 平 方 根 ( 大 约 为 ), 它 可 为 重 新 编 码 的 标 志 字 段 提 供 适 当 的 加 权 值 越 接 近 1.0, 对 集 合 字 段 的 加 权 就 越 高 于 对 数 值 字 段 的 加 权

313 301 聚 类 模 型 K-Means 模 型 块 K-Means 模 型 块 包 含 由 聚 类 模 型 捕 获 的 所 有 信 息, 还 包 含 有 关 训 练 数 据 和 估 计 过 程 的 信 息 当 运 行 包 含 K-Means 模 型 块 的 流 时, 该 节 点 将 添 加 两 个 新 字 段, 这 两 个 字 段 包 含 聚 类 成 员 以 及 与 该 记 录 所 分 配 到 的 聚 类 中 心 的 距 离 新 字 段 名 得 自 模 型 名 称, 即 为 聚 类 成 员 加 上 $KM- 前 缀, 为 与 聚 类 中 心 的 距 离 加 上 $KMD- 前 缀 例 如, 如 果 模 型 名 称 为 Kmeans, 则 新 字 段 的 名 称 应 是 $KM-Kmeans 和 $KMD-Kmeans 深 入 了 解 K-Means 模 型 的 一 种 有 力 方 法 是 使 用 规 则 归 纳 来 揭 示 用 于 区 分 通 过 模 型 发 的 聚 类 的 特 征 有 关 详 细 信 息, 请 参 阅 第 146 页 码 第 6 章 中 的 C5.0 节 点 也 可 以 单 击 模 型 块 浏 览 器 上 的 模 型 选 项 卡 以 显 示 聚 类 查 看 器, 它 提 供 聚 类 字 段 和 重 要 性 等 级 的 图 形 表 示 有 关 详 细 信 息, 请 参 阅 第 306 页 码 聚 类 浏 览 器 - 模 型 选 项 卡 有 关 使 用 模 型 浏 览 器 的 一 般 信 息, 请 参 阅 浏 览 模 型 块 K-Means 模 型 汇 总 K-Means 模 型 块 的 汇 总 选 项 卡 包 含 有 关 训 练 数 据 估 计 过 程 和 由 模 型 定 义 的 聚 类 的 信 息 显 示 的 信 息 有 聚 类 数, 还 有 迭 代 历 史 如 果 已 执 行 附 加 到 此 建 模 节 点 的 分 析 节 点, 则 分 析 信 息 也 将 显 示 在 此 选 项 卡 上 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 分 析 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 图 片 11-9 K-Means 模 型 块 : 汇 总 选 项 卡

314 302 章 11 两 步 聚 类 节 点 两 步 聚 类 节 点 提 供 一 种 形 式 的 聚 类 分 析 它 可 以 用 于 在 最 初 不 知 道 有 哪 些 组 时, 将 数 据 集 聚 类 为 不 同 的 组 与 Kohonen 节 点 和 K-Means 节 点 一 样, 两 步 聚 类 模 型 也 不 使 用 目 标 字 段 两 步 聚 类 模 型 试 图 揭 示 输 入 字 段 集 的 模 式 而 不 是 预 测 结 果 对 记 录 进 行 分 组, 以 使 一 个 组 或 聚 类 中 的 记 录 彼 此 相 似, 而 不 同 组 中 的 记 录 则 互 不 相 同 两 步 聚 类 是 一 种 分 两 步 进 行 聚 类 的 方 法 第 一 步, 完 成 简 单 数 据 处 理, 这 个 过 程 将 原 始 输 入 数 据 压 缩 为 若 干 易 处 理 的 子 聚 类 第 二 步, 采 用 分 层 聚 类 方 法 逐 渐 将 这 些 子 聚 类 合 并 成 越 来 越 大 的 聚 类, 不 需 要 再 次 进 行 数 据 处 理 分 层 聚 类 的 优 点 在 于 不 需 要 事 先 选 择 聚 类 数 许 多 分 层 聚 类 方 法 刚 开 始 都 将 单 个 记 录 作 为 最 初 的 聚 类, 然 后 递 归 合 并 这 些 记 录 以 不 断 生 成 更 大 的 聚 类 虽 然 此 类 方 法 常 因 数 据 数 量 巨 大 而 失 败, 但 两 步 聚 类 的 初 始 预 聚 类 使 得 分 层 聚 类 即 使 数 据 集 巨 大 速 度 也 非 常 快 注 意 : 得 到 的 模 型 一 定 程 度 上 取 决 于 训 练 数 据 的 顺 序 重 排 数 据 顺 序 并 重 新 构 建 模 型 有 可 能 得 到 不 同 的 聚 类 模 型 要 求 要 训 练 两 步 聚 类 模 型, 您 需 要 一 个 或 多 个 角 色 设 置 为 输 入 的 字 段 角 色 设 置 为 目 标 两 者 或 无 的 字 段 将 被 忽 略 两 步 聚 类 算 法 不 处 理 缺 失 值 构 建 模 型 时 将 忽 略 任 意 输 入 字 段 包 含 空 白 的 记 录 强 度 两 步 聚 类 可 以 处 理 混 合 字 段 类 型 并 能 有 效 处 理 大 型 数 据 集 它 还 能 检 验 多 种 聚 类 解 决 方 案 并 选 择 其 中 最 有 效 的 一 种, 因 此 不 必 知 道 开 始 时 应 有 多 少 个 聚 类 可 将 两 步 聚 类 设 置 为 自 动 排 除 离 群 值 或 能 对 结 果 造 成 损 害 的 极 其 异 常 情 况

315 303 聚 类 模 型 两 步 聚 类 节 点 模 型 选 项 图 片 两 步 聚 类 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 标 准 化 数 值 字 段 默 认 情 况 下, 两 步 聚 类 会 对 所 有 数 值 输 入 字 段 进 行 标 准 化, 使 它 们 具 有 相 同 的 尺 度, 即 均 值 为 0 且 方 差 为 1 要 保 留 数 值 字 段 的 原 始 尺 度, 可 取 消 选 中 此 选 项 符 号 字 段 不 受 影 响 排 除 离 群 值 如 果 选 中 此 选 项, 则 那 些 与 主 要 聚 类 似 乎 格 格 不 入 的 记 录 将 自 动 排 除 在 分 析 之 外 这 样 可 以 防 止 此 类 情 况 歪 曲 结 果 离 群 值 检 测 在 预 聚 类 步 骤 进 行 选 中 此 选 项 时, 会 将 相 对 于 其 他 子 聚 类 具 有 较 少 记 录 的 子 聚 类 视 为 潜 在 离 群 值, 且 重 新 构 建 不 包 括 这 些 记 录 的 子 聚 类 树 子 聚 类 被 视 为 包 含 潜 在 离 群 值 的 下 限 大 小 由 百 分 比 选 项 控 制 如 果 其 中 某 些 潜 在 离 群 值 记 录 与 任 何 新 子 聚 类 配 置 足 够 相 似, 则 可 将 其 添 加 到 重 新 构 建 的 子 聚 类 中 将 其 余 无 法 合 并 的 潜 在 离 群 值 视 为 离 群 值 添 到 噪 声 聚 类 中 并 排 除 在 分 层 聚 类 步 骤 之 外 使 用 经 过 离 群 值 处 理 的 两 步 模 型 对 数 据 进 行 评 分 时, 会 将 与 最 近 主 要 聚 类 的 距 离 大 于 特 定 阈 值 距 离 ( 基 于 对 数 似 然 ) 的 新 观 测 值 视 为 离 群 值 分 配 到 噪 声 聚 类 中, 名 称 为 -1

316 304 章 11 聚 类 标 签 为 生 成 的 聚 类 成 员 关 系 字 段 指 定 格 式 聚 类 成 员 关 系 可 表 示 为 具 有 指 定 标 签 前 缀 的 字 符 串 ( 例 如,"Cluster 1" "Cluster 2" 等 等 ), 也 可 以 表 示 为 数 值 自 动 计 算 聚 类 数 两 步 聚 类 可 以 非 常 迅 速 地 对 大 量 聚 类 解 决 方 案 进 行 分 析 并 为 训 练 数 据 选 择 最 佳 聚 类 数 通 过 设 置 最 大 聚 类 数 和 最 小 聚 类 数 指 定 要 尝 试 的 聚 类 解 决 方 案 的 范 围 两 步 聚 类 通 过 一 个 两 阶 段 过 程 确 定 最 佳 聚 类 数 在 第 一 个 阶 段, 随 着 所 添 加 聚 类 的 增 多, 可 基 于 贝 叶 斯 信 息 准 则 (BIC) 中 的 差 异 选 择 模 型 中 聚 类 数 的 上 限 在 第 二 个 阶 段, 为 聚 类 数 比 最 小 BIC 解 决 方 案 还 少 的 所 有 模 型 找 出 聚 类 间 最 小 距 离 的 差 异 距 离 的 最 大 差 异 用 于 识 别 最 终 聚 类 模 型 指 定 聚 类 数 如 果 知 道 模 型 中 要 包 括 的 聚 类 数, 请 选 中 此 选 项 并 输 入 聚 类 数 距 离 测 量 此 选 项 确 定 如 何 计 算 两 个 聚 类 之 间 的 相 似 性 对 数 相 似 性 该 似 然 度 量 假 设 变 量 服 从 某 种 概 率 分 布 假 设 连 续 变 量 是 正 态 分 布, 而 假 设 分 类 变 量 是 多 项 分 布 假 设 所 有 变 量 均 是 独 立 的 欧 几 里 德 距 离 欧 几 里 德 距 离 测 量 是 两 个 聚 类 之 间 的 直 线 距 离 它 只 能 用 于 所 有 变 量 连 续 的 情 况 聚 类 准 则 此 选 项 确 定 自 动 聚 类 算 法 如 何 确 定 聚 类 数 可 以 指 定 Bayesian 信 息 准 则 (BIC) 或 Akaike 信 息 准 则 (AIC) 两 步 聚 类 模 型 块 两 步 聚 类 模 型 块 包 含 由 聚 类 模 型 捕 获 的 所 有 信 息, 还 包 含 有 关 训 练 数 据 和 估 计 过 程 的 信 息 当 运 行 包 含 两 步 聚 类 模 型 块 的 流 时, 节 点 将 为 该 记 录 添 加 包 含 聚 类 成 员 的 新 字 段 新 字 段 名 得 自 模 型 名 称, 即 在 模 型 名 称 前 加 上 $T- 前 缀 例 如, 如 果 模 型 名 称 为 TwoStep, 则 新 字 段 的 名 称 应 是 $T-TwoStep 深 入 了 解 两 步 模 型 的 一 种 有 力 方 法 是 使 用 规 则 归 纳 来 揭 示 用 于 区 分 通 过 模 型 发 现 的 聚 类 的 特 征 有 关 详 细 信 息, 请 参 阅 第 146 页 码 第 6 章 中 的 C5.0 节 点 也 可 以 单 击 模 型 块 浏 览 器 上 的 模 型 选 项 卡 以 显 示 聚 类 查 看 器, 它 提 供 聚 类 字 段 和 重 要 性 等 级 的 图 形 表 示 有 关 详 细 信 息, 请 参 阅 第 306 页 码 聚 类 浏 览 器 - 模 型 选 项 卡 有 关 使 用 模 型 浏 览 器 的 一 般 信 息, 请 参 阅 浏 览 模 型 块 两 步 模 型 汇 总 两 步 聚 类 模 型 块 的 汇 总 选 项 卡 显 示 找 出 的 聚 类 数 以 及 有 关 训 练 数 据 估 计 过 程 和 所 使 用 的 构 建 设 置 的 信 息

317 305 聚 类 模 型 图 片 两 步 聚 类 模 型 块 汇 总 选 项 卡 示 例 聚 类 浏 览 器 有 关 详 细 信 息, 请 参 阅 第 43 页 码 第 3 章 中 的 浏 览 模 型 块 聚 类 模 型 通 常 用 于 根 据 所 检 查 变 量 查 找 具 有 类 似 记 录 的 组 ( 聚 类 ), 其 中 同 组 成 员 间 的 相 似 性 高 而 不 同 组 成 员 间 的 相 似 性 低 结 果 可 用 于 识 别 原 本 不 明 显 的 关 联 例 如, 通 过 对 客 户 偏 好 收 入 水 平 和 购 物 习 惯 的 聚 类 分 析, 可 以 识 别 出 对 某 种 市 场 营 销 活 动 更 可 能 做 出 反 应 的 客 户 类 型 有 两 种 方 法 可 以 解 释 聚 类 显 示 中 的 结 果 : 检 查 聚 类 以 确 定 该 聚 类 的 唯 一 特 征 是 否 有 一 个 聚 类 包 含 所 有 高 收 入 借 款 人? 此 聚 类 是 否 包 含 比 其 他 聚 类 更 多 的 记 录? 检 查 各 聚 类 上 的 字 段 以 确 定 值 在 聚 类 间 的 分 布 情 况 个 人 的 教 育 水 平 是 否 决 定 其 在 聚 类 中 的 成 员 资 格? 高 信 用 得 分 是 否 在 一 个 聚 类 或 另 一 个 聚 类 的 成 员 资 格 之 间 加 以 区 分? 使 用 聚 类 浏 览 器 中 的 主 视 图 和 各 个 链 接 视 图, 可 以 清 楚 回 答 这 些 问 题 可 在 IBM SPSS Modeler 中 生 成 以 下 聚 类 模 型 块 : Kohonen 网 络 模 型 块 K- 均 值 模 型 块 二 阶 聚 类 模 型 块

318 306 章 11 要 查 看 有 关 聚 类 模 型 块 的 信 息, 右 键 单 击 模 型 节 点 并 从 上 下 文 菜 单 中 选 择 浏 览 ( 或 选 择 流 中 节 点 的 编 辑 ) 或 者, 如 果 您 正 使 用 自 动 聚 类 建 模 节 点, 双 击 自 动 聚 类 模 型 块 中 的 所 需 聚 类 模 型 块 有 关 详 细 信 息, 请 参 阅 第 95 页 码 第 5 章 中 的 自 动 聚 类 节 点 聚 类 浏 览 器 - 模 型 选 项 卡 聚 类 模 型 的 模 型 选 项 卡 显 示 各 聚 类 之 间 字 段 的 摘 要 统 计 和 分 布 的 图 形 显 示, 也 称 为 聚 类 浏 览 器 注 意 : 模 型 选 项 卡 对 于 使 用 IBM SPSS Modeler 13 之 前 版 本 构 建 的 模 型 不 可 用 图 片 具 有 默 认 显 示 的 聚 类 浏 览 器 聚 类 浏 览 器 包 含 两 个 面 板, 主 视 图 位 于 左 侧, 链 接 或 辅 助 视 图 位 于 右 侧 有 两 个 主 视 图 : 模 型 摘 要 ( 默 认 视 图 ) 有 关 详 细 信 息, 请 参 阅 第 307 页 码 模 型 摘 要 视 图 聚 类 有 关 详 细 信 息, 请 参 阅 第 308 页 码 聚 类 视 图 有 四 个 链 接 / 辅 助 视 图 : 预 测 变 量 重 要 性 有 关 详 细 信 息, 请 参 阅 第 310 页 码 聚 类 预 测 变 量 重 要 性 视 图 聚 类 大 小 ( 默 认 视 图 ) 有 关 详 细 信 息, 请 参 阅 第 311 页 码 聚 类 大 小 视 图 单 元 格 分 布 有 关 详 细 信 息, 请 参 阅 第 312 页 码 单 元 格 分 布 视 图 聚 类 比 较 有 关 详 细 信 息, 请 参 阅 第 313 页 码 聚 类 比 较 视 图

319 307 聚 类 模 型 模 型 摘 要 视 图 图 片 主 面 板 中 的 模 型 摘 要 视 图 模 型 摘 要 视 图 显 示 聚 类 模 型 的 快 照 或 摘 要, 包 括 加 阴 影 以 表 示 结 果 较 差 尚 可 或 良 好 的 聚 类 结 合 和 分 离 的 Silhouette 测 量 该 快 照 可 让 您 快 速 检 查 质 量 是 否 较 差, 如 果 较 差, 您 可 返 回 建 模 节 点 修 改 聚 类 模 型 设 置 以 生 成 较 好 的 结 果 结 果 较 差 尚 可 和 良 好 是 基 于 Kaufman 和 Rousseeuw (1990) 关 于 聚 类 结 构 解 释 的 研 究 成 果 来 判 定 的 在 模 型 摘 要 视 图 中, 良 好 的 结 果 表 示 数 据 将 Kaufman 和 Rousseeuw 的 评 级 反 映 为 聚 类 结 构 的 合 理 迹 象 或 强 迹 象, 尚 可 的 结 果 将 其 评 级 反 映 为 弱 迹 象, 而 较 差 的 结 果 将 其 评 级 反 映 为 无 明 显 迹 象 Silhouette 测 量 所 有 记 录 的 平 均 值,(B A) / max(a,b), 其 中 A 是 记 录 与 其 聚 类 中 心 的 距 离,B 是 记 录 与 其 非 所 属 最 近 聚 类 中 心 的 距 离 Silhouette 系 数 为 1 表 示 所 有 个 案 直 接 位 于 其 聚 类 中 心 上 值 为 1 表 示 所 有 个 案 位 于 某 些 其 他 聚 类 的 聚 类 中 心 上 值 为 0 表 示 在 正 常 情 况 下 个 案 到 其 自 身 聚 类 中 心 与 到 最 近 其 他 聚 类 中 心 是 等 距 的 摘 要 所 包 含 的 表 格 具 有 以 下 信 息 : 算 法 所 使 用 的 聚 类 算 法, 例 如 二 阶 输 入 特 征 字 段 数 量, 也 称 为 输 入 或 预 测 变 量 聚 类 解 中 聚 类 的 数 量

320 308 章 11 聚 类 视 图 图 片 主 面 板 中 的 聚 类 中 心 视 图 聚 类 视 图 包 含 一 个 聚 类 - 特 征 网 格, 其 中 包 括 每 个 聚 类 的 名 称 大 小 和 概 要 文 件 网 格 中 的 列 包 含 以 下 信 息 : 聚 类 算 法 生 成 的 聚 类 编 号 标 签 应 用 于 每 个 聚 类 的 任 何 标 签 ( 默 认 为 空 白 ) 双 击 单 元 格 输 入 描 述 聚 类 内 容 的 标 签, 例 如 豪 华 汽 车 买 家 描 述 聚 类 内 容 的 任 何 描 述 ( 默 认 为 空 白 ) 双 击 单 元 格 输 入 聚 类 描 述 ; 例 如 年 龄 超 过 55 岁 专 业 人 员 收 入 超 过 100,000 美 元 大 小 每 个 聚 类 的 大 小, 表 示 为 总 体 聚 类 样 本 的 百 分 比 网 格 中 的 每 个 大 小 单 元 格 显 示 一 个 垂 直 条, 其 中 显 示 聚 类 中 的 大 小 百 分 比 数 值 格 式 的 大 小 百 分 比 和 聚 类 个 案 计 数 特 征 单 个 输 入 或 预 测 变 量, 默 认 按 总 体 重 要 性 排 序 如 果 有 列 的 大 小 相 等, 则 其 以 聚 类 编 号 的 升 序 显 示 总 体 特 征 重 要 性 由 单 元 格 背 景 阴 影 的 颜 色 表 示 ; 最 重 要 的 特 征 颜 色 最 深 ; 最 不 重 要 的 特 征 则 没 有 阴 影 表 格 上 方 的 向 导 指 示 与 每 个 特 征 单 元 格 颜 色 关 联 的 重 要 性 当 鼠 标 悬 停 在 单 元 格 上 时, 会 显 示 特 征 的 全 名 / 标 签 和 单 元 格 的 重 要 性 值 根 据 视 图 和 特 征 类 型, 可 能 会 显 示 其 他 信 息 在 聚 类 中 心 视 图 中, 这 包 括 单 元 格 统 计 量 和 单 元 格 值 ; 例 如 : 均 值 :4.32 对 于 类 别 特 征, 单 元 格 显 示 最 常 见 ( 模 态 ) 类 别 的 名 称 及 其 百 分 比

321 309 聚 类 模 型 在 聚 类 视 图 中, 您 可 以 选 择 多 种 显 示 聚 类 信 息 的 方 式 : 转 置 聚 类 和 特 征 有 关 详 细 信 息, 请 参 阅 第 309 页 码 转 置 聚 类 和 特 征 排 序 特 征 有 关 详 细 信 息, 请 参 阅 第 309 页 码 排 序 特 征 排 序 聚 类 有 关 详 细 信 息, 请 参 阅 第 309 页 码 排 序 聚 类 选 择 单 元 格 内 容 有 关 详 细 信 息, 请 参 阅 第 310 页 码 单 元 格 内 容 转 置 聚 类 和 特 征 默 认 情 况 下, 聚 类 显 示 为 列, 而 特 征 显 示 为 行 为 翻 转 这 种 显 示, 单 击 特 征 排 序 方 式 按 钮 左 侧 的 转 置 聚 类 和 特 征 按 钮 例 如, 当 显 示 许 多 聚 类 时, 您 可 能 想 要 进 行 此 操 作, 以 减 少 查 看 数 据 所 需 的 水 平 滚 动 量 图 片 主 面 板 中 的 转 置 聚 类 排 序 特 征 特 征 排 序 方 式 按 钮 可 使 您 选 择 特 征 单 元 格 的 显 示 方 式 : 总 体 重 要 性 这 是 默 认 的 排 序 方 式 特 征 以 总 体 重 要 性 的 升 序 进 行 排 序, 排 序 方 式 在 各 聚 类 间 相 同 如 果 有 特 征 具 有 同 数 重 要 性 值, 则 按 照 特 征 名 称 的 升 序 列 出 同 数 特 征 聚 类 内 重 要 性 特 征 按 照 其 相 对 于 每 个 聚 类 的 重 要 性 进 行 排 序 如 果 有 特 征 具 有 同 数 重 要 性 值, 则 按 照 特 征 名 称 的 升 序 列 出 同 数 特 征 当 选 中 此 选 项 时, 排 序 顺 序 通 常 因 聚 类 而 异 名 称 特 征 按 照 名 称 的 字 母 顺 序 进 行 排 序 数 据 顺 序 特 征 按 照 其 在 数 据 集 中 的 顺 序 进 行 排 序 排 序 聚 类 默 认 情 况 下, 聚 类 按 照 大 小 的 降 序 排 序 聚 类 排 序 方 按 钮 可 使 您 按 照 名 称 的 字 母 顺 序 对 其 进 行 排 序, 或 如 果 您 创 建 了 唯 一 标 签, 则 按 照 标 签 的 字 母 顺 序 对 其 进 行 排 序 具 有 相 同 标 签 的 特 征 按 照 聚 类 名 称 排 序 如 果 聚 类 按 照 标 签 排 序 且 您 编 辑 了 聚 类 的 标 签, 则 自 动 更 新 排 序 顺 序

322 310 章 11 单 元 格 内 容 单 元 格 按 钮 使 您 能 够 更 改 特 征 和 评 估 字 段 的 单 元 格 内 容 的 显 示 聚 类 中 心 默 认 情 况 下, 单 元 格 显 示 特 征 名 称 / 标 签 和 每 个 聚 类 / 特 征 组 合 的 集 中 倾 向 对 于 连 续 字 段 和 具 有 分 类 字 段 的 类 别 百 分 比 的 模 式 ( 最 频 繁 出 现 的 类 别 ) 显 示 均 值 绝 对 分 布 显 示 特 征 名 称 / 标 签 和 每 个 聚 类 中 特 征 的 绝 对 分 布 对 于 类 别 特 征, 显 示 条 形 图, 其 中 叠 放 了 按 数 据 值 的 升 序 排 序 的 类 别 对 于 连 续 特 征, 显 示 平 滑 密 度 图, 其 对 每 个 聚 类 使 用 相 同 的 端 点 和 间 隔 实 心 红 色 显 示 表 示 聚 类 分 布, 而 颜 色 较 淡 的 显 示 则 表 示 总 体 数 据 相 对 分 布 显 示 特 征 名 称 / 标 签 和 单 元 格 中 的 相 对 分 布 总 体 而 言, 显 示 类 似 于 绝 对 分 布 的 显 示, 不 同 之 处 在 于 所 显 示 的 是 相 对 分 布 实 心 红 色 显 示 表 示 聚 类 分 布, 而 颜 色 较 淡 的 显 示 则 表 示 总 体 数 据 基 本 视 图 如 果 聚 类 很 多, 不 滚 动 很 难 看 到 所 有 详 细 信 息 要 减 少 滚 动 量, 选 择 此 视 图 将 显 示 更 改 为 更 紧 凑 的 表 格 聚 类 预 测 变 量 重 要 性 视 图 图 片 链 接 面 板 中 的 聚 类 预 测 变 量 重 要 性 视 图 预 测 变 量 重 要 性 视 图 显 示 评 估 模 型 时 每 个 字 段 的 相 对 重 要 性 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性

323 311 聚 类 模 型 聚 类 大 小 视 图 图 片 链 接 面 板 中 的 聚 类 大 小 视 图 聚 类 大 小 视 图 显 示 包 含 每 个 聚 类 的 饼 图 每 个 聚 类 的 百 分 比 大 小 显 示 在 每 个 分 区 上 ; 鼠 标 悬 停 在 每 个 分 区 上 显 示 该 分 区 中 的 计 数 图 表 下 方 的 表 格 列 出 以 下 大 小 信 息 : 最 小 聚 类 的 大 小 ( 总 体 计 数 和 百 分 比 ) 最 大 聚 类 的 大 小 ( 总 体 计 数 和 百 分 比 ) 最 大 聚 类 与 最 小 聚 类 的 大 小 比 率

324 312 章 11 单 元 格 分 布 视 图 图 片 链 接 面 板 中 的 单 元 格 分 布 视 图 单 元 格 分 布 视 图 显 示 您 在 聚 类 主 面 板 的 表 格 中 选 择 的 任 意 特 征 单 元 格 数 据 分 布 的 展 开 的 详 图

325 313 聚 类 模 型 聚 类 比 较 视 图 图 片 链 接 面 板 中 的 聚 类 比 较 视 图 聚 类 比 较 视 图 由 网 格 式 布 局 构 成, 行 中 为 特 征, 列 中 为 选 定 聚 类 此 视 图 帮 助 您 更 好 地 理 解 组 成 聚 类 的 因 素 ; 同 时 使 您 能 够 看 到 各 聚 类 间 的 差 异, 不 但 与 总 体 数 据 比 较, 而 且 还 在 彼 此 之 间 比 较 选 择 要 显 示 的 聚 类, 单 击 聚 类 主 面 板 中 聚 类 列 的 顶 部 使 用 Ctrl+ 单 击 或 Shift+ 单 击 选 择 或 取 消 选 择 多 个 聚 类 进 行 比 较 注 意 : 您 可 以 选 择 最 多 五 个 聚 类 用 于 显 示 聚 类 以 选 择 时 的 顺 序 显 示, 而 字 段 顺 序 则 由 特 征 排 序 方 式 选 项 决 定 当 您 选 择 聚 类 内 重 要 性 时, 将 始 终 按 总 体 重 要 性 顺 序 排 序 字 段 背 景 图 显 示 每 个 特 征 的 总 体 分 布 : 类 别 特 征 显 示 为 点 图, 其 中 点 的 大 小 代 表 每 个 聚 类 最 频 繁 出 现 的 ( 模 态 ) 类 别 ( 按 特 征 ) 连 续 特 征 显 示 为 箱 图, 其 显 示 整 体 中 位 数 和 四 分 位 距 叠 放 在 这 些 背 景 视 图 上 的 是 所 选 聚 类 的 箱 图 : 对 于 连 续 特 征, 方 点 标 记 和 水 平 线 表 示 每 个 聚 类 的 中 位 数 和 四 分 位 数 间 距 每 个 聚 类 由 不 同 颜 色 表 示, 显 示 在 视 图 顶 部

326 314 章 11 浏 览 聚 类 浏 览 器 聚 类 浏 览 器 为 交 互 式 显 示 您 可 以 : 选 择 字 段 或 聚 类 以 查 看 更 多 详 细 信 息 比 较 聚 类 以 选 择 感 兴 趣 的 项 目 更 改 显 示 转 置 轴 使 用 生 成 菜 单 生 成 派 生 节 点 过 滤 节 点 和 选 择 节 点 使 用 工 具 栏 您 可 使 用 工 具 栏 选 项 控 制 在 左 右 两 侧 面 板 中 显 示 的 信 息 您 可 使 用 工 具 栏 控 件 更 改 显 示 的 方 向 ( 从 上 至 下 从 左 至 右 或 从 右 至 左 ) 另 外, 您 还 可 以 将 浏 览 器 重 置 为 默 认 设 置, 并 打 开 对 话 框 以 在 主 面 板 中 指 定 聚 类 视 图 的 内 容 图 片 用 于 控 制 聚 类 浏 览 器 上 显 示 的 数 据 的 工 具 栏 仅 当 您 在 主 面 板 中 选 择 聚 类 视 图 时, 特 征 排 序 方 式 聚 类 排 序 方 式 单 元 格 和 显 示 选 项 才 可 用 有 关 详 细 信 息, 请 参 阅 第 308 页 码 聚 类 视 图 请 参 阅 转 置 聚 类 和 特 征 第 309 页 码 请 参 阅 特 征 排 序 方 式 第 309 页 码 请 参 阅 聚 类 排 序 方 式 第 309 页 码 请 参 阅 单 元 格 第 310 页 码 从 聚 类 模 型 生 成 节 点 生 成 菜 单 可 基 于 聚 类 模 型 新 建 节 点 可 从 生 成 模 型 的 模 型 选 项 卡 访 问 该 选 项, 它 可 基 于 当 前 显 示 或 选 择 ( 即 所 有 可 见 聚 类 或 所 有 选 定 聚 类 ) 生 成 节 点 例 如, 您 可 选 择 一 个 特 征, 然 后 生 成 过 滤 节 点 以 丢 弃 所 有 其 他 ( 非 可 见 ) 特 征 生 成 的 节 点 放 置 在 画 布 上 ( 未 连 接 ) 另 外, 您 还 可 以 在 模 型 调 色 板 上 生 成 模 型 块 的 副 本 记 住, 在 执 行 之 前 连 接 节 点 并 进 行 所 需 编 辑 生 成 建 模 节 点 在 流 画 布 上 创 建 建 模 节 点 例 如, 如 果 您 想 在 某 个 流 中 使 用 这 些 模 型 设 置 但 您 不 再 拥 有 用 来 生 成 这 些 设 置 的 建 模 节 点, 该 功 能 会 很 有 用 模 型 到 调 色 板 在 模 型 调 色 板 上 创 建 模 型 块 当 有 同 事 发 给 您 包 含 模 型 的 流 而 不 是 模 型 本 身 时, 该 功 能 很 有 用 过 滤 节 点 创 建 新 的 过 滤 节 点 以 过 滤 聚 类 模 型 不 使 用 的 过 滤 字 段 和 / 或 当 前 聚 类 浏 览 器 显 示 中 不 可 见 的 字 段 如 果 此 聚 类 节 点 上 游 有 类 型 节 点, 则 所 生 成 的 过 滤 节 点 会 丢 弃 具 有 角 色 目 标 的 任 何 字 段

327 315 聚 类 模 型 过 滤 节 点 ( 从 选 择 创 建 ) 基 于 聚 类 浏 览 器 中 的 选 择 创 建 用 于 过 滤 字 段 的 新 过 滤 节 点 使 用 Ctrl+ 单 击 的 方 法 选 择 多 个 字 段 在 下 游 丢 弃 聚 类 浏 览 器 中 选 择 的 字 段, 但 您 可 在 执 行 之 前 通 过 编 辑 过 滤 节 点 更 改 此 行 为 选 择 节 点 创 建 新 的 选 择 节 点 以 基 于 在 当 前 聚 类 浏 览 器 显 示 中 可 见 的 任 一 聚 类 中 的 成 员 资 格 选 择 记 录 自 动 生 成 选 择 条 件 选 择 节 点 ( 从 选 择 创 建 ) 创 建 新 的 选 择 节 点 以 基 于 在 聚 类 浏 览 器 中 选 择 的 聚 类 中 的 成 员 资 格 选 择 记 录 使 用 Ctrl+ 单 击 的 方 式 选 择 多 个 聚 类 派 生 节 点 创 建 新 的 派 生 节 点, 其 派 生 出 标 记 字 段, 该 字 段 基 于 聚 类 浏 览 器 中 所 有 可 见 聚 类 的 成 员 资 格 分 配 给 记 录 True 或 False 值 自 动 生 成 派 生 条 件 派 生 节 点 ( 从 选 择 创 建 ) 创 建 新 的 派 生 节 点, 该 节 点 基 于 聚 类 浏 览 器 中 选 择 的 聚 类 中 的 成 员 资 格 派 生 出 标 记 字 段 使 用 Ctrl+ 单 击 的 方 式 选 择 多 个 聚 类 除 了 生 成 节 点 之 外, 您 还 可 以 从 生 成 菜 单 创 建 图 形 有 关 详 细 信 息, 请 参 阅 第 316 页 码 从 聚 类 模 型 生 成 图 形 控 制 聚 类 视 图 显 示 要 控 制 主 面 板 的 聚 类 视 图 中 显 示 的 内 容, 单 击 显 示 按 钮 ; 打 开 显 示 对 话 框 图 片 聚 类 浏 览 器 - 显 示 选 项 特 征 默 认 选 定 要 隐 藏 所 有 输 入 特 征, 取 消 选 择 该 复 选 框 评 估 字 段 选 择 要 显 示 的 评 估 字 段 ( 不 用 于 创 建 聚 类 模 型 的 字 段, 但 被 发 送 至 模 型 浏 览 器 以 评 估 聚 类 ); 默 认 不 显 示 任 何 字 段 注 意 : 如 果 无 评 估 字 段 可 用, 则 此 复 选 框 不 可 用 聚 类 描 述 默 认 选 定 要 隐 藏 所 有 聚 类 描 述 单 元 格, 取 消 选 择 该 复 选 框 聚 类 大 小 默 认 选 定 要 隐 藏 所 有 聚 类 大 小 单 元 格, 取 消 选 择 该 复 选 框 最 大 类 别 数 指 定 在 类 别 特 征 图 表 中 显 示 的 最 大 类 别 数 量 ; 默 认 值 是 20

328 316 章 11 从 聚 类 模 型 生 成 图 形 聚 类 模 型 提 供 许 多 信 息, 但 其 格 式 有 时 不 便 于 商 业 用 户 访 问 要 使 提 供 的 数 据 便 于 纳 入 商 业 报 表 和 演 示 文 稿, 您 可 生 成 所 选 数 据 的 图 形 例 如, 可 从 聚 类 浏 览 器 生 成 所 选 聚 类 的 图 形, 这 样 可 以 只 创 建 该 聚 类 中 个 案 的 图 形 注 意 : 仅 当 模 型 块 连 接 到 流 中 的 其 他 节 点 时, 您 才 能 从 聚 类 浏 览 器 生 成 图 形 生 成 图 形 E 打 开 包 含 聚 类 浏 览 器 的 模 型 块 E 在 模 型 选 项 卡 上, 从 视 图 下 拉 列 表 选 择 聚 类 E 在 主 面 板 上, 选 择 您 要 为 其 生 成 图 形 的 一 个 或 多 个 聚 类 E 从 生 成 菜 单, 选 择 图 形 ( 从 选 择 创 建 ); 显 示 图 形 板 基 本 选 项 卡

329 317 聚 类 模 型 图 片 图 形 板 节 点 对 话 框, 基 本 选 项 卡 注 意 : 当 您 以 此 方 式 显 示 图 形 板 时, 只 有 基 本 和 详 细 选 项 卡 可 用 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 图 形 板 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 E 使 用 基 本 或 详 细 选 项 卡 设 置 指 定 在 图 形 上 显 示 的 详 细 信 息 E 单 击 确 定 生 成 图 形

330 318 章 11 图 片 从 图 形 板 基 本 选 项 卡 生 成 的 直 方 图 图 形 标 题 标 识 模 型 类 型 和 选 择 包 含 在 内 的 一 个 或 多 个 聚 类

331 关 联 规 则 章 12 关 联 规 则 将 特 定 结 论 ( 特 定 产 品 的 购 买 ) 与 一 组 条 件 ( 若 干 其 他 产 品 的 购 买 ) 关 联 起 来 例 如, 规 则 啤 酒 <= 罐 装 蔬 菜 & 冷 冻 食 品 (173, 17.0%, 0.84) 表 述 的 是 : 啤 酒 经 常 与 罐 装 蔬 菜 和 冷 冻 食 品 一 起 成 对 出 现 该 规 则 可 靠 率 为 84% 并 适 用 于 17% 的 数 据 或 173 条 记 录 关 联 规 则 算 法 自 动 找 到 可 使 用 可 视 方 法 ( 比 如 Web 节 点 ) 手 动 找 到 的 关 联 图 片 12-1 Web 节 点 显 示 各 商 品 分 类 项 目 之 间 的 关 联 与 标 准 的 决 策 树 算 法 (C5.0 和 C&R 树 ) 相 比, 关 联 规 则 算 法 的 优 点 是 任 何 属 性 之 间 都 可 以 存 在 关 联 决 策 树 算 法 只 使 用 单 一 结 论 来 构 建 规 则, 而 关 联 算 法 则 试 图 找 到 更 多 规 则, 且 每 个 规 则 具 有 不 同 的 结 论 关 联 算 法 的 缺 点 是 试 图 在 可 能 非 常 大 的 搜 索 空 间 中 查 找 规 则, 因 而 运 行 时 间 比 决 策 树 算 法 长 得 多 关 联 算 法 使 用 生 成 与 检 验 方 法 来 查 找 规 则 ( 简 单 规 则 将 初 始 生 成 ) 并 对 照 数 据 集 来 验 证 这 些 规 则 符 合 条 件 的 规 则 将 被 保 存, 然 后 规 范 所 有 遵 循 各 种 限 制 条 件 的 规 则 规 范 是 将 条 件 添 加 到 规 则 的 过 程 然 后 这 些 新 规 则 将 对 照 数 据 进 行 验 证, 并 且 验 证 过 程 中 将 迭 代 保 存 最 符 合 条 件 和 最 有 用 的 规 则 用 户 通 常 会 对 允 许 进 入 规 则 的 前 项 的 可 能 的 数 量 给 出 一 定 限 制, 并 根 据 信 息 理 论 和 高 效 索 引 方 式 使 用 各 种 方 法 来 缩 小 原 来 可 能 很 大 的 搜 索 空 间 Copyright IBM Corporation 1994,

332 320 章 12 处 理 结 束 后, 将 给 出 最 符 合 条 件 的 规 则 的 列 表 此 组 关 联 规 则 不 能 直 接 用 于 做 出 预 测, 这 点 与 标 准 的 模 型 ( 比 如 决 策 树 或 神 经 网 络 ) 不 同 这 是 由 于 规 则 可 能 有 许 多 不 同 的 结 论 需 要 将 关 联 规 则 转 换 为 分 类 规 则 集 的 另 外 一 层 转 换 因 此, 关 联 算 法 生 成 的 关 联 规 则 被 称 作 非 精 练 模 型 虽 然 用 户 可 以 浏 览 这 些 非 精 练 模 型, 但 除 非 用 户 指 令 系 统 从 非 精 练 模 型 生 成 分 类 模 型, 否 则 无 法 明 确 地 将 这 些 模 型 用 作 分 类 模 型 用 户 可 通 过 浏 览 器 的 生 成 菜 单 选 项 来 完 成 这 种 转 换 支 持 两 种 关 联 规 则 算 法 : Apriori 节 点 从 数 据 抽 取 一 组 规 则, 即 抽 取 信 息 内 容 最 多 的 规 则 Apriori 节 点 提 供 五 种 选 择 规 则 的 方 法 并 使 用 复 杂 的 索 引 模 式 来 高 效 地 处 理 大 数 据 集 对 于 较 大 的 问 题,Apriori 训 练 的 速 度 通 常 较 快 ; 它 对 可 保 留 的 规 则 数 量 没 有 任 何 限 制, 而 且 可 处 理 最 多 带 有 32 个 前 提 条 件 的 规 则 Apriori 要 求 输 入 和 输 出 字 段 均 为 分 类 型 字 段, 但 因 为 它 专 为 处 理 此 类 型 数 据 而 进 行 优 化, 因 而 处 理 速 度 快 得 多 有 关 详 细 信 息, 请 参 阅 第 321 页 码 Apriori 节 点 序 列 节 点 可 发 现 连 续 数 据 或 与 时 间 有 关 的 数 据 中 的 关 联 规 则 序 列 是 一 系 列 可 能 会 以 可 预 测 顺 序 发 生 的 项 目 集 合 例 如, 一 个 购 买 了 剃 刀 和 须 后 水 的 顾 客 可 能 在 下 次 购 物 时 购 买 剃 须 膏 序 列 节 点 基 于 CARMA 关 联 规 则 算 法, 该 算 法 使 用 有 效 的 两 步 法 来 发 现 序 列 有 关 详 细 信 息, 请 参 阅 第 343 页 码 序 列 节 点 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据 关 联 规 则 模 型 使 用 的 数 据 可 能 是 交 易 格 式, 也 可 能 表 格 格 式, 如 下 所 述 下 面 的 内 容 是 一 般 描 述 ; 具 体 的 要 求 可 能 有 所 不 同, 请 参 见 每 种 模 型 类 型 文 档 中 的 讨 论 请 注 意, 对 模 型 进 行 评 分 时, 要 评 分 的 数 据 必 须 反 映 用 于 构 建 该 模 型 的 数 据 格 式 使 用 表 格 数 据 构 建 的 模 型 只 能 用 于 对 表 格 数 据 进 行 评 分 ; 使 用 交 易 数 据 构 建 的 模 型 只 能 对 交 易 数 据 进 行 评 分 交 易 格 式 交 易 数 据 对 于 每 个 交 易 或 项 目 具 有 一 个 单 独 的 记 录 例 如, 如 果 客 户 进 行 了 多 次 采 购, 则 每 次 采 购 都 会 有 一 个 单 独 的 记 录, 并 且 相 关 联 的 商 品 与 客 户 ID 相 链 接 这 种 格 式 有 时 称 为 行 穷 尽 格 式 客 户 采 购 1 jam 2 milk 3 jam 3 bread 4 jam 4 bread 4 milk Apriori CARMA 和 序 列 节 点 都 可 使 用 交 易 数 据

333 321 关 联 规 则 表 格 数 据 表 格 数 据 ( 也 称 为 篮 子 数 据 或 真 值 表 数 据 ) 由 单 独 的 标 志 表 示 项 目, 其 中 每 个 标 志 字 段 表 示 一 个 特 定 项 目 的 存 在 或 不 存 在 每 个 记 录 表 示 一 个 相 关 项 目 的 完 整 集 合 标 志 字 段 可 以 是 分 类 的 也 可 以 是 数 字 的, 但 某 些 模 型 具 有 更 具 体 的 要 求 客 户 Jam Bread Milk 1 T F F 2 F F T 3 T T F 4 T T T Apriori CARMA 和 序 列 节 点 都 可 使 用 表 格 数 据 Apriori 节 点 Apriori 节 点 会 发 现 数 据 中 的 关 联 规 则 Apriori 提 供 了 五 种 用 来 选 择 规 则 的 方 法, 它 使 用 一 种 复 杂 的 指 数 模 式 来 有 效 处 理 大 型 数 据 集 要 求 要 创 建 Apriori 规 则 集, 您 需 要 一 个 或 多 个 输 入 字 段 和 一 个 或 多 ö 目 标 字 段 输 入 字 段 和 输 出 字 段 ( 角 色 为 输 入 目 标 或 两 者 的 字 段 ) 必 须 是 符 号 型 字 段 角 色 为 无 的 字 段 将 被 忽 略 执 行 节 点 之 前 字 段 类 型 必 须 完 全 实 例 化 数 据 可 以 是 表 格 格 式, 也 可 以 是 事 务 格 式 有 关 详 细 信 息, 请 参 阅 第 320 页 码 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据 强 度 对 于 较 大 的 问 题,Apriori 训 练 的 速 度 通 常 处 理 速 度 快 它 对 于 可 以 包 含 的 规 则 数 也 没 有 任 何 限 制, 可 以 处 理 最 多 带 有 32 个 预 条 件 的 规 则 Apriori 提 供 了 五 种 不 同 的 训 练 方 法, 因 此 将 数 据 挖 掘 方 法 与 当 前 问 题 相 匹 配 时 可 以 实 现 更 强 的 灵 活 性

334 322 章 12 Apriori 节 点 模 型 选 项 图 片 12-2 Apriori 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 最 低 条 件 支 持 度 您 可 以 指 定 在 规 则 集 中 保 留 规 则 的 支 持 度 标 准 支 持 度 指 的 是 训 练 数 据 中 条 件 ( 规 则 中 的 if 部 分 ) 为 真 的 记 录 的 百 分 比 ( 请 注 意, 此 支 持 度 定 义 与 CARMA 和 序 列 节 点 中 使 用 的 定 义 不 同 有 关 详 细 信 息, 请 参 阅 第 346 页 码 序 列 节 点 模 型 选 项 ) 如 果 您 获 得 的 规 则 适 用 于 非 常 小 的 数 据 子 集, 请 尝 试 增 加 此 设 置 注 意 :Apriori 的 支 持 度 定 义 基 于 带 有 条 件 的 记 录 的 数 量 这 与 CARMA 和 序 列 算 法 不 同, 对 于 这 两 种 算 法, 支 持 度 定 义 基 于 具 有 规 则 中 所 有 项 ( 即 条 件 和 结 果 ) 的 记 录 的 数 量 关 联 模 型 的 结 果 显 示 ( 条 件 ) 支 持 度 和 规 则 支 持 度 两 个 测 量 最 小 规 则 置 信 度 您 还 可 以 指 定 置 信 度 标 准 置 信 度 基 于 其 规 则 条 件 为 真 的 记 录, 指 的 是 其 结 果 也 为 真 的 那 些 记 录 的 百 分 比 换 句 话 说, 置 信 度 是 基 于 规 则 的 正 确 预 测 的 百 分 比 置 信 度 低 于 指 定 标 准 的 规 则 将 被 放 弃 如 果 您 获 得 的 规 则 太 多, 请 尝 试 增 加 此 设 置 如 果 您 获 得 的 规 则 太 少 ( 甚 至 根 本 无 法 获 得 规 则 ), 请 尝 试 降 低 此 设 置 最 大 条 件 数 您 可 以 为 任 何 规 则 指 定 最 大 预 条 件 数 这 是 一 种 用 来 限 制 规 则 复 杂 性 的 方 式 如 果 规 则 太 复 杂 或 者 太 具 体, 请 尝 试 降 低 此 设 置 此 设 置 对 于 训 练 时 间 也 具 有 很 大 的 影 响 如 果 规 则 集 训 练 所 需 的 时 间 过 长, 请 尝 试 降 低 此 设 置 只 显 示 值 为 真 的 标 志 变 量 如 果 对 于 表 格 ( 数 据 表 ) 格 式 的 数 据 选 择 了 此 选 项, 则 在 生 成 的 规 则 中 只 会 包 括 真 值 这 样 可 能 有 助 于 使 得 规 则 更 容 易 理 解 该 选 项 不 适 用 于 事 务 格 式 的 数 据 有 关 详 细 信 息, 请 参 阅 第 320 页 码 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据 优 化 根 据 您 的 具 体 需 求, 选 择 为 了 提 高 建 模 性 能 而 设 计 的 选 项

335 323 关 联 规 则 选 择 速 度 可 指 示 算 法 从 不 使 用 磁 盘 溢 出, 以 便 提 高 性 能 选 择 内 存 可 指 示 算 法 在 合 适 的 时 候, 以 牺 牲 某 些 速 度 为 代 价 使 用 磁 盘 溢 出 此 选 项 默 认 为 选 中 状 态 注 意 : 以 分 布 式 模 式 运 行 时, 此 设 置 可 能 会 被 options.cfg 中 指 定 的 管 理 员 选 项 覆 盖 有 关 更 多 信 息, 请 参 阅 IBM SPSS Modeler Server 管 理 员 指 南 Apriori 节 点 专 家 选 项 对 于 那 些 详 细 了 解 Apriori 操 作 的 人 员 来 说, 通 过 下 列 专 家 选 项 可 以 对 归 纳 过 程 进 行 微 调 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家 图 片 12-3 Apriori 专 家 选 项 评 估 尺 度 Apriori 支 持 五 种 用 来 评 估 潜 在 规 则 的 方 法 规 则 置 信 度 该 默 认 方 法 使 用 规 则 置 信 度 ( 或 准 确 性 ) 来 评 估 规 则 对 于 此 评 估 尺 度, 评 估 尺 度 下 限 为 禁 用 状 态, 因 为 此 选 项 对 于 模 型 选 项 卡 上 的 最 小 规 则 置 信 度 选 项 来 说 是 多 余 的 有 关 详 细 信 息, 请 参 阅 第 322 页 码 Apriori 节 点 模 型 选 项 置 信 度 差 ( 也 称 为 与 先 验 相 比 的 绝 对 置 信 度 差 ) 此 评 估 尺 度 是 规 则 的 置 信 度 与 其 先 验 置 信 度 之 间 的 绝 对 差 此 选 项 会 防 止 出 现 偏 差, 即 结 果 分 布 不 均 匀 因 此 有 助 于 防 止 保 留 很 明 显 的 规 则 例 如, 可 能 会 出 现 这 样 的 情 况,80% 的 客 户 会 购 买 您 最 受 欢 迎 的 产 品 某 个 以 85% 的 准 确 性 预 测 购 买 该 受 欢 迎 产 品 的 规 则 不 会 使 您 的 了 解 加 深, 尽 管 85% 的 准 确 性 对 于 绝 对 尺 度 来 说 似 乎 已 经 相 当 好 了 请 将 该 评 估 尺 度 下 限 设 置 为 您 希 望 保 留 的 规 则 的 置 信 度 最 小 差 置 信 度 比 率 ( 也 称 为 置 信 度 商 数 与 1 之 间 的 差 ) 此 评 估 尺 度 为 1 减 去 规 则 置 信 度 与 先 验 置 信 度 之 间 的 比 ( 如 果 该 比 率 大 于 一, 则 减 去 其 倒 数 ) 与 置 信 度 差 相 似, 此 方 法 会 考 虑 不 均 匀 分 布 此 方 法 尤 其 适 用 于 找 出 预 测 不 常 发 生 事 件 的 规 则 例 如, 假 设 有 一 种 非 常 少 见 的 医 疗 情 况 只 在 1% 的 病 人 中 出 现 如 果 一 个 规 则 能 有

336 324 章 12 CARMA 节 点 10% 的 机 会 预 测 出 这 种 医 疗 情 况, 那 么 它 与 随 机 猜 测 相 比 就 是 一 种 很 大 的 提 高, 尽 管 从 绝 对 尺 度 角 度 来 看,10% 的 准 确 性 好 像 非 常 不 起 眼 请 将 该 评 估 尺 度 下 限 设 置 为 您 希 望 保 留 的 规 则 的 最 小 差 信 息 差 ( 也 称 为 与 先 验 的 信 息 差 ) 此 评 估 尺 度 基 于 信 息 收 益 测 量 如 果 某 个 特 定 结 果 的 概 率 被 视 为 一 个 逻 辑 值 ( 一 个 数 位 ), 则 信 息 收 益 为 基 于 条 件 可 以 确 定 的 该 数 位 的 比 例 信 息 差 是 给 定 条 件 的 情 况 下 信 息 收 益 与 只 给 定 了 结 果 的 先 验 置 信 度 的 情 况 下 信 息 收 益 之 间 的 差 此 方 法 的 一 个 重 要 特 征 在 于, 它 考 虑 了 支 持 度, 因 此 对 于 给 定 水 平 的 置 信 度, 它 倾 向 于 覆 盖 更 多 记 录 的 规 则 请 将 该 评 估 尺 度 下 限 设 置 为 您 希 望 保 留 的 规 则 的 信 息 差 注 意 : 因 为 此 评 估 尺 度 的 尺 度 与 其 他 尺 度 相 比 在 某 种 程 度 上 直 观 性 较 差, 所 以 您 可 能 需 要 试 验 各 种 下 限 才 能 获 得 满 意 的 规 则 集 标 准 化 卡 方 ( 也 称 为 标 准 化 卡 方 评 估 尺 度 ) 此 评 估 尺 度 是 条 件 与 结 果 之 间 关 联 的 一 个 统 计 学 指 数 此 评 估 尺 度 进 行 了 标 准 化, 采 用 0 和 1 之 间 的 值 此 测 量 尺 度 甚 至 比 信 息 差 评 估 尺 度 更 依 赖 于 支 持 度 请 将 该 评 估 尺 度 下 限 设 置 为 您 希 望 保 留 的 规 则 的 信 息 差 注 意 : 与 信 息 差 评 估 尺 度 相 同, 此 评 估 尺 度 的 尺 度 与 其 他 尺 度 相 比 在 某 种 程 度 上 直 观 性 较 差, 所 以 您 可 能 需 要 试 验 各 种 下 限 才 能 获 得 满 意 的 规 则 集 允 许 没 有 条 件 的 规 则 选 择 此 选 项 可 允 许 规 则 只 包 括 结 果 ( 项 目 或 项 目 集 合 ) 如 果 您 对 确 定 常 见 项 目 或 项 目 集 合 感 兴 趣, 则 此 选 项 非 常 有 用 例 如,cannedveg 是 一 个 没 有 条 件 的 单 项 规 则, 它 表 明 采 购 cannedveg 在 数 据 中 经 常 出 现 在 某 些 情 况 下, 如 果 您 只 对 最 可 信 的 预 测 感 兴 趣, 则 可 能 希 望 包 括 这 样 的 规 则 此 选 项 默 认 为 关 闭 状 态 按 照 惯 例, 没 有 条 件 的 规 则 的 条 件 支 持 度 表 示 为 100%, 规 则 支 持 度 与 置 信 度 相 同 CARMA 节 点 使 用 关 联 规 则 发 现 算 法 来 发 现 数 据 中 的 关 联 规 则 关 联 规 则 是 下 列 形 式 的 语 句 : 如 果 条 件 则 结 果 例 如, 如 果 某 个 Web 客 户 购 买 了 无 限 网 卡 和 高 端 无 线 路 由 器, 那 么 该 客 户 还 可 能 购 买 无 线 音 乐 播 放 器 ( 如 果 提 供 该 产 品 的 话 ) CARMA 模 型 在 不 要 求 用 户 指 定 输 入 或 目 标 字 段 的 情 况 下 从 数 据 抽 取 一 组 规 则 这 就 意 味 着 生 成 的 规 则 可 用 于 很 多 种 应 用 例 如, 您 可 以 使 用 此 节 点 生 成 的 规 则 来 查 找 一 系 列 产 品 或 服 务 ( 条 件 ), 其 结 果 是 您 要 在 此 假 期 内 进 行 促 销 的 项 目 使 用 IBM SPSS Modeler, 您 可 以 确 定 哪 些 客 户 购 买 了 这 些 条 件 产 品, 然 后 举 办 一 个 旨 在 促 销 这 些 结 果 产 品 的 营 销 活 动 要 求 与 Apriori 不 同,CARMA 节 点 不 需 要 输 入 字 段 或 目 标 字 段 这 是 该 算 法 工 作 方 式 的 重 要 组 成 部 分, 相 当 于 在 将 所 有 字 段 设 置 为 双 向 的 情 况 下 构 建 Apriori 模 型 您 可 以 在 构 建 了 模 型 之 后 过 滤 该 模 型, 从 而 限 制 哪 些 项 目 仅 列 为 条 件 或 结 果 例 如, 您 可 以 使 用 模 型 浏 览 器 来 查 找 一 系 列 产 品 或 服 务 ( 条 件 ), 其 结 果 是 您 要 在 此 假 期 内 进 行 促 销 的 项 目 要 创 建 CARMA 规 则 集, 您 需 要 指 定 一 个 ID 字 段 以 及 一 个 或 多 个 内 容 字 段 该 ID 字 段 可 以 是 任 意 角 色 或 测 量 级 别 角 色 为 无 的 字 段 将 被 忽 略 执 行 节 点 之 前 字 段 类 型 必 须 完 全 实 例 化 与 Apriori 相 似, 数 据 可 以 是 表 格 格 式, 也 可 以 是 事 务 格 式 有 关 详 细 信 息, 请 参 阅 第 320 页 码 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据

337 325 关 联 规 则 强 度 CARMA 节 点 基 于 CARMA 关 联 规 则 算 法 与 Apriori 不 同,CARMA 节 点 为 规 则 支 持 度 ( 条 件 和 结 果 的 支 持 度 ) 提 供 构 建 设 置, 而 不 仅 为 条 件 支 持 度 提 供 构 建 设 置 CARMA 还 允 许 带 有 多 个 结 果 的 规 则 与 Apriori 相 似,CARMA 节 点 生 成 的 模 型 可 以 插 入 到 数 据 流 中 用 来 创 建 预 测 有 关 详 细 信 息, 请 参 阅 第 38 页 码 第 3 章 中 的 模 型 块 CARMA 节 点 字 段 选 项 执 行 CARMA 节 点 之 前, 必 须 在 CARMA 节 点 的 字 段 选 项 卡 上 指 定 输 入 字 段 虽 然 大 多 数 建 模 节 点 的 字 段 选 项 卡 选 项 都 相 同, 但 CARMA 节 点 有 几 个 独 特 的 选 项 所 有 选 项 均 在 下 面 讨 论 图 片 12-4 CARMA 节 点 字 段 选 项 使 用 类 型 节 点 设 置 此 选 项 通 知 节 点 使 用 上 游 类 型 节 点 中 的 字 段 信 息 这 是 默 认 值 使 用 自 定 义 设 置 该 选 项 通 知 节 点 使 用 在 此 处 指 定 的 字 段 信 息, 而 不 是 在 任 何 上 游 类 型 节 点 中 给 出 的 字 段 信 息 选 择 了 此 选 项 之 后, 请 根 据 您 要 读 取 事 务 格 式 的 数 据 还 是 表 格 格 式 的 数 据 来 指 定 下 面 的 字 段 使 用 交 易 格 式 此 选 项 将 根 据 您 的 数 据 是 交 易 格 式 还 是 表 格 格 式 来 更 改 此 对 话 框 中 的 其 他 字 段 控 件 如 果 您 使 用 带 有 事 务 处 理 格 式 的 数 据 的 多 个 字 段, 则 认 为 在 某 个 特 定 记 录 中, 这 些 字 段 中 指 定 的 项 目 表 示 着 可 以 在 一 个 带 有 时 间 戳 的 事 务 中 找 到 的 项 目 有 关 详 细 信 息, 请 参 阅 第 320 页 码 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据

338 326 章 12 表 格 数 据 如 果 未 选 中 使 用 事 务 格 式, 则 显 示 以 下 字 段 输 入 选 择 输 入 字 段 或 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 输 入 类 似 分 区 该 字 段 允 许 您 使 用 指 定 字 段 将 数 据 分 割 为 几 个 不 同 的 样 本, 分 别 用 于 模 型 构 建 过 程 中 的 训 练 测 试 和 验 证 阶 段 通 过 用 某 个 样 本 生 成 模 型 并 用 另 一 个 样 本 对 模 型 进 行 测 试, 您 可 以 预 判 出 此 模 型 对 类 似 于 当 前 数 据 的 大 型 数 据 集 的 拟 合 优 劣 如 果 已 使 用 类 型 或 分 区 节 点 定 义 了 多 个 分 区 字 段, 则 必 须 在 每 个 用 于 分 区 的 建 模 节 点 的 字 段 选 项 卡 中 选 择 一 个 分 区 字 段 ( 如 果 仅 有 一 个 分 区 字 段, 则 将 在 启 用 分 区 后 自 动 引 入 此 字 段 ) 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 同 时 请 注 意, 要 在 分 析 时 应 用 选 定 分 区, 同 样 必 须 启 用 节 点 模 型 选 项 选 项 卡 中 的 分 区 功 能 ( 取 消 此 选 项, 则 可 以 在 不 更 改 字 段 设 置 的 条 件 下 禁 用 分 区 功 能 ) 交 易 数 据 如 果 选 中 了 使 用 事 务 格 式, 则 显 示 以 下 字 段 ID 对 于 事 务 处 理 格 式 的 数 据, 请 从 列 表 中 选 择 ID 字 段 数 字 字 段 或 符 号 字 段 可 用 作 ID 字 段 此 字 段 的 每 个 唯 一 值 都 应 该 表 明 一 个 特 定 的 分 析 单 元 例 如, 在 市 场 购 物 篮 的 应 用 中, 每 个 ID 可 能 表 示 一 个 客 户 对 于 Web 日 志 分 析 应 用, 每 个 ID 可 能 代 表 一 个 计 算 机 ( 以 IP 地 址 表 示 ) 或 一 个 用 户 ( 以 登 录 数 据 表 示 ) ID 是 连 续 的 ( 仅 Apriori 和 CARMA 节 点 ) 如 果 您 的 数 据 进 行 了 预 先 排 序, 以 便 所 有 ID 相 同 的 记 录 在 数 据 流 中 分 组 在 一 起, 那 么 选 择 此 选 项 可 以 加 快 处 理 速 度 如 果 您 的 数 据 未 经 预 先 排 序 ( 或 者 您 不 确 定 ), 请 将 此 选 项 保 持 未 选 中 状 态, 则 该 节 点 将 自 动 对 数 据 进 行 排 序 注 意 : 如 果 您 的 数 据 未 经 排 序 而 您 选 择 了 此 选 项, 则 可 能 会 在 模 型 中 得 到 无 效 结 果 内 容 指 定 模 型 的 内 容 字 段 这 些 字 段 包 含 与 关 联 建 模 有 关 的 项 目 您 可 以 指 定 多 个 标 志 字 段 ( 如 果 数 据 为 表 格 格 式 ) 或 者 一 个 名 义 字 段 ( 如 果 数 据 为 事 务 格 式 )

339 327 关 联 规 则 CARMA 节 点 模 型 选 项 图 片 12-5 CARMA 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 最 低 规 则 支 持 度 (%) 您 还 可 以 指 定 支 持 度 标 准 规 则 支 持 度 指 的 是 训 练 数 据 中 包 含 整 个 规 则 的 ID 的 比 例 ( 请 注 意, 此 支 持 度 定 义 与 Apriori 节 点 中 使 用 的 条 件 支 持 度 不 同 ) 如 果 您 要 关 注 更 常 见 的 规 则, 请 增 加 此 设 置 最 低 规 则 置 信 度 (%) 您 可 以 指 定 在 规 则 集 中 保 留 规 则 的 置 信 度 标 准 置 信 度 指 的 是 得 到 正 确 预 测 的 ID 在 所 有 使 用 规 则 进 行 预 测 的 ID 中 所 占 的 百 分 比 基 于 训 练 数 据, 该 百 分 比 的 计 算 如 下 : 包 含 整 个 规 则 的 ID 数 量 除 以 其 中 包 含 条 件 的 ID 数 量 置 信 度 低 于 指 定 标 准 的 规 则 将 被 放 弃 如 果 您 获 得 的 规 则 无 关 或 者 太 多, 请 尝 试 增 加 此 设 置 如 果 您 获 得 的 规 则 太 少, 请 尝 试 降 低 此 设 置 最 大 规 则 大 小 您 可 以 设 置 规 则 中 不 同 项 目 集 合 ( 与 项 目 不 同 ) 的 最 大 数 量 如 果 相 关 规 则 相 对 较 短, 则 可 以 降 低 此 设 置, 以 加 快 规 则 集 构 建 速 度 CARMA 节 点 专 家 选 项 对 于 那 些 详 细 了 解 Apriori 操 作 的 人 员 来 说, 通 过 下 列 专 家 选 项 可 以 对 建 模 过 程 进 行 微 调 要 访 问 专 家 选 项, 请 将 专 家 选 项 卡 上 的 模 式 设 置 为 专 家

340 328 章 12 图 片 12-6 CARMA 节 点 专 家 选 项 排 除 具 有 多 结 果 的 规 则 选 择 该 选 项 可 排 除 双 头 结 果, 即 包 含 两 个 项 目 的 结 果 例 如, 规 则 bread & cheese & fish -> wine&fruit 包 含 一 个 双 头 结 果, 即 wine&fruit 默 认 情 况 下, 这 样 的 规 则 包 括 在 内 设 置 修 剪 值 为 了 节 省 内 存, 使 用 的 CARMA 算 法 在 处 理 期 间 会 从 其 潜 在 项 目 集 合 列 表 中 定 期 删 除 ( 修 剪 ) 不 频 繁 的 项 目 集 合 选 择 此 选 项 可 调 整 修 剪 频 率, 您 指 定 的 数 字 将 决 定 修 剪 频 率 输 入 较 小 的 值 可 降 低 该 算 法 的 内 存 要 求 ( 但 可 能 会 延 长 所 需 的 训 练 时 间 ), 输 入 较 大 的 值 会 加 快 训 练 速 度 ( 但 可 能 会 提 高 内 存 要 求 ) 默 认 值 为 500 改 变 支 持 度 选 择 该 选 项 会 排 除 因 为 纳 入 不 平 均 而 好 像 表 现 为 非 常 频 繁 的 不 频 繁 项 目 集 合, 从 而 提 高 效 率 这 是 通 过 这 样 的 方 式 实 现 的 : 首 先 从 较 高 的 支 持 度 水 平 开 始, 然 后 逐 渐 下 降 到 模 型 选 项 卡 上 指 定 的 水 平 对 于 事 务 的 估 计 数 量 输 入 一 个 值 可 指 定 支 持 度 水 平 应 采 用 的 下 降 速 度 允 许 没 有 条 件 的 规 则 选 择 此 选 项 可 允 许 规 则 只 包 括 结 果 ( 项 目 或 项 目 集 合 ) 如 果 您 对 确 定 常 见 项 目 或 项 目 集 合 感 兴 趣, 则 此 选 项 非 常 有 用 例 如,cannedveg 是 一 个 没 有 条 件 的 单 项 规 则, 它 表 明 采 购 cannedveg 在 数 据 中 经 常 出 现 在 某 些 情 况 下, 如 果 您 只 对 最 可 信 的 预 测 感 兴 趣, 则 可 能 希 望 包 括 这 样 的 规 则 此 选 项 默 认 为 不 选 中 状 态 关 联 规 则 模 型 块 关 联 规 则 模 型 块 代 表 由 下 列 关 联 规 则 建 模 节 点 之 一 所 发 现 的 规 则 :

341 329 关 联 规 则 Apriori CARMA 模 型 块 包 含 建 模 期 间 从 数 据 提 取 的 规 则 的 相 关 信 息 查 看 结 果 您 可 以 使 用 该 对 话 框 上 的 模 型 选 项 卡 浏 览 关 联 模 型 (Apriori 和 CARMA) 以 及 序 列 模 型 生 成 的 规 则 在 生 成 新 节 点 或 对 模 型 评 分 之 前 浏 览 模 型 块 会 使 您 看 到 规 则 的 相 关 信 息, 还 会 提 供 用 于 过 滤 结 果 和 对 结 果 进 行 排 序 的 选 项 模 型 评 分 精 炼 模 型 块 (Apriori CARMA 和 序 列 ) 可 以 添 加 到 流 中, 用 于 进 行 评 分 有 关 详 细 信 息, 请 参 阅 第 57 页 码 第 3 章 中 的 使 用 流 中 的 模 型 块 用 于 评 分 的 模 型 块 在 其 各 自 的 对 话 框 中 包 括 一 个 额 外 的 设 置 选 项 卡 有 关 详 细 信 息, 请 参 阅 第 335 页 码 关 联 规 则 模 型 块 设 置 非 精 练 模 型 块 无 法 以 其 原 始 格 式 进 行 评 分 而 您 可 以 生 成 一 个 规 则 集, 并 将 该 规 则 集 用 于 评 分 有 关 详 细 信 息, 请 参 阅 第 338 页 码 从 关 联 模 型 块 生 成 规 则 集 关 联 规 则 模 型 块 详 细 信 息 在 关 联 规 则 模 型 块 的 模 型 选 项 卡 上, 您 可 以 看 到 一 个 表, 其 中 包 含 了 该 算 法 提 取 的 规 则 表 中 的 每 行 都 代 表 一 个 规 则 第 一 列 代 表 结 果 ( 规 则 的 then 部 分 ), 而 下 一 列 代 表 条 件 ( 规 则 的 if 部 分 ) 后 面 的 列 包 含 规 则 信 息, 如 置 信 度 支 持 度 和 提 升

342 330 章 12 图 片 12-7 关 联 规 则 模 型 块 模 型 选 项 卡 关 联 规 则 通 常 以 下 列 格 式 显 示 : 结 果 Drug = drugy 条 件 Sex = F BP = HIGH 该 示 例 规 则 的 解 释 为 如 果 Sex = F and BP = HIGH, 则 Drug 很 可 能 为 drugy; 或 者 以 另 一 种 方 式 解 释 对 于 Sex = F and BP = HIGH 的 记 录,Drug 很 可 能 为 drugy 使 用 对 话 框 工 具 栏, 可 以 选 择 显 示 其 他 信 息, 如 置 信 度 支 持 度 和 实 例 数 排 序 菜 单 工 具 栏 上 的 排 序 菜 单 按 钮 控 制 着 规 则 的 排 序 排 序 的 方 向 ( 升 序 或 降 序 ) 可 以 使 用 排 序 方 向 按 钮 ( 上 箭 头 或 下 箭 头 ) 进 行 更 改 图 片 12-8 用 于 排 序 的 工 具 栏 选 项 您 可 以 按 照 下 列 条 件 对 规 则 进 行 排 序 : 支 持 度 置 信 度

343 331 关 联 规 则 规 则 支 持 结 果 Lift 部 署 能 力 显 示 / 隐 藏 菜 单 显 示 / 隐 藏 菜 单 ( 标 准 工 具 栏 按 钮 ) 控 制 着 规 则 的 显 示 选 项 图 片 12-9 显 示 / 隐 藏 按 钮 可 用 的 显 示 选 项 如 下 : 规 则 ID 显 示 建 模 期 间 指 定 的 规 则 ID 通 过 规 则 ID, 可 以 标 识 哪 些 规 则 要 应 用 于 某 个 给 定 的 预 测 通 过 规 则 ID, 还 可 以 在 以 后 合 并 附 加 的 规 则 信 息, 如 部 署 能 力 产 品 信 息 或 条 件 实 例 数 显 示 规 则 所 适 用 的 唯 一 ID( 即 条 件 为 真 的 ID) 数 量 的 相 关 信 息 例 如, 假 设 规 则 为 bread -> cheese, 训 练 数 据 中 包 含 条 件 bread 的 记 录 数 量 称 为 实 例 数 支 持 度 显 示 条 件 支 持 度 即 其 条 件 为 真 的 ID 在 训 练 数 据 中 的 比 例 例 如, 如 果 50% 的 训 练 数 据 包 括 bread( 面 包 ) 的 购 买, 那 么 规 则 bread -> cheese 的 条 件 支 持 度 为 50% 注 意 : 此 处 定 义 的 支 持 度 与 实 例 数 相 同, 但 以 百 分 比 的 形 式 表 示 置 信 度 显 示 规 则 支 持 度 与 条 件 支 持 度 的 比 此 比 值 表 明 了 带 有 指 定 条 件 并 且 其 结 果 也 为 真 的 ID 的 比 例 例 如, 如 果 50% 的 训 练 数 据 包 含 bread( 面 包 )( 表 明 条 件 支 持 度 ), 但 只 有 20% 既 包 含 bread( 面 包 ) 又 包 含 cheese( 奶 酪 )( 表 明 规 则 支 持 度 ), 则 规 则 bread -> cheese 的 置 信 度 为 Rule Support / Antecedent Support, 在 这 里 为 40% 规 则 支 持 度 显 示 其 中 整 个 规 则 条 件 和 结 果 均 为 真 的 ID 的 比 例 例 如, 如 果 20% 的 训 练 数 据 既 包 含 bread( 面 包 ) 又 包 含 cheese( 奶 酪 ), 那 么 规 则 bread -> cheese 的 规 则 支 持 度 为 20% 提 升 显 示 规 则 置 信 度 与 具 有 结 果 的 先 验 概 率 的 比 例 如, 如 果 整 个 人 口 统 计 中 10% 购 买 了 bread( 面 包 ), 那 么 预 测 人 们 是 否 购 买 bread( 面 包 ) 置 信 度 为 20% 的 规 则 具 有 的 提 升 将 为 20/10 = 2 如 果 另 一 个 规 则 告 诉 您 人 们 将 购 买 bread ( 面 包 ), 并 且 置 信 度 为 11%, 则 该 规 则 的 提 升 接 近 1, 这 就 意 味 着 具 有 条 件 对 于 具 有 结 果 的 概 率 不 会 造 成 太 大 的 影 响 总 之, 提 升 不 为 1 的 规 则 比 提 升 接 近 1 的 规 则 的 相 关 性 更 强 部 署 能 力 是 一 个 有 关 训 练 数 据 中 满 足 了 条 件 而 未 满 足 结 果 的 百 分 比 的 度 量 在 产 品 购 买 领 域, 它 的 意 思 大 致 为 : 总 的 客 户 群 中 有 多 少 百 分 比 拥 有 了 ( 或 已 经 购 买 了 ) 条 件, 但 尚 未 购 买 结 果 部 署 能 力 统 计 量 定 义 为 ((Antecedent Support in # of Records - Rule Support in # of Records) / Number of Records) * 100, 其 中 Antecedent Support( 条 件 支 持 度 ) 表 示 其 条 件 为 真 的 记 录 数,Rule Support( 规 则 支 持 度 ) 表 示 条 件 和 结 果 都 为 真 的 记 录 数 过 滤 按 钮 菜 单 上 的 过 滤 器 按 钮 ( 漏 斗 图 标 ) 会 扩 展 对 话 框 的 底 部, 从 而 显 示 一 个 面 板, 其 中 将 显 示 活 动 的 规 则 过 滤 器 过 滤 器 用 于 减 少 模 型 选 项 卡 上 显 示 的 规 则 数 量

344 332 章 12 图 片 过 滤 按 钮 要 创 建 过 滤 器, 请 单 击 位 于 扩 展 面 板 右 侧 的 过 滤 器 图 标 这 样 将 打 开 一 个 单 独 的 对 话 框, 您 可 以 在 其 中 指 定 用 于 显 示 规 则 的 约 束 条 件 请 注 意, 过 滤 器 按 钮 通 常 与 生 成 菜 单 一 起 使 用, 以 便 首 先 过 滤 规 则, 然 后 生 成 一 个 包 含 部 分 规 则 的 模 型 有 关 详 细 信 息, 请 参 阅 下 面 的 为 规 则 指 定 过 滤 器 查 找 规 则 按 钮 通 过 查 找 规 则 按 钮 ( 望 远 镜 图 标 ), 可 以 搜 索 为 某 个 指 定 的 规 则 ID 显 示 的 规 则 相 邻 的 显 示 框 表 明 可 用 数 量 中 当 前 显 示 的 规 则 数 量 规 则 ID 由 模 型 按 照 发 现 时 间 的 顺 序 指 定, 并 且 会 在 评 分 期 间 添 加 到 数 据 中 图 片 查 找 规 则 按 钮 要 对 规 则 ID 重 新 排 序 : E 您 可 以 在 IBM SPSS Modeler 中 对 规 则 ID 进 行 重 新 排 序, 方 法 是, 首 先 根 据 所 需 的 测 量 标 准 ( 如 置 信 度 或 提 升 ) 对 规 则 显 示 表 进 行 排 序 E 然 后 使 用 生 成 菜 单 中 的 选 项, 创 建 一 个 经 过 过 滤 的 模 型 E 在 已 过 滤 的 模 型 对 话 框 中, 选 择 重 新 进 行 连 续 编 号 的 起 始 号 码, 然 后 指 定 一 个 开 始 号 码 有 关 详 细 信 息, 请 参 阅 第 339 页 码 生 成 已 过 滤 的 模 型 为 规 则 指 定 过 滤 器 默 认 情 况 下, 规 则 算 法 ( 如 Apriori CARMA 和 序 列 ) 可 能 会 生 成 非 常 大 量 的 规 则 为 了 在 浏 览 时 增 强 明 确 度, 或 者 为 了 简 化 规 则 评 分, 您 应 该 考 虑 过 滤 规 则, 以 便 更 加 显 著 地 显 示 相 关 的 结 果 和 条 件 使 用 规 则 浏 览 器 模 型 选 项 卡 上 的 过 滤 选 项, 可 以 打 开 一 个 用 于 指 定 过 滤 条 件 的 对 话 框

345 333 关 联 规 则 图 片 规 则 浏 览 器 过 滤 器 对 话 框 结 果 选 择 启 用 过 滤 器 可 激 活 基 于 包 括 还 是 排 除 指 定 结 果 的 过 滤 规 则 的 选 项 选 择 包 括 任 意 可 创 建 一 个 过 滤 器, 该 过 滤 器 中 的 规 则 至 少 包 含 一 个 指 定 结 果 另 外, 选 择 排 除 可 创 建 一 个 排 除 指 定 结 果 的 过 滤 器 您 可 以 使 用 列 表 框 右 侧 的 选 取 器 图 标 选 择 结 果 这 样 将 打 开 一 个 对 话 框, 其 中 列 出 生 成 的 规 则 中 包 含 的 所 有 结 果 注 意 : 结 果 可 能 包 含 多 个 项 目 过 滤 器 只 会 检 查 结 果 是 否 包 含 一 个 指 定 项 目 条 件 选 择 启 用 过 滤 器 可 激 活 基 于 包 括 还 是 排 除 指 定 条 件 的 过 滤 规 则 的 选 项 您 可 以 使 用 列 表 框 右 侧 的 选 取 器 图 标 选 择 项 目 这 样 将 打 开 一 个 对 话 框, 其 中 列 出 生 成 的 规 则 中 包 含 的 所 有 条 件 选 择 包 括 所 有 可 将 过 滤 器 设 置 为 一 个 包 含 过 滤 器, 其 中 的 规 则 必 须 包 括 指 定 的 所 有 条 件 选 择 包 括 任 意 可 创 建 一 个 过 滤 器, 该 过 滤 器 中 的 规 则 至 少 包 含 一 个 指 定 条 件 选 择 排 除 可 创 建 一 个 排 除 包 含 指 定 条 件 的 规 则 的 过 滤 器 置 信 度 选 择 启 用 过 滤 器 可 激 活 基 于 规 则 的 置 信 水 平 过 滤 规 则 的 选 项 您 可 以 使 用 最 小 和 最 大 控 件 来 指 定 置 信 度 范 围 当 您 浏 览 生 成 的 模 型 时, 置 信 度 将 以 百 分 比 的 形 式 列 出 当 您 对 输 出 评 分 时, 置 信 度 则 表 示 为 一 个 介 于 0 和 1 之 间 的 数 字 条 件 支 持 度 选 择 启 用 过 滤 器 可 激 活 基 于 规 则 的 条 件 支 持 度 水 平 过 滤 规 则 的 选 项 条 件 支 持 度 指 的 是 训 练 数 据 中 与 当 前 规 则 包 含 相 同 条 件 的 比 例, 因 此 与 普 及 性 指 数 有 点 类 似 您 可 以 使 用 最 小 和 最 大 控 件, 根 据 支 持 度 水 平 来 指 定 过 滤 规 则 的 范 围

346 334 章 12 提 升 选 择 启 用 过 滤 器 可 激 活 基 于 规 则 的 提 升 测 量 量 过 滤 规 则 的 选 项 注 意 : 提 升 过 滤 只 可 用 于 8.5 版 本 之 后 构 建 的 关 联 模 型 或 之 前 版 本 中 包 含 提 升 测 量 量 的 模 型 序 列 模 型 不 包 含 此 选 项 单 击 确 定 可 应 用 已 在 此 对 话 框 中 启 用 的 所 有 过 滤 器 为 规 则 生 成 图 形 关 联 节 点 提 供 了 大 量 信 息, 但 对 商 业 用 户 来 说, 它 可 能 并 不 始 终 是 一 种 方 便 访 问 的 格 式 要 使 提 供 的 数 据 便 于 纳 入 商 业 报 表 和 演 示 文 稿, 您 可 生 成 所 选 数 据 的 图 形 从 模 型 选 项 卡 上, 可 以 为 选 定 规 则 生 成 图 形, 从 而 只 为 该 规 则 中 的 个 案 创 建 图 形 E 在 模 型 选 项 卡 上, 选 择 感 兴 趣 的 规 则 E 从 生 成 菜 单 中, 选 择 图 形 ( 从 选 定 内 容 ) 显 示 图 形 板 基 本 选 项 卡 图 片 图 形 板 节 点 对 话 框, 基 本 选 项 卡 注 意 : 当 您 以 此 方 式 显 示 图 形 板 时, 只 有 基 本 和 详 细 选 项 卡 可 用 有 关 详 细 信 息, 请 参 阅 第 5 章 中 的 图 形 板 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点

347 335 关 联 规 则 E 使 用 基 本 或 详 细 选 项 卡 设 置 指 定 在 图 形 上 显 示 的 详 细 信 息 E 单 击 确 定 生 成 图 形 图 片 图 形 板 节 点 对 话 框, 基 本 选 项 卡 图 形 标 题 标 识 所 包 含 的 选 定 规 则 和 条 件 详 细 信 息 关 联 规 则 模 型 块 设 置 此 设 置 选 项 卡 用 于 为 关 联 模 型 (Apriori 和 CARMA) 指 定 评 分 选 项 此 选 项 卡 仅 在 模 型 块 添 加 到 用 于 评 分 的 流 后 才 可 用 注 意 : 用 于 浏 览 非 精 炼 模 型 的 对 话 框 不 包 括 设 置 选 项 卡, 因 为 不 能 对 它 进 行 评 分 要 对 非 精 练 模 型 进 行 评 分, 您 必 须 首 先 生 成 一 个 规 则 集 有 关 详 细 信 息, 请 参 阅 第 338 页 码 从 关 联 模 型 块 生 成 规 则 集

348 336 章 12 图 片 关 联 规 则 模 型 块 设 置 选 项 卡 预 测 的 最 大 数 量 指 定 每 个 购 物 篮 项 目 集 合 包 括 的 最 大 预 测 数 此 选 项 与 下 面 的 规 则 标 准 一 起 使 用 可 生 成 最 佳 预 测, 其 中 最 佳 指 的 是 置 信 度 支 持 度 提 升 等 的 最 高 水 平, 如 下 面 的 内 容 所 述 规 则 标 准 选 择 用 于 确 定 规 则 强 度 的 测 量 规 则 按 照 此 处 选 择 的 标 准 强 度 进 行 排 序, 以 便 返 回 项 目 集 合 的 最 佳 预 测 可 用 标 准 有 : 置 信 度 支 持 度 规 则 支 持 度 ( 支 持 度 * 置 信 度 ) Lift 部 署 能 力 允 许 重 复 预 测 选 择 此 选 项 可 在 评 分 时 包 括 具 有 相 同 结 果 的 多 个 规 则 例 如, 选 择 此 选 项 可 允 许 对 下 列 规 则 进 行 评 分 : bread & cheese -> wine cheese & fruit -> wine 关 闭 此 选 项 可 在 评 分 时 排 除 重 复 的 预 测 注 意 : 带 有 多 个 结 果 的 规 则 (bread & cheese & fruit -> wine & pate) 仅 在 所 有 结 果 (wine & pate) 均 在 以 前 经 过 预 测 的 情 况 下 才 会 视 为 重 复 预 测

349 337 关 联 规 则 忽 略 不 匹 配 的 购 物 篮 项 目 选 择 此 选 项 可 忽 略 项 目 集 合 中 附 加 项 目 的 存 在 例 如, 如 果 对 于 包 含 [tent & sleeping bag & kettle] 的 购 物 篮 选 择 了 此 选 项, 规 则 tent & sleeping bag -> gas_stove 应 用 时 则 会 忽 略 该 购 物 篮 中 存 在 的 额 外 项 目 (kettle) 可 能 存 在 一 些 情 况 应 该 排 除 额 外 的 项 目 例 如, 很 可 能 出 现 这 样 的 情 况, 某 人 购 买 了 tent( 帐 篷 ) sleeping bag( 睡 袋 ) 和 kettle( 水 壶 ), 而 此 人 已 经 拥 有 了 gas stove( 燃 气 炉 ), 这 点 通 过 kettle( 水 壶 ) 的 存 在 表 明 换 句 话 说,gas stove( 燃 气 炉 ) 可 能 不 是 最 佳 预 测 这 种 情 况 下, 您 应 该 取 消 选 择 忽 略 不 匹 配 的 购 物 篮 项 目 以 确 保 规 则 条 件 与 购 物 篮 内 容 精 确 匹 配 默 认 情 况 下, 不 匹 配 的 项 目 将 被 忽 略 检 查 购 物 篮 不 存 在 预 测 值 选 择 此 选 项 可 确 保 结 果 也 不 存 在 于 购 物 篮 中 例 如, 如 果 进 行 评 分 的 目 的 是 为 了 进 行 一 项 家 具 产 品 推 荐, 那 么 已 经 包 含 餐 桌 的 购 物 篮 可 能 不 会 购 买 另 一 个 这 样 的 家 具 这 种 情 况 下, 您 应 该 选 择 此 选 项 另 一 方 面, 如 果 产 品 易 腐 烂 或 者 是 一 次 性 的 ( 如 奶 酪 婴 儿 代 乳 品 或 者 卫 生 纸 ), 那 么 其 中 结 果 已 存 在 于 购 物 篮 的 规 则 可 能 有 些 价 值 在 后 面 一 种 情 况 下, 最 有 用 的 选 项 可 能 是 下 面 的 不 检 查 购 物 篮 中 是 否 存 在 预 测 值 检 查 购 物 篮 中 存 在 预 测 值 选 择 此 选 项 可 确 保 结 果 也 存 在 于 购 物 篮 中 当 您 尝 试 深 入 了 解 现 有 的 客 户 或 事 务 时, 此 方 法 非 常 有 用 例 如, 您 可 能 希 望 确 定 提 升 最 高 的 规 则, 然 后 探 索 哪 些 客 户 符 合 这 些 规 则 不 检 查 购 物 篮 中 是 否 存 在 预 测 值 选 择 此 选 项 可 在 评 分 时 包 括 所 有 规 则, 而 不 管 购 物 篮 中 是 否 存 在 结 果 关 联 规 则 模 型 块 概 要 关 联 规 则 模 型 块 的 概 要 选 项 卡 显 示 发 现 的 规 则 数 量, 以 及 规 则 集 中 规 则 的 最 大 和 最 小 支 持 度 提 升 值 置 信 度 和 部 署 能 力

350 338 章 12 图 片 关 联 规 则 模 型 块 概 要 选 项 卡 从 关 联 模 型 块 生 成 规 则 集 图 片 生 成 规 则 集 对 话 框

351 339 关 联 规 则 关 联 模 型 块 ( 如 Apriori 和 CARMA) 可 用 于 直 接 对 数 据 评 分, 您 也 可 以 首 先 生 成 一 个 规 则 子 集, 称 为 规 则 集 当 您 对 非 精 练 模 型 进 行 操 作 时, 因 为 该 模 型 不 能 直 接 用 于 评 分, 所 以 规 则 集 尤 其 有 用 有 关 详 细 信 息, 请 参 阅 第 62 页 码 第 3 章 中 的 非 精 练 模 型 要 生 成 规 则 集, 请 从 模 型 块 浏 览 器 的 生 成 菜 单 中 选 择 规 则 集 您 可 以 指 定 下 列 选 项, 将 规 则 转 换 为 规 则 集 : 规 则 集 名 称 使 您 能 够 指 定 新 生 成 规 则 集 节 点 的 名 称 创 建 节 点 位 置 控 制 新 生 成 规 则 集 节 点 的 位 置 选 择 工 作 区 GM 选 项 板 或 两 者 目 标 字 段 确 定 哪 个 输 出 字 段 将 用 于 生 成 的 规 则 集 节 点 从 列 表 中 选 择 一 个 输 出 字 段 最 小 支 持 度 指 定 生 成 的 规 则 集 中 要 保 留 的 规 则 的 最 小 支 持 度 支 持 度 小 于 指 定 值 的 规 则 不 会 包 括 在 新 的 规 则 集 中 最 小 置 信 度 指 定 生 成 的 规 则 集 中 要 保 留 的 规 则 的 最 小 置 信 度 置 信 度 小 于 指 定 值 的 规 则 不 会 包 括 在 新 的 规 则 集 中 默 认 值 使 您 能 够 为 分 配 到 不 会 触 发 任 何 规 则 的 已 评 分 记 录 的 目 标 字 段 指 定 默 认 值 生 成 已 过 滤 的 模 型 图 片 生 成 新 模 型 对 话 框 要 从 关 联 模 型 块 ( 如 Apriori CARMA 或 序 列 规 则 集 节 点 ) 生 成 已 过 滤 的 模 型, 请 从 模 型 块 浏 览 器 的 生 成 菜 单 中 选 择 已 过 滤 的 模 型 这 样 将 创 建 一 个 子 集 模 型, 其 中 只 包 含 浏 览 器 中 当 前 显 示 的 那 些 规 则 注 意 : 不 能 为 非 精 练 模 型 生 成 已 过 滤 的 模 型 您 可 以 指 定 下 列 用 于 过 滤 规 则 的 选 项 : 新 模 型 名 称 使 您 能 够 指 定 新 的 已 过 滤 模 型 节 点 的 名 称 创 建 节 点 位 置 控 制 新 的 已 过 滤 模 型 节 点 的 位 置 选 择 工 作 区 GM 选 项 板 或 两 者 规 则 编 号 指 定 规 则 ID 在 包 括 在 已 过 滤 模 型 中 的 规 则 子 集 中 的 编 号 方 式 保 留 初 始 规 则 ID 号 选 择 此 选 项 可 保 持 原 始 的 规 则 编 号 默 认 情 况 下, 会 为 规 则 提 供 一 个 与 算 法 发 现 它 们 的 顺 序 相 对 应 的 ID 该 顺 序 可 能 会 因 所 采 用 算 法 的 不 同 而 有 所 差 别 重 新 进 行 连 续 编 号 的 起 始 号 码 选 择 此 选 项 可 为 过 滤 的 规 则 指 定 新 的 规 则 ID 新 的 ID 将 根 据 模 型 选 项 卡 上 规 则 浏 览 器 表 中 显 示 的 排 序 顺 序 进 行 指 定, 从 您 在 此 处 指 定 的 数 字 开 始 您 可 以 使 用 右 侧 的 箭 头 指 定 ID 的 开 始 号 码

352 340 章 12 关 联 规 则 评 分 通 过 关 联 规 则 模 型 块 运 行 新 数 据 生 成 的 得 分 会 返 回 到 不 同 的 字 段 中 对 于 每 个 预 测 会 添 加 三 个 新 字 段, 其 中 P 表 示 预 测,C 表 示 置 信 度,I 表 示 规 则 ID 这 些 输 出 字 段 的 排 列 取 决 于 输 入 数 据 是 事 务 格 式 还 是 表 格 格 式 请 参 阅 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据 第 320 页 码 大 致 了 解 这 些 格 式 例 如, 假 设 您 要 使 用 一 个 基 于 下 面 三 个 规 则 生 成 预 测 的 模 型 对 购 物 篮 数 据 进 行 评 分 : Rule_15 bread&wine -> meat (confidence 54%) Rule_22 cheese -> fruit (confidence 43%) Rule_5 bread&cheese -> frozveg (confidence 24%) 表 格 数 据 对 于 表 格 数 据, 这 三 个 预 测 (3 为 默 认 值 ) 会 返 回 到 一 个 记 录 中 表 12-1 表 格 格 式 的 得 分 ID Bread Wine Cheese P1 C1 I1 P2 C2 I2 P3 C3 I3 Fred meat fruit frozveg.24 5 事 务 处 理 格 式 数 据 对 于 事 务 处 理 格 式 的 数 据, 对 于 每 个 预 测 都 会 生 成 一 个 单 独 的 记 录 预 测 仍 然 会 添 加 到 单 独 的 列 中, 但 得 分 在 计 算 时 返 回 这 样 会 生 成 带 有 不 完 整 预 测 的 记 录, 如 下 面 的 示 例 输 出 所 示 第 二 个 和 第 三 个 预 测 (P2 和 P3) 在 第 一 个 记 录 中 是 空 值, 同 时 还 会 显 示 相 关 的 置 信 度 和 规 则 ID 但 返 回 得 分 时, 最 后 一 个 记 录 将 包 含 所 有 三 个 预 测 表 12-2 事 务 处 理 格 式 的 得 分 ID 项 目 P1 C1 I1 P2 C2 I2 P3 C3 I3 Fred bread meat $null$$null$$null$$null$ $null$$null$ Fred Cheese meat fruit $null$ $null$$null$ Fred wine meat fruit frozveg 要 只 包 括 用 于 报 告 或 部 署 目 的 的 完 整 预 测, 请 使 用 选 择 节 点 选 择 完 整 的 记 录 注 意 : 为 了 明 确 起 见, 在 这 些 示 例 中 使 用 的 字 段 名 称 都 是 缩 写 在 实 际 应 用 中, 关 联 模 型 的 结 果 字 段 将 按 照 下 列 方 式 命 名 : 新 字 段 预 测 置 信 度 ( 或 其 他 标 准 ) 规 则 ID 字 段 名 示 例 $A-TRANSACTION_NUMBER-1 $AC-TRANSACTION_NUMBER-1 $A-Rule_ID-1 带 有 多 个 结 果 的 规 则 CARMA 算 法 允 许 带 有 多 个 结 果 的 规 则, 例 如 : bread -> wine&cheese 当 您 对 这 样 的 双 头 规 则 进 行 评 分 时, 预 测 将 以 下 表 显 示 的 格 式 返 回 :

353 341 关 联 规 则 表 12-3 对 包 括 带 有 多 个 结 果 预 测 的 结 果 进 行 评 分 ID Bread Wine Cheese P1 C1 I1 P2 C2 I2 P3 C3 I3 Fred meat&veg fruit frozveg.24 5 在 某 些 情 况 下, 您 可 能 需 要 在 部 署 之 前 分 割 这 样 的 得 分 要 分 割 带 有 多 个 结 果 的 预 测, 您 需 要 使 用 CLEM 字 符 串 功 能 解 析 该 字 段 有 关 详 细 信 息, 请 参 阅 第 8 章 中 的 字 符 串 函 数 中 的 IBM SPSS Modeler 14.2 用 户 指 南 部 署 关 联 模 型 对 关 联 模 型 进 行 评 分 时, 预 测 和 置 信 度 将 输 出 到 单 独 的 列 中 ( 其 中 P 表 示 预 测,C 表 示 置 信 度,I 表 示 规 则 ID) 这 种 情 况 要 区 分 输 入 数 据 是 表 格 格 式 还 是 事 务 格 式 有 关 详 细 信 息, 请 参 阅 第 340 页 码 关 联 规 则 评 分 图 片 预 测 位 于 列 中 的 表 格 得 分 准 备 得 分 进 行 部 署 时, 您 可 能 会 发 现 您 的 应 用 程 序 需 要 将 输 出 数 据 转 换 为 预 测 位 于 行 中 的 格 式, 而 不 是 位 于 列 中 的 格 式 ( 每 行 一 个 预 测, 有 时 称 为 行 穷 尽 格 式 ) 图 片 预 测 位 于 行 中 的 已 转 置 得 分 转 置 表 格 得 分 您 可 以 使 用 IBM SPSS Modeler 中 的 一 些 步 骤 将 表 格 得 分 从 列 转 置 为 行, 如 下 面 的 步 骤 所 示

354 342 章 12 图 片 用 于 将 表 格 数 据 转 置 为 行 穷 尽 格 式 的 流 示 例 E 在 导 出 节 点 中 使 函 数 可 确 定 预 测 的 当 前 顺 序, 并 将 此 指 示 保 存 在 一 个 新 字 段 中, 如 Original_order E 添 加 一 个 类 型 字 段, 确 保 所 有 字 段 均 实 例 化 E 使 用 过 滤 节 点 将 默 认 的 预 测 置 信 度 和 ID 字 段 (P1 C1 I1) 重 命 名 为 普 通 字 段, 如 Pred Crit 和 Rule_ID, 这 些 字 段 将 用 于 在 以 后 追 加 记 录 对 于 每 个 生 成 的 预 测 都 需 要 一 个 过 滤 节 点 图 片 重 命 名 预 测 2 的 字 段 时 过 滤 预 测 1 和 预 测 3 的 字 段 E 使 用 追 加 节 点 追 加 共 享 Pred Crit 和 Rule_ID 的 值

355 343 关 联 规 则 E 连 接 一 个 排 序 节 点, 以 便 按 照 字 段 Original_order 的 升 序 对 记 录 进 行 排 序, 按 照 Crit 的 降 序 对 记 录 进 行 排 序, 后 面 一 个 字 段 是 用 于 按 标 准 ( 如 置 信 度 提 升 和 支 持 度 ) 对 预 测 进 行 排 序 的 字 段 E 使 用 另 一 个 过 滤 节 点 将 字 段 Original_order 从 输 出 中 过 滤 掉 此 时, 数 据 就 可 以 进 行 部 署 了 转 置 事 务 得 分 转 置 事 务 得 分 的 过 程 与 上 面 的 过 程 相 似 例 如, 下 面 显 示 的 流 会 根 据 部 署 需 要, 将 得 分 转 置 为 每 行 一 个 预 测 的 格 式 图 片 用 于 将 事 务 处 理 格 式 的 数 据 转 置 为 行 穷 尽 格 式 的 流 示 例 除 了 添 加 两 个 选 择 节 点 之 外, 该 过 程 与 前 面 用 于 表 格 数 据 的 过 程 完 全 相 同 第 一 个 选 择 节 点 用 于 对 相 邻 记 录 的 规 则 ID 进 行 比 较, 以 便 只 包 括 唯 一 的 或 非 精 练 的 记 录 此 选 择 节 点 使 用 该 CLEM 表 达 式 选 择 记 录 : ID = undef. 第 二 个 选 择 节 点 用 于 放 弃 多 余 的 规 则, 或 者 Rule_ID 为 Null 值 的 规 则 此 选 择 节 点 使 用 下 列 CLEM 表 达 式 放 弃 记 录 : not(@null(rule_id)). 有 关 转 置 得 分 进 行 部 署 的 详 细 信 息, 请 联 系 技 术 支 持 部 门 序 列 节 点 序 列 节 点 会 发 现 连 续 数 据 或 面 向 时 间 的 数 据 中 的 模 式, 其 格 式 为 bread -> cheese 序 列 的 元 素 为 组 成 一 个 事 务 的 项 目 集 合 例 如, 如 果 某 人 进 入 商 店, 购 买 了 面 包 和 牛 奶, 几 天 之 后 返 回 了 该 商 店, 购 买 了 一 些 奶 酪, 那 么 这 个 人 的 购 买 活 动 可 以 表 示 为 两 个 项 目 集 合 第 一 个 项 目 集 合 包 含 面 包 和 牛 奶, 第 二 个 包 含 奶 酪 序 列 是 一 系 列 可 能 会 以 可 预 测 顺 序 发 生 的 项 目 集 合 序 列 节 点 会 检 测 频 繁 出 现 的 序 列, 并 创 建 一 个 可 用 于 生 成 预 测 的 生 成 模 型 节 点

356 344 章 12 要 求 要 创 建 序 列 规 则 集, 您 需 要 指 定 一 个 ID 字 段 以 及 一 个 可 选 的 时 间 字 段, 以 及 一 个 或 多 个 内 容 字 段 请 注 意, 这 些 设 置 必 须 在 建 模 节 点 的 字 段 选 项 卡 上 进 行 ; 不 能 从 上 游 类 型 节 点 中 读 取 该 ID 字 段 可 以 是 任 意 角 色 或 测 量 级 别 如 果 指 定 时 间 字 段, 则 该 字 段 可 以 是 任 意 角 色, 但 其 存 储 必 须 是 数 字 日 期 时 间 或 时 间 戳 如 果 不 指 定 时 间 字 段, 序 列 节 点 则 会 使 用 隐 含 的 时 间 戳, 实 际 上 是 使 用 行 号 作 为 时 间 值 内 容 字 段 可 具 有 任 意 测 量 级 别 和 角 色, 但 所 有 内 容 字 段 的 类 型 必 须 相 同 如 果 这 些 字 段 是 数 字 型 的, 则 必 须 为 整 数 范 围 ( 不 是 实 数 范 围 ) 强 度 序 列 节 点 基 于 CARMA 关 联 规 则 算 法, 该 算 法 使 用 一 个 有 效 的 两 次 传 递 方 法 查 找 列 另 外, 序 列 节 点 创 建 的 生 成 的 模 型 节 点 可 以 插 入 到 数 据 流 中 来 创 建 预 测 生 成 的 模 型 节 点 还 可 生 成 超 节 点 用 于 检 测 或 计 数 特 定 的 序 列, 以 及 基 于 特 定 的 序 列 作 出 预 测 序 列 节 点 字 段 选 项 图 片 序 列 节 点 字 段 选 项 执 行 序 列 节 点 之 前, 必 须 在 序 列 节 点 的 字 段 选 项 卡 上 指 定 ID 字 段 和 内 容 字 段 如 果 您 要 使 用 时 间 字 段, 也 需 要 在 此 处 指 定

357 345 关 联 规 则 ID 字 段 从 列 表 中 选 择 ID 字 段 数 字 字 段 或 符 号 字 段 可 用 作 ID 字 段 此 字 段 的 每 个 唯 一 值 都 应 该 表 明 一 个 特 定 的 分 析 单 元 例 如, 在 市 场 购 物 篮 的 应 用 中, 每 个 ID 可 能 表 示 一 个 客 户 对 于 Web 日 志 分 析 应 用, 每 个 ID 可 能 代 表 一 个 计 算 机 ( 以 IP 地 址 表 示 ) 或 一 个 用 户 ( 以 登 录 数 据 表 示 ) ID 是 连 续 的 如 果 您 的 数 据 进 行 了 预 先 排 序, 以 便 所 有 ID 相 同 的 记 录 在 数 据 流 中 分 组 在 一 起, 那 么 选 择 此 选 项 可 以 加 快 处 理 速 度 如 果 您 的 数 据 未 经 预 先 排 序 ( 或 者 您 不 确 定 ), 请 将 此 选 项 保 持 不 选 中 状 态, 序 列 节 点 将 自 动 对 该 数 据 进 行 排 序 注 意 : 如 果 您 的 数 据 未 经 排 序 而 您 选 择 了 此 选 项, 则 可 能 会 在 序 列 模 型 中 得 到 无 效 结 果 时 间 字 段 如 果 您 要 在 数 据 中 使 用 字 段 来 表 明 事 件 时 间, 请 选 择 使 用 时 间 字 段 并 指 定 要 使 用 的 字 段 时 间 字 段 必 须 是 数 字 日 期 时 间 或 时 间 戳 型 的 如 果 不 指 定 时 间 字 段, 则 假 设 记 录 按 照 从 数 据 源 出 发 的 顺 序 到 达, 记 录 号 将 用 作 时 间 值 ( 第 一 个 记 录 发 生 在 时 间 "1"; 第 二 个 记 录 发 生 在 时 间 "2"; 依 此 类 推 ) 内 容 字 段 指 定 模 型 的 内 容 字 段 这 些 字 段 包 含 与 序 列 建 模 有 关 的 事 件 序 列 节 点 可 以 处 理 表 格 格 式 的 数 据, 也 可 以 处 理 事 务 格 式 的 数 据 如 果 您 使 用 带 有 事 务 处 理 格 式 的 数 据 的 多 个 字 段, 则 认 为 在 某 个 特 定 记 录 中, 这 些 字 段 中 指 定 的 项 目 表 示 着 可 以 在 一 个 带 有 时 间 戳 的 事 务 中 找 到 的 项 目 有 关 详 细 信 息, 请 参 阅 第 320 页 码 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据 分 区 该 字 段 允 许 您 使 用 指 定 字 段 将 数 据 分 割 为 几 个 不 同 的 样 本, 分 别 用 于 模 型 构 建 过 程 中 的 训 练 测 试 和 验 证 阶 段 通 过 用 某 个 样 本 生 成 模 型 并 用 另 一 个 样 本 对 模 型 进 行 测 试, 您 可 以 预 判 出 此 模 型 对 类 似 于 当 前 数 据 的 大 型 数 据 集 的 拟 合 优 劣 如 果 已 使 用 类 型 或 分 区 节 点 定 义 了 多 个 分 区 字 段, 则 必 须 在 每 个 用 于 分 区 的 建 模 节 点 的 字 段 选 项 卡 中 选 择 一 个 分 区 字 段 ( 如 果 仅 有 一 个 分 区 字 段, 则 将 在 启 用 分 区 后 自 动 引 入 此 字 段 ) 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 同 时 请 注 意, 要 在 分 析 时 应 用 选 定 分 区, 同 样 必 须 启 用 节 点 模 型 选 项 选 项 卡 中 的 分 区 功 能 ( 取 消 此 选 项, 则 可 以 在 不 更 改 字 段 设 置 的 条 件 下 禁 用 分 区 功 能 )

358 346 章 12 序 列 节 点 模 型 选 项 图 片 序 列 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 最 低 规 则 支 持 度 (%) 您 还 可 以 指 定 支 持 度 标 准 规 则 支 持 度 指 的 是 训 练 数 据 中 包 含 整 个 序 列 的 ID 的 比 例 如 果 您 要 关 注 更 常 见 的 序 列, 请 增 加 此 设 置 最 低 规 则 置 信 度 (%) 您 可 以 指 定 在 序 列 集 中 保 留 序 列 的 置 信 度 标 准 置 信 度 指 的 是 得 到 正 确 预 测 的 ID 在 所 有 使 用 规 则 进 行 预 测 的 ID 中 所 占 的 百 分 比 基 于 训 练 数 据, 该 百 分 比 的 计 算 如 下 : 包 含 整 个 序 列 的 ID 数 量 除 以 其 中 包 含 条 件 的 ID 数 量 置 信 度 低 于 指 定 标 准 的 序 列 将 被 放 弃 如 果 您 获 得 的 序 列 太 多 或 者 不 是 非 常 相 关, 请 尝 试 增 加 此 设 置 如 果 您 获 得 的 序 列 太 少, 请 尝 试 降 低 此 设 置 最 大 序 列 容 量 您 可 以 设 置 序 列 中 不 同 项 目 集 合 ( 与 项 目 不 同 ) 的 最 大 数 量 如 果 相 关 序 列 相 对 较 短, 则 可 以 降 低 此 设 置, 以 加 快 序 列 集 构 建 速 度 要 添 加 到 流 的 预 测 指 定 生 成 的 结 果 模 型 节 点 要 添 加 到 流 中 的 预 测 数 量 有 关 详 细 信 息, 请 参 阅 第 348 页 码 序 列 模 型 块

359 347 关 联 规 则 序 列 节 点 专 家 选 项 对 于 那 些 详 细 了 解 序 列 节 点 操 作 的 人 员 来 说, 通 过 下 列 专 家 选 项 可 以 对 建 模 过 程 进 行 微 调 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家 图 片 序 列 节 点 专 家 选 项 设 置 最 大 持 续 时 间 如 果 选 择 了 此 选 项, 序 列 将 被 限 制 为 小 于 或 等 于 指 定 值 的 一 个 持 续 时 间 ( 第 一 个 项 目 集 合 和 最 后 一 个 项 目 集 合 之 间 的 时 间 ) 如 果 没 有 指 定 时 间 字 段, 该 持 续 时 间 则 以 原 始 数 据 中 的 行 数 ( 记 录 数 ) 表 示 如 果 使 用 的 时 间 字 段 为 时 间 日 期 或 时 间 戳 型 字 段, 该 持 续 时 间 则 表 示 为 秒 数 对 于 数 字 字 段, 持 续 时 间 则 使 用 与 字 段 相 同 的 单 位 数 表 示 设 置 修 剪 值 为 了 节 省 内 存, 序 列 节 点 中 使 用 的 CARMA 算 法 会 在 处 理 期 间 定 期 从 其 潜 在 项 目 集 合 列 表 中 删 除 ( 修 剪 ) 不 常 使 用 的 项 目 集 合 选 择 此 选 项 可 调 整 修 剪 的 频 率 指 定 的 数 字 决 定 了 修 剪 频 率 输 入 较 小 的 值 可 降 低 该 算 法 的 内 存 要 求 ( 但 可 能 会 延 长 所 需 的 训 练 时 间 ), 输 入 较 大 的 值 会 加 快 训 练 速 度 ( 但 可 能 会 提 高 内 存 要 求 ) 设 置 内 存 中 的 最 大 序 列 如 果 选 择 了 此 选 项,CARMA 算 法 则 会 将 建 模 期 间 备 选 序 列 的 内 存 存 储 限 制 为 指 定 的 序 列 数 如 果 IBM SPSS Modeler 在 序 列 建 模 期 间 使 用 的 内 存 过 多, 请 选 择 此 选 项 请 注 意, 您 在 此 处 指 定 的 最 大 序 列 值 指 的 是 在 构 建 模 型 期 间 进 行 内 部 跟 踪 的 备 选 序 列 数 此 数 字 应 该 比 最 终 模 型 中 预 期 的 序 列 数 大 很 多 项 目 集 之 间 的 约 束 间 距 通 过 此 选 项 可 以 针 对 不 同 项 目 集 合 的 时 间 间 距 指 定 约 束 如 果 选 择 了 此 选 项, 则 不 会 考 虑 时 间 间 距 小 于 您 所 指 定 的 最 小 间 距 或 大 于 最 大 间 距 的 项 目 集 合 作 为 序 列 的 组 成 部 分 使 用 此 选 项 可 避 免 考 虑 包 括 较 长 时 间 区 间 或 者 在 很 短 的 时 间 跨 度 内 发 生 的 那 些 序 列

360 348 章 12 注 意 : 如 果 使 用 的 时 间 字 段 为 时 间 日 期 或 时 间 戳 型 字 段, 该 时 间 间 距 则 表 示 为 秒 数 对 于 数 字 型 字 段, 时 间 间 距 则 使 用 与 时 间 字 段 相 同 的 单 位 数 表 示 例 如, 以 下 面 的 事 务 列 表 为 例 : ID Time 内 容 apples bread Cheese dressing 如 果 您 针 对 这 些 数 据 建 模 时 指 定 的 最 小 间 距 为 2, 则 会 得 到 下 列 序 列 : apples -> cheese apples -> dressing bread -> cheese bread -> dressing 您 不 会 看 到 像 apples -> bread 这 样 的 序 列, 因 为 apples 和 bread 之 间 的 间 距 小 于 最 小 间 距 与 之 相 似, 如 果 是 下 面 的 数 据 : ID Time 内 容 apples bread Cheese dressing 序 列 模 型 块 并 且 最 大 间 距 设 置 为 了 10, 您 则 不 会 看 到 任 何 带 有 dressing 的 序 列, 因 为 cheese 和 dressing 之 间 的 间 距 太 大, 不 考 虑 它 们 作 为 同 一 序 列 的 组 成 部 分 序 列 模 型 块 表 示 序 列 节 点 针 对 某 个 特 定 输 出 字 段 发 现 的 序 列, 可 以 添 加 到 流 中 以 生 成 预 测 当 您 运 行 包 含 序 列 节 点 的 流 时, 序 列 节 点 会 将 包 含 预 测 的 一 对 字 段, 以 及 序 列 模 型 中 每 个 预 测 的 相 关 置 信 度 值 添 加 到 数 据 中 默 认 情 况 下, 会 添 加 包 含 三 个 最 佳 预 测 的 三 对 字 段 ( 以 及 它 们 相 关 联 的 置 信 度 值 ) 您 既 可 以 通 过 在 构 建 时 设 置 序 列 节 点 模 型 选 项 更 改 构 建 模 型 时 生 成 的 预 测 数, 也 可 以 在 将 模 型 块 添 加 到 流 之 后 在 设 置 选 项 卡 上 更 改 此 数 量 有 关 详 细 信 息, 请 参 阅 第 352 页 码 序 列 模 型 块 设 置 新 的 字 段 名 称 派 生 自 模 型 名 称 预 测 字 段 的 字 段 名 称 为 $S-sequence-n( 其 中 n 表 示 第 n 个 预 测 ) 置 信 度 字 段 的 字 段 名 称 为 $SC-sequence-n 在 一 个 序 列 中 具 有 多 个 序 列 规 则 节 点 的 流 中, 新 的 字 段 名 称 将 包 括 数 字 前 缀, 以 便 将 它 们 区 别 开 来 流 中 的 第 一 个 序 列 集 节 点 使 用 普 通 的 名 称, 第 二 个 节 点 将 使 用 以 $S1- 和 $SC1- 开 头 的 名 称, 第 三 个 节 点 使 用 以 $S2- 和 $SC2- 开 头 的 名 称, 依 此 类 推 预 测 按 照 置 信 度 的 顺 序 显 示, 因 此 $S-sequence-1 所 包 含 预 测 的 置 信 度 最 高,$S-sequence-2 所 包 含 预

361 349 关 联 规 则 测 的 置 信 度 次 高, 依 此 类 推 对 于 其 中 可 用 预 测 数 量 小 于 所 请 求 预 测 数 量 的 记 录, 剩 余 的 预 测 包 含 值 $null$ 例 如, 如 果 对 于 某 个 特 定 的 记 录 只 能 进 行 两 个 预 测, 那 么 $S-sequence-3 和 $SC-sequence-3 的 值 将 为 $null$ 对 于 每 个 记 录, 会 将 模 型 中 的 规 则 与 目 前 对 于 当 前 ID 已 经 处 理 的 事 务 集 合 ( 包 括 当 前 记 录 和 具 有 相 同 ID 和 较 早 时 间 戳 的 所 有 以 前 记 录 ) 进 行 比 较 将 使 用 适 用 于 此 事 务 集 合 的 置 信 度 值 最 高 的 k 个 规 则 为 该 记 录 生 成 k 个 预 测, 其 中 k 为 模 型 添 加 到 流 之 后 在 设 置 选 项 卡 上 指 定 的 预 测 数 ( 如 果 多 个 规 则 对 于 该 事 务 集 合 预 测 了 相 同 的 结 果, 则 只 使 用 置 信 度 最 高 的 规 则 ) 有 关 详 细 信 息, 请 参 阅 第 352 页 码 序 列 模 型 块 设 置 与 其 他 类 型 的 关 联 规 则 模 型 相 同, 数 据 格 式 必 须 与 构 建 序 列 模 型 时 使 用 的 格 式 相 匹 配 例 如, 使 用 表 格 数 据 构 建 的 模 型 只 能 用 于 对 表 格 数 据 进 行 评 分 有 关 详 细 信 息, 请 参 阅 第 340 页 码 关 联 规 则 评 分 注 意 : 在 流 中 使 用 生 成 的 序 列 集 节 点 对 数 据 进 行 评 分 时, 您 在 建 模 时 选 择 的 任 何 容 差 或 间 距 设 置 都 将 被 忽 略, 不 会 用 于 评 分 目 的 根 据 序 列 规 则 进 行 的 预 测 该 节 点 以 与 时 间 相 关 ( 如 果 在 构 建 模 型 时 未 使 用 时 间 戳 字 段 的 话, 则 与 顺 序 相 关 ) 的 方 式 处 理 记 录 记 录 应 该 按 照 ID 字 段 和 时 间 戳 字 段 ( 如 果 存 在 的 话 ) 排 序 但 是, 预 测 与 添 加 到 其 中 的 记 录 的 时 间 戳 没 有 关 系 它 们 只 是 在 给 出 到 当 前 记 录 为 止 当 前 ID 的 事 务 历 史 的 情 况 下, 指 出 最 可 能 在 将 来 的 某 个 时 间 出 现 的 项 目 请 注 意, 每 个 记 录 的 预 测 不 一 定 与 该 记 录 的 事 务 相 关 如 果 当 前 记 录 的 事 务 不 触 发 某 个 特 定 的 规 则, 则 会 根 据 当 前 ID 的 以 前 事 务 选 择 规 则 换 句 话 说, 如 果 当 前 记 录 不 向 序 列 添 加 任 何 有 用 的 预 测 信 息, 则 会 将 此 ID 的 最 后 一 个 有 用 事 务 中 的 预 测 转 到 当 前 记 录 例 如, 假 设 您 拥 有 的 序 列 模 型 具 有 一 个 规 则 Jam -> Bread (0.66) 然 后 您 将 其 传 递 到 了 下 列 记 录 : ID 采 购 预 测 001 jam bread 001 milk bread 请 注 意, 与 您 的 预 期 相 同, 第 一 个 记 录 生 成 了 预 测 bread 第 二 个 记 录 也 包 含 bread 预 测, 因 为 没 有 规 定 jam 后 紧 跟 milk; 因 此,milk 事 务 不 会 增 加 任 何 有 用 信 息, 所 以 规 则 Jam -> Bread 仍 然 适 用 生 成 新 节 点 通 过 生 成 菜 单 可 以 基 于 序 列 模 型 创 建 新 的 超 节 点 规 则 超 节 点 创 建 一 个 可 以 检 测 和 计 算 已 评 分 数 据 中 序 列 发 生 次 数 的 超 节 点 如 果 未 选 择 任 何 规 则, 此 选 项 则 禁 用 有 关 详 细 信 息, 请 参 阅 第 353 页 码 从 序 列 模 型 块 生 成 规 则 超 节 点 模 型 到 调 色 板 将 模 型 返 回 到 模 型 选 项 板 当 有 同 事 发 给 您 包 含 模 型 的 流 而 不 是 模 型 本 身 时, 该 功 能 很 有 用

362 350 章 12 序 列 模 型 块 详 细 信 息 序 列 模 型 块 的 模 型 选 项 卡 显 示 算 法 提 取 的 规 则 表 中 的 每 行 都 代 表 一 个 规 则, 其 中 条 件 ( 规 则 if 部 分 ) 位 于 第 一 列, 结 果 ( 规 则 的 then 部 分 ) 位 于 后 面 的 第 二 列 图 片 序 列 模 型 块 模 型 选 项 卡 每 个 规 则 都 以 下 列 格 式 显 示 : 条 件 beer and cannedveg fish fish 结 果 beer fish 第 一 个 规 则 示 例 解 释 为 对 于 在 同 一 个 事 务 中 具 有 beer 和 cannedveg 的 ID, 很 可 能 后 面 会 出 现 beer 第 二 个 规 则 示 例 可 以 解 释 为 对 于 在 一 个 事 务 中 具 有 fish, 在 另 一 个 事 务 中 也 是 fish 的 ID, 很 可 能 后 面 会 出 现 fish 请 注 意 在 第 一 个 规 则 中,beer 和 cannedveg 是 同 时 购 买 的 ; 在 第 二 个 规 则 中,fish 是 在 两 个 不 同 的 事 务 中 购 买 的 排 序 菜 单 工 具 栏 上 的 排 序 菜 单 按 钮 控 制 着 规 则 的 排 序 排 序 的 方 向 ( 升 序 或 降 序 ) 可 以 使 用 排 序 方 向 按 钮 ( 上 箭 头 或 下 箭 头 ) 进 行 更 改

363 351 关 联 规 则 图 片 用 于 排 序 的 工 具 栏 选 项 您 可 以 按 照 下 列 条 件 对 规 则 进 行 排 序 : 支 持 度 % 置 信 度 % 规 则 支 持 % 结 果 第 一 个 条 件 最 后 一 个 条 件 项 目 数 ( 条 件 ) 例 如, 下 表 按 照 项 目 数, 以 降 序 进 行 排 序 条 件 集 合 中 具 有 多 个 项 目 的 规 则 排 在 条 件 集 合 中 项 目 数 较 少 的 规 则 前 面 条 件 beer and cannedveg and frozenmeal beer and cannedveg fish fish softdrink 结 果 frozenmeal beer fish softdrink 显 示 / 隐 藏 标 准 菜 单 显 示 / 隐 藏 标 准 菜 单 按 钮 ( 网 格 图 标 ) 控 制 着 规 则 的 显 示 选 项 可 用 的 显 示 选 项 如 下 : 实 例 数 显 示 其 中 发 生 完 整 序 列 ( 有 条 件 也 有 结 果 ) 的 唯 一 ID 的 数 量 的 相 关 信 息 ( 请 注 意, 此 内 容 与 关 联 模 型 不 同, 后 者 的 实 例 数 指 的 是 其 中 仅 条 件 适 用 的 ID 数 例 如, 假 设 规 则 为 bread -> cheese, 训 练 数 据 中 同 时 包 含 bread 和 cheese 的 ID 数 称 为 实 例 数 支 持 度 显 示 训 练 数 据 中 条 件 为 真 的 ID 的 比 例 例 如, 如 果 50% 的 训 练 数 据 中 包 括 条 件 bread, 那 么 规 则 bread -> cheese 的 支 持 度 为 50%( 与 关 联 模 型 不 同, 支 持 度 不 基 于 实 例 数, 如 前 面 所 述 ) 置 信 度 显 示 的 是 得 到 正 确 预 测 的 ID 在 所 有 使 用 规 则 进 行 预 测 的 ID 中 所 占 的 百 分 比 基 于 训 练 数 据, 该 百 分 比 的 计 算 如 下 : 包 含 整 个 序 列 的 ID 数 量 除 以 其 中 包 含 条 件 的 ID 数 量 例 如, 如 果 50% 的 训 练 数 据 包 含 cannedveg( 表 明 条 件 支 持 ), 但 只 有 20% 既 包 含 cannedveg 又 包 含 frozenmeal, 则 规 则 cannedveg -> frozenmeal 的 置 信 度 为 Rule Support / Antecedent Support, 在 这 里 为 40% 序 列 模 型 的 规 则 支 持 度 基 于 实 例 数, 显 示 其 中 整 个 规 则 条 件 和 结 果 均 为 真 的 训 练 记 录 的 比 例 例 如, 如 果 20% 的 训 练 数 据 既 包 含 bread 也 包 含 cheese, 那 么 规 则 bread -> cheese 的 规 则 支 持 度 为 20% 请 注 意, 这 些 比 例 基 于 有 效 事 务 ( 至 少 具 有 一 个 观 测 项 或 真 值 的 事 务 ), 而 不 基 于 总 的 事 务 在 这 些 计 算 中 不 会 考 虑 无 效 事 务 ( 没 有 项 目 或 真 值 的 事 务 )

364 352 章 12 过 滤 按 钮 菜 单 上 的 过 滤 器 按 钮 ( 漏 斗 图 标 ) 会 扩 展 对 话 框 的 底 部, 从 而 显 示 一 个 面 板, 其 中 将 显 示 活 动 的 规 则 过 滤 器 过 滤 器 用 于 减 少 模 型 选 项 卡 上 显 示 的 规 则 数 量 图 片 过 滤 按 钮 要 创 建 过 滤 器, 请 单 击 位 于 扩 展 面 板 右 侧 的 过 滤 器 图 标 这 样 将 打 开 一 个 单 独 的 对 话 框, 您 可 以 在 其 中 指 定 用 于 显 示 规 则 的 约 束 条 件 请 注 意, 过 滤 器 按 钮 通 常 与 生 成 菜 单 一 起 使 用, 以 便 首 先 过 滤 规 则, 然 后 生 成 一 个 包 含 部 分 规 则 的 模 型 有 关 详 细 信 息, 请 参 阅 下 面 的 为 规 则 指 定 过 滤 器 序 列 模 型 块 设 置 序 列 模 型 块 的 设 置 选 项 卡 显 示 模 型 的 评 分 选 项 此 选 项 卡 仅 在 模 型 添 加 到 流 工 作 区 用 于 评 分 之 后 可 用 图 片 序 列 模 型 块 设 置 选 项 卡 预 测 的 最 大 数 量 指 定 每 个 购 物 篮 项 目 集 合 包 括 的 最 大 预 测 数 适 用 于 此 事 务 集 合 的 置 信 度 值 最 高 的 规 则 将 用 于 为 记 录 生 成 预 测, 预 测 的 数 量 不 超 过 指 定 的 上 限 序 列 模 型 块 概 要 序 列 规 则 模 型 块 的 概 要 选 项 卡 显 示 发 现 的 规 则 数 量, 以 及 规 则 的 最 大 和 最 小 支 持 度 和 置 信 度 如 果 已 执 行 附 加 到 此 建 模 节 点 的 分 析 节 点, 则 分 析 信 息 也 将 显 示 在 此 选 项 卡 上 有 关 详 细 信 息, 请 参 阅 第 6 章 中 的 分 析 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点

365 353 关 联 规 则 图 片 序 列 模 型 块 概 要 选 项 卡 有 关 详 细 信 息, 请 参 阅 第 43 页 码 第 3 章 中 的 浏 览 模 型 块 从 序 列 模 型 块 生 成 规 则 超 节 点 图 片 生 成 规 则 超 节 点 对 话 框

366 354 章 12 要 基 于 序 列 规 则 生 成 规 则 超 节 点 : E 在 序 列 规 则 模 型 块 的 模 型 选 项 卡 上, 单 击 表 中 的 某 行 以 选 择 所 需 的 规 则 E 从 规 则 浏 览 器 菜 单 中 选 择 : 生 成 > 规 则 超 节 点 重 要 事 项 : 要 使 用 生 成 的 超 节 点, 必 须 在 将 数 据 传 递 到 超 节 点 之 前 按 照 ID 字 段 ( 和 时 间 字 段, 如 果 有 的 时 间 字 段 的 话 ) 对 数 据 进 行 排 序 超 节 点 无 法 在 未 排 序 的 数 据 中 正 确 检 测 序 列 您 可 以 指 定 下 列 用 于 生 成 规 则 超 节 点 的 选 项 : 检 测 指 定 传 递 到 超 节 点 的 数 据 的 匹 配 定 义 方 式 仅 条 件 每 当 超 节 点 在 具 有 相 同 ID 的 一 系 列 记 录 中 发 现 以 正 确 顺 序 排 列 的 选 中 规 则 的 条 件 时, 它 都 会 确 定 一 个 匹 配, 而 不 管 是 否 同 时 发 现 了 结 果 请 注 意, 此 选 项 不 考 虑 原 始 序 列 建 模 节 点 中 的 时 间 戳 容 差 或 项 目 间 距 约 束 设 置 在 流 中 检 测 到 最 后 一 个 条 件 项 目 集 合 ( 所 有 其 他 条 件 均 以 正 确 顺 序 发 现 ) 后, 具 有 当 前 ID 的 所 有 后 续 记 录 都 将 包 含 下 面 选 择 的 概 要 整 个 序 列 每 当 超 节 点 在 具 有 相 同 ID 的 一 系 列 记 录 中 发 现 以 正 确 顺 序 排 列 的 选 中 规 则 的 条 件 和 结 果 时, 它 都 会 确 定 一 个 匹 配 此 选 项 不 考 虑 原 始 序 列 建 模 节 点 中 的 时 间 戳 容 差 或 项 目 间 距 约 束 设 置 在 流 中 检 测 到 最 后 一 个 结 果 ( 所 有 条 件 均 以 正 确 顺 序 发 现 ) 后, 当 前 记 录 和 具 有 当 前 ID 的 所 有 后 续 记 录 都 将 包 含 下 面 选 择 的 概 要 显 示 控 制 匹 配 概 要 将 以 何 种 方 式 添 加 到 规 则 超 节 点 输 出 的 数 据 中 首 次 发 生 的 结 果 值 添 加 到 数 据 中 的 值 为 基 于 第 一 次 发 生 的 匹 配 预 测 的 结 果 值 这 些 值 将 作 为 一 个 名 为 rule_n_consequent 的 新 字 段 进 行 添 加, 其 中 n 为 规 则 编 号 ( 基 于 流 中 规 则 超 节 点 的 创 建 顺 序 ) 首 次 发 生 的 真 值 如 果 对 于 该 ID 至 少 存 在 一 个 匹 配, 添 加 到 数 据 的 值 为 真 ; 如 果 没 有 任 何 匹 配, 添 加 的 值 则 为 假 这 些 值 将 作 为 一 个 名 为 rule_n_flag 的 新 字 段 添 加 计 数 发 生 次 数 添 加 到 数 据 的 值 为 该 ID 的 匹 配 数 这 些 值 将 作 为 一 个 名 为 rule_n_count 的 新 字 段 添 加 规 则 编 号 添 加 的 值 为 选 中 规 则 的 规 则 编 号 规 则 编 号 是 基 于 超 节 点 添 加 到 流 的 顺 序 指 定 的 例 如, 第 一 个 规 则 超 节 点 被 视 为 规 则 1, 第 二 个 规 则 超 节 点 被 视 为 规 则 2, 依 此 类 推 当 您 要 在 流 中 包 括 多 个 规 则 超 节 点 时, 此 选 项 最 有 用 这 些 值 将 作 为 一 个 名 为 rule_n_number 的 新 字 段 添 加 包 括 置 信 度 图 表 如 果 选 中 此 选 项, 则 会 将 规 则 置 信 度 以 及 选 定 概 要 添 加 到 数 据 流 中 这 些 值 将 作 为 一 个 名 为 rule_n_confidence 的 新 字 段 添 加

367 时 间 序 列 模 型 章 13 为 什 么 要 进 行 预 测? 预 测 的 意 思 就 是 对 一 个 或 多 个 序 列 在 一 定 时 间 内 的 值 进 行 预 言 例 如, 您 可 能 希 望 预 测 某 个 系 列 产 品 或 服 务 的 预 期 需 求, 以 便 分 配 资 源 进 行 制 造 或 配 送 因 为 计 划 决 策 的 实 施 需 要 时 间, 所 以 预 测 在 很 多 计 划 过 程 中 都 是 一 个 必 不 可 少 的 工 具 时 间 序 列 建 模 方 法 假 定 历 史 总 会 自 我 重 演 即 使 不 是 完 全 一 样 也 会 非 常 接 近, 足 以 通 过 研 究 过 去 对 将 来 作 出 更 好 的 决 策 例 如, 为 了 预 测 下 一 年 的 销 售 量, 您 可 能 得 从 分 析 今 年 的 销 售 量 开 始, 看 看 近 年 来 都 有 哪 些 发 展 趋 势 或 模 式 ( 如 果 存 在 的 话 ) 但 模 式 可 能 很 难 测 量 例 如, 如 果 您 的 销 售 量 在 几 周 之 内 连 续 上 升, 那 么 这 是 季 节 性 原 因 呢 还 是 一 种 长 期 趋 势 的 开 始? 使 用 统 计 建 模 技 术, 可 以 分 析 过 去 数 据 中 存 在 的 模 式 并 加 以 预 测, 以 确 定 该 序 列 的 未 来 值 可 能 属 于 的 范 围 其 结 果 是 您 的 决 策 所 依 据 的 预 测 更 为 准 确 时 间 序 列 数 据 时 间 序 列 是 以 规 律 的 时 间 间 隔 采 集 的 测 量 值 的 有 序 集 合, 例 如, 每 日 的 股 票 价 格 或 每 周 的 销 售 数 据 测 量 值 可 以 是 您 感 兴 趣 的 任 何 内 容, 每 个 序 列 通 常 可 以 归 为 下 列 类 别 之 一 : 依 存 量 要 预 测 的 序 列 预 测 变 量 可 能 有 助 于 解 释 目 标 的 序 列 例 如, 使 用 广 告 预 算 来 预 测 销 售 量 预 测 变 量 只 能 用 于 ARIMA 模 型 事 件 一 种 特 殊 的 预 测 变 量 序 列, 用 于 说 明 可 预 测 的 重 复 发 生 事 件 例 如, 促 销 活 动 干 预 一 种 特 殊 的 预 测 变 量 序 列, 用 于 说 明 过 去 的 一 次 性 事 件 例 如, 停 电 或 员 工 罢 工 时 间 间 隔 可 以 代 表 任 何 时 间 单 位, 但 所 有 测 量 值 的 时 间 间 隔 必 须 相 同 而 且, 没 有 测 量 值 的 任 何 时 间 间 隔 必 须 设 置 为 缺 失 值 因 此, 有 测 量 值 的 时 间 间 隔 数 ( 包 括 测 量 值 为 缺 失 值 的 时 间 间 隔 ) 定 义 数 据 历 史 范 围 的 时 间 长 度 时 间 序 列 的 特 征 研 究 序 列 过 去 的 行 为 有 助 于 辨 别 其 中 的 模 式 从 而 作 出 更 好 的 预 测 将 其 绘 制 成 图 时, 许 多 时 间 序 列 就 会 表 现 出 下 列 一 种 或 多 种 特 征 : 趋 势 季 节 周 期 和 非 季 节 周 期 脉 冲 和 步 进 界 外 值 Copyright IBM Corporation 1994,

368 356 章 13 趋 势 趋 势 是 指 序 列 水 平 的 逐 渐 上 升 或 下 降 或 序 列 值 随 时 间 的 推 移 而 增 大 或 减 小 的 趋 势 图 片 13-1 趋 势 趋 势 既 可 以 是 局 部 的, 也 可 以 是 全 局 的, 而 一 个 序 列 可 以 同 时 体 现 这 两 种 趋 势 从 历 史 来 看, 股 票 市 场 指 数 的 序 列 图 总 的 趋 势 是 上 升 的 经 济 萧 条 时 期 所 表 现 出 的 是 局 部 下 降 趋 势, 而 经 济 繁 荣 时 期 表 现 出 的 是 局 部 上 升 趋 势 趋 势 既 可 以 是 线 性 的, 也 可 以 是 非 线 性 的 线 性 趋 势 是 指 序 列 水 平 表 现 为 正 增 加 或 负 增 加, 就 和 本 金 以 单 利 计 息 差 不 多 非 线 性 趋 势 通 常 表 现 为 倍 增, 即 相 对 于 以 前 的 序 列 值 成 比 例 地 增 长 全 局 线 性 趋 势 可 通 过 指 数 平 滑 模 型 和 ARIMA 模 型 很 好 地 拟 合 和 预 测 在 构 建 ARIMA 模 型 的 过 程 中, 通 常 会 对 表 现 出 趋 势 的 序 列 进 行 区 分, 以 消 除 趋 势 的 影 响 季 节 周 期 季 节 周 期 是 序 列 值 中 可 预 测 的 重 复 模 式 图 片 13-2 季 节 周 期 季 节 周 期 与 序 列 的 时 间 间 隔 相 联 系 例 如, 月 度 数 据 通 常 会 随 季 度 和 年 度 而 循 环 月 度 序 列 可 能 会 表 现 出 第 一 个 季 度 较 低 的 明 显 季 度 周 期 或 每 年 十 二 月 份 都 出 现 峰 值 的 年 度 周 期 表 现 出 季 节 周 期 的 序 列 称 之 为 具 有 季 节 性 季 节 模 式 对 于 获 取 良 好 的 拟 合 和 预 测 非 常 有 用, 用 来 捕 获 季 节 性 的 有 指 数 平 滑 模 型 和 ARIMA 模 型

369 357 时 间 序 列 模 型 非 季 节 周 期 非 季 节 周 期 是 序 列 值 中 可 能 无 法 预 测 的 重 复 模 式 图 片 13-3 非 季 节 周 期 某 些 序 列 ( 如 失 业 率 ) 明 显 地 表 现 出 周 期 性 行 为 ; 但 这 种 周 期 性 的 周 期 会 随 时 间 而 变 化, 因 此 很 难 预 测 何 时 高 何 时 低 其 他 序 列 可 能 具 有 可 预 测 的 周 期, 但 可 能 与 阳 历 并 不 完 全 吻 合, 或 者 其 周 期 比 一 年 长 例 如, 潮 汐 遵 循 阴 历, 与 奥 林 匹 克 运 动 会 相 关 的 国 际 旅 游 和 贸 易 每 隔 四 年 膨 胀 一 次, 还 有 许 多 宗 教 节 日, 其 阳 历 日 期 每 年 都 会 变 化 非 季 节 周 期 模 式 很 难 建 模, 通 常 会 增 加 预 测 的 不 确 定 性 例 如, 股 票 市 场 的 许 多 序 列 实 例 就 常 使 预 测 者 的 努 力 无 功 而 返 即 便 如 此, 当 存 在 非 季 节 模 式 时, 还 是 有 必 要 加 以 说 明 在 许 多 情 况 下, 您 仍 然 可 以 找 出 与 历 史 数 据 拟 合 得 很 好 的 模 型, 从 而 最 大 限 度 地 减 小 预 测 中 的 不 确 定 性 脉 冲 和 步 进 许 多 序 列 都 会 出 现 水 平 突 变 它 们 通 常 分 为 两 种 类 型 : 序 列 水 平 突 然 临 时 性 的 变 动, 或 称 脉 冲 序 列 水 平 突 然 永 久 性 的 变 动, 或 称 步 进 图 片 13-4 脉 冲 序 列

370 358 章 13 观 测 到 步 进 或 脉 冲 时, 找 到 一 种 貌 似 合 理 的 解 释 很 重 要 时 间 序 列 模 型 是 用 来 说 明 渐 变 而 非 突 变 的 因 此, 它 们 往 往 低 估 脉 冲 并 为 步 进 所 瓦 解, 导 致 模 型 拟 合 差 强 人 意, 增 加 预 测 的 不 确 定 性 ( 某 些 季 节 性 实 例 可 能 表 现 为 突 然 的 水 平 变 化, 但 该 水 平 在 不 同 的 季 节 周 期 之 间 则 保 持 稳 定 ) 如 果 扰 动 是 可 以 解 释 的, 则 可 以 使 用 干 预 或 事 件 为 其 建 模 例 如,1973 年 8 月, 石 油 输 出 国 组 织 (OPEC) 颁 布 的 石 油 禁 运 导 致 了 通 货 膨 胀 率 的 急 剧 变 化, 经 过 数 月 之 后 才 恢 复 到 正 常 水 平 通 过 为 该 禁 运 月 指 定 一 个 点 干 预, 可 以 改 善 模 型 的 拟 合 度, 因 此 可 以 间 接 提 高 预 测 的 准 确 性 例 如, 某 个 零 售 店 可 能 会 发 现, 所 有 商 品 均 标 记 降 价 50% 的 当 天 销 售 量 比 平 时 高 出 很 多 通 过 将 降 价 50% 的 促 销 指 定 为 一 个 定 期 的 事 件, 可 以 改 善 模 型 的 拟 合 度, 估 计 将 来 重 复 该 项 促 销 措 施 的 影 响 离 群 值 时 间 序 列 水 平 中 无 法 解 释 的 变 动 称 为 离 群 值 这 些 观 测 值 与 序 列 中 的 其 他 值 不 一 致, 可 能 会 显 著 影 响 分 析, 从 而 影 响 时 间 序 列 模 型 的 预 测 能 力 下 图 显 示 了 时 间 序 列 中 常 见 的 几 种 离 群 值 蓝 线 表 示 没 有 离 群 值 的 序 列 红 线 表 示 如 果 序 列 包 含 离 群 值 情 况 下 可 能 存 在 的 模 式 这 些 离 群 值 全 部 归 为 确 定 性 离 群 值, 因 为 它 们 只 影 响 序 列 的 均 值 水 平

371 359 时 间 序 列 模 型 图 片 13-5 离 群 值 类 型 加 性 离 群 值 革 新 离 群 值 时 间 时 间 层 移 动 离 群 值 时 间 瞬 时 变 化 离 群 值 时 间 季 节 加 性 离 群 值 时 间 局 部 趋 势 离 群 值 时 间 离 群 值 非 离 群 值 加 性 离 群 值 加 性 离 群 值 表 现 为 一 次 观 测 中 出 现 的 异 常 大 或 异 常 小 的 值 后 续 观 测 不 受 加 性 离 群 值 的 影 响 连 续 的 加 性 离 群 值 通 常 称 为 加 法 离 群 值 修 补 革 新 离 群 值 革 新 离 群 值 的 特 征 为 初 始 影 响 一 直 对 后 续 观 测 产 生 作 用 这 些 离 群 值 的 影 响 可 能 会 随 着 时 间 的 推 移 而 不 断 增 强 水 平 变 动 离 群 值 对 于 水 平 变 动, 离 群 值 之 后 出 现 的 所 有 观 测 值 均 会 移 到 一 个 新 的 水 平 与 加 性 离 群 值 相 反, 水 平 变 动 离 群 值 会 影 响 许 多 观 测 值, 并 且 具 有 永 久 性 影 响 瞬 时 变 化 离 群 值 瞬 时 变 化 离 群 值 类 似 水 平 变 动 离 群 值, 只 是 这 种 离 群 值 对 后 续 观 测 的 影 响 呈 指 数 递 减 最 终, 该 序 列 会 恢 复 到 正 常 水 平 季 节 加 性 离 群 值 季 节 加 性 离 群 值 表 现 为 以 固 定 时 间 间 隔 重 复 出 现 的 异 常 大 或 异 常 小 的 值

372 360 章 13 局 部 趋 势 离 群 值 局 部 趋 势 离 群 值 会 在 出 现 初 始 离 群 值 之 后, 在 序 列 中 产 生 一 个 由 离 群 值 中 的 模 式 所 导 致 的 整 体 漂 移 时 间 序 列 中 的 离 群 值 检 测 包 括 确 定 存 在 的 任 何 离 群 值 的 位 置 类 型 和 大 小 Tsay (1988) 提 出 了 一 个 用 于 检 测 均 值 水 平 变 化 以 识 别 出 确 定 性 离 群 值 的 迭 代 过 程 此 过 程 是 将 一 个 假 设 不 存 在 离 群 值 的 时 间 序 列 模 型 与 另 一 个 具 有 离 群 值 的 模 型 进 行 比 较 从 两 个 模 型 之 间 的 差 异 得 到 将 任 何 给 定 点 视 为 离 群 值 的 影 响 的 估 计 自 相 关 函 数 和 部 分 自 相 关 函 数 自 相 关 和 部 分 自 相 关 是 当 前 序 列 值 和 过 去 序 列 值 之 间 关 联 度 的 测 量, 表 明 在 预 测 将 来 值 时 过 去 的 哪 些 序 列 值 最 有 用 了 解 了 此 内 容, 您 就 可 以 确 定 ARIMA 模 型 中 过 程 的 顺 序 更 具 体 来 说, 自 相 关 函 数 (ACF) 在 延 迟 为 k 时, 这 是 相 距 k 个 时 间 间 隔 的 序 列 值 之 间 的 相 关 部 分 自 相 关 函 数 (PACF) 在 延 迟 为 k 时, 这 是 相 距 k 个 时 间 间 隔 的 序 列 值 之 间 的 相 关, 同 时 考 虑 了 两 个 间 隔 之 间 的 值 图 片 13-6 序 列 的 ACF 图 ACF 图 的 x 轴 表 示 计 算 自 相 关 处 的 延 迟 ;y 轴 表 示 相 关 值 ( 介 于 1 和 1 之 间 ) 例 如,ACF 图 中 延 迟 1 处 的 峰 值 表 示 每 个 序 列 值 与 前 面 的 值 强 相 关, 延 迟 2 处 的 峰 值 表 示 每 个 值 与 以 前 两 个 点 之 间 的 值 强 相 关, 依 此 类 推 正 相 关 表 示 较 大 的 当 前 值 与 指 定 延 迟 处 较 大 的 值 相 对 应 ; 负 相 关 表 示 较 大 的 当 前 值 与 指 定 延 迟 处 较 小 的 值 相 对 应 相 关 的 绝 对 值 是 关 联 强 度 的 测 量, 绝 对 值 越 大 表 明 关 系 越 强 序 列 变 换 变 换 对 在 模 型 估 计 之 前 稳 定 序 列 常 常 有 用 这 对 ARIMA 模 型 尤 其 重 要, 因 为 估 计 这 类 模 型 之 前 需 要 序 列 保 持 稳 定 如 果 在 整 个 序 列 中, 全 局 水 平 ( 均 值 ) 以 及 与 该 水 平 的 平 均 偏 差 ( 方 差 ) 保 持 不 变, 则 该 序 列 是 稳 定 的 尽 管 多 数 令 人 感 兴 趣 的 序 列 都 不 稳 定, 但 只 要 能 够 通 过 应 用 变 换 ( 如, 自 然 对 数 差 分 或 季 节 差 分 ) 使 序 列 保 持 稳 定, 则 ARIMA 就 是 有 效 的 方 差 稳 定 变 换 方 差 随 时 间 变 化 的 序 列 通 常 可 以 使 用 自 然 对 数 变 换 或 平 方 根 变 换 使 其 保 持 稳 定 这 些 变 换 也 称 为 函 数 变 换

373 361 时 间 序 列 模 型 自 然 对 数 对 序 列 值 取 自 然 对 数 平 方 根 对 序 列 值 应 用 平 方 根 函 数 自 然 对 数 变 换 和 平 方 根 变 换 不 能 用 于 具 有 负 值 的 序 列 水 平 稳 定 变 换 ACF 中 值 的 缓 慢 下 降 表 示 每 个 序 列 值 都 与 上 一 个 值 具 有 很 强 的 相 关 性 通 过 分 析 序 列 值 的 变 化, 您 可 以 获 得 一 个 稳 定 水 平 简 单 差 分 计 算 序 列 中 每 个 值 与 上 一 个 值 之 间 的 差, 序 列 中 最 旧 的 值 除 外 这 意 味 着 经 过 差 分 的 序 列 将 比 原 始 序 列 少 一 个 值 季 节 差 分 除 计 算 每 个 值 与 上 一 个 季 节 值 之 间 的 差 值 外, 其 他 均 与 简 单 差 分 相 同 将 简 单 差 分 或 季 节 差 分 同 时 用 于 对 数 变 换 或 平 方 根 变 换 时, 总 是 先 应 用 方 差 稳 定 变 换 同 时 使 用 简 单 差 分 和 季 节 差 分 时, 无 论 首 先 应 用 简 单 差 分 还 是 季 节 差 分, 得 到 的 序 列 值 均 相 同 预 测 变 量 序 列 预 测 变 量 序 列 包 括 可 能 有 助 于 解 释 要 预 测 序 列 的 行 为 的 相 关 数 据 例 如, 一 个 网 上 零 售 商 或 目 录 零 售 商 可 能 会 根 据 邮 寄 的 目 录 数 量 开 通 的 电 话 数 量 或 公 司 网 页 的 点 击 次 数 来 预 测 销 售 量 任 何 序 列 都 可 以 作 为 预 测 变 量, 条 件 是 该 序 列 须 延 伸 到 要 预 测 的 将 来 时 间, 并 且 具 有 不 存 在 缺 失 值 的 完 整 数 据 向 模 型 中 添 加 预 测 变 量 时 以 慎 重 为 宜 添 加 大 量 预 测 变 量 会 增 加 估 计 模 型 所 需 的 时 间 虽 然 添 加 预 测 变 量 可 以 提 高 模 型 拟 合 历 史 数 据 的 能 力, 但 并 不 意 味 着 该 模 型 就 一 定 能 产 生 更 好 的 预 测 结 果, 因 为 增 加 的 复 杂 怕 有 可 能 及 不 上 所 造 成 的 麻 烦 理 想 的 目 标 是, 找 出 的 模 型 既 是 最 简 单 的, 同 时 又 能 作 出 很 好 的 预 测 一 般 而 言, 建 议 预 测 变 量 的 数 量 应 小 于 样 本 大 小 除 以 15( 即 最 多 每 15 个 观 测 值 一 个 预 测 变 量 ) 有 缺 失 数 据 的 预 测 变 量 具 有 不 完 整 数 据 或 缺 失 数 据 的 预 测 变 量 不 能 在 预 测 中 使 用 这 适 用 于 历 史 数 据 和 将 来 值 在 某 些 情 况 下, 可 通 过 设 置 模 型 的 估 计 范 围 以 便 在 估 计 模 型 时 排 除 最 旧 数 据 来 避 免 上 述 限 制 时 间 序 列 建 模 节 点 时 间 序 列 节 点 可 为 时 间 序 列 估 计 指 数 平 滑 模 型 单 变 量 综 合 自 回 归 移 动 平 均 (ARIMA) 模 型 和 多 变 量 ARIMA( 或 变 换 函 数 ) 模 型 并 基 于 时 间 序 列 数 据 生 成 预 测 指 数 平 滑 是 一 种 使 用 以 前 的 序 列 观 察 的 加 权 值 来 预 测 未 来 值 的 预 测 方 法 因 此, 指 数 平 滑 不 是 以 对 数 据 的 理 论 理 解 为 基 础 的 指 数 平 滑 每 次 预 测 一 个 点, 在 输 入 新 数 据 时 可 调 整 其 预 测 此 技 术 有 助 于 预 测 可 展 示 趋 势 和 / 或 季 节 性 的 序 列 您 可 以 从 各 种 指 数 平 滑 法 模 型 中 进 行 选 择, 它 们 在 处 理 趋 势 和 季 节 性 上 有 所 不 同 ARIMA 模 型 比 起 指 数 平 滑 模 型 在 对 趋 势 和 季 节 组 件 建 模 方 面 可 提 供 更 成 熟 的 方 法, 特 别 是, 增 加 了 可 在 模 型 中 包 括 自 变 量 ( 预 测 变 量 ) 的 优 势 这 包 括 明 确 指 定 自 回 归 阶 数 和 移 动 平 均 阶 数 以 及 差 分 次 数 可 以 包 含 预 测 变 量 并 为 任 意 或 所 有 预 测 变 量 定 义 变 换 函 数 以 及 指 定 对 离 群 值 的 自 动 检 测 或 精 确 设 置

374 362 章 13 注 意 : 实 际 上, 如 果 想 要 包 括 预 测 变 量 ( 该 变 量 有 助 于 解 释 正 在 预 测 的 序 列 的 行 为, 例 如 邮 寄 的 目 录 数 或 某 公 司 网 页 的 点 击 数 ),ARIMA 模 型 会 非 常 有 用 而 指 数 平 滑 模 型 在 说 明 时 间 序 列 的 行 为 时, 并 不 试 图 去 了 解 其 行 为 的 原 因 例 如, 过 去 每 隔 12 个 月 就 会 达 到 最 大 值 的 序 列 有 可 能 继 续 保 持 该 行 为, 即 使 您 不 了 解 其 原 因 还 可 使 用 Expert Modeler, 它 可 自 动 识 别 和 估 计 对 一 个 或 多 个 目 标 变 量 拟 合 得 最 好 的 ARIMA 模 型 或 指 数 平 滑 模 型, 从 而 不 需 要 通 过 试 错 来 识 别 适 当 的 模 型 在 所 有 案 例 中, Expert Modeler 都 可 为 指 定 的 每 个 目 标 变 量 选 择 最 适 合 的 模 型 如 果 有 疑 问, 请 使 用 Expert Modeler 如 果 已 指 定 预 测 变 量, 则 Expert Modeler 会 将 那 些 与 相 关 序 列 具 有 统 计 意 义 下 的 显 著 关 系 的 变 量 包 括 在 ARIMA 模 型 中 适 当 时, 使 用 差 分 和 / 或 平 方 根 或 自 然 对 数 变 换 对 模 型 变 量 进 行 转 换 默 认 情 况 下, Expert Modeler 会 考 虑 所 有 指 数 平 滑 模 型 和 所 有 ARIMA 模 型 并 为 每 个 目 标 字 段 选 择 其 中 最 适 合 的 模 型 不 过, 可 以 将 Expert Modeler 限 制 为 仅 选 择 最 适 合 的 指 数 平 滑 模 型 或 仅 选 择 最 适 合 的 ARIMA 模 型 还 可 以 指 定 自 动 检 测 离 群 值 示 例 一 家 全 国 宽 带 提 供 商 要 求 分 析 师 预 测 用 户 注 册 数 量, 以 推 测 带 宽 普 及 程 度 分 析 师 需 要 对 各 地 市 场 进 行 预 测, 才 能 得 出 全 国 注 册 用 户 数 量 可 使 用 时 间 序 列 建 模 对 各 地 市 场 未 来 三 个 月 注 册 用 户 数 量 进 行 预 测 有 关 详 细 信 息, 请 参 阅 第 15 章 中 的 使 用 时 间 序 列 节 点 进 行 预 测 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 要 求 时 间 序 列 节 点 与 其 他 IBM SPSS Modeler 节 点 不 同, 在 时 间 序 列 节 点 中, 不 能 简 单 地 将 节 点 插 入 流 并 运 行 流 通 常 在 时 间 序 列 节 点 之 前, 必 须 先 插 入 时 间 区 间 节 点, 该 节 点 可 指 定 如 下 信 息, 例 如 所 使 用 的 时 间 区 间 ( 年 季 度 月 等 ) 用 于 估 计 的 数 据 以 及 预 测 所 延 伸 到 的 未 来 时 间 的 范 围 ( 如 果 已 使 用 ) 图 片 13-7 通 常 在 插 入 时 间 序 列 节 点 之 前 先 插 入 时 间 区 间 节 点 时 间 序 列 数 据 必 须 是 均 匀 间 隔 的 时 间 序 列 数 据 建 模 法 需 要 在 每 个 测 量 之 间 有 一 致 的 区 间, 并 由 空 行 表 示 所 有 缺 失 值 如 果 数 据 尚 未 满 足 此 需 求, 则 时 间 区 间 节 点 会 按 需 要 对 值 进 行 变 换 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 时 间 区 间 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 有 关 时 间 序 列 节 点 的 其 他 注 意 事 项 有 : 字 段 必 须 是 数 字 型 的 日 期 字 段 不 能 作 为 输 入 使 用 忽 视 分 区

375 363 时 间 序 列 模 型 字 段 选 项 图 片 13-8 时 间 序 列 节 点 对 话 框, 字 段 选 项 卡 在 字 段 选 项 卡 中 可 指 定 将 用 于 构 建 模 型 的 字 段 在 构 建 模 型 之 前, 需 要 指 定 要 将 哪 些 字 段 用 作 目 标 和 输 入 通 常, 时 间 序 列 节 点 会 使 用 来 自 上 游 类 型 节 点 的 字 段 信 息 如 果 正 在 使 用 类 型 节 点 选 择 输 入 和 目 标 字 段, 则 不 必 在 此 选 项 卡 上 做 任 何 更 改 使 用 类 型 节 点 设 置 该 选 项 通 知 节 点 使 用 来 自 上 游 类 型 节 点 的 字 段 信 息 这 是 默 认 值 使 用 自 定 义 设 置 该 选 项 通 知 节 点 使 用 在 此 处 指 定 的 字 段 信 息, 而 不 是 在 任 何 上 游 类 型 节 点 中 给 出 的 字 段 信 息 选 中 此 选 项 后, 请 指 定 下 面 的 字 段 注 意, 用 于 存 储 日 期 的 字 段 不 能 用 作 目 标 字 段 或 输 入 字 段 目 标 选 择 一 个 或 多 个 目 标 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 目 标 类 似 时 间 序 列 模 型 的 目 标 字 段 必 须 具 有 连 续 的 测 量 级 别 可 为 每 个 目 标 字 段 创 建 单 独 的 模 型 目 标 字 段 会 将 除 自 身 外 的 所 有 指 定 的 输 入 字 段 作 为 可 能 的 输 入 因 此, 同 一 种 字 段 可 以 包 含 在 两 个 列 表 中 ; 除 了 以 此 字 段 作 为 目 标 的 模 型 外, 此 字 段 可 用 作 所 有 模 型 的 可 能 的 输 入 输 入 选 择 输 入 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 输 入 类 似 时 间 序 列 模 型 的 输 入 字 段 必 须 是 数 值 型 的

376 364 章 13 时 间 序 列 模 型 选 项 图 片 13-9 时 间 序 列 节 点 对 话 框, 模 型 选 项 卡 模 型 名 称 指 定 分 配 给 执 行 节 点 时 生 成 的 模 型 的 名 称 自 动 基 于 目 标 或 ID 字 段 名 自 动 生 成 模 型 名 称, 在 未 指 定 目 标 的 情 况 下 ( 例 如 聚 类 模 型 ), 基 于 模 型 类 型 名 称 自 动 生 成 模 型 名 称 自 定 义 可 为 模 型 块 指 定 自 定 义 名 称 使 用 现 有 模 型 继 续 评 估 如 果 已 生 成 一 个 时 间 序 列 模 型, 则 选 择 此 选 项 可 以 重 新 使 用 为 该 模 型 指 定 的 标 准 设 置, 并 在 模 型 选 项 板 中 生 成 一 个 新 的 模 型 节 点, 而 不 必 从 头 构 建 一 个 新 模 型 使 用 此 方 法 ( 即 基 于 与 以 前 相 同 的 模 型 设 置, 使 用 最 新 数 据 重 新 估 计 并 生 成 新 的 预 测 ) 可 以 节 省 时 间 例 如, 若 特 定 时 间 序 列 的 原 始 模 型 是 Holt s 线 性 趋 势, 则 会 使 用 相 同 的 模 型 类 型 重 新 估 计 和 预 测 该 数 据 ; 系 统 不 会 为 新 数 据 重 新 尝 试 查 找 最 适 合 的 模 型 类 型 选 择 此 选 项 可 禁 用 方 法 和 标 准 控 件 有 关 详 细 信 息, 请 参 阅 第 374 页 码 重 新 估 计 和 预 测 方 法 可 以 选 择 Expert Modeler 指 数 平 滑 或 ARIMA 有 关 详 细 信 息, 请 参 阅 第 361 页 码 时 间 序 列 建 模 节 点 选 择 标 准 可 为 选 定 的 方 法 指 定 选 项 Expert Modeler 选 择 此 选 项 以 使 用 Expert Modeler, 将 自 动 为 每 个 相 关 序 列 查 找 拟 合 得 最 好 的 模 型 指 数 平 滑 法 使 用 此 选 项 可 指 定 自 定 义 的 指 数 平 滑 法 模 型 ARIMA 使 用 此 选 项 可 指 定 自 定 义 的 ARIMA 模 型

377 365 时 间 序 列 模 型 时 间 区 间 信 息 对 话 框 的 此 部 分 包 含 了 有 关 在 时 间 区 间 节 点 上 进 行 估 计 和 预 测 所 使 用 的 规 范 信 息 注 意, 如 果 选 择 使 用 现 有 模 型 继 续 评 估 选 项, 则 此 部 分 不 会 显 示 该 信 息 的 第 一 行 表 示 在 模 型 中 是 否 有 任 何 记 录 被 排 除 或 保 留 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 估 计 时 限 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 第 二 行 提 供 了 有 关 在 时 间 区 间 节 点 上 指 定 的 任 何 预 测 时 限 的 信 息 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 预 测 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 如 果 第 一 行 显 示 为 未 定 义 时 间 区 间, 则 表 示 未 连 接 时 间 区 间 节 点 此 情 况 在 试 图 运 行 流 时 将 引 发 错 误 ; 必 须 在 时 间 序 列 节 点 的 上 游 包 括 时 间 区 间 节 点 其 他 杂 项 信 息 置 信 限 宽 度 (%) 将 为 模 型 预 测 值 和 残 差 自 相 关 计 算 置 信 区 间 可 以 指 定 小 于 100 的 任 何 正 数 默 认 情 况 下 使 用 95% 的 置 信 区 间 ACF 和 PACF 输 出 中 的 最 大 延 迟 数 可 以 设 置 在 自 相 关 和 偏 自 相 关 表 和 图 中 显 示 的 最 大 延 迟 数 仅 构 建 评 分 模 型 选 中 此 复 选 框 以 减 少 模 型 中 存 储 的 数 据 量 当 构 建 具 有 大 量 ( 数 万 个 ) 时 间 序 列 的 模 型 时, 这 样 做 有 助 于 提 高 性 能 如 果 选 择 了 此 项, 模 型 参 数 和 残 差 选 项 卡 不 会 显 示 在 时 间 序 列 模 型 块 中, 但 您 仍 然 可 以 按 常 规 方 式 对 数 据 进 行 评 分

378 366 章 13 时 间 序 列 Expert Modeler 标 准 图 片 Expert Modeler 标 准 对 话 框, 模 型 选 项 卡 模 型 类 型 可 用 选 项 包 括 : 所 有 模 型 Expert Modeler 既 考 虑 ARIMA 模 型 也 考 虑 指 数 平 滑 法 模 型 仅 指 数 平 滑 法 模 型 Expert Modeler 仅 考 虑 指 数 平 滑 法 模 型 仅 限 ARIMA 模 型 Expert Modeler 仅 考 虑 ARIMA 模 型 Expert Modeler 考 虑 季 节 性 模 型 只 有 在 为 活 动 数 据 集 定 义 了 周 期 性 时 才 启 用 此 选 项 选 中 此 选 项 时,Expert Modeler 将 同 时 考 虑 季 节 模 型 和 非 季 节 模 型 如 果 未 选 择 此 选 项, 则 Expert Modeler 仅 考 虑 非 季 节 性 模 型 事 件 和 干 预 可 将 特 定 输 入 字 段 指 定 为 事 件 字 段 或 干 预 字 段 此 操 作 可 将 字 段 标 识 为 包 含 受 事 件 ( 可 预 期 的 循 环, 如 促 销 活 动 ) 影 响 的 时 间 序 列 数 据, 或 是 包 含 受 干 预 ( 一 次 性 事 件, 如 停 电 或 雇 员 罢 工 ) 影 响 的 时 间 序 列 数 据 对 于 标 识 为 事 件 字 段 或 干 预 字 段 的 输 入,Expert Modeler 将 仅 考 虑 简 单 回 归 而 不 是 任 意 变 换 函 数 包 括 在 此 列 表 中 的 输 入 字 段 必 须 具 有 标 志 名 义 或 有 序 的 测 量 级 别, 并 且 必 须 是 数 字 ( 例 如, 对 于 标 志 字 段, 是 1/0 而 不 是 真 / 假 ) 有 关 详 细 信 息, 请 参 阅 第 357 页 码 脉 冲 和 步 进

379 367 时 间 序 列 模 型 界 外 值 图 片 专 家 建 模 器 条 件 对 话 框, 离 群 值 选 项 卡 自 动 检 测 离 群 值 默 认 情 况 下, 不 自 动 检 测 离 群 值 选 中 此 选 项 以 执 行 离 群 值 自 动 检 测, 然 后 选 择 所 需 的 离 群 值 类 型 有 关 详 细 信 息, 请 参 阅 第 358 页 码 离 群 值

380 368 章 13 时 间 序 列 指 数 平 滑 标 准 图 片 指 数 平 滑 法 条 件 对 话 框 模 型 类 型 指 数 平 滑 模 型 分 类 为 季 节 模 型 或 非 季 节 模 型 只 有 使 用 时 间 区 间 节 点 定 义 的 周 期 性 为 季 节 时, 才 可 使 用 季 节 模 型 季 节 周 期 性 有 : 循 环 周 期 年 季 度 月 一 周 中 的 天 一 天 中 的 小 时 一 天 中 的 分 钟 和 一 天 中 的 秒 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 时 间 区 间 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 简 单 此 模 型 适 合 于 其 中 没 有 趋 势 或 季 节 性 的 序 列 其 唯 一 的 相 关 平 滑 参 数 是 水 平 简 单 的 指 数 平 滑 模 型 非 常 类 似 于 自 回 归 阶 数 为 零 差 分 阶 数 为 一 移 动 平 均 阶 数 为 一 且 没 有 常 量 的 ARIMA 模 型 Holt s 线 性 趋 势 此 模 型 适 合 于 其 中 有 线 性 趋 势 但 没 有 季 节 性 的 序 列 其 相 关 的 平 滑 参 数 是 水 平 和 趋 势, 并 且 在 此 模 型 中, 这 些 参 数 的 值 不 会 彼 此 限 制 Holt s 模 型 比 Brown s 模 型 更 加 常 用, 但 在 计 算 大 型 序 列 的 估 计 值 时 会 花 费 更 多 的 时 间 Holt s 指 数 平 滑 模 型 非 常 类 似 于 自 回 归 阶 数 为 零 差 分 阶 数 为 二 且 移 动 平 均 阶 数 为 二 的 ARIMA 模 型 Brown s 线 性 趋 势 此 模 型 适 合 于 其 中 有 线 性 趋 势 但 没 有 季 节 性 的 序 列 其 相 关 的 平 滑 参 数 是 水 平 和 趋 势, 但 在 此 模 型 中, 这 些 参 数 的 值 假 设 相 等 因 此,Brown 模 型 是 Holt 模 型 的 特 例 Brown s 指 数 平 滑 模 型 非 常 类 似 于 自 回 归 阶 数 为 零 差 分 阶 数 为 二 且 移 动 平 均 阶 数 为 二 的 ARIMA 模 型, 其 第 二 阶 移 动 平 均 的 系 数 等 于 第 一 阶 的 系 数 的 平 方 的 一 半 阻 尼 趋 势 此 模 型 适 合 于 具 有 逐 渐 消 失 的 线 性 趋 势 但 没 有 季 节 性 的 序 列 其 相 关 的 平 滑 参 数 是 水 平 趋 势 和 阻 尼 趋 势 阻 尼 指 数 平 滑 模 型 非 常 类 似 于 自 回 归 阶 数 为 一 差 分 阶 数 为 一 且 移 动 平 均 阶 数 为 二 的 ARIMA 模 型 简 单 季 节 此 模 型 适 合 于 其 中 没 有 趋 势 且 季 节 效 应 不 随 时 间 变 化 的 序 列 其 相 关 的 平 滑 参 数 是 水 平 和 季 节 季 节 指 数 平 滑 模 型 非 常 类 似 于 自 回 归 阶 数 为 零 差 分 阶 数 为 一 季 节 差 分 阶 数 为 一 且 移 动 平 均 阶 数 为 1 p 和 p+1 的 ARIMA 模 型, 其 中 p 是 一 个 季 节 区 间 中 的 周 期 数 对 于 以 月 为 时 间 单 位 的 数 据,p = 12

381 369 时 间 序 列 模 型 Winters 加 法 此 模 型 适 合 于 具 有 线 性 趋 势 且 季 节 效 应 不 随 时 间 变 化 的 序 列 其 相 关 的 平 滑 参 数 是 水 平 趋 势 和 季 节 Winters 加 法 指 数 平 滑 模 型 非 常 类 似 于 自 回 归 阶 数 为 零 差 分 阶 数 为 一 季 节 差 分 阶 数 为 一 且 移 动 平 均 阶 数 为 p+1 的 ARIMA 模 型, 其 中 p 是 一 个 季 节 区 间 中 的 周 期 数 对 于 以 月 为 时 间 单 位 的 数 据,p = 12 Winters 乘 法 此 模 型 适 合 于 具 有 线 性 趋 势 且 季 节 效 应 随 序 列 的 大 小 变 化 的 序 列 其 相 关 的 平 滑 参 数 是 水 平 趋 势 和 季 节 Winters 的 可 乘 指 数 平 滑 法 与 任 何 ARIMA 模 型 都 不 相 似 目 标 变 换 可 指 定 在 对 每 个 因 变 量 建 模 前 对 其 执 行 的 变 换 有 关 详 细 信 息, 请 参 阅 第 360 页 码 序 列 变 换 无 不 执 行 任 何 转 换 平 方 根 执 行 平 方 根 变 换 自 然 对 数 执 行 自 然 对 数 变 换 时 间 序 列 ARIMA 标 准 通 过 时 间 序 列 节 点 可 以 选 择 在 构 建 自 定 义 非 季 节 或 季 节 ARIMA 模 型 ( 也 称 为 Box-Jenkins 模 型 ) 时, 是 否 使 用 确 定 的 输 入 变 量 ( 预 测 变 量 ) 集 可 以 为 任 何 或 所 有 输 入 变 量 定 义 变 换 函 数 并 指 定 对 离 群 值 的 自 动 检 测 或 精 确 设 置 所 有 指 定 的 输 入 变 量 都 明 确 包 括 在 模 型 中 这 与 使 用 Expert Modeler 有 所 不 同, 后 者 只 将 那 些 与 目 标 变 量 具 有 统 计 意 义 下 的 显 著 关 系 的 输 入 变 量 包 括 在 模 型 中 模 型 模 型 选 项 卡 用 于 指 定 自 定 义 的 ARIMA 模 型 的 结 构

382 370 章 13 图 片 ARIMA 条 件 对 话 框, 模 型 选 项 卡 ARIMA 阶 数 在 结 构 网 格 的 相 应 单 元 格 中, 输 入 模 型 的 各 个 ARIMA 成 分 的 值 所 有 值 都 必 须 为 非 负 整 数 对 于 自 回 归 和 移 动 平 均 数 成 分, 该 值 表 示 最 大 阶 模 型 中 将 包 含 所 有 正 的 较 低 阶 例 如, 如 果 指 定 2, 则 模 型 包 括 的 阶 数 是 2 和 1 只 有 在 已 为 活 动 数 据 集 定 义 了 周 期 性 时, 才 会 启 用 季 节 列 中 的 单 元 格 自 回 归 (p) 模 型 中 的 自 回 归 阶 数 自 回 归 阶 指 定 要 使 用 序 列 中 以 前 的 哪 些 值 来 预 测 当 前 值 例 如, 自 回 归 阶 为 2 时, 指 定 序 列 中 过 去 两 个 时 段 的 值 用 于 预 测 当 前 值 差 分 (d) 指 定 在 估 计 模 型 之 前 应 用 于 序 列 的 差 分 的 阶 在 出 现 趋 势 ( 具 有 趋 势 的 序 列 通 常 是 不 稳 序 列, 而 ARIMA 建 模 假 定 其 稳 定 ) 时 需 要 差 分, 并 将 其 用 于 去 除 其 影 响 差 分 的 阶 与 序 列 趋 势 度 相 对 应, 一 阶 差 分 导 致 线 性 趋 势, 二 阶 差 分 导 致 二 次 趋 势, 等 等 移 动 平 均 数 (q). 模 型 中 的 移 动 平 均 数 的 阶 数 移 动 平 均 数 的 阶 指 定 如 何 使 用 先 前 值 的 序 列 平 均 数 的 偏 差 来 预 测 当 前 值 例 如, 如 果 移 动 平 均 数 的 阶 为 1 和 2, 则 指 定 在 预 测 序 列 的 当 前 值 时 将 考 虑 上 两 个 时 段 的 每 个 时 段 中 的 序 列 的 平 均 值 的 偏 差 季 节 性 阶 季 节 性 自 回 归 成 分 移 动 平 均 数 成 分 和 差 分 成 分 与 其 非 季 节 性 对 应 成 分 起 着 相 同 的 作 用 但 对 于 季 节 性 的 阶, 当 前 序 列 值 受 以 前 的 序 列 值 的 影 响, 序 列 值 之 间 间 隔 一 个 或 多 个 季 节 性 周 期 例 如, 对 于 月 数 据 ( 季 节 性 周 期 为 12), 季 节 性 1 阶 表 示 当 前 序 列 值 受 自 当 前 周 期 起 12 个 周 期 之 前 的 序 列 值 的 影 响 因 此, 对 于 月 数 据, 指 定 季 节 性 1 阶 等 同 于 指 定 非 季 节 性 12 阶 目 标 变 换 可 指 定 在 对 每 个 目 标 变 量 建 模 前 对 其 执 行 的 变 换 有 关 详 细 信 息, 请 参 阅 第 360 页 码 序 列 变 换 无 不 执 行 任 何 转 换

383 371 时 间 序 列 模 型 平 方 根 执 行 平 方 根 变 换 自 然 对 数 执 行 自 然 对 数 变 换 在 模 型 中 包 含 常 数 除 非 您 确 定 整 个 平 均 数 序 列 值 为 0, 否 则 包 含 常 数 是 标 准 方 法 当 应 用 差 分 时, 建 议 不 包 含 常 数 传 输 函 数 图 片 ARIMA 标 准 对 话 框, 变 换 函 数 选 项 卡 使 用 变 换 函 数 选 项 卡 可 以 为 任 何 或 所 有 的 输 入 字 段 定 义 变 换 函 数 通 过 变 换 函 数 可 以 指 定 以 何 种 方 式 使 用 这 些 字 段 的 过 去 值 来 预 测 目 标 序 列 的 未 来 值 只 有 在 类 型 节 点 或 时 间 序 列 节 点 的 字 段 选 项 卡 上 ( 选 择 使 用 自 定 义 设 置 输 入 ) 指 定 输 入 字 段 ( 角 色 设 置 为 输 入 ) 时, 此 选 项 卡 才 会 显 示 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 设 置 字 段 角 色 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 顶 部 的 列 表 显 示 了 所 有 的 输 入 字 段 此 对 话 框 中 其 余 的 信 息 则 特 定 于 上 述 列 表 中 已 选 定 的 输 入 字 段 转 换 函 数 的 阶 数 在 结 构 网 格 的 相 应 单 元 格 中, 输 入 转 换 函 数 的 各 个 成 分 的 值 所 有 值 都 必 须 为 非 负 整 数 对 于 分 子 和 分 母 成 分, 该 值 代 表 最 大 阶 模 型 中 将 包 含 所 有 正 的 较 低 阶 此 外,0 阶 始 终 包 括 在 分 子 成 分 中 例 如, 如 果 将 分 子 阶 数 指 定 为 2, 则 该 模 型 包 括 的 阶 数 为 2 1 和 0 如 果 将 分 母 阶 数 指 定 为 3, 则 该 模 型 包 括 的 阶 数 为 3 2 和 1 只 有 在 已 为 活 动 数 据 集 定 义 了 周 期 性 时, 才 会 启 用 季 节 列 中 的 单 元 格 分 子 变 换 函 数 的 分 子 阶 数 指 定 选 定 的 独 立 ( 预 测 变 量 ) 序 列 中 有 哪 些 以 前 的 值 用 于 预 测 相 关 序 列 的 当 前 值 例 如, 分 子 的 阶 为 1 时, 指 定 独 立 序 列 过 去 一 个 时 间 段 的 值 ( 以 及 独 立 序 列 的 当 前 值 ) 用 于 预 测 每 个 相 依 序 列 的 当 前 值

384 372 章 13 分 母 变 换 函 数 的 分 母 阶 数 指 定 如 何 使 用 与 选 定 独 立 ( 预 测 变 量 ) 序 列 以 前 值 均 值 之 间 的 偏 差 来 预 测 相 关 序 列 的 当 前 值 例 如, 分 母 的 阶 为 1 时, 指 定 在 预 测 每 个 相 依 序 列 的 当 前 值 时 考 虑 独 立 序 列 过 去 一 个 时 间 段 的 平 均 值 偏 差 差 分 指 定 在 估 计 模 型 之 前 应 用 于 所 选 独 立 ( 预 测 ) 序 列 的 差 分 的 阶 数 存 在 趋 势 时 必 须 使 用 差 分 来 去 除 其 效 果 季 节 性 阶 季 节 性 分 子 分 母 和 差 分 成 分 与 其 非 季 节 性 对 应 成 分 起 着 相 同 的 作 用 但 对 于 季 节 性 的 阶, 当 前 序 列 值 受 以 前 的 序 列 值 的 影 响, 序 列 值 之 间 间 隔 一 个 或 多 个 季 节 性 周 期 例 如, 对 于 月 数 据 ( 季 节 性 周 期 为 12), 季 节 性 1 阶 表 示 当 前 序 列 值 受 自 当 前 周 期 起 12 个 周 期 之 前 的 序 列 值 的 影 响 因 此, 对 于 月 数 据, 指 定 季 节 性 1 阶 等 同 于 指 定 非 季 节 性 12 阶 延 迟 设 置 延 迟 会 使 输 入 字 段 的 影 响 在 指 定 数 目 的 时 间 间 隔 后 才 产 生 例 如, 如 果 延 迟 设 置 为 5, 则 输 入 字 段 在 时 间 t 不 会 产 生 影 响, 直 到 此 后 五 个 时 限 后 (t + 5) 才 会 对 预 测 产 生 影 响 转 换 为 自 变 量 指 定 的 变 换 函 数 也 可 对 这 些 变 量 上 执 行 ( 可 选 ) 变 换 无 不 执 行 任 何 转 换 平 方 根 执 行 平 方 根 变 换 自 然 对 数 执 行 自 然 对 数 变 换 处 理 离 群 值 图 片 ARIMA 条 件 对 话 框, 离 群 值 选 项 卡 离 群 值 选 项 卡 为 处 理 数 据 中 的 离 群 值 提 供 了 多 种 选 择

385 373 时 间 序 列 模 型 不 检 测 离 群 值 或 为 其 建 模 默 认 情 况 下, 不 检 测 离 群 值, 也 不 为 其 建 模 选 择 此 选 项 可 禁 用 任 何 检 测 离 群 值 或 为 其 建 模 的 功 能 自 动 检 测 离 群 值 选 中 此 选 项 以 对 离 群 值 执 行 自 动 检 测, 并 选 择 一 个 或 多 个 显 示 的 离 群 值 类 型 要 检 测 的 离 群 值 类 型 选 择 要 检 测 的 离 群 值 类 型 支 持 的 类 型 有 : 加 法 ( 默 认 ) 层 移 动 ( 默 认 ) 创 新 的 瞬 时 的 季 节 性 可 加 的 局 部 趋 势 可 加 的 修 补 有 关 详 细 信 息, 请 参 阅 第 358 页 码 离 群 值 生 成 时 间 序 列 模 型 本 章 介 绍 关 于 生 成 时 间 序 列 模 型 的 某 些 方 面 的 一 般 信 息 : 生 成 多 个 模 型 使 用 时 间 序 列 模 型 进 行 预 测 重 新 估 计 和 预 测 生 成 的 模 型 块 在 单 独 主 题 中 介 绍 有 关 详 细 信 息, 请 参 阅 第 374 页 码 时 间 序 列 模 型 块 生 成 多 个 模 型 IBM SPSS Modeler 中 的 时 间 序 列 建 模 会 为 每 个 目 标 字 段 生 成 一 个 模 型 (ARIMA 模 型 或 指 数 平 滑 模 型 ) 因 此, 如 果 有 多 个 目 标 字 段, 则 SPSS Modeler 会 在 一 个 操 作 中 生 成 多 个 模 型, 这 样 不 仅 节 省 了 时 间, 还 可 以 对 每 个 模 型 的 设 置 进 行 比 较 如 果 要 比 较 相 同 目 标 字 段 的 ARIMA 模 型 和 指 数 平 滑 模 型, 可 以 分 别 运 行 时 间 序 列 节 点, 每 次 指 定 一 个 不 同 的 模 型 使 用 时 间 序 列 模 型 进 行 预 测 时 间 序 列 构 建 操 作 使 用 有 序 案 例 的 特 定 序 列 ( 也 称 为 估 计 范 围 ), 来 构 建 可 用 于 预 测 序 列 的 未 来 值 的 模 型 此 模 型 包 含 有 关 使 用 的 时 间 范 围 ( 包 括 区 间 ) 的 信 息 为 了 使 用 此 模 型 进 行 预 测, 对 于 目 标 变 量 和 预 测 变 量, 必 须 使 用 相 同 的 时 间 范 围 和 区 间 信 息 及 相 同 的 序 列 例 如, 假 设 在 一 月 初 时 要 预 测 产 品 1 在 该 年 前 三 个 月 中 每 月 的 销 售 情 况 可 使 用 产 品 1 在 上 一 年 的 一 月 到 十 二 月 ( 我 们 称 为 年 份 1) 之 间 的 实 际 每 月 销 售 数 据 来 构 建 模 型, 并 将 时 间 区 间 设 置 为 月 然 后 可 使 用 此 模 型 预 测 产 品 1 在 年 份 2 的 前 三 个 月 的 销 售 情 况

386 374 章 13 实 际 上 可 以 对 未 来 任 何 月 数 内 的 情 况 进 行 预 测, 不 过 可 以 肯 定 的 是, 试 图 预 测 的 未 来 时 间 越 远, 模 型 的 预 测 效 果 将 会 越 差 但 是, 无 法 对 年 份 2 的 前 三 个 星 期 的 情 况 进 行 预 测, 因 为 用 于 构 建 模 型 的 区 间 为 月 使 用 此 模 型 预 测 产 品 2 的 销 售 同 样 是 没 有 意 义 的, 因 为 一 个 时 间 序 列 模 型 只 与 用 于 定 义 此 模 型 的 数 据 相 关 有 关 详 细 信 息, 请 参 阅 第 15 章 中 的 使 用 时 间 序 列 节 点 进 行 预 测 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 重 新 估 计 和 预 测 已 将 估 计 时 限 硬 编 码 到 生 成 的 模 型 中 这 表 示 如 果 将 当 前 模 型 应 用 于 新 数 据, 估 计 时 限 之 外 的 所 有 值 都 将 被 忽 略 因 此, 每 当 有 可 用 的 新 数 据 时, 都 必 须 对 时 间 序 列 模 型 进 行 重 新 估 计, 这 与 其 他 IBM SPSS Modeler 模 型 不 同, 在 后 者 中, 不 用 更 改 就 可 将 模 型 重 新 应 用 于 评 分 继 续 上 述 示 例, 假 设 在 年 份 2 的 四 月 初, 已 具 有 从 一 月 到 三 月 的 实 际 每 月 销 售 数 据 但 是, 如 果 重 新 应 用 在 一 月 初 生 成 的 模 型, 该 模 型 会 忽 视 此 时 限 内 已 知 的 销 售 数 据 而 再 次 预 测 一 月 到 三 月 的 销 售 情 况 解 决 方 案 为 基 于 更 新 的 实 际 数 据 生 成 新 的 模 型 假 设 不 更 改 预 测 参 数, 新 模 型 用 于 预 测 下 一 个 三 个 月, 即 四 月 到 六 月 如 果 仍 可 访 问 用 于 生 成 原 始 模 型 的 流, 则 仅 需 使 用 包 含 已 更 新 数 据 的 文 件 引 用 替 换 该 流 中 的 源 文 件 引 用, 并 重 新 运 行 流 以 生 成 新 模 型 但 是, 如 果 可 以 使 用 的 只 有 保 存 在 文 件 中 的 原 始 模 型, 则 仍 可 使 用 该 模 型 生 成 时 间 序 列 节 点, 然 后 将 此 节 点 添 加 到 包 含 已 更 新 源 文 件 引 用 的 新 流 中 假 设 在 此 新 流 中 时 间 区 间 节 点 ( 其 中 已 将 区 间 设 置 为 月 ) 在 时 间 序 列 节 点 之 前 插 入, 则 运 行 此 新 流 会 生 成 需 要 的 新 模 型 有 关 详 细 信 息, 请 参 阅 第 15 章 中 的 重 新 应 用 时 间 序 列 模 型 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 时 间 序 列 模 型 块 时 间 序 列 建 模 操 作 使 用 如 下 所 示 的 前 缀 $TS- 创 建 多 个 新 字 段 : $TS-colname 每 个 目 标 序 列 模 型 预 测 的 值 $TSLCI-colname 每 个 已 预 测 序 列 的 置 信 区 间 下 限 值 * $TSUCI-colname 每 个 已 预 测 序 列 的 置 信 区 间 上 限 值 * $TSNR-colname 每 列 生 成 的 模 型 数 据 中 的 噪 声 残 差 值 * $TS-Total 此 行 中 $TS-colname 的 总 值 $TSLCI-Total 此 行 中 $TSLCI-colname 的 总 值 * $TSUCI-Total 此 行 中 $TSUCI-colname 的 总 值 * $TSNR-Total 此 行 中 $TSNR-colname 的 总 值 * * 这 些 字 段 的 可 见 性 ( 例 如, 在 添 加 表 格 节 点 的 输 出 中 ) 取 决 于 时 间 序 列 模 型 块 的 设 置 选 项 卡 上 的 选 项 有 关 详 细 信 息, 请 参 阅 第 380 页 码 时 间 序 列 模 型 设 置

387 375 时 间 序 列 模 型 图 片 时 间 序 列 模 型 块, 模 型 选 项 卡 对 于 输 入 到 时 间 序 列 构 建 节 点 中 的 每 个 序 列, 时 间 序 列 模 型 块 将 显 示 为 这 些 序 列 选 择 的 不 同 模 型 的 详 细 信 息 可 以 输 入 多 个 序 列 ( 例 如 有 关 产 品 线 地 区 或 仓 库 的 数 据 ), 且 对 于 每 个 目 标 序 列 可 生 成 一 个 独 立 的 模 型 例 如, 如 果 认 为 东 部 地 区 的 收 入 可 拟 合 ARIMA 模 型, 但 西 部 地 区 的 收 入 仅 能 拟 合 简 单 移 动 平 均 模 型, 则 会 使 用 适 合 的 模 型 对 每 个 地 区 进 行 评 分 对 于 每 个 构 建 的 模 型, 默 认 的 输 出 有 : 模 型 类 型 指 定 的 预 测 变 量 数 及 拟 合 优 度 测 量 ( 默 认 为 平 稳 的 R 平 方 ) 如 果 已 指 定 离 群 值 方 法, 则 会 有 一 列 用 于 显 示 检 测 到 的 离 群 值 数 默 认 输 出 还 包 括 Ljung-Box Q 列 自 由 度 列 和 显 著 相 关 值 列 还 可 以 选 择 高 级 输 出, 其 中 将 显 示 以 下 附 加 列 : R 方 RMSE( 均 方 根 误 差 ) MAPE( 平 均 绝 对 百 分 误 差 ) MAE( 平 均 绝 对 误 差 ) MaxAPE( 最 大 绝 对 百 分 比 误 差 )

388 376 章 13 MaxAE( 最 大 绝 对 误 差 ) 标 准 化 BIC( 标 准 化 贝 叶 斯 信 息 准 则 ) 生 成 可 以 回 到 流 或 选 项 板 的 模 型 块 生 成 时 间 序 列 建 模 节 点 生 成 建 模 节 点 使 用 用 于 创 建 此 模 型 集 的 设 置 将 时 间 序 列 建 模 节 点 放 置 到 流 中 举 例 而 言, 此 操 作 的 意 义 在 于, 如 果 要 使 用 这 些 模 型 设 置, 却 找 不 到 用 于 生 成 这 些 设 置 的 建 模 节 点 时, 可 以 在 流 中 获 得 这 些 设 置 模 型 到 调 色 板 将 包 含 所 有 目 标 的 模 型 块 放 置 到 模 型 管 理 器 中 模 型 图 片 选 中 所 有 按 钮 和 取 消 选 中 所 有 按 钮 复 选 框 选 择 要 用 于 评 分 的 模 型 默 认 情 况 下 会 选 中 所 有 复 选 框 选 中 所 有 和 取 消 选 中 所 有 按 钮 会 以 一 个 简 单 的 操 作 作 用 于 所 有 的 复 选 框 排 序 依 据 可 以 按 升 序 或 降 序 顺 序 对 指 定 显 示 列 的 输 出 行 进 行 排 序 选 定 选 项 可 根 据 由 复 选 框 选 定 的 一 行 或 多 行 对 输 出 进 行 排 序 举 例 而 言, 此 操 作 的 意 义 在 于, 使 名 称 为 从 Market_1 到 Market_9 之 间 的 目 标 字 段 显 示 在 Market_10 之 前, 因 为 在 默 认 排 序 顺 序 下, Market_10 将 直 接 显 示 在 Market_1 之 后 视 图 默 认 视 图 ( 简 单 ) 将 显 示 基 本 的 输 出 列 的 集 合 高 级 选 项 将 显 示 拟 合 优 度 测 量 的 附 加 列 估 计 中 使 用 的 记 录 数 原 始 源 数 据 文 件 中 的 行 数 目 标 类 型 节 点 中 标 识 为 目 标 字 段 ( 角 色 为 目 标 的 字 段 ) 的 字 段 模 型 用 于 此 目 标 字 段 的 模 型 类 型 预 测 变 量 用 于 此 目 标 字 段 的 预 测 变 量 ( 角 色 为 输 入 的 字 段 ) 数 离 群 值 只 有 在 已 请 求 ( 在 Expert Modeler 或 ARIMA 标 准 中 ) 自 动 检 测 离 群 值 时, 才 会 显 示 此 列 显 示 的 值 为 检 测 到 的 离 群 值 数 固 定 的 R 方. 将 模 型 的 平 稳 部 分 与 简 单 均 值 模 型 相 比 较 的 测 量 当 具 有 趋 势 或 季 节 性 模 式 时, 该 度 量 适 用 于 普 通 R 方 固 定 的 R 方 可 以 是 负 无 穷 大 到 1 范 围 中 的 负 值 负 值 表 示 考 虑 中 的 模 型 比 基 线 模 型 差 正 值 表 示 考 虑 中 的 模 型 比 基 线 模 型 好 R 方. 线 性 模 型 的 拟 合 优 度, 有 时 称 为 判 定 系 数 它 是 因 变 量 的 变 动 中, 由 回 归 模 型 解 释 的 比 例 其 值 的 范 围 为 0 到 1 如 果 值 较 小, 则 表 示 该 模 型 与 数 据 的 拟 合 度 不 好 RMSE. 均 方 根 误 差 均 方 误 差 的 平 方 根 度 量 因 变 量 序 列 与 其 模 型 预 测 水 平 的 相 差 程 度, 用 和 因 变 量 序 列 相 同 的 单 位 表 示 MAPE. 平 均 绝 对 误 差 百 分 比 度 量 因 变 量 序 列 与 其 模 型 预 测 水 平 的 相 差 程 度 它 与 使 用 的 单 位 无 关, 因 此 可 用 于 比 较 具 有 不 同 单 位 的 序 列 MAE. 平 均 绝 对 误 差 度 量 序 列 与 其 模 型 预 测 水 平 的 差 别 程 度 MAE 以 原 始 序 列 单 位 报 告 MaxAPE. 最 大 绝 对 误 差 百 分 比 最 大 的 预 测 误 差, 以 百 分 比 表 示 该 度 量 对 于 想 象 预 测 的 最 坏 情 况 方 案 很 有 用

389 377 时 间 序 列 模 型 MaxAE. 最 大 绝 对 误 差 最 大 的 预 测 误 差, 以 和 因 变 量 序 列 相 同 的 单 位 表 示 与 MaxAPE 相 同, 它 对 于 想 象 预 测 的 最 坏 情 况 方 案 很 有 用 最 大 绝 对 误 差 和 最 大 绝 对 误 差 百 分 比 可 能 发 生 在 不 同 的 序 列 点 上, 例 如, 当 较 大 序 列 的 绝 对 误 差 比 较 小 值 的 绝 对 误 差 稍 微 大 一 些 时 在 此 情 况 下, 最 大 绝 对 误 差 将 发 生 在 较 大 序 列 值 处, 而 最 大 绝 对 误 差 百 分 比 将 发 生 在 较 小 序 列 值 处 标 准 化 的 BIC. 标 准 化 的 BIC(BIC 准 则 ) 尝 试 代 表 模 型 复 杂 性 的 模 型 整 体 拟 合 的 一 般 度 量 它 是 基 于 均 方 误 差 的 分 数, 包 括 模 型 中 参 数 数 量 的 罚 分 和 序 列 长 度 罚 分 去 除 了 具 有 更 多 参 数 的 模 型 优 势, 从 而 可 以 容 易 地 比 较 相 同 序 列 的 不 同 模 型 的 统 计 量 Q Ljung-Box Q 统 计 量 该 模 型 中 残 差 错 误 的 随 机 测 试 df 自 由 度 估 计 特 定 目 标 时 自 由 变 化 的 模 型 参 数 量 显 著 水 平 Ljung-Box 统 计 量 的 显 著 性 值 显 著 性 值 小 于 0.05 表 示 残 差 错 误 不 是 随 机 的 摘 要 统 计 量 此 部 分 包 含 了 不 同 列 的 各 种 汇 总 统 计 量, 包 括 均 值 最 小 值 最 大 值 和 百 分 位 数 值 时 间 序 列 模 型 参 数 图 片 时 间 序 列 模 型, 参 数 选 项 卡 参 数 选 项 卡 列 出 用 于 构 建 选 定 模 型 的 各 种 参 数 的 详 细 信 息 显 示 模 型 的 参 数 选 择 为 其 显 示 参 数 详 细 信 息 的 模 型 目 标 该 模 型 预 测 的 目 标 字 段 ( 角 色 为 目 标 ) 的 名 称 模 型 用 于 此 目 标 字 段 的 模 型 类 型 字 段 ( 仅 ARIMA 模 型 ) 包 含 模 型 中 使 用 的 每 个 变 量 的 一 个 条 目, 第 一 个 是 目 标, 接 着 是 预 测 变 量 ( 如 果 有 ) 转 换 指 明 在 构 建 模 型 前 为 这 个 字 段 指 定 哪 一 种 变 换 类 型 ( 如 果 有 )

390 378 章 13 参 数 为 其 显 示 下 列 详 细 信 息 的 模 型 参 数 : 延 迟 ( 仅 ARIMA 模 型 ) 指 示 认 为 是 模 型 中 该 参 数 的 延 迟 ( 如 果 有 ) 估 计 值 参 数 估 计 值 该 值 用 于 计 算 预 测 值 和 目 标 字 段 的 置 信 区 间 SE 参 数 估 计 值 的 标 准 误 t 参 数 估 计 值 除 以 标 准 误 后 的 值 显 著 水 平 参 数 估 计 值 的 显 著 性 级 别 0.05 以 上 的 值 视 为 没 有 显 著 的 统 计 意 义 时 间 序 列 模 型 残 差 图 片 时 间 序 列 模 型, 残 差 选 项 卡 ( 显 示 ACF 和 PACF)

391 379 时 间 序 列 模 型 残 差 选 项 卡 为 每 个 构 建 的 模 型 显 示 了 残 差 ( 指 期 望 值 和 实 际 值 之 间 的 差 值 ) 的 自 相 关 函 数 (ACF) 和 偏 自 相 关 函 数 (PACF) 有 关 详 细 信 息, 请 参 阅 第 360 页 码 自 相 关 函 数 和 部 分 自 相 关 函 数 显 示 模 型 散 点 图 选 择 要 为 其 显 示 残 差 ACF 和 残 差 PACF 的 模 型 时 间 序 列 模 型 汇 总 图 片 时 间 序 列 模 型, 汇 总 选 项 卡 模 型 块 的 汇 总 选 项 卡 显 示 了 有 关 模 型 的 下 列 信 息 : 模 型 本 身 ( 分 析 ) 模 型 中 使 用 的 字 段 ( 字 段 ) 构 建 模 型 时 使 用 的 设 置 ( 构 建 设 置 ) 和 模 型 训 练 ( 训 练 概 要 )

392 380 章 13 当 第 一 次 浏 览 此 节 点 时, 汇 总 选 项 卡 的 结 果 是 折 叠 起 来 的 要 查 看 感 兴 趣 的 结 果, 可 使 用 项 目 左 侧 的 展 开 控 件 展 开 项 目, 或 单 击 全 部 展 开 按 钮 显 示 所 有 结 果 当 结 束 对 项 目 的 查 看 时, 为 了 隐 藏 结 果, 可 使 用 展 开 控 件 折 叠 要 隐 藏 的 特 定 结 果, 或 单 击 全 部 折 叠 按 钮 折 叠 所 有 结 果 分 析 显 示 指 定 模 型 的 相 关 信 息 字 段 列 出 构 建 模 型 时 用 作 目 标 和 输 入 的 字 段 构 建 设 置 包 含 有 关 在 构 建 模 型 中 使 用 的 设 置 的 信 息 训 练 概 要 显 示 模 型 类 型 用 于 创 建 模 型 的 流 模 型 创 建 者 模 型 构 建 完 成 时 间 和 模 型 构 建 所 用 时 间 时 间 序 列 模 型 设 置 图 片 时 间 序 列 模 型, 设 置 选 项 卡 使 用 设 置 选 项 卡, 可 以 指 定 通 过 建 模 操 作 创 建 哪 些 附 加 字 段 为 每 个 待 评 分 的 模 型 创 建 新 字 段 可 以 指 定 为 每 个 待 评 分 的 模 型 创 建 的 新 字 段 计 算 置 信 上 限 和 下 限 如 果 选 中, 则 对 于 每 个 目 标 字 段, 将 分 别 为 置 信 上 限 和 下 限 创 建 新 字 段 ( 默 认 前 缀 为 $TSLCI- 和 $TSUCI-), 并 同 时 创 建 这 些 值 的 合 计 字 段 计 算 噪 声 残 差 如 果 选 中, 则 对 于 每 个 目 标 字 段, 将 为 模 型 残 差 创 建 新 字 段 ( 默 认 前 缀 为 $TSNR-), 并 同 时 创 建 这 些 值 的 合 计 字 段

393 自 学 响 应 节 点 模 型 章 14 SLRM 节 点 使 用 自 学 响 应 模 型 (SLRM) 节 点, 可 以 构 建 这 样 的 模 型 : 随 着 数 据 集 的 增 长, 可 以 不 断 对 其 进 行 更 新 或 重 新 估 计, 而 不 必 每 次 使 用 整 个 数 据 集 重 新 构 建 该 模 型 例 如, 如 果 有 若 干 产 品, 而 您 希 望 确 定 某 位 客 户 获 得 报 价 后 最 有 可 能 购 买 的 产 品, 那 么 这 种 模 型 将 十 分 有 用 此 模 型 可 用 于 预 测 最 适 合 客 户 的 报 价, 以 及 该 报 价 被 接 受 的 概 率 最 初 构 建 模 型 时, 可 以 使 用 较 小 的 数 据 集, 其 中 的 报 价 和 对 这 些 报 价 的 响 应 可 以 随 机 选 择 随 着 数 据 集 的 增 长, 模 型 可 得 到 更 新, 从 而 越 发 能 够 根 据 其 他 输 入 字 段 ( 如 年 龄 性 别 职 业 和 收 入 ) 预 测 最 适 合 客 户 的 报 价 以 及 这 些 客 户 接 受 报 价 的 概 率 可 以 通 过 在 节 点 对 话 框 中 添 加 或 删 除 这 些 可 用 报 价 对 其 进 行 更 改, 而 不 必 更 改 数 据 集 的 目 标 字 段 如 果 与 IBM SPSS Collaboration and Deployment Services 一 起 使 用, 则 可 以 为 模 型 设 立 自 动 定 期 更 新 该 过 程 不 需 要 人 工 监 督 或 操 作 就 可 以 为 不 可 能 或 没 必 要 由 数 据 挖 掘 者 自 定 义 干 预 的 组 织 和 应 用 程 序 提 供 灵 活 且 成 本 低 的 解 决 方 案 示 例 某 金 融 机 构 希 望 为 每 位 客 户 提 供 最 有 可 能 接 受 的 报 价, 以 获 取 更 大 收 益 可 以 使 用 自 学 模 型 基 于 以 前 的 促 销 活 动 确 定 最 有 可 能 对 活 动 作 出 积 极 响 应 的 客 户 的 特 征, 并 根 据 最 近 的 客 户 响 应 实 时 更 新 该 模 型 有 关 详 细 信 息, 请 参 阅 第 17 章 中 的 向 客 户 报 价 ( 自 学 ) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南 Copyright IBM Corporation 1994,

394 382 章 14 SLRM 节 点 字 段 选 项 图 片 14-1 SLRM 节 点 对 话 框, 字 段 选 项 卡 执 行 SLRM 节 点 之 前, 必 须 在 节 点 的 字 段 选 项 卡 上 同 时 指 定 目 标 字 段 和 目 标 响 应 字 段 目 标 字 段 从 列 表 中 选 定 目 标 字 段 ; 例 如, 包 含 要 为 客 户 提 供 的 不 同 产 品 的 名 义 ( 集 合 ) 字 段 注 意 : 目 标 字 段 的 存 储 方 式 必 须 采 用 字 符 串 存 储 而 不 是 数 字 型 存 储 目 标 响 应 字 段 从 列 表 中 选 定 目 标 响 应 字 段 例 如, 接 受 或 拒 绝 注 意 : 此 字 段 必 须 是 标 志 字 段 标 志 的 真 值 表 示 报 价 接 受, 假 值 表 示 报 价 拒 绝 此 对 话 框 中 的 剩 余 字 段 是 整 个 IBM SPSS Modeler 中 通 用 的 标 准 字 段 有 关 详 细 信 息, 请 参 阅 第 30 页 码 第 3 章 中 的 建 模 节 点 字 段 选 项 注 意 : 如 果 源 数 据 包 括 要 用 作 连 续 ( 数 值 范 围 ) 输 入 字 段 的 范 围, 则 必 须 确 保 元 数 据 包 括 每 个 范 围 的 最 小 值 和 最 大 值

395 383 自 学 响 应 节 点 模 型 SLRM 节 点 模 型 选 项 图 片 14-2 SLRM 节 点 对 话 框, 模 型 选 项 卡 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 继 续 训 练 现 有 模 型 默 认 情 况 下, 每 当 执 行 一 个 建 模 节 点 时, 就 会 创 建 一 个 完 整 的 新 模 型 如 果 选 中 该 选 项, 则 会 继 续 训 练 该 节 点 成 功 生 成 的 最 后 一 个 模 型 这 样 就 可 以 在 无 需 访 问 原 始 数 据 的 情 况 下 更 新 或 刷 新 现 有 的 模 型, 并 可 能 会 显 著 提 升 性 能, 这 是 因 为 只 有 新 的 或 更 新 后 的 记 录 被 反 馈 到 流 中 上 一 个 模 型 的 详 细 信 息 与 建 模 节 点 存 储 在 一 起, 这 样 即 使 先 前 的 模 型 块 在 流 或 模 型 选 项 板 中 不 再 可 用 的 情 况 下, 也 可 以 使 用 该 选 项 目 标 字 段 值 默 认 情 况 下 会 将 此 选 项 设 置 为 使 用 全 部, 表 示 将 构 建 包 含 所 选 目 标 字 段 值 的 每 个 关 联 报 价 的 模 型 如 果 希 望 生 成 仅 包 含 目 标 字 段 的 某 些 报 价 的 模 型, 请 单 击 指 定, 并 使 用 添 加 编 辑 和 删 除 按 钮 输 入 或 修 改 要 为 其 构 建 模 型 的 报 价 的 名 称 例 如, 如 果 选 择 的 目 标 是 列 出 提 供 的 所 有 产 品, 则 可 以 使 用 此 字 段 将 提 供 报 价 的 产 品 限 制 为 在 此 输 入 的 产 品 模 型 评 估 此 面 板 中 的 字 段 与 模 型 不 相 关, 这 些 字 段 不 会 影 响 所 在 模 型 的 评 分 不 过, 这 些 字 段 有 助 于 形 成 一 个 直 观 表 示, 显 示 模 型 预 测 结 果 的 准 确 程 度

396 384 章 14 注 意 : 要 在 模 型 块 中 显 示 模 型 评 估 结 果, 还 必 须 选 中 显 示 模 型 评 估 复 选 框 包 括 模 型 评 估 选 中 此 框 可 创 建 针 对 每 项 所 选 报 价 显 示 模 型 预 测 准 确 性 的 图 形 设 置 随 机 数 种 子 根 据 随 机 百 分 比 估 计 模 型 准 确 性 时, 此 选 项 可 用 于 在 另 一 会 话 中 复 制 相 同 结 果 通 过 指 定 随 机 数 生 成 器 所 使 用 的 起 始 值, 可 以 确 保 在 每 次 执 行 节 点 时 都 会 分 配 相 同 的 记 录 输 入 所 需 的 种 子 值 如 果 未 选 中 该 选 项, 则 每 次 执 行 节 点 时 会 生 成 不 同 的 抽 样 模 拟 样 本 大 小 指 定 评 估 模 型 时 样 本 中 要 使 用 的 记 录 数 默 认 值 为 100 迭 代 数 使 用 此 选 项 可 在 经 过 指 定 的 迭 代 数 后 停 止 构 建 模 型 评 估 指 定 最 大 迭 代 次 数 ; 默 认 值 为 20 注 意 : 记 住, 样 本 大 小 较 大 及 迭 代 次 数 较 多 会 增 加 构 建 模 型 所 用 的 时 间 显 示 模 型 评 估 选 中 此 选 项 可 使 用 图 形 显 示 模 型 块 中 的 结 果 SLRM 节 点 设 置 选 项 图 片 14-3 SLRM 节 点 对 话 框, 设 置 选 项 卡 使 用 节 点 设 置 选 项 可 微 调 模 型 构 建 过 程 每 条 记 录 的 最 大 预 测 数 使 用 此 选 项, 可 以 限 制 对 数 据 集 中 每 条 记 录 进 行 的 预 测 的 次 数 默 认 值 为 3

397 385 自 学 响 应 节 点 模 型 例 如, 您 有 六 项 报 价 ( 如 储 蓄 抵 押 汽 车 贷 款 退 休 金 信 用 卡 和 保 险 ), 但 只 想 了 解 最 适 于 推 荐 的 两 项 ; 这 时 应 将 此 字 段 设 为 2 当 您 构 建 模 型 并 将 其 附 加 到 表 中 时, 会 看 到 每 条 记 录 有 两 个 预 测 列 ( 以 及 接 受 的 报 价 的 相 关 置 信 概 率 ) 预 测 可 以 由 六 种 可 能 报 价 中 的 任 意 报 价 组 成 随 机 化 等 级 为 避 免 任 何 偏 差 ( 例 如, 在 小 型 或 不 完 整 的 数 据 集 中 ) 并 平 等 对 待 所 有 可 能 的 报 价, 可 以 为 选 择 的 报 价 及 其 作 为 推 荐 报 价 被 纳 入 的 概 率 添 加 随 机 化 等 级 随 机 化 表 示 为 百 分 比, 以 0.0( 无 随 机 化 ) 与 1.0( 完 全 随 机 化 ) 之 间 小 数 值 的 形 式 显 示 默 认 值 为 0.0 设 置 随 机 数 种 子 为 选 择 的 报 价 添 加 随 机 化 等 级 时, 可 使 用 此 选 项 在 另 一 个 会 话 中 复 制 相 同 结 果 通 过 指 定 随 机 数 生 成 器 所 使 用 的 起 始 值, 可 以 确 保 在 每 次 执 行 节 点 时 都 会 分 配 相 同 的 记 录 输 入 所 需 的 种 子 值 如 果 未 选 中 该 选 项, 则 每 次 执 行 节 点 时 会 生 成 不 同 的 抽 样 注 意 : 为 从 数 据 库 中 读 取 的 记 录 选 择 设 置 随 机 数 种 子 选 项 时, 可 能 在 抽 样 前 需 要 使 用 排 序 节 点 以 确 保 每 次 执 行 节 点 时 能 得 到 相 同 的 结 果 这 是 因 为 随 机 种 子 依 赖 于 记 录 的 顺 序, 而 在 关 系 数 据 库 中 不 能 保 证 记 录 具 有 这 种 顺 序 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 排 序 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 排 列 次 序 选 择 报 价 在 所 构 建 模 型 中 的 显 示 顺 序 : 降 序 模 型 首 先 显 示 得 分 最 高 的 报 价 这 些 报 价 被 接 受 的 概 率 最 高 升 序 模 型 首 先 显 示 得 分 最 低 的 报 价 这 些 报 价 被 拒 绝 的 概 率 最 高 例 如, 在 决 定 要 从 某 种 特 定 报 价 的 营 销 活 动 中 删 除 哪 些 客 户 时, 这 种 顺 序 相 当 实 用 目 标 字 段 的 首 选 项 构 建 模 型 时, 您 可 能 希 望 对 数 据 的 某 些 方 面 进 行 主 动 推 广 或 删 除 例 如, 如 果 构 建 用 于 选 择 为 某 个 客 户 推 荐 的 最 佳 财 务 报 价 的 模 型, 您 可 能 需 要 确 保 始 终 包 含 一 种 特 定 报 价 ( 无 论 其 对 于 每 个 客 户 的 得 分 如 何 ) 要 在 此 面 板 中 包 含 某 项 报 价 并 编 辑 其 首 选 项, 请 单 击 添 加, 键 入 报 价 的 名 称 ( 例 如, 储 蓄 或 抵 押 ), 然 后 单 击 确 定 值 此 选 项 将 显 示 您 添 加 的 报 价 的 名 称 首 选 度 指 定 要 应 用 于 报 价 的 首 选 度 等 级 首 选 度 表 示 为 百 分 比, 以 0.0( 非 首 选 ) 与 1.0( 最 首 选 ) 之 间 小 数 值 的 形 式 显 示 默 认 值 为 0.0 始 终 包 括 要 确 保 某 项 特 定 报 价 始 终 包 含 于 预 测 中, 请 选 中 此 框 注 意 : 如 果 将 首 选 度 设 为 0.0, 将 忽 略 始 终 包 括 设 置 SLRM 模 型 块 考 虑 模 型 可 靠 性 与 数 据 极 少 的 全 新 模 型 相 比, 已 通 过 多 次 重 新 生 成 进 行 微 调 的 结 构 良 好 数 据 丰 富 的 模 型 应 当 始 终 产 生 更 精 确 的 结 果 要 利 用 较 成 熟 模 型 具 有 的 较 高 可 靠 性, 请 选 中 此 框 注 意 : 如 果 在 模 型 选 项 选 项 卡 上 同 时 选 中 包 括 模 型 评 估 和 显 示 模 型 评 估, 则 仅 在 此 选 项 卡 上 显 示 结 果

398 386 章 14 图 片 14-4 SLRM 模 型 块 显 示 在 运 行 包 含 SLRM 模 型 的 流 时, 该 节 点 会 估 计 每 个 目 标 字 段 值 ( 报 价 ) 的 预 测 准 确 性, 以 及 所 用 的 每 个 预 测 变 量 的 重 要 性 注 意 : 如 果 您 选 中 了 建 模 节 点 模 型 选 项 卡 中 的 继 续 训 练 现 有 模 型, 则 每 次 生 成 模 型 时 都 会 更 新 模 型 块 上 显 示 的 信 息 对 于 使 用 IBM SPSS Modeler 12.0 或 更 高 版 本 构 建 的 模 型, 模 型 块 的 模 型 选 项 卡 分 为 两 列 : 左 列 视 图 有 多 项 报 价 时, 选 择 要 显 示 其 结 果 的 一 项 报 价 模 型 性 能 显 示 针 对 每 个 报 价 所 估 计 的 模 型 的 准 确 性 测 试 集 合 通 过 模 拟 生 成 右 列 视 图 选 择 是 否 要 显 示 与 响 应 之 间 的 关 联 或 变 量 重 要 性 的 详 细 信 息

399 387 自 学 响 应 节 点 模 型 与 响 应 之 间 的 关 联 显 示 每 个 预 测 变 量 与 目 标 变 量 之 间 的 关 联 ( 相 关 ) 预 测 变 量 重 要 性 表 示 在 估 计 模 型 过 程 中 每 个 预 测 变 量 的 相 对 重 要 性 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 虽 然 在 使 用 SLRM 的 情 况 下, 图 形 是 由 SLRM 算 法 模 拟 生 成 的, 但 该 图 表 可 用 解 释 其 他 显 示 预 测 变 量 重 要 性 的 模 型 的 方 式 进 行 解 释 方 法 是 : 依 次 从 模 型 中 删 除 每 个 预 测 变 量, 然 后 查 看 此 操 作 对 模 型 准 确 性 的 影 响 如 何 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 SLRM 模 型 设 置 在 SLRM 模 型 块 的 设 置 选 项 卡 中 可 指 定 选 项 以 修 改 已 构 建 的 模 型 例 如, 可 以 通 过 SLRM 节 点 使 用 相 同 的 数 据 和 设 置 构 建 几 个 不 同 的 模 型, 然 后 使 用 每 个 模 型 中 的 此 选 项 卡 对 设 置 稍 做 修 改 以 查 看 其 对 结 果 的 影 响 注 意 : 只 有 将 模 型 块 添 加 到 流 中 之 后, 此 选 项 卡 才 可 用 图 片 14-5 SLRM 模 型 块 对 话 框, 设 置 选 项 卡 每 条 记 录 的 最 大 预 测 数 使 用 此 选 项, 可 以 限 制 对 数 据 集 中 每 条 记 录 进 行 的 预 测 的 次 数 默 认 值 为 3

400 388 章 14 例 如, 您 有 六 项 报 价 ( 如 储 蓄 抵 押 汽 车 贷 款 退 休 金 信 用 卡 和 保 险 ), 但 只 想 了 解 最 适 于 推 荐 的 两 项 ; 这 时 应 将 此 字 段 设 为 2 当 您 构 建 模 型 并 将 其 附 加 到 表 中 时, 会 看 到 每 条 记 录 有 两 个 预 测 列 ( 以 及 接 受 的 报 价 的 相 关 置 信 概 率 ) 预 测 可 以 由 六 种 可 能 报 价 中 的 任 意 报 价 组 成 随 机 化 等 级 为 避 免 任 何 偏 差 ( 例 如, 在 小 型 或 不 完 整 的 数 据 集 中 ) 并 平 等 对 待 所 有 可 能 的 报 价, 可 以 为 选 择 的 报 价 及 其 作 为 推 荐 报 价 被 纳 入 的 概 率 添 加 随 机 化 等 级 随 机 化 表 示 为 百 分 比, 以 0.0( 无 随 机 化 ) 与 1.0( 完 全 随 机 化 ) 之 间 小 数 值 的 形 式 显 示 默 认 值 为 0.0 设 置 随 机 数 种 子 为 选 择 的 报 价 添 加 随 机 化 等 级 时, 可 使 用 此 选 项 在 另 一 个 会 话 中 复 制 相 同 结 果 通 过 指 定 随 机 数 生 成 器 所 使 用 的 起 始 值, 可 以 确 保 在 每 次 执 行 节 点 时 都 会 分 配 相 同 的 记 录 输 入 所 需 的 种 子 值 如 果 未 选 中 该 选 项, 则 每 次 执 行 节 点 时 会 生 成 不 同 的 抽 样 注 意 : 为 从 数 据 库 中 读 取 的 记 录 选 择 设 置 随 机 数 种 子 选 项 时, 可 能 在 抽 样 前 需 要 使 用 排 序 节 点 以 确 保 每 次 执 行 节 点 时 能 得 到 相 同 的 结 果 这 是 因 为 随 机 种 子 依 赖 于 记 录 的 顺 序, 而 在 关 系 数 据 库 中 不 能 保 证 记 录 具 有 这 种 顺 序 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 排 序 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 排 列 次 序 选 择 报 价 在 所 构 建 模 型 中 的 显 示 顺 序 : 降 序 模 型 首 先 显 示 得 分 最 高 的 报 价 这 些 报 价 被 接 受 的 概 率 最 高 升 序 模 型 首 先 显 示 得 分 最 低 的 报 价 这 些 报 价 被 拒 绝 的 概 率 最 高 例 如, 在 决 定 要 从 某 种 特 定 报 价 的 营 销 活 动 中 删 除 哪 些 客 户 时, 这 种 顺 序 相 当 实 用 目 标 字 段 的 首 选 项 构 建 模 型 时, 您 可 能 希 望 对 数 据 的 某 些 方 面 进 行 主 动 推 广 或 删 除 例 如, 如 果 构 建 用 于 选 择 为 某 个 客 户 推 荐 的 最 佳 财 务 报 价 的 模 型, 您 可 能 需 要 确 保 始 终 包 含 一 种 特 定 报 价 ( 无 论 其 对 于 每 个 客 户 的 得 分 如 何 ) 要 在 此 面 板 中 包 含 某 项 报 价 并 编 辑 其 首 选 项, 请 单 击 添 加, 键 入 报 价 的 名 称 ( 例 如, 储 蓄 或 抵 押 ), 然 后 单 击 确 定 值 此 选 项 将 显 示 您 添 加 的 报 价 的 名 称 首 选 度 指 定 要 应 用 于 报 价 的 首 选 度 等 级 首 选 度 表 示 为 百 分 比, 以 0.0( 非 首 选 ) 与 1.0( 最 首 选 ) 之 间 小 数 值 的 形 式 显 示 默 认 值 为 0.0 始 终 包 括 要 确 保 某 项 特 定 报 价 始 终 包 含 于 预 测 中, 请 选 中 此 框 注 意 : 如 果 将 首 选 度 设 为 0.0, 将 忽 略 始 终 包 括 设 置 考 虑 模 型 可 靠 性 与 数 据 极 少 的 全 新 模 型 相 比, 已 通 过 多 次 重 新 生 成 进 行 微 调 的 结 构 良 好 数 据 丰 富 的 模 型 应 当 始 终 产 生 更 精 确 的 结 果 要 利 用 较 成 熟 模 型 具 有 的 较 高 可 靠 性, 请 选 中 此 框

401 Support Vector Machine 模 型 章 15 关 于 SVM Support Vector Machine (SVM) 是 一 项 功 能 强 大 的 分 类 和 回 归 技 术, 可 最 大 化 模 型 的 预 测 准 确 度, 而 不 会 过 度 拟 合 训 练 数 据 SVM 特 别 适 用 于 分 析 预 测 变 量 字 段 非 常 多 ( 如 数 千 个 ) 的 数 据 SVM 适 用 于 多 个 学 科, 例 如 客 户 关 系 管 理 (CRM) 面 部 图 像 和 其 他 图 像 识 别 生 物 信 息 学 文 本 挖 掘 概 念 提 取 入 侵 检 测 蛋 白 质 结 构 预 测 以 及 语 音 识 别 SVM 如 何 运 行 SVM 的 工 作 原 理 是 将 数 据 映 射 到 高 维 特 征 空 间, 这 样 即 使 数 据 不 是 线 性 可 分, 也 可 以 对 该 数 据 点 进 行 分 类 找 到 类 别 之 间 的 分 隔 符, 然 后 以 将 分 隔 符 绘 制 成 超 平 面 的 方 式 变 换 数 据 之 后, 可 用 新 数 据 的 特 征 预 测 新 记 录 所 属 的 组 例 如, 请 看 下 图, 图 中 的 数 据 点 落 到 了 两 个 不 同 的 类 别 中 : 图 片 15-1 原 始 数 据 集 可 以 用 一 条 曲 线 分 隔 这 两 个 类 别 : 图 片 15-2 添 加 了 分 隔 符 后 的 数 据 变 换 后, 可 以 用 超 平 面 定 义 这 两 个 类 别 之 间 的 边 界 : Copyright IBM Corporation 1994,

402 390 章 15 图 片 15-3 变 换 后 的 数 据 用 于 变 换 的 数 学 函 数 称 为 核 函 数 IBM SPSS Modeler 中 的 SVM 支 持 下 列 核 类 型 : 线 性 多 项 式 径 向 基 函 数 (RBF) Sigmoid 如 果 数 据 的 线 性 分 隔 比 较 简 单, 则 建 议 使 用 线 性 核 函 数 在 其 他 情 况 下, 应 当 使 用 其 他 函 数 在 所 有 情 况 下, 您 都 需 要 尝 试 使 用 不 同 的 函 数 才 能 获 得 最 佳 模 型, 因 为 每 一 个 函 数 均 使 用 不 同 的 算 法 和 参 数 调 整 SVM 模 型 除 了 类 别 之 间 的 分 隔 线, 分 类 SVM 模 型 还 会 查 找 定 义 两 个 类 别 之 间 的 空 间 的 边 际 线 图 片 15-4 初 具 模 型 的 数 据 位 于 边 距 上 的 数 据 点 称 为 支 持 向 量 两 个 类 别 之 间 的 边 距 越 宽, 模 型 在 预 测 新 记 录 所 属 的 类 别 方 面 性 能 越 佳 在 上 一 个 示 例 中, 边 距 不 是 很 宽, 因 此 称 该 模 型 过 度 拟 合 为 了 使 边 界 变 宽, 可 以 接 受 少 量 的 误 分 类, 例 如 :

403 391 Support Vector Machine 模 型 图 片 15-5 模 型 改 进 后 的 数 据 在 某 些 情 况 下, 线 性 分 隔 难 度 较 大, 例 如 : 图 片 15-6 线 性 分 隔 存 在 的 问 题 在 类 似 这 种 情 况 中, 目 标 是 找 到 宽 边 距 和 少 量 误 分 类 数 据 点 之 间 的 最 佳 平 衡 核 函 数 有 一 个 规 则 化 参 数 ( 称 为 C), 该 参 数 控 制 这 两 个 值 之 间 的 平 衡 若 要 获 得 最 佳 模 型, 您 可 能 需 要 对 该 参 数 和 其 他 核 参 数 尝 试 使 用 不 同 的 值 SVM 节 点 通 过 SVM 节 点, 可 以 使 用 Support Vector Machine 对 数 据 进 行 分 类 SVM 特 别 适 合 于 大 型 数 据 集, 即 具 有 大 量 预 测 变 量 字 段 的 数 据 集 可 以 对 节 点 使 用 默 认 设 置 以 相 对 较 快 地 生 成 基 本 模 型, 也 可 以 使 用 专 家 设 置 以 尝 试 使 用 不 同 类 型 的 SVM 模 型 生 成 模 型 后, 您 可 以 : 浏 览 模 型 块, 以 显 示 生 成 模 型 过 程 中 相 对 比 较 重 要 的 输 入 字 段 将 表 节 点 附 加 到 模 型 块 中, 以 查 看 模 型 输 出 示 例 一 位 医 学 研 究 人 员 获 得 了 一 个 包 含 大 量 人 体 细 胞 样 本 的 特 征 的 数 据 集, 这 些 样 本 是 从 极 有 可 能 患 上 癌 症 的 患 者 身 上 提 取 的 通 过 对 原 始 数 据 进 行 分 析, 发 现 良 性 样 本 与 恶 性 样 本 之 间 的 许 多 特 征 显 著 不 同 该 研 究 人 员 希 望 开 发 一 个 SVM 模 型, 使 该 模 型 可 以 使 用 其 他 患 者 样 本 中 的 相 似 细 胞 特 征 的 值, 以 尽 早 发 现 他 们 的 样 本 是 良 性 的 还 是 恶 性 有 关 详 细 信 息, 请 参 阅 第 26 章 中 的 细 胞 样 本 分 类 (SVM) 中 的 IBM SPSS Modeler 14.2 应 用 程 序 指 南

404 392 章 15 SVM 节 点 模 型 选 项 图 片 15-7 SVM 节 点 模 型 选 项 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 SVM 节 点 专 家 选 项 如 果 您 对 Support Vector Machine 具 有 深 入 了 解, 则 可 以 使 用 专 家 选 项 对 训 练 过 程 进 行 调 整 要 访 问 专 家 选 项, 请 在 专 家 选 项 卡 上 将 模 式 设 置 为 专 家

405 393 Support Vector Machine 模 型 图 片 15-8 SVM 节 点 专 家 选 项 追 加 所 有 概 率 ( 仅 对 分 类 目 标 有 效 ) 如 果 选 中 该 选 项, 则 指 定 为 由 节 点 处 理 的 每 个 记 录 显 示 名 义 或 标 志 目 标 字 段 的 各 个 可 能 值 的 概 率 如 果 未 选 中 该 选 项, 则 仅 为 名 义 或 标 志 目 标 字 段 显 示 预 测 值 的 概 率 该 复 选 框 的 设 置 将 决 定 模 型 块 上 的 相 应 复 选 框 的 默 认 状 态 停 止 标 准 确 定 何 时 停 止 优 化 算 法 值 的 范 围 从 1.0E 1 到 1.0E 6; 默 认 值 为 1.0E 3 减 小 该 值 会 生 成 更 准 确 的 模 型, 但 模 型 的 训 练 时 间 也 要 相 应 增 加 规 则 化 参 数 (C) 控 制 最 大 化 边 距 和 最 小 化 训 练 错 误 项 之 间 的 平 衡 通 常 情 况 下, 值 应 当 介 于 1 和 10( 含 ) 之 间 ; 默 认 值 为 10 增 加 该 值 会 提 高 训 练 数 据 的 分 类 准 确 度 ( 或 减 少 回 归 错 误 ), 但 这 也 可 以 导 致 过 度 拟 合 回 归 精 确 度 ( 正 数 ) 仅 当 目 标 字 段 的 测 量 级 别 为 连 续 时 才 使 用 如 果 错 误 数 小 于 此 处 指 定 的 值, 则 可 以 接 受 错 误 数 增 加 该 值 可 能 会 加 快 建 模 速 度, 但 要 以 准 确 度 为 代 价 核 类 型 确 定 用 于 变 换 的 核 函 数 的 类 型 核 类 型 不 同, 计 算 分 隔 符 的 方 法 也 将 不 同, 因 此 建 议 尝 试 使 用 不 同 的 选 项 默 认 值 为 RBF( 径 向 基 函 数 ) RBF 伽 马 仅 在 核 类 型 设 置 为 RBF 时 才 启 用 通 常 情 况 下, 值 应 当 介 于 3/k 和 6/k 之 间, 其 中 k 为 输 入 字 段 的 数 量 例 如, 如 果 有 12 个 输 入 字 段, 则 应 当 尝 试 使 用 介 于 0.25 和 0.5 之 间 的 值 增 加 该 值 会 提 高 训 练 数 据 的 分 类 准 确 度 ( 或 减 少 回 归 错 误 ), 但 这 也 可 以 导 致 过 度 拟 合 珈 马 仅 在 核 类 型 设 置 为 多 项 式 或 Sigmoid 时 才 启 用 增 加 该 值 会 提 高 训 练 数 据 的 分 类 准 确 度 ( 或 减 少 回 归 错 误 ), 但 这 也 可 以 导 致 过 度 拟 合 偏 差 仅 在 核 类 型 设 置 为 多 项 式 或 Sigmoid 时 才 启 用 在 核 函 数 中 设 置 coef0 值 大 多 数 情 况 下 可 以 使 用 默 认 值 0 度 仅 在 核 类 型 设 置 为 多 项 式 时 才 启 用 控 制 映 射 空 间 的 复 杂 性 ( 维 度 ) 通 常 情 况 下, 不 使 用 大 于 10 的 值

406 394 章 15 SVM 模 型 块 SVM 模 型 会 创 建 许 多 新 字 段 其 中 最 重 要 的 是 $S-fieldname 字 段, 该 字 段 显 示 由 模 型 预 测 的 目 标 字 段 值 模 型 创 建 的 新 字 段 的 数 量 和 名 称 取 决 于 目 标 字 段 的 测 量 级 别 ( 此 字 段 在 下 表 中 由 字 段 名 指 示 ) 要 查 看 这 些 字 段 及 其 值, 请 将 表 节 点 添 加 到 SVM 模 型 块 中, 然 后 执 行 表 节 点 表 15-1 目 标 字 段 测 量 级 别 为 名 义 或 标 记 新 字 段 名 描 述 $S-fieldname 目 标 字 段 预 测 值 $SP-fieldname 预 测 值 概 率 $SP-value $SRP-value $SAP-value 名 义 或 标 志 的 各 个 可 能 值 的 概 率 ( 仅 在 选 中 模 型 块 中 设 置 选 项 卡 上 的 追 加 所 有 概 率 时 才 显 示 ) ( 仅 适 用 于 标 志 目 标 ) 原 始 (SRP) 和 调 整 后 的 (SAP) 倾 向 得 分, 表 示 目 标 字 段 结 果 为 真 的 可 能 性 仅 当 在 生 成 模 型 之 前 选 中 SVM 建 模 节 点 的 分 析 选 项 卡 上 的 相 应 复 选 框 之 后, 才 显 示 这 些 得 分 有 关 详 细 信 息, 请 参 阅 第 34 页 码 第 3 章 中 的 建 模 节 点 分 析 选 项 表 15-2 目 标 字 段 测 量 级 别 为 连 续 新 字 段 名 描 述 $S-fieldname 目 标 字 段 预 测 值 预 测 变 量 重 要 性 另 外, 模 型 选 项 卡 上 还 可 能 显 示 表 示 评 估 模 型 时 每 个 预 测 变 量 相 对 重 要 性 的 图 表 通 常 您 要 将 建 模 的 主 要 精 力 放 在 最 重 要 的 预 测 变 量 上, 并 考 虑 丢 弃 和 删 除 那 些 最 不 重 要 的 预 测 变 量 注 意, 只 有 在 生 成 模 型 之 前 选 中 分 析 选 项 卡 上 的 计 算 预 测 变 量 重 要 性, 才 可 以 使 用 此 图 表 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 注 意 : 与 其 他 类 型 的 模 型 相 比,SVM 模 型 在 计 算 预 测 变 量 重 要 性 时 可 能 会 花 费 更 长 的 时 间, 默 认 情 况 下 不 在 分 析 选 项 卡 中 选 中 该 选 项 选 中 该 选 项 可 能 会 降 低 性 能, 对 大 数 据 集 尤 为 明 显

407 395 Support Vector Machine 模 型 SVM 模 型 设 置 图 片 15-9 SVM 模 型, 设 置 选 项 卡 通 过 设 置 选 项 卡 可 以 指 定 在 查 看 结 果 时 显 示 的 附 加 字 段 ( 例 如, 通 过 执 行 表 节 点 附 加 到 块 ) 通 过 选 择 这 些 选 项 可 以 查 看 每 个 选 项 的 效 果, 并 且 单 击 预 览 按 钮 ( 滚 动 至 预 览 输 出 右 侧 ) 可 以 查 看 附 加 字 段 追 加 所 有 概 率 ( 仅 对 分 类 目 标 有 效 ) 如 果 选 中 该 选 项, 则 为 由 节 点 处 理 的 各 个 记 录 显 示 名 义 或 标 志 目 标 字 段 的 各 个 可 能 值 的 概 率 如 果 未 选 中 该 选 项, 则 仅 为 名 义 或 标 志 目 标 字 段 显 示 预 测 值 及 其 概 率 此 复 选 框 的 默 认 设 置 由 建 模 节 点 的 相 应 复 选 框 确 定 计 算 原 始 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回? 是? 或? 否? 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 除 了 这 些 得 分, 还 有 其 他 在 评 分 过 程 中 生 成 的 预 测 值 和 置 信 度 值 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 得 分 仅 依 赖 于 训 练 数 据, 并 且 由 于 许 多 模 型 过 度 拟 合 此 数 据 的 倾 向, 该 得 分 可 能 会 过 度 优 化 调 整 后 的 倾 向 会 尝 试 通 过 针 对 检 验 或 验 证 分 区 对 模 型 性 能 进 行 评 估 进 行 弥 补 此 选 项 要 求 在 流 中 定 义 分 区 字 段 并 且 在 生 成 模 型 之 前 在 建 模 节 点 中 启 用 调 整 的 倾 向 得 分

408 最 近 相 邻 元 素 模 型 章 16 KNN 节 点 最 近 相 邻 元 素 分 析 是 根 据 观 测 值 与 其 他 观 测 值 的 类 似 程 度 分 类 观 测 值 的 方 法 在 机 器 学 习 中, 将 其 开 发 为 识 别 数 据 模 式 的 一 种 方 法, 而 不 需 要 与 任 何 存 储 模 式 或 观 测 值 完 全 匹 配 相 似 个 案 相 互 邻 近, 非 相 似 个 案 则 相 互 远 离 因 此, 两 个 观 测 值 之 间 的 距 离 是 其 不 相 似 性 的 测 量 将 靠 近 彼 此 的 个 案 视 为 相 邻 元 素 当 提 出 新 的 观 测 值 ( 保 留 观 测 值 ) 时, 计 算 其 到 模 型 中 每 个 观 测 值 的 距 离 计 算 最 相 似 观 测 值 最 近 相 邻 元 素 的 分 类 并 将 新 观 测 值 放 在 包 含 最 多 最 近 相 邻 元 素 的 类 别 中 您 可 以 规 定 需 要 检 验 的 最 近 相 邻 元 素 的 数 量 ; 此 值 叫 做 k 图 片 显 示 如 何 使 用 两 个 不 同 的 k 值 分 类 新 观 测 值 当 k = 5 时, 新 观 测 值 将 被 置 于 类 别 1 中, 因 为 大 多 数 最 近 相 邻 元 素 属 于 类 别 1 但 当 k = 9 时, 新 观 测 值 将 被 置 于 类 别 0 中, 因 为 大 多 数 最 近 相 邻 元 素 属 于 类 别 0 图 片 16-1 更 改 k 对 分 类 的 影 响 最 近 相 邻 元 素 分 析 也 可 用 于 计 算 连 续 目 标 的 值 在 此 情 况 下, 最 近 相 邻 元 素 的 平 均 值 或 中 间 目 标 值 用 于 获 得 新 观 测 值 的 预 测 值 Copyright IBM Corporation 1994,

409 397 最 近 相 邻 元 素 模 型 KNN 节 点 目 标 选 项 图 片 16-2 KNN 节 点 目 标 选 项 您 可 以 在 对 象 选 项 卡 输 入 数 据 中 根 据 最 近 相 邻 元 素 的 值 选 择 构 建 预 测 目 标 字 段 值 的 模 型, 或 者 只 是 查 找 特 定 感 兴 趣 个 案 的 最 近 相 邻 元 素 您 要 执 行 哪 种 类 型 的 分 析? 预 测 目 标 字 段 如 果 您 想 根 据 最 近 相 邻 元 素 的 值 预 测 目 标 字 段 的 值, 请 选 择 此 选 项 只 识 别 最 近 相 邻 元 素 如 果 您 只 想 看 到 特 定 字 段 的 最 近 相 邻 元 素, 请 选 择 此 选 项 如 果 您 选 择 只 识 别 最 近 相 邻 元 素, 在 此 选 项 卡 上 与 准 确 性 和 速 度 相 关 的 剩 余 选 项 将 被 禁 用, 因 为 其 只 与 预 测 目 标 相 关 您 的 目 标 是 什 么? 此 组 选 项 让 您 决 定 当 预 测 目 标 字 段 时, 速 度 准 确 性 或 二 者 是 否 是 最 重 要 的 因 素 或 者 您 可 以 选 择 自 己 自 定 义 设 置 如 果 您 选 择 平 衡 速 度 或 准 确 性 选 项, 则 算 法 预 先 选 择 该 选 项 的 最 合 适 设 置 组 合 高 级 用 户 可 能 希 望 覆 盖 这 些 选 择 ; 可 在 设 置 选 项 卡 上 的 各 个 窗 格 上 进 行 此 操 作 均 衡 速 度 和 精 确 度 选 择 小 范 围 内 相 邻 元 素 的 最 佳 数 量

410 398 章 16 速 度 查 找 固 定 数 量 的 相 邻 元 素 准 确 性 选 择 较 大 范 围 内 的 相 邻 元 素 的 最 佳 数 量, 并 在 计 算 距 离 时 使 用 预 测 变 量 重 要 性 自 定 义 分 析 选 择 该 选 项 以 微 调 设 置 选 项 卡 上 的 算 法 注 意 : 所 得 KNN 模 型 的 大 小 与 多 数 其 他 模 型 不 同, 随 着 训 练 数 据 量 的 增 加 呈 线 性 增 加 如 果 在 尝 试 构 建 KNN 模 型 时 看 到 报 告 内 存 溢 出 错 误 的 出 错 信 息, 则 尝 试 增 加 IBM SPSS Modeler 所 使 用 的 最 大 系 统 内 存 要 进 行 此 操 作, 请 选 择 工 具 > 选 项 > 系 统 选 项 并 在 最 大 内 存 字 段 中 输 入 新 大 小 系 统 选 项 对 话 框 中 所 作 的 更 改 要 在 重 新 启 动 SPSS Modeler 之 后 才 能 生 效 KNN 节 点 设 置 在 设 置 选 项 卡 上 您 可 以 指 定 最 近 相 邻 元 素 分 析 特 有 的 选 项 屏 幕 左 侧 的 侧 栏 列 出 了 用 于 指 定 选 项 的 面 板 模 型 图 片 16-3 KNN 节 点 模 型 选 项

411 399 最 近 相 邻 元 素 模 型 模 型 窗 格 提 供 控 制 如 何 构 建 模 型 的 选 项, 例 如 是 否 使 用 分 区 或 分 割 模 型 是 否 变 换 数 值 输 入 字 段 以 使 其 落 入 相 同 范 围 内 和 如 何 管 理 感 兴 趣 个 案 您 也 可 以 给 模 型 选 择 一 个 自 定 义 名 称 模 型 名 称 用 户 可 根 据 目 标 或 ID 字 段 自 动 生 成 模 型 名 称 ( 未 指 定 此 类 字 段 时 自 动 生 成 模 型 类 型 ) 或 指 定 一 个 自 定 义 的 名 称 使 用 分 区 数 据 如 果 定 义 了 分 区 字 段, 则 此 选 项 可 确 保 仅 训 练 分 区 的 数 据 用 于 构 建 模 型 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 创 建 分 割 模 型 给 指 定 为 分 割 字 段 的 输 入 字 段 的 每 个 可 能 值 构 建 一 个 单 独 模 型 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 手 动 选 择 字 段... 默 认 情 况 下, 节 点 使 用 来 自 类 型 节 点 的 分 区 与 分 割 字 段 设 置 ( 如 果 存 在 ), 但 此 处 您 可 以 覆 盖 这 些 设 置 要 激 活 分 区 与 分 割 字 段, 请 选 择 字 段 选 项 卡, 并 选 择 使 用 定 制 设 置, 然 后 返 回 此 处 分 区 字 段 该 字 段 允 许 您 使 用 指 定 字 段 将 数 据 分 割 为 几 个 不 同 的 样 本, 分 别 用 于 模 型 构 建 过 程 中 的 训 练 测 试 和 验 证 阶 段 通 过 用 某 个 样 本 生 成 模 型 并 用 另 一 个 样 本 对 模 型 进 行 测 试, 您 可 以 预 判 出 此 模 型 对 类 似 于 当 前 数 据 的 大 型 数 据 集 的 拟 合 优 劣 如 果 已 使 用 类 型 或 分 区 节 点 定 义 了 多 个 分 区 字 段, 则 必 须 在 每 个 用 于 分 区 的 建 模 节 点 的 字 段 选 项 卡 中 选 择 一 个 分 区 字 段 ( 如 果 仅 有 一 个 分 区 字 段, 则 将 在 启 用 分 区 后 自 动 引 入 此 字 段 ) 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 同 时 请 注 意, 要 在 分 析 时 应 用 选 定 分 区, 同 样 必 须 启 用 节 点 模 型 选 项 选 项 卡 中 的 分 区 功 能 ( 取 消 此 选 项, 则 可 以 在 不 更 改 字 段 设 置 的 条 件 下 禁 用 分 区 功 能 ) 分 割 对 于 分 割 模 型, 选 择 分 割 字 段 或 字 段 此 操 作 与 在 类 型 节 点 中 将 字 段 的 角 色 设 置 为 分 割 类 似 您 可 以 仅 将 类 型 为 标 志 名 义 或 有 序 的 字 段 指 定 为 分 割 字 段 选 为 分 割 字 段 的 字 段 无 法 用 作 目 标 输 入 分 区 频 率 或 权 重 字 段 有 关 详 细 信 息, 请 参 阅 第 26 页 码 第 3 章 中 的 构 建 分 割 模 型 标 准 化 范 围 输 入 选 中 此 复 选 框 为 连 续 输 入 字 段 标 准 化 值 标 准 化 特 征 具 有 相 同 的 值 范 围, 这 可 改 进 估 计 算 法 的 性 能 使 用 经 调 整 后 的 标 准 化 [2*(x min)/(max min)] 1 调 整 后 的 标 准 化 值 介 于 1 和 1 之 间 使 用 个 案 标 签 选 中 此 复 选 框 以 启 用 下 拉 列 表, 从 这 里 您 可 以 选 择 字 段 并 将 其 值 用 作 标 签, 以 在 模 型 浏 览 器 中 标 识 在 预 测 变 量 空 间 图 表 对 等 图 表 和 象 限 图 中 所 需 的 个 案 您 可 以 选 择 测 量 级 别 为 名 义 有 序 或 标 志 的 任 何 字 段 用 作 标 签 字 段 如 果 您 不 在 这 里 选 择 字 段, 则 用 以 源 数 据 中 行 号 标 识 的 最 近 相 邻 元 素 在 模 型 浏 览 器 图 表 中 显 示 记 录 如 果 您 在 构 建 模 型 之 后 要 操 作 数 据, 可 使 用 个 案 标 签, 以 避 免 每 次 需 要 参 考 源 数 据 在 显 示 中 标 识 个 案 识 别 焦 点 记 录 选 中 此 复 选 框 启 用 下 拉 列 表, 允 许 您 标 记 感 兴 趣 的 输 入 字 段 ( 仅 针 对 标 志 字 段 ) 如 果 在 此 处 指 定 了 一 个 字 段, 则 当 构 建 模 型 时 会 在 模 型 浏 览 器 中 初 始 选 中 代 表 该 字 段 的 点 在 此 处 选 择 焦 点 记 录 是 可 选 的 ; 任 何 点 都 可 以 暂 时 成 为 焦 点 记 录, 只 要 在 模 型 浏 览 器 中 手 动 选 中 它

412 400 章 16 相 邻 元 素 图 片 16-4 KNN 节 点 相 邻 元 素 选 项 相 邻 元 素 窗 格 具 有 一 组 控 制 如 何 计 算 最 近 相 邻 元 素 数 量 的 选 项 最 近 邻 元 素 的 数 目 (k) 指 定 特 定 个 案 的 最 近 相 邻 元 素 数 量 注 意, 使 用 大 量 的 邻 元 素 不 一 定 会 得 到 更 准 确 的 模 型 如 果 目 标 是 预 测 目 标, 则 您 具 有 两 个 选 择 : 指 定 固 定 值 k 如 果 您 希 望 指 定 要 查 找 的 最 近 相 邻 元 素 的 固 定 数 量, 则 使 用 该 选 项 自 动 选 择 k 您 也 可 以 使 用 最 小 值 和 最 大 值 字 段 以 指 定 一 个 数 值 范 围, 并 允 许 该 过 程 选 择 该 范 围 内 相 邻 元 素 的 最 佳 数 量 确 定 最 近 相 邻 元 素 数 目 的 方 法 依 赖 于 特 征 选 择 窗 格 上 要 求 的 特 征 选 择 如 果 特 征 选 择 有 效, 则 针 对 请 求 范 围 中 每 个 k 值 执 行 特 征 选 择, 并 选 择 具 有 最 低 误 差 率 ( 如 果 目 标 为 连 续, 则 为 最 低 平 方 和 误 差 ) 的 k 值 和 特 征 集 如 果 特 征 选 择 无 效, 则 使 用 V 折 交 叉 验 证 来 选 择 最 佳 的 邻 元 素 数 目 请 参 阅 交 叉 验 证 窗 格 以 控 制 折 叠 指 定 距 离 计 算 该 度 规 用 于 指 定 在 测 量 个 案 相 似 性 中 使 用 的 距 离 度 规

413 401 最 近 相 邻 元 素 模 型 Euclidean 度 规 两 个 个 案 x 和 y 之 间 的 距 离, 为 个 案 值 之 间 的 平 方 差 在 所 有 维 度 上 之 和 的 平 方 根 城 市 街 区 度 规 两 个 个 案 之 间 的 距 离 是 个 案 值 之 间 绝 对 差 在 所 有 维 度 上 之 和 又 称 为 Manhattan 距 离 或 者, 如 果 目 标 是 预 测 目 标, 您 可 以 选 择 在 计 算 距 离 时 按 照 其 标 准 化 重 要 性 计 算 特 征 权 重 预 测 变 量 的 特 征 重 要 性 的 计 算 方 法 为 : 不 含 预 测 变 量 的 模 型 的 误 差 率 或 平 方 和 误 差 与 完 整 模 型 的 误 差 率 或 平 方 和 误 差 之 比 通 过 重 新 对 特 征 重 要 性 值 指 定 权 重, 来 计 算 标 准 化 的 重 要 性, 因 此 其 总 和 为 1 计 算 距 离 时 按 照 重 要 性 计 算 特 征 权 重 ( 只 有 当 目 标 是 预 测 目 标 时 才 显 示 ) 选 中 此 复 选 框, 当 计 算 相 邻 元 素 之 间 距 离 时, 使 用 预 测 变 量 重 要 性 预 测 变 量 重 要 性 将 在 模 型 块 中 显 示, 并 用 于 预 测 ( 因 此 影 响 记 分 ) 有 关 详 细 信 息, 请 参 阅 第 45 页 码 第 3 章 中 的 预 测 变 量 重 要 性 范 围 目 标 预 测 ( 只 有 当 目 标 是 预 测 目 标 时 才 显 示 ) 如 果 指 定 了 连 续 ( 数 值 范 围 ) 目 标, 这 可 指 定 预 测 值 是 基 于 最 近 相 邻 元 素 的 均 值 还 是 中 值 来 计 算 的 特 征 选 择 图 片 16-5 KNN 节 点 特 征 选 择 选 项 只 有 在 目 标 是 预 测 目 标 时 才 激 活 此 窗 格 使 您 能 够 为 特 征 选 择 请 求 和 指 定 选 项 默 认 情 况 下, 特 征 选 择 会 考 虑 所 有 特 征, 但 可 以 选 择 特 征 子 集 以 强 制 纳 入 模 型

414 402 章 16 执 行 特 征 选 择 选 中 此 复 选 框 启 用 特 征 选 择 选 项 强 制 输 入 单 击 此 框 旁 的 字 段 选 择 按 钮 并 选 择 一 个 或 多 个 特 征 以 强 制 纳 入 模 型 中 止 准 则 在 每 一 步 上, 如 果 添 加 特 征 可 以 使 误 差 最 小 ( 计 算 为 分 类 目 标 的 误 差 率 和 连 续 目 标 的 平 方 和 误 差 ), 则 考 虑 将 其 纳 入 模 型 中 继 续 向 前 选 择, 直 到 满 足 指 定 的 条 件 当 已 选 择 指 定 数 量 的 特 征 时 停 止 除 了 那 些 强 制 纳 入 模 型 的 特 征 外, 算 法 还 会 添 加 固 定 数 目 的 特 征 指 定 一 个 正 整 数 减 少 所 选 择 的 数 目 值 可 以 创 建 更 简 约 的 模 型, 但 存 在 缺 失 重 要 特 征 的 风 险 增 加 所 选 择 的 数 目 值 可 以 涵 盖 所 有 重 要 特 征, 但 又 存 在 因 特 征 添 加 而 增 加 模 型 误 差 的 风 险 当 绝 对 误 差 比 率 变 化 小 于 或 等 于 最 小 值 时 停 止 当 绝 对 误 差 比 率 变 化 表 明 无 法 通 过 添 加 更 多 特 征 来 进 一 步 改 进 模 型 时, 算 法 会 停 止 指 定 一 个 正 数 减 少 最 小 变 化 值 将 倾 向 于 包 含 更 多 特 征, 但 存 在 包 含 对 模 型 价 值 不 大 的 特 征 的 风 险 增 加 最 小 变 化 值 将 倾 向 于 排 除 更 多 特 征, 但 存 在 丢 失 对 模 型 较 重 要 的 特 征 的 风 险 最 小 变 化 的 最 佳 值 将 取 决 于 您 的 数 据 和 具 体 应 用 请 参 阅 输 出 中 的 特 征 选 择 误 差 日 志, 以 帮 助 您 评 估 哪 些 特 征 最 重 要 有 关 详 细 信 息, 请 参 阅 第 411 页 码 预 测 变 量 选 择 错 误 日 志 交 叉 验 证 图 片 16-6 KNN 节 点 交 叉 验 证 选 项 只 有 在 目 标 是 预 测 目 标 时 才 激 活 此 窗 格 该 窗 格 上 的 选 项 控 制 计 算 最 近 相 邻 元 素 时 是 否 使 用 交 叉 验 证

415 403 最 近 相 邻 元 素 模 型 分 析 交 叉 验 证 将 样 本 划 分 为 许 多 子 样 本, 或 折 叠 然 后, 生 成 最 近 邻 元 素 模 型, 并 依 次 排 除 每 个 子 样 本 中 的 数 据 第 一 个 模 型 基 于 第 一 个 样 本 折 的 个 案 之 外 的 所 有 个 案, 第 二 个 模 型 基 于 第 二 个 样 本 折 的 个 案 之 外 的 所 有 个 案, 依 此 类 推 对 于 每 个 模 型, 估 计 其 错 误 的 方 法 是 将 模 型 应 用 于 生 成 它 时 所 排 除 的 子 样 本 最 佳 最 近 邻 元 素 数 为 在 折 中 产 生 最 小 误 差 的 数 量 交 叉 验 证 折 叠 V 折 交 叉 验 证 用 于 确 定 最 佳 邻 元 素 数 目 因 性 能 原 因, 它 无 法 与 特 征 选 择 结 合 使 用 随 机 分 配 个 案 到 折 指 定 应 当 用 于 交 叉 验 证 的 折 数 该 过 程 将 个 案 随 机 分 配 到 折, 从 1 编 号 到 V( 折 数 ) 设 置 随 机 数 种 子 根 据 随 机 百 分 比 估 计 模 型 准 确 性 时, 此 选 项 可 用 于 在 另 一 会 话 中 复 制 相 同 结 果 通 过 指 定 随 机 数 生 成 器 所 使 用 的 起 始 值, 可 以 确 保 在 每 次 执 行 节 点 时 都 会 分 配 相 同 的 记 录 输 入 所 需 的 种 子 值 如 果 未 选 中 该 选 项, 则 每 次 执 行 节 点 时 会 生 成 不 同 的 抽 样 使 用 字 段 分 配 个 案 指 定 一 个 将 活 动 数 据 集 中 的 每 个 个 案 分 配 到 折 中 的 数 值 字 段 字 段 必 须 为 数 值, 其 值 为 从 1 到 V 的 数 字 如 果 此 范 围 中 的 任 何 值 缺 失, 且 位 于 任 何 分 割 字 段 上 ( 如 果 分 割 模 型 有 效 ), 这 将 导 致 误 差 图 片 16-7 KNN 节 点 分 析 选 项 只 有 在 目 标 是 预 测 目 标 时 才 激 活 分 析 窗 格 您 可 以 使 用 它 指 定 模 型 是 否 要 纳 入 附 加 变 量 以 包 含 :

416 404 章 16 每 个 可 能 目 标 字 段 值 的 概 率 个 案 和 最 近 相 邻 元 素 之 间 的 距 离 原 始 和 调 整 后 的 倾 向 得 分 ( 仅 适 用 于 标 志 目 标 ) 追 加 所 有 概 率 如 果 选 中 该 选 项, 则 为 由 节 点 处 理 的 各 个 记 录 显 示 名 义 或 标 志 目 标 字 段 的 各 个 可 能 值 的 概 率 如 果 未 选 中 该 选 项, 则 仅 为 名 义 或 标 志 目 标 字 段 显 示 预 测 值 及 其 概 率 保 存 观 测 值 和 k 最 近 相 邻 元 素 之 间 的 距 离 对 于 每 个 焦 点 记 录, 为 其 k 个 最 近 相 邻 元 素 ( 来 自 培 训 样 本 ) 和 相 应 的 k 个 最 近 距 离 创 建 单 独 的 变 量 倾 向 得 分 可 以 在 建 模 节 点 中 和 模 型 块 的 设 置 选 项 卡 上 启 用 倾 向 得 分 该 功 能 仅 在 所 选 目 标 为 标 志 字 段 时 才 可 用 有 关 详 细 信 息, 请 参 阅 第 36 页 码 第 3 章 中 的 倾 向 得 分 计 算 原 始 的 倾 向 得 分 原 始 的 倾 向 得 分 仅 从 基 于 训 练 数 据 的 模 型 中 导 出 如 果 模 型 预 测 值 为 真 ( 将 响 应 ), 则 倾 向 与 P 相 同, 其 中 P 为 预 测 的 可 能 性 如 果 模 型 预 测 的 值 为 假, 则 计 算 出 的 倾 向 为 (1 P) 如 果 构 建 模 型 时 选 择 了 此 选 项, 则 默 认 情 况 下 将 在 模 型 块 中 启 用 倾 向 得 分 不 过, 无 论 是 否 在 建 模 节 点 中 选 择 了 原 始 倾 向 得 分, 都 可 以 始 终 在 模 型 块 中 选 择 启 用 原 始 倾 向 得 分 对 模 型 进 行 评 分 时, 原 始 倾 向 得 分 将 被 添 加 到 将 RP 字 母 附 加 到 标 准 前 缀 的 字 段 中 例 如, 如 果 预 测 位 于 名 为 $R-churn 的 字 段 中, 则 倾 向 得 分 字 段 的 名 称 将 是 $RRP-churn 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 仅 仅 基 于 由 可 能 过 度 拟 合 的 模 型 给 定 的 估 计 上, 这 样 会 导 致 过 于 乐 观 地 评 估 倾 向 调 整 后 的 倾 向 尝 试 通 过 查 看 模 型 在 检 验 或 验 证 分 区 的 性 能 或 通 过 调 整 倾 向 来 弥 补, 以 相 应 地 给 作 出 更 好 的 估 计 此 设 置 要 求 流 中 存 在 有 效 的 分 区 字 段 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 与 原 始 置 信 度 分 数 不 同, 调 整 后 的 倾 向 得 分 必 须 在 构 建 模 型 时 计 算 ; 否 则, 对 模 型 块 进 行 评 分 时 该 分 数 将 不 存 在 对 模 型 进 行 评 分 时, 在 将 AP 字 母 附 加 到 标 准 前 缀 的 字 段 中 添 加 调 整 后 的 倾 向 得 分 例 如, 如 果 预 测 位 于 名 为 $R-churn 的 字 段 中, 则 倾 向 得 分 字 段 的 名 称 将 是 $RAP-churn 调 整 后 的 倾 向 得 分 不 适 用 于 logistic 回 归 模 型 在 计 算 调 整 后 的 倾 向 得 分 时, 必 须 尚 未 平 衡 用 于 计 算 的 检 验 或 验 证 分 区 为 避 免 这 一 点, 请 确 保 在 任 何 上 游 平 衡 节 点 中 选 中 仅 平 衡 训 练 数 据 选 项 有 关 详 细 信 息, 请 参 阅 第 3 章 中 的 为 平 衡 节 点 设 置 选 项 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 此 外, 如 果 已 在 上 游 获 取 了 复 杂 样 本, 则 会 导 致 调 整 后 的 倾 向 得 分 无 效 调 整 后 的 倾 向 得 分 不 适 用 于 增 强 型 树 和 规 则 集 模 型 有 关 详 细 信 息, 请 参 阅 第 158 页 码 第 6 章 中 的 增 强 型 C5.0 模 型

417 405 最 近 相 邻 元 素 模 型 基 于 对 于 有 待 计 算 的 调 整 后 的 倾 向 得 分, 流 中 必 须 存 在 一 个 分 区 字 段 可 以 指 定 是 使 用 检 验 分 区 还 是 验 证 分 区 进 行 此 计 算 为 获 取 最 佳 结 果, 检 验 或 验 证 分 区 包 含 的 记 录 数 量 应 至 少 与 用 于 训 练 原 始 模 型 的 分 区 所 包 含 的 记 录 数 相 同 有 关 详 细 信 息, 请 参 阅 第 4 章 中 的 分 区 节 点 中 的 IBM SPSS Modeler 14.2 源 过 程 和 输 出 节 点 KNN 模 型 块 KNN 模 型 会 创 建 许 多 新 字 段, 如 下 表 所 示 要 查 看 这 些 字 段 及 其 值, 请 将 表 节 点 添 加 到 KNN 模 型 块 中, 然 后 执 行 表 节 点, 或 单 击 模 型 块 上 的 预 览 按 钮 表 16-1 KNN 模 型 字 段 新 字 段 名 描 述 $KNN-fieldname 目 标 字 段 预 测 值 $KNNP-fieldname 预 测 值 概 率 $KNNP-value $KNN-neighbor-n $KNN-distance-n 名 义 或 标 志 字 段 的 每 个 可 能 值 的 概 率 只 有 在 模 型 块 的 设 置 选 项 卡 上 选 中 了 追 加 所 有 概 率 才 会 被 纳 入 焦 点 记 录 的 第 n 个 最 近 相 邻 元 素 名 称 只 有 当 模 型 块 的 设 置 选 项 卡 上 的 显 示 最 近 设 为 非 零 值 时 才 会 被 纳 入 焦 点 记 录 第 n 个 最 近 相 邻 元 素 到 焦 点 记 录 的 相 对 距 离 只 有 当 模 型 块 的 设 置 选 项 卡 上 的 显 示 最 近 设 为 非 零 值 时 才 会 被 纳 入 模 型 视 图 图 片 16-8 最 近 邻 元 素 分 析 模 型 视 图 此 模 型 视 图 有 2 个 面 板 窗 口 : 第 一 个 面 板 显 示 模 型 概 览, 称 为 主 视 图 第 二 个 面 板 显 示 两 种 视 图 类 型 之 一 :

418 406 章 16 辅 助 模 型 视 图 显 示 有 关 模 型 的 更 多 信 息, 但 并 不 专 注 于 模 型 本 身 当 用 户 深 入 查 看 主 视 图 某 个 部 分 时, 链 接 视 图 显 示 有 关 某 个 模 型 特 征 的 详 细 信 息 默 认 情 况 下, 第 一 个 面 板 显 示 预 测 变 量 空 间, 第 二 个 面 板 显 示 预 测 变 量 重 要 性 图 表 如 果 预 测 变 量 重 要 性 图 表 不 可 用 ; 即 在 设 置 选 项 卡 的 相 邻 元 素 面 板 上 未 选 中 按 照 重 要 性 计 算 特 征 权 重 时, 显 示 视 图 下 拉 列 表 中 的 第 一 个 可 用 视 图 图 片 16-9 最 近 邻 元 素 分 析 模 型 视 图 下 拉 列 表 如 果 视 图 不 具 有 可 用 信 息, 它 将 从 视 图 下 拉 列 表 中 省 略 预 测 变 量 空 间 图 片 预 测 变 量 空 间 预 测 变 量 空 间 图 表 是 有 关 预 测 变 量 空 间 ( 如 果 存 在 3 个 以 上 预 测 变 量, 则 为 子 空 间 ) 的 交 互 式 图 形 每 条 轴 代 表 模 型 中 的 某 个 预 测 变 量, 图 表 中 的 点 位 置 显 示 个 案 这 些 预 测 变 量 在 训 练 和 坚 持 分 区 中 的 值 键 除 了 预 测 变 量 值 外, 图 中 的 点 还 传 递 其 他 信 息

419 407 最 近 相 邻 元 素 模 型 其 形 状 表 示 点 所 属 的 分 区, 即 训 练 或 坚 持 分 区 点 的 颜 色 / 阴 影 表 示 该 个 案 的 目 标 值, 不 同 的 颜 色 值 等 于 分 类 目 标 的 类 别, 阴 影 则 表 示 连 续 目 标 的 值 范 围 训 练 分 区 的 指 示 值 为 观 测 值 ; 对 于 坚 持 分 区, 则 为 预 测 值 如 果 未 指 定 目 标, 则 不 会 显 示 此 键 较 粗 的 轮 廓 表 示 个 案 为 焦 点 个 案 显 示 的 焦 点 记 录 链 接 到 它 们 的 k 个 最 近 邻 元 素 控 制 和 互 动 使 用 图 表 中 的 一 些 控 件 可 以 探 索 预 测 变 量 空 间 可 以 选 择 在 图 表 中 显 示 哪 个 预 测 变 量 子 集, 还 可 更 改 在 维 度 上 表 示 哪 些 预 测 变 量 焦 点 记 录 仅 仅 是 在 预 测 变 量 空 间 图 表 中 所 选 的 点 如 果 指 定 了 焦 点 记 录 变 量, 则 初 始 情 况 下 会 选 中 代 表 焦 点 记 录 的 点 不 过, 任 何 点 都 可 以 暂 时 成 为 焦 点 记 录, 只 要 您 选 中 它. 可 以 使 用 点 选 择 的 常 规 控 制, 即 单 击 某 个 点 以 选 择 该 点 并 取 消 选 中 其 它 点 ; 按 住 Ctrl 键 并 单 击 某 个 点 可 将 其 添 加 到 所 选 的 点 集 中 链 接 的 视 图, 如 对 等 图 表, 将 根 据 在 预 测 变 量 空 间 中 选 择 的 个 案 自 动 更 新 您 可 以 更 改 为 焦 点 记 录 显 示 的 最 近 邻 元 素 数 目 (k) 在 图 表 中 的 点 上 方 悬 停, 可 以 显 示 工 具 提 示 以 及 个 案 标 签 值, 或 个 案 编 号 ( 如 果 未 定 义 个 案 标 签 ), 以 及 观 察 和 预 测 目 标 值 使 用 重 置 按 钮 可 以 将 预 测 变 量 空 间 恢 复 到 其 原 始 状 态 更 改 预 测 变 量 空 间 图 表 上 的 轴 您 可 以 控 制 在 预 测 变 量 空 间 图 表 的 轴 上 显 示 的 特 征 要 更 改 轴 设 置 : E 单 击 左 侧 面 板 上 的 编 辑 模 式 按 钮 ( 画 笔 图 标 ), 为 预 测 变 量 空 间 选 择 编 辑 模 式 E 在 右 侧 面 板 中 更 改 视 图 在 两 个 主 面 板 之 间 出 现 显 示 区 域 面 板 E 单 击 显 示 区 域 复 选 框 E 单 击 预 测 变 量 空 间 中 的 任 何 数 据 点 E 要 使 用 具 有 相 同 数 据 类 型 的 预 测 变 量 替 换 某 个 轴 : 将 新 预 测 变 量 拖 到 您 要 替 换 的 预 测 变 量 的 区 域 标 签 ( 带 有 小 X 按 钮 ) 上 E 要 使 用 具 有 不 同 数 据 类 型 的 预 测 变 量 替 换 某 个 轴 : 在 您 要 替 换 的 预 测 变 量 的 区 域 标 签 上, 单 击 小 X 按 钮 预 测 变 量 空 间 变 为 二 维 视 图 将 新 预 测 变 量 拖 到 添 加 维 度 区 域 标 签 上 E 单 击 左 侧 面 板 上 的 探 索 模 式 按 钮 ( 箭 头 图 标 ), 退 出 编 辑 模 式

420 408 章 16 预 测 变 量 重 要 性 图 片 预 测 变 量 重 要 性 通 常, 您 将 需 要 将 建 模 工 作 专 注 于 最 重 要 的 预 测 变 量 字 段, 并 考 虑 删 除 或 忽 略 那 些 最 不 重 要 的 变 量 预 测 变 量 重 要 性 图 表 可 以 在 模 型 估 计 中 指 示 每 个 预 测 变 量 的 相 对 重 要 性, 从 而 帮 助 您 实 现 这 一 点 由 于 它 们 是 相 对 值, 因 此 显 示 的 所 有 预 测 变 量 的 值 总 和 为 1.0 预 测 变 量 的 重 要 性 与 模 型 精 确 性 无 关 它 只 与 每 个 预 测 变 量 在 预 测 中 的 重 要 性 有 关, 而 不 涉 及 预 测 是 否 精 确 最 近 邻 元 素 距 离 图 片 最 近 邻 元 素 距 离 该 表 只 显 示 焦 点 记 录 的 k 个 最 近 邻 元 素 与 距 离 如 果 焦 点 记 录 标 识 符 指 定 在 建 模 节 点 上, 则 它 为 可 用, 且 只 显 示 此 变 量 标 识 的 焦 点 记 录 每 行 : 焦 点 记 录 列 包 含 焦 点 记 录 的 个 案 标 签 变 量 值 ; 如 果 未 定 义 个 案 标 签, 则 此 列 包 含 焦 点 记 录 的 个 案 编 号

421 409 最 近 相 邻 元 素 模 型 在 最 近 相 邻 元 素 组 下 的 第 i 列 包 含 焦 点 记 录 的 第 i 个 最 近 相 邻 元 素 的 个 案 标 签 变 量 值 ; 如 果 未 定 义 个 案 标 签, 则 此 列 包 含 焦 点 记 录 第 i 个 最 近 相 邻 元 素 的 个 案 号 在 最 近 距 离 组 下 的 第 i 列 包 含 第 i 个 最 近 相 邻 元 素 与 焦 点 记 录 的 距 离 对 等 图 片 对 等 图 表 该 图 表 显 示 焦 点 个 案 及 其 在 每 个 预 测 变 量 和 目 标 上 k 个 最 近 邻 元 素 它 仅 在 预 测 变 量 空 间 图 表 中 选 择 了 焦 点 个 案 时 可 用 对 等 图 表 以 两 种 方 式 链 接 到 预 测 变 量 空 间 在 预 测 变 量 空 间 中 所 选 的 个 案 ( 焦 点 个 案 ) 显 示 在 对 等 图 表 中, 也 包 括 其 k 个 最 近 邻 元 素 在 对 等 图 表 中 使 用 在 预 测 变 量 空 间 中 所 选 的 k 值 选 择 预 测 变 量 使 您 可 选 择 在 对 等 图 表 中 显 示 的 预 测 变 量

422 410 章 16 象 限 图 图 片 象 限 图 该 图 表 显 示 焦 点 个 案 及 其 在 散 点 图 ( 或 点 图, 取 决 于 目 标 的 测 量 级 别 ) 上 k 个 最 近 邻 元 素 目 标 在 y 轴 上, 刻 度 预 测 变 量 在 x 轴 上, 按 预 测 变 量 划 分 面 板 它 仅 当 存 在 目 标, 且 在 预 测 变 量 空 间 图 表 中 选 择 了 焦 点 个 案 时 可 用 在 训 练 分 区 的 变 量 均 值 处, 为 连 续 变 量 绘 制 了 参 考 线 选 择 预 测 变 量 使 您 可 选 择 在 象 限 图 中 显 示 的 预 测 变 量

423 411 最 近 相 邻 元 素 模 型 预 测 变 量 选 择 错 误 日 志 图 片 预 测 变 量 选 择 对 于 该 图 表 上 的 点, 其 y 轴 值 为 模 型 的 误 差 ( 误 差 率 或 平 方 和 误 差, 取 决 于 目 标 的 测 量 级 别 ),x 轴 上 列 出 模 型 的 预 测 变 量 ( 加 上 x 轴 左 侧 的 所 有 特 征 ) 该 图 表 仅 当 存 在 目 标, 且 特 征 选 择 有 效 时 可 用 分 类 表 图 片 分 类 表 该 表 显 示 按 分 区 对 目 标 观 察 与 预 测 值 的 交 叉 分 类 它 仅 当 存 在 分 类 目 标 ( 标 志 名 义 或 有 序 ) 时 可 用 坚 持 分 区 中 的 ( 缺 失 ) 行 包 含 在 目 标 上 具 有 缺 失 值 的 坚 持 个 案 这 些 个 案 对 坚 持 样 本 : 整 体 百 分 比 有 贡 献, 但 对 正 确 百 分 比 无 影 响

424 412 章 16 误 差 摘 要 图 片 误 差 摘 要 它 仅 当 存 在 目 标 变 量 时 可 用 它 显 示 模 型 相 关 误 差, 对 于 连 续 目 标 为 平 方 和 误 差, 对 于 分 类 目 标 为 误 差 率 (100% 整 体 正 确 百 分 比 ) KNN 模 型 设 置 图 片 KNN 模 型 块 设 置 通 过 设 置 选 项 卡 可 以 指 定 在 查 看 结 果 时 显 示 的 附 加 字 段 ( 例 如, 通 过 执 行 表 节 点 附 加 到 块 ) 通 过 选 择 这 些 选 项 可 以 查 看 每 个 选 项 的 效 果, 并 且 单 击 预 览 按 钮 ( 滚 动 至 预 览 输 出 右 侧 ) 可 以 查 看 附 加 字 段 追 加 所 有 概 率 ( 仅 对 分 类 目 标 有 效 ) 如 果 选 中 该 选 项, 则 为 由 节 点 处 理 的 各 个 记 录 显 示 名 义 或 标 志 目 标 字 段 的 各 个 可 能 值 的 概 率 如 果 未 选 中 该 选 项, 则 仅 为 名 义 或 标 志 目 标 字 段 显 示 预 测 值 及 其 概 率 此 复 选 框 的 默 认 设 置 由 建 模 节 点 的 相 应 复 选 框 确 定 计 算 原 始 的 倾 向 得 分 对 于 含 标 志 目 标 ( 返 回? 是? 或? 否? 预 测 ) 的 模 型, 您 可 以 请 求 倾 向 得 分, 这 些 得 分 指 示 为 目 标 字 段 指 定 结 果 为 真 的 可 能 性 除 了 这 些 得 分, 还 有 其 他 在 评 分 过 程 中 生 成 的 预 测 值 和 置 信 度 值

425 413 最 近 相 邻 元 素 模 型 计 算 调 整 后 的 倾 向 得 分 原 始 倾 向 得 分 仅 依 赖 于 训 练 数 据, 并 且 由 于 许 多 模 型 过 度 拟 合 此 数 据 的 倾 向, 该 得 分 可 能 会 过 度 优 化 调 整 后 的 倾 向 会 尝 试 通 过 针 对 检 验 或 验 证 分 区 对 模 型 性 能 进 行 评 估 进 行 弥 补 此 选 项 要 求 在 流 中 定 义 分 区 字 段 并 且 在 生 成 模 型 之 前 在 建 模 节 点 中 启 用 调 整 的 倾 向 得 分 显 示 最 近 如 果 您 将 此 值 设 为 n, 其 中 n 是 非 零 正 整 数, 则 焦 点 记 录 的 第 n 个 最 近 相 邻 元 素 与 其 到 焦 点 记 录 的 相 对 距 离 一 起 纳 入 在 模 型 中

426 注 意 事 项 附 录 A This information was developed for products and services offered worldwide. IBM may not offer the products, services, or features discussed in this document in other countries. Consult your local IBM representative for information on the products and services currently available in your area. Any reference to an IBM product, program, or service is not intended to state or imply that only that IBM product, program, or service may be used. Any functionally equivalent product, program, or service that does not infringe any IBM intellectual property right may be used instead. However, it is the user s responsibility to evaluate and verify the operation of any non-ibm product, program, or service. IBM may have patents or pending patent applications covering subject matter described in this document. The furnishing of this document does not grant you any license to these patents. You can send license inquiries, in writing, to: IBM Director of Licensing, IBM Corporation, North Castle Drive, Armonk, NY , U.S.A. For license inquiries regarding double-byte character set (DBCS) information, contact the IBM Intellectual Property Department in your country or send inquiries, in writing, to: Intellectual Property Licensing, Legal and Intellectual Property Law, IBM Japan Ltd., , Shimotsuruma, Yamato-shi, Kanagawa Japan. 以 下 段 落 不 适 用 于 英 国 或 任 何 其 他 此 类 条 款 与 其 当 地 法 律 不 一 致 的 国 家 : SPSS INC.,IBM COMPANY 一 员, 按 原 样 提 供 本 出 版 物, 不 包 含 任 何 类 型 的 保 证, 无 论 是 明 示 或 默 示 的, 包 括 但 不 只 限 于 不 侵 权 的 默 示 保 证 适 销 性 或 适 用 特 定 目 的 一 些 国 家 不 允 许 某 些 交 易 中 明 示 或 默 示 保 证 的 免 责 声 明, 因 此 本 声 明 可 能 不 适 用 于 您 本 信 息 可 能 包 含 技 术 不 准 确 性 或 印 刷 错 误 我 们 将 定 期 对 以 上 信 息 进 行 更 改 ; 这 些 更 改 将 出 现 在 本 出 版 物 的 最 新 版 本 中 SPSS Inc. 可 能 在 任 何 时 候 对 本 出 版 物 中 介 绍 的 产 品 和 / 或 程 序 进 行 改 进 而 不 另 行 通 知 本 信 息 中 引 用 的 任 何 非 SPSS 和 非 IBM 网 站 只 用 于 参 考 目 的, 在 任 何 情 况 下 都 不 作 为 对 这 些 网 站 的 背 书 这 些 网 站 上 的 资 料 不 是 本 SPSS Inc. 产 品 资 料 的 一 部 分, 同 时 您 要 自 行 承 担 使 用 这 些 网 站 的 风 险 当 您 发 送 信 息 给 IBM 或 SPSS 时, 您 将 授 予 非 独 占 权 利 给 IBM 和 SPSS, 允 许 它 以 其 认 为 合 适 的 任 何 方 式 使 用 或 分 发 这 些 信 息 而 不 承 担 任 何 责 任 有 关 非 SPSS 产 品 的 信 息 分 别 来 自 这 些 产 品 的 供 应 商 已 出 版 的 公 告 或 其 它 公 开 的 来 源 SPSS 尚 未 测 试 这 些 产 品, 同 时 无 法 确 认 性 能 的 准 确 性 兼 容 性 或 与 非 SPSS 产 品 相 关 的 任 何 其 他 声 明 如 果 对 非 SPSS 产 品 的 性 能 有 任 何 疑 问, 请 咨 询 这 些 产 品 的 供 应 商 Copyright IBM Corporation 1994,

427 415 注 意 事 项 Licensees of this program who wish to have information about it for the purpose of enabling: (i) the exchange of information between independently created programs and other programs (including this one) and (ii) the mutual use of the information which has been exchanged, should contact: IBM Software Group, Attention: Licensing, 233 S. Wacker Dr., Chicago, IL 60606, USA. Such information may be available, subject to appropriate terms and conditions, including in some cases, payment of a fee. The licensed program described in this document and all licensed material available for it are provided by IBM under terms of the IBM Customer Agreement, IBM International Program License Agreement or any equivalent agreement between us. Any performance data contained herein was determined in a controlled environment. Therefore, the results obtained in other operating environments may vary significantly. Some measurements may have been made on development-level systems and there is no guarantee that these measurements will be the same on generally available systems. Furthermore, some measurements may have been estimated through extrapolation. Actual results may vary. Users of this document should verify the applicable data for their specific environment. Information concerning non-ibm products was obtained from the suppliers of those products, their published announcements or other publicly available sources. IBM has not tested those products and cannot confirm the accuracy of performance, compatibility or any other claims related to non-ibm products. Questions on the capabilities of non-ibm products should be addressed to the suppliers of those products. All statements regarding IBM s future direction or intent are subject to change or withdrawal without notice, and represent goals and objectives only. 本 信 息 包 含 用 于 日 常 商 业 运 营 的 数 据 和 报 告 示 例 为 了 尽 可 能 完 整 的 阐 明, 这 些 示 例 包 含 个 人 姓 名 公 司 品 牌 和 产 品 名 称 所 有 这 些 名 称 都 是 虚 构 的, 任 何 与 实 际 公 司 名 称 和 地 址 类 似 的 情 况 实 属 巧 合 If you are viewing this information softcopy, the photographs and color illustrations may not appear. 商 标 IBM IBM 徽 标 和 ibm.com 是 IBM Corporation 在 全 球 多 个 国 家 注 册 的 商 标 有 关 IBM 商 标 的 当 前 列 表, 请 访 问 公 司 网 站, 网 址 为 SPSS 是, 已 在 全 球 多 个 国 家 注 册 Adobe Adobe 徽 标 PostScript 和 PostScript 徽 标 是 Adobe Systems Incorporated 在 美 国 和 / 或 其 他 国 家 的 注 册 商 标 或 商 标 IT Infrastructure Library 是 中 央 计 算 机 与 电 信 总 局 的 注 册 商 标, 该 局 目 前 是 英 国 商 务 部 的 一 部 分

428 416 附 录 A Intel Intel 徽 标 Intel Inside Intel Inside 徽 标 Intel Centrino Intel Centrino 徽 标 Celeron Intel Xeon Intel SpeedStep Itanium 和 Pentium 是 Intel Corporation 或 其 子 公 司 在 美 国 和 其 他 国 家 的 商 标 或 注 册 商 标 Linux 是 Linus Torvalds 在 美 国 其 他 国 家 或 这 两 者 的 注 册 商 标 Microsoft Windows Windows NT 和 Windows 徽 标 是 Microsoft Corporation 在 美 国 其 他 国 家 或 这 两 者 的 商 标 ITIL 是 一 个 注 册 商 标, 以 及 英 国 商 务 部 的 注 册 社 区 商 标, 并 在 美 国 专 利 商 标 局 注 册 UNIX 是 Open Group 在 美 国 和 其 他 国 家 的 注 册 商 标 Cell Broadband Engine 是 Sony Computer Entertainment, Inc. 在 美 国 其 他 国 家 或 这 两 者 的 商 标, 并 许 可 使 用 Java 以 及 所 有 基 于 Java 的 商 标 和 徽 标 是 Sun Microsystems, Inc. 国 家 或 这 两 者 的 商 标 在 美 国 其 他 Linear Tape-Open, LTO, the LTO Logo, Ultrium, and the Ultrium logo are trademarks of HP, IBM Corp. and Quantum in the U.S. and other countries. 其 他 产 品 和 服 务 名 称 可 能 是 IBM SPSS 或 其 他 公 司 的 商 标

429 索 引 AIC 信 息 准 则 在 线 性 模 型 中, 225 ANOVA 在 线 性 模 型 中, 235 Apriori 模 型 专 家 选 项, 323 建 模 节 点, 321 建 模 节 点 选 项, 322 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据, 31 评 估 尺 度, 323 ARIMA 模 型, 361 季 节 性 阶, 370 差 分 阶, 370 常 数, 370 时 间 序 列 模 型 中 的 标 准, 369 离 群 值, 372 移 动 平 均 数 阶, 370 自 回 归 阶, 370 转 换 函 数, 371 bagging, 134 在 神 经 网 络 中, 176 在 线 性 模 型 中, 223 Bonferroni 调 整 CHAID 节 点, 143 Box 的 M 检 验 判 别 式 节 点, 265 C&R 树 模 型 不 纯 值 度 量, 141 从 模 型 块 生 成 图 形, 158 修 剪, 135 停 止 选 项, 136 先 验 概 率, 139 字 段 选 项, 131 建 模 节 点, 107, 128, 130, 整 体, 137 替 代 变 量, 136 树 深 度, 135 模 型 块, 150 目 标, 133 观 测 值 权 重, 32 误 分 类 成 本, 138 频 率 权 重, 32 C5.0 模 型, 106 从 模 型 块 生 成 图 形, 158 修 剪, 148 并 行 处 理, 147, 149 建 模 节 点, 146, 148, , 158 性 能, 147, 149 推 进, 148, 158 模 型 块, 150, 误 分 类 成 本, 148 选 项, 148 CARMA 模 型 ID 字 段, 325 专 家 选 项, 327 内 容 字 段, 325 多 个 结 果, 340 字 段 选 项, 325 建 模 节 点, 324 建 模 节 点 选 项, 327 数 据 格 式, 325 时 间 字 段, 325 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据, 327 CHAID 模 型, 106 Exhaustive CHAID, 135 从 模 型 块 生 成 图 形, 158 停 止 选 项, 136 字 段 选 项, 131 建 模 节 点, 107, 128, 130, 整 体, 137 树 深 度, 135 模 型 块, 150 目 标, 133 误 分 类 成 本, 140 confidence Apriori 节 点, 322 CARMA 节 点, 327 关 联 规 则, , 351 决 策 树 模 型, 153 序 列, 350 序 列 节 点, 346 costs 决 策 树, 138, 140 Cox 回 归 模 型, 290 专 家 选 项, 286 字 段 选 项, 283 建 模 节 点, 282 收 敛 准 则, 287 模 型 块, 289 模 型 选 项, 284 步 进 标 准, 288 设 置 选 项, 289 高 级 输 出, 287, 290 Cramér 的 V 特 征 选 择, 67 discriminant 模 型 专 家 选 项, 264 倾 向 得 分, 269 建 模 节 点, 263 收 敛 准 则, 264 模 型 块, 模 型 表 单, 263 步 进 标 准 ( 字 段 选 择 ), 267 评 分, 267 高 级 输 出, 265, 268 DTD, 60 events 识 别, 357 Excel 中 的 评 估, 215 Exhaustive CHAID, , 135 Expert Modeler 时 间 序 列 模 型 中 的 标 准,

430 418 索 引 F 统 计 在 线 性 模 型 中, 225 F 统 计 量 特 征 选 择, 67 Hosmer-Lemeshow 拟 合 优 度 Logistic 回 归 模 型, 254 IBM InfoSphere Warehouse (ISW) PMML 导 出, 61 IBM ISW 关 联 模 型 事 务 处 理 格 式 数 据, 31 IBM SPSS Modeler, 1 文 档, 2 IBM SPSS Statistics 模 型, 25 IBM SPSS Text Analytics, 2 ID 字 段 CARMA 节 点, 325 序 列 节 点, 344 k-means 模 型, 292, 专 家 选 项, 300 停 止 标 准, 300 模 型 块, 301 聚 类, 298, 301 距 离 字 段, 299 集 合 编 码 值, 300 K- 均 值 模 型 从 模 型 块 生 成 图 形, 316 KNN 请 参 阅 最 近 相 邻 元 素 模 型, 396 Kohonen 模 型, , 296 专 家 选 项, 296 二 进 制 集 合 编 码 选 项 ( 已 删 除 ), 294 从 模 型 块 生 成 图 形, 316 停 止 标 准, 294 反 馈 图 形, 294 周 边 状 况, 293, 296 学 习 速 率, 296 建 模 节 点, 293 模 型 块, 297 神 经 网 络, 293, 297 L 矩 阵 广 义 线 性 模 型, 278 Lagrange 乘 数 检 验 广 义 线 性 模 型, 279 lambda 特 征 选 择, 67 linearnode 节 点, 221 Logistic 回 归 模 型, 220 专 家 选 项, 245 主 效 应, 244 二 项 选 项, 240 交 互, 244 多 项 选 项, 240 建 模 节 点, 239 收 敛 选 项, 246 模 型 块, 250, 模 型 方 程 式, 250 步 进 选 项, 249 添 加 项, 244 预 测 变 量 重 要 性, 250 高 级 输 出, 247, 254 MLP( 多 层 感 知 器 ) 在 神 经 网 络 中, 177 MS Excel 设 置 集 成 格 式, 215 p 值, 67 PCA 模 型 专 家 选 项, 257 因 子 得 分, 257 因 子 数, 257 建 模 节 点, 255 方 程 式, 259 旋 转, 258 模 型 块, , 262 模 型 选 项, 256 特 征 值, 257 缺 失 值 处 理, 257 迭 代, 257 高 级 输 出, 262 Pearson 卡 方 CHAID 节 点, 144 特 征 选 择, 67 PMML 导 入 模 型, 41, 导 出 模 型, 41, 59, 61 QUEST 模 型, 106 从 模 型 块 生 成 图 形, 158 修 剪, 135 停 止 选 项, 136 先 验 概 率, 139 字 段 选 项, 131 建 模 节 点, 107, 128, 131, 整 体, 137 替 代 变 量, 136 树 深 度, 135 模 型 块, 150 目 标, 133 误 分 类 成 本, 138 R 平 方 在 线 性 模 型 中, 229 RBF( 径 向 基 函 数 ) 在 神 经 网 络 中, 177 ROI 决 策 树 收 益, 117 SLRM 查 看 自 学 响 应 模 型, 381 SPSS Modeler Server, 1 SQL Logistic 回 归 模 型, 253 导 出, 44 规 则 集, 156 Statistics 模 型, 25 Support Vector Machine 模 型 专 家 选 项, 392 关 于, 389 建 模 节 点, 391 核 函 数, 389 模 型 块, 394, 405

431 419 索 引 模 型 选 项, 392 设 置, 395 调 整, 390 过 度 拟 合, 390 SVM 请 参 阅 Support Vector Machine 模 型, 389 t 统 计 量 特 征 选 择, 67 Wald 统 计 量, 不 受 监 督 的 学 习, 不 纯 值 度 量 C&R 树 节 点, 141 决 策 树, 141 与 先 验 相 比 的 绝 对 置 信 度 差 apriori 评 估 尺 度, 323 专 家 建 模 器 离 群 值, 367 专 家 输 出 Cox 回 归 模 型, 287 专 家 选 项 Apriori 节 点, 323 CARMA 节 点, 327 Cox 回 归 模 型, 286 k-means 模 型, 300 Kohonen 模 型, 296 序 列 节 点, 347 贝 叶 斯 网 络 节 点, 169 两 分 杂 质 测 量, 141 两 步 聚 类 模 型, 292 主 成 分 分 析 请 参 阅 PCA 模 型, 255, 259 主 效 应 Logistic 回 归 模 型, 244 事 务 处 理 格 式 数 据, 320, Apriori 节 点, 31 CARMA 节 点, 325 IBM ISW 关 联 模 型, 31 MS 关 联 规 则 节 点, 31 序 列 节 点, 344 二 阶 聚 类 模 型, 两 步 聚 类 中 的, 303 从 模 型 块 生 成 图 形, 316 字 段 标 准 化, 303 建 模 节 点, 302 模 型 块, 304 聚 类, 304 聚 类 数, 303 选 项, 303 二 项 Logistic 回 归 模 型, 交 互 Logistic 回 归 模 型, 244 交 互 树, 105, , 111, 113 ROI, 117 利 润, 117 图 形 生 成, 158 导 出 结 果, 125 收 益, , 117, 120 替 代 变 量, 111 生 成 模 型, 自 定 义 分 割, 110 交 互 识 别, 107 优 化 性 能, 295, 299, 322 伪 R 方 Logistic 回 归 模 型, 254 似 然 比 卡 方 统 计 量 CHAID 节 点, 144 特 征 选 择, 67 似 然 比 检 验 Logistic 回 归 模 型, 247, 254 信 息 准 则 在 线 性 模 型 中, 225 信 息 差 apriori 评 估 尺 度, 324 修 剪 决 策 树, 130, 135 倾 向 得 分 discriminant 模 型, 269 决 策 列 表 模 型, 196 平 衡 数 据, 36 广 义 线 性 模 型, 280 停 止 选 项 决 策 树, 136 先 验 概 率, 139 决 策 树, 139 关 联 规 则 模 型, 155, , 319, 348, 350, 352 Apriori, 321 CARMA, 324 IBM InfoSphere Warehouse, 31 图 形 生 成, 334 序 列, 343 指 定 过 滤 器, 332 模 型 块, 328 模 型 块 摘 要, 337 模 型 块 详 细 信 息, 329 生 成 已 过 滤 的 模 型, 339 生 成 规 则 集, 338 设 置, 335 评 分 规 则, 340 转 置 得 分, 341 部 署, 341 其 他 信 息 面 板 决 策 树 模 型, 153 内 容 字 段 CARMA 节 点, 325

432 420 索 引 序 列 节 点, 344 决 策 列 表 模 型 PMML, 195 requirements, 192 SQL 生 成, 196 专 家 选 项, 194 使 用 查 看 器, 203 分 级 方 法, 194 工 作 模 型 窗 格, 197 建 模 节 点, 188 快 照 选 项 卡, 201 排 除 段, 189 搜 索 宽 度, 194 搜 索 方 向, 192 替 代 选 项 卡, 199 查 看 器 工 作 区, 197 模 型 选 项, 192 片 段, 195 目 标 值, 192 设 置, 196 评 分, 189, 195 邮 件 列 表, 188 决 策 树 模 型, 105, , 113, 128, , 146, 150, 154, 158 ROI, 117 停 止 选 项, 136 其 他 信 息 面 板, 153 利 润, 117 图 形 生 成, 158 导 出 结 果, 125 建 模 节 点, 126 收 益, , 117, 120 替 代 变 量, 111, 153 树 规 则, 151 模 型 块, 151 浏 览 器, 154 生 成, 自 定 义 分 割, 110 规 则 频 率, 153 误 分 类 成 本, 138, 140 预 测 变 量, 111 预 测 变 量 重 要 性, 151 浏 览 器, 55 分 区, 32, 326, 345, 399 模 型 构 建, 83, 91, 97, 148, 167, 192, 240, 256, 264, 272, 284, 295, 299, 303, 346, 383, 392, 399 选 择, 32, 326, 345, 399 分 数 统 计, 分 段, 107 分 类 收 益 决 策 树, 115, 117 分 类 树, , 146 分 类 表 Logistic 回 归 模 型, 247 在 最 近 邻 元 素 分 析 中, 411 删 除 模 型 链 接, 38 删 除 模 型 链 接, 38 利 润 决 策 树 收 益, 117 刷 新 模 型 自 学 响 应 模 型, 383 刷 新 测 量 量, 214 前 向 逐 步 在 线 性 模 型 中, 225 加 性 离 群 值, 359 修 补, 359 时 间 序 列 建 模 器, 372 加 权 最 小 平 方, 32 加 载 模 型 块, 41 匹 配 项 决 策 树 收 益, 114 协 方 差 矩 阵 广 义 线 性 模 型, 278 卡 方 统 计 量 CHAID 节 点, 144 特 征 选 择, 67 函 数 变 换, 360 分 割 决 策 树, 分 割 模 型, 399 受 影 响 的 特 征, 29 和 分 区, 28 建 模 节 点, 29 构 建, 26 分 割 模 型 块, 55 汇 总 选 项 卡, 44 历 史 决 策 树 模 型, 153 原 始 趋 向 得 分, 36 参 数 时 间 序 列 模 型 中, 377 参 数 估 计 值 Logistic 回 归 模 型, 254 广 义 线 性 模 型, 278 参 考 类 别 Logistic 节 点, 244

433 421 索 引 双 头 规 则, 327 变 换 序 列, 360 变 量 筛 选, 107 变 量 重 要 性 自 学 响 应 模 型, 385 可 用 字 段, 207 吉 尼 杂 质 测 量, 141 名 义 回 归, 239 周 期 性 时 间 序 列 建 模 器, 371 响 应 图 决 策 树 收 益, 114, 119 商 标, 415 回 归 收 益 决 策 树, 117, 120 回 归 树, 回 归 模 型 建 模 节 点, 220 因 子 分 析 / 主 成 分 分 析 中 的 主 成 分 分 析 (PCA)/ 因 子 模 型, 258 因 子 模 型 专 家 选 项, 257 因 子 得 分, 257 因 子 数, 257 建 模 节 点, 255 方 程 式, 259 旋 转, 258 模 型 块, , 262 模 型 选 项, 256 特 征 值, 257 缺 失 值 处 理, 257 迭 代, 257 高 级 输 出, 262 图 形 生 成 关 联 规 则, 334 图 表 选 项, 219 基 于 收 益 的 选 择, 120 基 于 树 的 分 析 一 般 用 法, 107 基 准 类 别 Logistic 节 点, 244 复 制 模 型 链 接, 39 多 层 感 知 器 (MLP) 在 神 经 网 络 中, 177 多 项 logisitic 回 归 模 型, 字 段 选 项 Cox 节 点, 283 SLRM 节 点, 382 建 模 节 点, 30 字 段 重 要 性 字 段 排 序, 64, 模 型 结 果, 34, 45, 47 过 滤 字 段, 47 季 节 加 性 离 群 值, 359 时 间 序 列 建 模 器, 372 季 节 差 分 变 换, 360 ARIMA 模 型, 370 季 节 性, 357 识 别, 356 季 节 性 阶 ARIMA 模 型, 370 实 例 数, 331, 351 决 策 树 模 型, 153 对 数 优 势 比 Logistic 回 归 模 型, 250 对 数 转 换, 360 时 间 序 列 建 模 器, 371 对 模 型 进 行 可 视 化 处 理, 218 对 比 系 数 矩 阵 广 义 线 性 模 型, 278 对 等 在 最 近 邻 元 素 分 析 中, 409 对 等 组 异 常 检 测, 73 导 入 PMML, 41, 导 出 PMML, 59, 61 SQL, 44 模 型 块, 41 局 部 趋 势 离 群 值, 360 时 间 序 列 建 模 器, 372 层 次, 107 工 作 模 型 窗 格, 197 差 分 变 换, 360 ARIMA 模 型, 370 带 状 化 连 续 变 量, 107 常 规 可 估 计 函 数 广 义 线 性 模 型, 278 干 预 识 别, 357 平 方 根 转 换, 360 时 间 序 列 建 模 器, 371 并 行 处 理 C5.0 模 型, 147, 149

434 422 索 引 广 义 线 性 模 型 fields, 271 专 家 选 项, 273 倾 向 得 分, 280 建 模 节 点, 270 收 敛 选 项, 276 模 型 块, 279, 281 模 型 表 单, 272 高 级 输 出, 278, 280 序 列 转 换, 360 序 列 检 测, 319, 343 序 列 模 型 ID 字 段, 344 专 家 选 项, 347 内 容 字 段, 344 字 段 选 项, 344 序 列 浏 览 器, 352 建 模 节 点, 343 排 序, 352 数 据 格 式, 344 时 间 字 段, 344 模 型 块, 348, 350, 352 模 型 块 摘 要, 352 模 型 块 设 置, 352 模 型 块 详 细 信 息, 350 生 成 规 则 超 节 点, 353 表 格 格 式 数 据 与 事 务 处 理 格 式 数 据, 347 选 项, 346 预 测, 348 序 列 浏 览 器, 352 应 用 程 序 示 例, 2 延 迟 ACF 和 PACF, 360 建 模 节 点, 21, 70, 146, 165, 293, 298, 302, 321, 343, 381 异 常 检 测 模 型, 75 噪 声 级 别, 73 对 等 组, 73, 76 建 模 节 点, 70 异 常 字 段, 72, 77 异 常 指 数, 72 截 断 值, 72, 76 缺 失 值, 73 评 分, 74, 77 调 整 系 数, 73 径 向 基 函 数 (RBF) 在 神 经 网 络 中, 177 快 照 创 建, 201 快 照 选 项 卡, 201 性 能 C5.0 模 型, 147, 149 性 能 增 强, 249, 295, 299, 322 投 票 规 则 集, 161 折 叠, 交 叉 验 证, 402 拟 合 优 度 统 计 量 Logistic 回 归 模 型, 254 广 义 线 性 模 型, 278 指 令 决 策 树, 125 指 数 平 滑 法, 361 时 间 序 列 模 型 中 的 标 准, 368 指 标 决 策 树 收 益, 114 挖 掘 任 务, 203 决 策 列 表 模 型, 188 创 建, 204 启 动, 204 编 辑, 204 排 序 预 测 变 量, 64, 推 进, 134, 148, 158 在 神 经 网 络 中, 176 在 线 性 模 型 中, 223 描 述 统 计 广 义 线 性 模 型, 278 提 升, 331 关 联 规 则, 332 决 策 树 收 益, 114 提 升 图 决 策 树 收 益, 118 支 持 度 Apriori 节 点, 322 CARMA 节 点, 关 联 规 则, 332 序 列, 350 序 列 节 点, 346 条 件 支 持, 331, 351 规 则 支 持 度, 331, 351 收 敛 的 Epsilon 值 CHAID 节 点, 144 收 敛 选 项 CHAID 节 点, 144 Cox 回 归 模 型, 287 Logistic 回 归 模 型, 246 广 义 线 性 模 型, 276 收 益 决 策 树, , 117 图 表, 218 导 出, 125 数 据 降 维, 107 主 成 分 分 析 (PCA)/ 因 子 模 型, 255 整 体 在 神 经 网 络 中, 179

435 423 索 引 在 线 性 模 型 中, 227 整 体 查 看 器, 48 模 型 摘 要, 49 组 件 模 型 精 确 性, 52 组 件 模 型 详 细 信 息, 54 自 动 数 据 准 备, 55 预 测 变 量 重 要 性, 50 预 测 变 量 频 率, 51 文 档, 2 新 手 入 门, 197 方 差 稳 定 变 换, 360 方 差 系 数 筛 选 字 段, 65 旋 转 主 成 分 分 析 (PCA)/ 因 子 模 型, 258 时 间 字 段 CARMA 节 点, 325 序 列 节 点, 344 时 间 序 列 模 型 ARIMA 标 准, 369 ARIMA 模 型, 361 Expert Modeler 标 准, 366 requirements, 362 周 期 性, 371 序 列 转 换, 371 建 模 节 点, 361 指 数 平 滑 标 准, 368 指 数 平 滑 法, 361 模 型 参 数, 377 模 型 块, 374 残 差, 378 离 群 值, 367, 372 转 换 函 数, 371 显 著 性 水 平 用 于 分 割, 用 于 合 并, 143 更 改 目 标 值, 212 替 代 变 量 决 策 树, 111, 136 决 策 树 模 型, 153 替 代 模 型, 211 替 代 规 则 窗 格, 209 替 代 选 项 卡, 199 替 换 模 型, 40 最 佳 子 集 在 线 性 模 型 中, 225 最 大 四 次 方 值 旋 转 主 成 分 分 析 (PCA)/ 因 子 模 型, 258 最 大 平 衡 值 旋 转 主 成 分 分 析 (PCA)/ 因 子 模 型, 258 最 大 方 差 旋 转 主 成 分 分 析 (PCA)/ 因 子 模 型, 258 最 近 相 邻 元 素 模 型 交 互 验 证 选 项, 402 关 于, 396 分 析 选 项, 403 建 模 节 点, 396 模 型 选 项, 398 特 征 选 择 选 项, 401 目 标 选 项, 397 相 邻 元 素 选 项, 400 设 置 选 项, 398 最 近 邻 元 素 分 析 模 型 视 图, 405 最 近 邻 元 素 距 离 在 最 近 邻 元 素 分 析 中, 408 有 序 两 分 杂 质 测 量, 141 权 重 字 段, 条 件 无 规 则, 327 构 建 规 则 节 点, 150 构 建 选 择 定 义, 204 查 看 器 选 项 卡 决 策 树 模 型, 154 图 形 生 成, 158 标 准 化 卡 方 apriori 评 估 尺 度, 324 标 签 value, 60 变 量, 60 树 地 图 决 策 树 模 型, 154 图 形 生 成, 158 树 指 令, 134 C&R 树 节 点, 123 CHAID 节 点, 123, 125 QUEST 节 点, 123 决 策 树, 125 树 构 建 器, , 113 ROI, 117 利 润, 117 图 形 生 成, 158 导 出 结 果, 125 收 益, , 117, 120 替 代 变 量, 111 生 成 模 型, 自 定 义 分 割, 110 预 测 变 量, 111 树 深 度, 135 核 函 数 Support Vector Machine 模 型, 389 概 率 Logistic 回 归 模 型, 250

436 424 索 引 模 型 ARIMA, 370 分 割, 26, 导 入, 41 替 换, 40 汇 总 选 项 卡, 44 模 型 信 息 广 义 线 性 模 型, 278 模 型 刷 新 自 学 响 应 模 型, 383 模 型 块, 38, 62, 150, 155, 158, , 281 保 存, 43 保 存 和 加 载, 41 分 割 模 型, 55 导 出, 41, 43 打 印, 43 整 体 模 型, 48 汇 总 选 项 卡, 44 生 成 处 理 节 点, 57 用 在 流 中, 57 菜 单, 43 评 分 具 有 以 下 的 数 据, 57 模 型 拟 合 Logistic 回 归 模 型, 254 模 型 测 量 刷 新, 214 定 义, 213 模 型 视 图 在 最 近 邻 元 素 分 析 中, 405 模 型 选 项 Cox 回 归 模 型, 284 SLRM 节 点, 383 贝 叶 斯 网 络 节 点, 167 模 型 选 项 板, 38, 41 模 型 链 接, 38 和 超 节 点, 40 复 制 和 粘 贴, 39 定 义 和 删 除, 38 步 进 干 预 识 别, 357 步 进 选 项 Cox 回 归 模 型, 288 Logistic 回 归 模 型, 249 残 差 时 间 序 列 模 型 中, 378 段 规 则 生 成, 203 水 平 变 动 离 群 值, 359 时 间 序 列 建 模 器, 372 水 平 稳 定 变 换, 360 法 律 注 意 事 项, 414 添 加 模 型 规 则, 209 渐 近 协 方 差 Logistic 回 归 模 型, 247 渐 近 相 关 Logistic 回 归 模 型, 247, 254 点 干 预 识 别, 357 焦 点 记 录, 399 片 段 决 策 列 表 模 型, 188 删 除, 211 删 除 规 则 条 件, 210 复 制, 210 排 除, 212 插 入, 209 编 辑, 209 设 置 优 先 级, 211 特 征 值 主 成 分 分 析 (PCA)/ 因 子 模 型, 257 特 征 选 择 模 型, 排 序 预 测 变 量, 64 65, 生 成 过 滤 节 点, 69 筛 选 预 测 变 量, 64 65, 重 要 性, 64 65, 生 成 序 列 规 则 集, 339 生 成 新 模 型, 212 直 接 Oblimin 旋 转 主 成 分 分 析 (PCA)/ 因 子 模 型, 258 直 观 表 示 决 策 树, 154 图 形 生 成, 158, 316, 334 聚 类 模 型, 306 相 关 矩 阵 广 义 线 性 模 型, 278 真 值 表 数 据, 320, 瞬 时 变 化 离 群 值, 359 瞬 时 离 群 值 时 间 序 列 建 模 器, 372 示 例 应 用 程 序 指 南, 2 概 述, 3 神 经 网 络, 174 停 止 规 则, 178 分 类, 184 复 制 结 果, 180 多 层 感 知 器 (MLP), 177 径 向 基 函 数 (RBF), 177 按 已 观 测 进 行 预 测, 184 整 体, 179

437 425 索 引 模 型 块 设 置, 187 模 型 摘 要, 182 模 型 选 项, 181 目 标, 176 组 合 规 则, 179 缺 失 值, 180 网 络, 186 防 止 过 度 拟 合, 180 隐 藏 层, 177 预 测 变 量 重 要 性, 183 神 经 网 络 模 型 字 段 选 项, 30 神 经 网 络 节 点, 174 离 群 值, 358 ARIMA 模 型, 372 专 家 建 模 器, 367 加 性 修 补, 359 季 节 加 性, 359 局 部 趋 势, 360 序 列 中, 357 时 间 序 列 模 型 中, 372 水 平 变 动, 359 瞬 时 变 化, 359 确 定 性, 358 识 别, 70 革 新, 359 积 分 ARIMA 模 型, 370 移 动 平 均 数 ARIMA 模 型, 370 第 一 个 匹 配 规 则 集, 161 筛 选 输 入 字 段, 65 筛 选 预 测 变 量, 64, 算 法, 38, 106 管 理 器 模 型 选 项 卡, 41 篮 子 数 据, 320, 类 别 合 并, 107 线 性 回 归 模 型, 220 加 权 最 小 平 方, 32 建 模 节 点, 220 线 性 核 函 数 Support Vector Machine 模 型, 389 线 性 模 型, 221 ANOVA 表, 235 R 平 方 统 计 量, 229 估 计 平 均 值, 237 信 息 标 准, 229 复 制 结 果, 228 按 已 观 测 进 行 预 测, 232 整 体, 227 模 型 块 设 置, 239 模 型 摘 要, 229 模 型 构 建 摘 要, 238 模 型 选 择, 225 模 型 选 项, 228 残 差, 233 目 标, 223 离 群 值, 234 系 数, 236 组 合 规 则, 227 置 信 水 平, 224 自 动 数 据 准 备, 224, 230 预 测 变 量 重 要 性, 231 线 性 趋 势 识 别, 356 组 合 规 则 在 神 经 网 络 中, 179 在 线 性 模 型 中, 227 组 织 数 据 选 择, 207 结 果 多 个 结 果, 327 统 计 模 型, 220 编 辑 高 级 参 数, 206 缺 失 值 CHAID 树, 111 从 SQL 中 排 除, 156 筛 选 字 段, 65 缺 失 数 据 预 测 变 量 序 列, 361 缺 陷 检 测 异 常 检 测, 70 置 信 区 间 Logistic 回 归 模 型, 247 置 信 度 Logistic 回 归 模 型, 253 决 策 树 模 型, 155 规 则 集, 155 置 信 度 商 数 与 1 之 间 的 差 apriori 评 估 尺 度, 323 置 信 度 差 apriori 评 估 尺 度, 323 置 信 度 得 分, 36 置 信 度 比 率 apriori 评 估 尺 度, 323 聚 类, , 298, , 总 体 显 示, 306 查 看 聚 类, 306 聚 类 分 析 异 常 检 测, 73 聚 类 数, 303 聚 类 浏 览 器 使 用, 314

438 426 索 引 关 于 聚 类 模 型, 305 单 元 格 内 容 显 示, 310 单 元 格 分 布, 312 单 元 格 分 布 视 图, 312 图 形 生 成, 316 基 本 视 图, 310 排 序 单 元 格 内 容, 310 排 序 特 征, 309 排 序 聚 类, 309 摘 要 视 图, 307 概 述, 306 模 型 摘 要, 307 特 征 显 示 排 序, 309 翻 转 聚 类 和 特 征, 309 聚 类 中 心 视 图, 308 聚 类 大 小, 311 聚 类 大 小 视 图, 311 聚 类 显 示 排 序, 309 聚 类 比 较, 313 聚 类 比 较 视 图, 313 聚 类 视 图, 308 聚 类 预 测 变 量 重 要 性 视 图, 310 转 置 聚 类 和 特 征, 309 预 测 变 量 重 要 性, 310 脉 冲 序 列 中, 357 自 动 分 类 器 模 型, 79 丢 弃 节 点, 87 停 止 规 则, 81 分 区, 84 建 模 节 点, 81, 83 排 序 节 点, 83 模 型 块, 100 模 型 类 型, 84 生 成 建 模 节 点 和 块, 102 简 介, 81 算 法 设 置, 80 结 果 浏 览 器 窗 口, 100 设 置, 88 评 估 图 形, 104 评 估 图 表, 103 自 动 建 模 节 点 自 动 分 类 器 模 型, 79 自 动 数 值 模 型, 79 自 动 聚 类 模 型, 79 自 动 数 值 模 型, 79 停 止 规 则, 81, 92 建 模 节 点, 建 模 选 项, 91 模 型 块, 100 模 型 类 型, 92 生 成 建 模 节 点 和 块, 102 算 法 设 置, 80 结 果 浏 览 器 窗 口, 100 设 置, 94 评 估 图 形, 104 评 估 图 表, 103 自 动 数 据 准 备 在 线 性 模 型 中, 230 自 动 聚 类 模 型, 79 丢 弃 节 点, 99 停 止 规 则, 81 分 区, 98 建 模 节 点, 排 序 节 点, 96 模 型 块, 100 模 型 类 型, 98 生 成 建 模 节 点 和 块, 102 算 法 设 置, 80 结 果 浏 览 器 窗 口, 100 评 估 图 表, 103 自 回 归 ARIMA 模 型, 370 自 学 响 应 模 型 变 量 重 要 性, 385 字 段 选 项, 382 建 模 节 点, 381 模 型 刷 新, 383 模 型 块, 385 目 标 字 段 的 首 选 项, 385, 388 结 果 的 随 机 化, 385, 388 设 置, 384, 387 自 定 义 分 割 决 策 树, 自 定 义 模 型, 211 自 然 对 数 转 换, 360 时 间 序 列 建 模 器, 371 自 相 关 函 数 序 列, 360 自 组 织 图, 293 行 穷 尽 数 据, 320, 表 格 数 据, 320, 340 Apriori 节 点, 31 CARMA 节 点, 325 序 列 节 点, 344 转 置, 341 规 则 关 联 规 则, 321, 324 规 则 支 持 度, 331, 351 规 则 ID, 332 规 则 归 纳, 105, , 146, 321 规 则 条 件 决 策 列 表 模 型, 188 规 则 超 节 点 从 序 列 规 则 生 成, 353 规 则 集, 126, 155, , 335, 从 决 策 树 中 生 成, 126

439 427 索 引 设 置 选 项 Cox 回 归 模 型, 289 SLRM 节 点, 384 评 估 图 形 来 自 自 动 分 类 器 模 型, 104 来 自 自 动 数 值 模 型, 104 评 估 图 表 来 自 自 动 分 类 器 模 型, 103 来 自 自 动 数 值 模 型, 103 来 自 自 动 聚 类 模 型, 103 评 估 尺 度 Apriori 节 点, 323 评 估 模 型, 213 评 分 数 据, 57 误 分 类 成 本 C5.0 节 点, 148 决 策 树, 87, 138, 140 误 差 摘 要 在 最 近 邻 元 素 分 析 中, 412 调 整 R 方 在 线 性 模 型 中, 225 调 整 后 的 倾 向 得 分 discriminant 模 型, 269 决 策 列 表 模 型, 196 平 衡 数 据, 36 广 义 线 性 模 型, 280 象 限 图 在 最 近 邻 元 素 分 析 中, 410 贝 叶 斯 网 络 模 型 专 家 选 项, 169 建 模 节 点, 165 模 型 块, 171 模 型 块 摘 要, 173 模 型 块 设 置, 172 模 型 选 项, 167 超 节 点 和 模 型 链 接, 40 趋 势 识 别, 356 转 换 函 数, 371 分 子 的 阶, 371 分 母 的 阶, 371 季 节 性 阶, 371 差 分 阶 数, 371 延 迟, 371 转 置 表 格 输 出, 341 输 入 字 段 筛 选, 65 选 择 分 析, 65 过 度 拟 合 SVM 模 型, 390 过 滤 节 点 从 决 策 树 中 生 成, 126 过 滤 规 则, 331, 352 关 联 规 则, 332 运 行 挖 掘 任 务, 203 连 续 变 量 分 段, 107 迭 代 历 史 记 录 Logistic 回 归 模 型, 247 广 义 线 性 模 型, 278 选 择 节 点 从 决 策 树 中 生 成, 126 逐 步 字 段 选 择 判 别 式 节 点, 267 邮 件 列 表 决 策 列 表 模 型, 188 部 分 自 相 关 函 数 序 列, 360 部 署 能 力 度 量, 331 重 要 性 排 序 预 测 变 量, 64, 模 型 中 的 预 测 变 量, 34, 45, 47 过 滤 字 段, 47 链 接 模 型, 38 防 止 过 度 拟 合 在 神 经 网 络 中, 180 防 止 过 度 拟 合 准 则 在 线 性 模 型 中, 225 降 维, 293 非 季 节 周 期, 357 非 精 练 模 型, 62, 67 69, 319 非 精 练 规 则 模 型, , 非 线 性 趋 势 识 别, 356 面 积 图 判 别 式 节 点, 265 革 新 离 群 值, 359 时 间 序 列 建 模 器, 372 预 测 概 述, 355 预 测 变 量 序 列, 361 预 测 变 量 决 策 树, 111 替 代 变 量, 111 筛 选, 64, 选 择 分 析, 64, 66 69

440 428 索 引 重 要 性 排 序, 64, 预 测 变 量 序 列, 361 缺 失 数 据, 361 预 测 变 量 空 间 图 表 在 最 近 邻 元 素 分 析 中, 406 预 测 变 量 选 择 在 最 近 邻 元 素 分 析 中, 411 预 测 变 量 重 要 性 discriminant 模 型, 267 Logistic 回 归 模 型, 250 决 策 树 模 型, 151 在 最 近 邻 元 素 分 析 中, 408 广 义 线 性 模 型, 279 模 型 结 果, 34, 45, 47 神 经 网 络, 183 线 性 模 型, 231 过 滤 字 段, 47 预 览 模 型 内 容, 44 频 率 决 策 树 模 型, 153 频 率 字 段, 33 风 险 导 出, 125 风 险 评 估 决 策 树 收 益, 121 高 级 参 数, 206 高 级 输 出 Cox 回 归 模 型, 287 因 子 / 主 成 分 分 析 (PCA) 节 点, 259

一、

一、 ... 1...24...58 - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - - 8 - i. ii. iii. iv. i. ii. iii. iv. v. vi. vii. viii. ix. x. - 9 - xi. - 10 - - 11 - -12- -13- -14- -15- C. @ -16- @ -17- -18- -19- -20- -21- -22-

More information

-i-

-i- -i- -ii- -iii- -iv- -v- -vi- -vii- -viii- -ix- -x- -xi- -xii- 1-1 1-2 1-3 1-4 1-5 1-6 1-7 1-8 1-9 1-10 1-11 1-12 1-13 1-14 1-15 1-16 1-17 1-18 1-19 1-20 1-21 2-1 2-2 2-3 2-4 2-5 2-6 2-7 2-8 2-9 2-10 2-11

More information

Microsoft Word - 强迫性活动一览表.docx

Microsoft Word - 强迫性活动一览表.docx 1 1 - / 2 - / 3 - / 4 - / 5 - I. 1. / 2. / 3. 4. 5. 6. 7. 8. 9 10 11. 12. 2 13. 14. 15. 16. 17. 18. 19. 20 21. 22 23. 24. / / 25. 26. 27. 28. 29. 30. 31. II. 1. 2 3. 4 3 5. 6 7 8. 9 10 11 12 13 14. 15.

More information

全唐诗28

全唐诗28 ... 1... 1... 1... 2... 2... 2... 3... 3... 4... 4... 4... 5... 5... 5... 5... 6... 6... 6... 6... 7... 7... 7... 7... 8... 8 I II... 8... 9... 9... 9...10...10...10...11...11...11...11...12...12...12...13...13...13...14...14...14...15...15...15...16...16...16...17...17

More information

「香港中學文言文課程的設計與教學」單元設計範本

「香港中學文言文課程的設計與教學」單元設計範本 1. 2. 3. (1) (6) ( 21-52 ) (7) (12) (13) (16) (17) (20) (21) (24) (25) (31) (32) (58) 1 2 2007-2018 7 () 3 (1070) (1019-1086) 4 () () () () 5 () () 6 21 1. 2. 3. 1. 2. 3. 4. 5. 6. 7. 8. 9. ( ) 7 1. 2.

More information

II II

II II I I II II III 1. 2. 3. III 4. IV 5. 6. 8. 9. 10. 12. IV V V VI VI VII VII VIII VIII IX IX X X XI XI XII XII 1 1 2 2 3 3 4 33 35 4 5 5 6 6 7 ( ) 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 17 17

More information

1 2 6 8 15 36 48 55 58 65 67 74 76 150 152 1 3 1 2 4 2 2001 2000 1999 12 31 12 31 12 31 304,347 322,932 231,047 14,018 16,154 5,665 (i) 0.162 0.193 0.082 (ii) 0.165 0.227 0.082 (iii) 10.08 13.37 6.47 0.688

More information

_Chi.ps, page Preflight ( _Chi.indd )

_Chi.ps, page Preflight ( _Chi.indd ) on conviction3 5 1. / 2. 14 3. 2 2 3 4. 372 12 5. 6. 1 7. 1 2 i ii iii iv 8. 9. 1 12 2 2 i ii iii i ii iii 3 iv http://www.pcpd.org.hk v i ii iii 4 i ii i / ii 5 1. 2. 3. i ii iii iv v vi 4. 5. 6 6. 7.

More information

Microsoft Word - MP2018_Report_Chi _12Apr2012_.doc

Microsoft Word - MP2018_Report_Chi _12Apr2012_.doc 人 力 資 源 推 算 報 告 香 港 特 別 行 政 區 政 府 二 零 一 二 年 四 月 此 頁 刻 意 留 空 - 2 - 目 錄 頁 前 言 詞 彙 縮 寫 及 注 意 事 項 摘 要 第 一 章 : 第 二 章 : 第 三 章 : 第 四 章 : 附 件 一 : 附 件 二 : 附 件 三 : 附 件 四 : 附 件 五 : 附 件 六 : 附 件 七 : 引 言 及 技 術 大 綱 人

More information

南華大學數位論文

南華大學數位論文 1 i -------------------------------------------------- ii iii iv v vi vii 36~39 108 viii 15 108 ix 1 2 3 30 1 ~43 2 3 ~16 1 2 4 4 5 3 6 8 6 4 4 7 15 8 ----- 5 94 4 5 6 43 10 78 9 7 10 11 12 10 11 12 9137

More information

李天命的思考藝術

李天命的思考藝術 ii iii iv v vi vii viii ix x 3 1 2 3 4 4 5 6 7 8 9 5 10 1 2 11 6 12 13 7 8 14 15 16 17 18 9 19 20 21 22 10 23 24 23 11 25 26 7 27 28 12 13 29 30 31 28 32 14 33 34 35 36 5 15 3 1 2 3 4 5 6 7 8 9 10 11

More information

皮肤病防治.doc

皮肤病防治.doc ...1...1...2...3...4...5...6...7...7...9...10... 11...12...14...15...16...18...19...21 I ...22...22...24...25...26...27...27...29...30...31...32...33...34...34...36...36...37...38...40...41...41...42 II

More information

性病防治

性病防治 ...1...2...3...4...5...5...6...7...7...7...8...8...9...9...10...10... 11... 11 I ...12...12...12...13...14...14...15...17...20...20...21...22...23...23...25...27...33...34...34...35...35 II ...36...38...39...40...41...44...49...49...53...56...57...57...58...58...59...60...60...63...63...65...66

More information

中国南北特色风味名菜 _一)

中国南北特色风味名菜 _一) ...1...1...2...3...3...4...5...6...7...7...8...9... 10... 11... 13... 13... 14... 16... 17 I ... 18... 19... 20... 21... 22... 23... 24... 25... 27... 28... 29... 30... 32... 33... 34... 35... 36... 37...

More information

全唐诗24

全唐诗24 ... 1... 1... 2... 2... 3... 3... 4... 4... 5... 5... 6... 6... 7... 7... 8... 8... 9... 9...10...10...10...11...12...12...12...13...13 I II...14...14...14...15...15...15...16...16...16...17...17...18...18...18...19...19...19...20...20...20...21...21...22...22...23...23...23...24

More information

2015年廉政公署民意調查

2015年廉政公署民意調查 報 告 摘 要 2015 年 廉 政 公 署 周 年 民 意 調 查 背 景 1.1 為 了 掌 握 香 港 市 民 對 貪 污 問 題 和 廉 政 公 署 工 作 的 看 法, 廉 政 公 署 在 1992 至 2009 年 期 間, 每 年 均 透 過 電 話 訪 問 進 行 公 眾 民 意 調 查 為 更 深 入 了 解 公 眾 對 貪 污 問 題 的 看 法 及 關 注, 以 制 訂 適 切

More information

509 (ii) (iii) (iv) (v) 200, , , , C 57

509 (ii) (iii) (iv) (v) 200, , , , C 57 59 (ii) (iii) (iv) (v) 500,000 500,000 59I 18 (ii) (iii) (iv) 200,000 56 509 (ii) (iii) (iv) (v) 200,000 200,000 200,000 500,000 57 43C 57 (ii) 60 90 14 5 50,000 43F 43C (ii) 282 24 40(1B) 24 40(1) 58

More information

Microsoft Word - Entry-Level Occupational Competencies for TCM in Canada200910_ch _2_.doc

Microsoft Word - Entry-Level Occupational Competencies for TCM in Canada200910_ch _2_.doc 草 稿 致 省 級 管 理 單 位 之 推 薦 書 二 零 零 九 年 十 月 十 七 日 加 拿 大 中 醫 管 理 局 聯 盟 All rights reserved 序 言 加 拿 大 中 醫 管 理 局 聯 盟, 於 二 零 零 八 年 一 月 至 二 零 零 九 年 十 月 間, 擬 定 傳 統 中 醫 執 業 之 基 礎 文 件 由 臨 床 經 驗 豐 富 之 中 醫 師 教 育 者 及

More information

2. 我 沒 有 說 實 話, 因 為 我 的 鞋 子 其 實 是 [ 黑 色 / 藍 色 / 其 他 顏 色.]. 如 果 我 說 我 現 在 是 坐 著 的, 我 說 的 是 實 話 嗎? [ 我 說 的 對 還 是 不 對 ]? [ 等 對 方 回 答 ] 3. 這 是 [ 實 話 / 對 的

2. 我 沒 有 說 實 話, 因 為 我 的 鞋 子 其 實 是 [ 黑 色 / 藍 色 / 其 他 顏 色.]. 如 果 我 說 我 現 在 是 坐 著 的, 我 說 的 是 實 話 嗎? [ 我 說 的 對 還 是 不 對 ]? [ 等 對 方 回 答 ] 3. 這 是 [ 實 話 / 對 的 附 錄 美 國 國 家 兒 童 健 康 與 人 類 發 展 中 心 (NICHD) 偵 訊 指 導 手 冊 I. 開 場 白 1. 你 好, 我 的 名 字 是, 我 是 警 察 [ 介 紹 房 間 內 的 其 他 人, 不 過, 在 理 想 狀 態 下, 房 間 裡 不 該 有 其 他 人 ] 今 天 是 ( 年 月 日 ), 現 在 是 ( 幾 點 幾 分 ) 我 是 在 ( 地 點 ) 問 你

More information

绝妙故事

绝妙故事 980.00 III... 1... 1... 4... 5... 8...10...11...12...14...16...18...20...23...23...24...25...27...29...29...31...34...35...36...39...41 IV...43...44...46...47...48...49...50...51...52...54...56...57...59...60...61...62...63...66...67...68...69...70...72...74...76...77...79...80

More information

榫 卯 是 什 麼? 何 時 開 始 應 用 於 建 築 中? 38 中 國 傳 統 建 築 的 屋 頂 有 哪 幾 種 形 式? 40 大 內 高 手 的 大 內 指 什 麼? 42 街 坊 四 鄰 的 坊 和 街 分 別 指 什 麼? 44 北 京 四 合 院 的 典 型 格 局 是 怎 樣 的

榫 卯 是 什 麼? 何 時 開 始 應 用 於 建 築 中? 38 中 國 傳 統 建 築 的 屋 頂 有 哪 幾 種 形 式? 40 大 內 高 手 的 大 內 指 什 麼? 42 街 坊 四 鄰 的 坊 和 街 分 別 指 什 麼? 44 北 京 四 合 院 的 典 型 格 局 是 怎 樣 的 目 錄 中 華 醫 藥 以 醫 術 救 人 為 何 被 稱 為 懸 壺 濟 世? 2 什 麼 樣 的 醫 生 才 能 被 稱 為 華 佗 再 世? 4 中 醫 如 何 從 臉 色 看 人 的 特 質? 6 中 醫 怎 樣 從 五 官 看 病? 8 中 醫 看 舌 頭 能 看 出 些 什 麼 來? 10 中 醫 真 的 能 靠 一 個 枕 頭, 三 根 指 頭 診 病 嗎? 12 切 脈 能 判 斷

More information

<4D6963726F736F667420576F7264202D203938BEC7A67EABD7B942B0CAC15AC075B3E6BF57A9DBA5CDC2B2B3B92DA5BFBD542E646F63>

<4D6963726F736F667420576F7264202D203938BEC7A67EABD7B942B0CAC15AC075B3E6BF57A9DBA5CDC2B2B3B92DA5BFBD542E646F63> 98 年 3 月 11 日 依 本 校 98 學 年 度 招 生 委 員 會 第 1 次 會 議 核 定 大 同 技 術 學 院 98 學 年 度 重 點 運 動 項 目 績 優 學 生 單 獨 招 生 簡 章 大 同 技 術 學 院 招 生 委 員 會 編 印 校 址 :600 嘉 義 市 彌 陀 路 253 號 電 話 :(05)2223124 轉 203 教 務 處 招 生 專 線 :(05)2223124

More information

(i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (i) (ii)(iii) (iv) (v)

(i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (i) (ii)(iii) (iv) (v) 1948 12 1 1986 1 1995 1995 3 1995 5 2003 4 2003 12 2015 82015 10 1 2004 2 1 (i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (i) (ii)(iii) (iv) (v) (vi) (vii)(viii) (ix) (x) (xi) 2013 8 15 (i) (ii) (iii)

More information

iv 20 1 1.75 不 必 詫 異, 其 實 成 功 與 失 敗 之 間 就 是 由 這 樣 簡 單 的 工 作 習 慣 造 成 的 可 見, 習 慣 雖 小, 卻 影 響 深 遠 遍 數 名 載 史 冊 的 成 功 人 士, 哪 位 沒 有 幾 個 可 圈 可 點 的 習 慣 在 影 響 着

iv 20 1 1.75 不 必 詫 異, 其 實 成 功 與 失 敗 之 間 就 是 由 這 樣 簡 單 的 工 作 習 慣 造 成 的 可 見, 習 慣 雖 小, 卻 影 響 深 遠 遍 數 名 載 史 冊 的 成 功 人 士, 哪 位 沒 有 幾 個 可 圈 可 點 的 習 慣 在 影 響 着 iii 前 言 : 好 習 慣 成 就 好 人 生 論 語 說 : 性 相 近 也, 習 相 遠 也 其 意 是 說, 人 的 本 性 很 接 近, 但 由 於 習 慣 不 同, 便 相 去 甚 遠 習 慣 是 宇 宙 共 同 的 法 則, 具 有 無 法 阻 擋 的 巨 大 力 量 冬 天 來 了, 春 天 還 會 遠 嗎? 這 就 是 無 法 阻 擋 的 一 股 力 量 蘋 果 離 開 樹 枝

More information

智力测试故事

智力测试故事 II 980.00 ... 1... 1... 1... 2... 2... 2... 3... 3... 3... 3... 4... 4... 5... 5... 6... 6... 7... 7... 8... 8... 8... 9... 9...10...10...10 I II...11...11...11...12...13...13...13...14...14...14...15...15...15...16...16...17...17...18...18...19...19...19...19...20...20...21...21...21

More information

(b) 3 (a) (b) 7 (a) (i) (ii) (iii) (iv) (v) (vi) (vii) 57

(b) 3 (a) (b) 7 (a) (i) (ii) (iii) (iv) (v) (vi) (vii) 57 (i) (ii) (iii) A. 123 2 3(1) (2) (i) 41 (ii) (iii) 121 4(3) (i) (ii) (iii) 123A 3 (a) 56 (b) 3 (a) (b) 7 (a) (i) (ii) (iii) (iv) (v) (vi) (vii) 57 (viii) (ix) (x) 4B(2)(d) (e) (f) (xi) (xii) (b) (a) (i)

More information

奇闻怪录

奇闻怪录 ... 1... 1... 2... 3... 3... 4... 4... 5... 5... 6... 8... 9... 10... 10... 11... 11... 13... 13... 14... 14... 15... 16... 17... 21 I ... 22... 23... 23... 24... 25... 25... 26... 27... 28... 29 UFO...

More information

<4D6963726F736F667420576F7264202D205B345DB5D8AE4CACD732303135AECAAFC5C1C9C1DCBDD0AB48A4CEB3F8A657AAED>

<4D6963726F736F667420576F7264202D205B345DB5D8AE4CACD732303135AECAAFC5C1C9C1DCBDD0AB48A4CEB3F8A657AAED> 華 夏 盃 全 國 全 國 數 學 奧 林 匹 克 邀 請 賽 ( 華 南 賽 區 ) 晉 級 賽 比 賽 詳 情 : 一 比 賽 對 象 : 小 學 一 至 六 年 級 中 學 一 二 年 級 二 比 賽 日 期 及 時 間 : 年 2 月 15 日 ( 星 期 日 ) 小 學 組 小 一 級 小 二 級 小 三 級 小 四 級 小 五 級 小 六 級 時 間 13:10~1:20 13:10~1:20

More information

目 录 院 领 导 职 责... 1 院 长 职 责... 1 医 疗 副 院 长 职 责... 1 教 学 副 院 长 职 责... 2 科 研 副 院 长 职 责... 2 后 勤 副 院 长 职 责... 3 主 管 南 院 区 副 院 长 职 责... 3 党 委 书 记 职 责... 4

目 录 院 领 导 职 责... 1 院 长 职 责... 1 医 疗 副 院 长 职 责... 1 教 学 副 院 长 职 责... 2 科 研 副 院 长 职 责... 2 后 勤 副 院 长 职 责... 3 主 管 南 院 区 副 院 长 职 责... 3 党 委 书 记 职 责... 4 目 录 院 领 导 职 责... 1 院 长 职 责... 1 医 疗 副 院 长 职 责... 1 教 学 副 院 长 职 责... 2 科 研 副 院 长 职 责... 2 后 勤 副 院 长 职 责... 3 主 管 南 院 区 副 院 长 职 责... 3 党 委 书 记 职 责... 4 纪 委 书 记 职 责... 5 院 长 办 公 室... 6 院 长 办 公 室 工 作 职 责...

More information

穨學前教育課程指引.PDF

穨學前教育課程指引.PDF i 1 1.1 1 1.2 1 4 2.1 4 2.2 5 2.3 7 2.4 9 2.5 11 2.6 1 2 1 5 3.1 1 5 3.2 1 5 19 4.1 19 4.2 19 4.3 2 1 4.4 29 4.5 38 4.6 4 3 4.7 47 50 5.1 5 0 5.2 5 0 5.3 6 2 5.4 9 4 5.5 1 2 6 ( ) 1 2 7 ( ) 1 31 ( ) 1

More information

(i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (xi) 60.99%39.01%

(i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (xi) 60.99%39.01% 48.55% 1998 19986 30%20086 2009 2009 200 (i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (xi) 60.99%39.01% 200820092010 772 928960200820092010 1512928 201 1. 20091222(2009)7267 20042008 16,980,954.02

More information

眼病防治

眼病防治 ( 20 010010) 787 1092 1/32 498.50 4 980 2004 9 1 2004 9 1 1 1 000 ISBN 7-204-05940-9/R 019 1880.00 ( 20.00 ) ...1...1...2...3...5...5...6...7...9... 11...13...14...15...17...18...19...20...21 I II...21...22...23...24...25...27...27...28...29...30...31...33...33...34...36...38...39...40...41...42...43...45

More information

中国南北特色风味名菜 _八)

中国南北特色风味名菜 _八) ( 20 010010) 7871092 1/32 356.25 4 760 2004 8 1 2004 8 1 11 000 ISBN 7-204-05943-3/Z102 1026.00 ( 18.00 ) ...1...2...2...4...6...7...8...9... 10... 11... 12... 13... 13... 14... 15... 17... 18... 19...

More information

30,000,000 75,000,000 75,000, (i) (ii) (iii) (iv)

30,000,000 75,000,000 75,000, (i) (ii) (iii) (iv) 30,000,000 75,000,000 75,000,000 24 (i) (ii) (iii) (iv) # * 1,800,000 1,800,000 15% 3,400,000 3,400,000 15% 4,200,000 4,200,000 10% 8,600,000 8,600,000 10% 12,600,000 12,600,000 88% 10% 16,000,000 16,000,000

More information

第 二 輯 目 錄.indd 2 目 錄 編 寫 說 明 附 : 香 港 中 學 文 憑 中 國 語 文 科 評 核 模 式 概 述 綜 合 能 力 考 核 考 試 簡 介 及 應 試 技 巧 常 用 實 用 文 文 體 格 式 及 寫 作 技 巧 綜 合 能 力 分 項 等 級 描 述 練 習 一

第 二 輯 目 錄.indd 2 目 錄 編 寫 說 明 附 : 香 港 中 學 文 憑 中 國 語 文 科 評 核 模 式 概 述 綜 合 能 力 考 核 考 試 簡 介 及 應 試 技 巧 常 用 實 用 文 文 體 格 式 及 寫 作 技 巧 綜 合 能 力 分 項 等 級 描 述 練 習 一 作 出 發 者 : 劉 梓 淩 版 : 精 工 出 版 社 行 : 精 工 印 書 局 香 港 銅 鑼 灣 道 168 號 電 話 :2571 1770 2554 1247 傳 真 :2806 0974 2873 2412 網 二 O 一 一 年 址 :http://www.jingkung.com 初 版 版 權 所 有, 翻 版 必 究 如 未 獲 得 本 公 司 同 意, 不 得 用 任 何

More information

I. 1-2 II. 3 III. 4 IV. 5 V. 5 VI. 5 VII. 5 VIII. 6-9 IX. 9 X XI XII. 12 XIII. 13 XIV XV XVI. 16

I. 1-2 II. 3 III. 4 IV. 5 V. 5 VI. 5 VII. 5 VIII. 6-9 IX. 9 X XI XII. 12 XIII. 13 XIV XV XVI. 16 125-0834I/1405/GH I. 1-2 II. 3 III. 4 IV. 5 V. 5 VI. 5 VII. 5 VIII. 6-9 IX. 9 X. 10-11 XI. 11-12 XII. 12 XIII. 13 XIV. 14-15 XV. 15-16 XVI. 16 I. * ++p ++ p ++ ++ * ++p ++ ++ ++p 1 2 ++ ++ ++ ++ ++ I.

More information

群科課程綱要總體課程計畫書

群科課程綱要總體課程計畫書 核 准 文 號 :102 年 4 月 22 日 臺 教 國 署 高 字 第 1020036237 號 國 立 曾 文 高 級 農 工 職 業 學 校 群 科 課 程 綱 要 總 體 課 程 計 畫 書 (102 學 年 度 入 學 學 生 適 用 ) 中 華 民 國 102 年 04 月 22 日 國 立 曾 文 高 級 農 工 職 業 學 校 群 科 課 程 綱 要 總 體 課 程 計 畫 書 核

More information

39898.indb

39898.indb 1988 4 1998 12 1990 5 40 70.................................................. 40.............................................................. 70..............................................................

More information

穨ecr2_c.PDF

穨ecr2_c.PDF i ii iii iv v vi vii viii 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 26 27 2 28 29 30 31 32 33 34 35 36 37 38 39 40 3 4 41 42 43 5 44 45 46 6 47 48 49 50 51 52 1 53 2 54 55 3 56

More information

電腦相關罪行跨部門工作小組-報告書

電腦相關罪行跨部門工作小組-報告書 - ii - - iii - - iv - - v - - vi - - vii - - viii - (1) 2.1 (2) (3) 13.6 (4) 1.6 (5) 21 (6) (7) 210 (8) (9) (10) (11) ( ) ( 12) 20 60 16 (13) ( ) (

More information

i

i i ii iii iv v vi vii viii ===== 1 2 3 4 5 6 7 8 9 10 ==== 11 12 13 14 15 16 17 18 19 ==== ==== 20 .. ===== ===== ===== ===== ===== ======.. 21 22 ===== ===== ===== ===== 23 24 25 26 27 28 29 ==== ====

More information

发展党员工作手册

发展党员工作手册 发 展 党 员 工 作 问 答 目 录 一 总 论...9 1. 发 展 党 员 工 作 的 方 针 是 什 么? 如 何 正 确 理 解 这 个 方 针?... 9 2. 为 什 么 强 调 发 展 党 员 必 须 保 证 质 量?... 9 3. 如 何 做 到 慎 重 发 展?... 10 4. 如 何 处 理 好 发 展 党 员 工 作 中 的 重 点 与 一 般 的 关 系?...11 5.

More information

i

i 9 1 2 3 4 i 5 6 ii iii iv v vi vii viii 1 1 1 2 3 4 2 5 6 2 3 2.10 ( 2.11 ) ( 2.11 ) ( 2.9 ) 7 8 9 3 10 5% 2% 4 11 93% (2001 02 2003 04 ) ( ) 2,490 (100%) 5 12 25% (2.57% 25%) 6 (2001 02 2003 04 ) 13 100%

More information

vi 黃 帝 內 經 即 學 即 用 別 做 反 自 然 的 事 053 成 年 人 應 該 斷 奶 055 吃 肉 吃 素 因 人 而 異 057 要 分 清 飢 和 餓 058 生 活 現 代 化 與 本 能 退 化 061 調 神 就 是 調 節 奏 063 想 冬 泳, 先 問 問 自 己

vi 黃 帝 內 經 即 學 即 用 別 做 反 自 然 的 事 053 成 年 人 應 該 斷 奶 055 吃 肉 吃 素 因 人 而 異 057 要 分 清 飢 和 餓 058 生 活 現 代 化 與 本 能 退 化 061 調 神 就 是 調 節 奏 063 想 冬 泳, 先 問 問 自 己 目 錄 001 第 一 講 道 法 自 然 養 生 首 先 要 找 對 方 向 003 健 身 不 同 於 健 體 006 隨 順 自 然 的 節 拍 008 調 和 的 重 要 013 吃 飯 的 講 究 017 飲 水 的 學 問 021 喝 適 合 自 己 的 茶 025 起 居 作 息 要 規 律 029 形 與 神 俱 靠 甚 麼 031 還 原 現 場 033 039 第 二 講 背 道

More information

Microsoft Word - 中三選科指南 2014 subject

Microsoft Word - 中三選科指南 2014 subject 必 修 科 目 簡 介 < < < 1. 中 文 > > > 本 科 的 公 開 評 核 以 課 程 發 展 議 會 與 香 港 考 試 及 評 核 局 聯 合 編 訂 的 中 國 語 文 科 課 程 及 評 估 指 引 ( 中 四 至 中 六 ) 為 根 據 目 標 本 科 主 要 評 核 考 生 : (1) 讀 寫 聽 說 能 力 思 維 能 力 審 美 能 力 和 自 學 能 力 ; (2)

More information

前 言 根 据 澳 门 特 别 行 政 区 第 11/1999 号 法 律 第 三 条 规 定, 审 计 长 执 行 其 职 责, 已 经 对 财 政 局 提 交 的 2011 年 度 澳 门 特 别 行 政 区 总 帐 目 ( 总 帐 目 ) 进 行 了 审 计 与 2010 年 度 相 同, 本 年 度 的 总 帐 目 由 政 府 一 般 综 合 帐 目 及 特 定 机 构 汇 总 帐 目, 两

More information

Microsoft Word - Panel Paper on T&D-Chinese _as at 6.2.2013__final_.doc

Microsoft Word - Panel Paper on T&D-Chinese _as at 6.2.2013__final_.doc 二 零 一 三 年 二 月 十 八 日 會 議 討 論 文 件 立 法 會 CB(4)395/12-13(03) 號 文 件 立 法 會 公 務 員 及 資 助 機 構 員 工 事 務 委 員 會 公 務 員 培 訓 及 發 展 概 況 目 的 本 文 件 介 紹 公 務 員 事 務 局 為 公 務 員 所 提 供 培 訓 和 發 展 的 最 新 概 況, 以 及 將 於 二 零 一 三 年 推 出

More information

Microsoft Word - Final Chi-Report _PlanD-KlnEast_V7_ES_.doc

Microsoft Word - Final Chi-Report _PlanD-KlnEast_V7_ES_.doc 九 龍 東 商 業 的 統 計 調 查 - 行 政 摘 要 - 2011 年 5 月 統 計 圖 行 政 摘 要...1 圖 I: 在 不 同 地 區 及 樓 宇 類 別 的 數 目 及 比 例...9 圖 II: 影 響 選 擇 地 點 的 因 素 的 重 要 程 度 對 比 就 現 時 所 在 地 點 各 項 因 素 的 滿 意 程 度...20 圖 III: 影 響 選 擇 樓 宇 的 因 素

More information

江苏宁沪高速公路股份有限公司.PDF

江苏宁沪高速公路股份有限公司.PDF - 1 - - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - - 8 - 33.33% ( ) ( ) ( ) 33.33% ( ) ( ) ( ) 1 1 1992 8 3200001100976 1997 6 27 H 12.22 2001 1 16 A 1.5 2001 12 3 503,774.75 14,914,399,845.00 13,445,370,274.00

More information

Microsoft Word - John_Ch_1202

Microsoft Word - John_Ch_1202 新 约 圣 经 伴 读 约 翰 福 音 目 录 说 明..I 序 言 : 圣 经 中 神 圣 启 示 的 三 层.II 按 时 分 粮 的 原 则..VIII 纲 目 XI 第 一 章..1 第 二 章 13 第 三 章 25 第 四 章 37 第 五 章 49 第 六 章 61 第 七 章 73 第 八 章 85 第 九 章 97 第 十 章..109 第 十 一 章..121 第 十 二 章..133

More information

飞行模拟设备的鉴定和使用规则

飞行模拟设备的鉴定和使用规则 中 国 民 用 航 空 总 局 民 航 总 局 令 第 141 号 飞 行 模 拟 设 备 的 鉴 定 和 使 用 规 则 (2005 年 3 月 7 日 公 布 ) CCAR-60 中 国 民 用 航 空 总 局 令 第 141 号 飞 行 模 拟 设 备 的 鉴 定 和 使 用 规 则 已 经 2005 年 2 月 5 日 中 国 民 用 航 空 总 局 局 务 会 议 通 过, 现 予 公 布,

More information

全唐诗50

全唐诗50 ... 1... 1... 2... 2... 3... 3... 3... 4... 4... 5... 5... 6... 6... 6... 7... 7... 7... 8... 8... 8... 9 I II... 9...10...10...10...11...11...11...12...12...12...13...14...14...15...15...16...16...16...17,...17...18...18...19...19...19

More information

Microsoft Word - Paper on PA (Chi)_2016.01.19.docx

Microsoft Word - Paper on PA (Chi)_2016.01.19.docx 立 法 會 發 展 事 務 委 員 會 二 零 一 六 年 施 政 報 告 及 施 政 綱 領 有 關 發 展 局 的 措 施 引 言 行 政 長 官 在 二 零 一 六 年 一 月 十 三 日 發 表 題 為 創 新 經 濟 改 善 民 生 促 進 和 諧 繁 榮 共 享 的 二 零 一 六 年 施 政 報 告 施 政 報 告 夾 附 施 政 綱 領, 臚 列 政 府 推 行 的 新 措 施 和

More information

Page i

Page i 况 1 1.1.1 1.1.2 1.1.3 2 2.1 2.1.1 2.1.2 2.1.3 2.1.4 Page i 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.3 2.3.1 Page ii 2.3.2 2.3.3 2.3.4 2.4 2.4.1 2.4.2 2.4.3 Page iii 2.5 2.5.1 2.6 2.6.1 2.6.2 3 3.1 3.1.1

More information

捕捉儿童敏感期

捕捉儿童敏感期 目弽 2010 捕捉儿童敏感期 I a mao 2010-3-27 整理 早教资料每日分享 http://user.qzone.qq.com/2637884895 目弽 目彔 目弽... I 出版前言... - 1 竨一章 4 丢孝子癿敂感朏敀乞... - 1 - 妞妞 0 4 岁 海颖 妞妞癿妈妈... - 1 黑白相亝癿地斱... - 1 斵转... - 2 就丌要新帰子... - 2 小霸王...

More information

Microsoft Word - NCH final report_CHI _091118_ revised on 10 Dec.doc

Microsoft Word - NCH final report_CHI _091118_ revised on 10 Dec.doc 十 八 區 區 議 會 的 簡 介 會 (1) 東 區 區 議 會 (2008 年 4 月 24 日 ) III. 中 環 新 海 濱 城 市 設 計 研 究 第 二 階 段 公 眾 參 與 ( 東 區 區 議 會 文 件 第 51/08 號 ) 10. 主 席 歡 迎 發 展 局 副 秘 書 長 ( 規 劃 及 地 政 ) 麥 駱 雪 玲 太 平 紳 士 規 劃 署 副 署 長 / 地 區 黃 婉

More information

世界名画及画家介绍(四).doc

世界名画及画家介绍(四).doc II...1...2...2...3...4...5...7...7...8...9...9...10... 11...12...13...14...15...15...16...18...18...19...20 III...21...21...22...24...24...25...26...27...28...29...30...30...31...33...33...34...35...36...36...37...38...39...40...41...42...43

More information

天主教永年高級中學綜合高中課程手冊目錄

天主教永年高級中學綜合高中課程手冊目錄 天 主 教 永 年 高 級 中 學 綜 合 高 中 課 程 手 冊 目 錄 壹 學 校 背 景. 貳 教 育 理 念 與 教 育 目 標. 3 一 規 劃 理 念...3 二 教 育 目 標...3 參 畢 業 要 求. 5 一 總 學 分 數...5 二 必 選 修 學 分 數...5 三 必 須 參 加 活 動...9 四 成 績 評 量 方 式...9 肆 課 程 概 述.. 9 一 課 程

More information

商丘职业技术学院

商丘职业技术学院 国 家 骨 干 高 等 职 业 院 校 建 设 项 目 ( 中 央 财 政 重 点 支 持 专 业 ) 二 〇 一 二 年 六 月 畜 牧 兽 医 专 业 建 设 指 导 委 员 会 主 任 委 员 : 朱 金 凤 ( 河 南 省 高 等 学 校 教 学 名 师 ) 副 主 任 委 员 : 王 居 强 ( 河 南 省 肉 牛 工 程 技 术 开 发 中 心 ) 潘 书 林 ( 中 牟 县 奶 业 科

More information

施 的 年 度 維 修 工 程 已 於 4 月 15 日 完 成, 並 於 4 月 16 日 重 新 開 放 給 市 民 使 用 ii. 天 水 圍 游 泳 池 的 年 度 維 修 工 程 已 於 3 月 31 日 完 成, 並 於 4 月 1 日 重 新 開 放 給 市 民 使 用 iii. 元

施 的 年 度 維 修 工 程 已 於 4 月 15 日 完 成, 並 於 4 月 16 日 重 新 開 放 給 市 民 使 用 ii. 天 水 圍 游 泳 池 的 年 度 維 修 工 程 已 於 3 月 31 日 完 成, 並 於 4 月 1 日 重 新 開 放 給 市 民 使 用 iii. 元 地 委 會 文 件 2016/ 第 25 號 ( 於 6.5.2016 會 議 討 論 ) 康 樂 及 文 化 事 務 署 在 元 朗 區 內 舉 辦 的 康 樂 體 育 活 動 及 設 施 管 理 綜 合 匯 報 (2016 年 5 月 號 報 告 ) 目 的 本 文 件 旨 在 向 各 委 員 匯 報 康 樂 及 文 化 事 務 署 ( 康 文 署 ) 於 2016 年 2 月 至 5 月 在

More information

尿路感染防治.doc

尿路感染防治.doc ...1...1...2...4...6...7...7...10...12...13...15...16...18...19...24...25...26...27...28 I II...29...30...31...32...33...34...36...37...37...38...40...40...41...43...44...46...47...48...48...49...52 III...55...56...56...57...58

More information

心理障碍防治(下).doc

心理障碍防治(下).doc ( 20 010010) 787 1092 1/32 498.50 4 980 2004 9 1 2004 9 1 1 1 000 ISBN 7-204-05940-9/R 019 1880.00 ( 20.00 ) ...1...2...2...3...4...5...6...7...8...9...10... 11...12...13...15...16...17...19...21 I ...23...24...26...27...28...30...32...34...37...39...40...42...42...44...47...50...52...56...58...60...64...68

More information

对联故事

对联故事 980.00 ... 1... 1... 2... 3... 3... 4... 4... 5... 5... 6... 7... 7... 8... 9...10...10...11...12...13...13...14...15...15...16...17 I II...18...18...19...19...20...21...21...22...22...23...24...25...25...26...26...27...28...29...29...30...30...31...32...32...33...34...34...35

More information

我 非 常 希 望 该 小 组 的 建 议 尤 其 是 其 执 行 摘 要 能 受 到 将 于 2000 年 9 月 来 纽 约 参 加 千 年 首 脑 会 议 的 所 有 领 导 人 的 注 意 这 次 历 史 性 的 高 级 别 会 议 提 供 了 一 个 独 特 的 机 会 使 我 们 能 够

我 非 常 希 望 该 小 组 的 建 议 尤 其 是 其 执 行 摘 要 能 受 到 将 于 2000 年 9 月 来 纽 约 参 加 千 年 首 脑 会 议 的 所 有 领 导 人 的 注 意 这 次 历 史 性 的 高 级 别 会 议 提 供 了 一 个 独 特 的 机 会 使 我 们 能 够 联 合 国 A/55/305 大 会 安 全 理 事 会 Distr.: General 21 August 2000 Chinese Original: English 大 会 第 五 十 五 届 会 议 临 时 议 程 项 目 87 整 个 维 持 和 平 行 动 问 题 所 有 方 面 的 全 盘 审 查 安 全 理 事 会 第 五 十 五 年 2000 年 8 月 21 日 秘 书 长 给

More information

緒 言 董 事 會 宣 佈, 為 能 更 具 效 率 調 配 本 集 團 內 的 資 金 有 效 降 低 集 團 的 對 外 貸 款, 並 促 進 本 集 團 內 公 司 間 的 結 算 服 務, 於 2016 年 9 月 30 日, 本 公 司 中 糧 財 務 與 管 理 公 司 訂 立 財 務

緒 言 董 事 會 宣 佈, 為 能 更 具 效 率 調 配 本 集 團 內 的 資 金 有 效 降 低 集 團 的 對 外 貸 款, 並 促 進 本 集 團 內 公 司 間 的 結 算 服 務, 於 2016 年 9 月 30 日, 本 公 司 中 糧 財 務 與 管 理 公 司 訂 立 財 務 香 港 交 易 及 結 算 所 有 限 公 司 及 香 港 聯 合 交 易 所 有 限 公 司 對 本 公 告 的 內 容 概 不 負 責, 對 其 準 確 性 或 完 整 性 亦 不 發 表 任 何 聲 明, 並 明 確 表 示, 概 不 對 因 本 公 告 全 部 或 任 何 部 分 內 容 而 產 生 或 因 倚 賴 該 等 內 容 而 引 致 的 任 何 損 失 承 擔 任 何 責 任 JOY

More information

樹 木 管 理 專 責 小 組 報 告 人 樹 共 融 綠 滿 家 園

樹 木 管 理 專 責 小 組 報 告 人 樹 共 融 綠 滿 家 園 樹 木 管 理 專 責 小 組 報 告 人 樹 共 融 綠 滿 家 園 序 言 我 們 都 愛 樹, 愛 那 鬱 鬱 葱 葱 的 綠 意, 愛 那 股 清 新 的 氣 息, 更 愛 那 溽 暑 中 遍 地 搖 曳 的 斑 斕 樹 蔭 人 與 樹 本 應 是 那 麼 近, 但 去 年 8 月 赤 柱 塌 樹 意 外, 卻 令 我 們 赫 然 發 現, 樹 木 原 來 也 可 以 潛 藏 著 危 險,

More information

南華大學數位論文

南華大學數位論文 南 華 大 學 美 學 與 藝 術 管 理 研 究 所 碩 士 論 文 台 灣 古 琴 美 學 之 研 究 The Research on Contemporary Qin and Aesthetics in Taiwan 研 究 生 : 范 姜 沛 文 指 導 教 授 : 周 純 一 王 海 燕 中 華 民 國 九 十 七 年 六 月 f j * ~ ~~W~{J~J~l-'wfnpfT UJ[

More information

<4D6963726F736F667420576F7264202D20A4A4B0EAB371AB4FB3E65FA4A4A4E5AAA95F5F32303133>

<4D6963726F736F667420576F7264202D20A4A4B0EAB371AB4FB3E65FA4A4A4E5AAA95F5F32303133> 香 港 德 輔 道 中 71 號 永 安 集 團 大 廈 9 樓 電 話 :2867 0888 傳 真 :3906 9906 查 詢 熱 線 :3187 5100 中 國 通 意 外 急 救 醫 療 計 劃 保 單 投 保 人 以 一 份 投 保 書 及 聲 明 謹 向 中 銀 集 團 保 險 有 限 公 司 ( 下 稱 本 公 司 ) 申 請 下 述 保 險 該 份 投 保 書 及 聲 明 已 被

More information

山东出版传媒招股说明书

山东出版传媒招股说明书 ( 山 东 省 济 南 市 英 雄 山 路 189 号 ) 首 次 公 开 发 行 股 票 ( 申 报 稿 ) 保 荐 机 构 ( 主 承 销 商 ) 中 银 国 际 证 券 有 限 责 任 公 司 ( 上 海 市 浦 东 银 城 中 路 200 号 中 银 大 厦 39 层 ) 首 次 公 开 发 行 股 票 ( 一 ) 发 行 股 票 类 型 : 人 民 币 普 通 股 (A 股 ) ( 二 )

More information

Teaching kit_A4_part4.indd

Teaching kit_A4_part4.indd 4 ( 學 生 ) i. 認 識 專 題 研 習 甚 麽 是 專 題 研 習? 專 題 研 習 是 學 會 學 習 的 其 中 一 個 關 鍵 項 目 學 生 根 據 自 己 或 老 師 所 訂 立 的 主 題, 依 照 本 身 的 興 趣 和 能 力, 在 老 師 的 指 導 下, 擬 定 研 習 題 目, 設 定 探 討 的 策 略 和 方 法, 進 行 一 系 列 有 意 義 的 探 索 歷

More information

5498 立 法 會 2013 年 3 月 27 日 李 國 麟 議 員, S.B.S., J.P. 林 健 鋒 議 員, G.B.S., J.P. 梁 君 彥 議 員, G.B.S., J.P. 黃 定 光 議 員, S.B.S., J.P. 湯 家 驊 議 員, S.C. 何 秀 蘭 議 員 李

5498 立 法 會 2013 年 3 月 27 日 李 國 麟 議 員, S.B.S., J.P. 林 健 鋒 議 員, G.B.S., J.P. 梁 君 彥 議 員, G.B.S., J.P. 黃 定 光 議 員, S.B.S., J.P. 湯 家 驊 議 員, S.C. 何 秀 蘭 議 員 李 立 法 會 2013 年 3 月 27 日 5497 會 議 過 程 正 式 紀 錄 2013 年 3 月 27 日 星 期 三 上 午 11 時 正 會 議 開 始 出 席 議 員 : 主 席 曾 鈺 成 議 員, G.B.S., J.P. 何 俊 仁 議 員 李 卓 人 議 員 涂 謹 申 議 員 陳 鑑 林 議 員, S.B.S., J.P. 梁 耀 忠 議 員 劉 皇 發 議 員, 大 紫

More information

gtja

gtja 声 明 本 公 司 及 全 体 董 事 监 事 高 级 管 理 人 员 承 诺 不 存 在 虚 假 记 载 误 导 性 陈 述 或 重 大 遗 漏, 并 对 其 真 实 性 准 确 性 完 整 性 承 担 个 别 和 连 带 的 法 律 责 任 本 公 司 负 责 人 和 主 管 会 计 工 作 的 负 责 人 会 计 机 构 负 责 人 保 证 公 开 转 让 说 明 书 中 财 务 会 计 资

More information

(Chi)_.indb

(Chi)_.indb 1,000,000 4,000,000 1,000,000 10,000,000 30,000,000 V-1 1,000,000 2,000,000 20,000,00010,000,0005,000,000 3,000,000 30 20% 35% 20%30% V-2 1) 2)3) 171 10,000,00050% 35% 171 V-3 30 V-4 50,000100,000 1) 2)

More information

14A 0.1%5% 14A 14A.52 1 2 3 30 2

14A 0.1%5% 14A 14A.52 1 2 3 30 2 2389 30 1 14A 0.1%5% 14A 14A.52 1 2 3 30 2 (a) (b) (c) (d) (e) 3 (i) (ii) (iii) (iv) (v) (vi) (vii) 4 (1) (2) (3) (4) (5) 400,000 (a) 400,000300,000 100,000 5 (b) 30% (i)(ii) 200,000 400,000 400,000 30,000,000

More information

第十五章 淘宝大卖家之营销数据分析

第十五章 淘宝大卖家之营销数据分析 本 样 章 直 接 来 自 笔 者 原 稿, 因 此 在 个 别 文 字 及 排 版 上 会 与 正 式 出 版 物 有 所 差 异 关 于 本 书 的 更 多 内 容 及 下 载 请 访 问 :www.statstar.com @ 文 彤 老 师 第 十 五 章 淘 宝 大 卖 家 之 营 销 数 据 分 析 学 习 前 建 议 阅 读 第 一 章 数 据 分 析 方 法 论 简 介, 了 解 三

More information

就財務委員會委員審核2015至16年度開支預算所提出初步問題的答覆

就財務委員會委員審核2015至16年度開支預算所提出初步問題的答覆 索 引 財 務 委 員 會 審 核 二 零 一 五 至 一 六 年 度 節 會 議 綜 合 檔 案 名 稱 :DEVB(W)-2-c1.docx 問 題 編 號 委 員 姓 名 總 目 綱 領 DEVB(W)001 2007 陳 恒 鑌 159 - DEVB(W)002 0152 陳 偉 業 159 (4) 起 動 九 龍 東 DEVB(W)003 0701 陳 婉 嫻 159 (2) 文 物 保

More information

穨_2_.PDF

穨_2_.PDF 6 7.... 9.. 11.. 12... 14.. 15.... 3 .. 17 18.. 20... 25... 27... 29 30.. 4 31 32 34-35 36-38 39 40 5 6 : 1. 2. 1. 55 (2) 2. : 2.1 2.2 2.3 3. 4. ( ) 5. 6. ( ) 7. ( ) 8. ( ) 9. ( ) 10. 7 ( ) 1. 2. 3. 4.

More information

中医疗法(下).doc

中医疗法(下).doc ( 20 010010) 787 1092 1/32 498.50 4 980 2004 9 1 2004 9 1 1 1 000 ISBN 7-204-05940-9/R 019 1880.00 ( 20.00 ) ...1...2...3...4...13...15...17...17...24...25...26...26...28...28...29...31...31...33...33

More information

1956 12 1955 101 1 1957 443 1956 237 s s i 39 424 401 iii 9 ix 31 iv 15 iii 2 Vi 46 i 24 VI iii 25 III i 7 III viii 9 I V 1 I vi 8 225 1480 I ii 10 IV viii 4 639 559 113 [ 384 322 ] III

More information

Microsoft Word - COC HKROO App I _Chi_ Jan2012.doc

Microsoft Word - COC HKROO App I _Chi_ Jan2012.doc 附 錄 I 目 錄 項 目 貨 品 描 述 頁 數 (I) 活 動 物 ; 動 物 1 (II) 植 物 2 (III) 動 物 或 植 物 脂 肪 及 油 及 其 分 化 後 剩 餘 的 ; 經 處 理 可 食 的 脂 肪 ; 動 物 或 植 物 蠟 2 (IV) 經 配 製 的 食 品 ; 飲 料 酒 及 醋 ; 煙 草 及 製 成 的 煙 草 代 替 品 2 (V) 礦 產 5 (VI) 化

More information

兒 童 會 4 摩 爾 門 經 本 教 材 專 為 8-11 歲 的 兒 童 設 計 耶 穌 基 督 後 期 聖 徒 教 會 台 北 發 行 中 心 印 行

兒 童 會 4 摩 爾 門 經 本 教 材 專 為 8-11 歲 的 兒 童 設 計 耶 穌 基 督 後 期 聖 徒 教 會 台 北 發 行 中 心 印 行 兒 童 會 4 摩 爾 門 經 8-11 歲 兒 童 會 4 摩 爾 門 經 本 教 材 專 為 8-11 歲 的 兒 童 設 計 耶 穌 基 督 後 期 聖 徒 教 會 台 北 發 行 中 心 印 行 1997, 1997 by Intellectual Reserve, Inc. 1997 耶 穌 基 督 後 期 聖 徒 教 會 版 權 所 有 台 北 發 行 中 心 印 行 英 語 核 准 日

More information

untitled

untitled CHONGQING INTERNATIONAL ENTERPRISE INVESTMENT CO.,LTD. I II III IV V VI ...7...10...11...13...13...14...15...15...21...32...50...53...54...56...56...56.59...61...61...66...69...72...74...74...75...75...75...77

More information

目 錄 壹 緒 論... 2 貳 明 時 代 背 景 一 明 代 禮 教 之 於 女 性? 母 德 婦 德... 2 二 明 代 婦 女 之 於 士 人? 經 濟 支 柱... 4 參 歸 有 光 一 仕 途... 7 二 家 庭... 7 肆 歸 有 光 文 學 裡 的 女 性 比 較 一 < 項

目 錄 壹 緒 論... 2 貳 明 時 代 背 景 一 明 代 禮 教 之 於 女 性? 母 德 婦 德... 2 二 明 代 婦 女 之 於 士 人? 經 濟 支 柱... 4 參 歸 有 光 一 仕 途... 7 二 家 庭... 7 肆 歸 有 光 文 學 裡 的 女 性 比 較 一 < 項 淺 談 歸 有 光 的 女 性 側 寫 以 項 籍 軒 志 葬 寒 花 志 及 先 妣 事 略 世 美 堂 後 記 為 例 指 導 教 授 : 陳 慶 元 撰 寫 學 生 : 亷 千 儀 目 錄 壹 緒 論... 2 貳 明 時 代 背 景 一 明 代 禮 教 之 於 女 性? 母 德 婦 德... 2 二 明 代 婦 女 之 於 士 人? 經 濟 支 柱... 4 參 歸 有 光 一 仕 途...

More information

Microsoft Word - report final.doc

Microsoft Word - report final.doc 殘 疾 人 士 無 障 礙 運 輸 需 要 研 究 調 查 報 告 書 目 錄 I. 撮 要 II. III. IV. 前 言 調 查 目 的 文 獻 回 顧 V. 調 查 方 法 VI. 調 查 結 果 VII. 分 析 及 討 論 VIII. 建 議 IX. 鳴 謝 I. 撮 要 殘 疾 人 士 在 日 常 生 活 上 面 對 不 少 困 難 與 挑 戰, 健 全 人 士 未 必 可 以 身 同

More information