学 校 编 码 :10384 分 类 号 密 级 学 号 :200424028 UDC 硕 士 学 位 论 文 基 于 NMR 的 代 谢 组 学 数 据 预 处 理 方 法 及 其 在 糖 尿 病 研 究 中 的 应 用 NMR-based Metabonomics Data Preprocess Methods and Its Application on Diabetes Mellitus Study 温 锦 波 指 导 教 师 姓 名 : 陈 忠 教 授 专 业 名 称 : 无 线 电 物 理 论 文 提 交 日 期 :2007 年 6 月 论 文 答 辩 时 间 :2007 年 6 月 学 位 授 予 日 期 :2007 年 月 答 辩 委 员 会 主 席 : 评 阅 人 : 2006 年 6 月
厦 门 大 学 学 位 论 文 原 创 性 声 明 兹 呈 交 的 学 位 论 文, 是 本 人 在 导 师 指 导 下 独 立 完 成 的 研 究 成 果 本 人 在 论 文 写 作 中 参 考 的 其 他 个 人 或 集 体 的 研 究 成 果, 均 在 文 中 以 明 确 方 式 标 明 本 人 依 法 享 有 和 承 担 由 此 论 文 而 产 生 的 权 利 和 责 任 声 明 人 ( 签 名 ): 2007 年 6 月 15 日
厦 门 大 学 学 位 论 文 著 作 权 使 用 声 明 本 人 完 全 了 解 厦 门 大 学 有 关 保 留 使 用 学 位 论 文 的 规 定 厦 门 大 学 有 权 保 留 并 向 国 家 主 管 部 门 或 其 指 定 机 构 送 交 论 文 的 纸 质 版 和 电 子 版, 有 权 将 学 位 论 文 用 于 非 赢 利 目 的 的 少 量 复 制 并 允 许 论 文 进 入 学 校 图 书 馆 被 查 阅, 有 权 将 学 位 论 文 的 内 容 编 入 有 关 数 据 库 进 行 检 索, 有 权 将 学 位 论 文 的 标 题 和 摘 要 汇 编 出 版 保 密 的 学 位 论 文 在 解 密 后 适 用 本 规 定 本 学 位 论 文 属 于 1 保 密 ( ), 在 年 解 密 后 适 用 本 授 权 书 2 不 保 密 ( ) ( 请 在 以 上 相 应 括 号 内 打 ) 作 者 签 名 : 日 期 : 年 月 日 导 师 签 名 : 日 期 : 年 月 日
目 录 中 文 摘 要 i 英 文 摘 要 iii 第 一 章 绪 论 1 1.1 引 言 1 1.2 本 文 的 主 要 工 作 4 参 考 文 献 5 第 二 章 基 于 NMR 的 代 谢 组 学 的 分 析 步 骤 8 2.1 生 物 样 本 收 集 与 制 备 9 2.2 数 据 预 处 理 11 2.3 数 据 多 统 计 元 分 析 15 2.4 生 物 机 理 分 析 17 2.5 本 章 小 结 18 参 考 文 献 18 第 三 章 基 于 NMR 的 代 谢 组 学 的 糖 尿 病 研 究 22 3.1 糖 尿 病 简 介 22 3.2 1 型 糖 尿 病 鼠 特 征 代 谢 物 分 析 23 3.2.1 材 料 与 方 法 24 3.2.2 结 果 分 析 与 讨 论 26 3.3 2 型 糖 尿 病 人 体 特 征 代 谢 物 分 析 29 3.3.1 材 料 与 方 法 29 3.3.2 结 果 分 析 与 讨 论 30 3.4 本 章 小 结 33 参 考 文 献 33
第 四 章 基 于 NMR 的 代 谢 组 学 的 数 据 预 处 理 方 法 研 究 36 4.1 不 同 归 一 化 方 法 的 分 析 36 4.1.1 归 一 化 方 法 描 述 36 4.1.2 归 一 化 方 法 对 比 37 4.2 不 同 标 准 化 方 法 的 分 析 42 4.2.1 标 准 化 方 法 描 述 42 4.2.2 标 准 化 方 法 对 比 44 4.3 变 量 选 择 优 化 代 谢 数 据 组 48 4.3.1 生 物 与 遗 传 算 法 48 4.3.2 基 于 R 值 的 遗 传 算 法 设 计 49 4.3.3 结 果 分 析 与 讨 论 50 4.4 本 章 小 结 52 参 考 文 献 53 第 五 章 总 结 与 展 望 56 5.1 本 文 总 结 56 5.2 展 望 56 论 文 发 表 情 况 58 致 谢 59
CONTENTS Abstract in Chinese i Abstract in English iii Chapter 1 Preface 1 1.1 Introduction 1 1.2 Main works of this dissertation 4 References 5 Chapter 2 Analysis process of NMR-based metabonomics 8 2.1 Sample collection and preparation 9 2.2 Data preprocess 11 2.3 Data multi-analysis 15 2.4 Biological mechanism analysis 17 2.5 Conclusions 18 References 18 Chapter 3 Study of diabetes mellitus using NMR-based metabonomics 22 3.1 Introduction of diabetes mellitus 22 3.2 Analysis of diabetes 1 rat s charactaristic metabolites 23 3.2.1 Material and methods 24 3.2.2 Results and discussions 26 3.3 Analysis of diabetes 2 human s charactaristic metabolites 29 3.3.1 Material and methods 29 3.3.2 Results and discussions 30 3.4 Conclusions 33
References 33 Chapter 4 Analysis of preprocess methods of NMR-based metabonomics data 36 4.1 Analysis of different normalization methods 36 4.1.1 Introduction of different normalization methods 36 4.1.2 Analysis of normalization methods 37 4.2 Analysis of different scaling methods 42 4.2.1 Introduction of scaling methods 42 4.2.2 Analysis of scaling methods 44 4.3 Optimization of metabonomics data by variable selectio 48 4.3.1 Evolution and genetic algorithm 48 4.3.2 Designing genetic algorithm based on parameter R 49 4.3.3 Results and discussions 50 4.4 Conclusions 52 References 53 Chapter 5 Summary and prospect 56 5.1 Summary 56 5.2 Prospect 56 Publications 58 Acknowledgements 59
作 者 姓 名 : 温 锦 波 论 文 题 目 : 基 于 NMR 的 代 谢 组 学 的 数 据 预 处 理 方 法 及 其 在 糖 尿 病 研 究 中 的 应 用 作 者 简 介 : 温 锦 波, 男,1982 年 04 月 出 生,2004 年 9 月 师 从 于 厦 门 大 学 陈 忠 教 授, 于 2007 年 月 获 硕 士 学 位 中 文 摘 要 自 从 1999 年 Nicholson 及 其 同 事 在 核 磁 共 振 (NMR) 研 究 的 基 础 上 提 出 代 谢 组 学 (Metabonomics) 以 来, 基 于 NMR 的 代 谢 组 学 得 到 了 迅 速 地 发 展 由 于 机 体 病 理 的 变 化, 代 谢 产 物 产 生 了 某 些 相 应 的 变 化, 利 用 NMR 手 段 就 可 以 检 测 到 这 些 代 谢 产 物 的 变 化 对 NMR 数 据 采 用 适 当 的 化 学 计 量 学 和 多 元 变 量 分 析 方 法, 提 取 丰 富 的 特 征 代 谢 物 信 息, 进 行 疾 病 的 诊 断 与 病 理 的 分 析 同 时, 数 据 预 处 理 是 代 谢 组 学 分 析 的 关 键 步 骤 之 一, 尤 其 是 数 据 归 一 化 与 标 准 化 如 何 选 择 合 适 的 预 处 理 方 法 已 成 为 代 谢 组 学 数 据 处 理 研 究 热 点 本 文 利 用 基 于 NMR 的 代 谢 组 学 方 法 研 究 糖 尿 病, 对 比 分 析 各 种 代 谢 组 学 数 据 归 一 化 与 标 准 化 方 法, 并 在 数 据 预 处 理 过 程 中 引 入 变 量 选 择 方 法 优 化 代 谢 组 学 数 据 组 本 文 的 主 要 内 容 如 下 : 1. 利 用 基 于 NMR 的 代 谢 组 学 方 法 研 究 糖 尿 病, 建 立 1 型 糖 尿 病 鼠 代 谢 模 型, 并 分 析 1 型 糖 尿 病 鼠 尿 液 特 征 代 谢 物 ; 同 时 建 立 2 型 糖 尿 病 人 体 代 谢 模 型, 分 析 2 型 糖 尿 病 人 体 血 液 特 征 代 谢 物 2. 对 比 基 于 NMR 的 代 谢 组 学 数 据 预 处 理 中 常 用 的 三 种 归 一 化 与 标 准 化 方 法, 评 价 各 种 方 法 的 优 缺 点 与 适 用 性, 并 分 析 其 对 代 谢 组 学 数 据 多 元 分 析 结 果 与 最 终 建 立 的 代 谢 模 型 的 影 响 3. 结 合 本 文 提 出 的 判 别 标 准 -R 值, 设 计 相 应 的 适 应 度 函 数, 在 代 谢 组 学 数 据 预 处 理 过 程 中, 引 入 遗 传 算 法 作 为 变 量 选 择 方 法 优 化 变 量 数 据 组 i
关 键 词 : 基 于 NMR 的 代 谢 组 学 ; 数 据 预 处 理 ; 糖 尿 病 ii
NMR-based Metabonomics Data Preprocess Methods and Its Application on Diabetes Mellitus Study Wen Jinbo ABSTRACT The NMR-based metabonomics approach evolved from the pioneering work of Nicholson and co-workers in 1999 has become a novel analytical technique. NMR-based metabonomics is a systems approach for studying in vivo metabolic profiles, which can provide information on disease processes at several stages in the discovery-and-development process by detecting change of the metabolites. While, data preprocess, as normalization and scaling, is one of the key step of metabonomics analysis, there are lots of preprocess methods, however only the appropriate one can get the accurate result. Using NMR-based metabonomics as a useful analytical technique, diabetes mellitus was studied in our work. The applicability of prevalent metabonomics data normalization and scaling methods was analyzed. At the same time, variable selection methods were introduced to the data pretreatments to optimize the metabonomics data. The main results are summarized as follows: First, we studied diabetes mellitus using 1 H-NMR-based metabonomics, established metabolic profiling of type 1 diabetic SD rats and identified the characteristic metabolites, also established metabolic profiling of type 2 diabetic patients and identified the characteristic metabolites. Second, we discussed the properties of different NMR-based metabonomics data normalization and scaling methods, analyzing their merits, drawbacks and applicability, analyzing their effects to the outcome of data multi-analysis. iii
Third, we designed a fitness function based on genetic algorithm (GA), combined with parameter R which defined to evaluate the quality of PC scoring plot. GA was used to improve the data clustering quality as a variable selection method. Keywords: NMR-based metabonomics; Diabetes mellitus (DM); Data preprocess iv
第 一 章 绪 论 1.1 引 言 [1] 代 谢 组 学 是 和 基 因 组 学 转 录 组 学 蛋 白 质 组 学 并 列 的 组 学 概 念, 是 目 前 生 物 学 和 药 物 学 领 域 发 展 最 快 的 学 科 之 一 代 谢 组 学 作 为 一 门 新 发 展 的 技 术, 它 是 通 过 考 察 生 物 体 系 受 刺 激 或 扰 动 后 ( 如 某 个 特 定 的 基 因 变 异 或 环 境 变 化 ) 其 代 谢 产 物 的 组 成 及 其 随 时 间 的 变 化, 来 研 究 生 物 体 系 代 谢 途 径 的 一 种 技 术 [2], 它 的 具 体 含 义 是 : 运 用 核 磁 共 振 (NMR) 质 谱 (MS) 气 质 联 用 技 术 (GC/MS) 高 效 液 相 色 谱 (HPLC) 等 先 进 的 分 析 技 术, 通 过 对 细 胞 提 取 物 组 织 提 取 物 和 生 物 体 液 ( 血 浆 血 清 尿 液 汗 液 胆 汁 脑 脊 液 等 ) 随 时 间 改 变 的 代 谢 物 进 行 检 测, 结 合 有 效 的 模 式 识 别 方 法 进 行 确 定 定 量 和 分 类, 并 将 这 些 代 谢 信 息 与 病 理 生 理 过 程 中 生 物 学 事 件 关 联 起 来, 从 而 了 解 机 体 生 命 活 动 的 代 谢 过 程 [2,3] 作 为 众 多 化 学 分 析 方 法 中 的 一 种,NMR 在 代 谢 物 组 学 的 研 究 中 起 着 非 常 重 要 的 作 用 这 主 要 取 决 于 NMR 所 具 有 的 优 势 : 首 先, 用 NMR 分 析 生 物 体 液 等 复 杂 混 合 物 时 样 品 的 预 处 理 简 单, 测 试 手 段 丰 富, 包 括 液 体 高 分 辨 NMR 高 分 辨 魔 角 旋 转 (HR-MAS) NMR 和 活 体 核 磁 共 振 定 域 谱 (MRS), 因 此, 能 够 在 最 接 近 生 理 状 态 的 条 件 下 对 不 同 类 型 的 样 品 进 行 检 测 其 次,NMR 是 一 种 无 损 的 多 参 数 和 动 态 分 析 技 术, 它 同 时 具 有 定 性 分 析 和 定 量 分 析 功 能, 并 且 通 过 单 次 检 测 可 以 得 到 所 有 含 量 在 NMR 检 测 限 以 上 的 物 质 ( 含 有 NMR 可 观 测 核 的 物 质 ) 的 特 征 NMR 谱, 以 及 这 些 物 质 在 整 个 刺 激 周 期 中 的 动 态 变 化, 而 且 NMR 谱 携 带 有 丰 富 的 分 子 结 构 和 动 力 学 信 息 ; 再 次,NMR 检 测 可 以 在 很 短 的 时 间 内 完 成 ( 一 般 5~10 min), 这 对 于 实 现 高 通 量 样 品 检 测 和 保 证 样 品 在 检 测 期 内 维 持 原 有 性 质 是 至 关 重 要 的 此 外, 流 动 探 头 自 动 进 样 技 术 和 自 动 NMR 谱 处 理 技 术 的 出 现 和 不 断 完 善, 也 使 检 测 速 度 和 准 确 性 不 断 提 高 而 且, 核 磁 共 振 手 段 灵 活 多 变, 通 过 操 控 脉 冲 序 列 我 们 可 以 获 得 多 种 多 样 的 信 息 例 如 代 谢 组 学 中 常 用 到 的 谱 图 编 辑 手 段 [4,5] : 单 脉 冲 CPMG(Carr-Purcell-Meiboom-Gill) 和 扩 散 加 权 序 列, 可 以 分 别 获 得 样 品 中 不 同 官 能 团 不 同 分 子 量 或 不 同 存 在 状 态 的 分 子 1 H NMR 谱 1
第 一 章 绪 论 自 基 于 NMR 的 代 谢 组 学 提 出 以 来, 引 起 了 各 国 科 学 家 的 极 大 兴 趣, 广 泛 的 应 用 于 各 个 领 域 [6-19], 如 疾 病 诊 断 [6-10], 药 物 开 发 [11-13], 植 物 代 谢 组 学 [14-16], 营 养 科 学 [17-19] 与 微 生 物 代 谢 组 学 等 方 面 的 研 究 基 于 NMR 的 代 谢 组 学 在 疾 病 诊 断 中 的 应 用 发 展 迅 速 由 于 机 体 病 例 的 变 化, 代 谢 产 物 也 产 生 了 某 种 相 应 的 变 化 同 时, 机 体 任 何 部 分 出 现 异 常 状 态, 在 体 液 的 组 成 成 分 上 都 会 有 反 映 利 用 核 磁 共 振 手 段 就 可 以 检 测 到 这 些 变 化, 对 NMR 数 据 采 用 适 当 的 化 学 计 量 学 和 多 元 变 量 分 析 方 法, 能 够 提 取 丰 富 的 特 征 代 谢 物 信 息, 这 些 特 征 代 谢 物 信 息 有 助 于 疾 病 的 诊 断 与 病 理 的 分 析 相 对 于 传 统 的 医 疗 诊 断 方 法, 代 谢 组 学 方 法 具 有 无 创 性 及 样 品 制 备 简 单 等 优 点, 因 此 其 应 用 范 围 涵 盖 了 先 天 性 代 谢 缺 陷 肾 脏 和 肝 脏 移 植 Alzheimer 疾 病 癌 症 等 广 泛 的 领 域 [20-22] 其 中 典 型 的 例 子 是 冠 心 病 的 研 究 冠 心 病 以 前 主 要 通 过 血 管 造 影 术 来 诊 断, 该 方 法 不 仅 昂 贵, 而 且 伴 随 有 不 良 反 应, 甚 至 可 能 导 致 死 亡 而 Brindle 等 [8] 用 代 谢 组 学 方 法 用 于 冠 心 病 诊 断, 结 果 显 示 经 过 正 交 信 号 校 正 (OSC) 的 模 式 识 别 方 法 能 很 好 的 区 分 重 症 冠 心 病 ( 三 支 血 管 疾 病,TVD) 病 人 和 冠 状 动 脉 正 常 人 的 血 清 另 外, 对 于 传 统 的 测 量 血 压 总 胆 固 醇 总 甘 油 三 脂 纤 维 蛋 白 素 原 白 细 胞 数 量 等 冠 心 病 危 险 度 因 子 (Risk Factor) 无 法 区 分 的 不 同 程 度 的 冠 心 病, 代 谢 组 学 方 法 也 能 很 好 的 区 分, 并 且 通 过 回 归 分 析, 发 现 VLDL LDL HDL 和 胆 碱 等 是 导 致 两 者 区 分 的 主 要 因 素 他 们 也 用 代 谢 组 学 方 法 对 不 同 程 度 的 高 血 压 病 人 作 了 研 究 [23], 发 现 导 致 不 同 收 缩 压 (Systolic Blood Pressure, SBP) 的 因 素 是 血 清 中 脂 蛋 白 颗 粒 的 组 成, 如 脂 肪 酸 侧 链 的 不 饱 和 度 脂 蛋 白 分 子 之 间 相 互 作 用 的 强 度, 而 不 是 脂 类 的 绝 对 含 量 多 种 癌 症 [11,24] ( 乳 腺 癌 卵 巢 癌 肝 癌 前 列 腺 癌 脑 肿 瘤 ) 先 天 性 障 碍 [20-22] 等 疾 病 在 代 谢 组 学 方 法 的 指 引 下 也 有 了 许 多 新 的 发 现 可 以 预 见, 代 谢 组 学 在 分 子 病 理 和 疾 病 诊 断 等 领 域 将 有 广 阔 的 应 用 前 景 糖 尿 病 (diabetes mellitus,dm) [25] 是 以 糖 代 谢 失 常 为 主 要 表 现 的 一 种 常 见 的 内 分 泌 性 代 谢 疾 病 其 主 要 病 理 生 理 变 化 为 胰 岛 素 的 绝 对 不 足 或 胰 岛 素 效 应 降 低 引 起 的 糖 蛋 白 质 脂 肪 水 及 电 解 质 等 代 谢 紊 乱, 可 分 为 胰 岛 素 依 赖 型 糖 尿 病 (IDDM, 称 为 1 型 ) 和 非 胰 岛 素 依 赖 型 糖 尿 病 (NIDDM, 称 为 2 型 ) 糖 尿 病 通 常 所 表 现 的 是 整 体 的 代 谢 紊 乱, 也 称 为 代 谢 综 合 症 由 于 糖 尿 病 是 代 谢 紊 乱 性 疾 病, 所 以 从 生 物 体 液 中 代 谢 物 的 角 度 研 究 是 一 个 很 好 的 渠 道 生 物 体 液 中 的 代 谢 物 与 细 胞 和 组 2
Degree papers are in the Xiamen University Electronic Theses and Dissertations Database. Full texts are available in the following ways: 1. If your library is a CALIS member libraries, please log on http://etd.calis.edu.cn/ and submit requests online, or consult the interlibrary loan department in your library. 2. For users of non-calis member libraries, please mail to etd@xmu.edu.cn for delivery details.