硕 士 专 业 学 位 论 文 (2009 届 ) 一 个 蛋 白 质 去 折 叠 可 视 化 系 统 的 设 计 与 实 现 The Design and Implementation of A Protein Unfolding Visualization System 研 究 生 姓 名 陈 宇 指 导 教 师 姓 名 吕 强 ( 教 授 ) 专 业 学 位 名 称 研 究 方 向 论 文 提 交 日 期 计 算 机 技 术 生 物 信 息 计 算 2009 年 10 月
中 文 摘 要 一 个 蛋 白 质 去 折 叠 可 视 化 系 统 的 设 计 与 实 现 中 文 摘 要 蛋 白 质 的 生 物 功 能 由 其 三 维 结 构 所 决 定, 而 蛋 白 质 通 过 特 定 的 折 叠 机 制 行 成 稳 定 的 空 间 结 构 当 前 生 物 科 学 领 域 一 直 在 研 究 蛋 白 质 序 列 与 其 空 间 结 构 的 关 系 蛋 白 质 的 折 叠 机 制 是 当 前 生 命 科 学 探 索 的 核 心 问 题 之 一 特 定 条 件 下, 蛋 白 质 的 去 折 叠 过 程 可 以 看 成 是 其 折 叠 过 程 的 逆 过 程, 因 此 对 蛋 白 质 去 折 叠 过 程 的 模 拟 和 仿 真, 对 更 好 探 索 折 叠 过 程 有 着 重 要 的 帮 助 本 文 尝 试 实 现 一 个 蛋 白 质 去 折 叠 可 视 化 系 统 肽 链 在 去 折 叠 的 展 开 过 程 中 应 该 遵 守 两 个 最 基 本 的 约 束 条 件 : 原 子 与 原 子 有 效 体 积 间 不 能 交 叠 穿 透 ; 肽 链 及 残 基 中 原 子 与 原 子 间 的 化 学 键 不 能 拉 断 本 文 将 折 叠 的 肽 链 表 示 为 一 个 刚 性 的 并 且 拥 有 一 定 运 动 自 由 度 的 线 性 链, 将 肽 链 上 的 原 子 表 示 为 可 自 由 旋 转 的 刚 性 球 体, 同 时 相 互 连 接 的 原 子 间 通 过 关 节 点 形 成 约 束 对 此 线 性 链 两 端 施 加 外 力, 通 过 使 用 动 力 学 模 拟 引 擎, 将 肽 链 逐 步 拉 伸 展 开, 最 终 达 到 完 全 伸 展 为 一 级 结 构 序 列 状 态 同 时, 可 以 完 整 记 录 蛋 白 质 肽 链 的 去 折 叠 的 过 程 基 于 去 折 叠 的 模 拟, 本 文 设 计 并 实 现 了 一 个 针 对 天 然 蛋 白 质 肽 链 在 全 原 子 水 平 上 的 去 折 叠 可 视 化 系 统 将 天 然 稳 定 状 态 的 折 叠 的 蛋 白 质, 通 过 动 力 学 的 运 算 模 拟, 可 使 肽 链 达 到 完 全 展 开 状 态 ; 并 用 三 维 可 视 化 手 段 呈 现 蛋 白 质 的 去 折 叠 的 动 态 模 拟 过 程 实 验 结 果 显 示, 在 蛋 白 质 残 基 数 量 在 130 以 内 时, 该 系 统 可 以 在 一 小 时 内 完 成 天 然 蛋 白 质 的 去 折 叠 模 拟 和 展 示 关 键 词 : 蛋 白 质 去 折 叠, 三 维 可 视 化, 动 力 学 模 拟 作 者 : 陈 宇 指 导 老 师 : 吕 强 2
Abstract The Design and Implementation of A Protein Unfolding Visualization System The Design and Implementation of A Protein Unfolding Visualization System Abstract The bio-functions of proteins are determined by their three dimensional structures which are ruled by specific folding mechanism dependent with the corresponding amino acid sequences. Sequence-folding relationship is the hot topic of structural biology. Under some conditions, protein unfolding can be considered as the reverse procedure of the protein folding. Therefore the study on the visualization based on simulation for protein unfolding is very important for the protein folding. There are two basic restrictions that the peptide should follow during its unfolding process: firstly, the atoms should not collide with each other; and secondly the bonds between the atoms should not be broken. In this thesis, the folded peptide chain is represented as a linear chain with rigidness and flexibility. Each atom in this chain can freely rotate around the joint atom within the bond space. The joint is the connection of the bonded atoms. After external force being applied to the two ends of the chain, by employing a dynamics simulation engine, the peptide chain will be gradually extended, and finally emerge to the corresponding primary structure of this protein. By this way, the protein unfolding procedure can be completely tracked. With the help of the unfolding simulation, a visualization system is designed and implemented for presenting the whole procedure of the protein unfolding based on the constraint dynamics. The system can replay the unfolding process in 3D animation style. Experiments show that the system can unfold and animate a native protein with the length less than 130 residues in one hour. Keywords: Protein unfolding, 3D Visualization, Dynamics simulation Written by Yu Chen Supervised by Qiang Lü III
目 录 第 一 章 引 言...1 1.1 研 究 背 景...1 1.2 蛋 白 质 折 叠 与 去 折 叠...1 1.3 蛋 白 质 去 折 叠 的 可 视 化...3 1.3.1 蛋 白 质 去 折 叠 可 视 化 的 意 义...3 1.3.2 蛋 白 质 结 构 简 介...3 1.3.3 蛋 白 质 数 据 库...5 1.3.4 蛋 白 质 去 折 叠 的 可 视 化 模 拟...6 1.4 论 文 主 要 工 作 与 组 织 结 构...6 第 二 章 实 现 蛋 白 质 去 折 叠 模 拟 的 相 关 技 术 概 述...7 2.1 计 算 机 三 维 可 视 化...7 2.1.1 可 视 化 的 分 类...7 2.1.2 可 视 化 的 实 现 步 骤...8 2.2 三 维 建 模 及 绘 制 技 术...9 2.2.1 常 用 建 模 及 绘 制 技 术...9 2.2.2 OpenGL 三 维 绘 制 技 术...10 2.3 碰 撞 检 测 算 法...13 2.3.1 碰 撞 检 测 分 类...13 2.3.2 层 次 包 围 盒 算 法...14 2.3.3 空 间 分 割 算 法...15 2.3.4 刚 体 碰 撞 响 应...16 2.4 本 章 小 结...17 第 三 章 蛋 白 质 去 折 叠 可 视 化 模 拟 系 统 设 计 与 实 现...18 3.1 PUV 系 统 工 作 流 程 框 架...18 3.2 蛋 白 质 相 关 数 据 封 装...18 3.2.1 标 准 PDB 文 件 分 析...19
3.2.2 ATOM 记 录 段 分 析...19 3.2.3 对 非 标 准 格 式 PDB 文 件 的 处 理...21 3.2.4 蛋 白 质 二 级 结 构 信 息 获 取...21 3.2.5 蛋 白 质 三 维 结 构 数 据 封 装...23 3.3 蛋 白 质 空 间 拓 扑 结 构 描 述...23 3.4 蛋 白 质 三 维 结 构 绘 制...25 3.5 PUV 模 拟 数 据 准 备...26 3.6 PUV 系 统 的 碰 撞 检 测 算 法...28 3.7 PUV 整 体 模 拟 算 法...30 3.8 去 折 叠 模 拟 数 据 保 存 及 再 现...31 3.8.1 PDB 文 件 序 列 形 式...31 3.8.2 AVI 动 画 形 式...32 3.9 本 章 小 结...33 第 四 章 蛋 白 质 去 折 叠 可 视 化 模 拟 系 统 测 试...34 4.1 PUV 系 统 运 行 界 面...34 4.2 PUV 蛋 白 质 三 维 结 构 显 示 效 果...34 4.3 蛋 白 质 去 折 叠 模 拟 实 验...36 4.3.1 对 不 同 残 基 数 量 蛋 白 质 的 去 折 叠 测 试...36 4.3.2 对 残 基 数 量 相 同 不 同 蛋 白 质 结 构 的 去 折 叠 测 试...37 4.3.3 去 折 叠 模 拟 过 程 效 果 展 示...38 4.4 本 章 小 结...40 第 五 章 总 结 与 展 望...41 参 考 文 献...43 附 录 A... 45 附 录 B... 46 攻 读 学 位 期 间 公 开 发 表 的 论 文...49 致 谢...50
第 一 章 引 言 第 一 章 引 言 1.1 研 究 背 景 生 物 信 息 学 是 信 息 时 代 人 类 为 解 决 生 命 科 学 中 的 各 种 挑 战 而 发 展 起 来 的 一 门 新 型 学 科, 它 是 由 生 物 学 应 用 数 学 计 算 机 科 学 相 互 交 叉 所 形 成 的 学 科, 是 当 今 生 命 科 学 和 自 然 科 学 的 重 大 前 沿 领 域 之 一, 也 是 21 世 纪 自 然 科 学 的 核 心 领 域 之 一 在 生 物 信 息 学 中, 蛋 白 质 是 其 研 究 的 重 要 宏 分 子 之 一 蛋 白 质 是 组 成 生 物 体 的 基 本 物 质, 是 生 命 活 动 的 主 要 承 担 者, 一 切 生 命 活 动 都 与 蛋 白 质 有 关 蛋 白 质 的 生 物 功 能 由 蛋 白 质 的 空 间 结 构 所 决 定, 因 此 在 研 究 蛋 白 质 功 能 时 需 要 了 解 蛋 白 质 的 空 间 结 构 目 前, 已 知 蛋 白 质 序 列 数 与 已 知 的 结 构 数 量 严 重 不 平 衡, 蛋 白 质 序 列 数 据 库 中 的 数 据 量 大 大 超 过 其 结 构 数 据 库 中 的 数 据 量 虽 然 蛋 白 质 结 构 测 定 方 法 有 所 改 进, 但 仍 不 能 满 足 实 际 的 需 要, 需 要 发 展 理 论 预 测 的 方 法 蛋 白 质 变 性 及 重 折 叠 实 验, 为 从 蛋 白 质 的 氨 基 酸 序 列 预 测 蛋 白 质 的 三 维 空 间 结 构 提 供 了 实 验 基 础 直 接 从 蛋 白 质 序 列 预 测 蛋 白 质 结 构 对 研 究 蛋 白 质 结 构 与 功 能 的 关 系 十 分 有 用, 这 也 将 促 进 蛋 白 质 工 程 和 蛋 白 质 设 计 的 发 展 从 原 理 上 讲, 蛋 白 质 序 列 隐 含 了 蛋 白 质 折 叠 后 的 空 间 结 构, 理 论 上 可 以 从 氨 基 酸 序 列 计 算 出 自 然 折 叠 的 蛋 白 质 结 构 但 是, 由 于 蛋 白 质 多 肽 链 可 能 的 构 象 是 个 天 文 数 字, 现 有 的 计 算 能 力 不 可 能 搜 索 整 个 构 象 空 间, 需 采 用 一 定 的 启 发 式 方 法 来 寻 找 自 由 能 最 优 或 接 近 于 最 优 的 构 象 近 年 来 人 们 在 认 识 蛋 白 质 的 结 构 及 其 折 叠 去 折 叠 机 制 方 面 取 得 了 一 些 不 错 的 成 绩, 但 是 对 其 基 本 规 律 的 认 识 尚 缺 乏 突 破 性 的 进 展 因 此, 蛋 白 质 结 构 及 其 相 关 功 能 的 可 视 化 研 究 对 进 一 步 认 识 蛋 白 质 起 着 重 要 的 作 用 本 文 对 蛋 白 质 去 折 叠 进 行 可 视 化 模 拟 的 目 的 在 于 借 助 计 算 机 图 形 学 及 相 关 技 术, 结 合 分 子 生 物 物 理 等 学 科 的 理 论, 快 速 而 准 确 地 进 行 蛋 白 质 肽 链 的 去 折 叠 可 视 化 模 拟 ; 从 而 可 以 为 今 后 探 索 折 叠 的 路 径 准 备 更 丰 富 真 实 的 逆 向 数 据 集 1.2 蛋 白 质 折 叠 与 去 折 叠 蛋 白 质 的 基 本 单 位 为 氨 基 酸, 而 蛋 白 质 的 一 级 结 构 指 的 就 是 其 氨 基 酸 序 列, 蛋 白 质 会 由 所 含 氨 基 酸 残 基 的 亲 水 性 疏 水 性 带 正 电 带 负 电 等 等 特 性 通 过 残 基 间 的 相 互 作 用 而 折 叠 成 一 立 体 的 三 级 结 构 如 图 1.1 所 示 1
第 一 章 引 言 图 1.1 蛋 白 质 折 叠 根 据 Anfinsen(1972 年 的 诺 贝 尔 化 学 奖 得 主 ) 的 研 究, 蛋 白 质 可 由 加 热 或 置 于 某 些 化 学 环 境 而 变 性, 三 级 结 构 解 体, 即 蛋 白 质 的 去 折 叠 过 程 ; 而 当 环 境 回 复 到 原 本 的 状 态 时, 蛋 白 质 可 于 不 到 一 秒 的 时 间 折 叠 至 原 先 的 立 体 结 构, 不 论 试 验 几 次, 蛋 白 质 都 仅 此 一 种 立 体 结 构, 于 是 Anfinsen 提 出 一 个 结 论 : 蛋 白 质 分 子 的 一 级 结 构 决 定 其 立 体 结 构 [1] 蛋 白 质 的 去 折 叠 过 程 如 图 1.2 所 示 图 1.2 蛋 白 质 去 折 叠 过 程 示 意 Anfinsen 的 研 究 结 果 非 常 重 要, 因 为 蛋 白 质 的 功 能 取 决 于 其 立 体 结 构, 而 目 前 根 据 已 知 某 基 因 序 列 可 翻 译 获 得 对 应 蛋 白 质 的 氨 基 酸 序 列, 既 蛋 白 质 的 一 级 结 构 ; 如 果 从 蛋 白 质 的 一 级 结 构 就 能 知 道 其 空 间 的 三 维 结 构, 那 么 即 可 直 接 从 基 因 推 测 其 编 码 蛋 白 质 所 对 应 的 生 物 学 功 能 虽 然 蛋 白 质 可 在 短 时 间 中 从 一 级 结 构 折 叠 至 立 体 结 构, 研 究 者 却 无 法 在 短 时 间 中 从 氨 基 酸 序 列 计 算 出 蛋 白 质 结 构, 甚 至 无 法 得 到 准 确 的 三 维 结 构, 这 是 因 为 蛋 白 质 三 维 结 构 的 可 能 构 象 空 间 实 在 是 相 当 巨 大 因 此, 研 究 蛋 白 质 折 2
第 一 章 引 言 叠 的 过 程, 可 以 说 是 破 译 第 二 遗 传 密 码 折 叠 密 码 (folding code) 的 过 程 1.3 蛋 白 质 去 折 叠 的 可 视 化 1.3.1 蛋 白 质 去 折 叠 可 视 化 的 意 义 通 过 生 物 化 学 实 验 手 段 (NMR,XRAY) 等 方 法 来 观 察 或 记 录 蛋 白 质 去 折 叠 的 过 程 时, 由 于 折 叠 与 去 折 叠 过 程 发 生 的 时 间 很 短 暂, 需 要 的 实 验 条 件 要 求 很 高, 而 同 时 获 得 可 靠 的 实 数 据 却 相 对 困 难 重 重, 所 以 一 些 实 验 都 是 针 对 特 定 的 蛋 白 质 进 行 ; 而 相 应 的 实 验 所 花 费 的 代 价 也 很 昂 贵 科 学 计 算 可 视 化, 是 计 算 机 图 形 学 的 一 个 重 要 研 究 方 向, 科 学 计 算 可 视 化 的 基 本 含 义 是 运 用 计 算 机 图 形 学 或 一 般 图 形 学 的 原 理 和 方 法, 将 科 学 与 工 程 计 算 等 产 生 的 大 规 模 数 据 转 换 为 图 形 图 像 动 画 等 形 式, 以 直 观 的 形 式 表 示 出 来 它 涉 及 计 算 机 图 形 学 图 像 处 理 计 算 机 视 觉 计 算 机 辅 助 设 计 及 图 形 用 户 界 面 等 多 个 研 究 领 域 通 过 可 视 化 工 具 对 蛋 白 质 结 构 进 行 探 索 也 是 最 常 用 的 研 究 手 段 之 一, 对 于 有 经 验 的 生 物 化 学 家, 他 们 往 往 可 以 从 这 些 图 形 中 发 现 重 要 规 律 同 样 地, 对 蛋 白 质 去 折 叠 过 程 进 行 可 视 化 模 拟, 可 以 使 用 较 小 的 代 价 取 得 更 多 有 价 值 的 参 考 数 据 1.3.2 蛋 白 质 结 构 简 介 蛋 白 质 的 生 物 学 功 能 在 很 大 程 度 上 取 决 于 其 空 间 结 构, 蛋 白 质 结 构 构 象 多 样 性 导 致 了 不 同 的 生 物 学 功 能 蛋 白 质 结 构 与 功 能 关 系 研 究 是 进 行 蛋 白 质 功 能 预 测 及 蛋 白 质 设 计 的 基 础 蛋 白 质 分 子 只 有 处 于 它 自 己 特 定 的 三 维 空 间 结 构 情 况 下, 才 能 获 得 它 特 定 的 生 物 活 性 ; 三 维 空 间 结 构 稍 有 破 坏, 就 很 可 能 会 导 致 蛋 白 质 生 物 活 性 的 降 低 甚 至 丧 失 因 为 它 们 的 特 定 的 结 构 允 许 它 们 结 合 特 定 的 配 体 分 子, 例 如, 血 红 蛋 白 和 肌 红 蛋 白 与 氧 的 结 合 酶 和 它 的 底 物 分 子 激 素 与 受 体 以 及 抗 体 与 抗 原 等 知 道 了 基 因 密 码, 科 学 家 们 可 以 推 演 出 组 成 某 种 蛋 白 质 的 氨 基 酸 序 列, 却 无 法 绘 制 蛋 白 质 空 间 结 构 因 而, 揭 示 人 类 每 一 种 蛋 白 质 的 空 间 结 构, 已 成 为 后 基 因 组 时 代 的 制 高 点, 这 也 就 是 结 构 基 因 组 学 的 基 本 任 务 对 于 蛋 白 质 空 间 结 构 的 了 解, 将 有 助 于 对 蛋 白 质 功 能 的 确 定 同 时, 蛋 白 质 是 药 物 作 用 的 靶 标, 联 合 运 用 基 因 密 码 知 识 和 蛋 白 质 结 构 信 息, 药 物 设 计 者 可 以 设 计 出 小 分 子 化 合 物, 抑 制 与 疾 病 相 关 的 蛋 白 质, 进 而 达 到 治 疗 疾 病 的 目 的 蛋 白 质 是 一 种 生 物 大 分 子, 基 本 上 是 由 20 种 氨 基 酸 以 肽 键 彼 此 连 接 形 成 肽 链 肽 键 连 接 成 肽 链 称 为 蛋 白 质 的 一 级 结 构 不 同 蛋 白 质 其 肽 链 的 长 度 不 同, 肽 链 中 不 同 3
第 一 章 引 言 氨 基 酸 的 组 成 和 排 列 顺 序 也 各 不 相 同 肽 链 在 空 间 卷 曲 折 叠 成 为 特 定 的 三 维 空 间 结 构, 包 括 二 级 结 构 和 三 级 结 构 二 个 主 要 层 次 有 些 蛋 白 质 由 多 条 肽 链 组 成, 每 条 肽 链 称 为 亚 基, 亚 基 之 间 又 有 特 定 的 空 间 关 系, 称 为 蛋 白 质 的 四 级 结 构 所 以 蛋 白 质 分 子 有 非 常 特 定 的 复 杂 的 空 间 结 构 一 般 认 为, 蛋 白 质 的 一 级 结 构 决 定 二 级 结 构, 二 级 结 构 决 定 三 级 结 构 [2] 线 性 多 肽 链 在 空 间 折 叠 成 特 定 的 三 维 空 间 结 构, 称 为 蛋 白 质 的 空 间 结 构 或 构 象 蛋 白 质 的 空 间 结 构 具 体 包 括 : 二 级 结 构 超 二 级 结 构 结 构 域 三 级 结 构 和 四 级 结 构 [3] (1) 蛋 白 质 一 级 结 构 (primary structure) 一 级 结 构 是 指 多 肽 链 的 氨 基 酸 残 基 的 排 列 顺 序, 也 是 蛋 白 质 最 基 本 的 结 构 它 是 由 基 因 上 遗 传 密 码 的 排 列 顺 序 所 决 定 的, 各 种 氨 基 酸 按 遗 传 密 码 的 顺 序 通 过 肽 键 连 接 起 来 每 一 种 蛋 白 质 分 子 都 有 自 己 特 有 的 氨 基 酸 的 组 成 和 排 列 顺 序 即 一 级 结 构, 由 这 种 氨 基 酸 排 列 顺 序 决 定 它 的 特 定 的 空 间 结 构, 也 就 是 蛋 白 质 的 一 级 结 构 决 定 了 蛋 白 质 的 二 级 三 级 等 高 级 结 构 (2) 蛋 白 质 二 级 结 构 (secondary structure) 二 级 结 构 是 指 多 肽 链 借 助 于 氢 键 沿 一 维 方 向 排 列 成 具 有 周 期 性 的 结 构 的 构 象, 是 多 肽 链 局 部 的 空 间 结 构 ( 构 象 ), 主 要 有 α 螺 旋 β 折 叠 β 转 角 等 几 种 形 式, 它 们 是 构 成 蛋 白 质 高 级 结 构 的 基 本 要 素 (3) 三 级 结 构 (tertiary structure) 三 级 结 构 主 要 针 对 球 状 蛋 白 质 而 言 的 是 指 整 条 多 肽 链 由 二 级 结 构 元 件 构 建 成 的 总 三 维 结 构, 包 括 一 级 结 构 中 相 距 远 的 肽 段 之 间 的 几 何 相 互 关 系, 骨 架 和 侧 链 在 内 的 所 有 原 子 的 空 间 排 列 如 果 蛋 白 质 分 子 仅 由 一 条 多 肽 链 组 成, 三 级 结 构 就 是 它 的 最 高 结 构 层 次 (4) 四 级 结 构 (quaternary structure) 四 级 结 构 是 指 在 亚 基 和 亚 基 之 间 通 过 疏 水 作 用 等 次 级 键 结 合 成 为 有 序 排 列 的 特 定 的 空 间 结 构 图 1.3 依 次 为 蛋 白 质 的 四 种 结 构 示 意 4
第 一 章 引 言 图 1.4 蛋 白 质 结 构 示 意 标 号 (1) 为 一 级 结 构 (2) 为 二 级 结 构 (3) 为 三 级 结 构 (4) 为 四 级 结 构 1.3.3 蛋 白 质 数 据 库 随 着 近 年 来 大 量 生 物 学 实 验 的 数 据 积 累, 形 成 了 当 前 数 量 巨 大 的 生 物 信 息 数 据 它 们 各 自 按 一 定 的 目 标 收 集 和 整 理 相 应 的 生 物 学 实 验 数 据, 并 提 供 相 关 的 数 据 库 操 作, 如 数 据 查 询 数 据 处 理 等 服 务 随 着 网 络 的 普 及 发 展, 这 些 数 据 库 大 多 可 以 通 过 网 络 直 接 访 问, 相 关 的 生 物 信 息 及 数 据 文 件 也 可 以 直 接 通 过 网 络 获 得 根 据 数 据 的 来 源 及 处 理 程 度, 通 常 将 这 些 生 物 信 息 数 据 库 分 为 一 级 数 据 库 和 二 级 数 据 库 一 级 数 据 的 数 据 都 直 接 来 源 于 实 验 获 得 的 原 始 数 据, 只 经 过 简 单 的 归 类 整 理 和 注 释 ; 二 级 数 据 库 则 是 在 一 级 数 据 库 实 验 数 据 和 理 论 分 析 的 基 础 上 针 对 特 定 目 标 衍 生 而 来, 是 对 生 物 信 息 数 据 的 进 一 步 整 理 国 际 上 著 名 蛋 白 质 序 列 数 据 库 有 SWISS-PORT PIR 等 ; 蛋 白 质 结 构 库 有 PDB 等 结 构 生 物 信 息 学 研 究 合 作 组 织 (RCSB) 的 蛋 白 质 结 构 数 据 库 PDB [4] 是 国 际 上 唯 一 的 生 物 大 分 子 结 构 数 据 档 案 库, 由 美 国 Brookhaven 国 家 实 验 室 建 立 PDB 收 集 的 数 据 来 源 于 X 光 晶 体 衍 射 和 核 磁 共 振 (NMR) 的 数 据, 经 过 整 理 和 确 认 后 存 档 而 成 目 前 PDB 数 据 库 的 维 护 由 RCSB 负 责 RCSB 的 主 服 器 和 世 界 各 地 的 镜 像 服 务 器 提 供 数 据 库 的 检 索 和 下 载 服 务 其 官 方 网 站 还 提 供 PDB 数 据 文 件 格 式 和 一 些 常 用 蛋 白 质 三 维 结 构 浏 览 器 的 说 明 本 文 开 发 过 程 中 所 用 到 的 最 初 的 蛋 白 质 分 子 结 构 数 据 均 来 自 于 RCSB 的 PDB 文 5
第 一 章 引 言 件 PDB 格 式 是 现 有 蛋 白 质 三 维 结 构 通 用 表 示 格 式 之 一 1.3.4 蛋 白 质 去 折 叠 的 可 视 化 模 拟 实 验 表 明, 蛋 白 质 去 折 叠 过 程 可 以 近 似 看 作 蛋 白 质 折 叠 的 逆 过 程, 可 以 通 过 模 拟 分 析 蛋 白 质 的 去 折 叠 过 程, 来 研 究 蛋 白 质 的 折 叠 机 制 [5] 如 果 使 用 计 算 机 三 维 绘 制 动 力 学 模 拟 等 手 段, 依 据 一 定 的 生 物 化 学 条 件, 加 以 规 则 约 束, 将 蛋 白 质 的 去 折 叠 过 程 动 态 地 展 现 并 将 其 中 间 数 据 保 存 下 来 ; 这 必 将 对 蛋 白 质 的 折 叠 机 制 结 构 预 测 及 结 构 功 能 等 研 究 有 更 好 的 帮 助 及 参 考 价 值 1.4 论 文 主 要 工 作 与 组 织 结 构 本 文 设 计 开 发 了 一 个 蛋 白 质 去 折 叠 的 可 视 化 动 力 学 模 拟 系 统 通 过 借 助 动 力 学 的 模 拟 运 算 使 得 蛋 白 质 肽 链 可 以 由 其 天 然 态 的 三 维 结 构 运 动 展 开 成 一 级 结 构, 从 而 实 现 蛋 白 质 肽 链 的 去 折 叠 模 拟 过 程 模 拟 过 程 中 的 中 间 数 据 可 以 图 像 或 PDB 数 据 格 式 保 存 利 用 模 拟 数 据, 系 统 可 以 动 态 再 现 模 拟 过 程, 并 可 生 成 AVI 动 画 系 统 模 拟 的 主 要 过 程 是 处 理 大 量 的 原 子 之 间 的 碰 撞 问 题, 由 于 原 子 数 量 较 多, 对 于 碰 撞 检 测 的 处 理 本 文 使 用 了 动 态 八 叉 树 空 间 分 割 技 术, 有 效 减 少 了 碰 撞 求 交 的 运 算 量 论 文 的 组 织 结 构 如 下 : 第 二 章 简 要 介 绍 了 蛋 白 质 去 折 叠 可 视 化 系 统 PUV ( Protein Unfolding Visualization) 所 涉 及 的 三 维 结 构 可 视 化 建 模 动 力 学 碰 撞 运 算 等 所 需 的 相 关 技 术 基 础 第 三 章 着 重 介 绍 了 PUV 的 整 个 系 统 架 构 以 及 其 在 各 个 关 键 技 术 环 节 上 的 具 体 设 计 与 实 现 第 四 章 具 体 展 示 整 个 PUV 的 工 作 模 拟 及 实 验 结 果 最 后 是 总 结 与 展 望 6
第 二 章 实 现 蛋 白 质 去 折 叠 模 拟 的 相 关 技 术 概 述 第 二 章 实 现 蛋 白 质 去 折 叠 模 拟 的 相 关 技 术 概 述 本 章 着 重 介 绍 蛋 白 质 去 折 叠 可 视 化 系 统 在 实 现 过 程 中 所 涉 及 的 一 些 相 关 关 键 技 术 这 些 技 术 主 要 有 三 维 建 模 可 视 化 绘 制 技 术 以 及 三 维 动 态 碰 撞 检 测 技 术 在 三 维 建 模 及 碰 撞 检 测 技 术 方 面, 我 们 着 重 分 析 了 与 本 系 统 相 关 的 重 要 技 术 细 节 本 章 所 介 绍 的 技 术 是 我 们 开 发 过 程 所 必 需 的 技 术 基 础 2.1 计 算 机 三 维 可 视 化 科 学 计 算 可 视 化 是 计 算 机 图 形 学 的 一 个 重 要 领 域, 它 的 核 心 是 将 数 据 转 换 为 图 形 图 像, 它 涉 及 到 标 量 矢 量 张 量 的 可 视 化 流 场 的 可 视 化 数 值 模 拟 及 计 算 的 交 互 控 制 海 量 数 据 的 存 储 处 理 及 传 输 图 形 图 像 处 理 的 向 量 及 并 行 算 法 等 而 计 算 三 维 可 视 化 建 模 则 着 重 将 这 些 数 据 以 空 间 三 维 图 形 方 式 展 现 给 用 户 如 三 维 建 筑 结 构 设 计 三 维 虚 拟 角 色 创 建 等 对 于 本 文 的 情 况 则 是 由 已 知 的 蛋 白 质 原 子 的 空 间 坐 标 数 据, 形 成 其 可 视 的 三 维 结 构, 并 能 通 过 模 拟 让 蛋 白 质 在 空 间 展 开 成 线 性 的 一 级 结 构 2.1.1 可 视 化 的 分 类 根 据 侧 重 面 的 不 同, 可 视 化 可 以 分 成 两 个 分 支, 科 学 可 视 化 (Scientific Visualization) 和 数 据 可 视 化 (Data Visualization) 科 学 可 视 化 侧 重 于 科 学 和 工 程 领 域 数 据 的 可 视 化 问 题, 它 是 空 间 数 据 场 的 可 视 化 ; 而 信 息 可 视 化 一 般 是 指 Internet 网 上 超 文 本 目 录 文 件 等 抽 象 信 息 的 可 视 化, 它 是 非 空 间 数 据 的 可 视 化 [6] 1. 科 学 可 视 化 因 为 随 着 科 学 技 术 的 发 展, 由 超 级 计 算 机 测 量 仪 器 人 造 地 球 卫 星 航 天 飞 机 地 震 勘 探 等 产 生 的 数 据 量 越 来 越 大 存 放 数 据 的 磁 带 堆 满 了 幢 幢 大 楼, 只 有 将 它 们 转 换 为 图 像 才 能 理 解 其 包 含 的 信 息 了 解 其 规 律 甚 至 发 现 用 其 它 方 法 不 能 发 现 的 现 象, 否 则, 只 能 将 这 些 数 据 收 集 起 来 束 之 高 阁 所 以 在 1987 年 由 美 国 国 家 基 金 会 在 NSF 科 学 计 算 可 视 化 会 议 上 第 一 次 提 出 了 科 学 计 算 可 视 化 (ViSC - Visualization in Scientific Computations) 的 概 念 它 是 指 运 用 计 算 机 图 形 学 和 图 像 处 理 技 术, 将 科 学 计 算 过 程 中 产 生 的 数 据 及 计 算 结 果 转 换 为 图 形 或 图 像 在 屏 幕 上 显 示 出 来, 并 进 行 交 互 处 理 的 理 论 方 法 和 技 术 科 学 计 算 可 视 化 是 计 算 机 图 形 学 的 一 个 重 要 领 域, 它 的 核 心 是 将 三 维 数 据 转 换 为 图 像, 它 涉 及 到 标 量 矢 量 张 量 等 不 同 类 别 的 空 间 数 据 的 可 7
第 二 章 实 现 蛋 白 质 去 折 叠 模 拟 的 相 关 技 术 概 述 视 化 流 场 的 可 视 化 数 值 模 拟 及 计 算 的 交 互 控 制 海 量 数 据 的 存 储 处 理 及 传 输 图 形 及 图 像 处 理 的 向 量 及 并 行 算 法 等 研 究 的 重 点 放 在 如 何 真 实 快 速 地 显 示 二 维 三 维 数 据 场 它 主 要 应 用 于 医 学 及 医 疗 地 震 勘 探 气 象 预 报 分 子 结 构 流 体 力 学 有 限 元 分 析 天 体 物 理 海 洋 观 察 地 理 信 息 洪 水 预 报 环 境 保 护 等 方 面 2. 信 息 可 视 化 信 息 可 视 化 是 随 着 计 算 机 网 络 的 广 泛 应 用 而 提 出 来 的, 它 只 有 五 年 的 历 史 目 前, 计 算 机 网 络 上 的 资 源 越 来 越 多, 存 储 的 数 据 量 越 来 越 大, 不 仅 访 问 的 结 果 需 要 用 图 像 来 表 示, 而 且 可 用 图 像 来 表 示 海 量 数 据 各 部 分 之 间 的 关 系, 指 导 和 加 速 查 找 的 过 程 它 的 研 究 内 容 包 括 层 次 信 息 结 构 可 视 化 多 维 数 据 结 构 可 视 化 时 变 数 据 结 构 可 视 化 网 络 运 行 状 态 可 视 化 分 布 环 境 算 法 可 视 化 网 络 浏 览 历 史 可 视 化 等 它 显 示 的 对 象 主 要 是 多 维 的 标 量 数 据 ( 经 济 管 理 Web 数 据 ), 目 前 的 研 究 重 点 在 于 : 设 计 和 选 择 什 么 样 的 显 示 方 式 才 能 便 于 用 户 了 解 庞 大 的 多 维 数 据 及 它 们 相 互 之 间 的 关 系 它 主 要 应 用 于 超 级 计 算 机 性 能 评 价 网 络 运 行 状 态 监 控 海 量 数 据 存 储 结 构 监 控 地 理 人 口 矿 产 市 场 等 可 视 化 2.1.2 可 视 化 的 实 现 步 骤 一 般 来 说, 可 视 化 的 过 程 与 我 们 拿 到 数 据 进 行 处 理 的 过 程 大 致 相 同, 大 致 有 以 下 四 个 步 骤 : 1. 过 滤 : 这 一 步 主 要 是 对 原 始 数 据 进 行 预 处 理 可 视 化 的 数 据 来 源 十 分 丰 富, 数 据 格 式 也 是 多 种 多 样, 这 一 步 将 各 种 各 样 的 数 据 转 换 为 可 视 化 工 具 可 以 处 理 的 标 准 格 式 可 以 转 换 数 据 形 式 滤 掉 噪 声 抽 取 感 兴 趣 的 数 据 等 2. 映 射 : 映 射 就 是 运 用 各 种 各 样 的 可 视 化 方 法 对 数 据 进 行 处 理, 提 取 出 数 据 中 包 含 的 各 种 科 学 规 律 现 象 等, 将 这 些 抽 象 的 甚 至 是 不 可 见 的 规 律 和 现 象 通 过 数 据 映 射 为 几 何 元 素 常 见 的 几 何 元 素 有 : 点 线 面 图 元 三 维 体 图 元 和 更 高 维 的 特 征 图 标 等 3. 绘 制 : 将 映 射 的 点 线 面 等 几 何 元 素 用 各 种 方 法 绘 制 到 屏 幕 上, 在 绘 制 中 有 些 物 体 可 能 是 透 明 的, 有 些 物 体 可 能 被 其 他 物 体 遮 挡 4. 显 示 : 显 示 模 块 除 了 完 成 可 视 信 息 的 显 示, 还 要 接 收 用 户 输 入 的 反 馈 信 息, 其 研 究 的 重 点 是 三 维 可 视 化 人 机 交 互 技 术 可 见, 可 视 化 的 重 点 在 于 如 何 将 数 据 以 最 佳 可 视 化 的 方 法 再 度 表 现 出 来 表 现 手 法 是 多 样 的, 主 要 是 通 过 计 算 机 的 绘 制 技 术, 但 表 现 效 果 取 决 于 我 们 前 面 的 展 现 思 路 8
第 二 章 实 现 蛋 白 质 去 折 叠 模 拟 的 相 关 技 术 概 述 2.2 三 维 建 模 及 绘 制 技 术 2.2.1 常 用 建 模 及 绘 制 技 术 当 我 们 能 够 将 数 据 映 射 转 化 到 可 用 于 可 视 化 目 的 的 数 据 时, 下 一 步 考 虑 的 就 是 如 何 实 现 这 些 新 数 据 的 表 达 了 对 于 我 们 所 需 的 三 维 绘 制 及 建 模 功 能, 目 前 常 用 的 技 术 主 要 有 OpenGL Direct3D VRML Java3D 等 等 下 面 简 要 介 绍 一 下 这 些 绘 制 技 术 的 主 要 特 点 1.OpenGL OpenGL 是 SGI 公 司 于 1992 年 发 布 的 一 个 开 放 的 三 维 图 形 软 件 包 它 独 立 于 窗 口 系 统 和 操 作 系 统, 以 它 为 基 础 开 发 的 应 用 程 序 可 以 十 分 方 便 地 在 各 种 平 台 间 进 行 移 植 [7] 它 的 功 能 特 点 主 要 有 : (1) 供 各 种 点 线 多 边 形 复 杂 曲 线 和 曲 面 以 及 复 杂 三 维 物 体 的 绘 制 函 数 ; (2) 提 供 基 本 三 维 变 换 和 投 影 变 换 ;(3) 光 照 模 式 包 括 辐 射 光 环 境 光 漫 反 射 光 和 镜 面 光 ;(4) 支 持 纹 理 映 射 ;(5) 位 图 显 示 和 图 像 增 强 ;(6) 双 缓 冲 动 画 等 等 OpenGL 是 个 专 业 的 图 形 程 序 接 口, 是 一 个 功 能 强 大, 调 用 方 便 的 底 层 图 形 库 目 前 大 量 的 高 性 能 图 形 系 统 均 是 基 于 OpenGL 平 台 开 发 2.Direct3D Direct3D 是 Microsoft 公 司 的 DirectX 交 互 媒 体 技 术 的 实 时 三 维 图 形 编 程 API 它 主 要 应 用 于 Windows 平 台 的 三 维 游 戏 的 编 程 它 是 以 设 备 无 关 的 方 式 提 供 对 三 维 显 示 硬 件 的 设 备 相 关 的 方 位 它 的 特 点 有 : (1) 可 以 切 换 的 Z 缓 冲 技 术 ;(2) 平 面 以 及 影 印 处 理 ;(3) 多 种 光 照 模 式 支 持, 完 全 支 持 材 质 ;(4) 支 持 变 换 和 三 维 裁 剪 ;(5) 充 分 利 用 Intel MMX 功 能, 支 持 Windows NT 显 然,Direct3D 是 为 在 Microsoft 的 Windows 平 台 上 的 应 用 程 序 提 供 三 维 支 持 的, 无 法 在 Internet 这 个 多 平 台 的 环 境 下 使 用 另 外,Direct3D 目 前 还 不 能 支 持 高 端 的 图 形 设 备 和 专 业 应 用 ; OpenGL 在 这 些 领 域 占 据 着 统 治 地 位 3.Java 3D Java 3D API 是 Sun 公 司 定 义 的 用 于 实 现 3D 显 示 的 应 用 开 发 接 口 Java 3D 提 供 了 基 于 Java 的 上 层 接 口 Java 3D 把 OpenGL 和 DirectX 这 些 底 层 技 术 包 装 在 Java 接 口 中 这 种 全 新 的 设 计 使 3D 技 术 变 得 不 再 繁 琐 并 且 可 以 加 入 到 J2SE J2EE 的 整 套 9
第 二 章 实 现 蛋 白 质 去 折 叠 模 拟 的 相 关 技 术 概 述 架 构, 这 些 特 性 保 证 了 Java 3D 技 术 强 大 的 扩 展 性 JAVA 3D 建 立 在 Java 基 础 之 上,Java 语 言 的 简 单 性 使 Java 3D 的 推 广 有 了 可 能 它 实 现 了 以 下 三 维 显 示 能 够 用 到 的 功 能 : (1) 生 成 简 单 或 复 杂 的 形 体 ;(2) 使 形 体 具 有 颜 色 透 明 效 果 贴 图 的 功 能 ; (3) 在 三 维 环 境 中 生 成 灯 光 移 动 灯 光 ;(4) 具 有 行 为 的 处 理 判 断 能 力 ;(5) 生 成 雾 背 景 声 音 ;(6) 使 形 体 变 形 移 动 生 成 三 维 动 画 ;(7) 编 写 非 常 复 杂 的 应 用 程 序, 用 于 各 种 领 域 如 VR( 虚 拟 现 实 ) Java3D 大 都 应 用 于 网 络 应 用 程 序, 分 子 网 络 浏 览 器 中 有 一 些 是 基 于 Java3D 的, 如 JMol Chime 等 4.VRML VRML 是 虚 拟 现 实 建 模 语 言 (Virtual Reality Modeling Language) 的 首 字 母 缩 写 它 是 一 种 用 于 描 述 三 维 造 型 与 交 互 环 境 的 简 单 的 文 本 语 言, 也 是 在 Internet 上 建 立 3D 多 媒 体 和 共 享 虚 拟 世 界 的 一 个 开 放 标 准 VRML2.0(VRML97) 自 1997 年 12 月 正 式 成 为 国 际 标 准 之 后, 在 网 络 上 得 到 了 广 泛 的 应 用 脚 本 化 的 语 句 可 以 编 写 三 维 动 画 片 三 维 游 戏 计 算 机 三 维 辅 助 教 学 它 最 大 的 优 势 在 于 可 以 嵌 在 网 页 中 显 示, 但 这 种 简 单 的 语 言 功 能 较 弱 ( 如 没 有 形 体 之 间 的 碰 撞 检 查 功 能 ), 与 JAVA 语 言 等 其 它 高 级 语 言 的 连 接 较 难 掌 握 5. 其 他 的 3D 技 术 除 了 上 述 介 绍 的 几 种 主 要 技 术 以 外, 还 有 其 它 的 一 些 主 要 应 用 于 网 络 的 Web3D 技 术 已 经 发 展 到 几 十 种 之 多 比 如 Cult3D Viewpoint Pulse3D Sev 3DML 等 等 其 中,Cult3D 主 要 用 于 在 网 页 上 建 立 互 动 的 3D 实 体, 它 使 用 的 是 Java 技 术, 具 有 一 个 跨 平 台 的 3D 引 擎 Cult3D 与 类 似 于 三 维 图 形 图 像 加 速 器 的 硬 件 没 有 关 系, 不 需 要 图 形 图 像 加 速 卡, 是 由 软 件 控 制 的 它 的 渲 染 速 度 很 快, 渲 染 效 果 非 常 出 色 并 且 它 还 具 有 良 好 的 交 互 性 结 合 本 文 的 实 际 情 况, 综 合 以 上 3D 技 术 的 比 较, 由 于 蛋 白 质 分 子 中 原 子 数 量 巨 大, 在 碰 撞 运 算 模 拟 中 需 要 较 好 的 实 时 交 互 显 示 性 能, 本 文 使 用 OpenGL 为 三 维 建 模 及 绘 制 平 台 2.2.2 OpenGL 三 维 绘 制 技 术 OpenGL 作 为 一 个 性 能 优 越 的 图 形 应 用 程 序 设 计 界 面 (API) 而 适 合 于 广 泛 的 计 算 环 境 ( 多 语 言 及 平 台 支 持 ), 从 个 人 计 算 机 到 工 作 站 和 超 级 计 算 机,OpenGL 都 能 10
第 二 章 实 现 蛋 白 质 去 折 叠 模 拟 的 相 关 技 术 概 述 实 现 高 性 能 的 三 维 图 形 功 能 由 于 许 多 在 计 算 机 界 具 有 领 导 地 位 的 计 算 机 公 司 纷 纷 采 用 OpenGL 作 为 三 维 图 形 应 用 程 序 设 计 界 面,OpenGL 应 用 程 序 具 有 广 泛 的 移 植 性 [8] OpenGL 能 够 对 整 个 三 维 模 型 进 行 渲 染 着 色, 从 而 绘 制 出 与 客 观 世 界 十 分 类 似 的 三 维 景 象 另 外 OpenGL 还 可 以 进 行 三 维 交 互 动 作 模 拟 等 具 体 的 功 能 主 要 有 以 下 这 些 内 容 [9] 模 型 绘 制 :OpenGL 能 够 绘 制 点 线 和 多 边 形 应 用 这 些 基 本 的 形 体, 我 们 可 以 构 造 出 几 乎 所 有 的 三 维 模 型 OpenGL 通 常 用 模 型 的 多 边 形 的 顶 点 来 描 述 三 维 模 型 如 何 通 过 多 边 形 及 其 顶 点 来 描 述 三 维 模 型, 在 指 南 的 在 后 续 章 节 会 有 详 细 的 介 绍 模 型 观 察 : 在 建 立 了 三 维 景 物 模 型 后, 就 需 要 用 OpenGL 描 述 如 何 观 察 所 建 立 的 三 维 模 型 观 察 三 维 模 型 是 通 过 一 系 列 的 坐 标 变 换 进 行 的 模 型 的 坐 标 变 换 在 使 观 察 者 能 够 在 视 点 位 置 观 察 与 视 点 相 适 应 的 三 维 模 型 景 观 在 整 个 三 维 模 型 的 观 察 过 程 中, 投 影 变 换 的 类 型 决 定 观 察 三 维 模 型 的 观 察 方 式, 不 同 的 投 影 变 换 得 到 的 三 维 模 型 的 景 象 也 是 不 同 的 最 后 的 视 窗 变 换 则 对 模 型 的 景 象 进 行 裁 剪 缩 放, 即 决 定 整 个 三 维 模 型 在 屏 幕 上 的 图 象 颜 色 模 式 的 指 定 :OpenGL 应 用 了 一 些 专 门 的 函 数 来 指 定 三 维 模 型 的 颜 色 程 序 员 可 以 选 择 二 个 颜 色 模 式, 即 RGBA 模 式 和 颜 色 表 模 式 在 RGBA 模 式 中, 颜 色 直 接 由 RGB 值 来 指 定 ; 在 颜 色 表 模 式 中, 颜 色 值 则 由 颜 色 表 中 的 一 个 颜 色 索 引 值 来 指 定 程 序 员 还 可 以 选 择 平 面 着 色 和 光 滑 着 色 二 种 着 色 方 式 对 整 个 三 维 景 观 进 行 着 色 光 照 应 用 : 用 OpenGL 绘 制 的 三 维 模 型 必 须 加 上 光 照 才 能 更 加 与 客 观 物 体 相 似 OpenGL 提 供 了 管 理 四 种 光 ( 辐 射 光 环 境 光 镜 面 光 和 漫 反 射 光 ) 的 方 法, 另 外 还 可 以 指 定 模 型 表 面 的 反 射 特 性 图 象 效 果 增 强 :OpenGL 提 供 了 一 系 列 的 增 强 三 维 景 观 的 图 象 效 果 的 函 数, 这 些 函 数 通 过 反 走 样 混 合 和 雾 化 来 增 强 图 象 的 效 果 反 走 样 用 于 改 善 图 象 中 线 段 图 形 的 锯 齿 而 更 平 滑, 混 合 用 于 处 理 模 型 的 半 透 明 效 果, 雾 使 得 影 像 从 视 点 到 远 处 逐 渐 褪 色, 更 接 近 于 真 实 位 图 和 图 象 处 理 :OpenGL 还 提 供 了 专 门 对 位 图 和 图 象 进 行 操 作 的 函 数 纹 理 映 射 : 三 维 景 物 因 缺 少 景 物 的 具 体 细 节 而 显 得 不 够 真 实, 为 了 更 加 逼 真 地 表 现 三 维 景 物,OpenGL 提 供 了 纹 理 映 射 的 功 能 OpenGL 提 供 的 一 系 列 纹 理 映 射 函 数 使 得 开 发 者 可 以 十 分 方 便 地 把 真 实 图 象 贴 到 景 物 的 多 边 形 上, 从 而 可 以 在 视 窗 内 绘 制 逼 真 的 三 维 景 观 11