查 找 DNA mrna cdna Protein promoter 引 物 设 计 BLAST 序 列 比 对 等 作 者 :urbest 2007-8-1 苏 州 大 学 生 命 科 学 学 院
最 近 看 到 很 多 战 友 在 论 坛 上 询 问 如 何 查 询 基 因 序 列 如 何 进 行 引 物 设 计 如 何 使 用 BLAST 进 行 序 列 比 对, 这 些 问 题 在 NCBI 上 都 可 以 方 便 的 找 到 答 案 现 在 我 就 结 合 我 自 己 使 用 NCBI 的 一 些 经 历 ( 经 验 ) 跟 大 家 交 流 一 下 BCBI 的 使 用 希 望 大 家 都 能 发 表 自 己 的 使 用 心 得, 让 我 们 共 同 进 步! 我 分 以 下 几 个 部 分 说 一 下 NCBI 的 使 用 : Part one 如 何 查 找 基 因 序 列 mrna Promoter Part two 如 何 查 找 连 续 的 mrna cdna 蛋 白 序 列 Part three 运 用 STS 查 找 已 经 公 布 的 引 物 序 列 Part four 如 何 运 用 BLAST 进 行 序 列 比 对 检 验 引 物 特 异 性 特 别 感 谢 本 版 版 主, 将 这 个 帖 子 置 顶! 从 发 帖 到 现 在, 很 多 战 友 对 该 帖 给 与 了 积 极 的 关 注, 在 此 向 给 我 投 票 的 ( 以 及 想 给 我 投 票 却 暂 时 不 能 投 票 的 ) 各 位 战 友 表 示 真 诚 的 感 谢, 谢 谢 各 位 战 友! 请 大 家 对 以 下 我 发 表 的 内 容 提 出 自 己 的 意 见 关 于 NCBI 其 他 方 面 的 使 用 也 请 水 平 较 高 的 战 友 给 予 补 充 First of all, 还 是 让 我 们 从 查 找 基 因 序 列 开 始 第 一 部 分 利 用 Map viewer 查 找 基 因 序 列 mrna 序 列 启 动 子 (Promoter) 下 面 以 人 的 IL6( 白 细 胞 介 素 6) 为 例 讲 述 一 下 具 体 的 操 作 步 骤 1. 打 开 Map viewer 页 面, 网 址 为 :http://www.ncbi.nlm.nih.gov/mapview/index.html 在 search 的 下 拉 菜 单 里 选 择 物 种,for 后 面 填 写 你 的 目 的 基 因 操 作 完 毕 如 图 所 示 : 2. 点 击 GO 出 现 如 下 页 面 : 2
3. 在 步 骤 二 图 示 的 右 下 角 有 一 个 Quick Filter, 下 面 是 让 你 选 择 的 几 个 复 选 框, 在 Gene 前 面 的 小 方 框 里 打 勾, 然 后 点 击 Filter. 出 现 下 图 : 说 明 一 下 :1 染 色 体 的 红 色 区 域 即 为 你 的 目 的 基 因 所 处 位 置 2 下 面 参 考 序 列 给 出 了 三 个, 是 不 同 的 部 门 做 出 来 的, 经 我 验 证, 序 列 有 微 小 的 差 异, 但 总 体 来 说 基 本 相 同 尽 管 你 分 别 点 击 后, 序 列 代 码 序 列 代 码 等 有 所 差 异, 但 碱 基 基 本 一 致, 不 影 响 大 家 研 究 分 析 序 列 现 在 普 遍 采 用 的 是 最 上 面 的 那 个 序 列, 这 一 条 是 世 界 范 围 的 生 物 科 学 家 用 计 算 机 合 成 的 一 个 序 列 我 也 推 荐 大 家 使 用 这 个 序 列 3
4. 点 击 上 述 三 条 序 列 第 一 条 序 列 ( 即 reference) 对 应 的 "Genes seq", 出 现 新 的 页 面, 页 面 下 方 为 : 5. 点 击 上 图 出 现 的 Download/View Sequence/Evidence, 即 下 载 查 看 序 列 等 功 能, 结 果 如 图 所 示 : 先 对 上 面 这 张 图 做 点 简 要 的 说 明, 在 Sequence Format( 序 列 输 出 格 式 ) 后 面 是 一 个 下 拉 式 选 择 菜 单, 默 认 的 为 FASTA 格 式, 还 有 一 个 是 GenBank 格 式 我 推 荐 大 家 选 择 GenBnak 格 式, 因 为 这 个 格 式 提 供 了 很 多 该 基 因 的 信 息, 而 FASTA 格 式 只 有 基 因 序 列 6. 在 Sequence Format 后 选 择 GenBank, 然 后 点 击 下 面 的 Display, 目 的 基 因 的 相 关 信 息 和 序 列 就 出 现 在 眼 前 了 点 击 后 如 图 所 示 ( 网 页 较 大, 只 抓 取 一 小 部 分 以 作 示 范 ): 4
在 上 述 打 开 的 网 页 中, 你 可 以 看 到 基 因 长 度, 基 因 序 列, 以 及 这 个 基 因 是 如 何 被 报 道 出 来 的 等 各 种 信 息 你 会 看 到 : mrna join(3598..3678,3841..4031,5090..5203,5911..6057, 7803..8394) 这 代 表 了 从 基 因 的 3598 位 开 始 就 是 转 录 区 了, 即 我 们 常 说 的 mrna 片 断, 由 于 内 含 子 的 存 在, 所 以 mrna 在 DNA 序 列 上 分 成 了 几 段 CDS join(3660..3678,3841..4031,5090..5203,5911..6057, 7803..7970) CDS 代 表 编 码 序 列, 即 蛋 白 编 码 区 是 从 3660 开 始 的 (ATG), 由 于 剪 接 作 用 所 以 CDS 区 也 是 不 连 续 的 说 到 这 里, 可 能 很 多 朋 友 都 已 经 明 白 了 promoter 即 启 动 子 区 域 在 哪 里 了 但 我 还 是 再 唠 叨 几 句 : 转 录 起 始 位 点 前 面 是 基 因 的 调 控 区, 启 动 子 区 没 有 明 显 的 位 置 定 义, 大 家 也 只 是 猜 测 它 的 大 体 位 置, 如 果 你 要 研 究 promoter 区 的 话, 建 议 你 选 择 转 录 起 始 位 点 前 的 2000 个 碱 基 进 行 研 究, 一 般 默 认 的 是 这 样 当 然 你 如 果 觉 得 长 度 太 长 不 好 研 究 的 话, 也 可 以 只 研 究 -1000 到 0 这 一 千 个 碱 基, 因 为 一 般 情 况 下, 启 动 子 区 的 变 异 都 在 这 个 区 域 内 这 样 大 家 就 可 以 找 到 自 己 的 目 的 基 因 序 列 和 启 动 子 了, 这 种 方 法 可 能 使 用 的 人 不 是 很 多, 但 我 个 人 比 较 喜 欢, 因 为 它 最 大 的 优 点 是 可 以 找 到 启 动 子 区 域 和 其 他 调 控 区 域 希 望 大 家 可 以 发 帖 交 流, 让 我 们 把 NCBI 用 的 更 好! 5
第 二 部 分 如 何 查 找 连 续 的 mrna cdna 蛋 白 序 列 ( 依 然 以 人 类 的 IL6 为 例 ) 1. 进 入 NCBI 主 页 :http://www.ncbi.nlm.nih.gov/ 在 search 后 面 选 择 Gene, 在 for 后 面 填 写 需 要 查 找 的 基 因 的 名 字 如 图 所 示 : 点 击 Go, 出 现 以 下 界 面 : 出 现 了 很 多 基 因 序 列, 在 每 个 序 列 的 右 边 还 有 Order cdna clone 的 链 接, 这 些 序 列 中 有 些 序 列 是 跟 你 的 目 的 基 因 同 名 的, 有 些 是 别 名 (Other Aliases) 与 你 的 目 的 基 因 一 致, 根 据 每 个 序 列 的 介 绍 认 真 选 择 你 的 目 的 基 因 上 图 中 我 需 要 的 IL6 是 标 号 为 2 的 序 列 2.1 查 找 cdna 序 列 2.1.1 点 击 Order cdna clone, 出 现 目 的 页 面 如 图 所 示 : 6
2.1.2 点 击 Clone Sequence 后 面 的 链 接 即 可 得 到 cdna 序 列 点 击 后 如 图 所 示 ( 只 抓 取 其 中 一 部 分 ): 2.2 查 找 mrna 蛋 白 序 列 回 到 步 骤 1 点 击 Go 之 后 出 现 的 页 面, 点 击 目 的 基 因 的 名 字, 出 现 以 下 页 面 ( 只 抓 取 7
相 关 部 分 ): 页 面 的 下 半 部 分, 即 可 以 获 取 mrna 和 蛋 白 序 列 的 部 分 : 找 到 NCBI Reference Sequences (RefSeq), 它 分 为 几 个 板 块, 第 一 个 mrna and Protein 区 可 以 让 我 们 找 到 连 续 的 编 码 mrna 序 列 和 蛋 白 序 列 在 mrna and Protein 8
下 面 有 两 个 序 列 代 码 ( 中 间 划 有 一 个 箭 头 ), 这 代 表 了 mrna 序 列 和 蛋 白 序 列 分 别 点 击 就 可 以 得 到 相 应 的 序 列 页 面 点 击 后 如 图 所 示,mRNA 序 列 : 蛋 白 序 列 如 下 : NCBI Reference Sequences (RefSeq) 的 第 二 个 板 块 是 Reference assembly, 它 下 面 显 示 的 是 Genomic, 点 击 Genomic 下 面 Reference assembly 对 应 的 Genbank 或 FASTA 即 可 出 现 编 码 的 DNA 序 列 ( 注 意 : 只 是 编 码 序 列, 其 中 包 括 内 含 子, 但 一 般 没 有 5 非 编 码 区 ) 这 一 步 就 不 做 贴 图 演 示 了 吧, 呵 呵 这 样 我 们 就 可 以 找 到 基 因 的 cdna 序 列 连 续 的 编 码 mrna 序 列 蛋 白 序 列 以 及 含 有 内 含 子 的 编 码 DNA 序 列 了 相 信 这 些 操 作 对 很 多 战 友 还 是 有 用 的 如 果 大 家 有 更 好 的 方 法, 欢 迎 发 帖 交 流! 友 情 提 示 : 在 NCBI 里 打 开 的 每 一 个 页 面 都 会 给 我 们 提 供 大 量 的 信 息, 大 家 不 妨 好 好 看 看, 可 能 会 有 令 我 们 惊 喜 的 收 获! 最 后 唠 叨 一 句 : 最 近 我 实 验 比 较 忙, 只 能 在 深 夜 发 帖, 可 能 要 过 几 天 再 发 第 三 部 分 [Part three 运 用 STS 查 找 已 经 公 布 的 引 物 序 列 ], 希 望 期 待 下 集 的 朋 友 可 以 理 解 9
第 三 部 分 运 用 STS 查 找 已 经 公 布 的 引 物 序 列 STS, 序 列 标 签 位 点 (Sequence Tagged Site): 一 段 短 的 DNA 序 列 (200-500 个 碱 基 对 ), 这 种 序 列 在 染 色 体 上 只 出 现 一 次, 其 位 置 和 碱 基 顺 序 都 是 已 知 的 在 PCR 反 应 中 可 以 检 测 处 STS 来,STS 适 宜 于 作 为 人 类 基 因 组 的 一 种 地 标, 据 此 可 以 判 定 DNA 的 方 向 和 特 定 序 列 的 相 对 位 置 以 上 内 容 基 本 是 STS 的 定 义, 我 主 张 活 学 活 用, 下 面 就 介 绍 一 下 我 个 人 用 STS 数 据 库 查 找 引 物 的 一 点 经 验 还 是 使 用 人 的 IL6 基 因 为 例, 呵 呵 1. 打 开 NCBI 主 页, 在 Search 后 面 的 下 拉 菜 单 选 择 UniSTS, 在 FOR 后 面 填 写 目 的 基 因 操 作 完 毕 如 图 所 示 : 点 击 GO 以 后 出 现 以 下 页 面, 这 是 你 会 发 现 NCBI 又 提 供 了 很 多 序 列, 下 面 我 们 还 是 要 初 步 筛 选 我 们 需 要 的 序 列 10
2. 根 据 物 种 目 的 阴 物 所 在 染 色 体 的 位 置 等 选 择 相 应 序 列 ( 可 能 不 只 一 个 ), 点 击 下 面 以 点 击 第 一 个 进 入 的 画 面 为 例 你 会 发 现 这 个 页 面 直 接 就 给 出 了 引 物 序 列,PCR 之 后 的 片 段 长 度 也 是 给 了 的 (247bp) 下 面 还 有 很 多 相 关 的 信 息 3. 点 击 GeneBank Accession 后 面 的 代 码, 进 入 下 一 个 页 面 11
啊! 前 后 引 物 都 呈 现 在 眼 前 了, 还 有 反 应 体 系 和 反 应 条 件! 其 中 Primer A 是 前 引 物 序 列,Primer B 则 是 后 引 物 序 列, 并 且 给 出 了 他 们 在 DNA 序 列 中 的 位 置 有 兴 趣 的 朋 友 可 以 在 序 列 中 找 一 下, 是 可 以 找 到 的, 不 过 要 注 意,PCR 是 双 链 扩 增, 在 序 列 中 可 以 直 接 找 到 的 是 Primer A 的 原 序 列 和 Primer B 的 互 补 序 列 在 步 骤 二 里 面 我 只 点 开 了 一 个 序 列, 继 续 打 开 其 他 的 可 能 还 会 有 对 自 己 有 用 的 引 物, 不 过 这 要 你 自 己 慢 慢 发 掘 了 这 种 寻 找 引 物 的 方 法 有 点 投 机 取 巧 的 味 道, 实 用 程 度 不 是 很 高, 但 如 果 这 里 面 恰 好 有 你 想 P 的 片 段 的 话, 恭 喜 你, 这 些 引 物 都 是 很 成 熟 的 引 物, 可 以 直 接 拿 过 来 使 用 了 如 果 想 寻 找 引 物, 大 家 可 以 查 阅 相 关 论 文, 已 经 报 道 的 引 物 我 们 为 什 么 不 用 呢?! 既 省 时 间, 可 靠 性 又 强 如 果 这 两 种 方 法 都 不 能 找 到 你 需 要 的 引 物 的 话, 那 就 自 己 设 计 吧, 建 议 使 用 Primer 5 和 Oligo 引 物 设 计 的 详 细 内 容 我 在 这 里 就 不 多 说 了, 推 荐 两 个 帖 子 给 大 家 看 一 下, 第 一 个 是 本 版 版 主 liuzeyi2002 发 起 的, 内 容 很 丰 富, 很 值 得 学 习, 另 一 个 则 是 我 发 的 http://www.dxy.cn/bbs/post/view?bid=64&id=9517792&sty=1&tpg=1&age=0 http://www.dxy.cn/bbs/post/view?bid=67&id=9523263&sty=1&tpg=1&age=0 12
第 四 部 分 如 何 运 用 BLAST 进 行 序 列 比 对 检 验 引 物 特 异 性 提 到 序 列 比 对, 绝 大 多 数 战 友 都 会 想 到 BLAST, 但 BLAST 的 使 用 确 实 又 是 一 个 很 大 的 难 题, 因 为 他 的 功 能 比 较 强 悍, 里 面 涉 及 到 的 知 识 比 较 多, 而 且 比 对 结 束 后 输 出 的 结 果 参 数 ( 指 标 ) 又 很 多 如 果 把 BLAST 的 使 用 详 细 的 都 讲 出 来, 我 想 我 发 帖 发 到 明 天 也 发 不 完, 更 何 况 我 自 己 也 不 是 完 全 懂 得 BLAST 的 使 用 所 以 我 在 这 里 也 就 画 龙 点 睛 以 比 对 核 酸 序 列 为 例 来 给 大 家 介 绍 一 下 BLAST 的 使 用, 也 算 是 BLAST 的 入 门 课 程 吧 请 看 帖 的 战 友 好 好 体 会, 如 果 你 用 心 看, 在 看 帖 完 毕 之 后 BLAST 的 基 本 使 用 ( 包 括 其 他 序 列 的 比 对 ) 应 该 没 有 问 题 了 1. 打 开 BLAST 页 面,http://www.ncbi.nlm.nih.gov/BLAST/ 打 开 后 如 图 所 示 : 对 上 面 这 个 页 面 进 行 一 下 必 要 的 介 绍 : BLAST 的 这 个 页 面 主 体 部 分 ( 左 面 ) 包 括 了 三 部 分 :BLAST Assembled Genomes Basic BLAST Specialized BLAST 相 信 大 家 可 以 看 懂 这 三 个 短 语 的 意 思, 我 就 不 多 说 了 ; 我 要 说 的 是, 可 以 认 为 这 是 三 种 序 列 比 对 的 方 法, 或 者 说 是 BLAST 的 三 条 途 径 第 一 部 分 BLAST Assembled Genomes 就 是 让 你 选 择 你 要 比 对 的 物 种, 点 击 相 应 物 种 之 后 13
即 可 进 入 比 对 页 面 第 二 部 分 Basic BLAST 包 含 了 5 个 常 用 的 BLAST, 每 一 个 都 附 有 简 短 的 介 绍 第 三 部 分 Specialized BLAST 是 一 些 特 殊 目 的 的 BLAST, 如 IgBLAST SNP 等 等, 这 个 时 候 你 就 需 要 在 Specialized BLAST 部 分 做 出 适 当 的 选 择 了 总 之, 这 是 一 个 导 航 页 面, 它 的 目 的 是 让 你 根 据 自 己 的 比 对 目 的 选 择 相 应 的 BLAST 途 径 下 面 以 最 基 本 的 核 酸 序 列 比 对 来 谈 一 下 BLAST 的 使 用, 期 间 我 也 会 含 沙 射 影 的 说 一 下 其 他 序 列 比 对 的 方 法 2. 点 击 Basic BLAST 部 分 的 nucleotide blast 链 接 到 一 个 新 的 页 面 打 开 后 如 图 所 示 : 介 绍 一 下 上 述 页 面 : Enter Query Sequence 部 分 是 让 我 们 输 入 序 列 的, 你 可 以 直 接 把 序 列 粘 贴 进 去, 也 可 以 上 传 序 列, 还 可 以 选 择 你 要 比 对 的 序 列 的 范 围 ( 留 空 就 代 表 要 比 对 你 要 输 入 的 整 个 序 列 ) Job Title 部 分 还 可 以 为 本 次 工 作 命 一 个 名 字 Choose Search Set 部 分 是 让 我 们 选 择 要 与 目 的 序 列 比 对 的 物 种 或 序 列 种 类 (genome DNA mrna 等 等 ) 如 果 是 人 或 老 鼠 的 话, 就 可 以 直 接 选 择 了 如 果 是 其 他 物 种 就 要 选 择 others 了, 这 时 候 网 页 会 主 动 跳 出 一 个 下 拉 对 话 框 和 一 个 输 入 式 对 话 框, 你 可 以 分 别 选 14
择 和 输 入 要 跟 你 的 序 列 比 对 的 序 列 种 类 和 物 种 下 面 的 Entrez Query 可 以 对 比 对 结 果 进 行 适 当 的 限 制 Program Selection 部 分 其 实 是 让 我 们 选 择 本 次 比 对 的 精 确 度, 种 内 种 间 等 等 在 BLAST 按 钮 下 面 有 一 个 Algorithm parameters, 这 是 参 数 设 置 选 项, 一 般 用 户 使 用 不 到 此 项, 所 以 它 比 较 隐 蔽, 点 击, 原 网 页 下 方 即 可 增 加 了 Algorithm parameters 的 内 容 大 部 分 战 友 都 用 不 到 更 改 这 里 面 的 选 项, 我 也 不 多 说 了, 有 兴 趣 的 朋 友 可 以 自 己 研 究 一 下 3. 依 次 填 写 上 述 网 页 必 须 部 分, 点 击 BLAST 按 钮 后, 出 现 如 下 界 面 ( 只 截 取 其 中 一 部 分 ): 出 现 的 这 个 结 果 页 面 信 息 含 量 非 常 大, 如 果 我 们 用 心 观 察, 还 是 可 以 发 现 其 中 的 一 些 主 要 指 标 的 列 举 上 图 也 是 为 了 给 大 家 展 示 一 下 这 些 评 价 标 准 其 中 Description 部 分 推 荐 大 家 详 细 看 一 下, 另 外 说 一 下 E value 这 个 指 标 与 其 他 指 标 不 同, 它 的 数 值 越 小 相 似 程 度 越 高, 其 他 几 个 ( 如 Totle score) 都 是 数 值 越 高 相 似 度 越 高 在 这 个 图 示 的 表 格 下 方 就 是 具 体 的 相 似 性 的 核 酸 序 列 了, 还 配 合 着 各 种 参 数 的 得 分 好 了, 各 位 亲 爱 的 战 友, 我 的 BLAST 就 发 到 这 里 为 止 了, 更 具 体 的 东 西 有 待 大 家 一 起 去 努 力 研 究 伴 随 着 BLAST 的 终 结, 我 的 一 步 一 步 教 你 使 用 NCBI 也 要 暂 时 告 一 段 落 了, 很 高 兴 自 己 发 第 一 个 帖 子 时 说 的 话 今 天 终 于 做 到 了 以 后 如 果 我 有 新 的 NCBI 使 用 方 法 的 话, 我 还 会 添 加 到 这 里 来, 但 我 想 这 一 阵 子 是 不 会 接 着 发 了, 呵 呵 真 心 希 望 各 位 战 友 在 这 里 一 起 交 流 自 己 使 用 NCBI 的 一 些 技 巧, 正 如 丁 香 园 的 宗 旨 一 样 我 为 人 人, 人 人 为 我, 让 我 们 互 相 学 习 共 同 进 步, 最 后 再 一 次 祝 愿 大 家 试 验 顺 利! 15
作 者 ;urbest 编 排 :lzfist 苏 州 大 学 生 命 科 学 学 院 本 文 章 已 在 丁 香 园 (http://www.dxy.cn) 网 站 发 表 16