Microsoft Word - FANSe_Manual_cn



Similar documents
说 明 为 了 反 映 教 运 行 的 基 本 状 态, 为 校 和 院 制 定 相 关 政 策 和 进 行 教 建 设 与 改 革 提 供 据 依 据, 校 从 程 资 源 ( 开 类 别 开 量 规 模 ) 教 师 结 构 程 考 核 等 维 度, 对 2015 年 春 季 期 教 运 行 基

何 秋 琳 张 立 春 视 觉 学 习 研 究 进 展 视 觉 注 意 视 觉 感 知

I

深圳市新亚电子制程股份有限公司

Microsoft Word - 第7章 图表反转形态.doc

第2章 数据类型、常量与变量

 编号:

登录、注册功能的测试用例设计.doc

评 委 : 李 炎 斌 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

HSK( 一 级 ) 考 查 考 生 的 日 常 汉 语 应 用 能 力, 它 对 应 于 国 际 汉 语 能 力 标 准 一 级 欧 洲 语 言 共 同 参 考 框 架 (CEF) A1 级 通 过 HSK( 一 级 ) 的 考 生 可 以 理 解 并 使 用 一 些 非 常 简 单 的 汉 语

3 复 试 如 何 准 备 4 复 试 成 绩 计 算 5 复 试 比 例 6 复 试 类 型 7 怎 么 样 面 对 各 种 复 试 04 05

采 取 行 动 的 机 会 90% 开 拓 成 功 的 道 路 2

i 1) 系 统 运 作 前 设 定 *1. [2.1 网 页 主 机 名 称 设 定 ] -- 设 定 校 务 系 统 的 主 机 IP 地 址, 以 供 其 他 个 人 电 脑 连 接 及 使 用 该 系 统 *2. [2.3.1 输 入 / 修 改 学 校 资 料 ] -- 输 入 系 统 使

《C语言基础入门》课程教学大纲

修改版-操作手册.doc

第 一 部 分 MagiCAD for Revit 安 装 流 程

Template BR_Rec_2005.dot

龚 亚 夫 在 重 新 思 考 基 础 教 育 英 语 教 学 的 理 念 一 文 中 援 引 的 观 点 认 为 当 跳 出 本 族 语 主 义 的 思 维 定 式 后 需 要 重 新 思 考 许 多 相 连 带 的 问 题 比 如 许 多 发 音 的 细 微 区 别 并 不 影 响 理 解 和

定 位 和 描 述 : 程 序 设 计 / 办 公 软 件 高 级 应 用 级 考 核 内 容 包 括 计 算 机 语 言 与 基 础 程 序 设 计 能 力, 要 求 参 试 者 掌 握 一 门 计 算 机 语 言, 可 选 类 别 有 高 级 语 言 程 序 设 计 类 数 据 库 编 程 类

( ) 信 号 与 系 统 Ⅰ 学 科 基 础 必 修 课 教 周 2016 年 06 月 13 日 (08:00-09:35) ( )

国债回购交易业务指引

全国建筑市场注册执业人员不良行为记录认定标准(试行).doc

<433A5C446F63756D656E E E67735C41646D696E F725CD7C0C3E65CC2DBCEC4CFB5CDB3CAB9D3C3D6B8C4CFA3A8BCF2BBAFA3A95CCAB9D3C3D6B8C4CF31302D31392E646F63>

Microsoft Word - 第3章.doc


金 不 少 于 800 万 元, 净 资 产 不 少 于 960 万 元 ; (3) 近 五 年 独 立 承 担 过 单 项 合 同 额 不 少 于 1000 万 元 的 智 能 化 工 程 ( 设 计 或 施 工 或 设 计 施 工 一 体 ) 不 少 于 2 项 ; (4) 近 三 年 每 年

评 委 : 徐 岩 宇 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

珠江钢琴股东大会


一、资质申请

0 年 上 半 年 评 价 与 考 核 细 则 序 号 部 门 要 素 值 考 核 内 容 考 核 方 式 考 核 标 准 考 核 ( 扣 原 因 ) 考 评 得 3 安 全 生 产 目 30 无 同 等 责 任 以 上 道 路 交 通 亡 人 事 故 无 轻 伤 责 任 事 故 无 重 大 质 量

<4D F736F F D20B2CEBFBC3232C6DAD1A7CFB0D3EBCBBCBFBCC4DAD2B3>

¹ º ¹ º 农 业 流 动 人 口 是 指 户 口 性 质 为 农 业 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个 月 及 以 上 的 流 动 人 口 非 农 流 动 人 口 是 指 户 口 性 质 为 非 农 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个

,,,,, :,, (.,, );, (, : ), (.., ;. &., ;.. &.., ;, ;, ),,,,,,, ( ) ( ),,,,.,,,,,, : ;, ;,.,,,,, (., : - ),,,, ( ),,,, (, : ),, :,

第 期 李 伟 等 用 方 法 对 中 国 历 史 气 温 数 据 插 值 可 行 性 讨 论

(Microsoft Word - NCRE\314\345\317\265\265\367\325\37313\324\27221\272\3051.doc)

用节点法和网孔法进行电路分析

2006年顺德区高中阶段学校招生录取分数线


Microsoft Word - 文件汇编.doc

3 月 30 日 在 中 国 证 券 报 上 海 证 券 报 证 券 时 报 证 券 日 报 和 上 海 证 券 交 易 所 网 站 上 发 出 召 开 本 次 股 东 大 会 公 告, 该 公 告 中 载 明 了 召 开 股 东 大 会 的 日 期 网 络 投 票 的 方 式 时 间 以 及 审

<4D F736F F D20B9D8D3DAB0BABBAAA3A8C9CFBAA3A3A9D7D4B6AFBBAFB9A4B3CCB9C9B7DDD3D0CFDEB9ABCBBE C4EAC4EAB6C8B9C9B6ABB4F3BBE1B7A8C2C9D2E2BCFBCAE92E646F6378>

随着执业中医师资格考试制度的不断完善,本着为我校中医学专业认证服务的目的,本文通过对我校中医类毕业生参加2012年和2013年的中医执业医师考试成绩及通过率、掌握率进行分析,并与全国的平均水平进行差异比较分析,以此了解我校执业中医师考试的现状,进而反映我校中医类课程总体教学水平,发现考核知识模块教学中存在的不足,反馈给相关学院和教学管理部门,以此提高教学和管理水平。

证券代码: 证券简称:长城电脑 公告编号:

<4D F736F F D D323630D6D0B9FAD3A6B6D4C6F8BAF2B1E4BBAFB5C4D5FEB2DFD3EBD0D0B6AF C4EAB6C8B1A8B8E6>

目 录 关 于 图 标... 3 登 陆 主 界 面... 3 工 单 管 理... 5 工 单 列 表... 5 搜 索 工 单... 5 工 单 详 情... 6 创 建 工 单... 9 设 备 管 理 巡 检 计 划 查 询 详 情 销 售 管

际 联 考 的 非 美 术 类 本 科, 提 前 批 本 科 体 育 类 第 一 批 第 二 批 第 三 批 的 理 工 类 和 文 史 类 本 科 平 行 志 愿, 考 生 可 以 填 报 6 所 院 校 志 愿 符 合 贫 困 地 区 专 项 计 划 和 农 村 考 生 专 项 计 划 报 考

一 公 共 卫 生 硕 士 专 业 学 位 论 文 的 概 述 学 位 论 文 是 对 研 究 生 进 行 科 学 研 究 或 承 担 专 门 技 术 工 作 的 全 面 训 练, 是 培 养 研 究 生 创 新 能 力, 综 合 运 用 所 学 知 识 发 现 问 题, 分 析 问 题 和 解 决

徐天宏:《基因天堂》.doc

附 件 : 上 海 市 建 筑 施 工 企 业 施 工 现 场 项 目 管 理 机 构 关 键 岗 位 人 员 配 备 指 南 二 一 四 年 九 月 十 一 日 2

上海证券交易所会议纪要

·岗位设置管理流程

一 六 年 级 下 册 教 科 书 总 体 说 明 ( 一 ) 教 学 内 容 本 册 教 科 书 一 共 安 排 了 5 个 教 学 单 元, 其 中 前 4 个 单 元 为 新 知 识, 第 五 单 元 是 对 整 个 小 学 阶 段 所 学 数 学 知 识 系 统 的 整 理 和 复 习

云信Linux SSH认证代理用户手册

中 国 软 科 学 年 第 期!!!

导 数 和 微 分 的 概 念 导 数 的 几 何 意 义 和 物 理 意 义 函 数 的 可 导 性 与 连 续 性 之 间 的 关 系 平 面 曲 线 的 切 线 和 法 线 导 数 和 微 分 的 四 则 运 算 基 本 初 等 函 数 的 导 数 复 合 函 数 反 函 数 隐 函 数 以

西 南 民 族 学 院 学 报 哲 学 社 会 科 学 版 第 卷 资 料 来 源 中 国 统 计 年 鉴 年 年 新 中 国 五 十 年 统 计 资 料 汇 编 中 国 人 口 统 计 年 鉴 年 数 据 资 料 来 源 中 国 统 计 年 鉴 中 国 统 计 出 版 社 年 版 资 料 来 源

黄 金 原 油 总 持 仓 增 长, 同 比 增 幅 分 别 为 4.2% 和 4.1% 而 铜 白 银 以 及 玉 米 则 出 现 减 持, 减 持 同 比 减 少 分 别 为 9.4%,9.4% 以 及 6.5% 大 豆, 豆 粕 结 束 连 续 4 周 总 持 仓 量 增 长, 出 现 小 幅

课程类 别

教师上报成绩流程图

正 规 培 训 达 规 定 标 准 学 时 数, 并 取 得 结 业 证 书 二 级 可 编 程 师 ( 具 备 以 下 条 件 之 一 者 ) (1) 连 续 从 事 本 职 业 工 作 13 年 以 上 (2) 取 得 本 职 业 三 级 职 业 资 格 证 书 后, 连 续 从 事 本 职 业

<4D F736F F D20C6F3D2B5C5E0D1B5CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

目 录 一 系 统 访 问... 1 二 门 户 首 页 申 报 用 户 审 核 用 户... 2 三 系 统 登 录 用 户 名 密 码 登 录 新 用 户 注 册 用 户 登 录 已 注 册 用

<4D F736F F D20BFC9B1E0B3CCD0F2BFD8D6C6CFB5CDB3C9E8BCC6CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

精 勤 求 学 自 强 不 息 Born to win! 解 析 : 由 极 限 的 保 号 性 知 存 在 U ( a) 当 a 时 f ( ) f ( a) 故 f ( ) 在 点 a 不 取 极 值 f ( ) f ( a) f ( ) f ( a) lim lim a a a a ( a)

工 程 勘 察 资 质 标 准 根 据 建 设 工 程 勘 察 设 计 管 理 条 例 和 建 设 工 程 勘 察 设 计 资 质 管 理 规 定, 制 定 本 标 准 一 总 则 ( 一 ) 本 标 准 包 括 工 程 勘 察 相 应 专 业 类 型 主 要 专 业 技 术 人 员 配 备 技 术

2.5 选 举 陈 晓 非 女 士 为 第 六 届 董 事 会 董 事 候 选 人 的 议 案 ; 2.6 选 举 卢 婕 女 士 为 第 六 届 董 事 会 董 事 候 选 人 的 议 案 ; 2.7 选 举 张 文 君 先 生 为 第 六 届 董 事 会 独 立 董 事 候 选 人 的 议 案

第二讲 数列

附件1:

中 日 信 息 化 的 比 较 与 合 作 一 中 日 信 息 化 的 规 模 比 较

抗 战 时 期 国 民 政 府 的 银 行 监 理 体 制 探 析 % # % % % ) % % # # + #, ) +, % % % % % % % %

<4D F736F F D C4EAB9A4B3CCCBB6CABFCAFDD1A7D7A8D2B5BFCEBFBCCAD4B4F3B8D9D3EBD2AAC7F3>

2016年南开大学MBA招生信息

untitled

<4D F736F F D20B3D6B2D6CFDEB6EEB1EDB8F1D7EED6D52E646F63>

第 三 章 审 计 证 据 2

名 称 生 命 科 学 学 院 环 境 科 学 1 生 物 学 仅 接 收 院 内 调 剂, 初 试 分 数 满 足 我 院 生 物 学 复 试 最 低 分 数 线 生 命 科 学 学 院 生 态 学 5 生 态 学 或 生 物 学 生 命 科 学 学 院

ETF、分级基金规模、份额变化统计

( 二 ) 现 行 统 一 高 考 制 度 不 利 于 培 养 人 的 创 新 精 神,,,,,,,,,,,,, [ ],,,,,,,,,,, :, ;,,,,,,? ( 三 ) 现 行 统 一 高 考 制 度 不 利 于 全 体 学 生 都 获 得 全 面 发 展,, [ ],,,,,,,,,,,

全国艺术科学规划项目

生产支援功能 使用说明书(IP-110 篇)

<433A5C C6B73625C B746F705CB9FABCCAD6D0D2BDD2A9D7A8D2B5B8DFBCB6BCBCCAF5D6B0B3C6C6C0C9F3C9EAC7EBD6B8C4CFA3A CDA8D3C3B0E6A3A92E646F63>

目 录 第 一 章 博 星 卓 越 电 子 商 务 营 销 策 划 实 践 平 台 硬 件 使 用 介 绍... 3 第 二 章 博 星 卓 越 电 子 商 务 营 销 策 划 实 践 平 台 管 理 员 端 功 能 使 用 介 绍 系 统 管 理 员 登 陆 班

全国教师资格认定管理信息系统

合 并 计 算 配 售 对 象 持 有 多 个 证 券 账 户 的, 多 个 证 券 账 户 市 值 合 并 计 算 确 认 多 个 证 券 账 户 为 同 一 配 售 对 象 持 有 的 原 则 为 证 券 账 户 注 册 资 料 中 的 账 户 持 有 人 名 称 有 效 身 份 证 明 文 件

第 六 章 债 券 股 票 价 值 评 估 1 考 点 一 : 债 券 价 值 的 影 响 因 素 2

自 服 务 按 钮 无 法 访 问 新 系 统 的 自 服 务 页 面 因 此 建 议 用 户 从 信 网 中 心 ( 主 页, 右 下 角 位 置 的 常 用 下 载, 或 校 园 网 用 户 自 服 务 ( 首 页

一 从 分 封 制 到 郡 县 制 一 从 打 虎 亭 汉 墓 说 起

类 似 地, 又 可 定 义 变 下 限 的 定 积 分 : ( ). 与 ψ 统 称 为 变 限 积 分. f ( ) d f ( t) dt,, 注 在 变 限 积 分 (1) 与 () 中, 不 可 再 把 积 分 变 量 写 成 的 形 式 ( 例 如 ) 以 免 与 积 分 上 下 限 的

第 四 条 建 设 单 位 对 可 能 产 生 职 业 病 危 害 的 建 设 项 目, 应 当 依 照 本 办 法 向 安 全 生 产 监 督 管 理 部 门 申 请 职 业 卫 生 三 同 时 的 备 案 审 核 审 查 和 竣 工 验 收 建 设 项 目 职 业 卫 生 三 同 时 工 作 可


Cybozu Garoon 3 管理员手册

北 京 德 恒 律 师 事 务 所 关 于 一 汽 轿 车 股 份 有 限 公 司 2012 年 度 股 东 大 会 的 法 律 意 见 致 : 一 汽 轿 车 股 份 有 限 公 司 德 恒 D BJ-02 号 北 京 德 恒 律 师 事 务 所 ( 以 下 简

国际财务报告准则第13号——公允价值计量

<4D F736F F D C3E6CFF2B6D4CFF3A3A8B5DAC8FDD5C220C0E0CCD8D0D4A3A92E646F63>

通用短信平台HTTP接口使用说明V1.0.4

思 想 政 治 理 论 经 核 查 无 误 思 想 政 治 理 论 经 核 查 无 误 思 想 政 治 理 论 经 核 查 无 误 思 想

18 上 报 该 学 期 新 生 数 据 至 阳 光 平 台 第 一 学 期 第 四 周 至 第 六 周 19 督 促 学 习 中 心 提 交 新 增 专 业 申 请 第 一 学 期 第 四 周 至 第 八 周 20 编 制 全 国 网 络 统 考 十 二 月 批 次 考 前 模 拟 题 第 一 学

2 根 据 广 东 省 交 通 建 设 工 程 施 工 现 场 开 工 前 考 核 评 表 或 根 据 广 东 省 交 通 建 设 工 程 施 工 现 场 实 施 过 程 考 核 评 表 的 和 内 容 进 行 核 查 ; 3 现 场 抽 查 具 有 代 表 性 的 各 岗 位 人 员 ( 从 事

<4D F736F F D20322EC9F3BACBC8CBD4B1D7CAB8F1D7A2B2E1B9DCC0EDB9E6B7B6B8BDB1ED2E646F63>

Transcription:

FANSe 快 速 准 确 的 核 酸 测 序 序 列 比 对 工 具 版 本 7.2 说 明 书 1. 介 绍 什 么 是 FANSe? FANSe 是 一 种 将 大 规 模 测 序 技 术 所 产 生 的 数 以 百 万 计 的 短 读 序 列 (reads, 即 短 核 苷 酸 序 列 ) 向 参 考 基 因 组 序 列 上 进 行 比 对 的 算 法 FANSe 能 在 保 持 合 理 运 行 速 度 的 前 提 下 达 到 非 常 高 的 准 确 度 FANSe 的 优 势 准 确 性 FANSe 能 达 到 一 个 稳 定 且 非 常 高 的 灵 敏 度 在 测 序 错 误 率 为 每 核 苷 酸 0.5% 的 情 况 下,FANSe 的 误 判 率 可 低 达 10-6, 特 别 是 在 比 对 RNA 测 序 序 列 的 时 候 在 我 们 所 有 的 测 试 案 例 中,FANSe 能 比 其 它 短 序 列 比 对 算 法 比 对 上 更 多 的 短 读 序 列 与 此 同 时,FANSe 仍 能 保 持 很 高 的 正 确 性 ( 将 短 读 序 列 比 对 到 其 来 源 的 位 点 上 ), 其 正 确 性 与 Bowtie 处 于 同 一 水 平 或 略 高 对 插 入 缺 失 位 点 的 敏 感 因 为 使 用 了 不 依 赖 硬 件 的 加 速 Smith-Waterman 算 法 ( 不 像 SHRiMP 那 样 必 须 要 求 SSE2 指 令 集 ),FANSe 能 对 碱 基 的 插 入 和 缺 失 提 供 完 美 的 检 测 速 度 FANSe 能 使 用 一 个 CPU 核 心 在 几 分 钟 内 向 大 肠 杆 菌 的 参 考 基 因 组 比 对 1000 万 个 短 读 序 列, 或 者 用 一 台 四 核 计 算 机 在 大 约 一 天 时 间 内 将 1000 万 个 短 读 序 列 向 人 类 参 考 基 因 组 进 行 比 对 对 短 读 序 列 的 错 配 宽 容 度 FANSe 对 错 配 碱 基 的 容 限 的 设 置 是 非 常 灵 活 的 : 你 可 以 设 置 任 意 数 值 的 容 许 错 配 碱 基 数, 而 不 像 SOAP2 Bowtie 那 样 只 能 最 多 允 许 2~3 个 错 配 设 置 较 高 的 错 配 容 限 可 以 最 大 限 度 地 提 高 比 对 的 灵 敏 度, 而 不 会 降 低 其 比 对 的 准 确 性 短 读 序 列 仍 会 被 匹 配 到 最 优 位 点 上 极 强 的 适 应 性 FANSe 对 输 入 的 测 序 读 长 和 参 考 基 因 组 没 有 任 何 限 制 它 支 持 在 参 考 序 列 中 存 在 被 遮 罩 的 (masked) 和 未 被 测 定 核 苷 酸 ( 标 识 为 "N") 现 在,FANSe 也 支 持 单 向 比 对

2. 使 用 FANSe 的 要 求 操 作 系 统 早 期 版 本 的 FANSe 是 用 Microsoft Visual BASIC.NET 2010 来 编 程 的 从 7.0 版 本 开 始, 我 们 用 ANSI-C 对 其 进 行 了 重 新 编 程, 能 在 多 种 操 作 系 统 上 对 其 进 行 编 译 我 们 推 荐 使 用 64 位 的 操 作 系 统 和 64 位 版 本 的 FANSe 以 获 得 更 好 的 性 能 ( 据 测 试 大 约 能 提 高 20-30% 的 速 度 ) 从 7.2 版 开 始,FANSe 编 程 时 只 考 虑 64 位 操 作 系 统 你 仍 然 可 以 下 载 源 代 码 并 将 其 编 译 成 32 为 可 执 行 文 件, 不 过 我 们 不 保 证 这 样 一 定 能 运 行 如 果 你 选 择 自 行 编 译, 请 选 用 一 种 可 靠 的 ANSI-C 编 译 器 我 们 强 烈 建 议 编 译 时 使 用 最 高 优 化 (-O3) 和 CPU 指 令 集 优 化 选 项 以 提 高 速 度 测 序 数 据 集 大 规 模 测 序 数 据 必 须 是 FASTQ 格 式, 且 在 核 苷 酸 空 间 内 FANSe 暂 不 支 持 SOLiD 的 原 始 色 彩 空 间 在 处 理 色 彩 空 间 之 前,SOLiD 格 式 的 数 据 应 先 转 换 成 核 苷 酸 空 间 的 FASTQ 格 式 FANSe 支 持 短 读 序 列 中 的 未 被 测 定 的 核 苷 酸 (N) 它 们 不 会 去 匹 配 参 考 基 因 组 上 任 何 核 苷 酸 但 是, 为 了 能 达 到 更 高 的 运 行 速 度, 我 们 建 议 您 事 先 除 去 这 些 N 为 了 达 到 更 好 的 稳 定 性, 建 议 每 个 序 列 的 名 称 里 面 不 要 有 @ 和 空 格 FANSe 并 不 利 用 测 序 质 量 字 符 串 如 果 测 序 质 量 字 符 串 是 以 Sanger 格 式 或 Illumina 1.8+ 格 式 表 示, 其 中 可 能 含 有 @, 在 极 个 别 的 情 况 下 可 能 干 扰 程 序 的 读 取 而 造 成 出 错 ( 我 们 测 试 了 上 百 个 数 据 集 才 发 现 一 个 特 例 ) 因 此 我 们 建 议 请 先 将 数 据 集 中 的 测 序 质 量 字 符 串 转 换 为 Illumina 1.3+ 格 式 参 考 基 因 组 参 考 基 因 组 序 列 必 须 以 标 准 的 FASTA 格 式 来 提 供 FANSe 全 面 支 持 多 种 格 式 的 被 遮 罩 基 因 组 (masked genome): 重 复 区 域 能 用 小 写 字 母 或 者 "N"/"X" 来 表 示 如 果 你 的 参 考 基 因 组 包 括 多 个 染 色 体, 我 们 强 烈 建 议 你 一 次 只 比 对 一 个 染 色 体, 因 为 这 样 能 带 来 更 快 的 速 度 和 更 高 的 稳 定 性 3. 使 用 教 程 3.1 使 用 命 令 行 FANSe -R[ 参 考 基 因 组 ] -D[ 测 序 数 据 ] -O[ 输 出 文 件 ] -L[ 最 大 读 长 ] -E[ 错 误 容 限 ] -I[ 插 入 缺 失 位 点 开 关 ] -S[ 种 子 长 度 ] -M[ 遮 罩 开 关 ] -B[ 最 优 输 出 开 关 ] U[ 单 向 开 关 ] 注 意 在 标 签 和 它 的 参 数 之 间 不 应 该 有 空 隙 举 例 :

FANSe -Rchr21.fa -Dreads.fastq -Ochr21.fanse -L37 -E2 -I0 -S8 -M1 -B1 U0 将 "reads.fastq" 数 据 比 对 到 参 考 基 因 组 "chr21.fa", 并 输 出 结 果 到 "chr21.fanse" 文 件 中 -R, -D, 和 -O 选 项 都 是 必 需 的 输 入 / 输 出 选 项 其 它 选 项 都 是 可 选 的 作 为 一 个 新 手, 你 可 以 简 单 地 使 用 下 面 的 命 令 行 和 默 认 参 数, 也 能 得 到 非 常 好 的 比 对 结 果 : FANSe -Rchr21.fa -Dreads.fastq -Ochr21.fanse 不 像 早 期 的 版 本,FANSe 7.0 及 以 后 的 版 本 不 需 要 一 个 单 独 的 步 骤 来 构 建 查 找 表 (lookup table), 因 为 该 步 骤 被 高 度 优 化, 能 分 别 在 不 到 0.1 秒 和 1 分 钟 的 时 间 内 完 成 对 大 肠 杆 菌 基 因 组 和 人 类 基 因 组 的 操 作, 因 此 被 整 合 在 FANSe 主 程 序 中, 不 会 在 硬 盘 中 产 生 额 外 的 查 找 表 数 据 3.2 文 件 输 入 / 输 出 选 项 如 果 没 有 这 些 选 项, 程 序 就 不 能 运 行 -R[ref]: 指 定 参 考 基 因 组 的 文 件 名 (FASTA 格 式 ) 我 们 强 烈 建 议 你 在 这 个 文 件 中 只 放 入 一 个 FASTA 序 列 除 字 母 数 字 和 "_", "-" 外, 其 他 字 符 不 允 许 出 现 在 文 件 名 和 该 文 件 的 路 径 里 -D[dataset]: 指 定 大 规 模 测 序 数 据 集 的 文 件 名 (FASTQ 格 式 ) -O[output]: 指 定 输 出 的 文 件 名 3.3 可 选 择 的 选 项 这 些 可 选 择 的 选 项 并 不 是 必 需 的 然 而, 为 了 得 到 更 好 的 结 果, 你 可 能 需 要 做 一 些 调 整 来 满 足 你 的 特 定 需 求 -L[number]: 在 测 序 数 据 集 中 最 大 读 长 默 认 值 为 100 这 个 参 数 能 有 效 地 使 用 内 存 来 加 速 比 对 你 通 常 能 从 测 序 仪 或 前 处 理 软 件 中 得 到 这 个 数 值 出 于 安 全 考 虑, 你 可 以 把 这 个 数 值 设 得 比 最 长 读 取 长 度 稍 微 高 一 点 如 果 一 个 短 读 序 列 的 长 度 大 于 这 个 设 定 值, 将 会 导 致 错 误 比 对 或 引 发 一 个 错 误 如 果 你 并 不 确 切 知 道 这 个 数 值, 你 可 以 设 一 个 更 大 的 安 全 数 值 比 如 说, 对 于 Illumina 的 测 序 数 据, 你 可 以 把 这 个 值 设 成 150 对 于 454 焦 磷 酸 测 序 数 据, 你 可 以 把 这 个 值 设 成 1000, 因 为 从 这 些 测 序 仪 得 到 的 短 读 序 列 通 常 不 会 超 过 这 个 数 值 但 是, 把 数 值 设 得 比 实 际 需 要 高 太 多 的 话, 会 显 著 地 拖 慢 比 对 速 度 以 及 增 加 内 存 的 使 用 量 -E[number]: 在 一 个 读 数 中 的 最 大 错 误 容 许 量, 包 括 碱 基 错 配, 插 入 和 缺 失 默 认 值 为 2 -I 0/1: 关 闭 (0) 或 开 启 (1) 碱 基 插 入 缺 失 的 检 查 默 认 值 为 0 -I0 并 不 考 虑 插 入 缺 失 位 点, 因 此 能 达 到 更 高 的 比 对 速 度 -I1 将 运 行 加 速 的 Smith-Waterman 优 化 如 果 开 启 了 碱 基 插 入 缺 失 的 检 查 功 能, 比 对 速 度 将 会 显 著 降 低, 特 别 是 对 于 长 的 短 读 序 列 ( 几 百 个 核 苷 酸 )

-S[number]: 种 子 长 度 (nt) 默 认 值 为 8 可 能 的 值 为 6, 8 和 0(0 表 示 自 动 设 置 : 读 长 小 于 24nt 使 用 6, 读 长 大 于 24nt 时 使 用 8) 在 大 多 数 情 况 下, 种 子 长 度 为 8 足 以 达 到 很 高 的 准 确 性 对 于 短 的 序 列 (<24nt) 和 较 高 的 错 配 容 许 数 值, 把 值 设 成 0 或 6 能 稍 微 地 增 加 敏 感 性, 但 却 会 运 行 得 更 慢 -M 0/1: 遮 罩 基 因 组 的 开 关 默 认 值 为 1 -M1 不 考 虑 在 参 考 基 因 组 序 列 上 的 被 遮 罩 区 域 ( 重 复 序 列 ) 小 写 字 母 和 "N", "X" 将 被 当 做 覆 盖 的 区 域 -M0 考 虑 所 以 在 参 考 基 因 组 序 列 上 的 A T G C 核 苷 酸, 不 管 它 们 是 大 写 还 是 小 写 的 但 仍 会 忽 略 "N", "X" -B 0/1: 最 优 匹 配 开 关 默 认 值 为 0 -B0 使 用 默 认 的 策 略 来 给 高 得 分 热 点 设 定 优 先 检 查 次 序 如 果 它 找 到 一 个 包 含 错 配 足 够 少 的 热 点, 就 会 停 止 搜 索 通 常 这 已 经 为 找 到 最 佳 的 匹 配 提 供 了 非 常 高 的 可 能 性, 特 别 是 对 于 小 的 基 因 组 和 / 或 稍 微 长 的 读 数 (>28) 来 说 但 是 它 并 不 能 100% 保 证 找 到 最 佳 的 排 列 -B1 将 强 制 程 序 寻 找 最 佳 的 匹 配 位 点 ( 即 错 误 最 少 的 匹 配 位 点 ) 它 将 会 稍 微 拖 慢 比 对 速 度 -U 0/1: 单 向 比 对 开 关 默 认 值 为 0. 这 是 FANSe 7.2 版 中 的 新 功 能 -U0: 将 reads 向 参 考 序 列 的 正 链 和 负 链 上 比 对 这 将 满 足 绝 大 多 数 需 要, 如 将 reads 向 基 因 组 DNA 参 考 序 列 上 比 对 -U1: 将 reads 仅 向 参 考 序 列 的 正 链 比 对 需 要 单 向 比 对 时 使 用, 例 如 将 reads 向 mrna 参 考 序 列 比 对 3.4 输 出 的 格 式 每 个 短 读 序 列 的 比 对 结 果 将 会 被 以 两 种 方 式 输 出 到 结 果 文 本 文 件 中 1.[ 序 列 名 ][ 短 读 序 列 的 核 苷 酸 序 列 ] 2.[ 正 链 / 反 义 互 补 链 ][Ref.sequence ID][ 错 误 的 个 数 ][ 在 Ref.sequence 中 的 位 置 ] 这 里 是 一 个 例 子 : 短 读 序 列 的 名 称 为 "@H2", 比 对 在 第 1 个 参 考 基 因 组 序 列 的 227267 位 置 上, 有 2 个 错 误 这 个 短 读 序 列 比 对 于 正 链 "F"( 当 比 对 于 反 义 互 补 链 时, 它 被 命 名 为 "R") 短 读 序 列 总 是 以 测 序 中 测 得 的 5-3 方 向 给 出, 与 FASTQ 中 的 序 列 相 同 注 意 这 个 位 置 是 基 于 0 的, 即 如 果 一 个 短 读 序 列 比 对 于 参 考 基 因 组 的 开 始, 它 的 位 置 值 为 0 通 常 数 据 库 里 给 出 的 序 列 只 有 正 链, 因 此 比 对 结 果 中 所 有 的 位 置 值 都 是 正 链 上 的 位 置 如 果 一 个 短 读 序 列 被 比 对 到 了 正 链 上, 位 置 值 就 是 其 5 端 第 一 个 核 苷 酸 的 位 置 如 果 一 个 短 读 序 列 被 比 对 到 了 互 补 链 上, 位 置 值 是 它 3 端 第

一 个 核 苷 酸 相 对 于 正 链 的 位 置 见 下 图, 红 旗 表 示 比 对 结 果 中 的 位 置 值 3.5 故 障 检 查 FANSe 是 个 新 开 发 的 程 序, 我 们 仍 在 不 断 地 改 进 它 我 们 已 经 在 不 同 的 测 序 平 台 上, 用 大 肠 杆 菌 鼠 人 等 多 种 参 考 基 因 组, 使 用 了 许 多 数 据 来 测 试 它 FANSe 运 行 起 来 相 当 稳 定 我 们 将 会 继 续 对 它 进 行 测 试 和 改 进, 特 别 是 当 问 题 出 现 的 时 候 注 意 要 遵 守 在 本 手 册 中 列 出 来 的 使 用 步 骤 错 误 的 参 数 设 置 可 能 会 导 致 不 可 预 料 的 错 误 信 息 ; 程 序 还 没 有 智 能 到 马 上 地 指 出 所 有 错 误 如 果 你 遇 到 什 么 问 题, 请 马 上 联 系 我 们 下 面, 我 们 列 出 了 一 些 经 常 会 被 问 到 的 问 题 常 见 问 题 (FAQ) 当 在 FANSe 程 序 中 加 载 参 考 基 因 组 序 列 的 时 候, 出 现 一 条 错 误 信 息 "out of memory" 或 "stack overflow" 这 个 问 题 最 有 可 能 出 现 在 你 试 图 在 32 位 系 统 上 运 行 FANSe, 且 使 用 一 个 大 于 400Mb 的 参 考 基 因 组 的 时 候 如 果 这 个 错 误 经 常 出 现, 请 使 用 64 位 的 系 统, 或 者 每 次 只 比 对 一 条 染 色 体 另 一 种 可 能 性 是 参 考 基 因 组 序 列 文 件 不 是 标 准 的 FASTA 格 式 我 买 了 最 新 的 6 核 CPU, 而 FANSe 却 只 能 使 用 一 个 核 如 果 能 用 上 所 有 的 核, 是 不 是 能 加 速 比 对? 出 于 对 稳 定 性 的 考 虑, 在 目 前 版 本 中 我 们 并 没 有 提 供 多 线 程 并 行 执 行 的 功 能 但 是 如 果 你 有 足 够 的 内 存, 你 可 以 同 时 在 一 台 计 算 机 中 运 行 多 个 FANSe 来 比 对 不 同 的 数 据 集 或 染 色 体 我 们 的 测 试 结 果 表 明,8G 内 存 足 以 运 行 7 个 FANSe 实 例 来 同 时 比 对 人 类 1 号 染 色 体, 而 且 性 能 几 乎 是 随 实 例 数 增 加 而 线 性 提 升 的 此 外, 我 们 正 在 尝 试 一 种 新 的 并 行 策 略 来 在 使 用 有 限 内 存 的 前 提 下 充 分 利 用 24 核 或 48 核 工 作 站 的 计 算 能 力 这 些 特 性 有 希 望 加 入 到 下 一 个 主 要 版 本 的 FANSe 里 我 需 要 使 用 被 遮 罩 基 因 组 (masked genome) 吗? 我 什 么 时 候 该 使 用 它? 对 于 RNA 测 序 应 用, 我 们 强 烈 建 议 使 用 masked 基 因 组 一 个 比 对 到 重 复 区 域 的 短 读 序 列 将 会 许 多 次 比 对 到 整 个 基 因 组, 就 不 能 给 出 确 切 比 对 位 置 使 用 masked 基 因 组 同 时 也 能 加 速 比 对 的 过 程

对 于 在 DNA 序 列 上 的 应 用, 例 如 甲 基 化 测 序 分 析, 如 果 你 也 对 重 复 序 列 有 兴 趣, 且 读 长 够 长 的 时 候, 你 可 以 使 用 非 masked 基 因 组 我 使 用 的 参 考 基 因 组 不 大, 含 有 16 个 染 色 体 但 FANSe 输 出 的 比 对 结 果 中 染 色 体 序 号 有 误 怎 么 办? 目 前 的 FANSe 版 本 对 多 染 色 体 的 支 持 并 不 完 善, 有 时 会 输 出 错 误 的 染 色 体 号, 尽 管 比 对 本 身 是 正 确 的 因 此, 我 们 强 烈 建 议 每 次 只 比 对 一 个 染 色 体 另 一 种 解 决 方 案 是 自 己 编 个 程 序 将 所 有 的 染 色 体 序 列 连 接 成 一 个 长 序 列 作 为 参 考 基 因 组 序 列, 然 后 进 行 比 对 4. 论 文 和 联 系 方 式 FANSe: an accurate algorithm for quantitative mapping of large scale sequencing reads Zhang G, Fedyunin I, Kirchner S, Xiao C, Valleriani A, Ignatova Z. Nucleic Acids Res. 2012 Feb 29. [Epub ahead of print] PMID: 22379138 网 站 : http://bioinformatics.jnu.edu.cn/software/fanse/ FANSe 由 张 弓 与 肖 传 乐 开 发, 目 前 采 用 C 语 言 写 成 如 果 您 有 任 何 问 题 建 议 错 误 报 告 或 希 望 FANSe 具 备 一 些 新 的 功 能, 请 联 系 : zhanggong@jnu.edu.cn 和 xiaochuanle@126.com.