RAxML使用指南.doc

Similar documents
VASP应用运行优化

PowerPoint Presentation

4. 每 组 学 生 将 写 有 习 语 和 含 义 的 两 组 卡 片 分 别 洗 牌, 将 顺 序 打 乱, 然 后 将 两 组 卡 片 反 面 朝 上 置 于 课 桌 上 5. 学 生 依 次 从 两 组 卡 片 中 各 抽 取 一 张, 展 示 给 小 组 成 员, 并 大 声 朗 读 卡

1.ai

Microsoft Word - å�¦ä¹€å¿…å¾Šå’‹éłƒï¼‹å®ı稿;(.doc

IP505SM_manual_cn.doc

(Microsoft Word - \251I\250D\245D\246W

关于试行《高等学校从事有害健康工种人员营养保健等级和标准的暂行规定》的通知

ZHFX1302.mps

A Community Guide to Environmental Health

Microsoft Word - template.doc

谚语阐因

SZ 江 苏 神 通 可 以 网 络 投 票 SZ 华 平 股 份 可 以 网 络 投 票 36507

Microsoft PowerPoint - Aqua-Sim.pptx

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

Microsoft PowerPoint - 04 Models of Amino Acid and Codon Substitution.ppt

書本介紹


30 ml polystyrene 4 mm ph 0.1 mg blender M -cm D. pulex D. magna 20 L 2 20

考 試 日 期 :2016/04/24 教 室 名 稱 :602 電 腦 教 室 考 試 時 間 :09: 二 技 企 管 一 胡 宗 兒 中 文 輸 入 四 技 企 四 甲 林 姿 瑄 中 文 輸 入 二 技 企 管 一

<4D F736F F D20CED2B5C4BDCCD3FDB9CACAC2BACFBCAFD2B3C2EB2D676169>

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

(Microsoft Word \256\325\260\310\267|\304\263\260O\277\375_\252k\250\356_.doc)

Microsoft Word - 桂电教[2008]8号.doc

教育心理学教学案例分析

nb.PDF

影響新產品開發成效之造型要素探討

ch_code_infoaccess

<4D F736F F D204238A67EABD7B2C4A447BEC7B4C1BCCCBEF0B0EAA4A4B0CFB0ECA4E8AED7A5D3BDD0AED >

中国商人必胜宝典--各地商人性格特征剖析

國立中山大學學位論文典藏.PDF

商 周 三 代 年 代 學 的 研 究 經 過 近 五 年 的 努 力, 完 成 夏 商 周 年 表 本 大 事 概 覽 中 夏 商 周 三 代 的 大 事 紀 年, 即 採 用 夏 商 周 斷 代 工 程 的 考 論 成 果 對 於 無 法 考 證 年 份 的 史 事 或 發 生 在 史 前 時

第 三 条 实 验 室 技 术 安 全 工 作 贯 彻 以 人 为 本 安 全 第 一 预 防 为 主 综 合 治 理 的 方 针 各 单 位 及 教 职 工 学 生 应 树 立 安 全 意 识, 履 行 安 全 义 务 承 担 安 全 责 任 第 四 条 实 验 室 技 术 安 全 工 作 坚 持

2015年全国硕士研究生入学考试

500 C ~ C 2

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

2015年4月11日雅思阅读预测机经(新东方版)

网易介绍

K7VT2_QIG_v3

石油大学(北京)

論 文 摘 要 本 文 乃 係 兩 岸 稅 務 爭 訟 制 度 之 研 究, 蓋 稅 務 爭 訟 在 行 訴 訟 中 一 直 占 有 相 當 高 的 比 例, 惟 其 勝 訴 率 一 直 偏 低, 民 87 年 10 月 28 日 行 訴 訟 法 經 幅 修 正 後, 審 級 部 分 由 一 級 一

Microsoft Word doc

1. 請 先 檢 查 包 裝 內 容 物 AC750 多 模 式 無 線 分 享 器 安 裝 指 南 安 裝 指 南 CD 光 碟 BR-6208AC 電 源 供 應 器 網 路 線 2. 將 設 備 接 上 電 源, 即 可 使 用 智 慧 型 無 線 裝 置 進 行 設 定 A. 接 上 電 源

Microsoft Word - TIP006SCH Uni-edit Writing Tip - Presentperfecttenseandpasttenseinyourintroduction readytopublish

ebook20-2

收 购 人 声 明 一 本 报 告 书 摘 要 依 据 中 华 人 民 共 和 国 证 券 法 上 市 公 司 收 购 管 理 办 法 公 开 发 行 证 券 的 公 司 信 息 披 露 内 容 与 格 式 准 则 第 16 号 上 市 公 司 收 购 报 告 书 等 相 关 法 律 法 规 编 写

Microsoft Word - No_HK doc

Time Estimation of Occurrence of Diabetes-Related Cardiovascular Complications by Ching-Yuan Hu A thesis submitted in partial fulfillment of the requi

由社會發展趨勢探討國人睡眠品質

Journal of Curriculum Studies September, 2013, Vol. 8, No. 2, pp A Study of the Relationship between Senior High School Curriculum and the Mult

Windows XP

<4D F736F F F696E74202D20312EB9FEB6FBB1F5B9A4D2B5B4F3D1A7D5E7C1BCA3BAC3E6CFF2D1D0BEBFC9FAB8B4CAD4B5C4BDE1B9B9BBAFC3E6CAD4BFBCBACBCCBDCBF7D3EBCAB5BCF92E BBCE6C8DDC4A3CABD5D>


硕士论文正文

辉 丰 股 份 重 大 事 项, 特 停 南 方 轴 承 临 时 停 牌 德 力 股 份 临 时 停 牌 瑞 丰 光 电 临 时 停 牌 联 建 光 电 临 时 停 牌 卡 奴 迪 路 临 时 停 牌

股票代码: 股票简称:*ST新梅 编号:临

郑 州 煤 电 重 要 事 项 未 公 告, 连 续 停 牌 金 圆 股 份 重 大 事 项, 特 停 永 鼎 股 份 重 要 事 项 未 公 告, 连 续 停 牌 长 城 影 视 临 时 停 牌 天 兴 仪 表 临 时 停 牌

商 业 城 大 华 标 准 70 万 70 万 驰 宏 锌 锗 瑞 华 标 准 140 万 150 万 亚 星 锚 链 江 苏 公 证 天 业 标 准 80 万 80

欢迎辞

金 陵 饭 店 中 兴 华 已 报 备 按 照 国 资 委 要 求 定 期 轮 换 天 衡 已 报 备 按 照 国 资 委 要 求 定 期 轮 换 *ST 中 富 中 喜 已 报 备 业 务 约 定 书 到 期 普

日 涨 幅 偏 离 值 达 到 7% 的 前 五 只 证 券 : 温 氏 股 份 ( 代 码 ) 涨 幅 偏 离 值 :11.68% 成 交 量 :1752 万 股 成 交 金 额 : 万 元 机 构 专 用 机 构 专 用

上市公司股东大会投票信息公告( )

东 华 能 源 江 苏 苏 亚 金 诚 已 报 备 因 地 域 及 审 计 时 间 安 排 等 原 因 中 兴 华 已 报 备 客 户 重 新 选 聘 会 计 师 事 务 所 亿 帆 鑫 富 立 信 已 报 备 客

昆 明 机 床 瑞 华 已 报 备 前 任 服 务 年 限 较 长 毕 马 威 华 振 已 报 备 未 与 客 户 未 就 2015 年 审 计 收 费 达 成 一 致 意 见 中 国 核 电 天 健 已 报 备 定

金 利 科 技 临 时 停 牌 凤 凰 光 学 重 要 事 项 未 公 告, 连 续 停 牌 安 源 煤 业 重 要 事 项 未 公 告, 连 续 停 牌 万 泽 股 份 临 时 停 牌 爱 康 科 技 重 大 事 项, 特 停

光 一 科 技 重 大 事 项, 特 停 茂 业 商 业 重 要 事 项 未 公 告, 连 续 停 牌 浙 富 控 股 重 大 事 项, 特 停 键 桥 通 讯 重 大 事 项, 特 停 黑 牛 食 品 重 大 事 项, 特 停

卧 龙 地 产 重 要 事 项 未 公 告, 连 续 停 牌 春 兴 精 工 临 时 停 牌 *ST 沧 大 重 要 事 项 未 公 告, 连 续 停 牌 天 地 源 重 要 事 项 未 公 告, 连 续 停 牌 汇 冠 股 份

金 圆 股 份 重 大 事 项, 特 停 长 城 影 视 临 时 停 牌 天 兴 仪 表 临 时 停 牌 商 赢 环 球 重 要 事 项 未 公 告, 连 续 停 牌 荣 安 地 产 临 时 停 牌 中 南 文 化

Untitled Document

Logitech Wireless Combo MK45 English

ebook 99-11

audiogram3 Owners Manual

Guide to Install SATA Hard Disks

PowerPoint Presentation


epub 61-2

Microsoft Word - 006新時代通識教育中生命科學概論的課程與教學.doc

Microsoft Word - 附件.doc

Microsoft Word - 愛吐沙的蛤蜊

i

科展作品說明書--情定水果 香邀你我

标题

第 一 部 分 投 标 邀 请 一. 项 目 名 称 : 北 京 大 学 附 属 中 学 副 食 品 商 店 协 议 供 货 商 招 标 项 目 二. 项 目 内 容 : 北 京 大 学 附 属 中 学 采 购 中 心 现 就 学 校 副 食 品 商 店 的 供 货 协 议 商 进 行 招 标, 中

我 可 以 向 你 们 保 证 以 下 的 内 容 100% 真 实, 请 您 一 定 耐 心 看 完 从 医 15 年 来, 我 也 反 复 告 诉 病 人 这 些 事 实 但 是 没 有 人 愿 意 去 听, 更 没 有 人 愿 意 去 相 信 或 许, 我 们 的 同 胞 们 真 的 需 要


反 馈 问 题 1 请 申 请 人 对 比 同 行 业 上 市 公 司 资 产 负 债 率 有 息 负 债 率 等 指 标, 分 析 说 明 本 次 偿 还 银 行 借 款 的 必 要 性 和 合 理 性 其 中, 部 分 拟 偿 还 的 银 行 借 款 为 流 动 资 金 借 款, 请 说 明 通

信 息 披 露 义 务 人 声 明 1 信 息 披 露 义 务 人 依 据 中 华 人 民 共 和 国 公 司 法 中 华 人 民 共 和 国 证 券 法 上 市 公 司 收 购 管 理 办 法 公 开 发 行 证 券 公 司 信 息 披 露 内 容 与 格 式 准 则 第 15 号 权 益 变 动

, (, ),,,,,, : : ( ), :,,,,,,, ( ), ( ),,,,,, ( ) ( ),, :!,,,,,,,,,,,,,,,,,,,,,,, [1 ] :,,,, :, ;, ( ),, :,,,,,,,,,,, 66

< B9C9B6ABB4F3BBE1CDB6C6B1D0C5CFA22E786C7378>

國立中山大學學位論文典藏.PDF

Index of Zhengtong Daozang

一步一步教你使用NCBI

2/80 2

天 主 教 輔 仁 大 學 社 會 學 系 學 士 論 文 小 別 勝 新 婚? 久 別 要 離 婚? 影 響 遠 距 家 庭 婚 姻 感 情 因 素 之 探 討 Separate marital relations are getting better or getting worse? -Exp

(Microsoft Word - \261M\256\327\272\353\302\262\263\370\247iEnd.doc)

中 国 证 券 监 督 管 理 委 员 会 : 根 据 贵 会 2015 年 12 月 9 日 签 发 的 中 国 证 监 会 行 政 许 可 项 目 审 查 一 次 反 馈 意 见 通 知 书 ( 号 )( 以 下 简 称 反 馈 意 见 ) 的 要 求, 无 锡 市 太 极 实 业

Microsoft Word - (web)_F.1_Notes_&_Application_Form(Chi)(non-SPCCPS)_16-17.doc

Microsoft Word - A _ doc

标题

Transcription:

用 RAxML 构建极大似然进化树 RAxML 是用极大似然法建立进化树的软件之一, 可以处理超大规模的序列数据, 包括上千至上万个物种, 几百至上万个已经比对好的碱基序列 作者是德国慕尼黑大学的 A. Stamatak 博士 RAxML 有若干版本 ( 有的版本支持在多个 CPU 上运行 ), 本文以最常用的单机版 raxmlhpc 为例 1 下载和安装 RAxML 可以在 Linux, MacOS, DOS 下运行, 下载网址为 http://icwww.epfl.ch/~stamatak/index-dateien/page443.htm 也可以使用 www.phylo.com 的超级计算机运行 对于 Linux 和 Mac 用户下载 RAxML-7.0.4.tar.gz 用 gcc 编译即可 make f Makefile.gcc Windows 用户可以下载编译好的 exe 文件, 而无需安装 2 数据的输入 RAxML 的数据位 PHYLIP 格式, 但是其名字可以增加至 256 个字符 RAxML 对 PHYLIP 文件中的 tabs,inset 不敏感 输入的树的格式为 Newick RAxML 的查错功能 1 序列的名称有重复, 即不同的碱基却拥有一致的名称 2 序列的内容重复, 即两条不同名称的序列, 碱基完全一致 3 某个位点完全由序列完全由未知符号组成, 如氨基酸序列完全由 X,?,*,- 组成,DNA 序列完全由 N,O,X,?,- 组成 4 序列完全由未知符号组成, 如氨基酸序列完全由 X,?,*,- 组成,DNA 序列完全由 N,O,X,?,- 组成 5 序列名称中禁用的字符如包括空格 制表符 换行符 :,(),[] 等 3 RAxMLHPC 下的选项 -s sequencefilename 要处理的 phy 文件 -n outputfilename 输出的文件 -m substitutionmodel 模型设定方括号中的为可选项 : [-a weightfilename] 设定每个位点的权重, 必须在同一文件夹中给出相应位点的权重

[-b bootstraprandomnumberseed] 设定 bootstrap 起始随机数 [-c numberofcategories] 设定位点变化率的等级 [-d] -d 完全随机的搜索进化树, 而不是从 maximum parsimony tree 开始 在 100 至 200 个分类单元间, 该选项可能会生成拓扑结构完全不同的局部最大似然树 [-e likelihoodepsilon] 默认值为 0.1 [-E excludefilename] 排除的位点文件名 [-f a b c d e g h i j m n o p s t w x] f 算法 -f a rapid Bootstrap -f b draw the bipartitions using a bunch of topologies -f c checks if RAxML can read the alignment. -f d rapid hill-climbing algorithm -f e optimize the model parameters -f g compute the per site log Likelihoods for one ore more trees passed via -z. -f h compute a log likelihood test (SH-test [21]) between a best tree passed via -t and a bunch of other trees passed via -z. -f i performs a really thorough standard bootstrap [-g groupingfilename] 预先分组的名称 [-h] program options [-i initialrearrangementsetting] speccify an innitial rearrangement setting for the ininital phase of the search algorithm. [-j] [-k] optimize branchlength and model parameters on bootstrapped trees [-l sequencesimilaritythreshold] Specify a threshold for sequence similarity clustering. [-L sequencesimilaritythreshold] [-M] 模型设定 -m GTRCAT: GTR approximation -m GTRMIX: Search a good topology under GTRCAT -m GTRGAMMA: General Time Reversible model of nucleotide subistution with the gamma model of rate heterogeneity. -m GTRCAT_GAMMA: Inference of the tree with site-specific evolutionary rates. 4 discrete GAMMA rates, -m GTRGAMMAI: Same as GTRGAMMA, but with estimate of proportion of invariable sites -m GTRMIXI: Same as GTRMIX, but with estimate of proportion of invariable sites. -m GTRCAT GAMMAI: Same as GTRCAT_GAMMA, but with estimate of proportion of invariable sites. -n outputfilename 输出文件名 -o outgroupname(s) 设定外类群如果有两个以上外类群, 两者之间不能用空格, 而应该用英文的 "," DNA, gen1=1-500 DNA, gen2=501-1000

[-p parsimonyrandomseed] [-P proteinmodel] [-q multiplemodelfilename] -q multiple modelfile name 如将以下信息拷贝到另存为文件 genenames DNA, rbcla = 1-526 DNA, matk = 527-1472 调用方法 -q genenames -m GTRGAMMA [-r binaryconstrainttree] -s sequencefilename 待分析的 phy 文件 [-t userstartingtree] 用户指定的进化树拓扑结构 [-T numberofthreads] [-u multibootstrapsearches] Specify the number of multiple BS searches per replicate to obtain better ML trees for each replicate. [-v] 版本信息 [-w workingdirectory] 将文件写入的工作目录 [-x rapidbootstraprandomnumberseed] invoke rapidbootstrap [-y] -y 只输出简约树拓扑结构, 之后推出, 该树也可以用于 GARLI 等软件 [-z multipletreesfile] [-# -N numberofruns] 生成的文件 RAxML log.examplerun: 运行时间 似然值 / number of checkpoint file RAxML result.examplerun: 树文件 RAxML info.examplerun: -m GTRGAMMA or -m GTRMIX contains information about the model and algorithm used RAxML parsimonytree.examplerun: -t. RAxML randomtree.examplerun: -d. RAxML checkpoint.examplerun.checkpointnumber: -j RAxML bootstrap.examplerun: -# and -b or -x RAxML bipartitions.examplerun: -f b RAxML reducedlist.examplerun: -l or -L RAxML bipartitionfrequencies.examplerun: -t, -z, -f m RAxML persitells.examplerun: -f g RAxML besttree.examplerun: -x 12345 -f a RAxML distances.examplerun: -f x

4 分析实例 若当前已经有比对好的序列, 名为 test1.phy 文件 raxmlhpc -x 12345 -p 12345 -# 100 -m GTRGAMMA out1 -s test1.phy -f d -q gennames -n TEST 将以上语句粘贴到记事本中, 另存为 test1.bat 文件, 保存到 raxmlhpc.exe 相同的文件夹, 双击 test1.bat 即可运行 运行结束后, 程序将自动关闭 -x 用快速方法进行 Bootstrap -p 设定随机数 -# Bootstrap100 次 -m GTRGAMMA 模型 -o out1 将 out1 序列设置为外类群 -s test1.phy 输入的 phy 文件为 ex_al.phy -n TEST 输出的各结果文件中包含 TEST -q gennames 设定的基因的各位点分割位置 -f d rapid hill-climbing algorithm 5 详实的例子 1 生成一系列随机化的 MP 树 raxmlhpc -y -s ex_al -m GTRCAT -n ST0 raxmlhpc -y -s ex_al -m GTRCAT -n ST1 raxmlhpc -y -s ex_al -m GTRCAT -n ST2 raxmlhpc -y -s ex_al -m GTRCAT -n ST3 raxmlhpc -y -s ex_al -m GTRCAT -n ST4 2 infer the ML trees for those starting trees using a fixed setting -i 10 raxmlhpc -f d -i 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST0 -n FI0 raxmlhpc -f d -i 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST1 -n FI1 raxmlhpc -f d -i 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST2 -n FI2 raxmlhpc -f d -i 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST3 -n FI3 raxmlhpc -f d -i 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST4 -n FI4 3 using the automatically determined setting on the same starting trees: raxmlhpc -f d -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST0 -n AI0 raxmlhpc -f d -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST0 -n AI1 raxmlhpc -f d -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST0 -n AI2 raxmlhpc -f d -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST0 -n AI3 raxmlhpc -f d -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST0 -n AI4

6 正确的碱基变化等级 Getting the Number of Categories right 大样本量的时候建议采用 GTRMIX 搜寻极大似然树用 GTRCAT 进行相应的 Bootstrap 因此, 需要设定几种 -c 值, 查看那种给出最大的 gamma 的似然值 raxmlhpc -f d -c 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST0 -n C10_0 raxmlhpc -f d -c 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST1 -n C10_1 raxmlhpc -f d -c 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST2 -n C10_2 raxmlhpc -f d -c 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST3 -n C10_3 raxmlhpc -f d -c 10 -m GTRMIX -s ex_al -t RAxML_parsimonyTree.ST4 -n C10_4 7 寻找已知最优的极大似然树 The Best-Known Likelihood tree (BKL) RAxML 从逐步随机添加的最大简约树开始, 搜寻极大似然树 在最大简约树建好之后, 部分树将进行简约树重排, 从而找到更为可靠的简约树 为什么不以 NJ 树开始, 而是以 MP 树开始呢? 这是因为在不同的搜索中,MP 树的拓扑结构可能是不同的, 而不同的初始拓扑结构, 会使用户有更大的可能发现极大似然树 注意 specifying -m GTRCAT in combination with -# is not a good idea, because you will probably want to compare the trees inferred under GTRCAT based on their likelihood values and will have to compute the likelihood of the final trees under GTRGAMMA anyway. 8 Bootstrapping 的设置 举例 : raxmlhpc -f d -m GTRCAT -s ex_al -# 100 -b 12345 -n MultipleBootstrap raxmlhpc-mpi -f d -m GTRCAT -s ex_al -# 100 -b 12345 -n MultipleBootstrap 按照 A. Stamatak 博士的 The RAxML 7.0.4 Manual 中国科学院植物研究所张金龙编 Jinlongzhang01@gmail.com zhangjl@ibcas.ac.cn 2010 年 2 月 2 日