系统发育分析方法.ppt
57页刘芳2015.12.11系统发育分析系统发育分析方法方法系统发育分析常用方法系统发育分析常用方法一、基于距离方法基于距离方法 Distance based (Algorithmic) methods二、基于特征符方法基于特征符方法 Character based (Tree searching) methodsMaximum parsimony (MP)Maximum likelihood (ML)Bayesian inference (BI)unweighted pair group method with arithmetic mean (UPGMA)Neighbor-Joining Method (NJ)Minimum Evolution (ME) Fitch-Margoliash Method (FM)方法方法基本特征基本特征适用范围适用范围优点优点缺点缺点NJ不需要分子钟假设,是基于最小进化原理,进行类的合并时,不仅要求待合并的类是相近的,而且要求待合并的类远离其他的类远缘序列,进化距离不大,信息位点少的短序列假设少,树的构建相对准确,计算速度快,只得一颗树,可以分析较多的序列,运行速度优于最大简约法序列上的所有位点等同对待,且所分析的序列的进化距离不能太大MP基于进化过程中碱基替代数目最少这一假说,不需要替代模型,对所有可能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树近缘序列物种序列的数目≤12.善于分析某些特殊的分子数据如插入、缺失等序列有用。
只适于序列数目N≤12存在较多回复突变或平行突变时,结果较差变异大的序列会出现长枝吸引而导致建树错误ML依赖于某一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树特定的替代的模,远缘序列很好的统计学基础,大样本时似然法可以获得参数统计的最小方差,在进化模型确定的情况下,ML法是与进化事实吻合最好的建树算法.所有可能的系统发育树都计算似然函数,计算量大,耗时时间长依赖于合适的替代模型,BI基因进化模型的统计推论法,通过后验概率直观反映出各分支的可靠性而不需要自检法检验大而复杂的数据集具有坚实的数学和统计学基础,可以处理复杂和接近实际情况的进化模型对进化模型比较敏感,后验概率是建立在许多假说上,在现实中可能不成立http://evolution.genetics.washington.edu/phylip/software.html系统发育树构建的软件系统发育树构建的软件常见软件常见软件软件名称软件名称用途用途DNAMAN序列分析的综合工具序列分析的综合工具BioEdit 序列分析的综合工具序列分析的综合工具DNASTAR序列分析的综合工具序列分析的综合工具MAFFT多重序列比对工具多重序列比对工具Muscle多重序列比对工具多重序列比对工具ClustalX图形化的多序列比对工具图形化的多序列比对工具;构建构建N-J系统树系统树Gblocks冗余序列处理工具冗余序列处理工具jModelTest, ModelTest, ModelGenerator进化模型选择工具进化模型选择工具PHYLIP集成的进化分析工具集成的进化分析工具MEGA图形化、集成的进化分析工具图形化、集成的进化分析工具PAUP集成的进化分析工具集成的进化分析工具PHYML, PAML, RAxMLML建树工具建树工具MrBayes基于贝叶斯方法的建树工具基于贝叶斯方法的建树工具TreeView进化树显示工具进化树显示工具FigTree, Adobe Illustrator进化树显示和编辑工具进化树显示和编辑工具系统发育树构建的过程系统发育树构建的过程多序列比对多序列比对 (MAFFT)进化模型的选择进化模型的选择 (ModelTest)系统发育树的构建系统发育树的构建 (RAxML, MrBayes, PAUP)系统发育树显示和编辑系统发育树显示和编辑 (FigTree, Adobe Illustrator))序列拼接序列拼接 (Mega)序列拼接序列拼接•BioEdit•Mega•Seqman•Contig•Sequencer多序列比对多序列比对http://mafft.cbrc.jp/alignment/server/速度:速度: Muscle>MAFFT>Clustal比对比对准确性:准确性:MAFFT>Muscle>>Clustal比对前MAFFT 7.0 online alignmenthttp://mafft.cbrc.jp/alignment/server/index.htmlPAUP软件使用流程软件使用流程 (系统树构建)(系统树构建)1. 将比对后的将比对后的fasta格式文件转换成格式文件转换成Nexus格式格式2. 将将paup命令粘贴到命令粘贴到Nexus文件下方,在命令程序中指定外群,文件下方,在命令程序中指定外群,保存。
保存begin paup; log file=p_buffer.txt; pset collapse=minbrlen; [ctype 1.5_1:all;] set maxtrees=5000 increase=no; outgroup ****; set criterion=parsimony; hsearch addseq=random nreps=1000; roottrees outroot=monophyl; savetrees brlens=yes file=MP.tre; pscores ALL/ci=yes tl=yes hi=yes rc=yes ri=yes khtest=yes; bootstrap nreps=1000 Keepall=yes / AddSeq=random nreps=10; roottrees outroot=monophyl; savetrees file=BT.tre from=1 to=1 savebootp=both maxdec=0; end;转换文件格式文件格式.....3.打开打开paup软件,打开软件,打开Nexus文件然后运行即可。
文件然后运行即可 4. 运行界面运行界面MP树运行完后,点击树运行完后,点击““Stop””,继续运行,继续运行BT树运行结果文件:MP树BT树P-buffer 文件RAxML建树建树Page 26• 程序自带的文件: raxmlHPC、 raxmlHPC-PTHREADS、 run 三个• 准备文件两个:phy格式的比对好的序列, txt格式的partition文件Run 文件基因的名字和序列所在位置跑多少次比对好序列的文件名字输出结果的的名字Partition文件的名字Partition 文件MrBayes建树建树(Mrmodeltest 2.3和Mrbayes 3.2.2) 3.2.2 fixes a number of bugs in previous releases of version 3.2. mrbayes_x86.exe for 32 bit system, mrbayes_x64.exe for 64 bit system操作步骤操作步骤•1. Fasta文件转换成Nexus格式的文件•2. 把Mrmodelblock文件夹中对应的MrModelblock*loci文件中的内容粘贴到Nexus文件最下方(几个基因即对应几个loci的文件,比如4个基因,则需要复制MrModelblock4loci 中的内容) •3. 修改刚刚粘贴的命令参看文件红色框中是要修改的地方•4. Paup运行刚刚修改好的Nexus文件,得到SCORES文件•5. 将SCORES文件复制到MrModeltest2.3文件夹中,此时该文件夹包含以下文件:•6. 运行cmd•得到txt文件•7. 打开刚刚得到的txt文件,从每一个txt文件中找到如下Bayes的模型:•8. 把得到的models复制到一个text文本中•9. 打开之前的NEXUS文件,删掉mrmodeltest命令, 粘贴bayes命令:•begin mrbayes;•[This block sets up several different partitions that could be used in the analysis of this dataset]• outgroup M_infuscans_CBS_869_96; [replace fungusX with your outgroup taxon]•[When defining your charsets below, the characters must follow each other directly, e.g. 1-300, 301-500, 501-600 and •not 5-300, 325-500, 530-600. You will excluded everything you do not want to include in the analysis (e.g. 1-4, 301-324 •and 501-529 in the charset excludedcharacters line.]•charset locus1 = 1-286; [replace the xx's with numbers reflecting the character spanning of your gene 1]•charset locus2 = 287-605; [replace the xx's with numbers reflecting the character spanning of your gene 2]•charset locus3 = 606-1159; [replace the xx's with numbers reflecting the character spanning of your gene 3]• charset locus4 = 1160-1678; [replace the xx's with numbers reflecting the character spanning of your gene 4] •charset excludedchars = 282-286 601-605 1155-1159 1674-1678; [list here all of the characters that you do not want to include. e.g. the bits between the loci]•exclude excludedchars;•partition AllLoci = 4: locus1, locus2, locus3, locus4;•log start filename=mydata.log;•end;•begin mrbayes;•outgroup M_infuscans_CBS_869_96;•set partition= AllLoci;•prset applyto=(1,2,4) statefreqpr=dirichlet(1,1,1,1); [This means locus1 and locus3 are same]•prset applyto=(3) statefreqpr=fixed(equal); [This is the model of locus2]•lset applyto=(1,2) nst=2 rates=gamma;•lset applyto=(3,4) nst=2 rates=propinv;•unlink shape=(all) pinvar=(all) statefreq=(all) revmat=(all);•mcmcp ngen= 10000000 relburnin=yes burninfrac=0.25 printfreq=1000 samplefreq=1000 nchains=4 savebrlens=yes stoprule=yes stopval=0.01;•mcmc;•sumt [conformat=simple]; [using Mrbayes3.2.1 should add "conformat=simple"]•end;红色字体文字是需要修改的地方;蓝色字体视情况修改,也可不修改。
•10. 把修改好的NEXUS文件放在Mrbayes文件夹中,打开Mrbayes,输入命定 : exe NEXUS的文件名.nex•11. Over~CIPRES建树建树CIPRES 建ML树(RAxML)http://www.phylo.org/portal2/login!input.actionCreate new folder Upload dataCreate new taskSelect toolsSet parameters最开始可以先输入=< 0.5,数据合适再输入>0.5ResultCIPRES 建贝叶斯树•如果上传的NEXUS文件中不包含不包含贝叶斯的命令,按照上图红色方框的内容设置•点击“Advance Parameters”,然后设置其他的命令(类似我们用的贝叶斯命令,只是将命令程序改成了选项,即选择题......)Setparameters根据情况设定时间,可以先设<0.5试一下Set parameters•如果上传的NEXUS文件中已包含已包含了贝叶斯的命令,则按照上图设置 可以先设<0.5试一下ResultFigtree/Treeview —打开系统发育树打开系统发育树系统发育树的编辑(系统发育树的编辑(Adobe Illustrator,,PPT))Here comes your footer Page 54iTol (Interactive Tree of Life)http://itol.embl.de/Thanks for your attention!。





