好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第四章、系统树的构建ppt课件.ppt

36页
  • 卖家[上传人]:资****亨
  • 文档编号:279417188
  • 上传时间:2022-04-19
  • 文档格式:PPT
  • 文档大小:259.50KB
  • / 36 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第四章、系统树的构建. .第一节、系统树的基本知识1.构建系统树的数据来源:表型数据表型数据(phenetic)和和遗传遗传(cladistic)数据数据表表型型性性关关系系定定义义为为根根据据物物体体一一组组表表型型性性状状所所获获得得的的相似性表型分枝图表型分枝图(phenogram)遗遗传传性性关关系系含含有有祖祖先先的的信信息息,因因而而可可用用于于研研究究进进化化的途径 进化分枝图进化分枝图(cladogram).表型分枝图和进化分枝图(cladogram)两个术语已用于表示分别根据表型性的和遗传性的关系所建立的关系树进化分枝图可以显示事件或类群间的进化时间,而表型分枝图则不需要时间概念Nei(1987)指出的,如果表型相似性的尺度意味着进化上的相似性的程度,则有关表型的方法就可以提供遗传上的关系树Bacterium 1Bacterium 3Bacterium 2Eukaryote 1Eukaryote 4Eukaryote 3Eukaryote 2Bacterium 1Bacterium 3Bacterium 2Eukaryote 1Eukaryote 4Eukaryote 3Eukaryote 2Phylograms show branch order and branch lengths进化树,有分支和支长信息进化分支图,进化树进化分支图,进化树Cladograms show branching order - branch lengths are meaningless进化分支图,只用分支信息,无支长信息。

      2. 系统树的表示方法节点节点根根核酸替代率核酸替代率进化枝进化枝自展支持率自展支持率.节点(node):表示一个分类单元(taxonomic unit),它可以是一个已存在的物种,也可以是一个祖先进化枝(clade):由两种或两种以上生物或DNA序列以及其祖先及所有后代组成的树枝根(root):所有分类的共同祖先操作分类学单位(operational taxonomic unit, OTU):指所要研究样品分类水平进化分支长度(branch length):用数据表示的进化枝的变化程度3. 系统树的类型有根树和无根树有根树:有一个叫根的特殊节点,用来表示共同的祖先,由该点通过唯一路径产生其他节点,反映了树上物种或基因的时间顺序无根树:只是指明了种属的相互关系,没有确认共同祖先或进化途径即反映分类单元之间的距离而不涉及谁是谁的祖先问题 .Rooted by outgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteria outgrouprooteukaryoteeukaryoteeukaryoteeukaryote无根树无根树archaeaarchaeaarchaeaMonophyletic group(单源群单源群)Monophyleticgroup有根树有根树外类群外类群.4.外类群的选取要区分不同的进化路径,在进化树分析过程中必须加入一个或多个已知与分析序列关系较远的序列作为外类群(OTUgroup)。

      外类群可以辅助定位树根,外类群序列与其他序列间的差异必须比其他序列之间的差异更显著,外类群的选择对进化分析的结果影响较大5.建树方法的选择建树方法建树方法基于距离的基于距离的方法方法基于离散特基于离散特征的方法征的方法邻接法邻接法 NJ非加权分组平均非加权分组平均法法 UPGMA最大简约法最大简约法 MP最大似然法最大似然法 ML距离的方法距离的方法:利用所有物种或分类单元间的进化距离,依据一定的原则及算法构建系统发育树基本思路是列出所有可能的序列对,计算序列之间的遗传距离,选出相似程度比较大或非常相关的序列对离散特征的方法离散特征的方法:利用具有离散特征状态的数据,如DNA序列中的特定位点的核苷酸;建树时,着重分析分类单元或序列间每个特征(如核苷酸位点)的进化关系等一种简单的距离矩阵.(1)非加权分组平均法 UPGMA最简单的距离算法,这一方法最初在数值分类学中用于反映类群的表征相似程度,当用来重建分子系统发育树时,其假定的前提条件是:在进化过程中,每一世系发生趋异的次数相同,及核苷酸或氨基酸的替换速率是均等且恒定的通过UPGMA法所产生的系统发育树可以说是物种树的简单体现,在每一次趋异发生后,从共祖节点到2个OTU间分支长度一样。

      UPGMA法在聚类时,首先将距离最小的2个OTU聚在一起,并形成一个新的OTU,其分支点位于2个OTU间距离的1/2处;然后计算新的OTU与其他OTU间的平均距离,再找出其中最小的2个OTU进行聚类;如此反复,直到所有的OTU都聚到一起,最终得到一个完整的系统发育树UPGMA法d=e=10/2=5.c=19/2=9.5g=c-d=9.5-5=4.5.a=b=22/2=11AB(CDE)A-2239.5B-41.5(CDE)-.(AB)(CDE)(AB)-40.5(CDE)-f1+a=f2+c=40.5/2=20.25f1=9.25 , f2=11.75.(2)邻接法Neighbor-joining method, NJ:基于最小进化原理,被认为是最小进化法ME的简化版在重建系统发育树时,它取消了UPGMA法所作的假定,认为在进化分支上发生趋异的次数可以不同现在表明它是最有效的基于距离数据重建系统发育树的方法之一NJ得到的系统发育树,2个聚在一起的OTU所在的终节点到共祖节点的距离并不一定相同NJ法跟踪的是树上的节点,而不是OTU在聚类过程中,根据原始距离矩阵,基于其他所有节点间的平均趋异程度而对每对节点间的距离作了调整,将每个OTU的趋异程度标准化,从而形成一个新的距离矩阵。

      重建时将距离最小的2个终节点连接起来,在树中增加一个共祖节点,同时去除原初的2个终节点及其分支,对整个树进行了修剪,随后,新增加的共祖节点被视为终节点,重复上一次循环3)最大简约法Maximum Parsimony method, MP:最早源于形态性状研究,现在已经推广到分子序列的进化分析中其理论基础是奥卡姆哲学原则,认为解释一个过程的最好理论是所需假设数目最少的那一个MP法对所有可能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树MP法利用对简约分析能提供信息的特征如在DNA序列数据中,利用的只是存在核苷酸序列差异的位点,这些位点被称为简约信息位点利用MP法重建系统发育树实际上是一个对给定OTU,其所有可能的树进行比较的过程对某一个可能的树首先对每个位点祖先序列的核苷酸组成做出判断,然后统计每个位点用来阐明差异的核苷酸最小替换数目在整个树中,所有信息简约位点最小核苷酸替换数的总和称为树的长度通过比较所有可能的树,选择其中长度最小的树作为最终的系统发育树,即最大简约树.(4)最大似然法Maximum Likelihood method, ML:最早应用于基因频率数据的分析,后来引入到了分子序列的分析中。

      ML法分析中,选取一个特定的替换模型来分析给定的一组序列数据,使获得的每一个拓扑结构的似然率都为最大值,然后在挑出其中似然率最大的拓扑结构作为最优树在ML法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率求最大值来估计枝长利用ML法来推断一组序列的系统发育树,需首先确定序列进化的模型,目前使用较多的是一些相对较简单的模型,如Jukes-Cantor模型、Kimura二参数模型及一般二参数模型这些模型都是建立在一定假设基础上;然后基于一定的模型考虑2个OTU序列间的关系,找到枝的长度这个过程需要寻找在某一进化距离上由第一种序列真正转换成第二种序列的可能性,并确定在最大可能下的进化距离;接着将多个OTU所构成的所有可能树作为最佳树,对重建每棵树的统计量进行似然估计;最后通过对树长度的优化,从而获得最佳树各参数的最大似然估计5)贝叶斯推断Bayesian法:英国学者T.贝叶斯1763年在论有关机遇问题的求解中提出一种归纳推理的理论,后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法但在发展过程中始终存在着与经典统计之间的争论 .Which Methods much better?6.建树方法比较A)UPGMA法假设在进化过程中所有核苷酸/氨基酸都有相同的变异率,也就是存在着一个分子钟。

      这种算法得到的进化树相对来说不是很准确,现在已经很少使用B)NJ法是一个经常被使用的算法,它构建的进化树相对准确,而且计算快捷其缺点是序列上的所有位点都被同等对待,而且所分析序列的进化距离不能太大,在处理相似度较高、亲缘关系较近的序列时,NJ算法是最可靠的C) MP法的速度上比距离法更快,但不适合处理大量的和变异比较明显的序列它有个弱点,用这种算法计算得到的树往往不是唯一的,还需要进一步筛选而且,在遇到趋同进化或进化速率不同的时候,这种方法的结果往往不理想D) ML法在MP法的基础上计算每个位点转移概率的大小,同时通过调节各个分支的长度和位点来描述最可能的谱系关系在树的拓扑结构方面,ML法可能是最好的算法但是ML算法的计算量显然大大增加了所以在处理大量序列的时候,此种方法计算极其耗时!.一般来讲,如果模型合适,ML的效果较好对近缘序列,有人喜欢MP,因为用的假设最少MP一般不用在远缘序列上,这时一般用NJ或ML对相似度很低的序列,NJ往往出现Long-branch attraction(LBA,长枝吸引现象),有时严重干扰进化树的构建贝叶斯的方法则太慢对于各种方法构建分子进化树的准确性,一篇综述(Comparison of the Accuracies of Several Phylogenetic Methods Using Protein and DNA Sequences, Hall BG. Mol Biol Evol 2005, 22(3):792-802)认为贝叶斯的方法最好,其次是ML,然后是MP。

      其实如果序列的相似性较高,各种方法都会得到不错的结果,模型间的差别也不大对于NJ和ML,是需要选择模型的对于各种模型之间的理论上的区别,这里不作深入的探讨,可以参看Nei的书对于蛋白质序列以及DNA序列,两者模型的选择是不同的一般来说,对于蛋白质的序列,一般选择Poisson Correction(泊松修正)这一模型而对于核酸序列,一般选择Kimura 2-parameter(Kimura-2参数)模型如果对各种模型的理解并不深入,并不推荐初学者使用其他复杂的模型Bootstrap几乎是一个必须的选项一般Bootstrap的值70,则认为构建的进化树较为可靠如果Bootstrap的值太低,则有可能进化树的拓扑结构有错误,进化树是不可靠的对于进化树的构建,如果对理论的了解并不深入,推荐使用缺省的参数需要选择模型的时候(例如用NJ或者ML建树),对于蛋白序列使用Poisson Correction模型,对于核酸序列使用Kimura-2参数模型另外需要做Bootstrap检验,当Bootstrap值过低时,所构建的进化树其拓扑结构可能存在问题并且,一般推荐用两种不同的方法构建进化树,如果所得到的进化树类似,则结果较为可靠。

      7.重建系统发育树的基本流程(1)选择合适的序列进行多序列比对选择合适的序列进行多序列比对所有系统发育学分析的一个基本假设,就是所比较的基因必须是种间同源基因因此,应首先确认要比较的基因可归于同一类输入序列的比对是进化树分析的基础,比对的错误可能使最精心设计的算法失效多序列比对最常使用的是Clustal程序,包括ClustalX和ClustalW使用Clustal程序比对后,有时还要根据序列特点进行手工比对,最后将比对结果转换为特定格式输出2)选择合适方法构建。

      点击阅读更多内容
      相关文档
      大象版(2024)新教材小学一年级科学上册第一单元《1.辨别真假水果》精品课件.pptx 人教版(PEP)新教材小学四年级英语上册Unit 4 Part A spell 教学课件.pptx 苏少版(2024)新教材小学一年级美术上册第六单元《第1课 我的好朋友》精品课件.pptx 人教版(PEP)新教材小学四年级英语上册Unit 4 Part A talk 教学课件.pptx 人教版(PEP)新教材小学一年级英语上册Unit 3 Listen and say教参课件.pptx 人教版(PEP)新教材小学四年级英语上册Unit 3 单词讲解课件.pptx 人教版(PEP)新教材小学一年级英语上册Unit 2 第一课时教学课件.pptx 人教版(PEP)新教材小学一年级英语上册Unit 2 Listen point and repeat教参课件.pptx 人教版(PEP)新教材小学一年级英语上册Unit 2 Fun time教参课件.pptx 人教版(PEP)新教材小学二年级英语上册Unit 3 Lesson 3教参课件.pptx 辽海版(2024)新教材小学一年级美术上册第一单元《2 涂涂画画》精品课件.pptx 辽海版(2024)新教材小学一年级美术上册第一单元《1 美好的事物》精品课件.pptx 人教版(PEP)新教材小学四年级英语上册Unit 3 课时 1 A talk 教学课件.pptx 苏少版(2024)新教材小学一年级美术上册第七单元《第2课 我跟别人不一样》精品课件.pptx 人教版(PEP)新教材小学一年级英语上册Unit 2 Lesson 1 精品课件.pptx 人教版(PEP)新教材小学四年级英语上册Unit 5 Lesson 4教参课件.pptx 人教版(PEP)新教材小学二年级英语上册Unit 3 Lesson 4教参课件.pptx 人教版(PEP)新教材小学四年级英语上册Unit 4 Lesson 1教参课件.pptx 大象版(2024)新教材小学一年级科学上册第一单元《2.感官的本领》精品课件.pptx 人教版(PEP)新教材小学一年级英语上册Unit 4 Listen point and repeat教参课件.pptx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.