好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

系统进化树的构建方法与软件应用-系统进化树.ppt

36页
  • 卖家[上传人]:飞***
  • 文档编号:50757657
  • 上传时间:2018-08-10
  • 文档格式:PPT
  • 文档大小:2.06MB
  • / 36 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 系统进化树的构建方法与软件应用姓名:张镜悬 E-mail:J.zhang@•什么是系统进化树系统进化树又称为演化树,是表明被认为具有共同祖先的各物 种间演化关系的树.在树中每个节点代表其各个分支的最近共同 祖先,而节点的线段长度对应了其演化的距离 (http://en.wikipedia.org/wiki/Phylogenetic_tree)•直系同源和旁系同源•直系同源:同源的基因是由共同的祖先基因进化而产生的 •旁系同源:同源的基因是由于基因复制产生的•这也就告诉我们用于分子进化分析中的序列必须是直系同 源的才可以真实的反映其进化的过程•系统进化树的分类根据树是否有根,进化树可以分为有根树和无根树两类•有根树和无根树的进化层面上的意义有根树反应了树上物种或者基因进化的时间顺序,通过分析有根 树的长度,可以了解不同的物种或者基因以什么方式和速率进 化无根树只反映分类单元之间的距离,而不涉及谁是谁的祖先问题做有根树需要指定outgroup所谓out group , 就是你所分析的东 西之外的一个group比如你分析人类的不同人种,就选个 chimpanzee,你要分析哺乳动物,就选个鳄鱼乌龟之类,总之保 证它在 你要分析的group之外,但又不太远就行了。

      将你选定 的东西指定为outgroup,做出来的树就是有根树out group可以 不只一个,它是一个group•系统进化树的结构nodebranch进化树的结构主要分为三部分: • 树叶 • 树枝 • 节点 其中我们把从同一个节点上分出的两个分支叫做sister group. Sister group 从结构上可以理解为从进化史上看两者非常接近 ,其次两者拥有唯一的共同的祖先•系统进化树的结构cdbadcbadbca•从结构上看,我们认为这三个树是等价的•构建系统进化树的理论方法•最大简约法(maximum parsimony,MP)最早源于形态性状研究,现在已经推广到 分子序列的进化分析中最大简约法的理论基础是奥卡姆哲学原则,这个原 则认为:解释一个过程的最好理论是所需假设数目最少的那一个对所有可 能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最 优树•优点:最大简约法对于分析某些特殊的分子数据如插入、缺失等序列有用 在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大 的时候,最大简约法能够推导获得一个很好的进化树 •缺点:在分析序列上存在较多 的回复突变或平行突变,而被检验的序列位点 数又比较少的时候,最大简约法可能会给出一个不合理的或者错误的进化树 推导结果。

      •构建系统进化树的理论方法最大似然法(maximum likelihood,ML)•最早应用于系统发育分析是在对基因频率数据的分析上,后来基于分子序列 的分析中也已经引入了最大似然法的分析方法当样本量很大的时候,似然 法可以获得参数统计的最小方差 •最大似然法分析中,选取一个特定的替代模型来分析给定的一组序列数据, 使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最 大的拓扑结构 作为最优树•最大似然进化模型 Ø 简单假设所有核苷酸(或者氨基酸)之间相互转变的概率是一样的 Ø 程序会把所有可能的核苷酸轮流置于进化树的内部节点上,并且计算每个这 样的序列产生实际数据的可能性 Ø 所有可能再现的几率被加总,产生一个特定点的似然值,然后这个数据集的 所有比对位点的似然值的加和就是整个进化树的似然值•构建系统进化树的理论方法• 邻近法(Neighbor-Joining Method,NJ )该方法通过确定距离最近(或相邻)的成对分类单位来使系统树的总距离达到最 小相邻是指两个分类单位在某一无根分叉树中仅通过一个节点(node)相连 通过循序地将相邻点合并成新的点,就可以建立一个相应的拓扑树。

      •构建系统进化树的所涉及的工具•PHYLIP •MEGA •R •Matlab •BioEdit •TreeView •PHYML •ClustalX•构建系统进化树的所涉及的工具PHYLIP由美国华盛顿大学Felsenstein开发,可以 免费下载,适用于绝大多数操作系统PAUP由美国simthsonion institute开发,仅适用于 Apple-Macintosh和UNIX操作系统MEGA美国宾夕法尼亚州立大学MasatoshiNei开 发的分子进化遗传学软件,图形化,集 成的进行分析工具,不包括ML MOLPHY日本国立统计数理研究所开发,最大似 然法构树PAML英国University college London开发,最大似 然法构树和分子进化模型•构建系统进化树的所涉及的工具PUZZLE应用quarter puzzling方法(一种最大简约法 )构建系统树TreeView英国University of Glasgow开发,进化树显示 工具Phylogeny欧洲生物信息研究所(EBI)的系统发育 分析软件PHYML快速的ML建树工具MrBayes基于贝叶斯方法的建树工具MAC5基于贝叶斯方法的建树工具 构建NJ树,可以用PHYLIP或者MEGA构建MP树,可以使用PHYLIP或者MEGA构建ML树可以使用PHYML,速度快,同时构建ML树还可以用PHYLIP,或 者可以使用BioEdit贝叶斯的算法以MrBayes为代表,不过速度比较慢关于系统发育分析的更多知识请参阅: 1.序列比对 (ClustalX2)•构建系统进化树的主要步骤2. 掐头去尾 选取所需序列 转换格式(BioEdit or ClustalX2) Example :3. 利用相关软件绘制系统进化树(BioEdit,MEGA) •实例讲解下面的内容将教大家如何来构建自己的系统进化树。

      首先我们需要弄清楚一个很重要的问题,什么是Fasta 格式?在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本 用于表示核苷酸序列或氨基酸序列的格式在这种格式中碱基对或氨基 酸用单个字母来编码,且允许在序列前添加序列名及注释序列文件的 第一行是由大于号“>”或分号“;”打头的任意文字说明(习惯常用 “>”作为起始),用于序列标记从第二行开始为序列本身,只允许 使用既定的核苷酸或氨基酸编码符号• 构建我们自己的Fasta 文件很多情况下,Fasta文件是 直接可以从数据库中下载 得到的,但是根据实际要 求的不同,有时候我们需 要自己构建Fasta文件,如 果您已近有了想用来构建 进化树的序列,您可以如 右图所示构建自己的文件 ,文件的保存格式是: 文 件名.txt•实例讲解下面我们以禽流感病毒为例,构建系统进化树 首先我们要下载我们所需的序列 http://www.ncbi.nlm.nih.gov/genomes/FLU/Database/nph- select.cgi?go=genomeset•实例讲解请在Define search set: 中选择我们想要的禽流感病毒的Type, Host, Country/Region, Subtype.这里我们选在了A型 禽流感病毒,当然在 这次练习中您喜欢的 任意类型。

      •实例讲解请在Define search set: 中选择我们想要的禽流感病毒的Type, Host, Country/Region, Subtype.这里我们选在了A型禽 流感病毒,当然在这次 练习中您喜欢的任意类 型当您确定之后请点 击 Show results•实例讲解当您点击完 Show results 之后你要做的就是选在我们所需的 序列了•实例讲解因为禽流感病 毒不像别的很 多别的病毒只 有核苷酸序列 ,它拥有八个 或者七个 Negative -sense RNA•实例讲解这里我们只要选中其 中一种就可以了,比 如说HA,我们可以 选择20个样本来构 建系统进化树样本 选择完之后请点击 Download, 文件类型 选择Nucleotide (Fasta), 并把文件保存在计算 机您熟悉的地方 当然根据需求的不同 您也可以选在蛋白序 列)•实例讲解文件下载完之后,下载的Fasta 文件直接用 ClustalX 2.0.12打开•实例讲解在进行多序列比对之前我们需要对软件进行一些设置1.选择Alignment标签 2.选择Output format options 请将Clustalw sequences numbers 选项设置为 On 之后点击 Ok ,在返回主界面 之后请点击Alignment 标签选 择 Do Complete Alignment选项选择保存路径之后点击ok,剩下的时 间可以去喝点咖啡休息一下。

      •实例讲解从图中我们可以发现起 始序列最短的是从位置 22开始的,而尾端序列 最短的是在位置1738, 通过设置我们可以保存 这样一批已经经过掐头 去尾后的序列,保存格 式为:文件名.aln当 然我们也可以直接保存 为Fasta format, 如果选择 前者我们需要用BioEdit 转换格式,如果是后者 我们可以直接进入建树 阶段点击主界面 中的 File标签 选择 Save as 选项,并按 照例子设置 参数•实例讲解经过ClustalX2掐头去尾后的序列可以用BioEdit软件打开,选择 FileSave as保存类型为:文件名.fasta. 当我们查询结果的时 候可以发现这和用ClustalX2保存的fasta文件是一致的•实例讲解下一步我们将介绍如何用MEGA构建我们的进化树,首先请大 家用MEGA软件将我们之前保留的Fasta文件打开•实例讲解下一步我们将介绍如何用MEGA构建我们的进化树,首先请大 家用MEGA软件将我们之前保留的Fasta文件打开这时候会有 两个窗口,选择File标签Convert file format to Mega.•实例讲解选择File标签Convert file format to Mega.当给出相应的文件路径之后点击ok ,然后制定 输出文件格式:文件名.meg•实例讲解双击刚才保存的meg文件.选择数据类型,在本次测试中我们 用的是核苷酸序列,对于右边的参 数信息请点击help按钮。

      更具实际的情况我 们这里选择No选项•实例讲解下一步进入建树的最后阶段在Plylogeny中选择建树方 法,这里我们选择NJ法参数设置好之后点 击compute.蛋白质序列一般选择Poisson Correction(泊松校正),对 于核苷酸序列一般采用 Kimura-2模型•实例讲解根据Mega的计算最终我们得到了序列中的进化关系Mega软件还可以自动提供一份简 要的分析报告,你只需要点击 Caption按钮报告便可以自动生成 如果Bootstrap Value >70我们认为 这个分支是可靠的 进化树评估优化方法简介:常用的两种方法就是Bootstrap和Jackknife所谓Bootstraping法 就是从整个序列的碱基(氨基酸)中任意选取 一半,剩下的一半序列随机补齐组成一个新的序列这样,一个序列就 可以变成了许多序列,一个多序列组也就可以变 成许多个多序列组根 据某种算法(最大简约性法、最大可能性法、邻位相连法)每个多序列 组都可以生成一个进化树将生成的许多进化树进行比 较,按照多数规 则(majority-rule)我们就会得到一个最“逼真”的进化树其数值反应了 该树枝的可信的百分比。

      所谓Jackknife则是另外一种随机选取序列的方法它与Bootstrap法的区别是不将剩下的一半序列补齐,只生成一个缩短了一半的新序列Double Check 通常情况下当我们用建树的一种方法获得了树图之后,我们建议大家。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.