您所在位置：网站首页 > 建筑/环境 > 建筑资料 > 系统发育树的详细构建方法

系统发育树的详细构建方法.docx

10页

卖家[上传人]：鲁**

文档编号：418974450

上传时间：2023-11-21

文档格式：DOCX

文档大小：26.44KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15金贝

下载

/ 10 举报版权申诉马上下载

文本预览

下载提示

常见问题

构建系统发育树需要注意的几个问题1 相似与同源的区别：只有当序列是从一个祖先进化分歧而来时，它们才是同源的2 序列和片段可能会彼此相似，但是有些相似却不是因为进化关系或者生物学功能相近的缘故，序列组成特异或者含有片段重复也许是最明显的例子；再就是非特异性序列相似3 系统发育树法：物种间的相似性和差异性可以被用来推断进化关系4 自然界中的分类系统是武断的，也就是说，没有一个标准的差异衡量方法来定义种、属、科或者目5 枝长可以用来表示类间的真实进化距离6 重要的是理解系统发育分析中的计算能力的限制任何构树的实验目的基本上就是从许多不正确的树中挑选正确的树7 没有一种方法能够保证一颗系统发育树一定代表了真实进化途径然而，有些方法可以检测系统发育树检测的可靠性第一，如果用不同方法构建树能得到同样的结果，这可以很好的证明该树是可信的；第二，数据可以被重新取样(bootstrap),来检测他们统计上的重要性分子进化研究的基本方法对于进化研究，主要通过构建系统发育过程有助于通过物种间隐含的种系关系揭示进化动力的实质表型的(phenetic)和遗传的(cladistic)数据有着明显差异Sneath和Sokal(1973)将表型性关系定义为根据物体一组表型性状所获得的相似性，而遗传性关系含有祖先的信息，因而可用于研究进化的途径。

这两种关系可用于系统进化(phylogenetictree)或树状图 (dendrogram)来表示表型分枝S(phenogram)和进化分枝图(cladogram)两个术语已用于表示分别根据表型性的和遗传性的关系所建立的关系树进化分枝图可以显示事件或类群间的进化时间，而表型分枝图则不需要时间概念文献中，更多地是使 “系统进化树” —词来表示进化的途径，另外还有系统发育树、物种树(species tree)、基因树等等一些相同或含义略有差异的名称系统进化树分有根(rooted)和无根(unrooted )树有根树反映了树上物种或基因的时间顺序，而无根树只反映分类单元之间的距离而不涉及谁是谁的祖先问用于构建系统进化树的数据有二种类型：一种是特征数据(characterdata),它提供了基因、个体、群体或物种的信息；二是E离数据(dis tance data)或相似性数据 (similari ty data),它涉及的则是成对基因、个体、群体或物种的信息距离数据可由特征数据计算获得，但反过来则不行这些数据可以矩阵的形式表达距离矩阵 (dis tance mat rix)是在计算得到的距离数据基础上获得的，距离的计算总体上是要依据一定的遗传模型，并能够表示出两个分类单位间的变化量系统进化树的构建质量依赖于距离估算的准确性。

1) 打开 clus tal X，载入上述序列，“load sequences”—“ou tpu tforma top ti ons” ：“CLASTAL FORMAT”; CLASTAL SEQUENCES NUMBERS:ON;ALIGNMENT PARAMETERS:“RESET NEW GAPS BEFOR ALIGNMENT” “MULTIPLE ALIGNMENT PARAMETERS”—设置相关参数2) “DO COMPLETE ALIGNMENT”fFILE—SAVE AS,掐头去尾3) 打开 MEGA 4,FILE—CONVERT TO MEGA FORMATE—SAVE—FILE—OPEN DATA—CONTAINING PROTAIN SEQUENCES NO —PHYLOGENY—BOOTSTRAP TEST OF PHYLOGENY—N J —设置相关参数最后看到系统发育树二这里要介绍的是 Bioedit-Mega 建树法，简单实用，极易上手1 将所测得的序列在 NCBI 上进行比对，这个就不多讲了2 选取序列保存为 text 格式3运行Bioedit,使用其中的CLUSTAL W进行比对。

4运用MEGA 4建树，首先将前面的文件转化格式为mega格式，然后进行激活，最后进行 N-J 建树此法简单实用，树形美观构建系统进化树的详细步骤1. 建树前的准备工作1・1相似序列的获得一一BLASTBLAST 是目前常用的数据库搜索程序，它是 Basic Local Alignment Search Tool 的缩写，意为“基本局部相似性比对搜索工具”(Altschul et al.,1990[62];1997[63])国际著名生物信息中心都提供基于Web的BLAST服务器BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段，并作为内核向两端延伸，以找出尽可能长的相似序列片段首先登录到提供BLAST服务的常用网站，比如国内的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ这些网站提供的BLAST服务在界面上差不多，但所用的程序有所差异它们都有一个大的文本框，用于粘贴需要搜索的序列把序列以FASTA格式(即第一行为说明行，以“>”符号开始，后面是序列的名称、说明等，其中“>”是必需的，名称及说明等可以是任意形式，换行之后是序列)粘贴到那个大的文本框，选择合适的BLAST程序和数据库，就可以开始搜索了。

如果是DNA序列，一般选择BLASTN搜索DNA数据库这里以 NCBI 为例登录 NCBI 主页-点击 BLAST-点击 Nucleotide-nucleotide BLAST (blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得到result of BLAST BLASTN 结果如何分析(参数意义)：>gi|28171832|gb|AY155203.1| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete sequenceScore = 2020 bits (1019), Expect = 0.0Identities = 1382/1497 (92%), Gaps = 8/1497 (0%) Strand = Plus / PlusQuery: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt 60Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt 58Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120Sbjct: 59 acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118Score ：指的是提交的序列和搜索出的序列之间的分值，越高说明越相似；Expect：比对的期望值。

比对越好，expect越小，一般在核酸层次的比对，expect小于le-10, 就比对很好了，多数情况下为 0；Identities ：提交的序列和参比序列的相似性，如上所指为1 497 个核苷酸中二者有1382 个相同；Gaps：一般翻译成空位，指的是对不上的碱基数目；Strand：链的方向，Plus / Minus意味着提交的序列和参比序列是反向互补的，如果是Plus / Plus 则二者皆为正向1.2 序列格式： FASTA 格式由于EMBL和GenBank数据格式较为复杂，所以为了分析方便也出现了十分简单的 FASTA数据格式FASTA格式又称为Pearson格式，该种序列格式要求序列的标题行以大于号“>”开头，下一行起为具体的序列一般建议每行的字符数不超过60或80个，以方便程序处理多条核酸和蛋白质序列格式即将该格式连续列出即可，如下所示：>E.coli1 aaattgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa61 gtcgaacggt aacaggaaga agcttgcttc tttgctgacg agtggcggac ……>AY631071 Jiangella gansuensis YIM 0021 gacgaacgct ggcggcgtgc ttaacacatg caagtcgagc ggaaaggccc tttcgggggt61 actcgagcgg cgaacgggtg agtaacacgt gggtaacctg ccttcagctc tgggataagc其中的'>'为Clustal X默认的序列输入格式，必不可少。

其后可以是种属名称，也可以是序列在Genbank中的登录号(Accession No.)，自编号也可以，不过需要注意名字不能太长，一般由英文字母和数字组成，开首几个字母最好不要相同，因为有时Clustal X程序只默认前几位为该序列名称回车换行后是序列将检测序列和搜索到的同源序列以FASTA格式编辑成为一个文本文件(例：C:\temp\jc.txt)，即可导入Clustal X等程序进行比对建树2. 构建系统树的相关软件和操作步骤构建进化树的主要步骤是比对，建立取代模型，建立进化树以及进化树评估鉴于以上对于构建系统树的评价，结合本实验室实际情况，以下主要介绍N-J Tree构建的相关软件和操作步骤2.1用Clustal X构建N-J系统树的过程(1) 打开Clustal X程序，载入源文件.File-Load sequences- C:\temp\jc.txt.(2) 序列比对Alignment - Output format options - 7 Clustal format ； CLUSTALW sequence numbers: ON Alignment - Do complete alignment(Output Guide Tree file, C:\temp\jc.dnd； Output Alignment file, C:\temp\jc.aln； )Align f waiting 等待时间与序列长度、数量以及计算机配置有关。

3) 掐头去尾File-Save Sequence as...Format: O CLUSTALGDE output case: LowerCLUSTALW sequence numbers: ONSave from residue: 39 to 1504 (以前后最短序列为准)Save sequence as: C:\temp\jc-a.alnOK将开始和末尾处长短不同的序列剪切整齐这里，因为测序引物不尽相同，所以比对后序列参差不齐一般来说，要“掐头去尾”，以避免因序列前后参差不齐而增加序列间的差异剪切后的文件存为ALN格式4) File-Load sequences-Replace existing sequences?-Yes- C:\temp\jc-a.aln 重新载入剪切后的序列5) Trees-Output Format OptionsOutput Files : 7 CLUSTAL format tree 7 Phylip format tree 7 Phylip distance matrix Bootstrap labels on: NODECLOSETrees-Exclude positions with g。

点击阅读更多内容