好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

序列特征分析PPT课件..ppt

44页
  • 卖家[上传人]:没有****飞上
  • 文档编号:269511820
  • 上传时间:2022-03-22
  • 文档格式:PPT
  • 文档大小:1.19MB
  • / 44 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第四章第四章 序列特征分析序列特征分析AnalysisAnalysis of Sequence of Sequence CharacterristicsCharacterristics第一节第一节 引言引言一、基因结构一、基因结构Section 1Section 1 Introduction Introduction 基因的概念是随着遗传学、分子生物学基因的概念是随着遗传学、分子生物学、生物化学等领域的发展不断完善的从分、生物化学等领域的发展不断完善的从分子生物学角度来看,子生物学角度来看,基因基因是负载特定生物遗是负载特定生物遗传信息的传信息的DNADNA分子片段,在一定的条件下能分子片段,在一定的条件下能够表达这种遗传信息,产生特定的生理功能够表达这种遗传信息,产生特定的生理功能原核生物基因结构:原核生物基因结构: 一个完整的原核基因结构是从基因的一个完整的原核基因结构是从基因的55端启动子区域开端启动子区域开始,到始,到33端终止区域结束基因的转录开始位置由转录起始端终止区域结束基因的转录开始位置由转录起始位点确定,转录过程直至遇到转录终止位点结束,转录的内位点确定,转录过程直至遇到转录终止位点结束,转录的内容包括容包括55端非翻译区、开放阅读框及端非翻译区、开放阅读框及33端非翻译区。

      基因翻端非翻译区基因翻译的准确起止位置由起始密码子和终止密码子决定,翻译的译的准确起止位置由起始密码子和终止密码子决定,翻译的对象即为介于这两者之间的开放阅读框对象即为介于这两者之间的开放阅读框ORFORF 操纵子模型结构操纵子模型结构 原核生物大多数基因表达调控是通过操纵子机制实现的原核生物大多数基因表达调控是通过操纵子机制实现的所谓操纵子通常由调节基因、启动子、操纵基因以及所谓操纵子通常由调节基因、启动子、操纵基因以及2 2个以个以上的编码序列(结构基因)在原核生物基因组中成簇串联组上的编码序列(结构基因)在原核生物基因组中成簇串联组成其中结构基因的表达受到操纵基因的调控调节基因能成其中结构基因的表达受到操纵基因的调控调节基因能产生作用于操纵基因的阻遏物(一种蛋白质),操纵基因靠产生作用于操纵基因的阻遏物(一种蛋白质),操纵基因靠近它所控制的结构基因,阻遏物与操纵基因的结合能阻止结近它所控制的结构基因,阻遏物与操纵基因的结合能阻止结构基因的转录构基因的转录 真核生物基因结构:真核生物基因结构: 一个完整的真核生物基因,不但包括编码区域,还包括一个完整的真核生物基因,不但包括编码区域,还包括55端和端和33端两侧长度不等的特异性序列,虽然这些序列不编端两侧长度不等的特异性序列,虽然这些序列不编码氨基酸,却在基因表达的过程中起着重要的作用。

      所以,码氨基酸,却在基因表达的过程中起着重要的作用所以,严格的严格的“ “基因基因” ”这一术语的分子生物学定义是:产生一条多肽这一术语的分子生物学定义是:产生一条多肽链或功能链或功能RNARNA所必须的全部核苷酸序列所必须的全部核苷酸序列二、蛋白质结构二、蛋白质结构 蛋白质是一种生物大分子,蛋白质中相邻的氨基蛋白质是一种生物大分子,蛋白质中相邻的氨基酸通过肽键形成一条伸展的肽链,这条链称为蛋白质酸通过肽键形成一条伸展的肽链,这条链称为蛋白质的一级结构,不同蛋白质其肽链的长度不同,肽链中的一级结构,不同蛋白质其肽链的长度不同,肽链中不同氨基酸的组成和排列顺序也各不相同肽链上的不同氨基酸的组成和排列顺序也各不相同肽链上的氨基酸残基形成局部的二级结构,各种二级结构在空氨基酸残基形成局部的二级结构,各种二级结构在空间卷曲折叠形成特定的三维空间结构有的蛋白质由间卷曲折叠形成特定的三维空间结构有的蛋白质由多条肽链组成,每条肽链称为亚基,亚基之间又有特多条肽链组成,每条肽链称为亚基,亚基之间又有特定的空间关系,称为蛋白质的四级结构定的空间关系,称为蛋白质的四级结构 蛋白质的一级结构蛋白质的一级结构蛋白质的一级结构决定二级结构蛋白质的一级结构决定二级结构蛋白质的二级结构决定三级结构蛋白质的二级结构决定三级结构 蛋白质的二级结构蛋白质的二级结构H H表示螺旋表示螺旋 E E表示折叠表示折叠 B B表示表示桥桥G G表示表示3-3-螺旋螺旋 I I表示表示螺旋螺旋 T T表示氢键转角表示氢键转角S S代表转向代表转向 对对DNADNA序列和蛋白质序列进行序列特征分析,序列和蛋白质序列进行序列特征分析,能够使我们从分子层次上了解基因的结构特点,能够使我们从分子层次上了解基因的结构特点,了解与基因表达调控相关的信息,了解了解与基因表达调控相关的信息,了解DNADNA序列与序列与蛋白质序列之间的编码,了解蛋白质序列与蛋白蛋白质序列之间的编码,了解蛋白质序列与蛋白质空间结构之间的关系和规律,为进一步研究了质空间结构之间的关系和规律,为进一步研究了解蛋白质功能与蛋白质结构之间的关系提供理论解蛋白质功能与蛋白质结构之间的关系提供理论依据。

      依据 第二节第二节 DNADNA序列特征分析序列特征分析Section 2Section 2 Analysis of DNA Sequence CharacteristicsAnalysis of DNA Sequence Characteristics 分析分析DNADNA序列,除了进行序列比对之外,更重要的工作序列,除了进行序列比对之外,更重要的工作是从序列中找到基因及其表达调控信息寻找基因的工作有是从序列中找到基因及其表达调控信息寻找基因的工作有两个:一是识别与基因相关的特殊序列信号,如启动子、起两个:一是识别与基因相关的特殊序列信号,如启动子、起始密码子,通过信号识别大致确定基因所在的区域;二是预始密码子,通过信号识别大致确定基因所在的区域;二是预测基因的编码区域,或预测外显子所在的区域在此基础上测基因的编码区域,或预测外显子所在的区域在此基础上,结合两个方面的结果确定基因的位置和结构绝大部分基,结合两个方面的结果确定基因的位置和结构绝大部分基因表达调控信息隐藏在基因序列的上游区域,在组成上具有因表达调控信息隐藏在基因序列的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。

      一定的特征,可以通过序列分析识别这些特征一、开放阅读框一、开放阅读框ORFopen reading frameORFopen reading frame 开放阅读框开放阅读框指的是从指的是从55端开始翻译起始密码子(端开始翻译起始密码子(ATGATG)到终止密码子(到终止密码子(TTATTA、TAGTAG、TGATGA)的蛋白质编码碱基序列)的蛋白质编码碱基序列每个序列都有每个序列都有6 6个可能的开放阅读框,其中个可能的开放阅读框,其中3 3个开始于第个开始于第1 1、2 2、3 3个碱基位点并沿着给定序列的个碱基位点并沿着给定序列的5 35 3的方向进行延伸,而的方向进行延伸,而另外的另外的3 3个开始于第个开始于第1 1、2 2、3 3个碱基位点但沿着互补序列的个碱基位点但沿着互补序列的5 5 33的方向进行延伸在开始这项工作之前,我们并不知道的方向进行延伸在开始这项工作之前,我们并不知道DNADNA双链中哪一条单链是编码链,也不知道准确的翻译起始双链中哪一条单链是编码链,也不知道准确的翻译起始点在何处,由于每条链都有点在何处,由于每条链都有3 3种可能的开发阅读框,种可能的开发阅读框,2 2条链共条链共计计6 6种可能的开放读框,我们的目的就是从这种可能的开放读框,我们的目的就是从这6 6个可能的开放个可能的开放阅读框中找出一个正确的开放阅读框。

      根据这个开放阅读框阅读框中找出一个正确的开放阅读框根据这个开放阅读框翻译得到的氨基酸序列才是真正表达的蛋白质产物翻译得到的氨基酸序列才是真正表达的蛋白质产物 真核生物的开放阅读框真核生物的开放阅读框 真核生物的开放阅读框不仅含有编码蛋白的外显子(真核生物的开放阅读框不仅含有编码蛋白的外显子(exonexon),而且还有内含子(),而且还有内含子(intronintron),并且内含子将开放阅读框分),并且内含子将开放阅读框分割为若干个小片段开放阅读框的长度变化范围非常大,因此割为若干个小片段开放阅读框的长度变化范围非常大,因此真核生物的基因预测远比原核生物困难但是,在真核生物的真核生物的基因预测远比原核生物困难但是,在真核生物的开放阅读框中,外显子与内含子之间的连接绝大部分情况下满开放阅读框中,外显子与内含子之间的连接绝大部分情况下满足足GT-AGGT-AG规律:内含子序列规律:内含子序列 5 5 端的起始两个核苷酸总是端的起始两个核苷酸总是GTGT,并且其并且其33端的最后两个核苷酸总是端的最后两个核苷酸总是AGAG,即:,即:5-GT 5-GT AG-3AG-3,这个规律有助于真核生物开放阅读框的识别。

      这个规律有助于真核生物开放阅读框的识别利用利用GENSCANGENSCAN识别基因开放阅读框识别基因开放阅读框 GENSCAN GENSCAN是美国麻省理工学院的是美国麻省理工学院的Chris BurgeChris Burge于于19971997年开发成功的人类(或脊椎动物)基因预测年开发成功的人类(或脊椎动物)基因预测软件,它是根据基因组软件,它是根据基因组DNADNA序列来预测开放阅读框序列来预测开放阅读框及基因结构信息的开放式资源,尤其适用于脊及基因结构信息的开放式资源,尤其适用于脊椎动物、拟南芥和玉米等真核生物椎动物、拟南芥和玉米等真核生物GENSCANGENSCAN的网址为:的网址为: httphttp:/ /genes.Mit.edu/GENSCAN.htmlgenes.Mit.edu/GENSCAN.htmlGENSCANGENSCAN操作页面操作页面用用GENSCANGENSCAN预测预测AC002390AC002390序列的基因序列的基因/ /外显子外显子 二、二、CpGCpG岛岛 CpGCpG islands islands CpG岛是指DNA序列上的一个区域,此区域含有大量相联的胞嘧啶(C)、鸟嘌呤(G),以及使两者相连的磷酸酯键(p)。

      CpG岛的概念是Gardiner-garden和Fromner于1987年提出的,基因中平均每100 Kb即可出现CpG岛位于基因的启动子和第一个外显子区,约有60%80%的人类基因的启动子和起始外显子含有CpG岛,其中GC含量大于50%,长度超过200bp因此搜索CpG岛可以为基因及其启动子预测提供重要线索利用利用CpGPlotCpGPlot预测分析预测分析CpGCpG岛岛 CpGPlot是预测CpG岛的工具,它是由欧洲分子生物学实验室EMBL European Molecular Biology Laboratory提供的其网址为:http:/www.ebi.ac.uk/Tools/emboss/cpgplot/index.htmlCpGPlotCpGPlot操作页面操作页面用用CpGplotCpGplot预测预测AC002390AC002390序列的序列的CpGCpG岛的结果岛的结果 三、转录终止信号三、转录终止信号 转录终止信号是在转录终止信号是在mRNAmRNA序列的序列的33端终止密码子下游端终止密码子下游位置上的加尾信号(位置上的加尾信号(tailing signaltailing signal)。

      前体)前体mRNA 3mRNA 3端多聚端多聚腺苷酸化是真核细胞内腺苷酸化是真核细胞内mRNAmRNA转录后处理的三个最主要步转录后处理的三个最主要步骤之一,这三个步骤包括:骤之一,这三个步骤包括:55帽子结构的形成、内含子的帽子结构的形成、内含子的剪切及剪切及33端的多聚腺苷酸化,因此,前体端的多聚腺苷酸化,因此,前体mRNA 3mRNA 3端多聚端多聚腺苷酸化与腺苷酸化与mRNAmRNA稳定性的调节、稳定性的调节、mRNAmRNA的细胞内转运、。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.