好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

讲稿9-蛋白质结构预测.doc

34页
  • 卖家[上传人]:工****
  • 文档编号:384812860
  • 上传时间:2023-04-04
  • 文档格式:DOC
  • 文档大小:756KB
  • / 34 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第九章蛋白质结构预测第一节概述蛋白质研究的核心内容:收集大量的蛋白质分子结构的信息,建立结构与功能之间关系的数据库,奠定蛋白质结构与功能之间关系的理论研究基础•验证蛋白质设计的假设证明是新结构改变了原有生物功能三维空间结构的测定•晶体学的技术制备出单晶体需纯蛋白质(几毫克〜几十毫克)进行繁杂的数据收集、计算和分析蛋白质的晶体状态与自然状态不尽相同,应考虑的问题• NMR(核磁共振)技术可以分析液态下的肽链结构, 绕过了结晶、X-射线衍射成像分析等难点,直接分析自然状态下的蛋白质的结构直接模拟出:蛋白质的空间结构、蛋白质与辅基和底物结合的情况酶催化的动态机理有效地分析蛋白质的突变蛋白质的分子结构蛋白质的一级结构 ( primary structure)多肽链的氨基酸残基的排列顺序蛋白质二级结构( secondary structure) 多肽链借助于氢键沿一维方向排列成具有周期性的结构的构象,是多肽链 局部的空间结构(构象),主要有a —螺旋、B —折迭、转角等超二级结构 ( supersecondary structur)e 相邻的二级结构单元组合在一起,彼此相互作用,排列形成规则的、在空 间结构上能够辨认的二级结构组合体,充当三级结构的构件( block building ) , 基本形式:aa、[3ap和等。

      结构域 ( domain) 在超二级结构的基础上形成的,通常由 50-300AA 残基组成, 在三维空间可以明显区分和相对独立,具有一定的生物功能 结构域的亚单位: 模体或基序 ( motif ) ,三级结构 ( tertiary structure) 整条多肽链的三维结构,包括骨架和侧链在内的所以原子的空间排列四级结构 ( quaternary structure) 在亚基和亚基之间通过疏水作用等次级键结合成为有序排列的特定的空间 结构亚基通常由一条多肽链组成,有时含两条以上的多肽链,单独存在时一 般没有生物活性第二节 蛋白质结构测定1. 一级结构测定或蛋白质顺序分析:(1) 应用化学裂解法和蛋白酶水解法将多肽链专一性裂解;(2) 逐一测定每个纯化的小肽段的顺序;(3) 根据肽段氨基酸顺序中的重迭区确定小肽段的排列次序;(4) 完成整条多肽链的顺序分析从cDNA或基因序列直接推导出蛋白质的氨基酸顺序,已成为最常用的测定蛋白质一级结构的方法2. 蛋白质三维结构测定(1) 测定晶体中的蛋白质分子构象:X射线晶体衍射图谱法(X-ray crystallography),中子衍射法;(2) 测定溶液中的蛋白质构象:核磁共振法(nuclear magnetic resonance NMR )、园二色性光谱法、激光拉曼光谱法、荧光光谱法、紫外差光谱法和氢同位素交换法等。

      X射线晶体衍射的基本原理 X射线晶体衍射法测定结果可靠但,在晶体中的蛋白质分子构象是静态的不能测定不稳定的过渡态的构象很多蛋白质很难结晶,或者很难得到用于结构分析的足够大的单晶核磁共振核磁矩不为零的核,在外磁场的作用下,核自旋能级发生塞曼分裂(Zeeman splitt in g) ,共振吸收某一特定频率的射频(radio freque ncy, RF )辐射的物理过程NMR法不需要制备蛋白质晶体,仅限于分析长度不超过150AA残基的小蛋白其它方法很难获得蛋白质分子完整的三维结构,在应用上存在较大的局限性第三节 蛋白质结构预测生物信息学的基本观点 : 分子的结构决定分子的性质和分子的功能因此,生物大分子蛋白质的空间 结构决定蛋白质的生物学功能蛋白质的空间结构又是由什么决定的呢? 当一个蛋白质的空间结构被破坏以后,或者蛋白质解折叠后,可以恢复其自 然的折叠结构 ( native structure) 大量的实验结果证明: 蛋白质的结构由蛋白质 序列所决定虽然影响蛋白质空间结构的另一个因素是蛋白质分子所处的溶液 环境,但是,决定蛋白质结构的信息则是被 编码于aa序列之中问题? 这种编码是否能被破译呢?或是否能够直接从aa序列预测出蛋白质的空间结构呢?是否可预测蛋白质结构?? ? 从数学上讲,蛋白质结构预测的问题是寻找一种从蛋白质的氨基酸线性序 列到蛋白质所有原子三维坐标的映射。

      典型的蛋白质含有几百个aa上千个原子, 而大蛋白质(如载脂蛋白)的aa个数超过4500所有可能的序列到结构的映射数 随蛋白质aa残基个数呈指数增长,是天文数字然而幸运的是,自然界实际存在 的蛋白质是有限的,并且存在着大量的同源序列,可能的结构类型也不多,序 列到结构的关系有一定的规律可循因此,蛋白质结构预测是可能的蛋白质结构的预测问题 ,也称为 蛋白质折叠问题 随着人类步入对基因组的诠释评估与功能解析的后基因组时代,蛋白质结构预 测自然就成为了计算生物学中的“ 圣杯” Why ???矛盾??? 蛋白质结构的试验测定费时费力,成功率非常有限,而未知 结构的蛋白质分子数量非常庞大解决办法 分子模拟方法用于蛋白质结构预测概念:依据蛋白序列信息,预测蛋白质中每个原子在三维空间中的相对位置 驱动因素:对结构知识的了解相当有限,实验确定蛋白质结构的过程非常缓慢,大量 的蛋白质结构不能通过实验方法测得数据库(PDB)中的结构数据&序列数据是蛋白质结构预测的主要驱动 因素之一已收录约55 000多个,增速每两年40%】结构的认识有利于进一步认识蛋白质的功能 S-fcrac k arc Ha.4 n [FEE) Ita 1a [Swi-c-G- Ft o l)200000JSDDCI■Hmk)有助于合理的设计药物(药物分子根据它作用的蛋白质分子的 结构来设计)。

      预测方法第一类 假设蛋白质分子天然构象处于热力学最稳定,能量最低状态,考 虑蛋白质分子中所有原子间的相互作用以及蛋白质分子与溶剂之间的相互作 用,采用分子力学的能量极小化方法,计算出蛋白质分子的天然空间结构 但遇到在数学上难以解决的多重极小值问题第二类 是利用存入蛋白质数据库的数据进行预测相比,基于同源性的重 复循环技术,非常可靠地灵敏地进行结构预测找出数据库中已有的蛋白质的 空间结构与其一级序列之间的联系总结出一定的规律,逐级从一级序列预测二级结构,再建立可能的三维模型,根据总结出的空间结构与其一级序列之间的 规律,排除不合理的模型,再根据能量最低原理得到修正的结构 但逐级预测 受到二级结构预测精度的限制即有:基于已有知识的预测方法或模板依赖模型 (template-based modeling)比较建模法 (或同源模型 )折叠识别法 (或穿线法 )从头预测 (ab initio) 或称自由模型 (free modeling)基本方案♦根据对天然蛋白质结构与功能分析建立起来的数据库里的数据,预测一定 aa 序列肽链空间结构和生物功能;♦根据特定的生物功能,设计蛋白质的aa序列和空间结构。

      通过基因重组等实验 直接考察分析结构与功能之间的关系;♦通过分子动力学、分子热力学等, 根据能量最低、同一位置不能同时存在两个原子等基本原则,分析计算蛋白质分子的立体结构和生物功能7结构预测流程Proteinsequence ►Database similarity searchPre diethree dimensional structure3D comparative modelingnoProtein 曲m订y, domain, cluster analysisStructural analysiss nmetrueture佃 inn-Wknowntrurtui'esequencealign withktunvn 3Dtructui'e?protein of8#一.基于已有知识的预测方法同源建模方法 (Homology Modeling ): 比较建模法 (comparative modeling method)Or 同源模型化根据大量已知的蛋白质三维结构来预测序列已知而结构未知的蛋白质结构,、是基于知识的蛋白质结构预测方法,= 称同源结构预测若待模型构建蛋白质的序列与模板序列经比对(alignment),序列同源性(sequenee identit》在40% (或35%)以上,'则它们的结构可能属于同一家族,"它们是同源蛋白(homology),主要思想 对于一个未知结构的蛋白质—通过序列同源分析找到一个已 知结构的同源蛋白质—以该蛋白质的结构为模板,为未知结构的蛋白质建立 结构模型。

      前提 必须要有一个已知结构的同源蛋白质通过搜索蛋白质结构数据库来完成理论基础 如果两个蛋白质序列在80个以上残基的序列比对中显示出25% (30%)的一致性,那么这两个蛋白质就具有相似的结构 ~~相似性原理模板结构 与目标蛋白质U (Unknown)的序列非常相似的已知结构蛋白质 原理蛋白质三级结构远比一级结构保守,因此即使蛋白质序列有明显差别, 它们的功能仍然可能非常相似同源性比较—序列比对—发现蛋白间的进化关系,发现序列保守模式或突变模式―这些序列模式中包含着三维结构信息―可预测 10、30%蛋白质的结构可以用同源蛋白模型构建的方法预测未知蛋白质三维结构 Why?它们可能由同一种蛋白质分化而来,具有相似的空间结构,相同或相近的功能若知道了同源蛋白家族中某些蛋白质的结构,就可以预测其它一些序列已知而结构未知的同源蛋白的结构 怎样做?1. 目标蛋白序列与目标序列的匹配:应用FASTA或BLAST搜索软件,\在 PIR、SWISSPROT 或 GENEBANK 等序列库中按序列同源性挑选出一些同源性比较高的序列, 将挑选出的序列与目标序列基序多重匹配, 得到模板结构等价位点套的初始集合2. 根据模板结构构建目标蛋白结构模型:在已确定的模板结构等价位点套的初始集合的基础上,旋转每一个模板的结构,使它们相互间的位置尽可能多地重迭在一起。

      不同两个模板在空间中若复合一定的重迭距离标准,则它们相互之间的关系就是等价位点许多这样的等价位点构成了等价位点套▼完成迭合后,即得到:同源蛋白的结构保守区(SCRs),相应的基架结构(framework)▼模板结构匹配后,用得到的同源体的SCRs的第一条序列与目标序列匹配,挑选出目标序列上的高相拟区— 目标蛋白的SCRs构建目标蛋白结构模型的软件:Homology、UQANTA/CHARM、COMPOSER、CONSENSUS、MODELLER 和 Collar extension等3. 优化和评估模建结构基序:同源结构模建(预测)得到的蛋白质结构模型,•含有一些不合理的原子间接触,要对模型进行分子力学和分子动力学优化,消除模型中不合理的接触•模型中有些键长、键角和二面角也有不合理性,用PROCHECK和PROSA II等软件检查评估♦♦要求•确认一条或更多与靶序列有明显相似性的模板结构•确认合适模板可以通过搜索结构数据库来完成 •相似性的检测以序列的一致性或者统计学方法来实现量化♦ ♦当然,更多的结构模板,能提高预测的准确性 多重序列比对,模板结构叠加,建立模型形成核心( core f。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.