电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

(毕业设计论文)《用高斯网络研究麦芽糖结合蛋白的构象转变》

23页
  • 卖家[上传人]:zhuma****mei1
  • 文档编号:54411486
  • 上传时间:2018-09-12
  • 文档格式:DOC
  • 文档大小:1.17MB
  • / 23 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、用高斯网络研究麦芽糖结合蛋白的构象转变摘 要 随着人类基因组计划的顺利完成,以功能基因组学和蛋白质组学为主要研究内容 的后基因组时代已经到来。从蛋白质一维序列预测其三维结构,进而从三维结构预测其生 物学功能是蛋白质组学研究的重要组成部分。本文首先简单介绍了蛋白质以及蛋白质折叠 的几种简化模型。然后又介绍了高斯网络基本原理,并研究了麦芽糖结合蛋白选取不同截 段半径时 open-apo 和 closed-ligan 两个结构的构象转变。 关键词 蛋白质功能; 蛋白质折叠; 简化模型; 计算机模拟; 高斯网络模型 1 蛋白质和蛋白质折叠1.1 蛋白质的结构和功能蛋白质是一切生命的物质基础,是肌体细胞的重要组成部分,是人体组织更新和修补的主要原料,没有蛋白质就没有生命。蛋白质是由 20 多种氨基酸组成,以氨基酸组成的数量和排列顺序不同,使人体中蛋白质多达 10 万种以上。它们的结构、功能千差万别,形成了生命的多样性和复杂性。蛋白质在生命活动中发挥着重要的生物学功能,任何一个生命体的繁衍、新陈代谢、运动等等,都需要数十亿蛋白质的协调行动才能得以顺利进行。为了执行特定的生物功能,每一个蛋白质分子都

      2、有一个独特的三维结构,而蛋白质的功能很大程度上依赖于其空间结构。蛋白质形成特定的结构才能执行特定的功能1。一旦蛋白质的空间结构发生了变化,蛋白质就失去了它应有的功能,将会对生物体的生命活动产生很大影响。1.2 蛋白质折叠的定义蛋白质是生命活动的主要承担者,对其结构与功能的研究具有重要的意义。所有蛋白质都是由一维的氨基酸序列形成特定的三维结构后,才能发挥正确的生理功能。但如何由蛋白质的氨基酸序列预测其三维结构,是一个仍未解决的问题,称为“蛋白质折叠” 2。蛋白质折叠是一个涉及分子生物学、物理、化学的交叉领域。分子生物学中心法则的概念和框架建立起来,即DNA RNA 蛋白质。“一维线性观点”3曾渗透到分子生物学的许多方面。但是,蛋白质只有折叠成特定的空间结构后,才能发挥其生物功能。特别是起催化作用的各种酶,往往需折叠成接近球形的特定形状,才能发挥作用。蛋白质折叠不对甚至还会导致病变。疯牛病就是一种蛋白质折叠病。生物学提供了明显的例子,表明一维遗传信息的存储和处理都不是简单的一维的。1.3 蛋白质折叠机制模型许多学者根据各自研究对象的折叠规律,提出了一些蛋白质折叠的模型,在此我们简单介绍以下

      3、几种:(1) 成核/快速生长模型 (The Nucleation/Rapid Growth Model)11伸展多肽链开始折叠时,多肽链上先形成许多小的“核” (Nuclei),这些小核由818 个氨基酸残基组成,它们随机波动很不稳定。多肽链的其它部分以“核”为模板,快速折叠“生长”,最终形成天然构象。在这个模型中,成核阶段(Nucleation) 是限速步骤。折叠核被认为是由一些关键的在进化中保守的残基接触形成的。(2) 扩散碰撞缔合模型 (The Diffusion-Collision-Adhesion Model)12这一模型认为预先形成的较大的二级结构单元通过随机扩散和碰撞组装成整个的折叠结构。多肽链在折叠起始阶段迅速形成一些类天然结构或称“微结构域” (Micro-Domain),如-helices,-strands 等,这些结构在伸展的多肽链中不稳定,它们之间相互碰撞、相互作用而结合在一起时,如果组装是有利的,这些“微结构域”就稳定下来,多肽链进一步折叠形成天然构象。(3) 框架模型 (The Framework Model)13在多肽链折叠过程中,先迅速形成二级结构,二级

      4、结构的形成通常先于三级结构的形成,并且是独立的。多肽链在二级结构的基础上再进行组装,形成三级结构。这个模型认为,即使是一个小蛋白也可以一部分一部分地进行折叠,其间形成的亚结构域 (Sub-Domain) 是折叠中间体的重要结构。(4) 快速疏水坍缩折叠模型 (The Rapid Hydrophobic Collapse Model)14与以上模型相比,它强调了蛋白质折叠的主要驱动力为疏水效应。疏水坍缩模型认为蛋白质折叠的初始阶段是分子坍缩。伸展多肽链处在极性的水溶液环境中,其疏水侧链基团为避开极性环境而将非极性残基埋藏在蛋白质分子里面,导致多肽链快速折叠,形成“熔球体” (Molten Globule),然后形成二级结构及特殊相互作用,再进一步折叠形成天然构象。2 蛋白质功能性运动的计算机模拟方法结构生物学中一个普遍的规律是:蛋白质序列决定蛋白质结构,蛋白质结构决定蛋白质功能。要想理解蛋白质发挥生物学功能的内部机制,仅仅知道其结构信息是不够的,还必须知道其动力学信息。为了理解蛋白质功能,进而控制和改造蛋白质功能,迫切需要发展有效的计算方法和技术,从蛋白质结构中获取与功能相关的动力学信息

      5、。蛋白质的各种运动跨越了非常大的时间尺度,共价键的振动时间尺度为 10-15秒,而蛋白质功能性运动时间尺度为毫秒、秒量级甚至更长。蛋白质的运动包括非常精细的局部结构变化以及大幅度的整体构象转变。蛋白质的功能性运动是大时间尺度的、大幅度的、涉及大的构象变化的一种运动形式。比如:对于离子输运蛋白、信号传导蛋白、免疫系统中的蛋白以及大量的酶等,它们在发挥生物学功能时都需要整体大的构象变化。分子动力学模拟和正则模分析及其简化方法是研究生物大分子动力学性质最常用的方法。2.1 分子动力学模拟早在上世纪 70 年代末,分子动力学模拟(MD)已经被用于生物大分子的热力学和动力学性质的研究中11。MD 模拟是在原子水平上,用经典的牛顿力学方程描述分子的运动过程,它不仅能得到原子的运动轨迹,对于平衡系统,还可以用 MD 模拟作适当的时间平均来计算一个物理量的统计平均值。对于一个非平衡系统的热力学过程,可以对发生在一定时间尺度内的物理现象进行直接模拟12。特别是许多微观细节,在实际实验中无法获得,而在 MD 模拟中都可以方便地观察到。对于 MD 模拟而言,最重要的两个因素是初始状态的给定和原子间相互作用势

      6、的确定13。原子的初始位置尽可能的选择体系的平衡位置,构象上的不合理可以通过能量优化来去除,原子的初速度是满足一定温度下的麦克斯韦分布。影响结果准确性的最主要因素是原子间作用势的精确度。目前,MD 模拟的势能函数的一般形式包括成键项和非键项,其中,成键项包括键长能、键角能、二面角能(正常二面角能和非正常二面角能) ,非键项包括范德华相互作用和静电相互作用,有的能量函数还包括氢键项。用于生物大分子模拟的著名力场有:AMBER14、CHARMM15、GROMOS11等。这些力场共同的局限性有以下几点:首先,力场参数无法做到非常精确,这直接影响到结果的准确性,力场参数的优化是一项艰巨的任务。其次,势函数中的静电项采用了固定电荷近似,通常忽略了极化效应。最后,这些力场中没有体现熵的效应。这些都将影响计算的精确度。虽然 MD 模拟在蛋白质动力学研究中得到了广泛应用,但是,采用该方法来研究蛋白质功能性运动却受到一定的局限。主要体现在以下两点:其一,MD模拟中积分步长的选取是由体系的高频运动所决定的,通常只能取在飞秒的时间量级,这就使得 MD 模拟非常耗时,现有的计算机能力限制着大体系、大尺度问题的

      7、研究。其二,MD 模拟中所采用的势函数的势能面并不是光滑的,存在很多的局部极小,在给定的温度下,需要长时间的热力学弛豫平衡才能采样到新的范围,因此采样空间受到限制。 2.2 正则模分析及其简化方法由于 MD 模拟计算量巨大,耗费很大的计算资源,迫切需要发展一种从结构获取动力学信息的合理有效并且计算简便的方法。正则模分析(NMA)及其简化方法,包括弹性网络模型(EN) 、高斯网络模型(GNM) 、各向异性网络模型(ANM) ,在研究这种问题中显示出强大的优势。上世纪 80 年代,正则模分析开始应用于蛋白质领域的研究15。最近,通过NMA 方法从蛋白质天然结构获得其集合运动模式,发现这种集合运动具有很高的鲁棒性 (robust),并且是与功能紧密联系的12。从此,NMA 在结构生物学研究方面显示出了强大的优势,被广泛应用开来。生物大分子在溶液中的实际运动形式是非常复杂的,包含无穷多构象之间的相互转换,但是,在天然态附近的运动却是简单并且鲁棒的,其运动模式是由其拓扑结构所决定的。NMA 方法正是基于这一事实,从蛋白质的天然拓扑结构出发,得到其功能相关的运动模式。蛋白质只有折叠到其天然结构,才

      8、能发挥其特定生物学功能,并且其特定的生物学功能是通过其特定的运动形式表现出来。因此,可以认为蛋白质天然结构蕴含着其功能相关的特定的动力学信息,而 NMA 正是提取该信息的有效方法12。正则模分析的基本思路是10,蛋白质分子存在两种运动方式:一种是局部快运动,即每一个原子在其平衡位置附近的高频运动,这种运动方式可以近似为简谐振动。另一种是集合慢运动,为分子内局部基团平移、旋转或表现为大范围的集合低频运动,这种运动方式是与功能相关的,并且集合慢运动可视为高频谐振动的叠加。基于上述近似,原子间相互作用势函数可在平衡位置附近展开为二次谐振函数,在此基础上可计算体系的简正运动模式,集合慢运动可通过简正模式的叠加得到。NMA 的计算步骤如下:选择合适的力场,获得原子间相互作用势函数表达式,并对体系做能量优化;对体系能量函数求二阶偏导,得到 Hessian 矩阵;对角化 Hessian 矩阵,得到本征值和本征向量,本征向量描述的就是体系的简正模式,相应的本征值就是该简正模式频率的平方;得到原子在平衡位置附近的运动方程, (2.2)其中,为原子 的质量;和为第个运动模式的振幅和相位,它们的数imikC

      9、kk值由初条件来确定; 为第个运动模式的频率;为第个本征2/kkkikak向量中的第 个元素;求力学量平均值。iTirion 用谐振势函数来代替传统 NMA 方法中采用的经典力场,简化了计算,提出了弹性网络(EN)模型13。在该模型中,势函数表达式为:(2.3)其中,为原子 与之间的距离;为其平衡距离(天然结构中的距离) ;ijdij0 ijd是弹性系数,并且假定所有原子对之间的弹性力常数相同;为截断半径,ccR当原子间距离小于时,它们之间存在相互作用,当原子间距离大于时,认cRcR为它们之间没有相互作用。采用这样的相互作用势时,把蛋白质天然态作为计算的初始结构,并不需要对它做能量优化,认为天然态的结构能量是最低的(等于零) 。该方法避免了传统 NMA 方法中耗时并且不太精确的能量优化。研究表明,该方法能够很好的获得体系的慢运动模式,精度与传统的 NMA 方法相当。正则模分析及其简化方法被广泛应用于蛋白质结构-功能关系的研究,取得了很大的成功,显示出了较大的计算优势。比如,在柔性分子对接中的应用14;)cos(1)(3kkNkikk iitaCmtr cijRdijijpddcE020)(应用到低温电子显微技术(cryo-EM)中,有助于从低分辨结构获得高分辨结构15;用来分析生物大分子的功能性运动13;用来寻找蛋白质功能位点13;与分子动力学结合提高采样效率12;分析不同蛋白质家族的结构及动力学特征13;以及用来划分蛋白质结构域13等等。目前已经有很多网上服务器和蛋白质运动的数据库可供使用和查询,比如iGNM、ProMode、ElNemo、WEBnm、MolMovDB 等。3 用高斯网络研究麦芽糖结合蛋白的构象转变3.1 引言革兰氏阴性菌的细胞包膜包含外膜、内膜和它们之间的细胞外液空间。外膜是半通透性的,其主要功能是保护细胞并阻止大分子的进出。细胞外液空间包含大量的小分子传导系统。内膜上包含大量的小分子传导蛋白,能够把细胞外液的小分子运输到细胞内。大肠杆菌小分子输运系统由细胞外液空间的小分子专一性结合蛋白和细胞内膜上的膜蛋白构成。目前,公认的转运机理是

      《(毕业设计论文)《用高斯网络研究麦芽糖结合蛋白的构象转变》》由会员zhuma****mei1分享,可在线阅读,更多相关《(毕业设计论文)《用高斯网络研究麦芽糖结合蛋白的构象转变》》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.