好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

植物血红蛋白基因家族的分子进化研究.docx

25页
  • 卖家[上传人]:杨***
  • 文档编号:293872753
  • 上传时间:2022-05-17
  • 文档格式:DOCX
  • 文档大小:59.04KB
  • / 25 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    •     植物血红蛋白基因家族的分子进化研究    齐小琼+王艇Summary: 植物血红蛋白 (Hemoglobin) 是一类由珠蛋白 (Globin) 和血红素 (Ferroheme) 组成的结合蛋白,广泛存在于植物界中根据序列特征、表达模式及配基结合性质可将血红蛋白分为共生血红蛋白 (Symbiotic hemoglobin, sHb)、非共生血红蛋白 (Nonsymbiotic hemoglobin, NsHb) 和截短的血红蛋白 (Truncated hemoglobin, tHb) 3大类,并对植物血红蛋白基因家族进行了分子系统发育分析和进化研究结果表明,通过基因重复在被子植物中产生了class 1和class 2两类血红蛋白基因该基因重复发生在单、双子叶植物分化之前,但由于class 2类基因在单子叶植物中发生了一次基因丢失事件,致使class 1类基因广泛分布于单、双子叶植物中,而class 2类基因则仅见于双子叶植物;class 2类基因的进化速率高于class 1类基因,并分别在class 2、sHbs的祖先支上检测到了正选择的发生,表明基因重复发生后,class 2、sHbs通过插曲式进化和适应性进化获得了不同的功能;在class 1和class 2的功能性分歧位点检测中获得14个I类功能性分歧位点,但未能发现II类功能性分歧位点,这些功能性分歧位点是由正选择作用或者放松的选择限制产生的。

      该研究结果可以指导后续的试验工作,来验证那些具有重要功能的氨基酸置换位点和正选择位点,从而揭示功能性分歧和适应性进化的分子基础Key:血红蛋白基因;基因家族;分子进化分析;适应性进化;功能性分歧:Q37 :A :0439-8114(2014)18-4447-10根据序列组成、表达模式以及配体结合性质等特点,植物血红蛋白可分为共生血红蛋白(Symbiotic hemoglobin, sHb)、非共生血红蛋白 (Nonsymbiotic hemoglobin, NsHb) 和截短的血红蛋白(Truncated hemoglobin, tHb) 3大类其中,根据与氧的亲和力和序列的相似性,NsHb又可分为NsHb1和NsHb2两大类系统发育分析表明,植物血红蛋白通过基因重复事件在被子植物中产生了class 1和 class 2两大类基因[1-5],其中class 1类由NsHb1组成,class 2类由NsHb2和sHb组成;而class 1和class 2中均不包含tHb,tHb是通过基因水平转移从细菌中获得[6],与植物中的NsHb和sHb形成了不同的进化谱系研究表明,class 1类基因广泛存在于被子植物中,而class 2类仅见于双子叶植物中,迄今为止没有在单子叶植物中发现。

      因此,对于class 2类基因在植物中的分布范围还没有确定——该类基因在单子叶植物中是缺失的还是普遍存在或是仅存在于部分支系中由于数据较少而没有检测到目前有两种可能的解释:①基因重复在单、双子叶分化之前就已经发生,但是class 2类基因在单子叶植物中丢失了;②基因重复只在双子叶植物中发生,即发生了双子叶植物特异性的重复事件,该过程不涉及单子叶植物[7]显然第二种假说更简约,但要验证这两个假说,需要更多单子叶植物基因组的序列数据及对基因重复和单、双子叶分歧发生时间的正确估算、综合分析判定针对基因家族成员在基因重复之后的功能分化,Ohno[8]提出了重复-保留-非/新功能化 (Duplication-Retention-Non/Neofunctionlization, DRNNF) 模型,Hughes[9]提出了蛋白质亚功能化 (Subfunctionalization, SF)模型,Force等[10]提出了DDC模型对于植物血红蛋白基因的两个拷贝,均在进化过程中保留了下来且具有了不同的功能,发生了功能性分歧针对基因重复发生后,class 1、class 2类基因发生的功能性分歧,有两个不同的假说可以解释:①基因重复之后,一个重复基因的功能被选择性的保留,另一个基因逃脱了选择限制而获得了新的功能[8-12];②基因重复发生之后,一个重复基因通过适应性进化获取了新的功能[13]。

      研究表明,正选择仅发生在特定时间、个别支系、蛋白质的某些位点,因此特定的正选择信号很容易被大量的负选择及中性选择信号所淹没[14],如果检测方法不当,很难检测到随着研究的深入,越来越多物种的血红蛋白序列被测定,尤其是对古老陆生植物中血红蛋白基因的研究,推断出血红蛋白祖先基因的序列特征、表达模式、三级结构、配体结合特征及进化样式等[15],为该基因家族进化研究奠定了基础但是对于被子植物血红蛋白基因重复发生所涉及的物种范围,尤其是class 2类基因在植物中的存在状况及共生血红蛋白基因的来源问题等都没有很好的解答,还需选取更多代表被子植物各分类群的血红蛋白基因序列,通过分析血红蛋白基因在这些物种中的存在状况、序列组成、基因结构等特征,阐明该基因家族在不同分类群中的进化特征和进化趋势,并进一步通过分子进化分析的各种方法从时间尺度和空间尺度阐释该家族基因在陆生植物中的起源和进化样式本研究从GenBank数据库中选取尽可能多的被子植物NsHb和sHb基因序列,通过密码子使用分析、相对进化速率检测、适应性进化分析、基因重复发生时间的估算、功能性分歧分析等,来初步确定基因重复涉及的物种范围;阐明在该基因重复早期是放松的选择限制还是正选择作用起主导作用,同时进一步鉴定发生选择限制改变或者氨基酸性质改变的功能性分歧位点;阐明植物血红蛋白的系统发育关系和进化样式及基因重复发生之后的选择压力变化情况,并且进一步鉴定出正选择位点。

      1 材料与方法1.1 序列数据的收集和选取用拟南芥(Arabidopsis thaliana)的AHB1和AHB2基因(登录号:AAD26949, AAB82770) 的蛋白序列作为查询序列,从GenBank数据库中搜索尽可能多的被子植物NsHb和sHb基因序列endprint1.2 序列比对和系统发育分析将血红蛋白核苷酸序列翻译成氨基酸序列,经MEGA 4.0软件[16,17]对位排列,再根据氨基酸对位排列结果进行核苷酸序列对位排列对位排列的结果根据需要进行手工校正,将分歧度很大的区域或者空格等从比对中移除,以免产生比对的不确定性采用ModelTest软件[18]确定GTR+I+G为最适的核苷酸置换模型;利用PHYML[19]软件,根据最大似然法(Maximum likelihood, ML)构建系统发育树,并进行了1 000次的Bootstrap检验1.3 同义密码子使用偏好性分析采用CodonW程序(http://bioweb.pasteur.fr/seqanal/interfaces/codonw.html)计算有效密码子数 (ENC)[20],最优密码子频率(FOP)[21],密码子适应指数(CAI)和同义密码子第三位上的G+C含量 (GC3s),并且检测同义密码子使用偏好性在每个基因间的差异。

      1.4 相对进化速率检测采用RRTree软件[22]计算基因重复形成的不同亚家族在进化过程中的置换速率,并比较它们之间的差异,计算时以苔藓植物小立碗藓 (Physcomitrella patens)和角齿藓(Ceratodon purpureus)中的血红蛋白基因作为外类群1.5 基因重复的时间估计根据系统发育构建的ML树将所研究的植物分为class 1和class 2两个类群采用BEAST软件包中自带的Uncorrelated Lognormal Distributed (UCLD) Relaxed Clock模型估算ML树上每个节点的分歧时间[23]主要分支的分歧时间根据最近共同祖先的时间 (tMRCA) 值来进行校正最适的核苷酸置换模型采用Modeltest确定的GTR+I+G模型,总共迭代计算60 000 000代,每1 000代保存1株样本;最后选用Tracer v1.4.1软件[24]检测收敛程度计算时把最初获得的15 000株老化样本去除,采用剩余样本重建时间尺度下的发育树1.6 适应性进化分析将系统发育分析得到的ML树分为3个分析组——1个大数据组 (全部58个序列组成) 和两个小数据组 (分别仅含class 1或class 2中的全部序列),采用PAML 4分析方法中的3类模型:分支模型[25]、位点模型[24,26]以及分支-位点模型[14,27]进行分析,序列位点处理采用cleandata=0进行设置。

      在分支模型中,分别进行了单比率(One-ratio) 和二比率(Two-ratio)模型分析在二比率模型设置中,为了检测class 1和class 2是否存在差异,假定class 2有着不同的ω值,即在大数据组中设定:(Outgroup#ω0,NsHb1#ω0,NsHb2#ω1,sHb#ω1,#ω1,#ω0);为了检测共生的血红蛋白与非共生血红蛋白的差异,假定sHbs有着不同的ω值,即在仅含有class 2的小数据组中设定:(NsHb2#ω0, sHb#ω1)分别将这些二比率模型同其相对应的单比率模型比较,进行似然比检验(LRT),分析所得结果位点模型分析时将class 1和class 2单独组成的两个小数据组分别进行,采用了三对模型M1a (近中性模型)和M2a(正选择模型),M0(单比率模型)和M3(离散模型),M7(beta 模型)和M8(beta & ω模型),并进行似然比检验模型M8a(beta &ω=1)同M8类似,只是将ω值固定为1,比较模型M8和M8a可以大大降低假阳性分支-位点模型可以检测出在特定支系上的特定位点上存在的正选择本研究采用该模型分别检测在class 2和sHbs的祖先分支上的正选择位点,因此运用大数据组将class 2的祖先支作为前景支,运用小数据组class 2将sHbs的祖先支作为前景支。

      model A设为:model=2,NSsite=2,fix_omega=0;model A1 设为:model=2,NSsite=2,fix_omega=1,omega =1将model A和model A1进行LRT1.7 功能性分歧分析为了研究基因重复发生之后各重复基因的功能性分歧及结构差异,采用Gu[28,29]提出的方法计算class 1和class 2之间的两类功能性分歧系数(θI和θII),通过DIVERGE v2.0软件包[30]实现第一种类型(type I)的功能性分歧氨基酸位点具有如下特点:它们在一个亚组中非常保守,而在另一个亚组中高度可变,反之亦然[28,31-33]可能暗示这些残基经历了改变的功能限制而导致了位点特异的速率差异;而第二种类型(type II) 的功能性分歧位点分别在两个亚组中都非常保守,但是它们的生物化学性质差别很大,因此导致了成簇特异的氨基酸性质的转换(Shift of cluster-specific amino acid property),例如正电比负电,暗示着这些残基可能有助于使不同亚组的功能实现特化[29]如果通过计算得到θI>0或者θII>0,并且具有统计显著性,那么就说明基因重复之后发生了位点特异的选择限制的改变或者氨基酸性质的巨大转变。

      2 结果与分析2.1 序列相似性搜索和多序列比对结果通过序列相似性搜索,从被子植物中获得了48个物种58条血红蛋白序列其中,有56条是完整的编码区序列,还有2条是部分编码区序列从表1中可以看出,大部分蛋白质序列都是由150个左右的氨基酸所组成;但蓖麻(Ricinus communis) 的NsHb比其他序列要长很多,含有537个氨基酸,其也包含保守的血红素结合位点(Heme-binding site),但是在5端含有一段序。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.