
芋扩展蛋白基因家族的全基因组鉴定及其在球茎膨大中的表达分析.docx
10页芋扩展蛋白基因家族的全基因组鉴定及其在球茎膨大中的表达分析 李必聪,李慧英,肖 遥,罗 莎,周庆红,黄英金,朱强龙,*(1.江西农业大学 农学院,江西 南昌 330045; 2.江西省薯芋生物学重点实验室,江西 南昌 330045)扩展蛋白(expansin)是一类广泛存在于各种植物细胞壁中的伸展蛋白,已被普遍认为是植物细胞生长过程中细胞壁延伸的关键调节因子[1]芋球茎膨大与其细胞生长和细胞壁延伸密切相关因此,深入研究芋扩展蛋白基因家族可为芋球茎的生长发育、增产提质以及优良新品种选育提供理论依据扩展蛋白长度一般为250~275个氨基酸(aa),由两个主要的功能结构域(DPBB_1和Pollen_allerg_1)和氨基末端的一个信号肽组成,信号肽的长度通常为20~30个aa[2]扩展蛋白基因家族可以根据其系统发育关系划分为EXPA、EXPB、EXLA和EXLB共4个亚家族(也称α、β、γ和δ亚家族)[3],其中EXPA和EXPB亚家族主要功能是促进植物细胞壁的伸展,并参与其他生长发育过程和抗性,但是关于EXLA和EXLB两个亚家族功能研究较少,尚未有明确的实验证据发现它们有增加细胞壁柔韧性的作用[2]。
自1992年McQueen-Mason等[4]首次发现黄瓜幼苗细胞壁的粗蛋白提取物具有诱导离体细胞壁扩张的能力,从而鉴定出2个扩展蛋白以来,随着各种植物的基因组测序数据的不断完成与发表,在越来越多的物种中鉴定出了扩展蛋白,如早期在拟南芥中鉴定到36个扩展蛋白基因、水稻有58个[2],玉米有88个[5]、大豆有75个[6]、番茄有38个[7]、烟草有52个[8]、马铃薯有34个[9]、冬枣有30个[10]、毛竹有82个[11]、茶树有40个[12]和油菜有109个[13]等,为进一步深入研究扩展蛋白功能奠定基础扩展蛋白基因在植物的许多发育过程中都发挥重要作用,如对地下根茎的调控作用,在马铃薯中发现StEXPA7和StEXPA8在幼小的膨大块茎中具有较高的基因表达水平,可能在马铃薯早期的块茎发育中发挥重要作用[14];蔡兆琴等[15-16]发现,扩展蛋白基因IbEXPA2参与甘薯块根生长膨大调控,而IbEXPA4可以促进块根的纵向生长和横向生长对植物细胞生长的调控作用,Lv等[17]的研究表明,分别存在3个、9个和2个扩展蛋白基因在棉花纤维细胞发育的起始阶段、快速伸长阶段和纤维生长的过渡阶段发挥重要作用;也有研究发现,AtEXPA10和PnEXPA1的转基因烟草植株与野生植株相比,其叶片、茎干和花朵显著增大,显微观察结果表明,膨大器官受细胞增殖刺激所致,且对PnEXPA1基因的过表达也会激活细胞扩增过程[18]。
对植物细胞壁的调控作用,Wei等[19]研究发现,拟南芥中的AtEXPA1基因可以通过改变保卫细胞的细胞壁结构来调节气孔的开放;在中药材三七直根发育的研究中发现,PnEXP15、PnEXP17、PnEXP22和PnEXP24可能通过参与调控细胞壁松弛来促进其主根的膨大[20]芋[Colocasiaesculenta(L.)Schott]是天南星科家族中的一员,也是世界上最古老的作物之一,以其重要的食用、药用和经济价值而广受人们的喜爱[21]据FAO(联合国粮食及农业组织)最新统计数据显示,2021年全球芋头产量超过1 200万t,是世界第五大根茎类农作物,其中我国大陆地区的芋头年产量为160多万t,仅次于尼日利亚,是世界第二大芋头产出国2021年已经公布的芋全基因组测序数据[21]为进一步深入研究芋扩展蛋白基因家族的进化和功能特征奠定了重要的研究基础芋头作为重要的非谷类粮食作物,其球茎富含易消化的淀粉颗粒且能量值高,并含有钾、磷、镁、锌和铁等对身体有益的微量元素[22-23],对于全球粮食安全起到重要的调节作用但与产量直接相关的球茎(芋头)形成分子机理研究鲜有,而在马铃薯[9]、甘薯[15]、萝卜[24]、葛根[25]等同为根茎类作物的扩展蛋白基因的研究已经比较深入了,所以对芋中的扩展蛋白基因进行系统而深入的研究具有重要意义。
本研究基于芋全基因组测序数据,对芋扩展蛋白基因家族进行筛选鉴定,从基因结构特征、蛋白理化特性、系统发育进化、基因共线性关系、基因转录表达模式及实时荧光定量PCR(qRT-PCR)验证等方面对芋扩展蛋白基因家族的特征特性、系统进化及其在球茎膨大中的分子功能进行分析,为进一步研究扩展蛋白在芋球茎膨大发育等生物学过程中的功能奠定基础1 材料与方法1.1 芋扩展蛋白基因家族成员的鉴定与结构分析为获得全部的芋扩展蛋白基因,本研究从国家基因库核酸序列归档系统(CNSA)(gb.org/pub/)中获取了芋基因组及氨基酸序列扩展蛋白基因特有的保守结构域DPBB_1(pfam03330)和Pollen_allerg_1(pfam01357)均从网站http://pfam.xfam.org/获取然后利用TBtools软件[26]中的Simple Hmm Search功能,基于隐马尔可夫模型,在芋蛋白质序列数据库中搜索扩展蛋白基因,选取满足E-value≤1×10-5条件的蛋白序列作为候选序列,再利用Pfam[27]和SMART[28]网站共同检验这些候选基因序列的特征结构域,并剔除未同时包含DPBB_1和Pollen_allerg_1两种特有保守结构域的基因序列。
最后使用TBtools软件中的Visualize BCBI CDD Domain Pattern功能对扩展蛋白基因进行结构域的可视化分析,最终确定芋扩展蛋白基因的数量此外,再利用芋全基因组的注释文件,通过TBtools软件中的Visualize Gene Structure(Basic)分析每个基因的内含子与外显子结构并对其进行可视化1.2 芋扩展蛋白序列分析及理化特征分析将鉴定出的31个芋扩展蛋白基因家族成员的蛋白序列通过生物信息学网站ProtParam tool[29]分析每个蛋白的物理与化学参数;接着再利用网站Softberry()预测每个蛋白的亚细胞定位信息;在SignalIP-6.0[30]网站上分析信号肽的长度;并在MEME[31]信息网站上分析芋扩展蛋白基因的基序结构,将最大模体数量设为10,其他参数默认1.3 芋扩展蛋白基因系统发育树的构建及基因命名首先通过MEGA11软件[32]中的Muscle序列比对功能对芋、拟南芥、水稻和马铃薯的扩展蛋白基因家族的氨基酸序列进行序列比对,然后将比对后的结果利用MEGA11软件中的Construct /Test Neighbor-Joining Tree功能(bootstrap值设置为1 000)构建系统发育树,再利用FigTree v1.4.4软件对系统发育树进行美化,从而将鉴定出的芋扩展蛋白基因家族成员进行亚家族分类,然后在不同的亚家族内根据其在染色体上的位置顺序进行命名。
1.4 芋扩展蛋白基因染色体定位和基因复制共线性分析通过TBtools中的Blast Compare Two Seqs [sets]功能对芋扩展蛋白基因家族的氨基酸序列进行自我比对,并根据串联重复基因的筛选标准:(1)基因序列的比对率大于70%;(2)基因序列的比对相似性大于70%;(3)基因在染色体上的位置小于100 kb,鉴定出其中存在的串联重复基因,再利用国家基因库核酸序列归档系统(CNSA)中的染色体注释文件,使用TBtools软件中的Gene Location Visualize from GTF/GFF功能获得全部基因在染色体上的位置信息并进行可视化;利用MCScanX软件[33]对芋和拟南芥进行扩展蛋白基因成员倍增模式(基因复制共线性)分析,再利用Circos软件[34]绘制出两个物种的扩展蛋白基因在染色体上的物理位置及基因间的共线性关系1.5 芋扩展蛋白基因在不同组织中的转录表达分析本实验室前期已经对地方芋品种江芋2号的叶片、根和3个不同发育时期的球茎(结芋期后8~10 d的子芋、50~60 d的子芋和90~100 d的子芋)进行了转录组测序从转录组测序结果获得的芋不同组织中的芋扩展蛋白基因的转录表达谱数据(FPKM值),并分析家族各成员的表达趋势,再使用Clust vis网站[35]绘制出基因表达热图。
1.6 qRT-PCR分析通过对芋扩展蛋白基因的转录表达谱热图和系统进化发育的分析,最终挑选出在芋球茎中表达差异最显著的基因(上调的有CeEXPA11、CeEXPA13和CeEXPA23;下调的有CeEXPA2和CeEXLA1)再利用Prime Primer 5.0软件[36]对它们的CDS序列的保守部分设计特异性引物(表1)并送至北京擎科生物科技有限公司进行合成使用TaKaRa MiniBEST Plant RNA Extraction Kit试剂盒对与转录组测序取样一致的芋球茎超低温保存材料的总RNA进行提取,再用TaKaRa PrimeScriptTMRT Master Mix试剂盒反转录成cDNA,以稀释4倍的cDNA为模板用于随后的qRT-PCR检测基因表达量在BIO-RAD CFX96 Real-Time System仪器上完成实验,qRT-PCR反应体系为10 μL,包括2 μL的cDNA样品,各0.5 μL的正反向引物,5 μL的2×Realtime PCR Super mix,2 μL灭菌水反应程序为:95 ℃ 30 s;95 ℃ 15 s,62 ℃ 15 s,72 ℃ 1 min,Plate Read,35个循环;熔解曲线在 65~95 ℃,increment 0.5 ℃ 0.05 s,Plate Read;结束。
以actin基因作为内参对照,构建熔解曲线,使用2-ΔΔCT方法计算相对表达量,分析各基因的表达特征使用SPSS 20进行单因素方差分析,Origin 2018进行图像绘制表1 扩展蛋白基因qRT-PCR引物2 结果与分析2.1 芋扩展蛋白基因的筛选在芋全基因组中共筛选出31个扩展蛋白基因家族成员,经过BCBI batch CD-search 上的结构域分析,最终确定这31个基因均具有扩展蛋白基因的保守结构域其中,EXPA亚家族有23个基因,EXPB亚家族有5个基因,EXLA亚家族有1个基因,EXLB亚家族有2个基因按各基因在染色体上的位置分布,将这31个扩展蛋白基因依次命名为:CeEXPA1~CeEXPA23、CeEXPB1~CeEXPB5、CeEXLA1、CeEXLB1~CeEXLB2(表2)表2 芋扩展蛋白基因基本理化性质分析2.2 芋扩展蛋白理化特征分析蛋白质的功能特征与其理化特性密切相关本研究鉴定出的31个扩展蛋白的分子量从16.75 ku到34.00 ku不等,差距达17.25 ku,平均值为27.64 ku;其蛋白质的最短氨基酸长度为242个,最长达310个,平均长度为261个,跨度也较大;经SignalP网站预测,共发现26个蛋白序列含有信号肽,长度范围在18~36个氨基酸之间,平均长度为25;利用Softberry网站预测,发现31个扩展蛋白均定位在细胞外。
结果表明,31个扩展蛋白的理论等电点最小值为4.84,最大值为9.70,平均值为8.18,其中有6个扩展蛋白的理论等电点均小于7,为酸性蛋白,而其余25个均为碱性蛋白对总平均疏水性的计算发现,大于零的值(0.011~0.151)有13个,表明它们属于疏水性蛋白,而其余的18个蛋白(-0.358~-0.002)则属于亲水性蛋白鉴定出的扩展蛋白不稳定指数在23.16~54.75,平均值为38.34,其中大于40的蛋白有10个,表明大部分扩展蛋白的结构稳定性较好(>40则不稳定)这些基因的脂溶指数为61.03~8。












