
黄瓜多样性固定核心样本集评价论文.doc
5页黄瓜多样性固定核心样本集评价论文 黄瓜多样性固定核心样本集评价论文预读: 摘要:《植物遗传资源学报》2016年第三期摘要:利用149对具有多态性的InDel引物对473份黄瓜初选核心种质自交系进行遗传多样性分析.采用3种方法12种取样比例对该初级遗传多样性固定群体进行抽样获得候选多样性固定核心样本集(GDFCC),使用等位基因数(Na)、有效等位基因数(Ne)、Shannon’s信息指数(I)、基因多样性指数(genediversity)、多态性信息含量(PIC)、总等位位点数(totalnumberofloci)、等位位点保留百分率(retentionrateofloci)评价候选多样性固定核心样本集的多样性和代表性,结果表明,采用逐级聚类+稀有基因优先取样法并按照15%取样比例构建出的多样性固定核心样本集的效果较好.比较发现,该核心样本集的Ne、I、基因多样性指数和PIC值均接近或高于初级遗传多样性固定群体,且对原始群体的等位位点的保留百分率为99.68%.入选多样性固定核心样本集的材料来自15个国家和国内18个省市.该研究为今后黄瓜优异基因资源的挖掘利用提供了代表性强、覆盖度广、遗传稳定的研究群体,将有利于黄瓜种质资源的高效研究利用.关键词:黄瓜;InDel标记;核心种质;遗传多样性固定群体;遗传多样性黄瓜(CucumissativusL.)属于典型的异花授粉作物,是世界普遍栽培的重要蔬菜.由于黄瓜杂优品种的大面积推广,栽培品种的遗传背景变得越来越狭窄,拓展黄瓜作物的遗传多样性显得十分必要.我国国家蔬菜种质中期库收集黄瓜资源2000余份,其中绝大部分属于地方品种,遗传杂合度高,严重制约了资源的研究和利用.虽然研究人员对黄瓜种质资源开展了一系列表型[1-6]和分子多样性鉴定[6-10]以及核心种质研究[11-15],但是前人的研究多基于有限的典型材料和天然混交的原始种质,研究结果在指导资源库大量资源的研究和利用中的作用非常有限.为了提高作物遗传多样性鉴定和核心种质研究结果的效度,英国国际园艺研究中心的G.J.King等[16]提出了多样性固定基础群体(DFFS)的概念,即代表某物种基因库内多样性的、遗传固定的自交系收集品种.他们在构建芸薹属作物核心种质的基础上,通过小孢子培养和连续多代自交的方法,构建了3个多样性固定基础群体并得到了有效应用,这为我们解决上述资源研究中的问题提供了有益的借鉴.InDel分子标记与SSR标记所反映出的基因组遗传信息不尽相同,具有多态性高、特异性强、稳定性好、检测容易、在基因组分布广等优点,在水稻[17-18]、玉米[19]、大白菜[20-21]、甘蓝[21-22]等作物上应用较多,在黄瓜苦味基因挖掘[23]、品种纯度鉴定[24]和抗病基因定位[25-27]等方面也有应用.本研究基于黄瓜表型初选核心种质多代自交构建的初选遗传多样性固定群体,利用黄瓜重测序信息设计的分布于黄瓜7条染色体上的149对InDel标记对其遗传多样性进行分析,结合多种取样方法和取样比例构建多样性固定核心样本集,为促进黄瓜种质资源高效研究和利用奠定基础.1材料与方法1.1试验材料试验材料为基于国家蔬菜种质资源中期库保存的2000多份国内外黄瓜种质资源构建的表型初级核心种质经过多代自交形成的473份自交系,即初级多样性固定群体,其中来自印度、埃及、匈牙利、美国、俄罗斯、日本等35个国家的材料116份,来自中国东北、华北、华中、华东、华南、西北、西南等7个地区的材料357份(表1).1.2试验方法1.2.1DNA提取在黄瓜植株4叶1心时,每份材料选5个生长正常单株的幼嫩叶片作为混合样品,采用改良CTAB法提取基因组DNA.使用微量分光光度仪检测DNA浓度,采用0.8%琼脂糖凝胶电泳检测DNA纯度和完整性.最终稀释浓度至20ng/L,-20℃冰箱保存备用.1.2.2PCR扩增与产物检测InDel引物根据黄瓜基因组重测序预测得到的InDel位点设计,这些引物分布于黄瓜的7条染色体上.引物由英杰生命科技有限公司(Invitrogen)合成,通过试验筛选出多态性引物149对(表2),建立并优化反应体系.PCR反应体系为15μL,其中DNA模板(15ng/μL)2μL,10×Buffer1.5μL,Mg2+(25mM)1.2μL,dNTP(2.5mM)0.2μL,上游引物(10uM)0.2μL,下游引物(10uM)0.2μL,Taq酶(2.5U/μL)0.2μL,ddH2O9.5μL.反应程序为:94℃5min;94℃30s,56℃30s,72℃1min,25个循环;72℃7min;4℃保存.反应产物用8%的非变性聚丙烯酰胺凝胶电泳检测,银染拍照.1.2.3数据统计与分析对InDel扩增产物进行统计,有带记为“1”,无带记为“0”,缺失记为“9”,并将原始数据分别转换为用于PowerMarkerV3.25软件和Popgen3.2软件使用的数据类型.使用PowerMarkerV3.25软件分析总等位位点数(totallo-ci)、等位位点保留百分率(retentionrateofloci)、基因多样性(genediversity)、多态性信息含量(PIC),使用Popgen3.2软件分析等位基因数(Na)、有效等位基因数(Ne)、Shannon’s信息指数(I).使用Pow-erMarkerV3.25软件和MEGA6.06,计算群体遗传距离(Nei’1972)并采用UPGMA法对群体进行遗传相似性聚类并构建系统进化树.1.2.4多样性固定核心样本集构建分别采用3种取样方法,即分组随机取样法、分组聚类+稀有基因优先取样法和逐级聚类压缩+稀有基因优先取样法,均分别按5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%的比例对初级多样性固定群体进行取样,即每种方法按不同比例抽样构建出12个候选多样性固定核心样本集,3种方法共构建36个候选多样性固定核心样本集.1.2.4.1分组随机取样法将473份初级多样性固定材料按品种来源地分为9组,分别为国外组、东北组、华北组、华中组、华东组、华南组、西北组、西南组、其他(来源地不明).按照12个取样比例,分别在9个组中进行随机取样,具体取样数量见表3.各组按比例取样后,将按相同比例所取样品进行合并,构成12个候选多样性固定核心样本集.1.2.4.2分组聚类+稀有基因优选取样法使用PowerMarkerV3.25软件利用分子数据分别计算9组材料的遗传距离,根据遗传距离分别进行聚类分析并构建系统进化树.根据聚类结果,各组按12个取样比例分别对具最远遗传距离的样品进行优先抽取.此外,对每个InDel引物扩增出的位点按其出现的频率进行分类,对具有稀有等位基因位点(基因频率<5%)的样品进行优先取样.各组按比例的取样数量参照分组随机取样法,取样后将各组按相同比例所取样品进行合并,构成12个候选多样性核心样本集.1.2.4.3逐级聚类+稀有基因优先取样法使用PowerMarkerV3.25软件计算所有样品间的遗传距离,根据遗传距离进行聚类分析并构建系统进化树.根据聚类分组结果,按12个取样比例进行逐级聚类取样,即从最低分类水平组内(样品间差异最小)的2个样品中随机取一个样品或优先选取其中具有稀有基因位点的样品,而另外一个样品被剔除,入选的样品和其他保留下来的样品进入下一轮聚类分析,若组内只有一个样品则直接进入下一轮聚类分析;对保留下来的样品再次计算遗传距离并进行聚类分析,按照相同的方法取样,再进入下一轮聚类分析和取样,直到剩余样品量达到相应比例要求的样本量范围,就构成了该比例的候选多样性核心样本集,即12个候选核心样本集.1.2.5不同候选多样性核心样本集的评价与比较分析3种方法构建的36个候选核心种质的平均等位基因数、总等位位点数、等位位点保留百分率、有效等位基因数、Shannon’s信息指数、基因多样性、多态性信息含量等参数,对不同候选多样性固定核心样本集进行评价和比较,最终选出最优的候选多样性固定核心样本集.2结果与分析2.1多态性InDel引物筛选与初选多样性固定群体的遗传多样性分析经过引物筛选,获得在不同材料间有多态性的149对InDel引物,这些引物在473个自交系中均扩增出具有明显多态性且带型稳定的产物,通过条带统计共检测到310个等位位点,每对InDel引物在所有材料中扩增出2~3个等位位点,平均等位基因数为2.1074个.各引物揭示的所有材料的有效等位基因数分布在1.0043~2.7587之间,平均为1.7930;Shannon’s信息指数范围为0.0154~1.0537,平均值为0.6182;基因多样性变幅为0.0043~0.6375,平均为0.4230;多态性信息含量为0.0043~0.5629,平均值为0.3310,说明这些引物能很好地检验黄瓜种质资源的遗传多样性.2.2多样性固定核心样本集的构建2.2.1分组随机取样法构建核心样本集对黄瓜初级遗传多样性固定群体按5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%的比例分别进行分组随机取样,计算不同比例构成的候选多样性固定核心样本集和初级遗传多样性固定群体(100%)的平均等位基因数、总等位位点数、等位位点保留百分率(表4),有效等位基因数、Shannon’s指数、基因多样性、PIC多态性信息含量.如表4和图1所示,随取样比例的增加,各指标均呈不规律上升趋势,且上述各参数在取样比例为15%时出现第1次拐点,说明从5%升高到15%的比例时群体多样性快速增加;当取样比例达到50%或60%时则达到最高,且高于或接近原始群体.同时,分析显示,从50%的抽样比例开始,所获得的候选核心样本集的等位位点保留百分率就已达到99.68%,说明50%比例已经能很好地表现原始群体的多态性;比例过低,等位位点丢失严重;过高,样本集的冗余度提高.综合分析认为50%是分组随机取样法构建黄瓜多样性固定核心样本集的最佳取样比例.2.2.2分组聚类+稀有基因优选取样法按照分组聚类和稀有基因优选的原则,按各比例取样最终获得12个候选核心样本集,计算不同比例构成的候选多样性固定核心样本集和初级遗传多样性固定群体(100%)的平均等位基因数、总等位位点数、等位位点保留百分率(表5),有效等位基因数、Shannon’s指数、基因多样性、PIC多样性信息含量.如表5和图2所示,各参数在取样比例达到40%开始快速上升,在70%时达到最高,之后趋缓.在5%~15%的区段,有效等位基因数和基因多样性指数曲线是较低且平缓的,而Shannon’s指数和多态性信息指数出现一个小峰值,说明从5%比例升高到10%比例时群体多样性在增加.从等位位点保留百分率情况看,20%以上的抽样比例便能使其保留100%,说明在抽样比例为25%以上时群体内出现严重冗余.综合多个参数的结果认为,抽样比例为60%时,不仅候选核心样本集的等位位点保留比例高、冗余程度低,而且多样性高于或接近原始群体,是分组聚类+稀有基因优先取样法构建候选黄瓜核心样本集的较佳取样比例.2.2.3逐级聚类+稀有基因优先取样法通过逐级聚类分析和取样,分别得到按90%~5%的12个比例抽样的候选多样性固定核心样本集426份、378份、330份、282份、237份、189份、141份、116份、95份、71份、47份和24份.计算不同比例构成的候选多样性固定核心样本集和初级遗传多样性固定群体(100%)的平均等位基因数、总等位位点数、等位位点保留百分率(表6),有效等位基因数、Shannon’s指数、基因多样性、PIC多态性信息含量.如表6和图3所示,随取样比例的增加呈先逐渐下降后又逐渐上升的变化趋势.当取样比例在5%~15%时,各参数值处于高位.在取样比例为30%时,各参数的下降速度出现拐点,且与90%取样比例的各参数接近.当取样比例为60%~70%时,各指标处于低。
