好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

转录组+代谢组联合分析方案模板-20181123.docx

15页
  • 卖家[上传人]:博****1
  • 文档编号:538237818
  • 上传时间:2023-04-04
  • 文档格式:DOCX
  • 文档大小:2.54MB
  • / 15 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • XX抗旱转录组研究方案XX抗旱转录组和代谢组联合分析方案研究背景及目的:非生物应激反应对动植物适应环境有重要作用,生物只有通过自身应激反应适应环境才能存活通常情况下,非生物逆境包括如强光、紫外线、高温或低温、冷冻、干旱、盐度、重金属和缺氧等多种复杂的环境条件引起的胁迫对于植物而言,非生物逆境会引起很多细胞内物质包括核酸、蛋白质、碳水化合物和氨基酸等的积累,表明植物对非生物胁迫的应答机制不是一个线性机制,而是一个涉及多基因、多信号途径、多基因产物和生物化学分子的的复杂的反应机制在系统生物学和功能基因组时代,将多个组学联合运用、从整体上解释生物学问题才是大势所趋因此,转录组和代谢组联合分析,可以从大量转录组信息中发掘差异基因,快速判断核心调控网络和关键候选基因,明确转录因子功能,阐述生物体响应非生物胁迫应答机制转录组(transcriptome)广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合蛋白质是行使细胞功能的主要承担者,蛋白质组是细胞功能和状态的最直接描述,转录组成为研究基因表达的主要手段,转录组是连接基因组遗传信息与生物功能的蛋白质组的必然纽带,转录水平的调控是目前研究最多的,也是生物体最重要的调控方式。

      代谢物是生物体表型的基础,能帮助更直观有效地了解生物学过程以及其机理基于对代谢物的定性定量分析,代谢组学可以用于研究代谢途径或代谢网络的解析,不同生物个体的代谢组学表型现象,不同疾病、药物等物理、化学或病原生物刺激后代谢产物的应答机制,以及食品、药物等安全评价 XX属茄科一年生或有限多年生草本植物,是一种重要的经济作物,在我国南北方均有广泛种植经过长期田间栽培观察发现,生长在北方的XX由于生长环境缺水,株形相对矮小,但是如降水量增加后其能生长较高大;南方的XX则由于生长环境雨水较多,株形较高大,但是如发生缺水胁迫石容易旱死由此可见,干旱是影响XX生长的一种重要非生物胁迫随着二代高通量测序技术(NGS)的发展和推广,目前NGS广泛应用于各种生长发育、环境适应、免疫互作等研究通过文献调研发现,在水稻、玉米、棉花、小麦等作物中,有大量文献报道显示应用转录组、miRNA、lncRNA测序技术从转录调控水平研究其响应干旱胁迫的分子机理,包括相关信号转导途径、代谢途径等本研究主要目的为解析XX在较长时间干旱条件下的调控机制,以及在复水后植物的调节机理,从转录组和代谢组水平比较抗旱和不抗旱XX材料在不同程度干旱处理过程中的转录组变化,从而挖掘相关关键基因以及调控机制。

      实验设计:选取抗旱和不抗旱的XX品种,根据抗旱表型最明显的时期选取合适生长期的XX进行处理实验将种子播种2周后开始进行干旱处理,分两组进行:(1) 轻度干旱处理;(2) 重度干旱处理样品选择时,生物学重复是非常必要的,SCI没有生物学重复而拒稿的文章比例越来越高生物学重复的相关性可以检验生物学实验操作的可重复性;生物学重复的相关性可以评估差异表达基因的可靠性;生物学重复的相关性可以辅助异常样品的筛查推荐转录组样本设置3次生物学重复(设置2次生物学重复具有统计学意义,但如果存在异常样品,无法完成后续分析),代谢物对环境变化的感应很强,不同样品的重复差异是比较大,对于植物,代谢组建议6次生物学重复技术平台:采用Illumina Hiseq X ten高通量测序平台,双端150bp测序; LC-MS; 技术路线:分析要点(文章思路)本研究的亮点主要在三个方面:转录组与代谢组联合分析和四个维度(不同材料、不同干旱处理(轻度和重度)、不同处理时间点、不同组织)所以文章思路主要也围绕这三个亮点展开转录组和代谢组先从四个维度进行比较和分析(不同材料、不同干旱处理(轻度和重度)、不同处理时间点、不同组织),再进行转录组和代谢组联合分析,构建转录调控网络分析。

      方案分析思路:一、 转录组测序数据分析1. 通过对下机后得到原始数据进行过滤(过滤接头序列或低质量序列),得到高质量数据,后续的分析均利用高质量数据分析;2. 组装Unigene库,并将以上过滤后获得的高质量数据与Unigene库进行比对分析,计算每个样品中基因的表达量;3. 样品间差异基因比较分析:3.1干旱处理过程中的差异基因筛选及注释:以抗旱XX在重度干旱的样品为例,通过对处理过程中4个时期样品进行两两比较,可以筛选出上调或下调表达的基因,对筛选到的这些差异基因进行功能注释、GO分类和富集、KEGG通路分类和富集分析,即可了解其参与的功能,进而筛选干旱处理过程中的关键基因; 差异基因火山图 差异基因KEGG代谢通路注释 差异基因维恩图3.2基因时间序列表达模式分析,筛选跟表型变化较一致模式的基因集:根据干旱处理中差异基因表达模式分析,如可观测与蒸腾作用相关关键基因在叶片中的表达模式(如下图)可根据这些基因随着处理时间延长表现出的表达模式,结合表型数据进行分析,筛选感兴趣的关键基因作为候选研究的关键基因差异表达基因模式折线图3.3不同组样品的差异表达基因层次聚类分析:对抗旱和不抗旱的不同处理时间的样品进行差异表达聚类分析,经过聚类可以对差异基因表达趋势分类,针对每一个亚簇可进一步提取数据作图并提供功能注释分析,可直观看到与抗旱相关基因的表达情况及功能。

      差异基因聚类及注释图3.4 按组来进行差异基因比较分析,从而便于整体上来比较不同材料、不同处理组、不同组织不同之间的差异如按照时间序列筛选一个差异基因集合,按照不同组织(空间)筛选一个差异基因集合,比较两个集合共同和特异的差异基因,并进行相关功能注释和富集分析,从而解析与干旱处理时间相关、叶片和根部响应干旱特异的基因和信号途径时间和空间差异基因韦恩图4、 根据样品所有基因表达量信息进行PCA分析,从而观察样品之间的分群,解析样品之间的关联样品PCA分析5、通过加权共表达网络分析(WGCNA),基于所有基因或者差异表达基因的表达量信息,计算基因间的相关系数,构建基因共表达网络,鉴定网络中不同功能的基因模块WGCNA分析鉴定的基因模块6、 计算各基因模块与关注表型之间的联系,鉴定关键基因模块并进行功能注释分析比如,计算各基因模块与记录的抗旱处理过程中的表型数据(比如叶片含水量、光合作用速率、蒸腾作用速率等)之间的相关系数和显著性值,鉴定与各表型数据高度相关的基因模块通过对关键基因模块进行GO富集等功能注释分析,从而来解析该模块调控相关性状的可能机制。

      基因模块与性状关联性分析 基因模块功能富集分析7、 计算各基因模块与样本之间的联系,根据基因模块的功能解释相关样本的表型因为本研究的实验设计涉及不同材料、不同处理组、不同组织,性状较多,比如,两种材料的两种干旱处理的各4个时期,2个不同的组织想知道在每个材料每个时期每个组织中发挥作用的基因模块,可通过计算每个模块的特征值与样本间的相关性来判断,来研究每个模块最喜欢哪个样本中表达基因模块与样品的关联系分析8、 关键模块绘制基因调控网络,筛选其中关键调控因子和功能蛋白模块中的各基因成员在关系上并非是平等的把处于调控网络中心的基因称为核心基因(hub gene),这类基因通常是转录因子等关键的调控因子,是值得优先深入分析和挖掘的对象在网络中,被调控线连接的基因,其表达模式是相似的,通常认为它们有相似的功能所以,在这个网络中,如果线条一端的基因功能是已知的,那么就可以预测线条另一端的功能未知的基因也有相似的功能,这就方便下一步验证功能未知基因 某基因模块调控网络图二、 代谢组数据分析2.1 代谢物定性定量分析 质谱分析后的下机 wiff 格式原始数据,可通过软件 Analyst 1.6.2 打开浏览,并用于定性定量分析。

      图 1 所示为混样 QC 样本的总离子流图(Total ions current,TIC,即每个时间点质谱图中所有离子的强度加和后连续描绘得到的图谱)及MRM代谢物检测多峰图(多物质的提取的离子流谱图, XIC),横坐标为代谢物检测的保留时间(Retention time, Rt),纵坐标为离子检测的离子流强度(强度,cps)图 1. 混样样品质谱分析总离子流图(上) 及 MRM 代谢物检测多峰图(下)基于本地代谢数据库,对样本的代谢物进行了质谱定性定量分析图1中MRM 代谢物检测多峰图展示了样本中能够检测到的物质,每个不同颜色的质谱峰代表检测到的一个代谢物为了比较每个代谢物在不同样本中的物质含量差异,根据代谢物保留时间与峰型的信息,我们对每个代谢物在不同样本中检测到的质谱峰进行校正,以确保定性定量的准确图 2展示了代谢物mr1267在不同样本中的定量分析积分校正结果,横坐标为代谢物检测的保留时间,纵坐标为某代谢物离子检测的离子流强度(cps)图 2. **样品代谢物定量分析积分校正2.2 样本质控分析 通过对不同 QC 样本质谱检测分析的 TIC 图进行重叠展示分析,可以判断代谢物提取检测的重复性。

      如图 3 显示了第一与最后一个 QC 样本质谱检测 TIC图重叠结果,可以发现质谱检测较为稳定,重复性较好 图 3. QC 样本质谱检测 TIC 重叠图图 4. **样本及 QC 样本 PCA 得分图三角形、方框分别表示品种 1(P1)与品种 2(P2);黑色圆点表示质控样本(QC); 不同颜色分别表示**七个时期组织样本; X 轴表示 PC1,Y 轴表示 PC2 对 QC 样本及**组织样本进行代谢主成分分析, PCA 得分图(Score plot)如图 4 所示,X 轴表示第一个主成分,Y 轴表示第二个主成分,QC 样本(黑色圆点)聚集在一起,其它样本且能够显著区别,结果表明**样品质谱检测分析较为稳定,采集的数据质量较好 2.3 差异代谢物的比较 2.3.1 差异代谢物的筛选 为了得到两个品种之间差异的代谢物,我们分别使用 OPLS-DA 和双因素方差分析两种方法来进行筛选在使用 SIMCA 14 的 OPLS-DA 时,我们分析同一个处理中两品种间差异代谢物 图5A为两种方法得到的差异代谢物的韦恩图 图5B 为已知的差异代谢物的分类扇形图 A .OPLS-DA 和双因素方差分析筛选的差异代谢物的韦恩图B.不同**品种之间差异代谢物的分类情况图 5.两品种间差异代谢物的筛选及其分类情况图 6. 不同**品种之间差异代谢物的分类情况部分品种间差异的代谢物在各个样品中的积累量如图 6 所示,该热图横轴为样品的编号, 并且在横轴的上方分别用颜色条标出该样品所属品种以及时期: 左边的浅红色表示品种 I,右边深红色表示品种 II, 各个品种内各个时期用黄棕色由浅到深依次表示; 纵轴为每个代谢物,蓝色到红色依次表示代谢物含量从低到高。

      3.3.2 差异代谢物的通路分析 对两品种或不同处理之间差异代谢物进行 KEGG 通路富集分析,结果如图7 所示图 7. 差异代谢物 KEGG pathway 富集分析图 8. KEGG 富集到各通路的各代谢物在各时期各样本中的积累量热图 在各品种中各时期的代谢物积累量如图 8热图所示 三、 转录组和代谢组联合分析3.1 mRNA与代谢物表达相关性分析我们将所有的差异表达代谢物的酶基因对应mRNA表达量被计算出来,比较两者之间的相关性我们将基因和代谢物能够完全对应。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.