
代谢组学ppt课件.ppt
45页1代谢组学代谢组学- -方法与应用方法与应用 授课教师授课教师 :吴敬:吴敬 教授教授 授课时间:授课时间:2009年年11月月;.2 “基因组学反映了什么是可以发生的,转录组学反映的是将要发生的,蛋白质组基因组学反映了什么是可以发生的,转录组学反映的是将要发生的,蛋白质组学指出了赖以发生的,只有代谢组学才真正反映业已发生的学指出了赖以发生的,只有代谢组学才真正反映业已发生的 ——许国旺许国旺;.3第一章第一章 代谢组学的简介代谢组学的简介 第二章第二章 代谢组学的研究方法代谢组学的研究方法第四章第四章 代谢组学的应用代谢组学的应用第五章第五章 代谢组学的发展前景代谢组学的发展前景 ;.4组学时代组学时代4 4种最重要的组学种最重要的组学;.5代谢组学(代谢组学(Metabonomics/ Metabolomics Metabonomics/ Metabolomics )是通过考察生物体系(细胞、组织)是通过考察生物体系(细胞、组织 或生物体)或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学。
间的变化,来研究生物体系的一门科学代谢组(代谢组(metabolomemetabolome)是基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、)是基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常生长功能维持生物体正常生长功能 和生长发育的小分子化合物的集合,主要是相对分子量小于和生长发育的小分子化合物的集合,主要是相对分子量小于10001000的内源性小分子的内源性小分子代谢物数量因物种不同而差异较大:代谢物数量因物种不同而差异较大:植物(植物(200 000200 000种)、动物(种)、动物(25002500种)、微生物(种)、微生物(15001500种)种);.6 代谢组学是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物代谢组学是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分学的重要组成部分 基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命的活动,而实际上细胞基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命的活动,而实际上细胞内许多生命活动是发生在代谢物层面的,如细胞信号释放(内许多生命活动是发生在代谢物层面的,如细胞信号释放(cell signalingcell signaling),能量),能量传递,细胞间通信等都是受代谢物调控的。
代谢组学正是研究代谢组传递,细胞间通信等都是受代谢物调控的代谢组学正是研究代谢组((metabolomemetabolome))————在某一时刻细胞内所有代谢物的集合在某一时刻细胞内所有代谢物的集合————的一门学科基因与蛋的一门学科基因与蛋白质的表达紧密相连,而代谢物则更多地反映了细胞所处的环境,这又与细胞的营养白质的表达紧密相连,而代谢物则更多地反映了细胞所处的环境,这又与细胞的营养状态,药物和环境污染物的作用,以及其它外界因素的影响密切相关状态,药物和环境污染物的作用,以及其它外界因素的影响密切相关 因此有人认为,因此有人认为,““基因组学和蛋白质组学告诉你什么可能会发生,而代谢组学则基因组学和蛋白质组学告诉你什么可能会发生,而代谢组学则告诉你什么确实发生了告诉你什么确实发生了Bill Lasley, UC DavisBill Lasley, UC Davis);.7198219831984198919992000200120022004Van De GreefVan De Greef: publication of MS for urine profilingSadler, Buckingham and Nicholson:Sadler, Buckingham and Nicholson: First publication on 1H-NMR of blood and plasmaNicholson, et al.: Nicholson, et al.: Multi-component analysis of spectra data from rat urineNicholson and Wilson: NMR spectroscopy of biofluidsNicholson: Nicholson: Definition of MetabonomicsHaselden, et al.:Haselden, et al.: First independent Pharma publication of MetabonomicsNicholson, Lindon, and Holmes:Nicholson, Lindon, and Holmes: Publication in Nature on MetabonomicsHolmes and Antti Holmes and Antti Explanation of statistics in MetabonomicsIncreasing # of publicationsIncreasing # of publications第一章第一章 代谢组学简介代谢组学简介————代谢组学的发展代谢组学的发展;.8代谢组学的特点:代谢组学的特点:1.1.关注内源化合物关注内源化合物2.2.对生物体系的小分子化合物进行定量定性研究对生物体系的小分子化合物进行定量定性研究3.3.上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响4.4.上述内源性化合物的知识可以被用于疾病的诊断和药物筛选上述内源性化合物的知识可以被用于疾病的诊断和药物筛选与转录组学和蛋白组学相比,代谢组学有以下优点:与转录组学和蛋白组学相比,代谢组学有以下优点:1.1.基因与蛋白质表达的微小变化会在代谢物上得到放大,从而使检测更容易基因与蛋白质表达的微小变化会在代谢物上得到放大,从而使检测更容易2.2.代谢组学的研究不需要建立全基因测序及大量序列标签(代谢组学的研究不需要建立全基因测序及大量序列标签(ESTEST)的数据库)的数据库3.3.代谢物的研究种类远小于蛋白质的数目代谢物的研究种类远小于蛋白质的数目4.4.研究中采用的技术更通用研究中采用的技术更通用;.9♦ Genomics and Proteomics are not sufficient to describe reasons for toxicity or disease state 基因组学和蛋白组学对于毒性或疾病状态的描述是不足的基因组学和蛋白组学对于毒性或疾病状态的描述是不足的♦ Neither Genomics nor Proteomics can produce time course information which is important for animal to animal comparison 基因组学和蛋白组学都不能提供动态信息,但这些信息对于动物间的比较是重要的基因组学和蛋白组学都不能提供动态信息,但这些信息对于动物间的比较是重要的♦ Metabolite profiling produces information on the biochemical pathways effected 代谢物分析能提供生化途径结果的信息代谢物分析能提供生化途径结果的信息♦ Monitoring metabolites allows concurrent or sequential affects to be monitored, e.g. blocking of a metabolic pathway in the liver can lead to toxicity in the brain (hydrazine) 代谢监控可监控即时或相继的结果,例如:阻断肝脏中代谢途径会在脑中产生毒性肼代谢监控可监控即时或相继的结果,例如:阻断肝脏中代谢途径会在脑中产生毒性肼♦ Metabonomics, unlike the other “omics” is non-invasive 不像别的组学研究,代谢组学是无创的不像别的组学研究,代谢组学是无创的The Need for Metabonomic Information;.10代谢组学研究现状代谢组学研究现状 代谢组学属于全局系统生物学(代谢组学属于全局系统生物学(Global systems biologyGlobal systems biology)研究方法,便于对)研究方法,便于对复杂体系的整体进行认识.譬如,一个正常工作的人体包括复杂体系的整体进行认识.譬如,一个正常工作的人体包括““人体人体””本身和与之本身和与之共同进化而来且共生的消化道微生物群体(或称菌群),孤立地研究共同进化而来且共生的消化道微生物群体(或称菌群),孤立地研究““人体人体””本本身的基因,转录子以及蛋白质当然可以为人们认识人体生物学提供重要信息,但身的基因,转录子以及蛋白质当然可以为人们认识人体生物学提供重要信息,但无法提供使人体正常工作不可缺少的菌群的信息.人体血液和尿液的代谢组却携无法提供使人体正常工作不可缺少的菌群的信息.人体血液和尿液的代谢组却携带着包括菌群在内的每一个细胞的信息,因此代谢组学方法对研究如人体这样复带着包括菌群在内的每一个细胞的信息,因此代谢组学方法对研究如人体这样复杂的进化杂合体十分有效.杂的进化杂合体十分有效.;.11不同器官不同器官组织具有不同的代具有不同的代谢轮廓,广廓,广谱全采集全采集;.12 代谢组学已经广泛地应用到了包括药物研发代谢组学已经广泛地应用到了包括药物研发, ,分子生理学分子生理学, ,分子病理学分子病理学, ,基因功能组学基因功能组学, ,营养学营养学, ,环境科学等重要领域环境科学等重要领域. .在代谢组学诞生后的在代谢组学诞生后的6 6年里年里, ,有关代谢组学的研究论文和专利有关代谢组学的研究论文和专利以指数的形式逐年增长以指数的形式逐年增长. .;.13 代谢组学与系统生物学代谢组学与系统生物学 系统生物学概念的诞生标志着研究哲学由系统生物学概念的诞生标志着研究哲学由" "还原论还原论" "向向" "整体论整体论" "的变化的变化. .系统生物学的系统生物学的中心任务就是要针对生物系统整体中心任务就是要针对生物系统整体( (无论它是生物细胞无论它是生物细胞, ,多细胞组织多细胞组织, ,器官还是生物整体器官还是生物整体),),建立定量建立定量, ,普适普适, ,整体和可预测整体和可预测(QUIP)(QUIP)的认知的认知. . 具体而言具体而言, ,系统生物学研究就是要将给定生物系统的基因系统生物学研究就是要将给定生物系统的基因, ,转录转录, ,蛋白质和代谢水平所蛋白质和代谢水平所发生的事件发生的事件, ,相关性及其对所涉及生物过程的意义进行整体性认识,从而出现了许多的相关性及其对所涉及生物过程的意义进行整体性认识,从而出现了许多的" "组组" "和和" "组学组学" "的新概念的新概念. .;.14 现已提出的一百多个现已提出的一百多个" "组组" "和和" "组学组学",",可以大体归纳为可以大体归纳为" "基因组基因组"/""/"基因组学基因组学","","转录组转录组"/""/"转录组学转录组学","","蛋白质组蛋白质组"/""/"蛋白质组学蛋白质组学" "和和" "代谢组代谢组"/""/"代谢组学代谢组学" "四个方面四个方面. .显而易见显而易见,DNA,mRNA,DNA,mRNA以及蛋白质的存在为生物过程的发生提供了物质基础以及蛋白质的存在为生物过程的发生提供了物质基础( (但这个过程有可能不发生但这个过程有可能不发生!),!),而代谢物质所反映的是已经发生了的生物学事件而代谢物质所反映的是已经发生了的生物学事件. .因此代谢组学是对一个生物系统进行因此代谢组学是对一个生物系统进行全面认识的不可缺少的一部分全面认识的不可缺少的一部分, ,是全局系统生物学是全局系统生物学(global systems biology)(global systems biology)的重要基础的重要基础;.15第二章第二章 微生物代谢组学的研究方法微生物代谢组学的研究方法Challenges of MetabonomicsSample Complexity and Data HandlingEach sample has..,Each sample has.., a wide range of compound classes a wide variation in metabolite concentrations a large number of potential componentsEach group of samples has…,Each group of samples has…,many sample analyses are required for statistical relevancea complex raw dataset that needs to be processeddifferences between sample groups which need to be highlighted;.16 代谢组学代谢组学(metabonomics(metabonomics//metabolomics)metabolomics)是效仿基因组学和蛋白质组学的研是效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式,是系统生物学的组成部分。
相对关系的研究方式,是系统生物学的组成部分 其研究对象大都是相对分子质量其研究对象大都是相对分子质量10001000以内的小分子物质先进分析检测技术以内的小分子物质先进分析检测技术结合模式识别和专家系统等计算分析方法是代谢组学研究的基本方法结合模式识别和专家系统等计算分析方法是代谢组学研究的基本方法 ;.17 代谢组学利用高通量、高灵敏度与高精确度的现代分析技术,动态跟踪细胞、代谢组学利用高通量、高灵敏度与高精确度的现代分析技术,动态跟踪细胞、有机体分泌出来的体液中的代谢物的整体组成,借助多变量统计方法,来辩识和解有机体分泌出来的体液中的代谢物的整体组成,借助多变量统计方法,来辩识和解析被研究对象的生理、病理状态及其与环境因子、基因组成等的关系析被研究对象的生理、病理状态及其与环境因子、基因组成等的关系 “ “代谢组学代谢组学””是一种整体性的研究策略,其研究策略有点类似于通过分析发动是一种整体性的研究策略,其研究策略有点类似于通过分析发动机的尾气成分,来研究发动机的运行规律和故障诊断等的机的尾气成分,来研究发动机的运行规律和故障诊断等的““反向工程学反向工程学””的技术思的技术思路。
由于代谢组学着眼于把研究对象作为一个整体来观察和分析,也被称为路由于代谢组学着眼于把研究对象作为一个整体来观察和分析,也被称为““整体整体的系统生物学的系统生物学”” ;.18研究方法和步骤研究方法和步骤1.1.样品制备:足量的代表性样品(样品制备:足量的代表性样品(-80℃-80℃保存)保存)2.2.数据采集和标志物识别:常用色谱数据采集和标志物识别:常用色谱- -质谱联用质谱联用 、、NMRNMR3.3.数据分析:数据分析: PCAPCA、、 PLSPLS、、 ANNANN4.4.代谢途径分析:代谢轮廓分析和代谢组学分析代谢途径分析:代谢轮廓分析和代谢组学分析;.19The strategy for large scale metabonomics research;.20样品制备样品制备 微生物代谢物样品的制备一般分为微生物培养、淬灭和代谢产物的提取根据研究对微生物代谢物样品的制备一般分为微生物培养、淬灭和代谢产物的提取根据研究对象、目的和采用的分析技术不同象、目的和采用的分析技术不同, ,所需的样品提取和预处理方法各异,不存在一种普适性所需的样品提取和预处理方法各异,不存在一种普适性的标准化方法。
的标准化方法 微生物代谢组学研究要求微生物的生长条件是可以控制和重复的在一个生物反应器微生物代谢组学研究要求微生物的生长条件是可以控制和重复的在一个生物反应器中,需要严格控制温度、中,需要严格控制温度、pHpH、培养基组成、溶解氧和二氧化碳等以明确界定生长条件,建、培养基组成、溶解氧和二氧化碳等以明确界定生长条件,建立标准的和可重复的参考培养条件微生物的培养可以以分批、补料或者连续培养模式进立标准的和可重复的参考培养条件微生物的培养可以以分批、补料或者连续培养模式进行由于连续培养的菌体生理稳定,易于控制且重现性较好,所以,大多数研究者倾向于行由于连续培养的菌体生理稳定,易于控制且重现性较好,所以,大多数研究者倾向于应用生物反应器连续培养操作模式应用生物反应器连续培养操作模式 ;.21在样品淬灭和代谢物的提取过程中,应遵循的原则是:在样品淬灭和代谢物的提取过程中,应遵循的原则是:((1 1)淬灭工艺最好可以立即冻结细胞代谢)淬灭工艺最好可以立即冻结细胞代谢((2 2)在淬灭过程中要求细胞膜无明显损伤,以免胞内代谢物外泄在淬灭过程中要求细胞膜无明显损伤,以免胞内代谢物外泄3 3)提取过程中应该尽可能多的提取胞内代谢物。
提取过程中应该尽可能多的提取胞内代谢物4 4)代谢产物不应该遇到任何物理或化学修饰代谢产物不应该遇到任何物理或化学修饰5 5)得到的样品基质应与所选择的分析方法相容得到的样品基质应与所选择的分析方法相容 冷甲醇、液氮和热乙醇是最常用的淬灭方法,而在提取方面由于特定的提取条件冷甲醇、液氮和热乙醇是最常用的淬灭方法,而在提取方面由于特定的提取条件往往仅适合某些类化合物目前尚无一种能够适合所有代谢产物的提取方法应该根据不往往仅适合某些类化合物目前尚无一种能够适合所有代谢产物的提取方法应该根据不同的化合物选择不同的提取方法,并对提取条件进行优化同的化合物选择不同的提取方法,并对提取条件进行优化 ;.22 • 对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关键步骤,也是最困难对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关键步骤,也是最困难和多变的步骤和多变的步骤 与原有的各种组学技术只分析特定类型的物质不同,代谢组学分析对象的大小、数与原有的各种组学技术只分析特定类型的物质不同,代谢组学分析对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差异很大,要对量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差异很大,要对它们进行无偏向的全面分析,单一的分离分析手段往往难以保证。
它们进行无偏向的全面分析,单一的分离分析手段往往难以保证 色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测和光散射等分离分析手段及其组合都被应用于代谢组学的研究和光散射等分离分析手段及其组合都被应用于代谢组学的研究 ;.23;.24 一般来说一般来说, ,选择代谢物组学分析方法时选择代谢物组学分析方法时, ,其原则是要同时考虑仪器和技术的检测速其原则是要同时考虑仪器和技术的检测速度、选择性和灵敏度度、选择性和灵敏度, ,找到一种最适合目标化合物的方法找到一种最适合目标化合物的方法 化学分析技术中最常用的是化学分析技术中最常用的是1 1H H核磁共振核磁共振( (1 1HNMR)HNMR)以及色谱质谱联用以及色谱质谱联用(X-MS)(X-MS),如气,如气相色谱耦联质谱相色谱耦联质谱(GC/MS)(GC/MS)、液相色谱耦联质谱、液相色谱耦联质谱(LC/MS)(LC/MS)和毛细管电泳耦联质谱联用技和毛细管电泳耦联质谱联用技术术 (CE/MS)(CE/MS)来分析研究代谢物并为其绘制图谱。
这些技术的耦联可以提高对样品的来分析研究代谢物并为其绘制图谱这些技术的耦联可以提高对样品的分辨率、敏感性及选择度分辨率、敏感性及选择度, ,有利于对更多的生物体系内的代谢物绘制图谱有利于对更多的生物体系内的代谢物绘制图谱;.25 GC/MS GC/MS 、、LC/MSLC/MS和和CE/MS CE/MS 可以同时检测出数百种化合物,包括糖类、有机酸、可以同时检测出数百种化合物,包括糖类、有机酸、氨基酸、脂肪酸和大量不同的次生代谢物氨基酸、脂肪酸和大量不同的次生代谢物 GC/MSGC/MS有很好的分离效率且相对较为经济,但需要对样品进行衍生化预处理,有很好的分离效率且相对较为经济,但需要对样品进行衍生化预处理,这一步骤会耗费额外的时间,甚至引起样品的变化受此限制,这一步骤会耗费额外的时间,甚至引起样品的变化受此限制,GC/MS GC/MS 无法分析膜无法分析膜脂等热不稳定性的物质和分子量较大的代谢产物脂等热不稳定性的物质和分子量较大的代谢产物近来,多维分离技术如二级气相色谱飞行时间质谱(近来,多维分离技术如二级气相色谱飞行时间质谱(GC-GC-TOF-MSGC-GC-TOF-MS),检测范围更),检测范围更广,但由于实际应用困难和花费较高等问题使其并未普遍使用。
广,但由于实际应用困难和花费较高等问题使其并未普遍使用 ;.26 HPLC HPLC 与与 GC GC 原理相似,但在进样前不需进行衍生化处理,适合那些不稳定、原理相似,但在进样前不需进行衍生化处理,适合那些不稳定、不易衍生化、不易挥发和分子量较大的化合物不易衍生化、不易挥发和分子量较大的化合物HPLC/MS HPLC/MS 选择性和灵敏度都较好,选择性和灵敏度都较好,但分析的时间相对较长,且需依赖纯的参照物但分析的时间相对较长,且需依赖纯的参照物 CE-MSCE-MS分离样品效率比普通的色谱质谱联用要高得多,仅需要极少的进液量分离样品效率比普通的色谱质谱联用要高得多,仅需要极少的进液量nLnL),而且其测试时间短,试剂成本低而且其测试时间短,试剂成本低CE-MSCE-MS在微生物代谢组领域发挥着越来越在微生物代谢组领域发挥着越来越重要的作用重要的作用 色谱质谱连用技术具有分离效率高、灵敏度好及经济实用等优点但需要解决色谱质谱连用技术具有分离效率高、灵敏度好及经济实用等优点但需要解决的主要问题是:大量色谱峰的识别问题以及方法的重现性问题。
的主要问题是:大量色谱峰的识别问题以及方法的重现性问题;.27NMRNMR是当前代谢组学研究中的主要技术是当前代谢组学研究中的主要技术 首先,不同于质谱具有离子化程度和基质干扰等问题,首先,不同于质谱具有离子化程度和基质干扰等问题,NMR NMR 没有偏向性,对所有化合没有偏向性,对所有化合物的灵敏度是一样的;其次,物的灵敏度是一样的;其次,NMR NMR 无损伤性,不破坏样品的结构和性质,可在接近生理条无损伤性,不破坏样品的结构和性质,可在接近生理条件下进行实验,可在一定的温度和缓冲液范围内选择实验条件,可以进行实时和动态的检件下进行实验,可在一定的温度和缓冲液范围内选择实验条件,可以进行实时和动态的检测;此外,测;此外,NMR NMR 氢谱的谱峰与样品中各化合物的氢原子是一一对应的,所测样品中的每一氢谱的谱峰与样品中各化合物的氢原子是一一对应的,所测样品中的每一个氢原子在图谱中都有其相关的谱峰,图谱中信号的相对强弱反映样品中各组分的相对含个氢原子在图谱中都有其相关的谱峰,图谱中信号的相对强弱反映样品中各组分的相对含量,更为直观量,更为直观 因此,NMR NMR 方法很适合研究代谢产物中的复杂成分。
方法很适合研究代谢产物中的复杂成分 与与 GC/MS GC/MS 和和 LC/MS LC/MS 相比,相比, NMR NMR 的缺点是灵敏度低,有可能形成信号重叠,且其对的缺点是灵敏度低,有可能形成信号重叠,且其对样品制备的要求很高同时因为动态范围有限,很难同时测定生物体系中共存的浓度相差样品制备的要求很高同时因为动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物较大的代谢产物 ;.28数据分析平台数据分析平台 在代谢组学研究中,大多数是从检测到的代谢产物信息中进行两类在代谢组学研究中,大多数是从检测到的代谢产物信息中进行两类(如基因突变前后如基因突变前后的响应的响应)或多类或多类(如不同表型间代谢产物如不同表型间代谢产物)的判别分类以及生物标记物的发现由于生物样的判别分类以及生物标记物的发现由于生物样品的组成复杂,在得到分析对象的原始谱图后,首先需要对数据进行预处理品的组成复杂,在得到分析对象的原始谱图后,首先需要对数据进行预处理(归一化和滤归一化和滤噪噪),消除干扰因素,保留有用信息消除干扰因素,保留有用信息 数据的解析可分为如下数据的解析可分为如下3个基本步骤:个基本步骤:(1)提取出色谱分离后未能有效分开的代谢物峰并得出其相应浓度;提取出色谱分离后未能有效分开的代谢物峰并得出其相应浓度;(2)根据其保留时间及质谱图等信息鉴别有效峰所代表的化合物;根据其保留时间及质谱图等信息鉴别有效峰所代表的化合物;(3)根据代谢数据建立代谢网络模型。
根据代谢数据建立代谢网络模型;.29 代谢组学分析得到的是信息含量丰富的多维数据,应用模式识别和多维统计分析等方代谢组学分析得到的是信息含量丰富的多维数据,应用模式识别和多维统计分析等方法能从这些大量的数据中充分挖掘出其中的信息,这些方法能够为数据降维,使它们更易法能从这些大量的数据中充分挖掘出其中的信息,这些方法能够为数据降维,使它们更易于可视化和分类于可视化和分类 目前数据分析常用的两类算法是基于寻找模式的非监督方法目前数据分析常用的两类算法是基于寻找模式的非监督方法 (unsupervised method) (unsupervised method) 和有监督方法和有监督方法 (supervised method)(supervised method) 非监督方法非监督方法 是用来探索完全未知的数据特征的方法,对原始数据信息依据样本特性进行是用来探索完全未知的数据特征的方法,对原始数据信息依据样本特性进行归类,把具有相似特征的目标数据归在同源的类里,并采用相应的可视化技术直观地表达归类,把具有相似特征的目标数据归在同源的类里,并采用相应的可视化技术直观地表达出来。
应用在此领域的常见方法有聚类分析出来应用在此领域的常见方法有聚类分析 (cluster analysis) (cluster analysis) 和主成分分析和主成分分析 (principal components analysis(principal components analysis,,PCA) PCA) 等 ;.30 聚类分析依据物以类聚的原理分析具有相似性的事物,将分类对象置于一个多维聚类分析依据物以类聚的原理分析具有相似性的事物,将分类对象置于一个多维空间中,根据事物彼此不同的属性进行辨认,将性质相近的归入一类,这样归在同一空间中,根据事物彼此不同的属性进行辨认,将性质相近的归入一类,这样归在同一类的事物具有高度的相似性;聚类分析就是把事物按其相似程度进行分类,并找出每类的事物具有高度的相似性;聚类分析就是把事物按其相似程度进行分类,并找出每一类事物共同特征的分析工具一类事物共同特征的分析工具 具体到代谢组学中,被归入一类的物质有相同的特征,可能有相同的功能作用,具体到代谢组学中,被归入一类的物质有相同的特征,可能有相同的功能作用,这样通过同一类事物中一个研究较为清晰的物质可以推断该类中其他物质的功能作用。
这样通过同一类事物中一个研究较为清晰的物质可以推断该类中其他物质的功能作用聚类分析过程通常可分为以下步骤:数据收集并且收集相应的变量;产生一个相似矩聚类分析过程通常可分为以下步骤:数据收集并且收集相应的变量;产生一个相似矩阵;决定把目标总体细分为几类,及其对每一种类别相应的定义;实施聚类分析,产阵;决定把目标总体细分为几类,及其对每一种类别相应的定义;实施聚类分析,产生结果 ;.31 主成分分析是目前应用最为广泛的多维分析方法之一主成分分析是目前应用最为广泛的多维分析方法之一PCA PCA 的特点是将分散在一组的特点是将分散在一组变量上的信息集中到某几个综合指标,即主成分变量上的信息集中到某几个综合指标,即主成分 (principal component(principal component,,PC) PC) 上,利上,利用这些主成分来描述数据集内部结构,实际上也起着数据降维的作用用这些主成分来描述数据集内部结构,实际上也起着数据降维的作用 主成分是由原始变量按一定的权重经线性组合而成的新变量这些变量具有以下性主成分是由原始变量按一定的权重经线性组合而成的新变量。
这些变量具有以下性质:质:1)1)每一个每一个 PC PC 之间都是正交的;之间都是正交的;2)2)第第1 1个个 PC PC 包含了数据集的绝大部分方差,第包含了数据集的绝大部分方差,第2 2个个次之,依此类推这样,由头次之,依此类推这样,由头2 2个或个或3 3个个 PC PC 作图,就能够很好地代表数据集所包含的生作图,就能够很好地代表数据集所包含的生物化学变化物化学变化 ;.32有监督方法 如果存在一些有关数据的先验消息和假设,有监督方法比非监督方法有监督方法 如果存在一些有关数据的先验消息和假设,有监督方法比非监督方法更适合且更有效有监督方法在已有知识的基础上建立信息组更适合且更有效有监督方法在已有知识的基础上建立信息组 (class (class information)information),并利用所建立的组对未知数据进行辨识、归类和预测并利用所建立的组对未知数据进行辨识、归类和预测 在这类方法中,由于建立模型时有可供学习利用的训练样本,所以称为有监督在这类方法中,由于建立模型时有可供学习利用的训练样本,所以称为有监督学习应用于该领域的常见方法有线性判别分析学习。
应用于该领域的常见方法有线性判别分析 (linear discrimination (linear discrimination analysis)analysis)、偏最小二乘法、偏最小二乘法- -显著性分析显著性分析 (PLS-discrimination analysis) (PLS-discrimination analysis) 和人工和人工神经元网络神经元网络 (artificial neural networks(artificial neural networks,,ANN) ANN) ;.33网上数据库 在信息时代,代谢组学的分析离不开各种代谢途径和升华数据库,利用网上数据库 在信息时代,代谢组学的分析离不开各种代谢途径和升华数据库,利用网络资源进行研究是必不可少的,与基因组学和网络资源进行研究是必不可少的,与基因组学和蛋白组学已有较完善的数据库供搜索使用相比,目前代谢组学研究尚无类似的功能完蛋白组学已有较完善的数据库供搜索使用相比,目前代谢组学研究尚无类似的功能完备数据库备数据库DOME () DOME () 有许多关于代谢物的原始数据和分析结果,分析结果用多维统计软件处理后有许多关于代谢物的原始数据和分析结果,分析结果用多维统计软件处理后可用于可用于 OMEs OMEs 的浏览器的浏览器 (BROME) (BROME) 浏览。
浏览 MetaCyc () MetaCyc () 是一个关于代谢物的数据库,阐述了超过是一个关于代谢物的数据库,阐述了超过150150种生物体中的代谢途径,包种生物体中的代谢途径,包含了从大量的文献和网上资源中得到的代谢途径、反应、酶和底物的资料含了从大量的文献和网上资源中得到的代谢途径、反应、酶和底物的资料MMP () MMP () 对主要代谢途径及涉及的关键酶进行了详尽的描述对主要代谢途径及涉及的关键酶进行了详尽的描述 ArMet () ArMet () 是一个涵盖大部分植物代谢组学研究工作的网站,包含了这些工作开展的是一个涵盖大部分植物代谢组学研究工作的网站,包含了这些工作开展的时间,甚至还有详细的实验步骤,并将代谢物信息标准化,以便于研究者交流时间,甚至还有详细的实验步骤,并将代谢物信息标准化,以便于研究者交流;.34第三章第三章 代谢组学的应用代谢组学的应用代谢组学在微生物领域的应用代谢组学在微生物领域的应用 ( (一一) )微生物分类微生物分类, ,突变体筛选以及功能基因研究突变体筛选以及功能基因研究 经典的微生物分类方法多根据微生物形态学以及对不同底物的代谢情况进行表 经典的微生物分类方法多根据微生物形态学以及对不同底物的代谢情况进行表型分类。
最近型分类最近, ,随着分子生物学的突飞猛进随着分子生物学的突飞猛进, ,基因型分类方法如基因型分类方法如16SrDNA16SrDNA测序测序,DNA,DNA杂杂交以及交以及PCRPCR指纹图谱等方法得到了广泛应用然而指纹图谱等方法得到了广泛应用然而, ,某些菌株按照基因型与表型两类某些菌株按照基因型与表型两类方法分类会得出不同的结果因此方法分类会得出不同的结果因此, ,根据不同的分类目的联合应用这两类方法已成根据不同的分类目的联合应用这两类方法已成为一种趋势为一种趋势BIOLOGBIOLOG等方法在表型分类中应用较为广泛等方法在表型分类中应用较为广泛, ,但是但是, ,代谢谱分析方法代谢谱分析方法(metabolic p rofiling)(metabolic p rofiling)异军突起异军突起, ,逐渐成为一种快速、高通量逐渐成为一种快速、高通量, ,全面的表型分类方全面的表型分类方法;.35 采用代谢组分类时采用代谢组分类时, ,可以通过检测胞外代谢物来加以鉴别常用的胞外代谢物可以通过检测胞外代谢物来加以鉴别常用的胞外代谢物检测方法为样品衍生化后进行检测方法为样品衍生化后进行GC2MSGC2MS分析、薄层层析或分析、薄层层析或HPLC2MSHPLC2MS分析分析, ,最后通过特征最后通过特征峰比对进行分类。
峰比对进行分类BundyBundy等采用等采用NMRNMR分析代谢谱成功地区分开临床病理来源以及实分析代谢谱成功地区分开临床病理来源以及实验室来源的不同杆菌验室来源的不同杆菌(bacillus cereus)(bacillus cereus) 除了表型分类外除了表型分类外, ,代谢组学数据可以应用于突变体的筛选在传统研究中的沉代谢组学数据可以应用于突变体的筛选在传统研究中的沉默突变体默突变体( (即未发生明显的表型变化的突变体即未发生明显的表型变化的突变体) )内内, ,突变基因可能导致了某些代谢途突变基因可能导致了某些代谢途径发生变化径发生变化, ,通过代谢快照通过代谢快照(metabolic snap shot)(metabolic snap shot)可以发现该突变体并研究相应可以发现该突变体并研究相应基因的功能基因的功能;.36( (二二) )发酵工艺的监控和优化发酵工艺的监控和优化 发酵工艺的监控和优化需要检测大量的参数 发酵工艺的监控和优化需要检测大量的参数, ,利用代谢组学研究工具可以减少实验数量利用代谢组学研究工具可以减少实验数量, ,提高检测通量提高检测通量, ,并有助于揭示发酵过程的生化网络机制并有助于揭示发酵过程的生化网络机制, ,从而有利于理性优化工艺过程。
从而有利于理性优化工艺过程 BuchholzBuchholz等采用连续采样的方法研究了大肠杆菌在发酵过程中的代谢网络的动力学变化等采用连续采样的方法研究了大肠杆菌在发酵过程中的代谢网络的动力学变化他们在葡萄糖缺乏的培养液培养的大肠杆菌中加入葡萄糖他们在葡萄糖缺乏的培养液培养的大肠杆菌中加入葡萄糖, ,并迅速混匀并迅速混匀, ,按每秒按每秒4 4~~5 5次的频率次的频率连续取样利用酶学分析、连续取样利用酶学分析、HPLC/LC2MSHPLC/LC2MS等手段监测样品中多达等手段监测样品中多达3030种以上的代谢物、核苷以及种以上的代谢物、核苷以及辅酶辅酶, ,从而解析了葡萄糖以及甘油的代谢途径和底物摄取体系通过统计学分析建模从而解析了葡萄糖以及甘油的代谢途径和底物摄取体系通过统计学分析建模, ,发现在发现在接触葡萄糖底物后的接触葡萄糖底物后的1515~~25s25s范围内范围内, ,大肠杆菌体内发生的葡萄糖代谢物变化与经典生化途径大肠杆菌体内发生的葡萄糖代谢物变化与经典生化途径相符相符, ,但随后的过程则与经典途径不符但随后的过程则与经典途径不符, ,推测可能存在新的未知调控步骤。
推测可能存在新的未知调控步骤TakorsTakors认为认为, ,通过上通过上述代谢动力学研究述代谢动力学研究, ,掌握代谢途径及网络中的关键参数掌握代谢途径及网络中的关键参数, ,将直接有利于代谢工程的优化将直接有利于代谢工程的优化, ,包括菌包括菌株的理性优化以及发酵参数的调控株的理性优化以及发酵参数的调控 ;.37( (三三) )环境微生物研究环境微生物研究 微生物降解是环境中去除污染物的主要途径深入了解污染物在微生物内的代谢途 微生物降解是环境中去除污染物的主要途径深入了解污染物在微生物内的代谢途径径, ,将有助于人们优化生物降解的条件将有助于人们优化生物降解的条件, ,从而实现快速的生物修复这些代谢中间体大都从而实现快速的生物修复这些代谢中间体大都通过萃取、分析方法进行逐个研究通过萃取、分析方法进行逐个研究, ,并借助专家经验拟合出代谢途径并借助专家经验拟合出代谢途径, ,其动力学过程亦很其动力学过程亦很少触及代谢组学方法的采用有可能改变这一现状代谢组学方法的采用有可能改变这一现状 BoersmaBoersma等采用代谢组学方法研究氟代酚的微生物降解途径。
氟代化合物具有特殊等采用代谢组学方法研究氟代酚的微生物降解途径氟代化合物具有特殊的的1919F F核磁共振属性核磁共振属性, ,1919F F的核磁共振灵敏度与的核磁共振灵敏度与1H1H核相近核相近; ;由于生物体内无内源性由于生物体内无内源性1919F F核磁信核磁信号号, ,因而无本底干扰所有因而无本底干扰所有1919F F核磁信号均可归结于异生素及其代谢物核磁信号均可归结于异生素及其代谢物1919F F核的化学位移核的化学位移值宽值宽, ,约为约为700ppm(700ppm(1 1H H为为15ppm,15ppm,1313C C为为250ppm)250ppm)较宽的化学位移导致较宽的化学位移导致19 19 F F在不同取代物的峰在不同取代物的峰图不易产生重叠因此图不易产生重叠因此, ,借助核磁共振技术可以更方便地研究含氟化合物的代谢中间体借助核磁共振技术可以更方便地研究含氟化合物的代谢中间体 ;.38代谢生物学在药物研发和疾病研究中的应用代谢生物学在药物研发和疾病研究中的应用 代谢组学在疾病动物模型的确证、药物的筛选、药效及毒性评价、作用机制和临床评价代谢组学在疾病动物模型的确证、药物的筛选、药效及毒性评价、作用机制和临床评价等方面有着广泛的应用。
等方面有着广泛的应用 Nicholson 研究小组利用研究小组利用NMR代谢组学技术,在药物毒性评价方面开展了深入研究,代谢组学技术,在药物毒性评价方面开展了深入研究,结果表明代谢组学方法可判断毒性影响的组织器官极其位点,推测药物相关作用机制确定结果表明代谢组学方法可判断毒性影响的组织器官极其位点,推测药物相关作用机制确定与毒性有关的签字生物标志物;变在此基础上建立棵供毒性预测的专家系统及毒物影响动与毒性有关的签字生物标志物;变在此基础上建立棵供毒性预测的专家系统及毒物影响动物内源性代谢物随时间的变化轨迹物内源性代谢物随时间的变化轨迹 代谢组学在疾病的研究中的应用主要包括病变标志物的发现、疾病的诊断、治疗和愈后代谢组学在疾病的研究中的应用主要包括病变标志物的发现、疾病的诊断、治疗和愈后的判断 目前报道较多在疾病研究的应用,如新生儿的代谢紊乱、冠心病、膀胱炎、高血压和精目前报道较多在疾病研究的应用,如新生儿的代谢紊乱、冠心病、膀胱炎、高血压和精神系统疾病等神系统疾病等;.39 Nicholson Nicholson及其工作组发现了给予氨基半乳糖的大鼠可以被分为有反应和无及其工作组发现了给予氨基半乳糖的大鼠可以被分为有反应和无反应两组,而这两组动物可以根据它们在给药前的尿代谢物来区分,他们第一次提反应两组,而这两组动物可以根据它们在给药前的尿代谢物来区分,他们第一次提到药物代谢组学的概念,并将其定义为到药物代谢组学的概念,并将其定义为““根据用药前代谢产物的特点来预测对个人根据用药前代谢产物的特点来预测对个人进行药物或外来物的干预的结果进行药物或外来物的干预的结果””。
;.40NMR flow probeN2 gasVarian Inova 600Shielded magnet120 ul flow probeGilson 215 autosamplerBiomek® RobotRefrigeratedMetabolismCage (0o C.)Frozen Storage+ NaN3Deuterated BufferTSPData Processing;.41SynthesisEfficacy/HTSEfficacy/In VivoLeadTOXINDP1P2P3Metabonomics in Drug DevelopmentPreclinical Efficacy BiomarkersPreclinical Safety Biomarkers andMechanismsRapid Throughput Tox ScreeningClinical Efficacy BiomarkersClinical Safety BiomarkersPreLead PrioritizationDevelopment Timeline (Not to Scale);.42;.43代谢组学在植物研究中的应用代谢组学在植物研究中的应用 植物代谢组学研究大多集中在代谢轮廓或代谢指纹图谱上。
根据代谢对象的植物代谢组学研究大多集中在代谢轮廓或代谢指纹图谱上根据代谢对象的不同,植物代谢组学的研究主要包括:不同,植物代谢组学的研究主要包括:1.1.某些特定种类植物的代谢组学研究某些特定种类植物的代谢组学研究2.2.不同基因型植物的代谢学表型研究不同基因型植物的代谢学表型研究3.3.某些生态型植物的代谢组学某些生态型植物的代谢组学4.4.受外界刺激后植物自身的免疫应答受外界刺激后植物自身的免疫应答 代表性研究工作:利用代谢产物进行分类、鉴别和寻求植物代谢过程中的关代表性研究工作:利用代谢产物进行分类、鉴别和寻求植物代谢过程中的关键基因;.44代谢组学与中医药现代化代谢组学与中医药现代化 中药成分复杂,数量和质量制约因素多,作用机制不明,毒性和不良反应认识不中药成分复杂,数量和质量制约因素多,作用机制不明,毒性和不良反应认识不足,研究水平低,这些因素严重影响了中医药的发展,不能为西方社广泛接受足,研究水平低,这些因素严重影响了中医药的发展,不能为西方社广泛接受 代谢组学的核心是研究外源性物质对生物体所产生的整体效应用它研究对机体代谢组学的核心是研究外源性物质对生物体所产生的整体效应。
用它研究对机体所形成的内源性代谢组的系统作用时,其研究方法与中医药治疗疾病的整体观念相一所形成的内源性代谢组的系统作用时,其研究方法与中医药治疗疾病的整体观念相一致,用其研究中药,对中药的药效作用物质基础、产生毒副作用的物质基础,正确认致,用其研究中药,对中药的药效作用物质基础、产生毒副作用的物质基础,正确认识用药剂量和疗程、防止毒性反应都有重要意义识用药剂量和疗程、防止毒性反应都有重要意义 中药代谢与肠道菌群密切相关,了解肠道菌群的基因组对中药汤剂的毒性和有效中药代谢与肠道菌群密切相关,了解肠道菌群的基因组对中药汤剂的毒性和有效性的反应调节机制,可能会开发出一种突破性的治疗方法性的反应调节机制,可能会开发出一种突破性的治疗方法————调节人体菌群治疗疾病调节人体菌群治疗疾病;.45代谢组学的问题和展望代谢组学的问题和展望1.1.庞大数据的处理问题庞大数据的处理问题————如何建立合理有效的数据分析平台如何建立合理有效的数据分析平台2.2.数据的解释问题数据的解释问题————如何判断代谢组分析结果与基因的表达或阻遏的对应如何判断代谢组分析结果与基因的表达或阻遏的对应3.3.低浓度代谢物的分析低浓度代谢物的分析————如何富集低浓度代谢物而不引起试验误差如何富集低浓度代谢物而不引起试验误差4.4.代谢组学和其它组学的拟合代谢组学和其它组学的拟合5.5.商品化的数据软件和图谱库缺乏、不完善商品化的数据软件和图谱库缺乏、不完善6.6.细胞代谢的瞬时状态较难反映细胞代谢的瞬时状态较难反映 代谢组学的发展仍处于初始阶段,在方法学和应用两方面均面临极大的挑战,需要其他学科代谢组学的发展仍处于初始阶段,在方法学和应用两方面均面临极大的挑战,需要其他学科的配合和交叉。
的配合和交叉 全组分分析和动态分析将不断发展,非歧视性检测尚待时日;能否从大量代谢产物中找出特全组分分析和动态分析将不断发展,非歧视性检测尚待时日;能否从大量代谢产物中找出特异性生物标志物决定了此技术能否在广泛应用的重要因素,不同代谢组学的整合建成的网络异性生物标志物决定了此技术能否在广泛应用的重要因素,不同代谢组学的整合建成的网络图对于快速识别早期标志物及生理过程的关键组分非常有用图对于快速识别早期标志物及生理过程的关键组分非常有用 应用方面,代谢组学要想生存发展,必然要有特色,要从表形入手回答其他组学不能回答的应用方面,代谢组学要想生存发展,必然要有特色,要从表形入手回答其他组学不能回答的生物问题生物问题。
