好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

质谱数据定量分析方法.ppt

39页
  • 卖家[上传人]:新**
  • 文档编号:588789128
  • 上传时间:2024-09-09
  • 文档格式:PPT
  • 文档大小:2.45MB
  • / 39 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 蛋白质学组中质谱数据定量分析方法研究谢红卫国防科学技术大学机电工程与自动化学院自动控制系2010.5.15 主要内容研究背景(我们对定量问题的认识) 定量数据分析面对的问题 定量数据分析的基本方法 已有定量软件和应用情况研究内容和结果 定量信息提取方法及问题 多批次定量数据的对应及重复实验 差异显著性检验 计算问题和软件开发未来工作 第一部分:研究背景第一部分:研究背景 定量数据分析面对的问题大规模Biomarker 发现---低丰度蛋白质--- 信号信号S/N低低+鉴定信息少鉴定信息少 重复实验数据综合重复实验数据综合 蛋白质和肽段预分离技术策略的数据综合Biomarker验证---靶标分析--- 靶标挑选(MRM)肽段分析效率预测(绝对定量)肽段分析效率预测(绝对定量)生物样本蛋白质表达的随机变化影响 临床诊断---直接寻找差异--- 肽段组学,肽段特征矩阵,LC-MS策略策略,信号直接对比+有选择鉴定 定量数据分析的基本方法不包括MRM、iTRAQ和SC定量标记定量无标定量 计算问题图谱定量信息提取---同位素峰簇处理肽段定量指标计算---比值计算,XIC处理,母离子误差校正RT对齐---LC-MS策略和LC-MS/MS策略的不同信号归一化---消除系统误差差异显著性检验---考虑信号强度影响 质谱信号与定量无标记:同位素峰无标记:同位素峰标记:配对的同位素峰 图谱定量信息提取方法基本方法 最大值法,平滑积分法,信号求和,构建3D peaks(MaxQuant),函数拟合附加处理 小波去噪,同位素分布约束,信噪比过滤结果形式 标记定量:比值,定量指标 无标定量:定量指标 肽段定量指标计算可选步骤可选步骤去噪处理:小波,平滑滤波XIC峰形拟合:复杂的类高斯函数XIC边界确定:信噪比,连续性,局部最小值母离子匹配误差分布:提高精度?标记定量:标记定量:比值计算,MaxQuant采用了最小二乘拟合法问题:问题:不同试剂标记的肽段XIC平移,差异越大,表现越明显无标记定量:无标记定量:定量指标计算 RT对齐LC-MS策略:策略:寻找共同的肽段信号,建立非线性模型LC-MS/MS策略:策略:利用共同鉴定肽段的RT建立对齐模型对齐模型:对齐模型:3次样条,局部回归,小波,分段线性,偏移向量等作用:作用:对LC-MS/MS策略,可以弥补鉴定信息的不足,提高MS图谱信号利用率 信号归一化和差异显著性检验信号归一化信号归一化 目的:针对无标记定量,消除不同实验间的系 统误差 基本方法:寻找不变量差异显著性检验差异显著性检验 从肽段到蛋白质的信息综合:平均?筛选? 异方差问题:信号越弱,误差分布越宽 一个例子XIC定量信息:TGVIVGEDVHNLFTYAK图谱计数SCXIC面积SA(对数)保留时间RT上样量(ug/ul)1268.5453.6616173.0707.5658.1350220.335.1559.1996300.0345.8957.6437970.003AVG_ISO_DISSCCHXCorr∆CnLM(ug/ul)12625.10.623.01432.630.333.07025.580.470.3432.80.400.3324.90.490.03424.30.720.003132.20.340.003鉴定信息数据产生LTQ/FT分析Yeast样品,SEQUEST搜库,Target-decoy过滤(FDR=0.01),取Scan number最小的记录 定量软件Cencus、CRAWDAD、MaxQuant软件在可视化、速度、数据文件格式支持、算法精度和实验策略支持等方面有很大发展空间 定量软件-Mascot支持的定量类型 多种标记定量, MS/MS图谱定量, emPAI, 重复实验Label free, 选择信号最强的3个肽段p数据处理算法特色 基于m/z和RT的对齐,多种XIC积分方法,多参数鉴定结果过滤,outliers排除,归一化处理(利用均值)p使用方法 在搜库前定义修饰和定量的参数(通过修改XML文件实现),搜库,然后使用Distiller定量 第二部分:研究内容和结果第二部分:研究内容和结果 定量信息的提取:Label free去噪方法去噪方法不去噪Xcalibur默认小波去噪谱峰定量信息谱峰定量信息最大值平滑积分函数拟合信号加和同位素峰同位素峰单一最高全部XIC处理处理小波去噪平滑去噪连续性截断误差分析XIC定量定量平滑积分函数拟合信号加和XXX图图谱谱水水平平肽肽段段水水平平X共3*4*3*4*3=432种计算流程比较原则:比较原则:重复实验的CV值最小目前结论目前结论::(1)不进行去噪处理的信号加和方法最优(2)高信号水平的处理结果CV值都比较小 定量信息提取:标记定量图谱水平:非线性拟合算法特点特点可定义一般模式,支持自定义标记方法,支持多重标记能够充分利用同位素分布信息能够直接解决谱峰叠加问题 定量信息提取:标记定量肽段水平 实现了多种算法实现了多种算法:XIC面积比, 图谱比值平均,主成分分析, 最小二乘回归采用了异常值排除策略采用了异常值排除策略实现了基于实现了基于XIC连续性的截断连续性的截断 单一同位素峰最高一同位素峰最高问题:同位素峰分布测量误差第二同位素峰最高第二同位素峰最高第三同位素峰最高第三同位素峰最高第四同位素峰最高第四同位素峰最高数据:FT_yeast, BPRC,高可信鉴定肽段 问题:从质量预测同位素分布经验公式:从IPI.Human 3.49酶切肽段中统计(胰酶,2个漏切,肽段长度不超过100)aibi1.007 0.00057920.0006321 -0.092120.00056830.022920.0005526 0.09675 0.000568 0.11380.00057950.1215 Bellew, M., M. Coram, et al., Bioinformatics, 2006. 22(15):. 重复实验的数据处理RT对齐和交叉搜索P1P2Pn…√XX√√√MS搜索搜索MS搜索搜索信息的充分利用不可逆不可逆:需要建立个RT对齐模型可逆可逆:需要建立n-1个模型工作:工作:实现了基于局部回归(采用线性函数)的可逆模型和算法,大大减小了计算量 交叉搜索的效果鉴定次数定量次数 重复实验的数据处理---信息融合问题问题:一个肽段,多个定量结果,怎样给出最终结果?方法:方法:信号归一化后,求平均值、中值或者最大值结果:结果:对简单重复来说,分组平均后组间差异更小,例如10次重复,分为两组,求5次平均。

      数据:FT_yeast, BPRC 标记定量中比值分布--信号强度H/D(3)标记实验中发现,比值的标准差随着XIC中peak number的增大而减小数据:FT,人血浆,BPRC 无标记定量中差异分布分段估计方差 带有参数的分布模型极大似然估计—直接优化似然函数初始值的选择决定成败 标记定量软件SILVERC++语言GUI交互操作批量数据处理文件格式支持:XML,Mascot dat和html多线程,图谱、XIC导出,多种输出格式,算法优化 索引文件和速度提升索引文件和数据结构Scan number到MS图谱索引:Hash表图谱中Isotopic peaks定位:二分法查找 无标记定量软件LFQuant重复实验支持定量精度和参数优化速度:1 s可以定量1000个肽段支持pepXML,protXML,mzXML,mzData,mzML蛋白质组装和未鉴定肽段搜索RT对齐、信号归一化p从搜库(SEQUEST)到定量完成的全流程自动化,有GUI界面 LC-MS策略支持软件XICFinder不需要鉴定信息,直接从MS图谱中解析同位素峰簇考虑了XIC截断,同位素峰叠加,母离子误差校正等问题提供了信噪比、同位素分布拟合优度等过滤测试:发现采用严格过滤规则,则鉴定肽段也可能不能定量,说明和LC-MS/MS策略可以相互补充 第三部分:进一步的思考第三部分:进一步的思考 预分离和信号归一化SDS分离蛋白质多条带分布条带切割的不均匀性不同实验之间信号不可比 1D-SDS PAGE 和Label free定量蛋白质的多条带分布问题没有提及多条带分布的原因:修饰、误切、可变剪接 信号归一化“局部效应”仅仅考虑了信号强度因素RPLC和ESI过程中的离子抑制效应和Matrix effect:信号的局部归一化寻找RT轴上的校正曲线:不变量 可能方法仪器加性电子噪声的不变性图谱信号统计不变量小波去噪 蛋白质组装与定量Quant:MSID score:MS/MSPCP: sequenceQuant:MSPCP: sequence影响图谱质量,从而影响 ID Score决定碎裂模式,影响 ID score蛋白质肽段RPLC分离过程中肽段之间相互影响色谱流出曲线与肽段混合物有关MS response不仅仅由肽段自身属性决定,还与其它混合在一起的肽段相关肽段检测效率预测问题肽段检测效率预测问题 贝叶斯网络蛋白质肽段肽段肽段酶切模型MS图谱(多张,组成XIC)MS/MS图谱(多张,重复鉴定)母离子误差分布同位素分布匹配XIC形状定量指标序列物理化学属性碎裂模式图谱质量搜库打分重复鉴定次数共享肽段问题:肽段有多个父节点 感谢北京蛋白质组研究中心-贺福初,钱小红,朱云平研究员北京蛋白质组研究中心-刘科辉博士,马洁博士团队主要成员: 博士---张纪阳,刘伟 博士生---孙汉昌,徐长明,张伟,刘辉,唐海 琳,王腾蛟 硕士生---马海滨 谢谢大家! 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.