浅谈生物医学大数据及其应用
27页1、浅谈生物医学大数据及其应用 基于组学数据的因果推断与疾病预后,魏永越, MD, PhD 陈峰,教授,博导 南京医科大学公共卫生学院 3月26日武汉,概 述,整合策略及方法,实例分析,讨 论,概 述,实例分析,讨 论,整合策略及方法,生物(健康)数据之特点,优点: 质量高、精确性好 缺点: 单个变量效应微弱 变量间关系复杂,实时采集数据 实时分析数据 实时结局预警,单个数据集分析的局限性,Cell, 2014,Big Data, being pooled,48 GWAS + Validation sets,339,224 individuals,Big Data, being pooled,11 GWAS + 41 custom array studies,21594 cases vs. 54156 controls,Big Data, being Bigger,基线 多态性 拷贝数 甲基化 转录组 蛋白组 代谢组,样 本,样本类型 样本数量 数据种类 离散程度,实时 健康数据,Big Data, being Integrated,概 述,整合策略及方法,实例分析,讨 论,How to
2、deal with.,基线 多态性 拷贝数 甲基化 转录组 蛋白组 代谢组,样 本,block missing disaster,多组学数据整合,双重双向填补法整合数据,“盘活”已有数据, 提高数据的“完整性”,达到充分利用的目的。,Nature Biotechnology,2015,块状缺失数据填补,要求: 快! 尽可能维持方差/协方差结构不变 传统方法: 均值填补,MCMC填补 机器学习方法: Multi-layer perceptron(多层感知机,MLP) KNN填补,Bridging by COV,Listwise deletion(LD) 只利用#7#12号记录 Pairwise deletion(PD) 计算方差协方差矩阵时只考虑两个变量间的缺失 消去变换法,高维数据快速初筛,ERB筛选法,Journal Cover Cancer Discovery (IF=19). 11 February 2014,Journal Cover Cancer Cell (IF=23). 11 February 2013,Borrow information from human body
《浅谈生物医学大数据及其应用》由会员金****分享,可在线阅读,更多相关《浅谈生物医学大数据及其应用》请在金锄头文库上搜索。
2024-01-29 43页
2024-01-03 8页
2023-12-11 27页
2023-12-11 26页
2023-12-11 21页
2023-12-11 26页
2023-12-11 26页
2023-12-11 27页
2023-12-11 29页
2023-12-11 28页