综合多组学数据的肝细胞癌分层策略及进展.docx
8页综合多组学数据的肝细胞癌分层策略及进展* 王猛 李晓琴 高斌(北京工业大学环境与生命学部,北京 100124)肝细胞癌(hepatocellular carcinoma,HCC)是最常见的原发性肝脏恶性肿瘤,其占比约90%根据最新全球癌症数据统计,HCC已成为全球第六大最常诊断的癌症和第三大癌症死亡原因,其发病率在全球范围内呈上升趋势[1-2]在中国,HCC是中国第四大常见癌症和第二大癌症相关死亡原因[3],严重威胁中国人民的生命和健康流行病学调查显示,慢性肝炎和肝硬化是全球范围内诱发HCC的主要风险因素[4]除此之外,由代谢综合征、肥胖、2型糖尿病和非酒精性脂肪肝等风险因素诱发的HCC患病率正逐年增加,并在未来可能成为全球HCC发生的主要原因[5]从分子角度,HCC是由多种基因组和表观基因组改变的累积引起其中常见的包括TERT启动子、AXIN1、TP53和CTNNB1的致癌突变,染色体1q、8q的扩增,8p、22p的丢失等[6]这些发生遗传改变的基因往往与Wnt-β-catenin、细胞周期控制、AKT-mTOR、MAPK等通路有关[7]突变特征分析也表明,一些诱发DNA突变的风险因素如饮酒、吸烟以及黄曲霉毒素B1暴露等,也与已知基因的致癌突变相关[8]。
这似乎也表明,肝脏虽然可以在体内起到解毒作用,但这些有毒代谢物也可以诱导相关基因的驱动突变进而损害肝细胞基因组,从而导致癌变目前用于HCC分型的系统主要基于肿瘤负荷,在临床上,巴塞罗那临床肝癌分期系统是迄今为止预测HCC预后和指导选择治疗干预措施最常用的模型[9]而中国则根据本国国情及实践积累,依据患者体力活动状态、肝肿瘤及肝功能情况,提出了中国肝癌分期系统,共分为四期[10]但值得注意的是,这些分期系统虽然对治疗方案的选择和预后评估至关重要,但它们不足以描述影响预后和治疗反应的生物学和分子特征[11]因此十分必要开发一个HCC精确的分子分类系统随着高通量技术的不断发展和其成本的下降,癌症基因组图谱(The Cancer Genome Atlas,TCGA)、国际癌症基因组联盟(International Cancer Genome Consortium,ICGC)和肿瘤细胞系的百科全书(Cancer Cell Line Encyclopedia,CCLE)等国际合作项目已收集了同一癌症患者队列不同层次的组学数据这为癌症分子分型提供重要依据,并能够很好地反映不同亚型下癌症生物学背景的差异,对癌症的治疗有着重要影响。
单一组学的研究虽然可以单向揭示肿瘤大量信息(如转录组数据可以描述癌症之间基因表达差异),但癌症与宿主之间相互作用、癌症内部分子之间相互作用以及不同组学之间关联需要多维方法来描绘因此,多组学整合研究(即整合两个或多个组学数据,进行数据分析、可视化和解释)被认为是深入了解癌症病发机制和癌症异质性最有前景的工具[12-13]本文总结了当前HCC多组学分层策略和相关研究进展1 HCC的异质性HCC是一种在病理和分子水平上高度异质性的疾病,这种异质性可能源于不同的风险因素、遗传事件、基因表达模式、激活的通路、免疫浸润程度或肿瘤间质变化,其大致可分为瘤内异质性和瘤间异质性[14]多种组学测序和单细胞测序技术的发展能更加深入了解HCC肿瘤的异质性[15]Losic等[16]采集了来自14名HCC患者的71个区域样本,对其进行了DNA测序、RNA-seq和TCR-seq来研究HCC瘤内异质性他们发现,在同一肿瘤内部的抗原表达,免疫浸润水平均有显著差异,其中区域性克隆免疫反应对HCC瘤内异质性的形成起着重要作用为了以更高的分辨率了解这些数据,该团队对2名HCC患者中不同区域内的肿瘤进行单细胞测序,其结果进一步表明了即使在同一结节内距离较远的两个肿瘤组织,其激活的转录途径也存在着显著差异。
实际上,肿瘤异质性被认为是多种药物在癌症临床试验中失败以及对现有药物出现耐药性的主要原因Gao等[17]对10名接受根治性切除术的HCC患者的55个区域进行采样和低传代培养,并对其进行DNA测序、拷贝数分析和高通量药物筛选发现其中只有4个样本的亚区检测到FGF19、DDR2、PDGFRA和TOP1等基因改变并对相应的靶向治疗药物敏感而索拉非尼作为目前全球针对晚期HCC的一线治疗药物[18],尽管它可以略微延长晚期HCC患者生存率,但由于不同患者的肿瘤之间相关药物转运蛋白的表达、细胞内药物代谢、信号通路的激活或失活、细胞内和细胞间特性等具有一定差异,使其在大量的患者中观察到其药效性受到了不同程度的影响[19]因此,如何利用关键特征将不同的HCC患者分为相对同质的亚型,具有重要临床意义下一节将具体描述结合多种组学数据对HCC分层的策略及方法2 多组学HCC分层策略精准肿瘤学的主要目的之一便是识别癌症分子亚型,即将具有共同生物学特征或临床表型(如生存时间和药物敏感性)的患者群体进行分类,使不同患者可以根据其所属亚型不同选择更加适合其自身的治疗方案聚类是多年来相关研究人员在癌症分层中的常用算法。
至今已开发出了许多聚类方法,如层次聚类、一致性聚类、基于密度、分布或质心的方法、半监督或监督的方法等[20]本文根据输入聚类算法组学数量,将当前多组学HCC分层策略分为从单组学出发(from single-to-multi,S To M)和从多组学出发(from multi-to-multi,M To M)两大策略2.1 从单组学出发(S To M)策略S To M策略即利用单组学数据的不同特征对HCC进行分层后,结合多种组学数据寻找不同HCC亚型之间的差异分子,并验证其差异的真实性和肿瘤生物学现象的关联(如肿瘤的发生、转移、预后、免疫、代谢、信号通路等)(图1)特征选择是S To M策略的核心,多年来针对分层特征的选择可大致分为基于数据分布的方法、基于生物特征的方法和基于多组学的方法3种表1总结了近年来S To M策略下HCC分层研究的方法和结果Table 1 The summary of methods and results for stratification of hepatocellular carcinoma by using the S To M strategy表1 S To M策略肝细胞癌分层方法与结果小结Fig. 1 Hepatocellular carcinoma stratification using S To M strategy图1 从单一组学出发的肝细胞癌分层策略2.1.1 基于数据分布的方法基于数据分布的方法主要是根据数据分布特点或其在不同临床属性间的差异对特征进行筛选,其常见方法有方差筛选、变异系数筛选、中位偏差筛选、Cox模[21]等。
Ao等[22]通过单因素Cox回归模型鉴定出192组HCC预后相关基因对后,选择了其中C指数最高的20组基因对,并根据其对患者的风险评分将患者分为高低风险组综合多组学研究发现,两个亚型在基因突变和拷贝数变异上具有显著差异其中,高风险组转录特征主要为细胞增殖和肿瘤微环境等相关途径的激活,而低风险患者的转录特征在于各种代谢途径的激活,并且两个亚型之间的转录差异与其DNA甲基化差异显著相关Jiang等[23]则选取变异系数前25%的蛋白质组学数据进行非负矩阵分解(nonnegative matrix factorization,NMF)和一致性聚类将110名早期HCC患者分为3个子类(SI、SII和SIII)通过多种组学(蛋白质组、转录组和突变谱)分析发现,SI和SII具强增殖特征,并且CTNNB1的突变频率和WNT通路的激活程度要高于SIII,相比之下SIII则具有强侵袭性,其富集了很多肿瘤促进通路,并且存在抑制性免疫亚群2.1.2 基于生物特征的方法随着对癌症研究的不断深入,人们发现癌细胞可以激活不同的免疫检查点通路,以达到抑制机体免疫,促进其生长发展的目的针对PD-1/PD-L1、CTLA-4等免疫检查点的抑制剂可以重新激活抗癌免疫反应,并在某些癌症的临床治疗上展现出良好的治疗效果[24]。
有研究表明,在慢性肝炎的环境下,调节性T细胞、髓源性抑制细胞的募集以及免疫检查点CTLA-4和PD-1的上调,通常会促进HCC生长与发展[25]因此,免疫检查点抑制剂似乎是有希望的HCC治疗策略此外,肝脏作为重要代谢器官,其可以通过不同代谢物的生理调节来控制全身能量代谢,其代谢异常也往往会引起如非酒精性脂肪肝和2型糖尿病等疾病[26]实际上,一些代谢物的指标如葡萄糖和醋酸盐利用率、血清中乳酸含量已被认为是HCC有效的分层或预后指标[27]因此,目前在HCC分层策略中,针对生物学特征的提取主要为免疫特征和代谢特征Zhang等[28]对HCC免疫细胞质谱流式数据进行层次聚类,将HCC分为3个亚型其中亚型1为免疫活性亚型,具有相对正常的T细胞浸润水平,但B细胞浸润水平较低亚型2为免疫缺陷亚型,其特征在于淋巴细胞的浸润减少、树突状细胞和自然杀伤细胞的增加、单核细胞IL-1β过表达亚型3为免疫抑制亚型,其Treg细胞、Breg细胞和M2极化巨噬细胞等免疫抑制细胞的浸润水平要明显高于其他两个亚型,并且一些免疫抑制分子如PD-1、PD-L1、Tim-3和CTLA-4在该亚型中过表达Bidkhori等[29]使用转录组数据构建了一个由1 972个代谢基因组成的HCC特异性代谢网络。
之后,作者使用一种网络平滑的算法(network-based stratification,NBS)来传播每个基因的表达对其在网络相邻基因的影响[30],并将HCC分为3个子类多种组学整合分析发现3种不同亚型的代谢和信号通路在基因组、转录组和蛋白质组水平上均具有显著差异,并且3种亚型倾向依赖不同的同工酶来催化同一生化反应2.1.3 基于多组学的方法除了上述方法之外,还有一些分层特征本身是由多种组学确定的也被列入S To M策略中例如Yang等[31]对849名肝癌患者使用DriverNet算法[32](一种基于突变谱和转录谱的驱动基因发现算法),鉴定出34个HCC驱动基因在后续的分析中作者将这34个驱动基因的突变谱输入NBS算法中[30],将HCC分为3个具有显著生存差异的子类(NBS1、NBS2和NBS3)其中NBS1和NBS2富集了如TP53、AXIN1、RB1等抑癌基因,NBS3则具高CTNNB1突变频率和低抑癌基因突变频率,并且该分类模型与先前报道的基于转录组的分类模型显著相关2.2 从多组学出发(M To M)策略M To M策略则希望通过对多种组学数据(如基因组、转录组、表观基因组与肿瘤生物学的关联)进行多层面的综合分析(即从系统生物学的概念出发)全景式地展示不同亚型内各组学之间的差异与联系。
数据降维是M To M策略的核心步骤,即将多种组学数据集中放入一个低维的堆叠矩阵中,然后再对该数据矩阵实施聚类算法以获得具有多种组学特征的分层结果(图2)根据使用的算法不同,常见的M To M策略分层算法可以分为3类,基于相似性的方法、基于集成的方法和深度学习表2总结了近年来M To M策略下HCC分层研究的方法和结果Table 2 The summary of methods and results for stratification of hepatocellular carcinoma by using M To M strategy表2 M To M策略肝细胞癌分层方法与结果小结Fig. 2 Hepatocellular carcinoma stratification using M To M strategy图2 从多组学出发的肝细胞癌分策略2.2.1 基于相似性的方法基于相似性的方法主要思想是将不同的组。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


