医生如何书写系统评价和meta分析——辑文编译4013.doc
12页医生如何书写系统评价和 meta 分析?——辑文编译 4013摘要:当针对某一临床问题的高等级临床试验很少时,对系统评价的结果解释就比较困难但是,如果坚持使用严格的评价方法(包括全面的文献检索、主要研究的质量评价、恰当的统计学方法、对估计值和偏倚风险的信度评估等),就可以将偏倚风险降到最低,并可能得出有用的结论因此,本文的目的是:(I)总结外科学领域全面严格的系统评价和 meta 分析的重要特征;(II)强调几个未广泛应用的统计学方法,相对于传统的两两对照数据合成,这些方法可能会开阔更广泛有趣的视野;(III)为全面分析和结果撰写提供一个指南1、构建临床问题在检索文献之前,必须先构建好既清晰准确又适于做系统评价或 meta 分析的临床问题为了改善现有临床认知、实践、指南和决策,仔细评估临床问题的意义和适用性是非常重要的构建临床问题有一个公认方法就是采取 PICO 格式PICO 即清晰的定义研究人群(P), 干预(I),对照(C),结局(O)(1) 例如,在最近一篇无缝合主动脉瓣置换的系统评价和 meta 分析(8)中,研究人群定义为需要进行外科主动脉瓣置换的患者(P), 干预是微创主动脉瓣置换(I),对照是传统主动脉瓣置换(C),结局包括围手术期死亡率和并发症(O)。
J 构建一个好的临床问题的难点在于定义研究人群和干预方式的范围为了确定问题的范围,评价者必须充分理解现有的文献证据、潜在不足和不确定因素,并了解系统评价或 meta 分析或许可以补充哪些不足、回答哪些问题范围综述(scoping review)有助于探索现有证据的范围并帮助确定临床问题的范围当构建临床问题时,需要考虑现有证据的等级和研究设计例如,如果有可以纳入足够的随机对照试验(RCT),则可将系统评价的范围限定为仅纳入 RCT,这样可以避免非随机研究带来的选择性偏倚相反,如果可纳入的RCT 较少,而证据主要局限于观察性研究时,评价者则可以考虑将范围扩展到为同时纳入 RCT 和观察性研究为了分析非随机设计对结局效应量的影响,可以进行二次分析,即亚组分析和敏感性分析 (10,11)当进行 meta 分析时,问题可能会更窄,例如仅纳入对比两种干预方式的试验相似的逻辑也适用于设定研究人群、干预、对照及结果的范围例如,如果人群定义的过宽,则众多的危险因素会影响结局效应估计值,进而产生错误的趋势和结论(12,13)例如,年轻患者 (70 岁)因为潜在并存病及手术风险不同,所以植入的主动脉瓣耐用度方面也存在着差异。
因此若合成所有年龄患者的无再手术率数据,则会所得出一个不准确的全年龄组瓣膜耐用度一个清晰的问题应该既有临床意义又有严格定义的研究人群、干预方式、对照和结局指标当问题不清晰时,系统评价就会模糊、结构差、异质性强,此时会产生一系列风险,并且得出无效的结果我们推荐在制作系统评价之前J先写作或发表一个研究计划书(15,16) 此研究计划书应充分定义纳入排除标准、研究对象、干预、结局指标和统计分析策略2、文献检索下一步,作者应根据要回答的临床问题预先设定纳入及排除标准,并在最终文稿中写明此标准可能包括:拟纳入研究的设计(RCT 还是所有研究类型;仅对照研究)、研究人群特点( 性别、年龄、疾病)、研究发表语言以及发表时间(比如纳入 2000 年以后发表的研究)排除标准包括但不限于:低级证据(如仅有摘要)、会议论文,社论及专家观点、重复随访报道同一组人群的研究、每组少于 10 个样本的研究等等应该考虑到纳入排除标准所引起的潜在偏倚,并与系统评价结果一同讨论为了全面系统的检索原始研究,推荐检索多个数据库(17)经典的电子数据库包括 MEDLINE, EMBASE, PubMed, Cochrane Central Register of Controlled trials 和 ACP。
如果仅检索一个数据库,则很可能存在漏检,因此是不推荐的(18,19)非常重要的是,评价者应该根据其预设的临床问题使用关键词、MeSH 词以及布尔逻辑符,比如 “AND”,“OR”,和“NOT”根据PRISMA 指南(20) ,在系统评价中需至少提供一个检索策略,可以作为文章表格或补充表格或者附录数据文献检索应该至少由两个评价者分别独立完成两人对最终纳入文章的任何不一致意见都应该由讨论和协商解决而且,需要进行附加检索,包括检索注册试验、纳入研究的参考文献、外语文献和与领域内专家交流等在终稿中,应该按照 PRISMA 流程图标明整体检索策略J 3、研究质量评价纳入研究的内在偏倚风险会影响最终结果的真实性(validity)因此,需要依据 Cochrane 或 MOOSE 指南对纳入研究进行质量评价许多不同的清单和工具可以用来评估研究内部偏倚(24,25)考克兰协作组Review Manager 软件内置有 RCT 质量评价工具,其包括如下方面:随机序列生成、分配隐藏、受试者盲法、结局评估盲法、不完整结果数据、选择性报告结果、以及其他偏倚来源RCT 常被认为是系统评价和 meta 分析该纳入的最佳高质量金标准研究。
但是,不同的 RCT 在方法学和报告质量上有差异因此,对所有纳入的 RCT 进行质量评估是非常重要的高质量 RCT 应该遵循随机对照试验报告规范(CONSORT),CONSORT 标准包括 22 个清单条目和流程图(28) 也有许多清单可以评估观察性研究(29-31)其中一个是荷兰考克兰协作组建立的,而另一个常用清单是 STROBE (29)MOOSE 工具(31)的主要方面包括:(I) 清晰定义研究人群;(II) 清晰定义结局以及结局评估;(III)独立评估结局参数; (IV)足够的随访; (V) 随访时无选择性失访;(VI)识别重要混杂因素和预后因素强烈推荐采用这些清单来严格评估纳入研究的质量完整清单应该以文中表格或者补充表格形式出现在系统评价中应该由至少两个评价者独立进行偏倚风险评估,而且任何差异都应该通过讨论达成共识表格 1 是最近发表的外科领域系统评价(8,32)中的风险评估表单对于不符合预先设定的质量要求的研究,需要谨慎考虑在进一步的统计分析中是否合纳入,比如可以通过敏感性分析识J别异质性或通过累积 meta 分析(33-35)来识别时间对效应量的影响 (34,36,37)。
4、数据提取数据提取应该基于预先做好的提取表格进行,此表格内容包括预先定好的人口学数据、手术参数和结局指标等数据提取应该至少由两个评价者独立进行,并通过协商解决不一致意见这样可以降低评价者偏倚风险、错误和主观性5、统计学方法概括统计量需要基于系统评价类型和可用数据选择统计方法当系统评价研究某外科干预而没有对照组时,可以采用描述性统计方法报道连续性变量的均数、标准差及范围如果研究间的人群特点或纳入/排除标准足够相似,则可以进行加权率的 meta 分析,即采用随机效应模型合并单臂队列研究此类 meta 分析的一个例子就是采用加权合并分析无缝合主动脉瓣置换术(SU-AVR)(8)后随访 12个月的瓣周漏发生率对于基于对照研究的系统评价和 meta 分析,概要统计量的最佳表达形式就是森林图(38)森林图包括每个纳入研究效应量的加权合并,也能够提示研究间的异质性图 2 是微创主动脉瓣置换时采用胸骨小切口还是胸廓小切口对比的 meta 分析森林图(39)在森林图中,以方块表示其每个研究的效应量均J数,以水平线表示每个研究的效应量 95%置信区间方块大小代表着该研究在meta 分析中所占的权重比例黑色菱形代表 meta 分析的合成效应量,其宽度是整体置信区间。
如果此菱形方块全部在中心垂直实线的一侧,则说明两干预方式对比的效应量差异具有统计学意义(38)点估计的典型概括统计量为描述二分类变量的相对危险度(RR)或优势比(OR)和描述连续数据的加权均数差(WMD)Meta 分析的统计模型可以为固定效应模型或随机效应模型前者假设纳入研究间的真实效应相似,而后者则假设纳入研究描绘的是效应量的随机样本随机效应模型最适用于当效应量存在异质性时为了评估纳入研究间的效应量是否存在一致性,需要对异质性进行量化评估(40)常用的评估异质性的检验有两种考克兰 Q 检验可以判断该效应量异质性的有或无(41)而 I2 统计量表示变异的量级,0%说明任何变异都源于机遇(chance),I2 值越高则说明无法解释的变异越大通常来讲,I2 值大于 50%说明该效应量存在显著的异质性当存在显著异质性时,需要解释异质性的来源(40)一些方法可以用来识别异质性的潜在来源首先就是亚组分析(42)对不同亚组的结局进行相同的统计分析,并在亚组间作交互式检验来识别亚组间是否存在显著性差异如果P 值是显著性,则很大可能会在特别亚组和目标结局之间存在相关性另一个可以评估异质性的方法是下面要说的 meta 回归。
Meta 回归分析J Meta 回归分析是另一个评估异质性的方法Meta 回归分析判断自变量与因变量间是否存在显著的关联性自变量为研究或者干预的特点(例如年龄、研究时间点、手术时间),因变量为结局指标(43) 构建回归模型时可以采用 P 值和回归系数(r)评估相关性的强度显著关系表明研究变量可能是观察到的变异性的来源(8,43-45)例如图 3 的 meta 回归分析表明,采用 Perceval S 内植物时,研究时期中点与瓣周漏率呈显著负相关(8)这说明,对于瓣周漏的合并结局而言,SU-AVR 学习曲线可能是异质性的来源网络 meta 分析网络 meta 分析可能适合于评估多个干预方式(>2)治疗同一种疾病或获得同一种结局的情况众所周知,网络 meta 分析是一种多种干预方式比较的meta 分析,其目的是合并所有可能的含有多个干预方式的直接或间接对照结果,并进行整体比较(46-48)相对于传统的两两对比 meta 分析,网络 meta分析的优点是采用了间接证据,合成所有可获得的数据,可以为目前还没有头对头直接比较试验的干预方式间的对照计算效应估计值尽管本文范围不包括网络 meta 分析的统计学细节,但是仍需指出:可用的直接证据(A 比 B)和间接证据(A 比 C, C 比 B)可以采用贝叶斯统计模型运行蒙特卡罗模拟(49)。
此模型会收敛似然估计效应量,并提供一个 A 比 B 比 C 模式的对照此方法的前提假设是干预方式的对照组(比如 C)在间接对比试验间是相似的(50)J 网络 meta 分析特有软件包包括 WinBUGS 和 GeMTC 包网络 meta 分析的制作过程与传统 meta 分析相似,包括(I)从直接和间接对照研究中提取数据;(II)将数据输入软件例如 WinBUGS 或 GeMTC;(III)运行贝叶斯模型和蒙特卡罗模拟在这个首次对比中位胸骨切开、微创胸骨切开、微创胸廓切开进行微创主动脉瓣置换的系统评价中,采用了基于直接和间接证据的贝叶斯网络 meta 分析(39)因为既往很少有研究针对微创胸骨切开和微创胸廓切开进行了头对头对比,所以这种情况特别适于做网状 meta 分析此网络 meta 分析整合直接对照和间接对照证据,得出了微创胸骨切开与微创胸廓切开术对比的效应量网络 meta 分析的注意事项是,其比两种干预方式对照 meta 分析更容易受异质性的影响(51,52)在进行网络 meta 分析时,可以用几个不同的模型来评估异质性这些统计模型包括一致性模型、不一致性模型和节点拆分模型(node-splitting model)。
如果发现了显著的异质性,则需要说明不一致性模型和节点拆分模型的结果,并且要慎重得出文。





