
沃登编辑:医学论文中统计分析错误辨析与释疑_1.doc
6页医学论文中统计分析错误辨析与释疑患者例数 药物种类 疗效∶治愈未治 愈A 药30 10 B 药11 49 表2 三种药物治疗某病的疗效的观察结果患者例数 药物种类疗效∶治愈显效好转无效A 药15 49 31 5 B 药4 9 50 22 C 药1 15 45 24 表3 两所医院用三种药物治疗某病的疗效的观察结果患者例数 医院名称药物种类 疗效∶治愈显效好转无效甲A 药15 49 31 5 B 药4 9 50 22 C 药1 15 45 24 乙A 药36 115 184 47 B 药4 18 44 35 C 药1 925 4 频数只有两行两列,故简称为2 ×2 表或四格表;而表2 中的原始频数占3 行4 列,故简称为3 ×4 表, 一般被简称为R ×C 表;表3 中含有3 个定性变量(医院名称、药物种类、疗效),故被称为三维列联表, 当列联表中定性变量的个数大于等于3 时,一般被统称为高维列联表二、定性资料统计分析方法概述[1 24] 1 1 关于2 ×2 表资料的统计分析方法的合理选择:2 ×2 表资料的统计分析方法取决于其设计类型,即横断面研究设计、队列研究设计、病例 2对照研究设计和配对设计四种类型,每种类型又需考虑一些具体情况,方可选择较为合适的统计分析方法处理资料。
常用的方法有: 一般χ2 检验、校正χ2 检验、Fisher 的精确检验;计算相对危险度( RR) 、计算比数比( OR) 、检验总体RR (或OR) 与1 之间的差别是否具有统计学意义的χ2 MH 检验;配对设计定性资料的McNemarχ2 检验2 1 关于R ×C 表资料的统计分析方法的合理选择:R ×C 表资料的统计分析方法取决于表中两定性变量的性质和分析目的,按性质可将此类列联表分为以下四类:即“双向无序的R ×C 表”、“结果变量为有序变量的单向有序的R ×C 表”、“双向有序且属性不同的R ×C 表”和“双向有序且属性相同的R ×C 表”对于这些R ×C 表资料,还需结合资料所具备的条件或分析目的,选用合适的统计分析方法,他们是: 一般χ2 检验、Fisher 的精确检验; 秩和检验、Ridit 分析、有序变量的Logistic 回归分析; 秩相关分析或典型相关分析;线性趋势检验;一致性(或叫Kappa) 检验或特殊模型分析 3 1 关于高维表资料的统计分析方法的合理选择:高维表资料的统计分析方法取决于表中定性变量是否能分出“原因和结果变量”,若分不出原因和结果变量,一般需要选用对数线性模型分析法;若分得出原因和结果变量,则可分为以下3 种情形:即结组动物的发病率的比较。
对差错的辨析与释疑:从实验设计角度看,各小组之间不仅在动物数目上缺乏可比性(有些组有10 只,有些组只有2 只),而且在重要的非处理因素(如中毒的时间) 上不具有可比性,故这些均使得出的结论缺乏说服力在实验结果的表达中,使用的多为定性的描述,在统计分析部分虽交代采用了t 检验和χ2 检验,但在给出统计分析结果时未给出检验统计量的具体值,直接就写B 、C 二组与A 、C 二组比较差异无显著意义( P >0 105) ,使人不能不对其P 值的可靠性提出质疑样本较小的定性资料的统计分析,一般不宜采用χ2 检验,而应选用Fisher 的精确检验来处理 3 1 由于多方面的错误导致统计分析方法的误用 例3 某作者对TRT 组与对照组疗效进行比较,结论为TRT 组疗效显著地优于对照组的疗效, 资料见表5 对差错的辨析与释疑:其一,原作者在收集和整理资料时违背了实验设计的要求,将原本属于“重复观测”的多因素定性资料错误地按“独立重复试验”方式进行收集和整理因为两组患者中的每一位都在“第2 、6 、12 个月”被重复观察了3 次,而且每次都按完全适应、基本适应、部分适应、未适应来给出疗效的评定,此时的“疗效”是“多值有序变量”;其二, 原作者将一个三维列联表资料简单地拆分成三个独立的二维列联表资料,割裂了整体设计,无法正确反映原因与结果之间的真正联系; 其三,对结果变量(疗效) 的有序性不予理睬,简单地将其分为适应与不适应两档(因为分析的是总适应率),采用无法利用结果变量有序性信息的χ2 检验进行资料处理,其结论的可靠性大大降低(注:表中26 19% 为原文漏项) 。
果变量为二值变量的高维表、结果变量为多值有序变量的高维表和结果变量为多值名义变量的高维表对于这些高维表资料,其统计分析方法有:多元Logistic 回归分析、对数线性模型;有序变量的多元Logistic 回归分析;扩展的多元Logistic 回归分析三、定性资料统计分析错误辨析与释疑 1 1 资料整理过失及误差和对资料类型判断错子宫>8 孕周腹部手术史组别总例数年龄 百分率百分率(岁) 例数( %) 例数( %) TVH 78 45.2 68 87.2 6 7.7 LAVH102 44. 0 △ 92 90.2 ☆ 22 21.5 ▲ CISH 208 42. 7 △ 188 90. 4 ☆ 46 20.2 ▲ TAHP200 46.1 △ 112 91. 0 ☆ 44 22.0 ▲ 注:TVH: 阴道全子宫切除术;LAVH: 腹腔镜辅助阴道子宫切除术;CISH: 腹腔镜鞘内宫颈上子宫切除术; TAHP: 剖腹子宫切除术; 与TVH 组比较△χ2=0.310 4, P =0.433 1; 与TVH 组比较☆χ2= 01407 2, P = 0. 521 4 ;LAVH 组间比较▲χ2=0.949 6, P = 0. 813 4 对差错的辨析与释疑:根据原作者在文字叙述部分介绍可知,CISH 组总病例数应为228 例,其中子宫>8 孕周病例数应为208 例,而表4 中将总病例数写成208 例,将子宫>8 孕周病例数写成188 例;将TAH 写成TAHP , 且该组中子宫>8 孕周病例数应为182 例,而表4 中却写成112 例。
如此多的过失误差出现在同一张表格中,是不应该的在该表格中记录的年龄这个变量,对于每一个研究对象而言,都可以得到一个精确量化的数值,应该是 一个定量资料,若以组来概括表达,年龄应该用“ �x ±s”的形式表达,不应仅写一个数据;更为不妥的是:误用χ2 检验来分析表中后3 组的年龄与第1 组(即TVH 组) 的年龄之间的差别是否具有统计学意义另外,在表4 中,就子宫大小、腹部手术史的比较而言,原作者的用意让人感到困惑因为该试验的目的是比较微创手术TVH 、LAVH 、CISH 较常规剖腹手术TAH 优越,对于基本情况的比较应该是试图说明各组间在重要非处理因素方面均衡性好, 组间的差异无统计学意义;而将各组与同为微创手术的TVH 组比较,并不能说明微创手术组患者的·78 · 中华医学杂志2004 年1 月2 日第84 卷第1 期 Natl Med J China , January 2 ,2004 ,Vol 84 , No. 1 本例最妥当的做法是严格按重复测量设计收集资料,并采用重复测量设计定性资料的统计分析方法进行统计分析;若一定要在错误收集资料的情况(表5) 下处理资料,应将其视为结果变量为多值有序变量的三维列联表资料,可选用有序变量的多元Logistic 回归分析方法处理之。
表5 两组患者在2 、6 、12 个月时的疗效(例数) 部分总适应率适应未适应( %) χ2 值P 值对照组1080 0 6 个月TRT 组11721 12 82.1 69.30 <0.01 对照组1083 9 17 79 26.9 12 个月 TRT 组11773 23 7 14 88.0 53.64 <0.01 对照组10811 13 21 63 41. 7 注:原作者在论文中未提及使用的统计学方法,但根据给出的检验统计量的符号推测,此处采用的是目前常用的一般χ2 检验例4 1 原作者展示了实验动物的切口愈合情况和感染情况,其中一部分实验结果列在表6 中,其中甲、乙、丙分别代表切口愈合的等级,从甲到丙表示由优到劣表6 实验动物的切口愈合和感染情况实验组切口对照组切口细菌愈合情况感染率愈合情况感染率浓度鼠数 甲乙丙( %) 鼠数 甲乙丙( %) 100 30 23 2 5 23.33 30 28 0 26.60 102 27 17 3 7 37.04 30 26 1 313.33 105 30 15 5 10 50.00 29 22 3 424.14 108 30 11 4 15 63.33 30 19 2 936.67 注:除100 浓度外,102 、105 和108 浓度组差异均有显著性意义(χ2 分别为4. 31 、4. 22 和4.27 , P < 0. 05) 对差错的辨析与释疑:原作者在文章中虽未明确提及所使用的统计分析方法,但从统计表底部的注释中我们可以看到,原作者采用的是在固定细菌浓度的条件下,比较实验组与对照组切口感染率之间的差别是否具有统计学意义,采用的是一般χ2 检验。
对于“感染与否”这个二值的结果变量来说,它表7 实验动物的切口愈合情况(例) 切口愈合情况 实验分组细菌浓度甲级乙级丙级 实验组100 23 25 102 17 37 105 15 510 108 11 415 对照组100 28 02 102 26 13 105 22 34 108 19 29 四、定性资料统计分析方法合理选择的要领我们认为对于定性资料的统计分析,可以遵循这样的思路:明确实验研究的专业目的;辨清实验中存在的影响因素和观测结果;要注意资料的收集方式与实验设计是否吻合,要注意实验设计的四个基本原则(随机、对照、重复、均衡) 是否严格遵守;要注意列联表资料所对应的设计类型、资料所具备的前提条件、结果变量的性质和分析目的,在系统、全面地学习和掌握了常见的定性资料的统计分析方法之后,方可合理选用统计分析方法处理定性资料,最后还应注意检查结果解释和专业结论是否同时满足专业及统计学要求,千万不要将χ2 检验视为处理定性资料的“万能工具”,千万不要作出含糊其词的解释和专业结论沃登编辑网: 70 多个细分领域无论您的文章是中文还是英文,分属 临床医学、基础医学或生物学,沃登将为您选派对口的专业编辑,为您提供最优质、高效的服务。
沃登编辑团队可分为两类: 一、华人编辑:母语为汉语,长期在国外留学工作,均在母语为英语国家知名学府获得 MD 或 Ph.D 学位,至少 发表 20 篇以上 SCI 论文,经过沃登生物严格选拔培训最终成为沃登生物华语编辑的成员其优势在于对中国 作者逻辑思维、习惯等深刻理解、能汉语直接沟通,对一些问题能更深入的探讨,帮助作者快速、精准的解决 文中问题所在 二、外籍编辑:母语为英语,拥有 MD 或 Ph.D 学位,绝大多数任职于常春藤名校或为美国医学写作学会 (AMWA)会员,几乎都担任多本期刊的审稿人外籍编辑占有语言及文化背景的优势,能高效、最大限度的 传达文章价值,巧妙回复审稿人等沃登通过科学的管理,将华人编辑与外籍编辑完美结合,力争为作者提供 最高质的编辑服务。












