好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

医学论文中常用卫生统计学方法失当案例浅析.ppt

58页
  • 卖家[上传人]:re****.1
  • 文档编号:571168523
  • 上传时间:2024-08-09
  • 文档格式:PPT
  • 文档大小:180KB
  • / 58 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 医学论文中常用卫生统计学医学论文中常用卫生统计学方法失当案例浅析方法失当案例浅析宁夏疾病预防控制中心胡熊2011年5月修改稿1 n n卫生统计学,对医学工作者来说,是一门十分重要的专业科学和技能现在有越来越多的卫生、医务工作者,把卫生统计学的基本理念与方法,运用到科学研究、实验检测和现场调查从设计到总结的全过程中并在撰写论文时,运用卫生统汁学的方法对数据信息资料进行加工整理、统计处理和分析2 n n笔者曾就历年来在为一些医学刊物审稿时发现的医学论文存在的常用卫生统计方法失当或不准确等问题,撰写了一篇文章发表于《宁夏医学杂志》2006年.28卷第8期之后又搜集了一些预防医学论文,将其中存在的有关常用卫生统计方法使用不当的案例摘出,企望与作者及相关刊物的编者商榷3 一、样本的代表性(样本与总体的关系)n n预防医学工作者进行现场调查或实验(试验)研究,往往都是抽样研究,而企图以此样本来阐述总体的特征但在一些论文中,作者抽取的样本实际上不足以代表或说明总体这一问题集中地反映在论文的标题上即“帽子”过大,内容不足以代表!4 n n《银川市南郊9-11岁儿童口腔保健知识调查》n n样本仅为样本仅为1 1所小学所小学4 4年级年级115115人。

      人n n《宁夏农村卫生室服务现状调查结果及成因分析》n n样本仅为样本仅为“ “我区经济条件居中的石嘴山市惠农我区经济条件居中的石嘴山市惠农区所有(区所有(5 5个乡个乡2626个村)村卫生室个村)村卫生室” ”5 n n《颅脑损伤与视力障碍》n n共收治共收治153153例颅脑损伤,其中一过性视力障碍例颅脑损伤,其中一过性视力障碍2424人,文章仅报道其中人,文章仅报道其中3 3例n n《某医院2002-2004年环境监测结果分析》n n该文监测范围:某医院临床科室该文监测范围:某医院临床科室ⅡⅡ类环境:手类环境:手术室、供应室、各种监护室、产房;术室、供应室、各种监护室、产房;ⅢⅢ类环境:类环境:治疗室、换药室、注射室、采血室治疗室、换药室、注射室、采血室n n采样仅为关好门窗在无人走动情况下,分别用采样仅为关好门窗在无人走动情况下,分别用两种消毒方法后采集空气样本,细菌培养、菌两种消毒方法后采集空气样本,细菌培养、菌落计数医院环境的总概念,环境监测的范畴)(医院环境的总概念,环境监测的范畴)6 n n《中国大陆男男性接触者受教育程度与艾滋病高危行为的关系的研究》n n样本虽包括全国样本虽包括全国3030个省区市,但其调查方法采个省区市,但其调查方法采用自填问卷方式。

      用自填问卷方式调查对象会受文化程度限制及影响)(调查对象会受文化程度限制及影响)7 n n《全球抗癫痫运动-宁夏农村癫痫流行病学调查》n n样本仅为吴忠市利通区杨马湖乡样本仅为吴忠市利通区杨马湖乡总(母)课题与分(子)课题的关系)(总(母)课题与分(子)课题的关系)8 n n《《关于血压正常值的探讨关于血压正常值的探讨》》n n样本为样本为5050例例18-2218-22岁女学生左右臂血压对比岁女学生左右臂血压对比n n文章结论:左臂高于右臂的比例大于右臂高于左臂的文章结论:左臂高于右臂的比例大于右臂高于左臂的比例,与全国常模相反比例,与全国常模相反血压个体差异大,正常值需大样本测得,仅(血压个体差异大,正常值需大样本测得,仅5050例,又分年龄组,例,又分年龄组,样本太小)样本太小)9 n n《孕妇弓形虫感染胎盘垂直传播状况的调查》.引自《中国公共卫生》.2006.22(1).12-13.n n调调查查对对象象::随随机机抽抽取取大大连连市市妇妇产产医医院院20032003年年9 9月月-2004-2004年年1 1月住院产妇月住院产妇9393人,年龄为人,年龄为21-3621-36岁。

      岁10 n n质疑:仅1个城市1所医院5个月(以秋冬季节为主)收治的产妇,此样本显然不足以代表“孕妇”这一庞大总体11 n n《8-12岁男孩唾液性激素水平半追踪研究》.引自《中国公共卫生》.2003.19(1).14-16.n n研研究究对对象象::选选取取沈沈阳阳市市沈沈河河区区3 3所所小小学学8 8岁岁6363人人、、1010岁岁6666人,共人,共129129名男孩,连续观察名男孩,连续观察3 3年12 n n质疑:仅1个城市的1个区中2个年龄组的男孩,如何能代表“8-12”岁男孩这一总体13 n n《中国儿童铅中毒及其研究现状》.引自《中华流行病学杂志》.2005.26(9).649-650.n n研研究究对对象象::采采取取分分层层随随机机抽抽样样法法抽抽取取全全国国1515个个城城市市的的儿儿童童文文章章写写道道::“ “我我们们认认为为这这次次调调查查的的结结果果是是可可靠靠的的,,能能代代表表城城市市儿儿童童的的铅铅中中毒毒现现状 ”n n在在同同期期刊刊物物就就同同一一课课题题发发表表的的另另一一篇篇文文章章的的标标题题却却是是《《中中国国1515城城市市儿儿童童血血铅铅水水平平及及影影响响因因素素现状调查现状调查》》。

      14 n n质疑:城市和农村在造成铅污染的途径、方式和程度上,存在着极大的差异遭受严重工业、交通等污染的城市儿童与数量更多的农村儿童相比较,肯定会存在较大的差异城市儿童即使样本量再大,也不能反映农村儿童的现状故以此作为“中国儿童”这一总体的代表,显然是不确切的该刊物后一篇论文的标题就准确多了15 二、统计学检验和推断二、统计学检验和推断n n在论文的第一部份即材料(对象)与方法中,许多作者往往只说明调查、观察、实验等方法,而不给出数据资料用什么卫生统计方法处理;或仅笼统地介绍使用某种统计软件,而不说明采用何种统计描述及统计推断方法;n n在论文的结果部分,许多作者往往仅列出概率P值的大小因为在方法中未介绍统计推断方法及相应的统计量值,致使读者无从知晓P值由何得出n n作者必需注意:不同的统计处理方法都有其适用的前提条件16 n n《高浓度大剂量局部灌注给药治疗耐多药肺 结 核 》 .引 自 《 中 国 防 痨 杂 志 》.2004.26(2).89-91.n n文文章章对对象象与与方方法法栏栏中中指指出出;;统统计计学学处处理理组组间间比比较较采采用用χχ2 2检检验验和和t t检检验验。

      全全文文的的观观察察指指标标为为耐耐药药病病例例数数、、痰痰检检阴阴转转率率、、病病灶灶显显著著吸吸收收率率、、并并发发症症及及不不良良反反应应病病例例数数等等,,均均为为定定性性( (分分类类变变量量) )资料17 n n质疑;定性资料是不可能采用t检验来进行统计学推断的n n希望作者在方法介绍时,认真注明统计推断方法,给出具体计算结果,再配以相应的P值,以免读者对其结论心存疑虑18 三、频数分布表的组段划分三、频数分布表的组段划分n n大样本的定量(数值变量)资料,首先要编制频数分布表在频数分布表的组段划分,各组段上、下限的确定上,容易出现以下问题:19 n n《98例慢性头痛患者脑血流图特点及临床分析》n n该文文字描述该文文字描述9898例的年龄分组为:例的年龄分组为:3030岁以下岁以下2 2例,例,31-4031-40岁岁2828例,例,41-5041-50岁岁4343例,例,51-6051-60岁岁2222例,例,6060岁以上岁以上3 3例n n在其列表中年龄组段划分则为<在其列表中年龄组段划分则为<3030、、3131、、4141、、5151、>、>6060前者各组上、下限封口,后者仅为各年龄组而非年龄(前者各组上、下限封口,后者仅为各年龄组而非年龄段)段)20 n n《中国18岁及以上人群血脂水平及分布特征》及《中国18岁及以上人群血脂异常流行特点研究》.均引自《中华预防医学杂志》.2005.39(5).302-310.n n该该研研究究对对象象为为4925349253名名1818岁岁及及以以上上人人群群,,属属大大样样本。

      本n n两两篇篇文文章章的的文文字字描描述述和和绝绝大大部部分分附附表表中中, ,年年龄龄段段的的划划分分均均为为18-4418-44岁岁、、45-5945-59岁岁、、≥≥6060岁岁而而第第二篇文章的表二篇文章的表1 1则将年龄段标为则将年龄段标为18-18-、、45-45-、、≥≥6060 21 n n质疑:组段划分以上述文章为例,如上、下限均标出,即上下封口,它的确切含义应该理解为18-44岁组,即刚满18岁到刚满44岁止,而45-59岁组,则为刚满45岁到刚满59岁止那么44岁零几个月而又足45岁者应划在哪个组?而后文表1年龄分组的标记方式是正确的,只给出各组段的下限值(或上限值),在其后(前)划一“~”符号即可22 n n《会宁县1998年麻疹爆发的流行病学调查分 析 》 .引 自 《 西 北 预 防 医 学 杂 志 》.2005.8(2).32-34.n n文文中中各各年年龄龄段段的的划划记记为为::<<1 1岁岁、、1-41-4岁岁、、5-85-8岁岁、、9-129-12岁、岁、13-1513-15岁、>岁、>1515岁n n关关于于频频数数表表各各组组段段标标记记的的案案例例还还有有许许多多, ,笔笔者者不不再一一例举。

      正确的方法上例已经交待了再一一例举正确的方法上例已经交待了23 四、算术平均数及标准差四、算术平均数及标准差n n《《新生儿黄疸血清总胆汁酸测定的临床意义新生儿黄疸血清总胆汁酸测定的临床意义》》n n该文对新生儿黄疸之血清总胆汁酸(该文对新生儿黄疸之血清总胆汁酸(TBATBA)、总胆红素()、总胆红素(TBilTBil),),直接胆红素(直接胆红素(DBilDBil))》》,丙氨酸氨基转移酶(,丙氨酸氨基转移酶(ALTALT)进行测定进行测定注:注:* *与对照组比较p<,与对照组比较p<,△△与母乳组比较p<与母乳组比较p<24 n n《毒鼠强中毒救治方法的临床研究》25 n n《《宁夏农村卫生室服务现状调查结果及成因分析宁夏农村卫生室服务现状调查结果及成因分析》》n n该文调查内容之一为村卫生室面积、使用年限及间数(表中缺单该文调查内容之一为村卫生室面积、使用年限及间数(表中缺单位)位) (由于样本量小仅(由于样本量小仅2626个村卫生室,各指标离散程度大,其个村卫生室,各指标离散程度大,其分布状态不详,故计算 及分布状态不详,故计算 及S S是不合适的。

      是不合适的26 n n53例糖尿病患者膳食纤维的摄入量调查》.引自《中华预防医学杂志》.2005.39(5).342-344. n n本文在方法中未说明使用何种统计处理方法表中本文在方法中未说明使用何种统计处理方法表中数据也未标明是哪一类集中与离散趋势指标数据也未标明是哪一类集中与离散趋势指标, ,是否是是否是 再者, ,表中平均值含义不清表中平均值含义不清 27 n n《不同种类燃料对室内空气质量的影响》.引自《中国公共卫生》.2003. 19(2).196. 28 n n质疑:计算算术平均数的前提条件应该是该数据资料的分布是正态分布或近似正态分布,在双侧情况下, 算术平均数值应大于2.58×s但上述各例中,s均偏大,有的甚至大于均数可以判定这些资料不可能是正态分布或近似正态分布,不适宜以算术平均数及其标准差进行统计描述;因此在进一步做统计推计时也不具备进行F检验或t检验的前提条件29 n n健康人群的生理、生化等指标,往往多呈正态分布;病理状态下则可能有所改变,而中毒事故造成的人体内和环境中毒物的浓度,一般情况下多为正偏态分布统计教课书中对此类资料的描述或推断,都有相应的方法介绍(如几何均数、中位数及百分位数;非参数统计等)。

      n n作者在使用各种统计软件包时,不要忽略了计算各种指标的前提条件,否则会得出不准确的结果,从而导致不可靠甚至错误的结论30 五、率与构成比五、率与构成比n n《《临沂市无脊灰证实后急性弛缓性麻痹病例监测质量评价临沂市无脊灰证实后急性弛缓性麻痹病例监测质量评价》》n n文章的结论中认为文章的结论中认为“ “报告病例的各县区分布不均衡,病例相对集报告病例的各县区分布不均衡,病例相对集中的趋势较大中的趋势较大” ”31 n n质疑:因各县人口基数不同,故应计算各自的报告率,再以此进行比较,才能反映其真实发病强度32 n n《255例传染病统计分析》n n前言中提及前言中提及“ “为了摸清临沂市兰山区近年来传为了摸清临沂市兰山区近年来传染病流行特征及其发病动态染病流行特征及其发病动态” ”病例来源为该病例来源为该市某医院市某医院2001-20032001-2003年住院的传染病病例年住院的传染病病例n n该文结论是该文结论是“ “3 3个区个区2 2个县收治病例,临沂市最个县收治病例,临沂市最高高139139例,占例,占75.6%75.6%,其次为城乡结合部的患者,其次为城乡结合部的患者3232例,占例,占12.5%12.5%,而边远山区仅为,而边远山区仅为1010例。

      表明例表明城市居民患病率偏高城市居民患病率偏高” ”   ( (仅一所医院收治的病例,因无法计算患病率,故很难分仅一所医院收治的病例,因无法计算患病率,故很难分析流行特征、动态析流行特征、动态 ;且结论数据均为构成比且结论数据均为构成比) )33 n n《西吉县2000-2005年麻疹流行病学分析》n n其中关于职业分布:其中关于职业分布:3 3例为幼托儿童,占例为幼托儿童,占1.42%1.42%,,8080例为散居儿童,占例为散居儿童,占37.73%37.73%,,100100例为学生,例为学生,占占47.17%47.17%,,2727例为农民,占例为农民,占12.72%12.72% ( (以上数据均为构成比,不能代表各类人群的发病强度应分以上数据均为构成比,不能代表各类人群的发病强度应分别计算以上几类人群的患病率/发病率别计算以上几类人群的患病率/发病率) )34 n n《《某市某病检出阳性率某市某病检出阳性率》》n n人口资料人口资料 nn=107 =107 男男 67 67 女女 4040 <1 <1岁岁 40 1-40 1-岁岁 34 3-34 3-岁岁 3333( (分母不应用n分母不应用n=107 =107 ,而应以各组例数为分母。

      而应以各组例数为分母) )35 n n《某医院抗生素使用情况》 ( (第一个为率,后三个均为构成比;且未标明比例基数第一个为率,后三个均为构成比;且未标明比例基数) )36 n n《《海海南南州州20002000——20042004年年孕孕产产妇妇死死亡亡情情况况分分析析》》. .引引自自《《西北预防医学杂志西北预防医学杂志》》.2005.8(2).46-47..2005.8(2).46-47.n n文文中中2.3.2.3.段段为为6060例例孕孕产产妇妇死死亡亡地地点点及及死死因因顺顺位位::“ “6060例例孕孕产产妇妇死死亡亡中中, ,死死在在地地区区医医院院的的3 3例例占占5%5%县县级级1212例例占占20%20%乡乡级级2828例例占占46.6%46.6%在在家家中中生生产产者者1010例例占占16.7%,16.7%,途途中中死死亡亡者者5 5例例占占8.3%,8.3%,死死前前未未得得到到救救治治的的2 2例例占占3.3%3.3% ”( (引引文文中中标标点点符符号号按按原原文文未未做做修修改改) )该该文文对对孕孕产产妇妇孕孕期期接接受受保保健健情情况况、、5 5年年来来孕孕产产妇妇死死亡亡前前4 4位位死死因因等等内内容容, ,亦亦只只给给出出各各自自的的构构成成比比而而均均无无率率的的计计算算结结果果。

      作作者者完完全全根根据据这这些些数数据据来来进进行行分分析析判判断断同同时时文文章章并并未未进进行行排排序37 n n质疑:应该以在各级医疗机构就诊的孕产妇为分母,以在该地死亡者为分子,分别计算出各级医疗机构等的死亡率,这些率才能真实反映出孕产妇在不同医疗机构及其它地方的死亡频率只能依此来判断分析并进行排序,才能得出正确的结论38 六、标准化六、标准化n n《《宁夏孕妇缺铁性贫血调查分析报告宁夏孕妇缺铁性贫血调查分析报告》》( (注:原表合计数有误,已做改正)注:原表合计数有误,已做改正)39 n n(从表中可见,随产后周期的延长,贫血率呈下降趋势城乡两样本在产后不同周期的样本比例不同,从表中括号内数据可见,城市样本中高贫血率样本构成大,农村则低贫血率样本构成大标准化后两样本标化率分别为17.39%和16.61%40 n n《《浙江省嘉兴地区妊娠高血压综合征发病情况研浙江省嘉兴地区妊娠高血压综合征发病情况研究究》》. .引自引自《《中华流行病学杂志中华流行病学杂志》》 2005.26(2).960- 2005.26(2).960-962962 n n本文调查农村本文调查农村123903123903名孕妇名孕妇, ,诊断妊高征发病率诊断妊高征发病率11.0%,11.0%,城市城市1216712167名孕妇名孕妇, ,妊高征发病率妊高征发病率12.0%12.0%。

      文章还提示:文章还提示:“ “在病例构成方面在病例构成方面, ,城市人群轻度妊高征所占比例略大城市人群轻度妊高征所占比例略大于农村重度所占比例较小于农村重度所占比例较小, ,约为农村的三分之二约为农村的三分之二 ”文章的结论是:妊高征发病率的分布特征是城市高于文章的结论是:妊高征发病率的分布特征是城市高于农村 41 n n质疑:本文作者已经发现城、乡之间妊高征人群轻、中、重度构成比有差异这一类内部构成有差异、而各构成各自的率也不同的两组比较时,应先进行标准化,再对标准化率做进一步统计学推断否则判断孰高孰低依据不足 42 七、对照、均衡七、对照、均衡n n《《农村回、汉族人群对精神病认识对照研究农村回、汉族人群对精神病认识对照研究》》n n汉族样本取自该市城郊乡,回族样本取自该市崇兴乡汉族样本取自该市城郊乡,回族样本取自该市崇兴乡台子村台子村n n该文结论:对精神病正确认识,汉族明显优于回族该文结论:对精神病正确认识,汉族明显优于回族(x(x2 2=)=)  (两样本文化程度构成不一,而文化程度直接影响对疾病的认识,不符(两样本文化程度构成不一,而文化程度直接影响对疾病的认识,不符合科研设计对照均衡原则。

      合科研设计对照均衡原则43 八、相关、趋势八、相关、趋势n n《《噪声对女工月经和妊娠结局的影响噪声对女工月经和妊娠结局的影响》》(表中未标明(表中未标明P P值是哪两组比较所得)值是哪两组比较所得)n n该文结论是:统计结果显示自然流产发生率与噪声分该文结论是:统计结果显示自然流产发生率与噪声分贝的高低量呈相关趋势,调查组与对照组比较差异有贝的高低量呈相关趋势,调查组与对照组比较差异有显著性(显著性(P P<和<和P P<)<)(相关性与差异性不是一个概念,此文未做相关分析)(相关性与差异性不是一个概念,此文未做相关分析)44 n n《《255255例传染病统计分析例传染病统计分析》》  (此表病例数合计(此表病例数合计265265,表中缺合计,且带小数的数据究竟是由何,表中缺合计,且带小数的数据究竟是由何计算之,其比例基数为何?)计算之,其比例基数为何?)n n该文结语:该文结语:“ “性病和肝炎性病和肝炎……呈明显下降趋势,而肺结呈明显下降趋势,而肺结核从核从20022002年开始,出现明显上升趋势年开始,出现明显上升趋势” ”(该文未做任何统计学分析,包括趋势性检验且一个年度的上升(该文未做任何统计学分析,包括趋势性检验。

      且一个年度的上升或下降很难说明其趋势或下降很难说明其趋势45 n n《1989—2003年云南省艾滋病流行态势分析 》 .引 自 《 中 华 预 防 医 学 杂 志 》.2004.38(5).309-312.n n文文章章在在对对象象与与方方法法栏栏中中指指出出, ,采采用用EPIINFOEPIINFO软软件件对对调调查查资资料料进进行行统统计计分分析析文文章章结结果果显显示示::“ “女女性性性性工工作作者者、、嫖嫖客客和和男男性性性性病病患患者者等等性性乱乱人人群群中中的的HIVHIV感感染染率率逐逐年年升升高高, ,性性接接触触传传播播的的构构成成比比逐逐年年上上升升献献血血员员中中的的HIVHIV感感染染水水平平处处于于较较低水平低水平, ,但感染率在逐年上升但感染率在逐年上升 ”46 n n质疑:虽然文章说明了使用的统计软件,但未说明计算哪些统计描述和推断的指标文章也未给出相应的统计计算结果,故上述结论是否可靠、可信,值得存疑 47 n n《定西地区世行贷款结核病控制项目实施9年效果分析》.引自《中国防痨杂志》2004.26(2).72-74 48 n n质疑:文章未说明使用何种卫生统计推断方法,也未给出具体趋势性检验结果。

      n n(受文章资料所限,笔者仅能用Cox-Stuart法检验其趋势,得出P>0.05,说明不存在上升趋势49 九、统计图九、统计图n n统计表和统计图是表达统计资料的重要形式前者可代替冗长繁杂的文字描述,后者可直观地反映事物间的数量关系或变化趋势可惜的是,近年来有的高等医药院校规划教材中却删除了此章节!50 n n《宁夏卫生防疫50年》n n该书中在描述从上世纪该书中在描述从上世纪5050年代至本世纪初各类年代至本世纪初各类主要传染病发病率变化时,用普通线图来表示,主要传染病发病率变化时,用普通线图来表示,原则是不错的原则是不错的51 52 53 n n同样的数据,将其纵座标改为对数,绘制出半同样的数据,将其纵座标改为对数,绘制出半对数线图,两图比较,直观感觉不同前者显对数线图,两图比较,直观感觉不同前者显示自八十年代中期以来,疫情大幅下降且较平示自八十年代中期以来,疫情大幅下降且较平稳;而后者显示同期疫情虽有下降,但年度间稳;而后者显示同期疫情虽有下降,但年度间仍有较大幅度的波动,不可掉以轻心!仍有较大幅度的波动,不可掉以轻心!n n由于统计图对数量的表达比较粗略,故常应同由于统计图对数量的表达比较粗略,故常应同时附有统计表。

      时附有统计表54 n n以上案例,仅是在常用卫生统计学方法的范畴,经笔者筛选认为具有代表性的实例,列举出来,希望以此引起作者的关注我们在运用卫生统计学方法对论文中的数据资料进行处理时,不仅需要学会计算,更重要的是对卫生统计学的基本理念和各类统计描述和统计推断方法的适用前提条件,有更深入的理解和准确的把握,才不致於由于采用不当的方法而导致错误的结论55 联系方式联系方式n nEmail: 或n n n nTel:0951 567588556 谢谢大家!谢谢大家!57 58 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.