
采用Kappa统计量评价胸部CT图像质量的评估.doc
2页1采用 Kappa 统计量评价胸部 CT 图像质量 的评估【关键词】 Kappa 统计量 胸部 CT 图像 质量评估统计学是各项研究中不可或缺的基础学科,由于统计学知识的缺乏而造成大量人力物力浪费的事例不胜枚举下面介绍统计学方法在医学影像学研究中应用的认识,现总结如下1 材料与方法1.1 材料 影像诊断的一致性检验:这是进行统计的基础,试想,诊断结果不一致,其研究结果的可信度就大打折扣,该研究价值也就不高,别的方面做得再好也无济于事所以拿到数据后首先做一致性检验适用范围 a 同一组病例,新诊断方法与金标准的一致性b 两种诊断方法对同一样本诊断结果的一致性c 两个医务人员对同一病人的诊断结论的一致性及多名医务人员的两两比较d 同一医务人员对同一组病人前后进行两次观察作出的诊断是否具有一致性1.2 方法1.2.1 两个医务人员对同一病人的诊断结论的一致性计算方法 (1)计算填写四格表:A 项为基准项或金标准,B 项为实验组或观察项目A、B 两项各设阴性(或不一致或没有病)与阳性(或一致或有病)两个指标,abcd 四个格点分别是 a 两者皆判为阳性;d 两者皆判为阴性;b(右上)假阳性点,即 A(金标准或基准者)阴性,B 判阳性;c(左下)假阴性点即 A(金标准或基准者)阳性,B 判阴性。
本例 a 点 A 医师与 B医师判定优良一致数 83 例;b 点 A 医师判合格,B 医师判优良,3 例;c 点 A 医师2判优良,B 医师判合格,3 例;d 点两人判定合格一致数 5 例(见表 1) (2)计算Kappa 值:公式 Kappa=Pa-Pe/1-Pe;Pa 为实际观察到的一致率=实际观察一致数/总观察人数;实际观察一致数=两者皆判为阳性数(a 点)+两者皆判为阴性数(d点);本例为 Pa=(83+5)/94=0.93617;Pe 为期望一致率=[(α+Χβ+)/N+(α-Χβ-)/N]/N;即两者都判为阳性格点(a 点)的行合计数×例合计数/总观察数+两者都判为阴性格点(d 点)的行合计数×例合计数/总观察数,两者之和再除以总观察数(或乘以总观察数的倒数 1/N)本例为 Pe=[(86×86/94)+(8×8/94)]/94=(78.680851+0.680851)/94=0.844273;本例 Kappa=(Pa-Pe)/(1-Pe)=(0.93617-0.844273)/(1-0.844273)=0.09189657/0.155727=0.59011 (3)计算Kappa 值的标准误[1]:本例为 SK=0.10314。
(4)为 Kappa 值的假设检验:①H0:Kappa=0②统计量 U 值:U=Kappa/SK,本例为 U=5.7214465表 1 两名医师诊断实验评价的四格表1.2.2 同一医务人员对同一组病人前后进行两次观察作出的诊断是否具有一致性 (1)计算填写四格表,A 项为基准项或金标准,B 项为实验组或观察项目A、B 两项各设阴性(或不一致或没有病)与阳性(或一致或有病)两个指标,abcd 四个格点分别是 a 两次皆判为阳性;d 两次皆判为阴性;b(右上)假阳性点,即 A 医师第一次(金标准或基准者)阴性,第二次判阳性;c(左下)假阴性点,即 A 医师第一次(金标准或基准者)阳性,第二次判阴性本例 a 点 A 医师两次判定优良一致数 74 例;b点第一次医师判合格,第二次医师判优良,5 例;c 点第一次 A 医师判优良,第二次 A 医师判合格,6 例;d 点两次判定合格一致数 9 例(见表 2) (2)计算 Kappa 值:公式 Kappa=Pa-Pe/1-Pe;Pa 为实际观察到的一致率=实际观察一致数/总观察人数;实际观察一致数=两者皆判为阳性数(a 点)+两者皆判为阴性数(d 点);本例3为 Pa=(74+9)/94=0.8829;Pe 为期望一致率={(α+Χβ+)/N+(α-Χβ-)/N}/N;即两者都判为阳性格点(a 点)的行合计数×例合计数/总观察数+两者都判为阴性格点(d 点)的行合计数×例合计数/总观察数,两者之和再除以总观察数(或乘以总观察数的倒数 1/N)。
本例为 Pe={(79×80/94)+(15×14/94)}/94=0.739;本例Kappa=(Pa-Pe)/(1-Pe)=0.551 (3)计算 Kappa 值的标准误:本例为 SK=0.102 (4)为 Kappa 值的假设检验:①H0:Kappa=0②统计量 U 值:U=Kappa/SK,本例为 U=5.4 表 2 同一名医师诊断实验评价的四格表 2 结果在胸部多层螺旋 CT 小剂量分段扫描的诊断与防护价值课题研究中对评分进行一致性检验,一致性检验的统计量 Kappa=0.59011,P0.05,有统计学意义A、B 两名医师对 CT 图像质量评分结果的一致性是较好的A、C 两名医师一致性检验的统计量 Kappa=0.5903,P0.01,有统计学意义同一医务人员对同一组病人前后进行两次观察,一致性检验的统计量 Kappa=0.551,P0.01,有统计学意义可见 A 医师前后两次对 CT 图像质量评分结果的一致性是较好的本统计方法选择正确,统计效率高,结果可信度高3 讨论医学影像学研究中选择统计学方法有自身的特点,应引起重视,应该确定一套标准的医学影像学研究适用的统计方法,使研究结果具有可比性,让大家有章可循。
要重视进行一致性检验和盲法评价[2]因为影像学是主观因素很多的学科,对同一份样本,不同的人评价不同,同一个人不同时间评价的结果前后也可能不一致结合临床实际,尽可能做到齐同对比诊断基准者的设立要慎重,手术病理结果是诊断的金标准,但是在临床研究中常难以完全做到,为了便于对比和统计,结合研4究内容设立金标准十分重要,为与手术病理的金标准区别,作者称作此为基准者或基准组本研究以常规 CT 扫描组作为基准组参考文献】1 马斌荣主编.医学科研中的统计方法.北京:科学出版社,2005.157.2 项萍,许茂盛,杨光钊.肺部单发磨玻璃样结节的 HRCT 诊断.浙江临床医学,2008,10(10):1371.。
