
关于对诊断一致性Kappa系统的探讨.doc
8页1关于对诊断一致性 Kappa 系统的探讨【关键词】 诊断试验;,,一致性检验;,,Kappa 系数,,,摘要: 对诊断一致性的简单 Kappa 系数、加权 Kappa 系数以及总 Kappa 系数进行了分析和说明,由于 Kappa 系数仅适用于行数和列数相等的方表,针对 Kappa 检验的这一局限性,给出了行数和列数不一致时使用 SPSS 软件实现 Kappa 检验的方法关键词: 诊断试验; 一致性检验; Kappa 系数 在诊断试验中,研究者希望考察不同的诊断方法在诊断结果上是否具有一致性诊断试验的一致性检验经常用于下列两种情况[1]:一种是评价新的诊断试验方法与金标准的一致性;另一种是评价两种诊断试验方法对同一个样本(化验对象)的化验结果的一致性、两个医务工作者对同一组病人的诊断结论的一致性、同一医务工作者对同一组病人前后进行两次观察作出诊断的一致性等1960年 Cohen 等提出用 Kappa 值作为评价判断的一致性程度的指标实践证明,它是一个描述诊断的一致性较为理想的指标,因此在临床试验中得到广泛的应用本研究分别给出三种 Kappa 系数,即简单 Kappa 系数,加2权 Kappa 系数和总 Kappa 系数及标准误和检验统计量的计算公式,并针对 Kappa 系数仅适用于行数和列数相等的方表的问题,给出了用 SPSS 软件实现对行列数不等资料的 Kappa 检验方法。
1 简单 Kappa 系数的计算公式[1]K=P0-Pe[]1-Pe(1)其中 P0=∑ipii,称为观测一致率,Pe=∑ipi.pi,称为期望一致率,即两次检验结果由于偶然机会所造成的一致率,其中 pi.=Ri[]N, pi=Ci[]N, Ri,Ci 分别为第 i 个格点所对的行合计和列合计,N 为总例数当两个诊断完全一致时, P0=1,此时 Kappa 值为 1当观测一致率大于期望一致率时,Kappa 值为正数,且 Kappa 值越大,说明一致性越好当观察一致率小于期望一致率时,Kappa 值为负数,这种情况一般来说比较少见根据边缘概率的计算,Kappa 值的范围值应在-1~1 之间Kappa≥075 两者一致性较好;0.75>Kappa≥0.4 两者一致性一般;Kappa<0.4 两者一致性较差Kappa 系数标准误的计算公式为:S=Pe+P2e-∑ipi.pi(pi.+pi)[](1-Pe)N(2)3其 95%的置信区间为:(k-1.96S, k+1.96S)(3)由于 Kappa 值是一个样本统计量,作是否有统计学意义的假设检验时,应选用统计量:U=Kappa[]S(4)2 加权的 Kappa 系数[2]加权的 Kappa 系数是简单 Kappa 系数的推广,是用加权的方法对两个评价结果进行量化。
对于四格表来说,简单 Kappa 系数与加权的 Kappa 系数是相等的,对于一般的行列表,加权的Kappa 系数的计算公式为:Kw=P0(w)-Pe(w)[]1-Pe(w)(5)P0(w)=∑i ∑jwijpijPe(w)=∑i ∑jwijpi.pj4其中 0≤wij=wji<1, i≠j, wij=1加权 Kappa 系数的标准误计算公式为:Skw=∑i ∑jpi.pj[wij-(i.+j)]2-P2e(w)[](1-Pe(w))2 N(6)95%的置信区间为:(kw-1.96Skw, kw+1.96Skw)(7)假设检验的统计量为 U=kW[]Skw(8)Kappa 的权系数一般使用 CicchettiAllison 和 FleissCohen两种权值类型[2] ,CicchettiAllison 的计算公式为:wij=1-|Ci-Cj|[]Ck-Ci(9)FleissCohen 的计算公式为:wij=1-(Ci-Cj)2[](Ck-Ci)2(10)5其中,Ci 表示第 i 列的评价分值,k 表示列数如果是数值型变量,评价分值 Cij 就是第 i 行第 j 列对应的具体数值;如果是分类变量,可按照相应级别进行赋值。
由于 wij=1,而当 i≠j 时,0≤wij<1,所以由 Kappa 系数的计算公式可知加权的 Kappa 系数大于简单 Kappa 系数3 总 Kappa 系数假设列联表为多向列联表(我们不妨设有 q 个方向),且每个变量有两个水平,即为 2×2×…×2 列联表,令 ki 表示第 i 个变量的Kappa 系数,Ski 表示第 i 个 Kappa 系数的标准误,则总 Kappa系数的计算公式为:K 总 =∑q[]i=1 ki[]Ski / ∑q[]i=1 1[]Ski(11)若要检验各变量 Kappa 系数是否都相等,可采用自由度为q-1 的 χ2 检验,计算公式为:χ2=∑q[]i=1 (ki-k 总)2[]Ski(12)(11)、(12) 两个公式均适用于加权的 Kappa 系数64 行列数不等时 Kappa 系数的计算Kappa 系数的计算适用于两个评价人分级水平数相同的情况,即数据格式为行数和列数相等的方表而在实际操作中,经常会出现分级水平数不一致,即行列数不等的情况我们来看一个实例:两名医生按照某项指标的 1~4 个等级来评价 8 个病人一个医生用全部 4 个等级进行评价,而另一医生只有 3 个等级进行评价。
此时,对于两个医生来说,他们评价的级别范围不同数据见表 1表 1 甲乙两医生对病人的评价(略)下面我们使用 SPPS 软件获得 Kappa 值及检验结果SPSS 110 或更低的版本在这种情况下均无获得 Kappa 统计量SPSS115以上的版本可以计算出 Kappa 值首先进入数据编辑器并给甲医生添加额外的观测值 0001数据录入见图 1选择Analyze→Descriptive Statistics→Crosstabs,将变量甲,乙分别放入对应的行列框内,选择 Statistics 按钮,得到如下对话框(图 2),选择 Kappa 复选框,按 continue 即可输出 Kappa 值、标准误和P 值相应的结果为:7Kappa=0.810, P=0.001,S=0.1765 讨论在诊断试验的研究中,数据资料多为双向有序的列联表资料,即两个变量都是有序变量,而且属性相同属性相同分为三种情况,一种情况是属性、分级水平数和分级水平都完全相同如甲医生和乙医生都把病人的检查结果分为 1、2 、3、4 四个等级此时可直接作 Kappa 检验当这两个变量都只有 2 个水平时,就成为配对设计的四格表资料,可使用配对 χ2 检验,即 McNemar 检验。
第二种是属性相同的分级水平数相同,但分级水平不全相同如甲医生和乙医生都把病人的检查结果分为四个等级,但甲医生的分级为1、2 、3 、 4,而乙医生的分级为 2、3 、4、5在这种情况下,由于列联表的行数和列数仍然是一致的,即列联表仍为方表,所以也可计算出相应的 Kappa 统计量第三种是属性相同,但分级水平数和分级水平不全相同这种情况就是我们所说的列联表的行列数不一致由于收集上来的数据不能轻易删除掉,所以我们考虑添加行或列使联表成为方表如行数为 n,例数为 n-1,则我们只需要添加第 n 列,在第 n 行第 n 列的格点中添加权值 0001,而第 n 行的其它格点均设为 0,就可以命名其成为方表,并计算 Kappa 统计量了由于权值系数很小,所以不会影响 Kappa 值的计算结果8另一方面,如果两个变量中有一个变量是金标准,那么我们不但能分析出检验结果的一致性,还可以计算出敏感度、特异度、误诊率和漏诊率等指标如果有不同的诊断分界点,还可以绘制出ROC 曲线诊断试验的评价[3 ]在医学研究中具有十分重要的意义,目前大多数文献都使用 Kappa 统计量来检验结果的一致性所以本研究主要是对 Kappa 系数作一个探讨和分析。
诊断试验评价的统计学方法还会随着更多问题的提出和解决而不断得到发展、修正和扩展参考文献1 马斌荣,主编医学科研中的统计方法北京:科学出版,2005,32 SAS91 软件说明书(英文版)3 宇传华译诊断医学统计学北京:人民卫生出版社,2005,3 。












