
roc曲线软件在处理不同类型资料中的应用探讨(7页).doc
8页ROC曲线软件在处理不同类型资料中的应用探讨牛华 肖质刘莉孙驚王建琼黄永红台虹赵崇吉云南省临床检验中心(650032昆明)摘要:目的探讨在进行ROC曲线分析过程中对不同类型资料处理时应注意的 问题及其解决方法方法用云南省临床检验中心开发的中文ROC曲线分析软 件,根据各心肌损伤标志物心肌肌钙蛋白(cTNT)、肌红蛋白(MYO)和肌酸激酶同工酶质量(CK・MBmass)测定结果资料分布特点及类型选择在全程数据 范围内(即两组资料从最低值至最高值范围)或选择在重叠范围内进行ROC曲 线分析处理结果 各心肌损伤标志物在不同时问内原始测定结果的资料分布极 差非常大,经对数转换后资料分布极差明显减小可直接进行全程数据范围的 ROC曲线分析,否则分析的结果无效或很不理想;若选择用两组资料重叠范围 内的处理方法,其分析结果与对数转换后进行的全程数据•范围处理结果一致结 论 在进行ROC曲线分析吋,应注意资料数据的分布规律,选择不同的统计方 式关键词:ROC曲线中文软件心肌标志物对数转换The application of ROC program with different types dataNiu Hua, Xiao Zhi, Liu Li, Sun Yi, Wang Jianqiong, Huang Yonghong, Tai Hong, Zhao Chongji. Yunnan Provincial Clinical Laboratory Center, Kunming, 650032, China.[Abstract] Objective To explore the solutions of problems with the ROC analysis for different types data. Methods Two kinds of ROC analyses of three cardiac infarction markers, cTNT, MYO and CK-MB mass, were performed with the ROC program developed by Yunnan Provincial Clinical Laboratory Center. Results The distribution of prime data had a large range, which produced a bad analysis result. After logarithmic transformation, the prime data that had smaller range now can be analyzed with full-span method. The results were similar to the ROC analyzed with the overlapped data. Conclusion We should choose different statistical method depend on the distribution of data when we performed ROC analyses.Key words ROC curve; Chinese software; Cardiac infarction markers; logarithmic transformationROC (Receiver Operating Characteristic)曲线分析在诊断性试验中,用于诊断 临界点的止确选择,对临床实验室工作尤为重要。
但H前国内外应用的ROC曲 线软件有的是选择在全程数据范围内进行处理分析(既疾病组与菲疾病组分布的 两组资料从最低值至最高值范围);有的是选择在两组资料重叠范围内进行处理 分析不同软件提供的分析功能不同,对分析数据的要求也不同,若忽视数据资料的分布情况,可能会导致ROC曲线分析结果不理想或得出错谋的结果本文 依据各心肌损伤标志物心肌肌钙蛋白(cTNT)、肌红蛋白(MYO)和肌酸激酶 同工酶质量(CK-MB mass)测定结果资料分布特点及类型选择在全程数据范围 内或选择在重叠范围内进行ROC曲线分析处理,以探讨ROC曲线分析不容忽视 的数据分布问题及其处理方法材料和方法%1. 研究对象1. AMI组 符合WHO标准诊断m的AMI患者79例(男70例,女9例),年 龄31〜88岁2. 疾病对照组 同期住院的不稳定心绞痛患者35例、心绞痛患者18例、缺血 性心肌病患者14例和冠心病并心衰13例(男39例,女41例),年龄47〜91岁1. 标本采集患者在入院2小时内、24小时内和48小时内分别采集静脉血标本并立即分 离血清进行测定1. 仪器和试剂1. 仪器 Elecsys2010电化学自动免疫分析仪 Roche公司生产I. 试剂 (1) CK-MB mass检测试剂:Roche公司生产,批号15765102 ,校 准液批号156389c (2) cTNT检测试剂:Roche公司生产,批号158468,校准液 批号154259c (3) MYO检测试剂:Roche公司生产,批号15908601,校准液批 号154400c质控詁批号:156988。
1. 软件的开发1. 软件的开发环境Windows 98 中文版(美国Microsoft公司)Delphi 7. 0 英文版(美国Borland公司)2. 软件设计方案2.1统计指标:ROC曲线下面积、真阳性数、假阳性数、真阴性数、假阴性数、 敬感度、特异度、诊断指数、准确度、阳性预测值、阴性预测值、患病率、阳性 似然比、阴性似然比、验后概率共计15项2. 2为适应不同数据的分布情况,数据分组可选择全程分组或数据重叠区分组的 方法2.3统计图:频数分布图、单一 ROC曲线图和ROC曲线图综合图2. 4图表保存:可任意命名,以BMP格式保存到任意路径,可插入到WPS、Word、 Eexcel > Power Point等文字处理、办公软件中2.5打印:A4幅面,分为原始数据、统计指标和统计图三种打印格式2. 6数据库格式:MDBo2・ 7 数据库接口: ActiveX 数据对象(ActiveX Data Objects, ADO)2. 8帮助文件:chm格式3. 软件发布方式以光盘为载体的安装盘每套软件包括安装盘一片,使用手册一本,注册后 即可运行4软件运行环境中文 Windows98/2000/XP%1. 数据统计方法1. 对各心肌损伤标志物测定结果原始数据进行算术平均值、中位数及对数转换 值的算术平均值、中位数统计处理。
2. 各心肌损伤标志物测定结果进行对数转换的方法:cTNT对数值=lg(cTNTX 1000); CK-MB mass 对数值二lg(CK・MB X 10); MYO 对数转换值=lg(MYO)o结果一.非AMI及AMI患者不同吋间各心肌标志物测定结果原始数据的均值、中 位数、范围和对数转换值的均值、中位数、范围见表1表1 非AMI及AM1患者不同时间各心肌标志物的测定结果Tab L Levels of Cardiac infarction markers in non-AMI and AMI patients at different time phrases项目测定值非AMI患者对照组AMI患者 入院2小时内AMI患者入院24小时内AMI患者入院48小时内原始数据均值0.0120.5311.3552.138心肌肌钙蛋白原始数据中位数0.010.1670.6320.871cTnT原始数据范围0.01-0.0560.01-4.00.012-10.350.015-18.48(ug/L)対数转换值均值1.0622.1482.7462.881对数转换值中位数1.002.2222.8012.941对数转换值范围1.0-1.7481.0 〜3.61.079〜4.0151.176 〜4.267原始数据均值2.35733.69975.52440.86肌酸激酶同工酶原始数据中位数2.3220.6123.066.65质昴原始数据范围1.15-4.121.38-250.41.94 〜5001.23-251.5CK-MB-mass対数转换值均值1.3572.2012.3752.056(ug/L)対数转换值中位数1.3652.3142.3621.822对数转换值范围1.061^1.6151」39 〜3.3981.288-3.6981.089-3.400原始数据均值44.38356.61275.4163.07肌红蛋口原始数据中位数41.5123.811762.0MYO原始数据范围21-99.2324.69〜290629.9-192828.41-1496(Ug/L)対数转换值均值1.6202.1332.2071.929対数转换值中位数1.6182.0932.0681.792对数转换值范围1.322-1.9961.392〜3.4631.476-3.2851.453-3.174表1结果显示:非AMI患者各心肌标志物测定结果的均值近似等于中位数, 数据分布极差较小。
而AMI患者在入院2小吋内、24小吋内和48小吋内cTNT 测定结果原始数据的均值与中位数相差2-4倍,数据范围最高值与最低值相差 400〜1232倍,数据分布极差很大CK-MB mass和MYO的情况也与之相同 二•应用ROC曲线分析软件(第一版)0进行两组资料全程数据的处理分析从表1看出,若以cTNT24小时内资料分析为例,原始数据对照组测定值从0.01-0.056 ug/L,而测定组的值从0.012-10.35 ug/L,两组资料重叠范围为 0.012-0.056 ug/L,两组资料全程范围为0.01〜10.35 ug/L;经对数转换后,cTNT 对照组测定值从1.0〜1.748,测定组的值从1.079〜4.015,两组资料重叠范围为 1.079〜1.748,两组资料全程范围为1.0〜4.015若要在两组资料重叠范围得出5 个诊断临界值,可按软件的提示选择输入组间距⑵,则原始数据的组间距应选为 0.0088 u g /L,全程ROC曲线分析要分成1175组;而对数转换值的组间距应选 为0.13ug/L,全程ROC曲线分析要分成23组同样,cTNT 48小时内资料分 析原始数据全程ROC曲线分析要分成2252组。
故,当cTNT这类原始资料若选 择的组间距及全程分组达不到要求时,可导致全程ROC曲线分析软件处理结果 无效但采用对数转换值进行的全程ROC曲线分析结果非常理想(见图1),当 要求诊断临界值越多时,则输入的组问距越小,全程分组越多从图1得知,cTNT24小时内诊断指数最大时的对数临界值为1.78,取其反 对数值应为0.06 ug/L,对应的敏感度为0.89,特异度为1.(), AUC面积为0.973; cTNT 24小吋内最佳对数临界值为1.65,取其反对数值应为0.045 u g /L,对应的 每攵感度为0.92,特异度为0.95; cTNT其他时间的评价结果及CK-MB mass和 MYO的评价结果。












