好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

COX回归模型的样本含量的计算方法及软件实现.doc

7页
  • 卖家[上传人]:油条
  • 文档编号:2602649
  • 上传时间:2017-07-25
  • 文档格式:DOC
  • 文档大小:28.50KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1COX 回归模型的样本含量的计算方法及软件实现【摘要 】   目前生存分析中 COX 回归模型到底需要多少样本量往往靠经验法来估计旨在介绍并推广生存分析中 COX 回归模型所需样本量的计算公式及其目前可以实现该计算方法的软件,并通过实例说明了该公式的应用,以期提高今后研究工作的效率 【关键词】  生存分析; COX 回归模型; 样本量; 统计软件COX 回归模型在生存分析中应用非常广泛,然而,关于应用该模型到底需要多少样本含量的问题一直未得到很好地解决主要原因就是生存分析中往往涉及到数据删失的问题,如果不考虑删失数据,则可以利用率的比较所需样本量的计算公式但是,简单的忽略这部分数据,往往会造成信息的损失如果考虑删失数据,则样本量的计算又变得非常复杂,因此,直到今天,这个问题依然是国内外统计学者研究的热点之一本研究仅介绍其中一种较为成熟的计算方法及其相应的实现软件,并通过实例说明该公式应该逐渐被研究者们广泛应用,从而达到提高研究效率的目的1 公式介绍2以往,对于 COX 回归模型所需的样本量往往凭经验去估计,即至少需要相当于协变量个数 10~15 倍的阳性结局事件1983 年,Schoenfeld 在 Biometrics 杂志上撰文,提出了一个计算比例风险模型样本含量的公式[1,2 ]:D=(Z1-α+Zβ)2[P(1-P)logΔ)2 ]-1这里,D 是指发生阳性结局的总人数,P 是指分配到第一治疗组人数所占的比例。

      logΔ 是指风险比的对数该公式主要是用来计算随机化分组研究的设计所需的样本量,适用于二分类自变量同时,当考虑其他协变量对生存时间的影响时,则要求主要感兴趣的研究变量与其他变量间相互独立然而,在实际的工作当中,变量之间有时并不能满足独立性因此,2000 年,Hsieh 和 Lavori 在 Controlled Clinical Trials 上将 Schoenfeld 的计算公式进行了扩展[3] ,现介绍如下:N=(Z1-α/2+Z1-β)2P(1-R2)σ2B2等号左边,N 表示所需要的样本含量等号右边 Z1-α/2,Zβ 表示给定检验水准和检验功效时的 z 界3值;P 表示整个研究期间阳性结局事件的发生率;B 表示对数风险比,即 logΔ;σ2 表示感兴趣的研究因素 X1 的方差,这里假定 X1服从正态分布,对于非正态分布的 X1,如二项分布,可通过 p(1-p)进行估计,这里,p 表示 X1 取“0” 或“1”的比例与 Schoenfeld的计算公式不同的是,该公式引入了“方差膨胀因子” (VIF) ,即1/(1-R2) R2 表示 X1 对其他协变量作回归分析时的确定系数,取值范围 0~1,当取值为“0”时,一般表示只考虑一个自变量 X1的情形。

      亦即当变量间不满足独立性时,需要通过 VIF 来增加参数估计值的方差上述各指标可通过查阅相关文献或进行预试验确定2 软件实现目前,有许多统计软件可以用来计算生存分析所需的样本量,但是大部分软件都是针对 log rank 检验的,或是要求生存时间服从指数分布,比如 S plus、PS、NQuery Advisor、STATA、PASS 等然而,逐渐地也有不少软件开始引入针对 COX 回归分析所需样本量的计算程序,比如 STATA 和PASS现介绍如下:2.1 STATA 软件的应用4程序如下:stpower COX [coef] [, options][coef]:用来设定感兴趣的研究因素 X1 的对数风险比,即 logΔ;[, options]:选择项,常用的有:* alpha(numlist):检验水准,默认 0.05;* power(numlist):检验效能,默认 0.8;* onesided:单侧检验,默认双侧检验;* sd(#) :感兴趣的研究因素 X1 的标准差,默认 0.5;* r2(#) :确定系数,默认 0;* failprob(#):阳性结局事件发生率,默认 100%。

      2.2 PASS 软件的应用PASS 是 NCSS 软件中执行检验功效分析和计算样本量大小5的一个功能模块操作步骤如下:① 打开 NCSS 软件,进入类似 SPSS 的操作界面;② 点击 PASS 下拉菜单,选择“survival and reliability”子菜单,选择“COX regression”,进入相关参数设置对话框;③ 设置相关参数,点击工具栏“play” ,完成操作3 实例应用Krall, Uthoff and Harley (1975)研究了 65 例多发性骨髓瘤患者预后的影响因素,一共 9 个变量(具体数据参见 sas phreg 过程中的数据集 Myeloma) 如研究者主要感兴趣的变量为X1(logBUN),预估计其对数风险比 logΔ=1,研究结束时死亡率P=48/65=73.8%,按照单侧 0.05 的检验水准和预期 80%的检验效能,估计所需的样本量的计算过程如下:① 估计 X1 的标准差,得 σ=0.3126;② 对 X1 和其他协变量作多重线性回归分析,得R2=0.1839;6③ 利用 STATA 或 PASS 软件,将上述参数带入计算,得样本含量 N=107。

      按照 Hsieh 和 Lavori 所提供的公式,若要达到 80%的检验效能,估计所需的样本量为 107 例故对于该项研究而言,若只研究 65 例患者,则需慎重对待所得结论4 讨论本研究中提到的公式,有效地解决了在生存分析中广泛应用的 COX 回归模型的样本含量的计算问题,为医学科研工作者在今后的研究中提高研究效率、节省人力物力财力提供了一定的科学依据该公式适用于任何分布的生存时间,只要满足 COX 比例风险假定即可另外,该公式不仅适用正态分布的自变量,也适用非正态分布的自变量,比如二分类的自变量,此时,可以计算出近似所需的样本量该公式不仅仅局限于对单个影响因素的研究,还可以综合考虑其他协变量的影响这一点在公式中主要体现在 R2 的取值上7对于单个自变量的研究,R2 取“0”即可;对于多个自变量的研究,则需要通过回归分析估计 R2由于 STATA 软件被广大研究者所熟悉,而 PASS 界面又非常友好,操作简单,只需要输入相应的参数既可以得到所需的结果此外,该公式相对较简单,亦可以直接计算因此,期待能在今后的生存分析中得到广泛的应用,以提高研究的工作效率另外,当已知样本含量时,也可以利用该公式和上述两个软件估计检验功效,以判断当阴性结果出现时,是否由于样本含量不足导致。

      参考文献】1 Schoenfeld, David A. Sample Size Formula for the Proportional Hazards Regression Model. Biometrics, 1983, 39: 499~ 503.2 赵耐青. 生存分析的最小样本含量计算.上海医科大学学报,1994,21(5) :333~337.3 Hsieh, F.Y. and Lavori, P.W. Sample Size Calculations for the COX Proportional Hazards Regression Model with Nonbinary Covariates. Controlled Clinical Trials, 2000, 21: 552~ 560.8。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.