
第八章回归分析.doc
19页第八章,回归分析第八章 回归分析 第一节 Linear过程 8.1.1 主要功能 8.1.2 实例操作 第二节 Curve Estimation过程 8.2.1 主要功能 8.2.2 实例操作 第三节 Logistic过程 8.3.1 主要功能 8.3.2 实例操作 第四节 Probit过程 8.4.1 主要功能 8.4.2 实例操作 第五节 Nonlinear过程 8.5.1 主要功能 8.5.2 实例操作回归分析是处理两个及两个以上变量间线性依存关系的统计方法在医学领域中此类问题很普遍如人头发中某种金属元素的含量与血液中该元素的含量有关系人的体表面积与身高、体重有关系;等等回归分析就是用于说明这种依存变化的数学关系 第一节 Linear过程8.1.1 主要功能 调用此过程可完成二元或多元的线性回归分析在多元线性回归分析中用户还可根据需要选用不同筛选自变量的方法(如:逐步法、向前法、向后法等) 返回目录 返回全书目录8.1.2 实例操作 [例8.1]某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下试用多元回归方法确定以身高、体重为自变量体表面积为应变量的回归方程。
儿童编号 体表面积(Y) 身高(_1) 体重(_2) 1 2 3 4 5 6 7 8 9 10 5.382 5.299 5.358 5.292 5.602 6.014 5.830 6.102 6.075 6.411 88.0 87.6 88.5 89.0 87.7 89.5 88.8 90.4 90.6 91.2 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.08.1.2.1 数据准备 激活数据管理窗口定义变量名:体表面积为Y保留3位小数;身高、体重分别为_1、_21位小数输入原始数据结果如图8.1所示 图8.1 原始数据的输入8.1.2.2 统计分析 激活Statistics菜单选Regression中的Linear...项弹出Linear Regression对话框(如图8.2示)从对话框左侧的变量列表中选y点击钮使之进入Dependent框选x1、x2点击钮使之进入Indepentdent(s)框;在Method处下拉菜单共有5个选项:Enter(全部入选法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。
本例选用Enter法点击OK钮即完成分析 图8.2 线性回归分析对话框用户还可点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析;点击Plots...钮选择是否作变量分布图(本例要求对标准化Y预测值作变量分布图);点击Save...钮选择对回归分析的有关结果是否作保存(本例要求对根据所确定的回归方程求得的未校正Y预测值和标准化Y预测值作保存);点击Options...钮选择变量入选与剔除的α、β值和缺失值的处理方法 8.1.2.3 结果解释 在结果输出窗口中将看到如下统计数据:_ _ _ _ M U L T I P L E R E G R E S S I O N _ _ _ _Listwise Deletion of Missing Data Equation Number 1 Dependent Variable.. Y Block Number 1. Method: Enter _1 _2Variable(s) Entered on Step Number 1.. _2 2.. _1Multiple R .94964 R Square .90181 Adjusted R Square .87376 Standard Error .14335 Analysis of Variance DF Sum of Squares Mean Square Regression 2 1.32104 .66052 Residual 7 .14384 .02055 F = 32.14499 Signif F = .0003------------------ Variables in the Equation ------------------ Variable B SE B Beta T Sig T _1 .068701 .074768 .215256 .919 .3887 _2 .183756 .056816 .757660 3.234 .0144 (Constant) -2.856476 6.017776 -.475 .6495End Block Number 1 All requested variables entered.结果显示本例以_1、_2为自变量Y为应变量采用全部入选法建立回归方程。
回归方程的复相关系数为0.94964决定系数(即r2)为0.90181经方差分析F=34.14499P=0.0003回归方程有效回归方程为Y=0.0687_1+0.183756_2-2.856476 本例要求按所建立的回归方程计算Y预测值和标准化Y预测值(所谓标准化Y预测值是指将根据回归方程求得的 Y预测值转化成按均数为0、标准差为1的标准正态分布的Y值)并将计算结果保存入原数据库系统将原始的_1、_2值代入方程求Y值预测值(即库中pre_1栏)和标准化Y预测值(即库中zpr_1栏)详见图8.3 图8.3 计算结果的保存本例还要求对标准化Y预测值作变量分布图系统将绘制的统计图送向Chart Carousel窗口双击该窗口可见下图显示结果 图8.4 对标准化Y预测值所作的正态分布图返回目录 返回全书目录第二节 Curve Estimation过程8.2.1 主要功能 调用此过程可完成下列有关曲线拟合的功能: 1、Linear:拟合直线方程(实际上与Linear过程的二元直线回归相同即Y = b0+ b1_); 2、Quadratic:拟合二次方程(Y = b0+ b1_+b2_2); 3、pound:拟合复合曲线模型(Y = b0b1_); 4、Growth:拟合等比级数曲线模型(Y = e(b0+b1_)); 5、Logarithmic:拟合对数方程(Y = b0+b1ln_) 6、Cubic:拟合三次方程(Y = b0+ b1_+b2_2+b3_3); 7、S:拟合S形曲线(Y = e(b0+b1/_)); 8、Exponential:拟合指数方程(Y = b0 eb1_); 9、Inverse:数据按Y = b0+b1/_进行变换; 10、Power:拟合乘幂曲线模型(Y = b0_ b1); 11、Logistic:拟合Logistic曲线模型(Y = 1/(1/u + b0b1_)。
返回目录 返回全书目录8.2.2 实例操作 [例8.2]某地1963年调查得儿童年龄(岁)_与锡克试验阴性率(%)Y的资料如下试拟合对数曲线 年龄(岁) _ 锡克试验阴性率(%) Y 1 2 3 4 5 6 7 57.1 76.0 90.9 93.0 96.7 95.6 96.28.2.2.1 数据准备 激活数据管理窗口定义变量名:锡克试验阴性率为Y年龄为_输入原始数据 8.2.2.2 统计分析 激活Statistics菜单选Regression中的Curve Estimation...项弹出Curve Estimation对话框(如图8.5示)从对话框左侧的变量列表中选y点击钮使之进入Dependent框选x点击钮使之进入Indepentdent(s)框;在Model框内选择所需的曲线模型本例选择Logarithmic模型(即对数曲线);选Plot models项要求绘制曲线拟合图;点击Save...钮弹出Curve Estimation:Save对话框选择Predicted value项要求在原始数据库中保存根据对数方程求出的Y预测值点击Continue钮返回Curve Estimation对话框再点击OK钮即可。
图8.5 曲线拟合对话框8.2.2.3 结果解释 在结果输出窗口中将看到如下统计数据:ndependent: _ Dependent Mth Rsq d.f. F Sigf b0 b1 Y LOG .913 5 52.32 .001 61.3259 20.6704在以_为自变量、Y为应变量采用对数曲线拟合方法建立的方程决定系数R2=0.913(接近于1)作拟合优度检验方差分析表明:F=52.32P=0.001拟合度很好对数方程为:Y=61.3259+20.6704ln_ 本例要求绘制曲线拟合图结果如图8.6所示 图8.6 对数曲线拟合情形根据方程Y=61.3259+20.6704ln_将原始数据_值代入求得Y预测值(变量名为fit_1)存入数据库中参见图8.7 图8.7 计算结果的保存返回目录 返回全书目录第三节 Logistic过程8.3.1 主要功能 调用此过程可完成Logistic回归的运算所谓Logistic回归是指应变量为二级计分或二类评定的回归分析这在医学研究中经常遇到如:死亡与否(即生、死二类评定)的概率跟病人自身生理状况和所患疾病的严重程度有关;对某种疾病的易感性的概率(患病、不患病二类评定)与个体性别、年龄、免疫水平等有关。
此类问题的解决均可借助逻辑回归来完成 特别指出本节介绍的Logistic过程应与日常所说的Logistic曲线模型(即S或倒S形曲线)相区别用户如果要拟合Logistic曲线模型可调用本章第二节Curve Estimation过程系统提供11种曲线模型其中含有Logistic曲线模型(参见上节) 在一般的多元回归中若以P(概率)为应变量则方程为P=b0+b1_1+b2_2+…+bk_k, 但用该方程计算时常会出现P>1或P eb0+b1_1+b2_2+…+bk_k P = ——————————— 1+ eb0+b1_1+b2_2+…+bk_k返回目录 返回全书目录8.3.2 实例操作 [例8.3]某医师研究男性胃癌患者发生术后院内感染的影响因素资料如下表请通过Logistic回归统计方法对主要影响因素进行分析 术后感染 (有无) Y 年龄 (岁) _1 手术创伤程度 (5等级) _2 营养状态 (3等级) _3 术前预防性抗菌 (有无) _4 白细胞数 (109/L) _5 癌肿病理分度 (TNM得分总和) _6 有 有 无 无 无 有 无 有 有 无 无 无 无 无 无 69 72 57 41 32 65 58 54 55 59 64 36 42 48 50 4。
