
SPSS多元回归分析实例.docx
14页多元回归分析在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析可以建立因变量》与 各自变量%j=1,2,3,...,n)之间的多元线性回归模型:丫二岛+8内+为做+--+虹位 +昌其中:b0是回归常数;bk(k=1,2,3,...,n)是回归参数;e是随机误差多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;X1为最多连续10天诱蛾量(头);X2为4月上、中旬百束小谷草 把累计落卵量(块);X3为4月中旬降水量(毫米),X4为4月中旬雨日(天);预报一代粘虫幼虫发生量》(头/m2)分级别数值 列成表2-1预报量乂 每平方米幼虫0~10头为1级,11〜20头为2级,21〜40头为3级,40头以上为4级预报因子:X1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;X2卵量0〜150块为1 级,151〜300块为2级,301~550块为3级,550块以上为4级;%降水量0〜10.0毫米为1级,10.1〜13.2毫米为2级,13.3〜17.0 毫米为3级,17.0毫米以上为4级;X4雨日0〜2天为1级,3〜4天为2级,5天为3级,6天或6天以上为4级。
表2-1x1x2x3x4y年蛾量级别卵量级别降水量级别雨日级别幼虫密 度级别19601022411214.31211011961300144030.111141196269936717.511191196318764675417.147455419654318011.9121111966422220101013119678063510311.82322831976115124020.612171197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.7432444197825516510101112数据保存在“DATA6-5.SAV”文件中1)准备分析数据在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据再创建蛾 量、卵量、降水量、雨日和幼虫密度的分级变量XI”、“x2”、“x3”、“x4”和亍”,它们对应的分级数值可以在SPSS数据编辑窗口 中通过计算产生。
编辑后的数据显示如图2-1图2-1或者打开已存在的数据文件“DATA6-5.SAV”2)启动线性回归过程单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图2-2所示的线性回归过程窗口图2-2线性回归对话窗口3) 设置分析变量设置因变量:用鼠标选中左边变量列表中的“幼虫密度[y]”变量,然后点击“Dependent"栏左边的〔二向右拉按钮,该变量就 移到“Dependent ”因变量显示栏里设置自变量:将左边变量列表中的“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]”变量,选移到“Independent(S)”自变量 显示栏里设置控制变量:本例子中不使用控制变量,所以不选择任何变量选择标签变量:选择“年份”为标签变量选择加权变量:本例子没有加权变量,因此不作任何设置4) 回归方式本例子中的4个预报因子变量是经过相关系数法选取出来的,在回归分析时不做筛选因此在『Method”框中选中“Enter”选 项,建立全回归模型5)设置输出统计量单击“Statistics^按钮,将打开如图2-3所示的对话框该对话框用于设置相关参数。
其中各项的意义分别为:图 2-3 “Statistics”对话框©“Regression Coefficients” 回归系数选项:/ “Estimates"输出回归系数和相关统计量Confidence interval"回归系数的95%置信区间Covariance matrix ”回归系数的方差-协方差矩阵本例子选择“Estimates"输出回归系数和相关统计量② “Residuals”残差选项:“Durbin-Watson”Durbin-Watson 检验Casewise diagnostic"输出满足选择条件的观测量的相关信息选择该项,下面两项处于可选状态:E3“Outliers outside standard deviations”选择标准化残差的绝对值大于输入值的观测量; 庭“All cases ”选择所有观测量本例子都不选③ 其它输入选项“Model fit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表R squared change”输出由于加入和剔除变量而引起的复相关系数平方的变化Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。
Part and partial correlation^相 关系数和偏相关系数Collinearity diagnostics”显示单个变量和共线性分析的公差本例子选择“Model fit”项6)绘图选项在主对话框单击“Plots”按钮,将打开如图2-4所示的对话框窗口该对话框用于设置要绘制的图形的参数图中的X和 “Y”框用于选择X轴和Y轴相应的变量Moll□EPE NDNT■ZPRED ■2RES(D TDF1ESID ■ADUPftED "SRES^D -SURE SID"一.LU %1 1IZO做1F Prodiicc all parUal pIvHConllimuECancelr HislngruHi r Ka^imiil p rcibslxllity1 plot图2-4“Plots”绘图对话框窗口左上框中各项的意义分别为:• “DEPENDNT ”因变量• “ZPRED”标准化预测值• “ZRESID”标准化残差• “DRESID”删除残差• “ADJPRED”调节预测值• “SRESID”学生氏化残差• “SDRESID”学生氏化删除残差Standardized Residual Plots”设置各变量的标准化残差图形输出。
其中共包含两个选项:“Histogram”用直方图显示标准化残差Normal probability plots ”比较标准化残差与正态残差的分布示意图Produce all partial plot-偏残差图对每一个自变量生成其残差对因变量残差的散点图本例子不作绘图,不选择7)保存分析数据的选项在主对话框里单击“Save”按钮,将打开如图2-5所示的对话框1. iMdr keqneiMKii1 : 1Coneinut 1Canedtic IpF ynnteBriHidizrdr StsmhrdijedF Adjusk d「S.E-,- c-1 ffliean jLredlcliofttP UnttBndjirdlzBd r ardl2«d!r剧udc砒1氏d F DeletedF Mahah no bisP LcvicragEr^SliuSefitizE
就会在当前数据文件中新添加一个以字符,PRE_”开头命名的变量,存放根据回 归模型拟合的预测值Standardized标准化预测值Adjusted调整后预测值S.E. of mean predictions 预测值的标准误本例选中“Unstandardized'非标准化预测值② “Distances”距离栏选项:Mahalanobis:距离Cook’s”: Cook 距离Leverage values:杠杆值③ “Prediction Intervals”预测区间选项:Mean:区间的中心位置厂Individual:观测量上限和下限的预测区间在当前数据文件中新添加一个以字符IICI_”开头命名的变量,存放 预测区间下限值;以字符"UICI_”开头命名的变量,存放预测区间上限值Confidence Interval :置信度本例不选④ “Save to New File"保存为新文件:选中“Coefficient statistics ”项将回归系数保存到指定的文件中本例不选⑤ “Export model information to XML file"导出统计过程中的回归模型信息到指定文件。
本例不选⑥ “Residuals"保存残差选项:“Unstandardized”非标准化残差Standardized”标准化残差Studentized ”学生氏化残差Deleted”删除残差Studentized deleted”学生氏化删除残差本例不选⑦ “Influence Statistics"统计量的影响DfBeta(s) ”删除一个特定的观测值所引起的回归系数的变化Standardized DfBeta(s)”标准化的 DfBeta 值DiFit”删除一个特定的观测值所引起的预测值的变化Standardized DiFit”标准化的 DiFit 值Covariance ratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率本例子不保存任何分析变量,不选择8) 其它选项在主对话框里单击“Opti。
