
应用回归分析-课后习题答案-何晓群.doc
29页第二章 一元线性回归 2.14 解答:(1)散点图为: (2)x与y之间大致呈线性关系 (3)设回归方程为 =(4) = (5)由于服从自由度为n-2的t分布因而也即:=可得即为:(2.49,11.5) 服从自由度为n-2的t分布因而即可得(6)x与y的决定系数(7)ANOVAx平方和df均方F显著性组间(组合)9.00024.5009.000.100线性项加权的8.16718.16716.333.056偏差.8331.8331.667.326组内1.0002.500总数10.0004由于,拒绝,说明回归方程显著,x与y有显著的线性关系8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立9)相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10) 序号111064221013-33320200442027-75540346残差图为:从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
11)当广告费=4.2万元时,销售收入,即(17.1,39.7)2.15 解答:(1) 散点图为:(2)x与y之间大致呈线性关系3)设回归方程为 =(4) =0.23050.4801(5) 由于服从自由度为n-2的t分布因而也即:=可得即为:(0.0028,0.0044) 服从自由度为n-2的t分布因而即可得(6)x与y的决定系数 =0.908(7) ANOVAx平方和df均方F显著性组间(组合)1231497.5007175928.2145.302.168线性项加权的1168713.03611168713.03635.222.027偏差62784.464610464.077.315.885组内66362.500233181.250总数1297860.0009由于,拒绝,说明回归方程显著,x与y有显著的线性关系8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立9) 相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10)序号18253.53.07680.4232221510.88080.11923107043.95880.0412455022.0868-0.0868548011.8348-0.8348692033.4188-0.4188713504.54.9688-0.466883251.51.27680.2232967032.51880.481210121554.48080.5192从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
11)(12),即为(2.7,4.7)近似置信区间为:,即(2.74,4.66)(13)可得置信水平为为,即为(3.33,4.07).2.16 (1)散点图为:可以用直线回归描述y与x之间的关系.(2)回归方程为:(3) 从图上可看出,检验误差项服从正态分布第三章 多元线性回归3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:相关性yx1x2x3Pearson 相关性y1.000.556.731.724x1.5561.000.113.398x2.731.1131.000.547x3.724.398.5471.000 y..048.008.009x1.048..378.127x2.008.378..051x3.009.127.051.Ny10101010x110101010x210101010x310101010所以=系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量: y (2) 所以三元线性回归方程为 模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.898a.806.70823.44188.8068.28336.015a. 预测变量: (常量), x3, x1, x2。
3)由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高(4)Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量: (常量), x3, x1, x2b. 因变量: y因为F=8.283 P=0.015<0.05所以认为回归方程在整体上拟合的好(5)系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量: y(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得:Anovab模型平方和df均方FSig.1回归12893.19926446.60011.117.007a残差4059.3017579.900总计16952.5009a. 预测变量: (常量), x2, x1b. 因变量: y由表知通过F检验继续做回归系数检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-459.624153.058-3.003.020-821.547-97.700x14.6761.816.4792.575.037.3818.970.556.697.476.9871.013x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013a. 因变量: y此时,我们发现x1,x2的显著性大大提高7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)(8)(9) 残差统计量a极小值极大值均值标准 偏差N预测值175.4748292.5545231.500038.9520610标准 预测值-1.4381.567.0001.00010预测值的标准误差10.46620.19114.5263.12710调整的预测值188.3515318.1067240.183549.8391410残差-25.1975933.22549.0000019.1402210标准 残差-1.0751.417.000.81610Student 化 残差-2.1161.754-.1231.18810已删除的残差-97.6152350.88274-8.6834843.4322010Student 化 已删除的残差-3.8322.294-.2551.65810Mahal。
距离.8945.7772.7001.55510Cook 的距离.0003.216.486.97610居中杠杆值.099.642.300.17310a. 因变量: y所以置信区间为(175.4748,292.5545)(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好。
