好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

spss软件分析异常值检验实验报告.docx

6页
  • 卖家[上传人]:汽***
  • 文档编号:380171522
  • 上传时间:2023-11-30
  • 文档格式:DOCX
  • 文档大小:40.21KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 实验五:残差分析【实验目的】(1) 通过残差检验,掌握残差分析的方法(2) 异常值检验【仪器设备】计算机、spss软件、何晓群《实用回归分析》表4.15和表5.6的数据【实验内容、步骤和结果】1.1 对何晓群《实用回归分析》表4.15的数据进行残差分析原始数据如表1,其中y表示货运总量(亿吨)x1表示工业总产值(亿元)x2表示农业总产 值(亿元)x3表示居民非商业支出(亿元)表1.yx1x2x31607035126075402.4210654022657442324072381.222068451.5275784241606636227570443.2250654231.2对表1数据用spss软件进行分析得以下各表表2•模型汇总模型RR方调整R方标准估计的误差1.898a• 806.70823.442a. 预测变量:(常量),x3, x1, x2b. 因变量:y由上表可知复相关系数R=0.898,决定系数R方=0.806,由决定系数看出回归方程的显著性 不高,接下来看方差分析表3表3Anova模型平方和df均方FSig.1 回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量:(常量),x3, x1, x2。

      b. 因变量:y由表3知F值为8.283较小,说明xl、x2、x3整体上对y的影响不太显著表4系数模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-348.280176.459-1.974.096x13.7541.933.3851.942.100x27.1012.880.5352.465.049x312.44710.569.2771.178.284回归方程为 y 二弓 4 8. 2 840 3.X 5f4 x7. 4-0 1 x 12. 4 4 7l 2 3表5残差统计量极小值极大值均值标准偏差N预测值175.47292.55231.5038.95210标准预测值-1.4381.567.0001.00010预测值的标准误差10.46620.19114.5263.12710调整的预测值188.35318.11240.1849.83910残差-25.19833.225.00019.14010标准残差-1.0751.417.000.81610Student化残差-2.1161.754-.1231.18810已删除的残差-97.61550.883-8.68343.43210Student化已删除的残差-3.8322.294-.2551.65810Mahal。

      距离.8945.7772.7001.55510Cook的距离.0003.216.486.97610居中杠杆值.099.642.300.17310Student-17520D225250275图1.学生化残差(p晶⑷4"散点图因变量:yO-5I 7JI图2.回归学生化删除的残差散点图凶变量:y(pres邑-1Q€- 2I I I I I175 20C 225 250 27&y 图3•回归删除的残差:1・3对数据用spss进行分析得表6异常值的诊断分析yx1x2x3ZRE 1SRE 1SDR 1C00 1LEV 116070351—0. 66014—0. 89353—0. 876040.166090. 3541826075402.40. 54710. 627670. 592770. 031150・14025210654020. 227980・ 265170・ 243490.00620.1607926574423—0. 00388—0. 00433—0. 0039600. 0993524072381.21. 417361.7542. 293830・ 408740. 2470222068451.5—1. 0749—2.11566—3.832143・ 216010. 6418727578424—0. 74885—1.17348—1. 220390.50110. 4927716066362—0. 85347—1.16281—1.206060・ 289460.3612927570443.20. 351270. 409350. 379020. 0150.16366250654230. 797521.064621.079110. 221580.33883从表6中可以看出,绝对值最大的学生化残差SRE=2・ 11566,小于3,因而根据学生化残差诊 断认为数据不存在异常值•绝对值最大的删除学生化残差为SDR=3.83214,因而根据学生化 删除残差诊断认为第6个数据为异常值•其中中心化杠杆值0・64187,cook距离为3・21601 位于第一大.因此第6个数据为异常值.2.1对何晓群《实用回归分析》表5.6的数据进行残差分析原始数据为 :表7.10个啤酒品牌的广告费用和销售量啤酒品牌广告费X/万兀销售量Y/万箱A12036.3B68.720.7C100 ・115.9D76.613.2E8.78.1F17.1G21.55.6H1.44.4I5.34.4J1.74.32.2 对上表数据进行回归分析得表&系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)4.0682.1661.878.097广告费/万元.196.036.8865.393.001回归方程为y = 4.068 + 0.196 x回归方程通过了F检验、t检验,只是表明变量X 和y之间的线性关系是显著的,但不能保证数据拟合得很好。

      残差分析可知存在有影响的 观测值并且为异值2.3 对表7进行异常值诊断分析得表9:表9.异常值的诊断分析啤酒品牌广告费/万元销售量/万箱ZRE 1SRE 1SDR 1C00 1LEV 1A12036.31. 736062. 298623.689961. 989540. 32958B68・720.70.631790. 681860. 657210. 038310. 04147C100.115.9一1・ 54544—1. 82798—2.240770. 666730. 18523D76・613.2-1.16719—1. 27958—1. 342140. 165260. 06796E8.78.10. 462860. 502850.477990. 022790. 05273F17.10.563860. 62320. 597640. 043020. 08136G21.55.6—0. 53271—0. 5675—0.541860. 021710. 01882H1.44.40. 011410. 012590. 011780. 000020. 07972I5.34.4—0. 14047—0. 15369—0.143970. 002330. 06461J1.74.3—0. 02016—0. 02224—0. 020810. 000050.0785从表 9 中可以看出,绝对值最大的学生化残差 SRE=2.29862, 小于 3,因而根据学生化残差 诊断认为数据不存在异常值.绝对值最大的删除学生化残差为SDR=3.68996,因而根据学 生化删除残差诊断认为第 1 个数据为异常值.其中中心化杠杆值 0.32958,cook 距离为 1・98954位于第一大•因此第1个数据为异常值•从回归标准化残差图4看,y的观测值的 方差不相同,而是随着x的增加而增加的。

      异常值的原因并不是数据的随机误差,而是由 于本数据存在异方差,应采用加权最小二乘法进行回归,回归结果会较精确图 4. 回归标准化残差图散点图因变fit: y06O010.0 20.0 30.Q 4C.0【实验小结】(包括收获、心得体会、存在的问题及解决问题的方法、建议等)通过这次实验,我进一步了解并掌握了运用SPSS软件对数据进行分析和处理,通过残 差检验,掌握残差分析的方法和异常值检验,还有EXCEL的表格应用在老师和同学们的帮助下顺利的解决了处理数据中遇到的问题,希望在以后的学习实践中能熟练运用spss软 件进行数据处理与分析。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.