应用回归实验报告
重 庆 交 通 大 学学 生 实 验 报 告实验课程名称 应用回归分析 开课实验室 理学院实验室 学 院 09 年级 信息与计算科学 专业班 1 学 生 姓 名 林艳 学 号 09180117 开 课 时 间 2011 至 2012 学年第 1 学期总 成 绩教师签名2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了每周加班工作时间的数据和签发的心保单数目,x为每周签发的新保单数目,y为每周加班工作时间(小时)。见表2.7.表2.7周序号12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.0(1) 画散点图; 答:(2) X与y之间是否大致呈线性关系;答:由(1)的散点图可以看出x与y之间大致呈线性关系。(3) 用最小二乘估计求出回归方程;答:由SPSS得:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).118.355.333.748x.004.000.9498.509.000a. 因变量: y由该系数表得出最小二乘估计的回归方程为:(4) 求回归标准误差;答:模型汇总模型RR 方调整 R 方标准 估计的误差1.949a.900.888.48002a. 预测变量: (常量), x。由上表得回归标准误差为:=0.48002(5) 给出与的置信度为95%的区间估计;答: 系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量).118.355.333.748-.701.937x.004.000.9498.509.000.003.005a. 因变量: y由上表得:得置信区间为:(-0.701,0.0937);得置信区间为:(0.003,0.005);(6) 计算x与y的决定系数;答:由(4)得模型汇总表得:=0.900,从相对水平上来看,回归方程能够减少因变量y得99.0%得方差波动。(7) 对回归方程做方差分析;答:由SPSS得方差表:Anovab模型平方和df均方FSig.1回归16.682116.68272.396.000a残差1.8438.230总计18.5259a. 预测变量: (常量), x。b. 因变量: y由方差分析表中看到,F=72.396,Sig=0.000,说明y对x得线性回归高度显著。(8) 做回归系数1显著性的检验;答:从(5)中得系数表中可得:回归系数1检验的t值=8.509,显著性Sig=0.000,与F检验的检验结果一致。(9) 做相关系数的显著性检验;答:从(4)的模型汇总表可得:r=0.949,说明y与x有显著的线性关系,与F检验和回归系数检验的结果一致。也说明对于一元线性回归三种检验的结果是完全一致的;(10) 对回归方程作残差图并作相应的分析;答:残差图:从残差图上看出,残差是围绕e=0随机扰动,从而模型的基本假定是满足的。(11) 该公司预计下一周签发新保单=1000张,需要的加班时间是多少?答:由SPSS得下表:xyPRELICIUICILMCIUMCI8253.53.075861.913294.238442.720513.4312221510.88893-0.387912.165770.252531.52534107043.954222.755315.153143.493694.4147555022.089950.910863.269051.68382.4961148011.838990.646133.031851.394462.2835392033.416452.245384.587523.034223.7986813504.54.958063.664136.251994.288025.628093251.51.28330.047122.519470.7331.8335967032.520171.355773.684572.158892.88145121554.474063.232465.715673.911695.0364410003.703262.519494.887033.283734.12279从表中得出加班时间:(12) 给出的置信水平为95%的精确预测区间和近似预测区间。答:从(10)表可以得出置信水平为95%的精确预测区间为(3.28373,4.12279),近似预测区间为即(2.74332,3.70326)。(13) 给出E()置信水平为95%的区间估计。答:从(11)表中得E()置信水平为95%的区间估计为:(2.51949,4.88703)。2.16 表2.8是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元)。(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?(2)建立y对x的线性回归;(3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。(4)通过p-p图或q-q,若有异常点剔出后再分析。表2.8序号yx序号yx序号yx119583334618208163059351953826422202633114191809529673620460312432032535542020939328537214192752426800454221226443914382510634295294704669222462445173922482394762661048882327186434940209692509730678571024339905020412722454408271705536252338235944225892404292585341682620627282143226443402102450035472722795336644246402829112427431592821570292045223412297122714036212922080298046256102932133016837823022250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349172197431553418443230551258453766解:(1)由图看出x与y大致呈直线关系;(2):由SPSS得:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)12109.8791196.94810.117.000x3.314.312.83510.630.000a. 因变量: y回归方程为:(3)由标准残差的直方图和正态概率图可以看出,误差项通过了正态性假设。(4)yxDREZRESRE195833346-3696.68-1.55754-1.5748202633114-2224.35-0.93347-0.9457203253554-3636.03-1.53486-1.55042268004542-375.051-0.15628-0.158892947046691958.1840.812460.8278266104888-1780.17-0.73204-0.7492306785710-392.213-0.15325-0.1609271705536-3575.91-1.41585-1.47673258534168-72.0447-0.0303-0.03066245003547647.71380.273410.276182427431591737.7220.729930.739152714036213090.4091.304891.317943016837825635.1982.379292.40314265254247348.59290.146380.148252736039822097.3420.884320.8938216903568-2290.41-0.96691-0.97667219743155-607.181-0.25503-0.25826208163059-1471.5-0.61677-0.62523180952967-3963.59-1.65744-1.68214209393285-2105.59-0.8864-0.89661226443914-2488.5-1.04991-1.06083246244517-2536.66-1.05785-1.07509271864349681.41740.285480.289473399050205526.4252.258292.31852233823594-651.909-0.27524-0.278206272821-860.884-0