
(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品).pdf
13页第二章第二章一元线性回归分析一元线性回归分析思考与练习参考答案思考与练习参考答案2.12.1一元线性回归有哪些基本假定?答: 假设 1、解释变量 X 是确定性变量,Y 是随机变量;假设 2、随机误差项 ε 具有零均值、同方差和不序列相关性:E(εi)=0i=1,2, …,nVar (εi)=2i=1,2, …,nCov(εi,εj)=0i≠ji,j= 1,2, …,n假设 3、随机误差项 ε 与解释变量 X 之间不相关:Cov(Xi, εi)=0i=1,2, …,n假设 4、ε 服从零均值、同方差、零协方差的正态分布εi~N(0,2)i=1,2, …,n2.2 考虑过原点的线性回归模型Yi=β1Xi+εii=1,2, …,n误差 εi(i=1,2, …,n)仍满足基本假定求 β1的最小二乘估计解:得:ˆ ˆX X ) )2 2ˆ ˆ) )2 2 ( (Y Y Q Qe e ( (Y Yi i Y Y i ii i1 1i ii i 1 1i i 1 1n nn nn n Q Qe eˆ ˆX X ) )X X 0 0 2 2 ( (Y Yi i 1 1i ii iˆ ˆ i i 1 11 1ˆ ˆ 1 1 ( (X X Y Y ) )i ii ii i 1 1n nn n ( (X Xi i) )2 2i i 1 12.3 证明(2.27 式) , e ei i =0 =0,, e ei iX Xi i=0=0 。
ˆˆX ))2ˆ) (Y (Q (YiYii01i211nn证明:ˆˆXˆ其中:Yi01i即: e ei i =0 =0,, e ei iX Xi i=0=0ˆeiYiYi Q Q 0 0ˆ ˆ 0 0 Q Q 0 0ˆ ˆ 1 1(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第1页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第1页2.4回归方程 E(Y)=β0+β1X 的参数 β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明答:由于εεi i~N(0,~N(0, 2 2) )i=1,2, …,ni=1,2, …,n所以Yi=β0+ β1Xi+ ε εi i~N~N((β0+β1Xi , , 2 2) )最大似然函数:最大似然函数:n nL L( ( , , , , 2 2) ) n nf f ( (Y Y ) ) ( (2 22 2) ) n n/ / 2 2exp{exp{ 1 1[ [Y Yi i ( ( 0 0 1 1 0 0, , X Xi i)] )]2 2} }0 01 1i i 1 1i ii i2 2 2 2 i i 1 1n n1 1n n2 22 22 2LnLn{ {L L( ( 0 0, , 1 1, , )} )} ln(ln(2 2) ) [ [Y Y ( ( , , X X )] )] i i0 01 10 0i i2 22 2 2 2i i 1 1ˆ ˆ就是 β0,β1的最大似然估计值。
ˆ ˆ, 使得 Ln(L)最大的 1 10 0同时发现使得 Ln(L)最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同值得注意的是:最大似然估计是在 εi~N(0,2)的假设下求得,最小二乘估计则不要求分布假设所以在 εi~N(0,2 ) 的条件下, 参数 β0,β1的最小二乘估计与最大似然估计等价ˆˆX ))2ˆ)2(Y (Q (YiYii01i11nnˆ ˆ是 β0的无偏估计2.5证明 0 0n nn nX Xi i X X1 1ˆ ˆ) ) E E( (Y Y ˆ ˆX X) ) E E[ [证明:E E( ( Y Y X XY Yi i) ) 0 01 1i in ni i 1 1L Lxxxxi i 1 1n nX Xi i X XX X X X1 11 1 E E[ [ ( ( X X) )Y Yi i] ] E E[ [ ( ( X Xi i)( )( 0 0 1 1X Xi i i i)] )]n nL Ln nL Li i 1 1i i 1 1xxxxxxxxn nX Xi i X XX X X X1 11 1 E E[ [ 0 0 ( ( X X) ) i i] ] 0 0 ( ( X Xi i) )E E( ( i i) ) 0 0L LxxxxL Lxxxxi i 1 1n ni i 1 1n nn nn n2.62.6 证明证明:ˆ ˆ) ) ( (1 1 VarVar( ( 0 0n nn nX X2 2 X Xi i 1 1n ni i X X 1 1X X2 2) ) ( ( ) )n nL Lxxxx2 22 22 2n nX X X XX Xi i X X2 21 11 1i iˆ ˆ) ) VarVar[ [( ( X XVarVar( ( ) )Y Y ] ] [ [( ( X X) ) VarVar( ( 0 0 1 1X Xi i i i)] )] 0 0i iL LxxxxL Lxxxxi i 1 1n ni i 1 1n n(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第2页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第2页X Xi i X XX Xi i X X2 22 21 12 21 1X X2 22 2 [( [( ) ) 2 2X X ( (X X) ) ] ] [ [ ] ] n nnLnLxxxxL Lxxxxn nL Lxxxxi i 1 1n n2.72.7 证明平方和分解公式:SST=SSE+SSRSST=SSE+SSRn nn n证明:2 2ˆ ˆ) ) ( (Y Yˆ ˆ Y Y ] ]2 2SSTSST Y Yi i Y Y [ [ Y Yi i Y Yi ii ii i 1 1i i 1 1 ˆ ˆ Y Y Y Yi ii i 1 1n nn n 2 2ˆ ˆ)( )(Y Yˆ ˆ Y Y ˆ ˆ) ) 2 2 Y Yi i Y Y Y Yi i Y Yi ii ii ii i 1 1i i 1 1n nn n n n 2 2 i i 1 1 ˆ ˆ Y Y2 2 ˆ ˆ) )Y Y Y Yi i Y Yi ii ii i 1 1 2 2 SSRSSR SSESSE2.8 验证三种检验的关系,即验证:(1)t t ( (n n 2 2) )r r1 1 r r2 2ˆ ˆ2 2L Lxxxx SSRSSR/ /1 12 21 1; (2)F F t t2 2ˆ ˆSSESSE /( /(n n 2 2) ) r LyyLxxSSE (Lxx(n2))n证明: (1)ˆLˆxxt 2ˆˆLxx(2)nnr LyySSE (n2)n2rn2r2SSE SST1rˆˆx y) (y ˆ(x x) y) (ˆi y) (SSR (yˆ1(xi x))2ˆ12Lxx01i1i222i1i1i1i1nˆ2LSSR/1F 12xxt2ˆSSE/(n2)1 1( ( x xi i x x ) )2 22 22.9 验证(2.63)式:VarVar( (e ei i) ) ( (1 1 ) ) n nL Lxxxx证明:ˆi) var(yi) var(y ˆi)2cov( yi, y ˆi)var(ei) var(yi yˆˆx )2cov( y , y ˆ(x x)) var(y ) var(i01ii1i(xi x)21(xi x)221[]2[]nLxxnLxx221(xi x)22[1]nLxx(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第3页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第3页ˆ ˆ( (x x x x)) )) CovCov( (y y , , y y) ) CovCov( (y y , , ˆ ˆ( (x x x x)) ))CovCov( (y yi i, , y y 1 1i ii ii i1 1i in n( (x x x x) )1 1n ny yi i) )其中: CovCov( (y yi i, , y yi i) ) ( (x xi i x x) )CovCov( (y yi i, , i in ni i 1 1L Lxxxxi i 1 11 12 2( (x xi i x x) )2 22 21 1( (x xi i x x) )2 22 2 ( ( ) ) n nL Lxxxxn nL Lxxxxˆ22.10 用第 9 题证明证明:e2in 2是 2的无偏估计量1n1n2ˆ ) ˆ) E(E(yi yE(ei2)n2i1n2i121n1n1(xi x)22var(ei) [1]n2i1n2i1nLxx1(n2)22n22.11 验证决定系数与 F 值之间的关系式r r2 2 F FF F n n 2 2证明:SSRSSR1SSTSSRSSE1SSE /SSR1n21SSR/(SSE /(n2))1Fn2F n21Fr22.142.14 为了调查某广告对销售收入的影响, 某商店记录了 5 个月的销售收入 y (万元)和广告费用 x(万元) ,数据见表 2.6,要求用手工计算:表表 2.62.6月份XY11102210332044205540(1) 画散点图(略)(2) X 与 Y 是否大致呈线性关系?答:从散点图看,X 与 Y 大致呈线性关系。
完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第4页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第4页(3) 用最小二乘法估计求出回归方程计算表X12345和 15均 3Y1010202040100均 20( (X Xi i X X) )2 2( (Y Yi i Y Y ) )2 2( (X Xi i X X)( )(Y Yi i Y Y ) )ˆ ˆY Yi i613202734和 100均 20ˆ ˆ Y Y ) )2 2( (Y Yˆ ˆ Y Y ) )2 2( (Y Yi ii ii i(-14)2(-7)2072142SSR=49041014和 Lxx=1010010000400Lyy=60020100040和 Lxy=70(-4)2(3)2072(-6)2SSE=1107070ˆ ˆ Y Y ˆ ˆX X 2020 3 3 7 7 1 1. . 7 7, , 0 01 1L Lxxxx1010ˆ ˆ ˆ ˆX X 1 1 7 7X Xˆ ˆ 回归方程为:Y Y0 01 1ˆ ˆ 1 1 (4) 求回归标准误差先求 SSR(Qe)见计算表。
所以L Lxyxyˆ ˆ Q Qe e110110 6 6. .055055. .n n 2 23 3ˆ ˆ, ,ˆ ˆ (5) 给出0 0 1 1的置信度为 95%的区间估计;ˆ ˆ的置信区间是ˆ ˆ 由于(1-)的置信度下,( ( i ii i查表可得t t / / 2 2( (n n 2 2) ) t t0 0. .025025( (3 3) ) 3 3. .182182ˆ ˆ t t s s ) ) t t s s ˆ ˆ, , ˆ ˆi i 2 2i i2 2i iS S ˆ ˆ 1 1ˆ ˆ2 2 L Lxxxx 3636. .667667 1 1. .9159151010所以 1 1的95%的区间估计为:(7—3.182*1.915, 7+3.182*1.915) , 即 (0.906,13.094) ˆ ˆS S ˆ ˆ0 01 1X X2 21 12525ˆ ˆ ( ( ) ) 3636. .667667( ( ) ) 6 6. .351351n nL Lxxxx5 510102 2所以 0 0的95%的区间估计为: (-1-3.182*6.351,-1+3.182*6.351) ,ˆ ˆ即(-21.211, 19.211) 。
0的置信区间包含 0,表示0不显著6)计算 x 和 y 的决定系数^^R R2 2 SSRSSRSSRSSR490490 0 0. .817817SSTSSTL Lyyyy600600(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第5页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第5页说明回归方程的拟合优度高7) 对回归方程作方差分析方差分析表方差来源SSRSSESST平方和490110600自由度134均方49036.667F 值13.364F值=13.364>F0.05(1,3)=10.13(当n1=1,n2=8时, α=0.05查表得对应的值为10.13) ,所以拒绝原假设,说明回归方程显著8)做回归系数β1的显著性检验 H0: β1=0ˆ ˆ/ / S Sˆ ˆ 7 7/ /1 1. .915915 3 3. .656656t t 1 1 1 1t 值=3.656>t0.05/2(3)=3.182,所以拒绝原假设, 说明 x 对 Y 有显著的影响。
8) 做相关系数 R 的显著性检验R R R R2 2 SSRSSR 0 0. .817817 0 0. .904904SSTSSTR 值=0.904>R0.05(3)=0.878,所以接受原假设,说明 x 和 Y 有显著的线性关系9) 对回归方程作残差图并作相应的分析残差图(略) .从残差图上看出,残差是围绕e=0在一个固定的带子里随机波动,基本满足模型的假设e ei i~N(0,~N(0, 2 2 ) ), 但由于样本量太少, 所以误差较大.(10) 求广告费用为 4.2 万元时,销售收入将达到多少?并给出置信度为 95%的置信区间.解: 当 X0=4.2 时,ˆ ˆ ˆ ˆX X 1 1 7 7 4 4. .2 2 2828. .4 4ˆ ˆ Y Y0 00 01 10 0(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第6页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第6页所以广告费用为 4.2 万元时, 销售收入将达到 28.4 万元.由于置信度为 1-α时,Y0估计值的置信区间为:ˆtSˆˆtSˆYY Y000Y YY Y200200S SY Yˆ ˆ Y Y0 00 01 1( (X X0 0 X X) )2 21 11 1. .4444ˆ ˆ ( (1 1 3636. .667667( (1 1 ) )n nL Lxxxx5 510102 2所以求得 Y0的 95%的置信区间为: [6.05932 ,50.74068]预测误差较大.2.152.15 一家保险公司十分关心其总公司营业部加班的制度,决定认真调查一下现状。
经过十周时间,收集了每周加班工作时间的数据和签发的新保单数目,x 为每周新签发的保单数目,y 为每周加班工作时间(小时) 见表 2.7表 2..7周序号18253.522151.0310704.045502.054801.069203.0713504.583251.596703.01012155.0XY1、画散点图散点图散点图5.0每每周周加加班班工工作作时时间间小小时时4.03.02、由散点图可以看出, x 与 y 之间大致呈线性关系2.0))1.0200400600800100012001400每周签发的新保单数目每周签发的新保单数目(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第7页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第7页3、用最小二乘法求出回归系数回回归归系系数数显显著著性性检检验验表表a a未标准化系数B标准误.118.355.004.000标准化系数β.94995%回归系数的置信区间下限上限-.701.937.003.005模型1t.3338.509(Constant)每周签发的新保单数目P 值.748.000a.Dependent Variable:每周加班工作时间(小时)由表可知:β0ˆ= 0.0 0 3 5 9ˆ= 0.118β1回归方程为:ˆ y = 0.118 +0.00359xˆ4、求回归标准误差σ方方 差差 分分 析析 表表b b模型1回归残差总和平方和16.6821.84318.525自由度189均方16.682.230F72.396P值.000aa.Predictors: (Constant), 每周签发 的新保单 数目b.Dependent Variable:每周加班 工作时间 (小时)由方差分析表可以得到:SSE=1.843^SSE故回归标准误差,=0.48。
n2^25、给出回归系数的置信度为 95%的区间估计回回归归系系数数显显著著性性检检验验表表a a未标准化系数B标准误.118.355.004.000标准化系数β.94995%回归系数的置信区间下限上限-.701.937.003.005模型1t.3338.509(Constant)每周签发的新保单数目P 值.748.000a.Dependent Variable:每周加班工作时间(小时)由回归系数显著性检验表可以看出,当置信度为95%时:0的预测区间为[-0.701,0.937],1的预测区间为[0.003,0.005].^^(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第8页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第8页0的置信区间包含0,表示0不拒绝为零的假设模模 型型 概概 要要b b模 型1R.949a决 定系数.900调 整后 的决 定系 数.888估 计值 的 标准 误差.4800Durbin-Wats on.753^^a.Predictor s: (Constant),每 周签 发 的 新保 单 数 目b.Dependent Vari able: 每 周加 班 工 作时 间 ( 小 时)6、决定系数由模型概要表得到决定系数为0.9接近于1,说明模型的拟合优度高。
方方 差差 分分 析析 表表b b模型1回归残差总和平方和16.6821.84318.525自由度189均方16.682.230F72.396P值.000aa.Predictors: (Constant), 每周签发 的新保单 数目b.Dependent Variable:每周加班 工作时间 (小时)7. 对回归方程作方差分析由方差分析表可知:F值=72.396>5.32(当n1=1,n2=8时,查表得对应的值为5.32)P值≈0,所以拒绝原假设,说明回归方程显著8、对1的显著性检验从上面回归系数显著性检验表可以得到1的t统计量为t=8.509,所对应的p值近似为0,通过t检验说明每周签发的新保单数目x对每周加班工作时间y有显著的影响9.做相关系数显著性检验^^(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第9页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第9页相相 关关 分分 析析 表表每周加班每周签发 的工作时间新保单数 目(小时)1.949**.0001010.949**1.0001010每周签发 的新保单 数目每周加班 工作时间 (小时)Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N**.Correlation is significant at the 0.01 level (2-tailed).相关系数达到0.949,说明x与y显著线性相关。
10、对回归方程作残差图并作相应分析未未标标准准化化残残差差0.60000残差图残差图0.300000.00000从残差图上看出,残差是围绕e=0随即波动,满足模型的基本假设0.30000-0.60000-0.90000200400600800100012001400每周签发的新保单数目每周签发的新保单数目11、 该公司预计下一周签发新保单 X0=1000 张,需要的加班时间是多少?当x0=1000张时,y = 0.118 +0.00359* 1000 = 3.7032小时12、给出Y0的置信水平为95%的预测区间通过SPSS运算得到Y0的置信水平为95%的预测区间为:(2.5195,4.8870)13 给出E(Y0)的置信水平为95%的预测区间通过SPSS运算得到Y0的置信水平为95%的预测区间为:(3.284,(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第10页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第10页4.123 )2.16表是 1985 年美国 50 个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入 x(美元).序号y1234567891011121314151617x序号yx序号yx19583334618202633114192032535542026800454221294704669222661048882330678571024271705536252585341682624500354727242743159282717036212930168378230265254247312736039823221690356833219743155342081630593518095296736209393285372264439143824624451739271864349403399050204123382359442206272821432279533664421570292045220802980462225037314720940285348218002533492293427295018443230551195382642204603124214192752251603429224823947209692509272245440258924042226443402246402829223412297256102932260153705257884123291323608414808349258453766解答:(1)绘制 y 对 x 的散点图,可以用直线回归描述两者之间的关系吗?4 0 0 0 0.0 03 5 0 0 0.0 03 0 0 0 0.0 0y y2 5 0 0 0.0 02 0 0 0 0.0 02 0 0 0.0 03 0 0 0.0 04 0 0 0.0 05 0 0 0.0 06 0 0 0.0 07 0 0 0.0 08 0 0 0.0 09 0 0 0.0 0x x(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第11页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第11页由上图可以看出 y 与 x 的散点分布大致呈直线趋势。
2)建立 y 对 x 的线性回归利用 SPSS 进行 y 和 x 的线性回归,输出结果如下:表 1模型概要RR2调整后的R20.8350.6970.6912323.25589表表2 2 方差分析表方差分析表模型1回归平方和残差平方和总平方和8.734E8502.645E849 5397517.938平方和6.089E8自由度1和平均6.089E8F值112.811P值.000a随机误差项的标准差估计值表表3 3 系数表系数表非标准化系数模型1常数对学生的人均经费投入B12112.6293.314标准差1197.768.312标准化系数回归系数t值10.113P值.000.000.83510.6211) 由表 1 可知,x 与 y 决定系数为r2 0.697,,说明模型的拟合效果一般x与 y 线性相关系数 R=0.835R=0.835,,说明 x 与 y 有较显著的线性关系2) 由表 2(方差分析表中)看到, F=112.811,显著性Sig.p 0.000,说明回归方程显著3)由表 3 可见对1的显著性 t 检验 P 值近似为零,故1显著不为 0,说明x 对 y 有显著的线性影响。
4)综上,模型通过检验,可以用于预测和控制完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第12页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第12页x 与 y 的线性回归方程为: 1211212112. .629629 3 3. .314314* * x xy y(3)绘制标准残差的直方图和正态概率图图 1 标准残差的直方图理论正态概率图 2标准残差的正态概率 P-P 图观测值概率由图 1 可见标准化后残差近似服从正态分布,由图 2 可见正态概率图中的各个散点都分布在 45°线附近,所以没有证据证明误差项服从同方差的正态分布的假定是不真实的,即残差通过正态性检验,满足模型基本假设完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第13页(完整word版)应用回归分析,第2章课后习题参考答案汇总(word文档良心出品)--第13页。












