
应用回归分析-第2章课后习题参考答案解析.doc
13页2.1 一元线性回归模型有哪些基本假定?答:1. 解释变量 是非随机变量,观测值是常数2. 等方差及不相关的假定条件为 这个条件称为高斯-马尔柯夫
2.2 考虑过原点的线性回归模型误差仍满足基本假定求的最小二乘估计答:令即解得即的最小二乘估计为2.3 证明: Q <,>= ∑<-->2 因为Q <,>=min Q <, >而Q <, > 非负且在上可导,当Q取得最小值时,有即-2∑<-->=0 -2∑<--> =0又∵=-< +>= --∴∑=0,∑ =0〔即残差的期望为0,残差以变量x的加权平均值为零2.4 解:参数β0,β1的最小二乘估计与最大似然估计在εi~N<0, 2 > i=1,2,……n的条件下等价 证明:因为 所以 其最大似然函数为 已知使得Ln〔L最大的,就是,的最大似然估计值 即使得下式最小 : ① 因为①恰好就是最小二乘估计的目标函数相同 所以,在 的条件下, 参数β0,β1的最小二乘估计与最大似然估计等价2.5.证明是的无偏估计 证明:若要证明是的无偏估计,则只需证明E<>= 因为,的最小二乘估计为 其中E<>=E<>=E<>=E[] =E[] =E<>+E<>+E<> 其中==由于=0,所以=== =>==0又因为一元线性回归模型为所以E<>=0所以E<>+E<>+E<==所以是的无偏估计。
2.6 解:因为①,②,③联立 ①②③式,得到因为,,所以2.7 证明平方和分解公式:SST=SSE+SSR证明:2.8 验证三种检验的关系,即验证:〔1;〔2证明:〔1因为,所以又因为,所以故 得证〔22.9 验证〔2.63式:证明:其中: 注:各个因变量是独立的随机变量2.10 用第9题证明是的无偏估计量 证明:注:2.11验证证明:所以有以上表达式说明r ²与F 等价,但我们要分别引入这两个统计量,而不是只引入其中一个理由如下:①r ²与F,n都有关,且当n较小时,r较大,尤其当n趋向于2时,|r|趋向于1,说明x与y的相关程度很高;但当n趋向于2或等于2时,可能回归方程并不能通过F的显著性检验,即可能x与y都不存在显著的线性关系所以,仅凭r较大并不能断定x与y之间有密切的相关关系,只有当样本量n较大时才可以用样本相关系数r判定两变量间的相关程度的强弱② F检验检验是否存在显著的线性关系,相关系数的显著性检验是判断回归直线与回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏2.12 如果把自变量观测值都乘以2,回归参数的最小二乘法估计和会发生什么变化?如果把自变量观测值都加上2,回归参数的最小二乘估计和会发生什么变化?解: 解法〔一:我们知道当,时,用最小二乘法估计的和分别为⑴当时有将②③带入①得到⑵当时有将②③带入①得到·解法〔二: 当,时,有 当时 当 , ,由最小二乘法可知,离差平方和时,其估计值应当有 。
即回归参数的最小二乘估计和在自变量观测值变化时不会变2.13 如果回归方程相应的相关系数r很大,则用它预测时,预测误差一定较小这一结论能成立吗?对你的回答说明理由解:这一结论不成立因为相关系数r表示x与线性关系的密切程度,而它接近1的程度与数据组数有关n越小,r越接近1n=2时,|r|=1因此仅凭相关系数说明x与有密切关系是不正确的只有在样本量较大时,用相关系数r判定两变量之间的相关程度才可以信服,这样预测的误差才会较小2.14 解:〔1散点图为:〔2x与y大致在一条直线上,所以x与y大致呈线性关系〔3得到计算表:XY1104100206〔-142〔-4221011001013〔-72〔32320000200042010027727254044004034142〔-62和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20 所以回归方程为:〔4= 所以,〔5因为 ,的置信区间为; 同理,因为,所以,的置信区间为查表知, 所以,的置信区间为〔-21.21,19.21,的置信区间为〔0.91,13.09。
〔6决定系数 〔7计算得出,方差分析表如下:方差来源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004 查表知,F0.05<1,3>=10.13,F值>F0.05<1,3>,故拒绝原假设,说明回归方程显著8) 做回归系数β1的显著性检验 计算t统计量: 查表知, ,所以,t>t0.05/2<3>,所以接受原假设,说明x和Y有显著的线性关系〔9做相关系数r的显著性检验:因为 所以,相关系数 因为查表知,n-2等于3时,%的值为0.959,%的值为0.878 所以,%<|r|<%,故x与y有显著的线性关系〔10残差表为:序号残差111064221013-33320200442027-75540346 残差图为:〔11当X0=4.2时, 其95%的置信区间近似为,即为: 〔17.1,39.72.15解:〔1画散点图; 图形→旧对话框→散点图,得到散点图〔表1如下:〔2x与y之间是否大致呈线性关系? 由上面〔1散点图可以看出,x与y之间大致呈线性关系。
用最小二乘估计求出回归方程; 分析→回归→线性,得到"回归系数显著性检验表〔表2"如 下:CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstBStd. ErrorBeta1
〔7对回归方程作方差分析; 由"方差分析表〔表3"可得,F-值=72.396, 我们知道,当原假设:=0成立时,F服从自由度为〔1,n-2的F分布〔见,临界值〔1,n-2=〔1,8=5.32 因为F-值=72.396>5.32, 所以拒绝原假设,说明回归方程显著,即x与y有显著的线性关系〔8做回归系数显著性的检验; 由"回归系数显著性检验表〔表2"可得,的t检验统计量为t=8.509,对应p-值近似为0,p<, 说明每周签发的新报单数目x对每周加班工作时间y有显著的影响〔9做相关系数的显著性检验; 分析→相关→双变量,得到"相关分析表〔表5"如下:Correlations每周签发的新保单数目x每周加班工作时间y每周签发的新保单数目xPearson Correlation1.949**Sig. <2-tailed>.000N1010每周加班工作时间yPearson Correlation.949**1Sig. <2-tailed>.000N1010**. Correlation is significant at the 0.01 level <2-tailed>. 由上表可知,相关系数为0.949,说明x与y显著线性相关。
〔10对回归方程作残差图并作相应的分析; 从上图可以看出,残差是围绕e=0随即波动的,满足模型的基本假。












