
第4章违背基本假设的情况.ppt
87页第四章 违背基本假设的情况,,,4.1 异方差性产生的背景和原因 4.2 一元加权最小二乘估计4.3 多元加权最小二乘估计4.4 自相关性问题及其处理 4.5 异常值与强影响点 4.6 本章小结与评注,第四章 违背基本假设的情况,,,,Gauss-Markov条件,4.1 异方差性产生的背景和原因,,,一、异方差产生的原因 例4.1 居民收入与消费水平有着密切的关系用xi表示第i户的收入量,yi表示第i户的消费额,一个简单的消费模型为:yi=β0+β1xi+εi,i=1,2,…,n低收入的家庭购买差异性比较小,高收入的家庭购买行为差异就很大导致消费模型的随机项εi具有不同的方差4.1 异方差性产生的背景和原因,,,二、异方差性带来的问题 当存在异方差时,普通最小二乘估计存在以下问题:(1)参数估计值虽是无偏的,但不是最小方差线性无偏估计;(2)参数的显著性检验失效;(3)回归方程的应用效果极不理想4.2 一元加权最小二乘估计,,一、异方差性的检验(一)残差图分析法,图2.5(b)存在异方差,4.2 一元加权最小二乘估计,,,一、异方差性的检验(二)等级相关系数法 等级相关系数检验法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。
这种检验方法既可用于大样本,也可用于小样本进行等级相关系数检验通常有三个步骤 第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即ei的值4.2 一元加权最小二乘估计,,,(二)等级相关系数法 第二步,取ei的绝对值,分别把xi和|ei|按递增(或递减)的次序分成等级,按下式计算出等级相关系数:,,其中,n为样本容量,di为对应于xi和|ei|的等级的差数4.2 一元加权最小二乘估计,,,(二)等级相关系数法 第三步,做等级相关系数的显著性检验在n>8的情况下,用下式对样本等级相关系数rs进行t检验检验统计量为:,,如果t≤tα/2(n-2)可认为异方差性问题不存在,如果t>tα/2(n-2),说明xi与|ei|之间存在系统关系,异方差性问题存在4.2 一元加权最小二乘估计,,,,,例4.3 设某地区的居民收入与储蓄额的历史统计数据如表4.11)用普通最小二乘法建立储蓄y与居民收入x的回归方程,并画出残差散点图;(2)诊断该问题是否存在异方差;,4.2 一元加权最小二乘估计,,,,,,,4.2 一元加权最小二乘估计,,,,,图4.1 残差图,4.2 一元加权最小二乘估计,,用SPSS计算等级相关系数。
4.2 一元加权最小二乘估计,,,,,(2)计算等级相关系数4.2 一元加权最小二乘估计,,,,,Spearman等级相关系数可以反映非线性相关的情况,Pearson简单相关系数不能反映非线性相关的情况例如x与y的取值如下,,,容易计算出y与x的简单相关系数r=0.9746,而y与x的等级相关系数rs=1,具有完全的曲线相关4.2 一元加权最小二乘估计,,,,,二、一元加权最小二乘估计,消除异方差性的方法通常有: 加权最小二乘法, Box-Cox变换法, 方差稳定性变换法加权最小二乘法(Weighted Least Square,简记为WLS)是一种最常用的消除异方差性的方法4.2 一元加权最小二乘估计,,,,,二、一元加权最小二乘估计,,一元线性回归普通最小二乘法的残差平方和为:,一元线性回归的加权最小二乘的离差平方和为:,,4.2 一元加权最小二乘估计,,,,,,,加权最小二乘估计为:,,其中,,,,是自变量的加权平均;,是因变量的加权平均4.2 一元加权最小二乘估计,,,,,观测值的权数应该是观测值误差项方差的倒数,即,,在实际问题中,误差项的方差是未知的,常与自变量x的幂函数xm成比例,其中m是待定的未知参数。
此时权函数为,,4.2 一元加权最小二乘估计,,,三、寻找最优权函数,,利用SPSS软件可以确定幂指数m的最优取值依次点选Analyze-Regression-Weight Estimation进入估计权函数对话框,默认的幂指数m的取值为m=-2.0,-1.5,-1.0,-0.5,0,0.5,1.0,1.5,2.0先将因变量y与自变量x选入各自的变量框,再把x选入Weight变量框,幂指数(Power)取默认值,计算结果如下(格式略有变动):,4.2 一元加权最小二乘估计,,,,Log-likelihood Function = -224.258830 POWER value = -2.000Log-likelihood Function = -221.515008 POWER value = -1.500Log-likelihood Function = -218.832193 POWER value = -1.000Log-likelihood Function = -216.252339 POWER value = -.500Log-likelihood Function = -213.856272 POWER value = .000Log-likelihood Function = -211.773375 POWER value = .500Log-likelihood Function = -210.185972 POWER value = 1.000Log-likelihood Function = -209.316127 POWER value = 1.500Log-likelihood Function = -209.379714 POWER value = 2.000,The Value of POWER Maximizing Log-likelihood Function = 1.500Log-likelihood Function = -209.316127,4.2 一元加权最小二乘估计,,,Analysis of Variance:,Variables in the Equation,4.2 一元加权最小二乘估计,,,,,,幂指数m的最优取值为m=1.5。
加权最小二乘的r2=0.9360,F值=423.741;普通最小二乘的r2=0.912,F值=300.732说明加权最小二乘估计的效果好于普通最小二乘的效果4.2 一元加权最小二乘估计,,,,,,图4.2 加权最小二乘残差图残差图,4.2 一元加权最小二乘估计,,,,,,,,,,4.2 一元加权最小二乘估计,,,,,,,,,,4.2 一元加权最小二乘估计,,,,,,,,,,,说明:1.关于异方差性的诊断,方法很多,至于哪种检验方法最好,目前还没有一致的看法残差图方法直观但较粗糙等级相关系数检验要比残差图检验方法更为可取 2.加权最小二乘并不是去真正消除异方差,而只是通过加权的方法消除异方差对回归估计的不良影响,4.3 多元加权最小二乘,,,,当误差项εi存在异方差时,加权离差平方和为,,,记,,加权最小二乘估计WLS的矩阵表达,4.3 多元加权最小二乘估计,,,,,,通常取权函数W为某个自变量xj(j=1,2,…,p)的幂函数,即, 在x1,x2,…,xp这p个自变量中取哪一个? 这只需计算每个自变量xj与普通残差的等级相关系数,选取等级相关系数最大的自变量构造权函数。
4.3 多元加权最小二乘估计,,,,,,,例4.4 续例3.2,研究北京市各经济开发区经济发展与招商投资的关系 因变量y为各开发区的销售收入(百万元), x1为截至1998年底各开发区累计招商数目, x2为招商企业注册资本(百万元) 计算出普通残差的绝对值abse=|ei|与x1、x2的等级相关系数,re1=0.443,re2=0.721,因而选取x2构造权函数4.3 多元加权最小二乘估计,,,,,,,4.3 多元加权最小二乘估计,仿照例4.3,用Weight Estimate估计幂指数m,得m的最优值为m=2 由于m=2是在默认范围[-2,2]的边界,因而应该扩大范围重新计算取m从1到5,步长仍为0.5,得m的最优值为m=2.5,4.3 多元加权最小二乘估计,,,,,,,4.3 多元加权最小二乘估计,,,,,,加权最小二乘的R2=0.84941,F值=33.84;普通最小二乘的R2=0.842,F值=31.96加权最小二乘估计的拟合效果略好于普通最小二乘加权最小二乘的回归方程为: =-266.96+1.696x1+0.4703x2普通最小二乘的回归方程为: =-327.039+2.036x1+0.468x2,,4.3 多元加权最小二乘估计,,,,,,,方差稳定变换,4.3 多元加权最小二乘估计,,,,,,,Box-Cox变换,§4.4 自相关性问题及其处理,,,,,,,如果一个回归模型的随机误差项cov(εi ,εj)≠0则称随机误差项之间存在着自相关现象。
这里的自相关现象不是指两个或两个以上的变量之间的相关,而指的是一个变量前后期数值之间存在的相关关系§4.4 自相关性问题及其处理,,,,,,,一、自相关性产生的背景和原因 1.遗漏关键变量时会产生序列的自相关性 2.经济变量的滞后性会给序列带来自相关性 3.采用错误的回归函数形式也可能引起自相关性 4.蛛网现象(Cobweb phenomenon)可能带来序列的自相关性 5.因对数据加工整理而导致误差项之间产生自相关性§4.4 自相关性问题及其处理,,,,,二、自相关性带来的问题,1.参数的估计值不再具有最小方差线性无偏性2.均方误差MSE可能严重低估误差项的方差3.容易导致对t值评价过高,常用的F检验和t检验失效如果忽视这一点,可能导致得出回归参数统计检验为显著,但实际上并不显著的严重错误结论 4.当存在序列相关时,仍然是β的无偏估计量,但在任一特定的样本中, 可能严重歪曲β的真实情况,即最小二乘估计量对抽样波动变得非常敏感 5.如果不加处理地运用普通最小二乘法估计模型参数,用此模型进行预测和结构分析将会带来较大的方差甚至错误的解释§4.4 自相关性问题及其处理,,,,,,,三、自相关性的诊断,(一)图示检验法 1. 绘制(et,et-1)的散点图。
§4.4 自相关性问题及其处理,,,,,,,三、自相关性的诊断,(一)图示检验法 2.按照时间顺序绘制回归残差项et的图形§4.4 自相关性问题及其处理,,三、自相关性的诊断,(二)自相关系数法误差序列ε1,ε2,…,εn的自相关系数定义为,,自相关系数的估计值为,,§4.4 自相关性问题及其处理,,三、自相关性的诊断,(三)D.W检验 D.W检验是J.Durbin和G.S.Watson于1951年提出的一种适用于小样本的一种检验方法 D.W检验验只能用于检验随机扰动项具有一阶自回归形式的序列相关问题 这种检验方法是建立计量经济学模型中最常用的方法,一般的计算机软件都可自动产生出D.W值§4.4 自相关性问题及其处理,,(三)D.W检验 随机扰动项的一阶自回归形式为: εt=ρεt-1+ut 其中ut是不相关序列 为了检验序列的相关性,构造的假设是H0:ρ=0,,,§4.4 自相关性问题及其处理,,(三)D.W检验,,,,定义D.W统计量为:,,。
