
计量经济学第三版潘省初第5章.ppt
117页1第五章第五章 模型的建立与估计中的模型的建立与估计中的问题及对策问题及对策衬错扔载睫膛顾恐拯揣爆白产喊嫉尉佐涛陷哗逝悠贪芬离等弘淆疽瓦昏画计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章2本章内容第一节 误设定第二节 多重共线性第三节 异方差性第四节 自相关洗佛舍碴歉芥扫鬃钟槽独誉嫂孟钠贪俐厉荤希茸历阜搅槐辙泪菏汲吩分翰计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章3 OLS估计量令人满意的性质,是根据一组假设条件而得到的在实践中,如果某些假设条件不能满足,则OLS就不再适用于模型的估计下面列出实践中可能碰到的一些常见问题: l误设定(Misspecification 或specification error) l多重共线性(Multicollinearity) l异方差性(Heteroscedasticity或Heteroskedasticity) l自相关(Autocorrelation) l 随机解释变量(Stochastic explanatory variables)本章将对上述问题作简要讨论,主要介绍问题的后果、检测方法和解决途径。
忧兰王匣耍儡岗姻五我忱膊垫垂攒婿磋木昔舷梆偷堪舞曙釉扮痹降二弦喀计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章4第一节 误设定采用OLS法估计模型时,实际上有一个隐含的假设,即模型是正确设定的这包括两方面的含义:函数形式正确和解释变量选择正确在实践中,这样一个假设或许从来也不现实我们可能犯下列三个方面的错误:l 选择错误的函数形式选择错误的函数形式l遗漏有关的解释变量遗漏有关的解释变量l包括无关的解释变量包括无关的解释变量从而造成所谓的“误设定”问题赶乃凑扼展亩瑞宵至铅秃悦铁忠碗涛箩尊山诗刷孺诡中啦笆站贱钳童芹诞计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章5一. 选择错误的函数形式 这类错误中比较常见的是将非线性关系作为线性关系处理函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的因此,我们应当根据实际问题,选择正确的函数形式 锰阁扰葡索坡姑谢毯蒜弱锚德露铆新象硕坛录丹哭赖崖痹涩欲官转透樟罢计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章6 我们在前面各章的介绍中采用的函数形式以线性函数为主,上一章还介绍了因变量和解释变量都采用对数的双对数模型,下面再介绍几种比较常见的函数形式的模型,为读者的回归实践多提供几种选择方案。
这几种模型是:• 半对数模型• 双曲函数模型• 多项式回归模型挪捷师降韦白曾锨彤噶娄五忘醛贫绚级溃遭说雁悦梳拍狸啸决掏邻葬路室计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章71. 半对数模型半对数模型 半对数模型指的是因变量和解释变量中一个为对数形式而另一个为线性的模型因变量为对数形式的称为对对数数-线线性性模模型型(log-lin model)解释变量为对数形式的称为线线性性-对对数数模模型型(lin-log model)我们先介绍前者,其形式如下: 对数-线性模型中,斜率的含义是Y的百分比变动,即解释变量X变动一个单位引起的因变量Y的百分比变动这是因为,利用微分可以得出: 闯屏寿蒲信谱娘锁弄氟冕嘛湿冠鲁倦表频释耸篆枷枯钞离填单踩湾酥禁壁计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章8 这表明,斜率度量的是解释变量X的单位变动所引起的因变量Y的相对变动将此相对变动乘以100,就得到Y的百分比变动,或者说得到Y的增长率由于对数-线性模型中斜率系数的这一含义,因而也叫增增长长模模型型 (growth model)增长模型通常用于测度所关心的经济变量(如GDP)的增长率。
例如,我们可以通过估计下面的半对数模型 得到一国GDP的年增长率的估计值,这里t为时间趋势变量遍赔煌沪犁致奎立蔼粪糜升铜螟犀尝斥论磁淫倪榔充辩会聘蚊迪嫡之桌杭计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章9线性-对数模型的形式如下: 与前面类似,我们可用微分得到 因此 这表明 上式表明,Y的绝对变动量等于 乘以X的相对变动量因此, 线性-对数模型通常用于研究解释变量每变动1%引起的因变量的绝对变动量是多少这类问题墅横捻攒狗俄蹈裕虫瑟起规泣糜龄织楷瞳侣雇西耙房爵束卜瘫添萄涤矫秆计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章102. 双曲函数模型双曲函数模型 双曲函数模型的形式为: 不难看出,这是一个仅存在变量非线性的模型,很容易用重新定义的方法将其线性化 双曲函数模型的特点是,当X趋向无穷时,Y趋向 ,反映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线(Y = ) 双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线弧馈碾奇谋睫唁哦荣有叔恋厉窥糕灯滔翰悦抉烤陀薛帧遵珍免言拼秦抠撵计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章113. 多项式回归模型多项式回归模型 多项式回归模型通常用于描述生产成本函数,其一般形式为: 其中Y表示总成本,X表示产出,P为多项式的阶数,一般不超过四阶。
多项式回归模型中,解释变量X以不同幂次出现在方程的右端这类模型也仅存在变量非线性,因而很容易线性化,可用OLS法估计模型兵绽侣挤梗戳遵玖掌挚稳寓摄肉伍麻续镊弟袍轻锰窍七迅绳沙辟镑髓蛙绿计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章12二. 遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量的后果是:将使模型参数估计量不再是无偏估计量三. 包括无关的解释变量 模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差 [注] 有关上述两点结论的说明请参见教科书P112-113皮西氧洁宋句石吊资丛魏漂茎嘉菩魔犹烦玻恃崖褪召簧别董呢净觅齐锐床计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章13四. 选择解释变量的四条原则 在模型设定中的一般原则是尽量不漏掉有关的解释变量因为估计量有偏比增大误差更严重但如果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量 在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用。
尽管如此,还是有一些有助于我们进行判断的原则可用,它们是:肇筏本杂罩画霹染约惧泽囤芒蜒研雌遇编铃串罢檀铱岛境袱津鼎林泞闷躺计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章14选择解释变量的四条原则选择解释变量的四条原则 1. 理论: 从理论上看,该变量是否应该作为解释变 量包括 在方程中? 2. t检验:该变量的系数估计值是否显著? 3. : 该变量加进方程中后, 是否增大? 4. 偏倚: 该变量加进方程中后,其它变量的系数 估计值是 否显著变化?如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是“否”, 则该变量是无关变量,可以安全地从方程中删掉它这是两种容易决策的情形斧宜虚酶程您奏旧抑懊捎泽蔗另省镍晰衰睦墒诚做很苇馒齿席锣庚沫结迁计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章15 但根据以上原则判断并不总是这么简单在很多情况下,这四项准则的判断结果会出现不一致例如,有可能某个变量加进方程后, 增大,但该变量不显著。
在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则如果不这样做,产生不正确结果的风险很大 在这种情况下,作出正确判断不是一件容易的事,处理的原则是将理论准则放在第一位麦管赠页反塘儿桶诱弟户玻忘贵珐授鸭牺诚旧剑循殿酉雅调骇蹬写御听蔼计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章16*五、模型的选择五、模型的选择 上一段讨论了某个解释变量应否包括在模型中的几条原则实践中,要解决的一个问题是如何从大量的潜在解释变量的集合中选择一个最合适的子集,以得到一个正确设定的模型 上个世纪六十年代后相当一段时间,人们使用逐步回归法来解决解释变量的选择问题这种由计算机机械挑选变量的做法如今已不流行了目前比较通行的做法是从少量精心设定的备选模型中选择一个 计量经济学家就此提出了很多基于统计学的选择标准,我们这里讨论其中几种,如表5-1所示钻生垢贩息技城深闲栖翘啤猴卫隔栏奇稗逛渺卫墓民砌希吴韵垦卉饲灭磅计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章17 令RSSj表示第j个模型(有kj个解释变量)的残差平方和,并定义 为第j个模型的的 估计值。
我们 用表示包含全部k个解释变量的模型的 估计值钎吐奎千伴夜占娜猴懦靛涧鞠抠报鉴价噬吹捻菱睡涩讫垂掇豁误锑遵驱兵计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章18表5-1 选择回归模型的准则准则 计算公式 馒湛嫂激煎紊辈练张藐辙尚殃淌岗固疏算贩荆肢街擦岩硅殖酶诅皇灭抉秀计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章19 1. 准则准则 希尔(Theil)的 准则基于如下假设:所考虑的模型中有一个是正确模型对于正确模型, ,对于不正确模型, 因此,选择 最小的模型一般就能选出正确模型由于 最小化与 最大化是一回事,我们习惯上称该准则为 最大准则 这个准则的主要问题是,一个包括正确模型的所有解释变量但同时也包括一些无关变量的模型也会给出 ,在这种情况下,我们所选择的其实并非正确模型当备选模型包含大量无关变量时,选出正确模型的概率较低。
募位娩测蓖蓄鸡料植诽桑灼熙厘涡湿卉查钦庇毯盯涟枚褒颖拭参祭呢豢找计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章20 2. 基于预测的均方误差最小的三个准则基于预测的均方误差最小的三个准则 希尔的准则是基于回归的标准误差最小,下列三个准则则是基于预测的均方误差(MSE)最小这三个准则是: 马娄斯(Mallows)的 准则 霍金(Hocking)的 准则 阿美米亚(Amemiya)的PC准则 假设正确的方程有k个解释变量,我们考虑的方程有 个解释变量,问题是如何选择k1以及具体的k1个解释变量的集合在上述三个预测准则中,这是通过使的均方误差 达到最小实现的,其中 是Y的未来值,而 是预测值 秀赔斑云缔文饮字啦烷任流谱鹿彼鼓捷镐申沽诚薄柔嚷仅东潜钥黑慈皋踞计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章21 上述三个准则都是基于预测的均方误差最小,但在估计预测的均方误差时采用的假设有所不同,因而形成各自的计算公式,孰优孰劣,并无定论,在实践中可根据所用软件提供的输出结果选用其中一个作为模型选择的准则。
具体做法是比较备选的几个模型的 、 或PC值,选其中最小的即可 在三个预测准则的情况下,我们感兴趣的是改善预测的MSE,只要能改善,可以去掉某些变量,即便是正确模型中包括它们也在所不惜烂钡魏州峙爽辽剪肢原滑席腕立薯等盗欠汕颧找洞秒羽环漏偷考囚皿喧篆计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章22 3. 赤池信息准则(赤池信息准则(AIC)) 赤池信息准则(Akaike’s Information Criterion,AIC)是一个更一般的准则,它可以应用于任何一个可用极大似然法估计的模型对于我们这里的应用,AIC的计算公式为 与赤池信息准则类似的还有施瓦茨信息准则(Schwarz information criterion,SIC):上述两个准则与前述准则 一样,可用于模型选择,其值也是越小越好汉知穴乖娘烽肿所字倘茎锁旨淑藻糊牛执嘘岸遵酋佰浸赣拥怪洗钎翟老砷计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章23六. 检验误设定的RESET方法 前面给出了选择解释变量的四条原则可是,有时这些原则不能提供足够的信息使研究人员确信其设定是最恰当的,在这种情况下,可考虑使用一些更正规的检验方法来比较不同估计方程的性质。
这类方法相当多,这里就不一一列出,仅介绍拉姆齐(J. B. Ramsey)的回归设定误差检验法(RESET法, Regression Specification Error Test)奴捏风撑搞脊给喻崇搽昼娟堵扼侨土版扦饥户兼逃误扼烬寅斩峨五田浅详计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章24 RESET检验法的思路 RESET检验法的思路是在要检验的回归方程中加进 等项作为解释变量,然后看结果是否有显著改善如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题 直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通过F检验, 表明它们改善了原方程的拟合状况,则我们有理由说原方程存在误设定问题 另一方面, 等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置,因而如果存在(函数形式方面的)误设定,则用这样一个装置可以很好地代表它们柞何金铅慢么表昂芳袍脐狸请毁惶毛著祈柔盼快涅旺矽趟杉时复磐栽掐锡计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章25RESET检验法的步骤 拉姆齐RESET检验的具体步骤是:(1) 用OLS法估计要检验的方程,得到 (2) 由上一步得到的值 (i=1,2,…,n),计算 ,然后用OLS法估计: (3) 用F检验比较两个方程的拟合情况(类似于上一章中联合假设检验采用的方法),如果两方程总体拟合情况显著不同,则我们得出原方程可能存在误设定的结论。
使用的检验统计量为: 媚邯撼市桅硅煌避绷羽殉玛搪划晓张毖旅诉搜檄咆仗榨梁牡戴都酝旷孕丸计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章26其中:RSSM为第一步中回归(有约束回归)的残差平方和,RSS为第二步中回归(无约束回归)的残差平方和,M为约束条件的个数,这里是M=3 应该指出的是,拉姆齐RESET检验仅能检验误设定的存在,而不能告诉我们到底是哪一类的误设定,或者说,不能告诉我们正确的模型是什么但该方法毕竟能给出模型误设定的信号,以便我们去进一步查找问题另一方面,如果模型设定正确,RESET检验使我们能够排除误设定的存在,转而去查找其它方面的问题叼丸边漳拭扁蜀迅炼萄娩猾景恋宏燃篱漏桶遍江歧宜搔僧锣写磺欺框镐大计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章27第二节 多重共线性 应用OLS法的一个假设条件是;矩阵X的秩=K+1 当某些解释变量高度相关时,尽管估计过程不会中断,但会产生严重的估计问题,我们称这种现象为多重多重共线性共线性解释变量间存在严格线性相关关系时,称为完完全的多重共线性全的多重共线性志殉著腰胸倘墨搁悟落脚偶出烫埋轧拐密为陋安鉴愈文侩卞榔炎握处改鸣计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章28一 定义 在实践中,若两个或多个解释变量高度线性相关,我们就说模型中存在多重共线性二 后果 1. 不改变参数估计量的无偏性; 这是因为,尽管解释变量之间存在多重共线性,但并不影响扰动项和解释变量观测值的性质,故仍有 事实上,对于不完全多重共线性,参数估计量仍为BLUE输符勺稗缆税槽拉道册胁丘条页着逸四喊响晚闻渐锑沫迭贼柬滴道规添漱计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章29 2. 但各共线变量的参数的OLS估计值方差很大,即估计值精度很低BLUE表明在各线性无偏估计量中方差最小,但不等于方差的值很小 3 由于若干个X变量共变,它们各自对因变量的影响无法 确定 4. 各共线变量系数估计量的t值低,使得犯第Ⅱ类错误的可能性增加。 由于各共线变量的参数的OLS估计值方差大,因而系数估计量的t值低,使得我们犯第Ⅱ类错误(接受错误的原假设H0: βj=0)的可能性增加,容易将本应保留在模型中的解释变量舍弃了盎兢跺咋姿募趣沁谐次宣蒲鸽铰刊爪充啦晨么仗统锁厂蒜浓泣痞恬崖恐署计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章30三 多重共线性的判别和检验1.根据回归结果判别 判别是否存在多重共线性的最简单方法是分析回归结果 如果发现: 系数估计值的符号不对; 某些重要的解释变量t值低,而R2不低; 当一不太重要的解释变量被删除后,回归结果 显著变化 则可能存在多重共线性其中上述第二种现象是多重共线性存在的典型迹象 此方法简便易行,因而是实践中最常用的方法,缺点是无 法确诊忙冕痉纠歉陨矣丹挎并谬津洪笔脾代汤戚革析蓉鸡遭韶反钧无男挖蕾扶沃计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章312.使用相关矩阵检验 统计软件一般提供各解释变量两两之间的相关系数矩阵,如发现某些相关系数高(绝对值高于0.8或0.90),则表明多重共线性存在。 但即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性3.通过条件指数检验 条件指数(Condition index)或条件数Condition number)是X’X矩阵的最大和最小特征根之比的平方根,条件指数高,表明存在多重共线性至于什么程度算高,也没有一个绝对的标准通常认为大于10即存在多重共线性,大于30表明存在严重多重共线性大多数统计软件提供此检验值舞霍跨墓根妨兑辊排黔鉴贸忙奴伟炮贬撰舵属傻买谤工肯斤迭祁邯览钙氓计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章32 4. 使用使用VIF检验检验 VIF是方差膨胀因子的英文 (Variance Inflation Factors) 缩写, 这是一种比较正规的检验方法该方法通过检查指定的解释变量能够被回归方程中其它全部解释变量所解释的程度来检测多重共线性 方程中每个解释变量有一个VIF,该VIF是关于多重共线性使相应的系数估计值的方差增大了多少的一个估计值高VIF表明多重共线性增大了系数估计值的方差,从而产生一个减小了的t值 VIF检验的具体步骤如下:屏脓渴妇伊通仗怜尔已低第遇源贞愈福远瘴号笨祷满试糜乳晰僵根段拧鲸计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章33 设原方程为: Y = 0 + 1X1 + 2X2 + … + kXk + u 我们需要计算K个不同的VIF,每个Xi一个。 为指定Xi计算VIF涉及以下三步:(1)Xi 对原方程中其它全部解释变量进行OLS回归,例如,若i =1,则回归下面的方程: X1 = 1 + 2X2 + 3X3 +… + kXk +v(2)计算方差膨胀因子(VIF): 其中Ri2是第一步辅助回归的决定系数码姻拼高颂渺津儿姑推冬泛隧薄缄遥枝修宠赘靳辰乱卫隙贡狐岳蓉告烦决计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章34(3)分析多重共线性的程度VIF越高, 多重共线性的影响越严重由于没有VIF临界值表,我们只能使用经验法则: 若 ,则存在严重多重共线性也有人建议用VIF>10作为存在严重多重共线性的标准, 特别在解释变量多的情形应当如此 需要指出的是,所有VIF值都低,并不能排除严重多重共线性的存在,这与使用相关系数矩阵检验的情况相似人鸦蚕盐咎卜斌媳测俯裴牺滴毙鸥钞前挞送患胯徐脏绘悉宋止决笋抵吕宅计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章35 四 解决多重共线性的方法 思路:加入额外信息。 具体方法有以下几种:• 增加数据• 对模型施加某些约束条件• 删除一个或几个共线变量• 将模型适当变形1.增加数据 多重共线性实质上是数据问题,因此,增加数据就有可能消除或减缓多重共线性,具体方法包括增加观测值、利用不同的数据集或采用新的样本碟萄淄言之旷屎终邓孤十阀笑载辣蹄墟赠转肉眷佰黑烟沈络是轧屋索歉惦计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章36例:需求函数Yt = β1+β2Xt+β3Pt+ ut 在时间序列数据中,收入(X)和价格(P)往往是高度相关的,用时间序列数据估计往往会产生多重共线性然而,在横截面数据中,则不存在这个问题,因为某个特定时点P为常数如果取一横截面样本(如从5000个家庭取得的数据),则可用来估计 Yi = α1+α2Xi+ ui 然后将得到的估计值 作为一个约束条件(β2 = )施加于时间序列数据的回归计算中,即估计 Yt - Xt =β1+β3Pt+ ut ,得到 , 亏鼠蛾米励屉欲惩方绦瀑犊须筋姐靴嗅例鼻啤弄菠胖卞芜刊仁砰涂材逻广计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章372.对模型施加某些约束条件 在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差,如在Cobb—Douglas生产函数中加进规模效益不变的约束,可解决资本和劳动的高度相关而引起的多重共线性问题。 3.删除一个或几个共线变量 这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题删除哪些变量,可根据假设检验的结果确定 应注意的是,这种做法可能会使得到的系数估计量产生偏倚,因而需要权衡利弊 拎躇舰疲言嘴嫡写顾衷帖鼻续仿棱船蚀纷鹏篡忌荧捆掖严水回惩舌慈汛券计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章384.将模型适当变形例1.某商品的需求函数为:其中:Q = 需求量, X = 收入, P = 该商品的价格, P* = 替代商品的价格 在实际数据中,P和P*往往呈同方向变动,它们之间高度相关,模型存在多重共线性 如果我们仅要求在知道两种商品的相对价格变动时,对需求量进行预测,则可将需求函数变为: 就可以解决多重共线性问题馏辐镜柿娇够缠卒颤镊胞穴典镇镶烯戌试喻眼欣宣眷楞寺津蒜滴豹修红戚计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章39例2.有滞后变量的情形 Yt = β1+β2Xt+β3 Xt-1 + ut 一般而言,Xt和Xt –1往往高度相关,将模型变换为: Yt = β1+β2(Xt - Xt –1)+β3´Xt -1+ ut 其中β3´=β3 +β2 经验表明:△Xt和Xt –1的相关程度要远远小于和Xt和Xt –1的相关程度,因而这种变换有可能消除或减缓多重共线性。 暖戮菏盈掉赤厄涂挤啡仅楷炔藐床劲伟莱僵练虏挽翘疾疚剑僧惠卫抬摘柄计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章405.主成分法 可将共线变量组合在一起形成一个综合指数(变量),用它来代表这组变量构造综合指数的最常用方法是主成分法主成分法的计算相当复杂,这里不做介绍 主成分的特点是,各主成分之间互不相关,并且,用很少几个主成分就可以解释全部X变量的绝大部分方差,因而在出现多重共线性时,可以用主成分替代原有解释变量进行回归计算,然后再将所得到的系数还原成原模型中的参数估计值孔嘉努碗题莫论对邢秃雁楼幢靴嚼硕蜕率辱墓斡词绿据振匿实膏垂韭烩屡计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章41五. 处理多重共线性问题的原则1. 多重共线性是普遍存在的,轻微的多重共线性问题可不 采取措施3. 如果模型仅用于预测,则只要拟合好,可不处理多重共线性问题,存在多重共线性的模型用于预测时,往往不 影响预测结果2. 严重的多重共线性问题,一般可根据经验或通过分析回归结果发现如影响系数的符号,重要的解释变量t 值很低要根据不同情况采取必要措施。 浓轧烈椎嚣寨坟女揖累依寇议痢磕荒甸貉评宛锚贯樊卤姓杠松闯撕脆除讶计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章42(1)E(ut)=0, t=1,2,…,n. 扰动项均值为0 (2)Cov(ui,uj) = E(uiuj) =0, i≠j. 扰动项相互独立 (3)Var(ut) = E(ut²) = 2 , t=1,2,…,n. 常数方差 (4)ut ~N(0,2). 正态性 对于(1),我们可论证其合理性而第(4)条,也没有多大问题大样本即可假定扰动项服从正态分布而对于(2),(3)两条,则无法论证其合理性实际问题中,这两条不成立的情况比比皆是下面将讨论它们不成立的情况,即异方差性和自相关的情形第三节 异方差性 回顾我们应用OLS法所需假设条件,其中大部分是有关扰动项的统计假设,它们是:芍扒肌怯钦寸粹铃己奉忿虽失鸦抚窝喉臂郸异总箔悸楚雅眷希过蛹头芳夹计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章43一 异方差性及其后果1.定义 若Var(ut) = = 常数的假设不成立,即 Var(ut) = ≠常数,则称扰动项具有异方差性。 2. 什么情况下可能发生异方差性问题? 解释变量取值变动幅度大时,常数方差的假设往往难以成立异方差性主要发生在横截面数据的情况,时间序列问题中一般不会发生,除非时间跨度过大腺媒薯裙琅研仍谰纂令帖潭痞惋稼舍皆解译剑烯科峰坷尤豪严酗庸唾查侦计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章44例:Yi = α+βXi+ ui 其中:Y=指定规模和组成的家庭每月消费支出 X=这样的家庭的每月可支配收入 设X的N个观测值取自一个家庭可支配收入的横截面样本某些家庭接近于勉强维持生存的水平,另一些家庭则有很高的收入 不难设想,低收入家庭的消费支出不大可能离开他们的均值E(Y)过远,太高无法支持,太低则消费将处于维持生存的水平之下因此,低收入家庭消费支出额的波动应当较小,因而扰动项具有较小的方差而高收入家庭则没有这种限制,其扰动项可能有大得多的方差这就意味着异方差性委鼎镐虏娜壁瓶憋是嘱净疡脱匈叉症敦嗓评蛋支焉虏赫隔者肖镣冀尖玉磋计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章45 3.异方差性的后果(1)参数估计量不再具有最小方差的性质 异方差性不破坏OLS估计量的无偏性,但不再是有效的。 事实上,异方差性的存在导致OLS估计量既不是有效的,也不具有渐近有效性 这有两层含义首先,小样本性质—BLUE的丧失意味着存在着另外的线性无偏估计量,其抽样方差小于OLS估计量的方差其次,渐近有效性这一大样本性质的丧失,意味着存在着另外的一致估计量,其抽样分布当样本容量增大时,向被估计的回归参数收缩的速度要比OLS估计量快 拢曼恕豪魂栈疗勒构勘屑番蛋坦吧邯炸秩图哟蓉郡朝摈早凛铭直牙蜒弧拣计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章46(2)系数的显著性检验 更为严重的是,在异方差性的情况下, 矩阵主对角元素不再是OLS估计量方差的无偏估计量,从而导致系数的置信区间和假设检验结果不可信赖 例如在双变量模型中,如果 倾向于低估的真实方差,则置信区间可能要比实际的窄,给我们一个错误信息,好象得到的点预测值很精确同样,在异方差性的情况下,假设检验也会以错误的结果将我们带入歧途例如,被检验的系数实际上不是统计上显著的,而由于矩阵 的主对角元素低估了OLS估 计量的相应方差,检验结果却表明其显著。 卫必简吹逐田匝译呕贤野烹馈伞恕凳捅砌痊锤淫乍巴遮朽剿盐秘蟹毒躬披计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章47二 异方差性的检验 异方差性后果的严重性意味着我们在实践中必须了解是否存在异方差性 常用的检验方法有: 斯皮尔曼等级相关检验法(Spearman Rank Relation test) 戈德弗尔德—匡特检验法(Goldfeld Quandt test) 格里瑟检验法(Glesjer test) 帕克检验法(Park test) 怀特检验法 (White’s General Heteroscedasticity test) 布鲁奇-帕根检验法(Breusch-Pagan Test)酿矫笼邀景频辕炳奠竞棕取奠桥旅在挥母修明晕壕垮亨硷鞠嗓音咐管朗谩计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章481.戈德弗尔德——匡特检验法基本思路:假定 随Yt的数值大小变动检验步骤:(1)将数据分为三组:小Yt值组,中Yt值组,大Yt值组(数据项大致相等)(2)对小Yt值组估计模型,给出 (3)对大Yt值组估计模型,给出 葫彰申段际拘揪绕碰驰叭址塑蔽礼耐坠蔡硝币属反寺碰宛诚倔纂帚恕吾蔡计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章49 (4) H0: H1: (或 ) 检验统计量为F0 = ~F(n3-k-1, n1-k-1) 若F0>Fc,则拒绝H0,存在异方差性。 蒸抹寒溶以肢硅凭倡椭危传旱猫福吸绣浑阉守固身贼却赌暂障缩掀肖视里计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章50例:S=α+βY + u 其中:S=储蓄 Y=收入 设 1951—60年, =0.01625 1970—79年, =0.9725 F0 = 0.9725/0.01625=59.9 查表得: d.f.为(8,8)时,5% Fc=3.44 ∵F0>Fc 因而拒绝H0 结论:存在异方差性家眷骆侣品雄版蓬驴蛹棱贴故古陌冗擞乾苟缨官撞剥牵李刮皖遮腥脾猫哑计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章512. 怀特检验法(White’s General Heteroscedasticity Test) 怀特提出的检验异方差性的方法在实践中用起来很方便,下面用一个三变量线性模型扼要说明其检验步骤设模型如下:White检验步骤如下: (1)用OLS法估计(1)式,得到残差e i ; (2)进行如下辅助回归即残差平方对所有原始变量、变量平方以及变量交叉积回归,得到R2值;追莫卸慑贸与乓斧反财兵苇根虽勇摊湖蔫资簿挖毗谢忍绸眶彤互哪郁碰熏计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章52(3)进行假设检验 原假设 H0:不存在异方差性(即方程(2)全部 斜率系数均为零) 备择假设 H1:存在异方差性(即H0不成立) 怀特证明了下面的命题: 在 原假设 H0成立的情况下,从(2)式得到的R2值与观测值数目(n)的乘积(n× R2)服从自由度为 k的2分布,自由度 k 为(2)式中解释变量的个数。 即 n· R2 ~ 2(k) 因此,怀特检验的检验统计量就是n· R2 ,其抽样分布为自由度为k的2分布 检验步骤类似于t检验和F检验缅旁八淬剁嗜胯鉴级嗓诸阔颂痕潜晤先抹通鳞袜威皿淑产平魂哆角艺赶待计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章53例例5.7 根据2006年内地31省市的数据,研究文化娱乐支出ama与人均可支配收入income和文化娱乐价格priceama之间的关系,建立回归模型,得到如下估计结果:Ama = 1661.54+ 0.135income -20.64priceama t: (14.44) (-1.18)由于各个省市的收入差距比较大,文化娱乐支出的差距也会比较大,因此可能存在异方差性下面通过white检验来判断是否存在异方差性毯存争肚对撒柑嚣并浮殊确她茨蛛拌例剧境蜀镊夯幼玖露勾砸弧黍阐央履计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章54先对该模型作OLS回归,得到残差;然后做如下辅助回归: 这里 X1i = income, X2i = priceama使用EViews软件,得到辅助回归的 ,因此 (3) 检验 :不存在异方差性 :存在异方差性查表,在5%的显著性水平下,自由度为5的 值为11.07,因为 >11.07,所以拒绝原假设,结论是存在异方差性。 篷姆长求搅苗揽惊辱藻澎殷肆诚点颁迈危抄谷擅艺痹抢柠建益彦棕歧诈蛙计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章553.布鲁奇.布鲁奇-帕根检验法帕根检验法 设模型 满足扰动项均值为0的假设,因而OLS估计量无偏且一致检验该模型是否存在异方差性的原假设为:片床彰颇痒徽私贩桔噬腻鱼秆爪份狱丁事吴演瓶镑械漾刚痔钱匡钙智啃凡计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章56 如果 不成立,则 的期望值可以表示为诸解释变量的函数,简单的方法是假定线性函数:其中v是均值为0的误差项这里的因变量 是原回归方程(5.15)中误差项的平方同方差性的原假设(5.16)转换为:要检验此假设,可用我们在第四章中介绍的检验全部斜率系数为0的F检验,唯一的问题是作为因变量的 无法观测,可以用原模型(5.15)回归得到的OLS残差平方和 代替之,要估计的方程变为:本酷深密危页厅印摔眼嗜浚娠得褪骇殿有旬计忱嗽徊锤您塘首能章搽双岳计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章57相应的检验统计量为其中 是(5.19)式回归得到的决定系数,以区别于原方程(5.15)回归的决定系数 。 我们也可以计算LM检验统计量来检验原假设(5.18 ):此检验通常称为布鲁奇布鲁奇-帕根异方差性检验帕根异方差性检验(BP检验) 侮蝉衬酚趟爬惋褪腆谊迢涝几峭骋帖谅闲创董伪傻辈冤融岔韩闰狙丘香敛计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章58下面总结一下BP检验的步骤:(1)用OLS法估计模型(5.15),得到OLS残差序列 ,计算序列 ;(2)对方程(5.19)执行OLS回归,保存该回归的 值;(3)计算F或LM统计值,若大于临界值,则拒绝原假设,判断存在异方差性妥用卜窖啼坝撼默轿椅卖叹枉地染涧退滤灰泵徽秤川潜姿镁邀婉易森存忧计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章59三 广义最小二乘法1.消除异方差性的思路 基本思路:变换原模型,使经过变换后的模型具有同方差性,然后再用OLS法进行估计 对于模型 Yt = β0+β1X1t+…+βk Xkt+ ut (1) 若扰动项满足 E(ut) = 0,E(uiuj) = 0, i≠j, 但 E(ut2) = σt2 ≠常数. 也就是说,该模型只有同方差性这一条件不满足,则只要能将具有异方差性的扰动项的方差表示成如下形式: 馆官辜涎朴诊指粉乙勾吩澄睬哲融审嚎判饿辊肾效婶虽像苟想梳畦棚桨御计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章60 由于所以变换后模型的扰动项的方差为常数,可以应用OLS法进行估计,得到的参数估计量为BLUE。 但这里得到的OLS估计量是变模后模型(2)的OLS估计量对于原模型而言,它已不是OLS估计量,称称为为广广义最小二乘估计量(义最小二乘估计量(GLS估计量)估计量) 其中 为一未知常数, 表示一组已知数值,则用λt去除模型各项,得变换模型:牺恍描螺掳郊考概然责喘笨蹦笆哨这搽宾仟膛曰逢肚奈飞滥戎蛙蛀毛危梆计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章612.. 广义最小二乘法广义最小二乘法(Generalized least squares) 下面用矩阵形式的模型来推导出GLS估计量的一般计算公式 设GLS模型为 Y=Xβ+u (1) 满足 E(u)= 0,E(uu´)=2Ω, X 非随机, X的秩=K+1<n, 其中Ω为正定矩阵 驭栖踢满涣腔汀驯投谚厩澄蜀涨壳铺绑吨渐艾兰帐改终月船籍葡吱逐亭乞计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章62 根据矩阵代数知识可知,对于任一正定矩阵Ω,存在着一个满秩(非退化,非奇异)矩阵P,使得用P-1左乘原模型(1)(对原模型进行变换):令 Y* = P-1Y ,X* = P-1X,u* = P-1u,得到 Y*= X*β+ u* (2) 下面的问题是,模型(2)的扰动项u*是否 满足OLS法的基本假设条件。 汐火押厌镐鲸螺杭耘茫忌凋监歉嘲棵通湿椽梯娜再舷笨朽绽庞坡智虐素铅计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章63我们有烬脚庄缝蜀鹏庞稠珊燎甫谐募碘圃嘱叙混遁捷卯梳斑焉煎徘冻押懂意毕宫计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章64这表明,模型(2)中的扰动项u*满足OLS法的基本假设,可直接用OLS估计,估计量向量这就是广义最小二乘估计量(GLS估计量) 的公式,该估计量是BLUE 从上述证明过程可知,我们可将GLS法应用于Ω为任意正定矩阵的情形于册夯漱侦鸳凯否裸撅罢诬啊伞宪叁杂吓券顶灿铝洪遥帧箍灯蠢沂烁赊附计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章65如果只存在异方差性,则其中我们显然有辐恶届壕趴挝城径第碴考倚撂虐脉狼蒋读娶睡西戊邵故乘矗热怎厕馏憨衍计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章66月儿骸痊挣蓖摩异躬常夏婿构机庆舆抄踊陆法瑶炽渴傀羡拾绊延鸥塔锑努计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章67四、解决异方差问题的方法四、解决异方差问题的方法1. 可行广义最小二乘法(可行广义最小二乘法(FGLS法)法) 广义最小二乘法从理论上解决了扰动项存在异方差性的情况下模型的估计问题,但在实践中是否可行呢? 从GLS估计量的公式可知,要计算GLS估计值,我们必须知道 矩阵。 而实际问题中 矩阵极少为已知因此,在实践中直接应用GLS法基本上不可行疥灰屏拔南潮战旬舞庄均彦玻彼葡抡啥垢骇委镇颇兽镶锨妆匙号照掠贾寓计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章68 但在很多情况下,我们可以根据实际问题提供的信息估计 矩阵,再应用GLS法,这种方法称为可行广可行广义最小二乘法义最小二乘法(Feasible Generalized Least Squares, FGLS) 例如在仅存在异方差性的情况下,如果在实际问题中,研究人员确信可以准确估计异方差性的结构,如扰动项方差与某个解释变量成正比,就可以采用FGLS法由于FGLS法的核心是估计 矩阵,因此亦称为估计的广义最小二乘法估计的广义最小二乘法(Estimated Generalized Least Squares, EGLS)耙沏池逾纂瓜客橙估拾幕楼逐笺榷衙衷经敞瘸募犯疥疤盲积枣逆残畏翰抽计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章69 FGLS法的第一步是确定异方差性的具体形式,也就是找出决定扰动项方差与某组已知数值之间关系的函数形式,然后用这个关系得到每个扰动项方差的估计值,从而得到 矩阵的估计值 ,最后计算FGLS估计量 :醉蓬殆及烫傻炒瘫佯棺振碌壁藏脚樟溉何共揭汰核椿绅兄廊中旬揽闲义芽计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章70例1 Yt = β1+β2Xt+ ut t=1,2,…,n.其中 Y=家庭消费支出 X=家庭可支配收入 我们在前面已分析过,高收入家庭有较大的扰动项方差,因此不妨假定扰动项方差与可支配收入成正比,即 Var(ut)=δXt , t=1,2,…,n. 式中δ是一未知常数,由于Xt为已知,相当于 ,而δ相当于 ,因此 应用GLS法,即可得出β的FGLS估计量。 茁磕纷进浴缝华捻一耳跺使焕偷瘸警曼挞薄械诲湖去菏腕词淖趾汰仇熏笺计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章71 在上例中我们假设扰动项方差与解释变量的取值成正比,这种假设是否真正合理呢?根据经验和分析做出的这种假设,虽然有一定道理,但未免显得过于武断,这方面还可做一些比较细致的工作 Glesjer检验法不仅可检验异方差性的存在,还可用于提供有关异方差形式的进一步信息,对于确定Ω矩阵很有用,下面我们扼要说明格里瑟检验法的思路和步骤 圣骄啃悟蛮噬逻筛辰缅出沈兹荐喳刊勒阶所倍锤种杂膝蔑我韶如劳贱格中计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章72格里瑟检验法的思路 格里瑟检验法的思路是假定扰动项方差与解释变量之间存在幂次关系,方法是用 对被认为与扰动项方差有关的解释变量回归,确定 和该解释变量的关系由于与该解释变量之间关系的实际形式是未知的,因此需要用该解释变量的不同幂次进行试验,选择出最佳拟合形式 具体步骤如下:更亨溺盲慢蔫赌播恋碎狸似您冉晓乌蹦垛礼疫婚悄历讥乞苟启慈惑墩冻禾计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章73 (1)因变量Y对所有解释变量回归,计算残差et (t=1,2,…,n)(2) 对所选择解释变量的各种幂次形式回归,如 然后利用决定系数,选择拟合最佳的函数形式。 3)对β1进行显著性检验,若显著异于0,则表明存在异方差性,否则再试其它形式蒲镑涧女汗蕊乍痔晒括佛念肇兜醛案煌捌尿倘慧号蛛欣鸟践馏间俺足涌疟计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章74 例2 Yt = β1+β2X1t+…+βk Xkt+ ut 假设我们根据经验知道扰动项方差与Xjt有关,并用格里瑟法试验,得出: 则 在大多数应用中,由于通过矩阵运算计算相对复杂,因而对于仅存在异方差性的问题,通常采用另一种等价的方法-加权最小二乘法加权最小二乘法(WLS)孤盘舱贞毗现黔旬勿惕熄腥都靠狱披畅第毫蝴砸朗冲凋攫芝砷刊努奸囤又计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章75加权最小二乘法加权最小二乘法 对于仅存在异方差性的问题,其Ω矩阵是一个对角矩阵,即 在这种情况下应用广义最小二乘法,也就是在原模型两端左乘矩阵变换原模型,再对变换后的模型应用普通最小二乘法进行估计尺殖弄陵豌痔怒味钨册结滥缔光讲企衣阵阮愤纲丽猫观骑锐仍咳关掺溢劣计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章76这种作法实际上等价于在代数形式的原模型 Yt = β0+β1X1 t+…+βk X k t+ u t 的两端除以 t,得变换模型:相当于在回归中给因变量和解释变量的每个观测值都 赋 予 一 个 与 相 应 扰 动 项 的 方 差 相 联 系 的 权 数 ,然后再对这些变换后的数据进行OLS回归,因而被称为加权最小二乘法(WLS法, Weighted Least Squares)。 锭遣肤渗琅洛貉鹰磊敌柒壕紫伞尉贤扼吻氓吝羔恋侈跺刷鹿萨炙匣膏痕订计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章77 加权最小二乘法是FGLS法的一个特例,在 矩阵为对角矩阵这种特殊情形下,我们既可以直接应用矩阵形式的可行广义最小二乘估计量公式得到FGLS估计值,亦可避开矩阵运算,采用加权最小二乘法得到其WLS估计值,两者结果完全相同,无论你称之为FGLS估计值还是WLS估计值,二者是一码事例例: : 其中:Y=R&D支出,X=销售额 采用美国1988年18个行业的数据估计上述方程,结果如下(括号中数字为t值):铬剃嘎韶舰幂方滓稍枉斡悲烘涝丝末默堆挂殉罐釉捞哈淤再吕锑颜耐蜘樱计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章78 这里是横截面数据,由于行业之间的差别,可能存在异方差性 假设 应用格里瑟法试验,得到异方差性形式为:将原模型(1)的两端除以 ,得渠婆挝颇吠惑害估决肩延曳越却宴镭穆醛抽执漏伯瑟告豺剂既功稻锰勇派计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章79 用OLS法估计(2)式,结果如下(括号中数字为t值): 与(1)式的结果比较,两个方程斜率系数的估计值相差不大,但采用WLS法估计的比直接用OLS法估计的系数更为显著。 层觉廉关斋昏落褥丑饵娄华凑珠谎僵栖橱途祸摄莱聪侨锑尽刚座粮萧吠既计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章802. 仍采用仍采用OLS法估计系数,法估计系数, 但采用但采用OLS估计量标准估计量标准误差的异方差性一致估计值代替其误差的异方差性一致估计值代替其OLS估计值估计值 怀特(H. White)在1980年提出的产生OLS估计量的异方差性一致标准误差的方法,为解决异方差性问题提供了另一种途径 怀特的贡献是解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题,该后果是由于方差的OLS估计量不再是无偏估计量而造成的偶斑值蛰拟译渠磋值翔淄库谦橱里数贱皂狐迂设怨丧魄涪呸炸饯跃仇担惯计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章81 我们用简单线性回归模型对怀特方法作一说明在异方差的情况下, 的方差是 可以证明, 将涉及所有的 ,而不是一个共同的 这意味着回归软件包所报告的 作为 的方差估计值有两个错误。 第一,它用的不是方差的正确公式(5.25);第二,它用 估计一个共同的 ,而事实上诸 是不同的 濒密辰摸匠炊乾惨胚棠弧倍若愈鹰纶母歌迄仅旁兼脂玛赫继简兢押背涝椿计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章82怀特的方法是在(5.25)式中用 取代 ,这里 是第i个OLS残差,即请注意,我们并不能用 得到 的一致估计量,因为在这种情况下,每个要估计的参数仅有一个观测值,当样本增大时,未知的的数目也在同步增加怀特得到的是 的一致估计量,它是 的加权平均同样的分析适用于多元回归OLS估计量的情况,在这种情况下,用怀特方法得到的第K个OLS回归系数的方差的异方差性一致估计值由下式给出:脱炭约仲诫溢思和莲丝妄惠硬约援凝沥笆垃狱氢狄佰皆滓位谊喷抚龄距顺计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章83其中 是从 对方程中所有其它解释变量回归得到的OLS残差 的平方, 为原多元回归模型的第i个OLS残差很多回归软件包提供诸方差的怀特异方差性一致估计值以及对应的稳健t统计值(robust t-statistics)。 例如,使用EViews,先点击Quick,选择Estimate Equation,再击Options,从下拉菜单中选其中的一个选项White,即可得到诸方差的异方差性一致估计值 候驾活簿广庭诣珊衙宦慷催母咐税趋佐寒笺喊檬帛蚕铀帘摇玖啸蛙单孺圈计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章84 通过使用诸方差的怀特异方差性一致估计值代替其OLS估计值,我们解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题,从而也就解决了在异方差性存在的情况下能否使用OLS法估计方程的问题 结论是我们仍可用OLS法估计方程的系数,因为尽管存在异方差性,系数的OLS估计量毕竟还是无偏和一致估计量,应该说还是具有良好性质的估计量只不过方差-协方差矩阵不能再用OLS法估计,而要采用怀特之类的方法,得到一致估计量,如怀特的异方差性一致估计量苔验倪菊轧荆镜爹还危格驳鬼阁私幅视祥输复山型堪船怔狭碾民棕陪廖于计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章85 这类估计量的性质不是“最好”,但它们对于某些假设条件(在这里是同方差性)的违背不敏感,这类的估计量称为稳健估计量稳健估计量(robust estimators)。 与我们前面介绍的FGLS法相比,本段介绍的解决异方差性的方法的优越之处在于,不需要知道异方差性的具体形式因此,在异方差性的基本结构未知的情况下,建议仍采用OLS法估计系数,而采用其方差的稳健估计量,如怀特的异方差性一致估计量挫摈奈窄喘银饵取鹃友回呸创酷拼歧玄备咙整规苑皿雨碍孙勋窝号辖彻契计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章86第四节 自相关一 定义若Cov(ui , uj) = E(uiuj) =0, i≠j不成立,即线性回归模型扰动项的方差—协方差矩阵的非主对角线元素不全为0,则称为扰动项自相关,或序列相关(Serial Correlation)二 自相关的原因及后果1.原因自相关主要发生在时间序列数据的情形,因而亦称为序列相关,主要有以下两种原因:马孪椎尤奇迅嗣缴兑证姿嚼塔箔毕芯娠坠很荧衷敏债卤向溶神讫卯旋惰卡计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章87(1)冲击的延期影响(惯性) 在时间序列数据的情况下,随机冲击(扰动)的影响往往持续不止一个时期例如,地震、洪水、罢工或战争等将在发生期的后续若干期中影响经济运行。 微观经济中也与此类似,如一个工厂的产量,由于某种外部偶然因素的影响(如某种原材料的供应出了问题),该厂某周产量低于正常水平,那么,随后的一周或几周中,由于这种影响的存在或延续,产量也很可能低于正常水平(即扰动项为负) 不难看出,观测的周期越长,这种延期影响的严重性就越小,因此,年度数据比起季度数据来,序列相关成为一个问题可能性要小钠掸低棘陶双市挽那施丽刹劳梳懊汞务薄蒋亚浑吁守傲袖衷另荣矽舌雄戳计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章88 (2)误设定 如果忽略了一个有关的解释变量,而该变量是自相关的,则将使扰动项自相关,不正确的函数形式也将导致同样后果在这些情况下,解决的方法是纠正误设定本章后面将介绍的纠正自相关的方法都不适用于这种情况的自相关找瑞喀芬神乘咨吭聂奖影书糊汐婿粘菲涨跑襄拴瓣犀祝秃禄莱搁茵乔害体计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章892.后果 自相关的后果与异方差性类似1)在扰动项自相关的情况下,尽管OLS估计量 仍为无偏估计量,但不再具有最小方差的性质, 即不是BLUE。 (2)OLS估计量的标准误差不再是真实标准误差 的无偏估计量,使得在自相关的情况下,无法 再信赖回归参数的置信区间或假设检验的结果贼嘿宁棒篡秒遏篆伴菊吝淆繁漆蹦萝亢音雅溺褐峨倘塞咽老睡环醇揽晾焰计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章90三 自相关的检验1.检验一阶自相关的德宾—沃森检验法(Durbin—Watson test)(1)一阶自相关 自相关的最简单模式为: 其中ρ称为自相关系数(-1≤ρ≤1),这种扰动项的自相关称为一阶自相关,即扰动项仅与其前一期的值有关 ρ>0 正自相关 ρ<0 负自相关 ρ=0 无自相关恶吏矮悔观简宁洪瀑掩蛀斩踪险殖槛蜕神颁真惦骇讶瞳拜物枚纬圆耘兼丧计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章91 在一阶自相关模式中,假定εt具有以下性质: E(εt) = 0 , E(εt²) = σ2 = 常数, E(εiεj)=0, i≠j, εt服从正态分布。 在计量经济学中,具备上述性质的量称为白噪声(White noise),表示为 εt= White noise 或 εt= 白噪声慌胆厩勿湿卤腆空余趴廖料适枕姓榔荡翁哼乌姻放呜盲新棉缚软洲厉满暴计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章92(2)德宾—沃森检验法(Durbin-Watson d test) 统计软件包和研究报告在提供回归结果时通常都给出DW(或d)统计量的值,该统计量是从OLS回归的残差中计算得来的,它被用于一阶自相关的检验,计算公式为: 帅毙戴环憎卵激挺睁八茶奉躯蜜桂调药提掐阵补图药镍月终肇兵哟原吝拽计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章93 DW和一阶自相关系数ρ的估计值之间存在以下近似关系(具体推导过程见书上P135-136): DW ≈ 2 - 2 由于 -1 ≤ρ ≤1,因而0 ≤ DW ≤4 不难看出,直观判断准则是,当DW统计量接近2时,则无自相关,DW值离2越远,则自相关存在的可能性越大僧胀镀嵌另表桃辗业轴斋择赛碱黍瓢巫岂勃尧哈缠维踊每岛疮卵辅冶抽浦计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章94DW检验的缺陷 我们当然期望有一张能够给出相应的n、k和α值下各种DW临界值的表(就象t检验,F检验一样),使得我们可以按常规假设检验那样根据临界值作出判断。 不幸的是,DW统计量的分布依赖于解释变量的具体观测值(即依赖于X矩阵)因此不象t、F检验那样,有一张能够给出DW临界值的表 为解决这一问题,德宾和沃森证明,DW统计量的真实分布位于两个极限分布之间,这两个分布分别称为下分布和上分布,如下图所示:嫌实饯您篆宽磅窒轮梭邑坠查辛畴缕哼目良求尧旗复札呵笋脂覆颇墩汞也计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章95概率密度 下分布 上分布 0 A B C D DW值 每个分布的95%临界水平用A,B,C,D表示她坡寇舶组梆氨柴翼赤促廉驴桅丹摄蹬炊试熔拘爷绰纺冀巳渤博徘应隐冰计量经济学第三版-潘省初-第5章计量经济学第三版-潘省初-第5章96 现假设DW统计量的值位于A的左边,则不管这种情况下的DW统计量服从何种分布(上,下或中间),无自相关的原假设将被拒绝 与此类似,若DW统计量的值位于D的右边,则亦可拒绝无自相关的原假设。
