好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

本科经济计量学第8章节第4版课件.ppt

59页
  • 卖家[上传人]:w****i
  • 文档编号:92757710
  • 上传时间:2019-07-12
  • 文档格式:PPT
  • 文档大小:486KB
  • / 59 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第8章 多重共线性: 解释变量相关会有什么后果,本章试图回答以下问题: 多重共线性的性质是什么? 多重共线性的理论后果是什么? 多重共线性的实际后果是什么? 在实际中,如何发现多重共线性? 多重共线性是否真的是一个问题? 消除多重共线性的弥补措施有哪些?,8.1 多重共线性的性质:完全多重共线性的情形 8.2 近似或不完全多重共线性的情形 8.3 多重共线性的理论后果 8.4 多重共线性的实际后果 8.5 多重共线性的诊断 8.6 多重共线性必定不好吗 8.7 一个扩展例子:1960至1982年期间美国的鸡肉需求 8.8 如何解决多重共线性:补救措施 8.9 小结,考虑一个简单的数字例子表8-1给出了两列收入数据,假定X3和X4是由两位研究员估计的,为了区别,称X3为收入, X4 为收益 将需求函数加以扩展,写成: Yi=A1+A2X2i+A3X3i+ui (8-1) Yi=B1+B2X2i+B3X4i+ui (8-2) 这两个需求函数的不同之处在于对收入的不同测度8.1 多重共线性的性质:完全多重共线性的情形,,,当用表8-1的数据来进行回归时,计算机拒绝估计“回归”。

      用Excel软件和Eviews软件情况不同 作价格(X2)和收入(X3)的关系图,见图8-1 如果作X3对X2 的回归则得到如下方程: X3i=300-2X2i R2(=r2)=1.00 (8-3) 即收入变量(X3)和价格变量(X2)完全相关,也即存在多重共线性图8-1 收入X3与价格X2的关系图,由于存在完全共线性,所以我们不能对方程(8-1)进行回归估计 若把方程(8-3)代入方程(8-1)中,有: Yi=A1+A2X2i+A3(300-2X2i)+ui =(A1+300A3)+(A2-2A3)X2i+ui =C1+C2X2i+ui (8-4) 其中, C1=A1+300A3 (8-5) C2=A2-2A3 (8-6),X3i=300-2X2i,,变量变换,式(8-4)的估计结果如下: se=(0.746) (0.1203) t=(66.538) (-17.935) r2=0.9757 (8-7),我们可以估计得到C1=49.667,C2=-2.1576,但无法得到A1、A2和A3的估计值。

      当解释变量之间存在完全多重共线性时,无法获得所有参数的唯一估计值,也不能对参数进行假设检验 注意这里的多重共线性指的是两个或多个变量完全线性相关,是完全多重共线性的情况 在实际中,完全多重共线性是比较少的,多数情况下是:两个或多个解释变量接近完全线性相关,或说是高度线性相关,我们称之为接近或不完全多重共线性或高度多重共线性结论:,8.2 近似或不完全多重共线性的情况,,结果如下: se=(120.06) (0.8122) (0.4003) t=(1.2107) (-3.4444) (-0.7971) R2=0.9778 (8-8),从现在起,我们所说的多重共线性是指不完全多重共线性 仍然利用表8-1的数据,以收益作为收入变量来进行回归Eviews软件回归结果:ls y c x2 x4,,先验信息,Eviews文件,,,,,,,,,,,结论: (1)尽管不能估计回归方程(8-1),但是能估计(8-2) (2)与预测相同,方程(8-7)和(8-8)中的价格系数都是负的,并且两者之间的数值差异不大 (3)方程(8-8) R2的值比(8-7)只增加了0.0020,这一增加量在统计上不显著。

      (4)收入(收益)变量的系数是统计不显著的而且对于一般商品,这个符号是错误的 (5)尽管收入变量是不显著的,但价格和收益联合地对商品的需求有显著影响作价格与收入的关系图(参见图8-2) 从图上可以看出,价格和收益之间存在高度相关 这两个变量之间的回归方程是: X4i=299.92-2.0055X2i + ei (8-9) se=(0.6748) (0.1088) t=(444.44) (-18.44) r2=0.9770 回归结果表明:价格与收益高度相关相关系数为-0.9884,也即高度共线性,或是接近完全多重共线性如果相关系数是-1,则是完全多重共线性的情况图8-2 收益X4与价格X2的关系图,注意:在只有两个解释变量的情形下,相关系数r可用作共线性程度的测度但当解释变量多于两个时,相关系数则不适合度量共线性8.3 多重共线性的理论后果,,在古典线性回归模型(CLRM)假定下,OLS估计量是最优线性无偏估计量(BLUE)如果解释变量间存在多重共线性,OLS估计量会怎样? 完全多重共线性的后果:参数估计量不存在,无法估计出模型中的参数 接近或者高度多重共线性的后果: (1)即使在接近共线性的情形下,OLS估计量仍然是无偏的。

      仍然是最优线性无偏估计量,即使某些系数是统计不显著的 (2)接近共线性也并未破坏OLS估计量的最小方差性但最小方差并不意味着方差值也较小 (3)多重共线性本质上是一个样本(回归)现象8.4 多重共线性的实际后果,,在接近或者高度多重共线性的情形下,我们可能遇到如下一个或者多个后果: (1)OLS估计量的方差和标准差较大 (2)置信区间变宽 (3)t值不显著 (4)R2值较高,但t值并不都显著 (5)OLS估计量及其标准差对数据的微小变化非常敏感 (6)回归系数符号有误 (7)难以衡量各个解释变量对回归平方和或R2的贡献因为解释变量间存在共线性,解释变量前的参数并不反映各自与被解释变量间的结构关系,而是反映它们对被解释变量的共同影响所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,回归参数的符号与经济理论不符 简言之,多重共线性的存在使得OLS估计量的标准差变大,参数估计量的经济含义不合理,变量的显著性检验失去意义,无法衡量各解释变量的贡献8.5 多重共线性的诊断,,因为多重共线性所产生的严重后果,所以我们非常关心模型中是否存在多重共线性以及多重共线性的程度 多重共线性是一个样本特性(sample specific),我们需要注意以下问题: (1)多重共线性是一个程度问题而不是存在与否的问题。

      (2)由于多重共线性是在假定解释变量是非随机的条件下出现的问题,因而它是样本的特征,而不是总体的特征度量特定样本多重共线性的程度时常用的经验法则如下: (1)R2较高但t值显著的不多 (见(8-8)的回归结果) (2)解释变量两两高度相关 但这一标准并不十分可靠因为解释变量两两相关系数较低时也可能存在高度多重共线性 (3)检查偏相关系数 假设有三个解释变量,X2,X3,X4 r23表示X2与X3之间的相关系数相关系数r23.4,称为偏相关系数,它是在变量X4为常数的条件下 X2 和X3之间的相关系数 偏相关系数是检验多重共线性的另一手段4)从属(subsidiary)或辅助(auxiliary)回归 作每个解释变量对其他剩余解释变量的回归并计算相应的R2值其中的每一个回归都被称为是从属或者辅助回归,从属于Y对所有变量的回归 例如:考虑Y对X2,X3,X4,X5,X6,X7—这6个解释变量的回归如果回归结果表明存在多重共线性,则可通过辅助回归,来判断哪些解释变量是共线性的 在这个例子中,假设有一个容量为50的随机样本,对每个解释变量作剩余解释变量的回归F统计量的计算如下: 其中n是观察值的个数,k是包括截距在内的解释变量的个数。

      各辅助回归的R2值如下:,R22=0.90(X2对于其他解释变量的回归) R32=0.18(X3对于其他解释变量的回归) R42=0.36(X4对于其他解释变量的回归) R52=0.86(X5对于其他解释变量的回归) R62=0.09(X6对于其他解释变量的回归) R72=0.24(X7对于其他解释变量的回归),表8-2 检验R2的显著性,上面结果表明,X2、X4、X5、X7与其他变量共线性,尽管有的R2值看起来较低5)方差膨胀因子(the variance inflation factor) 方程(8-25)和(8-27)给出了计算两个部分斜率系数b2和b3方差的公式通过简单的代数变换,这些方差公式可以写为:,,其中,R22是X2与X3之间辅助回归方程的样本决定系数 方程(8-14)右边的表达式被称为方差膨胀因素VIF,因为随着R2的增加,系数b2,b3的方差也增加了(膨胀了) 还应该注意到,b2,b3的方差不仅仅取决于VIF,还取决于ui的方差和相应变量X2、X3的方差所以,以下情形是很有可能的:Ri2很高,但ui的方差较低或者X2、X3的方差较高,或者两种情况同时出现,就会使得b2,b3的方差较低,t值较高。

      8-14),所以,辅助回归方程中的Ri2可能只是多重共线性的一个表面指示器,它并不一定扩大估计量的标准差较高的Ri2既不是较高标准差的必要条件也不是充分条件多重共线性本身并不必然导致较高的标准差8.6 多重共线性必定不好吗,,(1)如果研究是为了用模型来预测被解释变量的未来均值,则多重共线性本身未必是一件坏事 通常,预测人员都是根据解释能力(用R2来度量)来选择模型的如果解释变量间的多重共线性关系会一直持续下去,那么,即使模型中有这种多重共线性,模型仍可用于预测如果这种多重共线性完全是由随机样本因素造成,那么,模型和预测都没有意义2)如果研究不仅仅是为了预测,而且还要可靠地估计所选模型的各个参数,则严重的多重共线性将是一件“坏事”,因为它可能会导致估计量的标准差增大8.7 一个扩充例子:1960至1982年期间美国的鸡肉需求,表7-8给出了美国1960至1982年期间有关数据:平均每人鸡肉消费量(Y(磅)),每人实际(即通货膨胀调整后的)可支配收入(X2(美元)),鸡肉的实际零售价格(X3(美分/磅)),猪肉实际零售价格(X4(美分/磅)),牛肉实际零售价格(X5(美分/磅))从理论上说,商品的需求通常是消费者实际收入,该商品实际价格以及竞争商品或互补商品的实际价格的函数。

      估计的需求函数如下:应变量是平均每人鸡肉消费量(Y)的自然对数Eviews软件回归结果:ls log(y) c log(x2) log(x3) log(x4) log(x5),,补救措施,收入 价格 猪肉 牛肉,我们拟合的是有多个解释变量的双对数回归模型所以,所有的系数都是Y对相应X变量的偏弹性如:需求的收入弹性约为0.34,需求的自价格弹性约为-0.50,需求(猪肉)的交叉弹性约为0.15,需求(牛肉)的交叉弹性约为0.09 回归结果表明:需求的收入和自价格弹性各自都是统计显著的,但两个交叉弹性是统计不显著的那么,模型中是否存在多重共线性?,鸡肉需求函数共线性的检验[方程(8-15)] 相关矩阵: 表8-3给出了4个解释变量(对数形式)之间的两两相关系数 在Eviews软件中,在数据窗口点击view—correlations 即可从表中可以看出,解释变量之间的两两相关系数都很高但是这并不表明需求函数中一定存在着共线性,只是可能性存在辅助回归 当我们对每个解释变量与其他剩余解释变量进行回归时,发现存在共线性问题这一点可以从表8-4中所给出的结果看出来表8-4 辅助回归,,ls log(x2) c log(x3) log(x4) log(x5),,,,,,观察以上回归结果中的R2值和F值,说明模型中存在多重共线性。

      每个解释变量都与其他解释变量高度共线性8.8 如何解决多重共线性:补救措施,,1 . 从模型中删掉不重要的解释变量 2 . 获取额外的数据或新的样本 3 . 重新考虑模型 4 . 利用先验信息 5 . 进。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.