好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

线性回归模型分析的扩展(powerpoint 93页).pptx

95页
  • 卖家[上传人]:ahu****ng3
  • 文档编号:277742430
  • 上传时间:2022-04-15
  • 文档格式:PPTX
  • 文档大小:1.06MB
  • / 95 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第四讲第四讲 线性回归分析的扩展线性回归分析的扩展Linear Regression Analysis: Extension一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设二、多重共线性二、多重共线性三、异方差性三、异方差性四、序列相关四、序列相关五、设定误差五、设定误差一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(经典正态线性回归模型(CNLRM)的假定)的假定(一)关于模型的假定(一)关于模型的假定1.回归模型对参数而言是线性的回归模型对参数而言是线性的2.模型是正确设定的模型是正确设定的(二)关于解释变量的假定(二)关于解释变量的假定3.解释变量解释变量X是确定性变量是确定性变量4.若若X是随机的,则误差项与是随机的,则误差项与X不相关不相关5.解释变量的取值有足够变异解释变量的取值有足够变异6.解释变量之间不存在完全的线性关系解释变量之间不存在完全的线性关系引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(经典正态线性回归模型(CNLRM)的假定)的假定(三)关于误差项的假定(三)关于误差项的假定7.对于给定的对于给定的X,误差项均值为,误差项均值为08.对于给定的对于给定的X,误差项方差相等,误差项方差相等9.对于给定的对于给定的X,误差项之间不存在序列相关,误差项之间不存在序列相关10.误差项服从正态分布误差项服从正态分布引言:放宽经典模型的假设引言:放宽经典模型的假设放宽的假定放宽的假定相应的问题相应的问题假定假定1、2模型设定问题模型设定问题假定假定3、4随机解释变量随机解释变量假定假定5过度决定(微数缺测性)过度决定(微数缺测性)假定假定6多重共线性多重共线性假定假定7误差项均值非零误差项均值非零假定假定8异方差性异方差性假定假定9序列相关序列相关假定假定10误差项非正态分布误差项非正态分布u假定假定3和和4在联立在联立方程模型中讨论方程模型中讨论u对假定对假定5我们做简我们做简单讨论单讨论u假定假定7影响参数估影响参数估计的无偏性,暂不计的无偏性,暂不讨论讨论u假定假定10对于大样对于大样本数据不是必需的本数据不是必需的假定。

      假定u本讲主要考虑放宽本讲主要考虑放宽了其余假定后面临了其余假定后面临的问题的问题引言:放宽经典模型的假设引言:放宽经典模型的假设微数缺测性微数缺测性o从理论上讲,样本容量从理论上讲,样本容量n和解释变量数目和解释变量数目k必须满足必须满足nk+2,才能进行,才能进行OLS估计和假设检验但事实上,即便估计和假设检验但事实上,即便n满足满足上述条件,但如果样本很小,那么虽然能够进行估计和检上述条件,但如果样本很小,那么虽然能够进行估计和检验,也很难通过验,也很难通过t检验1.什么是多重共线性什么是多重共线性2.多重共线性的影响多重共线性的影响3.多重共线性的诊断多重共线性的诊断4.多重共线性的处理多重共线性的处理二、多重共线性二、多重共线性什么是多重共线性什么是多重共线性o多重共线性(多重共线性(multicollinearity):回归模型中的一些或全:回归模型中的一些或全部解释变量之间存在一定程度的线性关系部解释变量之间存在一定程度的线性关系什么是多重共线性什么是多重共线性例题例题4.1其他例题:其他例题:p200X1 X2X3X410555267158075251895973424125129183015515289什么是多重共线性什么是多重共线性图形表示:巴伦坦图图形表示:巴伦坦图YX1X2YX1 X2低度多重共线性低度多重共线性高度多重共线性高度多重共线性什么是多重共线性什么是多重共线性产生多重共线性的原因产生多重共线性的原因1)样本过小样本过小2)模型设定有误:添加了过多的解释变量模型设定有误:添加了过多的解释变量v由于样本过小,即便在总体中解释变量之间没有线性关系,由于样本过小,即便在总体中解释变量之间没有线性关系,也可能在获得的样本中观察到较强的线性关系也可能在获得的样本中观察到较强的线性关系多重共线性的影响多重共线性的影响存在完全线性关系时的存在完全线性关系时的OLS估计估计o无法得到无法得到OLS估计量估计量例题:例题:p201-202多重共线性的影响多重共线性的影响存在多重共线性关系时的存在多重共线性关系时的OLS估计估计o可以证明即便存在多重共线性,可以证明即便存在多重共线性,OLS估计量仍然是估计量仍然是BLUE,但系数估计量的方差较大,从而不容易通过但系数估计量的方差较大,从而不容易通过t检验,同时预检验,同时预测区间变宽,降低了预测精确度。

      测区间变宽,降低了预测精确度例题:例题:p202-203多重共线性的影响多重共线性的影响影响程度的度量:方差膨胀因子(影响程度的度量:方差膨胀因子(variance-inflation factor)多重共线性的影响多重共线性的影响例题例题4.2RjVIFj0.001.00A0.501.331.33A0.905.765.76A0.9510.26 10.26A0.9950.25 50.25A多重共线性的诊断多重共线性的诊断简单诊断方法简单诊断方法oR2高而单个系数的高而单个系数的t值小,换言之,值小,换言之,F检验显著,但显著的检验显著,但显著的t值少值少o任意两个解释变量之间的相关系数较大,比如大于任意两个解释变量之间的相关系数较大,比如大于0.9o解释变量之间的偏相关系数较大解释变量之间的偏相关系数较大F简单方法一般来说不很精确简单方法一般来说不很精确多重共线性的诊断多重共线性的诊断运用回归分析进行诊断运用回归分析进行诊断o逐步分析法:先引入经济意义明显,并且在统计上最显著的逐步分析法:先引入经济意义明显,并且在统计上最显著的解释变量,然后逐步引入其他解释变量如果新引入的解释解释变量,然后逐步引入其他解释变量。

      如果新引入的解释变量使原有解释变量的系数估计值发生明显变化,或变量使原有解释变量的系数估计值发生明显变化,或t统计量统计量明显变小,则说明新引入的解释变量与原有解释变量之间存明显变小,则说明新引入的解释变量与原有解释变量之间存在多重共线性,可以去掉新引入的解释变量在多重共线性,可以去掉新引入的解释变量o辅助回归法:做每一个解释变量对其余解释变量的回归,得辅助回归法:做每一个解释变量对其余解释变量的回归,得出相应的出相应的F统计值,如果在给定的显著性水平下统计值,如果在给定的显著性水平下F统计值是显统计值是显著的,说明该解释变量与其他解释变量之间存性关系,著的,说明该解释变量与其他解释变量之间存性关系,可以去掉该解释变量(可以去掉该解释变量(p207,p211)多重共线性的诊断多重共线性的诊断运用一些指标进行诊断运用一些指标进行诊断1)方差膨胀因子:计算每个解释变量的方差膨胀因子方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一,一般认为如果般认为如果VIF大于大于10,说明该变量与其他变量存在高度共,说明该变量与其他变量存在高度共线性线性2)容许度(容许度(tolerance):定义容许度):定义容许度TOL如下,一般认为如果如下,一般认为如果TOL小于小于0.1,说明该变量与其他变量存在高度共线性,说明该变量与其他变量存在高度共线性3)条件指数(条件指数(condition index, CI):一般认为,如果条件指):一般认为,如果条件指数在数在10到到30之间,存在较强的多重共线性,如果大于之间,存在较强的多重共线性,如果大于30,则,则存在严重的多重共线性存在严重的多重共线性多重共线性的诊断多重共线性的诊断例题例题4.3(p218)YConsumptionX1IncomeX2 Wealth7080810651001009901201273951401425110160163311518018761202002052140220220115524024351502602686例题:例题:p209-211多重共线性的诊断多重共线性的诊断几点说明几点说明o多重共线性是一个程度问题而不是存在与否的问题多重共线性是一个程度问题而不是存在与否的问题o多重共线性是关于样本的一种特征多重共线性是关于样本的一种特征o如果研究是为了估计斜率系数和预测,多重共线性不是一个如果研究是为了估计斜率系数和预测,多重共线性不是一个严重的问题;但如果研究的主要目的是假设检验,则高度多严重的问题;但如果研究的主要目的是假设检验,则高度多重共线性的危害就很大重共线性的危害就很大多重共线性的处理多重共线性的处理1)剔除共线性变量中不太重要的解释变量剔除共线性变量中不太重要的解释变量2)补充新数据补充新数据3)重新设定模型重新设定模型o练习题:练习题:p216-217,习题,习题10.14-10.19 1.什么是异方差性什么是异方差性2.异方差性的影响异方差性的影响3.异方差性的诊断异方差性的诊断4.异方差性的处理异方差性的处理三、异方差性三、异方差性什么是异方差性什么是异方差性o异方差性(异方差性(heteroscedasticity):回归模型误差项的方:回归模型误差项的方差不相同差不相同o同方差性(同方差性(homoscedasticity):回归模型误差项的方差:回归模型误差项的方差不相同不相同什么是异方差性什么是异方差性同方差性同方差性XY概概率率密密度度X:受教育年限:受教育年限Y:工资:工资什么是异方差性什么是异方差性异方差性异方差性XY概概率率密密度度X:收入:收入Y:消费支出:消费支出什么是异方差性什么是异方差性异方差性异方差性XY概概率率密密度度X:时间:时间Y:打字错误:打字错误例题:例题:p220-224什么是异方差性什么是异方差性产生异方差性的原因产生异方差性的原因原因原因解释变量:收入解释变量:收入被解释变量:消费支出被解释变量:消费支出解释变量与误差项相关解释变量与误差项相关随着收入的增加,支出差异性更大随着收入的增加,支出差异性更大有重要的解释变量未被有重要的解释变量未被包含在回归模型中包含在回归模型中物价也是影响支出的因素,物价上物价也是影响支出的因素,物价上涨时,高收入者有可能拿出更多的涨时,高收入者有可能拿出更多的钱来消费,因而支出差异性更大钱来消费,因而支出差异性更大异常值(异常值(outliers)异方差性的影响异方差性的影响1)回归系数的回归系数的OLS估计量虽然是无偏的、一致的,但不再估计量虽然是无偏的、一致的,但不再是有效的是有效的2)回归标准差的估计不再是无偏的回归标准差的估计不再是无偏的3)回归系数回归系数OLS估计量的方差估计不再是无偏的,因而估计量的方差估计不再是无偏的,因而t统统计量不再服从计量不再服从t分布,分布,F统计量不再服从统计量不再服从F分布,从而无分布,从而无法进行区间估计和假设检验法进行区间估计和假设检验4)无法根据回归结果进行预测无法根据回归结果进行预测异方差性的诊断异方差性的诊断1)图解法图解法2)布罗施布罗施-培甘检验(培甘检验(Breusch-Pagan test)3)怀特检验(怀特检验(White test)4)帕克检验(帕克检验(Park test)5)Glesjer test6)戈德菲尔德戈德菲尔德-匡特检验(匡特检验(Goldfeld-Quandt test )异方差性的诊断异方差性的诊断图解法图解法在同方差假定下作回归分析,用残差项平方与解释变量做散点图在同方差假定下作回归分析,用残差项平方与解释变量做散点图X异方差性的诊断异方差性的诊断图解法:简便处理图解法:简便处理o用残差项平方与因变量拟合值做散点图用残差项平方与因变量拟合值做散点图异方差性的诊断异方差性的诊断例题例题4.4(p222)o1988年美国公司销售额与研发支出的关系年美国公司销售额与研发支出的关系异方差性的诊断异方差性的诊断例题例题4.4异方差性的诊断异方差性的诊断布劳殊布劳殊-培干检验(培干检验(Breusch-Pagan test)异。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.