好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第八章多重共线性解释变量相关会有什么后果ppt课件.ppt

35页
  • 卖家[上传人]:m****
  • 文档编号:593025361
  • 上传时间:2024-09-23
  • 文档格式:PPT
  • 文档大小:149KB
  • / 35 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第二部分实际中的回归分析 根本假定违背:不满足根本假定的情况根本假定违背:不满足根本假定的情况 〔1〕模型设定有偏误;所选模型是正确设定的〔2〕解释变量之间存在多重共线性;〔3〕随机误差项序列存在异方差性;〔4〕随机误差项序列存在序列相关性所选模型是正确设定的解释变量之间不存在完全线性关系误差项方差为常数误差项之间不相关根本假定根本假定根本假定根本假定 第八章 多重共线性Multi-CollinearityMulti-Collinearity•一、多重共线性的性质一、多重共线性的性质•二、多重共线性的实践后果二、多重共线性的实践后果•三、多重共线性的诊断三、多重共线性的诊断•四、抑制多重共线性的方法四、抑制多重共线性的方法•五、案例五、案例 一、多重共线性的性质1、完全多重共线性2、近似〔不完全〕多重共线性 对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n其根本假设之一是解释变量是相互独立的 假设某两个或多个解释变量之间出现了相关性,那么称为多重共线性(Multicollinearity)。

      完全共线性的情况并不多见,普通出现的是在一定程度上的共线性,即近似共线性 一个怪模型•商场销售额= B1营业面积+ B2店员人数+ B3铺租+ B4宣传费用+ui•何以怪?•这样论述事物,越说越乱,与其说是“解释〞,毋宁是“蛊惑〞 消费函数的多重共线性•假设技術不变,劳动与资本投入会是等比例的比如,每添加一部缝纫机,就要添加一个工人此时,投入品之间是完全共线性,即等比例变化•多途径投放广告,销售额的变动究竟来自哪种广告方式,无法区分各广告方式之间经常存在共线性 为什么不能容忍多重共线性?•一个模型中的某个变量违背常识比如某些积极要素被“算〞成了消极要素•模型应该儘量简捷•奥卡姆剃刀:如无必要,毋增实体 •产生多重共线性的背景•经济变量之间具有共同变化趋势•哲学观念:事物是普遍联繫的联繫的严密程度有所不同多重共线性会经常出现•假设一个回归方程之中,幾个自变量之间具有比较强的相关性,那么自变量之间可以相互解释,我们可以只留下一个自变量:•设y=x1+x2+c, 其中,x1=ax2, 那么y=ax2+x2+c=(a+1)x2+c•模型中包含滞後变量•利用截面数据建模也能够出现多重共线性•经济学实际有“互补品〞与“替代品〞•样本数据本身的缘由•心思学家的调查数据经常出自大学生 8.1 多重共线性的性质The nature of multicollinearity•表8-1中,x2每上升1,x3会下降2,这是完全的共线性,它们之间的函数关係是x3=300-2x2,也就是说,x3一列数字“完全〞可以由x2取代,反之亦然。

      这时,无法按表12-1中的资料对回归方程进展估计•当解释变量之间存在完全线性相关或者完全多重共线性时,我们不能够獲得一切参数的独一估计值既然我们不能獲得它们的独一估计值,也就不能根据某一样本做任何统计推论•在完全多重共线性的情况下,不能够对多元回归模型中的某一单个回归系数进展估计和假设检验 假设在解释变量X1,X2,…,Xk中,存性关係解释变量间的线性关係存在时,存在不全为零的常数 这種关係为完全多重共线性,变量间的相关係数为1实践上更多的情况是,解释变量间有不完全的线性关係:存在不全为零的数:其中vi 为随机项解释变量间存在的完全或不完全的线性关係称为多重共线性由於经济变量本身的性质,多重共线性或强或弱,普遍存在假定λ1≠0, 8.2接近或者不完全多重共线性的情形The case of near, or imperfect, multicollinearity•X4的绝大部分信息包含在x2中,x2幾乎完全是重複信息•这样得到的回归方程很怪:在整体上存在较好的解释才干,但在每一个解释变量上却出现违背常识的景象 多重共线性的表示图 OLS估计量的方差与协方差•OLS估计量的方差与协方差提供了估计量b置信程度的信息。

      各样本间越是近似,其统计量的变异程度就越小,根据这种样本估计的参数就越准確r23是T个XT2值和XT3值的相关系数 影响b2的方差的要素•OLS估计量的变异程度受什么要素影响•误差项u的方差σ2越大,OLS估计量的变异程度越大•样本量越大, OLS估计量的变异程度越小var(b2)公式中的T大,分母也大, var(b2)就小•自变量对均值的变异程度越大, OLS估计量的变异程度越小•X2和X3之间的相关系数越大,b2的方差也越大假设X2和X3完全相关,r23=1, var(b2)无法计算 假设存在c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n 其中: ci不全为0 假设存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中ci不全为0,vi为随机误差项1、解释变量间存在完全共线性〔perfect multicollinearity〕2、近似〔不完全、高度〕共线性〔、近似〔不完全、高度〕共线性〔near/imperfect/high multicollinearity〕〕不能够获得一切参数的独一估计值及根据样本进展任何统计推断。

      OLS估计量仍是最优线性无偏估计量 留意:留意: 除非是完全共线性,多重共线性并不意味着任何根本假设的违背; 因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质 问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的〞,尤其是在统计推断上无法给出真正有用的信息 OLS估计量仍是最优线性无偏估计量但这不代表单个样本估计值的性质〔如方差最小等〕多重共线性本质上是一个样本〔回归〕景象多重共线性本质上是一个样本〔回归〕景象存在不完全多重共线性时参数估计值的方差与规范差变大参数估计值的方差与规范差变大容易使经过样本计算的容易使经过样本计算的t值小于临界值,值小于临界值, 误导作出参数为误导作出参数为0的推断的推断能够将重要的解释变量排除在模型之外能够将重要的解释变量排除在模型之外 概念:方差膨胀因子概念:方差膨胀因子根据P76第四章有:R2添加 b2和b3的方差〔或规范差〕添加〔或膨胀〕多重共线性使参数估计值的方差增大,1/(1-R2)为方差膨胀因子(Variance Inflation Factor, VIF)当完全不共线时, R2 =0 当近似共线时, 0< R2 <1 时间序列样本:经济昌盛时期,各根本经济变量〔收入、消费、投资、价钱〕都趋于增长;衰退时期,又同时趋于下降。

      横截面数据:消费函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小补充:产生多重共线性的主要缘由〔了解补充:产生多重共线性的主要缘由〔了解〕〕〔〔1〕经济变量相关的共同趋势〕经济变量相关的共同趋势 〔〔2 2〕滞后变量的引入〕滞后变量的引入 在经济计量模型中,往往需求引入滞后经济变量来反映真实的经济关系 例如,消费=f(当期收入, 前期收入〕 显然,两期收入间有较强的线性相关性 〔〔3 3〕样本资料的限制〕样本资料的限制 由于完全符合实际模型所要求的样本数据较难搜集,特定样本能够存在某种程度的多重共线性 普通阅历: 时间序列数据样本:简单线性模型,往往存在多重共线性 截面数据样本:问题不那么严重,但多重共线性依然是存在的 8.4 多重共线性的实践後果Practical consequences of multicollinearity•(1) 普通最小二乘法估计量的方差和规范差较大•(2) 置信区间变宽•(3) t值不显著•(4) R2值较高,但t值那么并不都显著•(5) 普通最小二乘估计量及其规范差对数据的微小变化非常敏感,趋於不稳定。

      •(6) 回归系数符号有误•(7) 难以衡量各解释变量对回归平方和(ESS)或者R2的奉献•在高度共线性情况下,很难衡量每一个解释变量对总体R2的奉献 8.5 多重共线性的诊断detdction•(1) 多重共线性是一个程度问题而不是存在与否的问题•(2) 由於多重共线性是在假定解释变量是非随机的条件下出现的问题,因此它是样本的特徵,而不是总体的特徵•不做“检测多重共线性〞,而是测度给定样本的多重共线性程度•根据一些阅历法那么,或者说是在详细运用中可以给我们提供一些有关多重共线性存在与否的线索 多重共线性存在的线索1•(1) R2较高但t 值显著的不多•High R2 but few significant t ratios•(2) 解释变量两两高度相关•High pairwise correlations among explanatory variables•(3) 检验偏相关係数•Examination of partial correlations•(4) 从属或者辅助回归•Subsidiary, or auxiliary, regression•检验模型中哪个变量与其他变量高度共线性的方法就是作每个变量对其他剩餘变量的回归并计算相应的R2值 多重共线性存在的线索2•(5) 方差膨胀因子(the variance inflation factor)•随着R22的添加,b2和b3的方差也添加或膨胀了。

      l方差膨胀因子与b2、b3是线性关係,单调递增,两个自变量之间的关係越亲密,回归系数的变异程度就越大l没有一种检验方法可以彻底处理多重共线性问题l没有一个简单的方法处理这个多重共线性问题 方差膨胀因子检验阅历法那么•VIF代表由于把除去Ri的其它一切变量参与到模型中而引起的方差膨胀•一个大的方差膨胀因子值预示着在解释变量中存在着冗餘信息•断定系数Ri2=0.9, VIF=10•断定系数Ri2=0.8, VIF=5•幾种观念,以为VIF>8或10时,多重共线性显著,且Xi为多餘变量.•假设多个变量的方差膨胀因子都比较大,选最大的方差膨胀因子的变量为多餘的. 8.6 多重共线性必定不好吗Is multicollinearity necessarily bad?•假设研讨是为了用模型来预测解释变量的未来均值,那么多重共线性本身未必是一件坏事•假设研讨不仅仅是为了预测,而且还要可靠地估计所选模型的各个参数,那么严重的共线性将是一件“坏事〞,由于它将导致估计量的规范差增大•假设是为了比较准確地估计一组系数(例如,两个系数的和或者差),那么,即使存在多重共线性,也可以到达目的 三、多重共线性的诊断〔1〕检验多重共线性能否存在及度量共线性的程度;〔2〕估计多重共线性的范围,即判别哪些变量之间存在共线性。

      〔1〕没有度量多重共线性的单一方法;〔2〕具有的是一些阅历法那么,即是在详细运用中可以提供判别存在多重共线性的一些线索义务:留意: 1 1、对多个解释变量的模型,采用综合统计检验法、对多个解释变量的模型,采用综合统计检验法 假设 在OLS法下:R2与F值较大,但t检验值较小,阐明各解释变量对Y的结合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著三、多重共线性的诊断R2值较高,但解释变量t值统计显著的不多这是共线性的典型特征首先,检验多重共线首先,检验多重共线性能否存在〔性能否存在〔1 1〕〔〕〔2 2〕〕 2 2、对两个解释变量的模型,采用简单相关系数法、对两个解释变量的模型,采用简单相关系数法对多个解释变量的模型,计算这些解释变量两两之对多个解释变量的模型,计算这些解释变量两两之间的相关系数,假设有些相关系数很高间的相关系数,假设有些相关系数很高( (如超越如超越0.8)0.8),那么能够以为存在较为严重的共线性那么能够以为存在较为严重的共线性三、多重共线性的诊断 求出X1与X2的简单相关系数r,假设|r|接近1,那么阐明两变量存在较强的多重共线性。

      但是,这一规范并不可靠,有时候,两两相关系数但是,这一规范并不可靠,有时候,两两相关系数能够较低,但仍能够存在共线性能够较低,但仍能够存在共线性 进一步确定哪些变量引起的3 3、从属回归或辅助回归〔断定系数检验法〕、从属回归或辅助回归〔断定系数检验法〕Step1:使模型中每一个解释变量分别以其他解释变量为解释变量进展回归〔这些回归称为从属回归或辅助回归Ste:2:首先察看这些辅助回归相应的拟合优度〔或断定系数〕的大小;然后对这些辅助回归进展F检验H0:Rj.2=0 Xji=1X1i+2X2i+LXLi假设回绝原假设那么阐明Xj与其他解释变量之间存在显著的线性关系 3 3、从属回归或辅助回归〔断定系数检验法〕、从属回归或辅助回归〔断定系数检验法〕Rj•2:第j个解释变量对其他解释变量的回归方程的断定系数 假设存在较强的共线性 Rj•2较大且接近于1 〔1- Rj•2 〕较小因此,给定显著性程度,计算F值,并与相应的临界值比较,来断定能否存在相关性从而Fj的值较大 四、抑制多重共线性的方法1、排除引起共线性的变量、排除引起共线性的变量找出引起多重共线性的解释变量,将它排除出去。

      〔补充〕逐渐回归法:〔补充〕逐渐回归法: 以Y为被解释变量,逐个引入解释变量,构成回归模型,进展模型估计根据拟合优度的变化决议新引入的变量能否独立假设拟合优度变化显著,那么阐明新引入的变量是假设拟合优度变化显著,那么阐明新引入的变量是一个独立解释变量;一个独立解释变量;假设拟合优度变化很不显著,那么阐明新引入的变假设拟合优度变化很不显著,那么阐明新引入的变量与其它变量之间存在共线性关系量与其它变量之间存在共线性关系两难:共线性; 设定误差 2、获取额外的数据或新的样本3、重新思索模型4、参数的先验信息5、变量变换添加样本可改善共线性问题,但有困难四、抑制多重共线性的方法然先验信息难以获得,且其准确性易遭质疑名义变量变为实践变量、采用变量的差分方式 作业作业做在书上:做在书上:8.1~8.12;;自行思索:自行思索:8.14~8.18、、做在作业本上:做在作业本上: 8.20、、 8.23、、8.24、、8.27上机:上机:8.22、、8.28 。

      点击阅读更多内容
      猜您喜欢
      2024-2025年度湖南省导游从业资格证自我提分评估(附答案).docx 2024-2025年度河南省安全评价师职业资格模拟考试试卷B卷含答案.docx 2024-2025年度河北省互联网营销师中级基础试题库和答案要点.docx 2024-2025年度湖南省保安员资格考试押题练习试卷B卷附答案.docx 2024-2025年度广西壮族自治区初级质量师题库及答案.docx 2024-2025年度河南省导游证考试之导游业务能力检测试卷B卷附答案.docx 2024-2025年度河北省出版专业资格考试中级之基础知识模拟考试试卷A卷含答案.docx 2024-2025年度江苏省初级质量师题库附答案(基础题).docx 2024-2025年度海南省国家电网招聘之环化材料类综合练习试卷B卷附答案.docx 2024-2025年度河南省国家电网招聘之管理类高分通关题型题库附解析答案.docx 2024-2025年度河南省安全评价师职业资格题库及答案.docx 2024-2025年度河南省初级质量师题库及答案.docx 部编版四个太阳优秀ppt课件.ppt 2024-2025年度海南省出版专业资格考试初级能力提升试卷B卷附答案.docx 山东省济南市2023-2024学年高一上学期1月期末考试英语试题 word版含解析.docx 2024-2025年度浙江省保险代理人考试押题练习试题A卷含答案.docx 2024-2025年度河南省互联网营销师中级能力检测试卷A卷附答案.docx 2024-2025年度海南省国家电网招聘之管理类模拟预测参考题库及答案.docx 2024-2025年度海南省互联网营销师初级过关检测试卷A卷附答案.docx 2024-2025年度浙江省导游从业资格证模拟考核试卷含答案.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.