
4模型的建立与估计中的问题及对策培训资料.ppt
151页Xianghong Shirley Wang,1,第四章 模型的建立与估计中的问题及对策,Xianghong Shirley Wang,2,误设定 (misspecification) 多重共线性 (multicollinearty) 异方差 (heteroskedasticity) 自相关 (autocorrelation),实践中的常见问题:,Xianghong Shirley Wang,3,经典假设与违背假设的情况:,Xianghong Shirley Wang,5,遗漏相关变量(omitting relevant variables),例如,如果“正确”的模型为:,而我们将模型设定为:,即设定模型时漏掉了一个相关的解释变量 这类错误称为遗漏相关变量模型中遗漏了对因变量有显著影响的解释变量将使模型参数估计量不再是无偏估计量Xianghong Shirley Wang,6,误选无关变量 (including irrevelant variables),例如,如果 为“真”,但我们将模型设定为:,即设定模型时,多选了一个无关解释变量 这类错误称为误选无关变量模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。
Xianghong Shirley Wang,7,错误的函数形式 (wrong functional form),例如,如果“真实”的回归函数为:,但却将模型设定为:,这就是设定了错误的函数形式这类错误中比较常见的是将非线性关系作为线性关系处理函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的Xianghong Shirley Wang,8,,解决解释变量误设定问题的原则,在模型设定中的一般原则是尽量不漏掉有关的解释变量因为估计量有偏比增大误差更严重但如果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量 在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用Xianghong Shirley Wang,9,理论: 从理论上看,该变量是否应该作为解释变量包括在方程中? t检验:该变量的系数估计值是否显著? :该变量加进方程中后, 是否增大? 偏倚:该变量加进方程中后,其它变量的系数估计值是否显著变化?,如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是“否”, 则该变量是无关变量,可以安全地从方程中删掉它。
这是两种容易决策的情形选择解释变量的四条准则,Xianghong Shirley Wang,10,在很多情况下,这四项准则的判断结果会出现不一致例如,有可能某个变量加进方程后, 增大,但该变量不显著 在这种情况下,作出正确判断不是一件容易的事,处理的原则是将理论准则放在第一位,再多的统计证据也不能将一个理论上很重要的变量变成“无关”变量 在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则如果不这样做,产生不正确结果的风险很大Xianghong Shirley Wang,11,,检验模型误设定的RESET方法,拉姆齐(J. B. Ramsey)于1969年提出了一种回归设定误差检验法(RESET法) RESET检验法的思路是在要检验的回归方程中加进 等项作为解释变量,然后看结果是否有显著改善如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题Xianghong Shirley Wang,12,直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通过F 检验, 表明它们改善了原方程的拟合状况,则我们有理由说原方程存在误设定问题。
等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置,因而如果存在误设定,则用这样一个装置可以很好地代表它们Xianghong Shirley Wang,13,(1) 用OLS法估计要检验的方程,得到 (2) 由上一步得到的值 (i=1,2,,n),计算 ,然后用OLS法估计: (3) 用F检验比较两个方程的拟合情况,如果两方程总体拟合情况显著不同,则我们得出原方程可能存在误设定的结论使用的检验统计量为:,RESET检验法的步骤,Xianghong Shirley Wang,14,RSSM为第一步中回归的残差平方和,RSS为第二步中回归的残差平方和,M为约束条件的个数,这里是M=3 注意:拉姆齐RESET检验仅能检验误设定的存在,而不能告诉我们到底是哪一类的误设定,或者说,不能告诉我们正确的模型是什么但该方法毕竟能给出模型误设定的信号,以便我们去进一步查找问题另一方面,如果模型设定正确,RESET检验使我们能够排除误设定的存在,转而去查找其它方面的问题Xianghong Shirley Wang,15,软件实现,Eviews实现的步骤:方程窗口ViewStability TestsRamsey RESET Test输入Number of fittedOK。
Xianghong Shirley Wang,16,4.2 多重共线性,多重共线性的概念 多重共线性产生的原因及后果 多重共线性的检验 解决多重共线性问题的方法 实例,Xianghong Shirley Wang,17,一、多重共线性的概念,,定义:如果某两个或多个解释变量高度线性相关,则称模型中存在多重共线性(Multicollinearity)对于模型 Yi = 0+ 1X1i+ 2X2i++ kXki+ ui ,i = 1,2,,n,其基本假设之一是解释变量是互相独立的 表示为矩阵的秩,有rank(X)=k+1 如:X2= X1,则 X2 对 Y 的作用可由 X1 代替Xianghong Shirley Wang,20,二、多重共线性产生的原因及后果,主要原因包括以下三个方面:,经济变量共同的变动趋势 时间序列数据:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降 截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小Xianghong Shirley Wang,21,,滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系 例如:消费 = f (当期收入, 前期收入) 显然,两期收入间具有较强的线性相关性Xianghong Shirley Wang,22,,样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性 例如:消费 = f (收入, 财富水平),当我们获得收入和财富的样本数据时,两个自变量可能高度相关我们很难找到足够多的财富少而收入高的样本Xianghong Shirley Wang,23,,一般来说,简单线性模型中涉及到时间序列数据样本时往往会存在多重共线性;而对于截面数据样本,问题不那么严重,但多重共线性仍然是存在的。 在多元线性回归模型中,我们关心的并不是多重共线性的有无,而是多重共线性的程度 当多重共线性的程度较高时,会给最小二乘估计量带来严重的后果如何看待多重共线性呢?,Xianghong Shirley Wang,24,多重共线性的后果,的OLS估计量为:,完全共线性下参数估计量不存在,如果存在完全共线性,则必有 ,故(XX) 1 不存在,因此无法得到参数的估计量Xianghong Shirley Wang,25,例:对于二元线性回归模型,如果两个解释变量完全相关,如X2 = X1,则二元模型就会退化为一元线性回归模型:,这时,只能确定综合参数 1+2 的估计值:,Xianghong Shirley Wang,26,近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为:,由于|XX| 0,引起 (XX)-1 主对角线元素较大,即使得参数估计值的方差增大,估计值的精度降低近似共线性下OLS估计量的方差增大,Xianghong Shirley Wang,27,仍以二元线性模型 为例:,恰为 X1与 X2的线性相关系数的平方r 2,由于 r 2 1,故 1/(1- r2 ) 1。 Xianghong Shirley Wang,28,多重共线性使参数估计值的方差增大,1/(1-r 2)为方差膨胀因子(Variance Inflation Factor, VIF),当完全不共线时, r 2 = 0,当近似共线时, 0 < r 2 <1,当完全共线时, r 2 =1,,方差膨胀因子表,Xianghong Shirley Wang,29,如果模型中两个解释变量具有线性相关性,例如 X2 = X1 ,这时,X1 和 X2前的参数 1、2 并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响 1、 2 已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如 1 本来应该是正的,结果恰是负的参数估计量经济含义不合理,Xianghong Shirley Wang,30,存在多重共线性时,参数估计值的方差与标准差变大,容易使通过样本计算的 t 值小于临界值, 误导作出参数为 0 的推断,可能将重要的解释变量排除在模型之外,,,,变量的显著性检验出现偏误,Xianghong Shirley Wang,31,注意,除非是完全共线性,多重共线性并不意味着任何基本假设的违背; 即使出现较高程度的多重共线性,OLS估计量仍具有无偏性、线性性、有效性等良好的统计性质; 但是,无偏性并不保证对某个给定的样本参数估计值等于真值,最小方差性也不保证参数估计量的方差在给定样本下很小。 Xianghong Shirley Wang,32,通过分析回归的结果可以对是否存在多重共线性作出初步的判断:,三、多重共线性的检验,发现系数估计值的符号不对 某些重要的解释变量t值偏低,而拟合优度不低 当一个不太重要的解释变量被删除后,回归结果发生显著变化,如需具体判断哪些变量发生了多重共线性,则需要进一步的检验,经常使用以下几种方法:,Xianghong Shirley Wang,33,1. 利用变量间的相关性判断,对只有两个解释变量的模型,采用简单相关系数法求出 X1与 X2 的简单相关系数 r ,若 |r| 接近1,则说明两变量存在较强的多重共线性一般软件可以提供各解释变量两两之间的相关系数矩阵 对于多个解释变量来说,可以将模型中每一个解释变量分别对其他解释变量进行回归,并计算拟合优度如果某一种回归:Xji = 1X1i + 2X2i +kXki 的拟合优度较大,说明 Xj 与其他所有解释变量之间存在共线性Xianghong Shirley Wang,34,2. 使用方差膨胀因子(VIF)检验,这。












