
内生性问题课件.ppt
57页Chapter9内生性问题内生性:在回归分析中,干扰项和解释变量相关回顾:确保估计量具有一致性的条件随机抽样 满秩 外生 内生性的后果 统计角度而言:OLS (MLE) 估计结果有偏且不一致 实践角度而言:经验结果存在多种可能的解释(并非“因果”推断)1.何谓内生性?2.内生性问题的可能来源 遗漏变量 假定真实的经济关系: 实际估计的模型: 如果存在 ,则所有的估计系数不具有一致性 遗漏变量通常源于无法观察的影响因素 考虑影响工资的模型 该模型忽略了人的能力(如果能找到代理变量,如IQ,可以将其加入模型中) 人的能力将影响其受教育的程度联立方程(simultaneity,双向因果)测测量误误差 因变量的测量误差 真实的经济关系 可估计的模型测测量误误差 自变量的测量误差 真实的经济关系 可估计的模型3.内生性的检验 Hausman检验 参数的两种估计量和,在原假设和备择假设下都是一致估计量,而仅在原假设下是一致估计量 原假设:变量是外生的 备择假设:变量具有内生性 2SLS估计量 OLS估计量 案例1:美国货币货币 需求函数(BASICS.WF1)因变变量M1:MONEY STOCK(CURR,TRAV.CKS,DEM DEP,OTHER CKABLE DEP)(BIL$,SA)自变变量IP:INDUSTRIAL PRODUCTION: TOTAL INDEX (1987=100,SA)自变变量PPI: PRODUCER PRICE INDEX: FINISHED GOODS (82=100,NSA)自变变量TB3:INTEREST RATE: U.S.TREASURY BILLS,AUCTION AVG,3-MO.(% PER ANN,NSA)外生变变量URATE: UNEMPLOYMENT RATE: ALL WORKERS, 16 YEARS & OVER (%,SA)外生变变量AAA: BOND YIELD: MOODYS AAA CORPORATE (% PER ANNUM)货币需求函数的初始估计结果为检验 IP是否具有内生性,估计以IP为因变量的简约式模型,并提取残差v显然,IP具有内生性4.内生性的处理与参数估计 工具变量(instrumentalvariable) 两阶段最小二乘(2SLS) 广义矩估计(GMM)工具变量 如果存在多个工具变量 如何检验 ?一个简单简单 的IV 估计计量 一元模型 y = b0 + b1x + u, 满足假定条件 Cov(z,y) = b1Cov(z,x) + Cov(z,u), b1 = Cov(z,y) / Cov(z,x) b1 的IV估计量为IV估计计量的推断 满足同方差假定E(u2|z)=s2=Var(u) 类似于OLS,给定渐近方差,可以得到参数的标准差估计量IVversusOLS IV 的标准差与OLS的标准差差别在x 对 z回归的R2 R2 1, IV 标准差更大 当 Cov(x,u) 0,IV 估计是一致估计量,而OLS 估计量非一致案例2:用邻邻近大学作为为教育的IV(card.wf1)Card(1995)利用1976年的数据估计计男性的教育回报报。
因变变量LOG(wage):工资资的对对数自变变量educ:受教育年数自变变量exper:工作经验经验自变变量exper2:工作经验经验 的平方虚拟变拟变 量black:黑人为为1,其它人种为为0虚拟变拟变 量smsa:居住在大城市及其郊区为为1,否则为则为 0虚拟变拟变 量south:居住在南方为为1,否则为则为 0其它控制变变量:smsa66,reg662,reg669受教育程度是否具有内生性?请同学们自己检验Card采用一个虚拟变拟变 量作为为教育的工具变变量,即是否在一个四年制大学的附近长长大(nearc4),需要检验检验 两者的偏相关性2sls估计结果OLS估计结果糟糕IV的影响 如果Cov(z,u) = 0的假定不满足 IV 估计量也是非一致的 可以比较两个估计量的极限偏倚案例3:估计计吸烟对对出生婴婴儿体重的影响(bwght.Wf1)log(bwght):婴儿的出生体重Packs:母亲每天吸烟的包数由于模型中仅有一个自变量,我们担心packs会与某些省略的变量具有较高相关性,如packs与其他健康因素或者基因等有关,会致使packs变量具有内生性采用香烟价格cigprice作为工具变量,根据经济 学理论,cigprice与packs具有负向关系,较为 合理我们的检验结果表明,两者的相关关系并不显著。
你如何解释?如果仍以cigprice作为工具变量,估计结果为:这个结果说明什么,合理吗?TwoStageLeastSquares(2SLS)考虑结 构模型y1 = b0 + b1y2 + b2z1 + u1, y2 是内生变量,z1是外生变量 简约 式模型 y2 = p0 + p1z1 + p2z2 + p3z3 + v2 其中z2 与 z3 是工具变量 可以用z2 或 z3 作为y2的工具变量 但最佳工具变量是线性组合 y2* = p0 + p1z1 + p2z2 + p3z3 估计简约 式模型y2 = p0 + p1z1 + p2z2 + p3z3 + v2 2是y2的拟合值,作为y2*的估计值 估计结 构模型 y1 = b0 + b1 2 + b2z1 + u12SLS注意事项项 尽管参数估计值 一样,但方差不准确,所以2SLS最好用软件直接估计 存在多个内生变量时,工具变量个数不少于内生变量个数 R2可能是负的案例4:职业职业 女性的教育回报报(mroz1.wf1)职业女性教育回报的回归模型如下:教育具有内生性,引入motheduc与fatheduc作为工具变量,首先检验其偏相关性采用2SLS估计结果:过过度识别约识别约 束问题问题 存在多个内生变量 需要m个工具变量,且 过度识别问题 (overidentifyed ) m个工具变量,h个内生变量 有m-h个过度识别约 束(overidentifying restrictions) 如,仅有一个内生变量,那只需要一个工具变量就可以识别 参数,其他的工具变量对于参数识别 而言没有必要 增加IV个数能提高渐进 有效性 有限样本下,增加过多的IV会夸大偏倚过过度识别约识别约 束检验检验 采用2SLS估计结 构模型 提取估计的残差,估计模型 计算nR2,在原假设 , 如果拒绝原假设表明至少有一个工具变变量不是外生变量 案例4:增加huseduc作为为工具变变量三个工具变量都是外生变量5.广义义矩估计计 广义矩估计(generalized method of moments, GMM) 由Hansen提出矩估计:求解上述方程组,得到参数的估计量,当时,能否求解? 用GMM方法重新估计计案例4GMM框架下的过过度识别约识别约 束检验检验 Sargan-Hansen 检验Eviews下的操作GMM框架下的假设检验设检验GMM准则函数:在H1下:在H0下:LR统计量:(1)C-test or EHS test(Eichenbaum, Hansen, Singleton)用来检验检验 一部分工具变变量是否具有正交性,工具变变量应应满满足下面条件:表示工具变量,其中Z1满足正交条件,检验Z2是否满足CT统计统计 量是LR类统计类统计 量,服从Chi-squared分布,自由度为为Z2中变变量的个数Eviews下的操作View/IV Diagnostics and tests/Instrument Orthogonality test/输输入需要检验检验 的工具变变量以案例4为例(2)内生性检验 (regressor endogeneity test)通常也称为Durbin-Wu-Hausman检验 ,用以检验 回归模型中一个、多个或全部的自变量是否具有内生性在H0下,x可以做工具变变量,但在H1下,x不能作为为工具变变量HT统计统计 量是LR类统计类统计 量,服从Chi-squared分布,自由度为为r,待检验变检验变 量的个数View/IV Diagnostics and tests/regrssor endogeneity test/输输入需要检验检验 的变变量以案例4为例Thomas A. Mroz .The Sensitivity of an Empirical Model of Married Womens Hours of Work to Economic and Statistical Assumptions.Econometrica, Volume 55, Issue 4 (Jul. 1987), 765 799. The Econometric Society案例5:重复Mroz论论文的实证结实证结 果(mroz2.wf1)Seong H. Moon. A Partial Replication of T. Mroz paper(1987) on the Sensitivity of an Empirical Model. December 18, 2003,working paper。












