
两阶段最小二乘法TSLS案例分析.doc
9页两阶段最小二乘回归Contents1背景 32理论 43操作 44 SPSSAU输出结果 55文字分析 66剖析 9TSLS是用于解决内生性问题的一种方法,除TSLS外还可使用GMM估计内生变量是指 与误差项相关的解释变量对应还有一个术语叫‘外生变量',其指与误差项不相关的 解释变量产生内生性的原因通常在三类,分别说明如下:内生性原因说明遗漏变量比如研究工资的影响因素时,解释变量纳入受教育年限,但个人 能力未被纳入变量有测量误差比如使用成绩来测量IQ值双向因果关系比如受教育年限影响工资,工资反过来影响受教育年限内生性问题的判断上,通常是使用Durbin-Wu-Hausman检验(SPSSAU在两阶段最小二乘 回归结果中默认输出),当然很多时候会结合自身理论知识和直观专业性判断是否存在 内生性问题如果假定存在内生性问题时,直接使用两阶段最小二乘回归或者GMM估计 即可一般不建议完全依照检验进行判断是否存在内生性,结合检验和专业理论知识综 合判断较为可取内生性问题的解决上,通常使用工具变量法,其基本思想在于选取这样一类变量(工具 变量),它们的特征为:工具变量与内生变量有着相关(如果相关性很低则称为弱工具变 量),但是工具变量与被解释变量基本没有相关关系。
寻找适合的工具变量是一件困难 的事情,解决内生性问题时,大量的工作用于寻找适合的工具变量关于引入工具变量的个数上,有如下说明:项说明Durbin-Wu-Hausman过度识别检验过度识别工具变量个数〉内生变量个数有有恰好识别工具变量个数=内生变量个数有无不可识别工具变量个数〈内生变量个数——过度识别和恰好识别是可以接受的,但不可识别这种情况无法进行建模,似想用一个工 具变量去标识两个内生变量,这是不可以的另需要提示,如果是恰好识别状态下是无 法进行 Durbin-Wu-Hausman 检验工具变量引入时,有时还需要对工具变量外生性进行检验(过度识别检验),针对工具 变量外生性检验上,SPSSAU默认提供Sargan检验和Basmann检验特别提示,只有过 度识别时才会输出此两个检验指标关于两阶段最小二乘法的原理上,其将估计分成两个步骤(阶段)回归如下表格说明:阶段说明目标第一阶段将内生变量与工具变量,外生变量进行回 归得到预测值Prediction (其目 的在于替换内生变量)第二阶段将被解释变量与Prediction,外生变量进 行回归得到最终结果第一阶段回归结果为中间过程值,SPSSAU默认没有输出;第二阶段回归结果为最终结果 值。
特别提示:• 内生性问题涉及以下几点,分别是内生变量判断(Durbin-Wu-Hausman检验和理论 判断),内生性问题的解决(两阶段最小二乘回归TSLS或GMM),工具变量引入后过 度识别检验(Sargan检验和Basmann检验)等• 如果在理论上认为可能某解释变量可能为内生变量,那么直接进行TSLS回归即可两阶段最小二乘回归案例Contents1背景 32理论 43操作 44 SPSSAU输出结果 55文字分析 66剖析 91 背景 本案例引入Mincer(1958)关于工资与受教育年限研究的数据案例数据中包括以下信 息,如下表格:编号名称说明类型1是否美国南方(1为南方)数字1代表美国南方城市,数 字0代表不是南方城市-2婚姻(已婚为1)数字1代表已婚状态,数字0 代表未婚状态外生变量3是否大城市(1为大城市)数字1代表大城市,数字0代 表不是大城市外生变量4母亲受教育年限工具变量5iq智商一6成绩工具变量7年龄一8受教育年限内生变量9工龄一10当前单位工作年限外生变量11Ln工资工资的对数值被解释变量12工资—数据共有12项,其中编号为1,5,7,8,12共五项并不在考虑范畴。
本案例研究‘受教育年限'对于‘Ln工资'的影响明显的,从理论上可能出现‘双向 因果关系'即‘受教育年限'很可能是内生变量那么可考虑使用‘母亲受教育年限' 和‘成绩'这两项数据作为工具变量同时研究时纳入3个外生变量,分别是‘婚姻',‘是否大城市‘和'当前单位工作年限'使用两阶段最小二乘TSLS回归进行解决内 生性问题本案例研究时,工具变量为 2 个,内生变量为 1 个,因而为过度识别,可以正常进行 TSLS 回归2 理论两阶段最小二乘回归,其内部原理上共分为两次回归第一次回归将内生变量与工具变 量,外生变量进行回归,并且得到回归预测值Prediction;第二次回归将被解释变量与 Prediction,外生变量进行回归,得到最终模型结果第一次回归为中间过程值,SPSSAU 并没有输出,如果有需要可自行使用线性回归或OLS回归进行即可• 关于内生性的检验Durbin-Wu-Hausman检验,其用于检验是否真的为内生变量; 如果说检验不通过(接受原假设),那么说明没有内生变量存在,可直接使用OLS 回归即可当然即使没有内生性,一般也可以使用TSLS回归,没有内生性问题 时,OLS回归和TSLS回归结论通常一致;• 关于过度识别检验上,SPSSAU提供Sargan检验和Basmann检验(使用任意其一 即可),原理上此过度识别检验仅在‘过度识别'时才会输出,即工具变量个数> 内生变量个数时,才会输出。
3 操作 本案例分别将被解释变量,内生变量,工具变量和外生变量纳入对应的模型框中,如下:4 SPSSAU输出结果SPSSAU共输出6类表格,分别是研究变量类型表格,2sls模型分析结果表格,2sls模 型分析结果-简化格式表格,模型汇总(中间过程)表格,Durbin-Wu-Hausman test外生 性检验(test of exogenei ty)和过度识别检验(overiden tifying res trie tions)说明 如下:表格名称说明研究变量类型表格变量类型汇总表格2sls模型分析结果表格模型结果表格2sls模型分析结果-简化格式表格模型分析结果的简化格式表格模型汇总(中间过程)表格输出一般性指标比如R值Durbin-Wu-Hausman test 外生性检 验(test of exogeneity)是否存在内生变量检验过度识 别检验(overidentifying restrietions)工具变量是否外生性检验表格,如果是‘恰好 识别'则不会有此表格5文字分析研究变量类型类型名称被解释变量Ln工资内生变量受教育年限工具变量母亲受教育年限成绩婚姻(已婚为1)外生变量是否大城市(1为大城市)当前单位工作年限研究变量类型类型名称被解释变量Ln工资内生变量受教育年限母亲受教育年限工具变量成绩婚姻(已婚为1)外生变量是否大城市(1为大城市)当前单位工作年限上一表格展示本次研究时涉及的各变量属性,包括被解释变量,内生变量,工具变量和 外生变量组成情况。
2sls模型分析结果(n=758)非标准化系数 T pB标准误95% CIR2调整R2Wald x23.605 〜常数3.932 0.167 23.5820.000**4.2580.087 〜受教育年限0.112 0.013 8.807 0.000**0.137是否大城市0.145 0.029 5.096 0.000**0.089 〜X2(1为大城市)0.201⑷=244.172,p=0.000当刖单位工作年0.036 0.008 4.513 0.000**0.020 〜限0.051婚姻0.167 0.027 6.125 0.000**0.114 〜(已婚为1)0.221被解释变量:Ln工资* p<0.05 ** p<0.01上表格列出TSLS两阶段最小二乘回归的最终结果(第二阶段结果),首先模型通过Wald卡方检 验(Wald x2 =244.172, p=0.000〈0.05),意味着模型有效同时R方值为0.342,意味着内生 和外生变量对于工资的解释力度为34.2%具体查看内生和外生变量对于被解释变量'工资'的 影响情况来看:受教育年限的回归系数值为0.112(p=0.000〈0.01),意味着受教育年限会对工资产生显著的正向 影响关系。
婚姻(已婚为1)的回归系数值为0.167(p=0.000〈0.01),意味着相对未婚群体来讲,已婚群体的 工资水平明显会更高是否大城市(1为大城市)的回归系数值为0.145(p=0.000〈0.01),意味着相对来讲,大城市样本 群体,他们的工资水平明显会更高当前单位工作年限的回归系数值为0.036(p=0.000〈0.01),意味着当前单位工作年限会对工资产 生显著的正向影响关系总结分析可知:受教育年限,婚姻,是否大城市,当前单位工作年限全部均会对工资产生显著的 正向影响关系模型汇总(中间过程)Wald x2 R R 2 调整 R 2 Root MSE DW 值x2 (4)=244.172,p=0.000 0.585 0.342 0.338 0.348 1.755 上表格展示模型的基础指标值,包括模型有效检验wald卡方值(此处提供wald卡方非 F检验),R值,Root MSE等指标值Durbin-Wu-Hausman test 外生性检验(test of exogeneity)检验原假设检验结果检验结论Durbin检验Wu-Hausman 检验所有解释变量均外生(不存在内生变量)所有解释变量均外生(不存在内生变量)x2 (1)=3.973, p=0.046 拒绝原假设F (1,752)=3.962,p=0.047 拒绝原假设Durbin-Wu-Hausman test用于检验解释变量X (即内生外量)是否均为外生变量(即是 否不存在内生变量);从上表可知,本次研究纳入的内生变量为‘受教育年限',Wu- Hausman检验显示拒绝原假设(p=0.047〈0.05),意味着‘所有解释变量均外生'这一假 设不成立。
即意味着‘受教育年限'是内生变量同时也可使用Durbin检验,一般情 况下使用Durbin-Wu-Hausman检验较多特别提示: 如果无法拒绝原假设,那么说明研究的内生变量并不是真正意义上的内生变量,那么此 时可考虑直接使用OLS回归结果即可,但多数时候也可直接使用TSLS两阶段最小二乘 的结果,似研究者专业理论知识综合而定过度识别检验(overide ntif ying res trie tio ns)检验原假设检验结果检验结论Sargan检验所有工具变量均外生x2 (1)=0.025,p=0.874接受原假设Basmann 检验所有工具变量均外生X,2 (1)=0.025,p=0.874接受原假设过度识别检验用于检验工具。












