
模型中的特殊解释变量.ppt
23页单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,*,第8章 模型中的特殊解释变量,8.1 随机解释变量(一般性了解),,8.2 工具变量,,8.3 滞后变量(一般性了解),,8.4 虚拟变量(重点,),,8.5 时间变量,,8.1随机解释变量,,(第2版教材第203页),,(第3版教材第174页),,(第2版教材第207页),,(第3版教材第177页),8.2 工具变量法,,,工具变量法是解决随机解释变量,X,与误差项,u,相关时,,,的OLS估计量不具有一致性的方法假定,有变量,Z,与,X,高度相关,但与误差项,u,不相关,,则用,Z,替换,X,,估计回归参数,,,这种估计方法称作工具变量法,,Z,称作工具变量,,的工具变量法估计量,具有一致性例8.1,用最终消费C1对国内生产总值Y回归假定Y与误差项,u,相关,但资本总额K与误差项,u,不相关,用K作Y的工具变量工具变量法的EViews操作:打开模型估计对话窗,选TSLS估计法在方程设定区填入,C1 C Y,,在工具变量列写区填入,C K,,,点击确定键8.2 工具变量法,(第2版教材第208页),,(第3版教材第178页),,,8.3 滞后变量(一般性了解),滞后的原因。
如:消费行为的滞后,央行上调银行存款准备金率,投资、项目研发周期长,一项政策的执行有滞后1)分布滞后模型,(权数法、阿尔蒙多项式法不讲),,Y,t,,=,,+,,0,,X,t,+,,1,,X,t,-1,,+ …+,,k,X,t,-,k,+,u,t,,,可以用,OLS法估计参数,,但,不具有有效性,容易引起多重共线性最大滞后阶数由AIC、SC准则决定2)自回归模型,(柯依克变换不讲),,Y,t,,=,,+,,0,,X,t,+,,1,,Y,t,-1,,+ …+,,m,Y,t,-,m,+,u,t,,,可以,用OLS法估计参数,为有偏、一致估计量,最大滞后阶数由AIC、SC准则决定3)自回归分布滞后模型,,Y,t,,=,,+,,0,,X,t,+,,1,,X,t,-1,,+ …+,,k,X,t,-,k,+,,1,,Y,t,-1,,+ …+,,m,Y,t,-,m,+,u,t,,,如消费模型:,Y,t,,=,,+,,0,,X,t,+,,1,,X,t,-1,,+,,1,,Y,t,-1,,+,u,t,,,(第2版教材第218页),,(第3版教材第187页),,8.4 虚拟变量,(重点掌握),,在实际建模过程中,被解释变量不但受定量变量影响,同时还,受定性变量影响,。
例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用,取值为1或0,这种变量称作虚拟变量(dummy variable),用,D,表示虚拟变量应用于模型中,对其回归系数的估计与检验方法和定量变量相同第2版教材第219页),,(第3版教材第188页),注意:(1),当定性变量含有,m,个类别时,,模型不能引入,m,个虚拟变量最多只能引入,m,-1个虚拟变量,,否则当模型中存在截距项时就会产生完全多重共线性,无法估计回归参数比如,对于季节数据引入4个虚拟变量,数据如下表,,8.4 虚拟变量,则必然会有,截距项对应的单位向量等于,,(,D,1,+,D,2,+,D,3,+,D,4,) 这意味着虚拟变量之间存在完全多重共线性2) 把虚拟变量取值为0所对应的类别称作,基础类别,3) 当定性变量含有,m,个类别时,不能把虚拟变量的值设成如下形式这种赋值法在一般情形下与虚拟变量赋值是完全不同的两回事4) 回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起做解释变量8.4 虚拟变量,(第2版教材第219页),,(第3版教材第188页),,,(第2版教材第220页),,(第3版教材第189页),8.4 虚拟变量,1. 用虚拟变量测量截距变动,,设有模型,,y,t,=,,0,+,,1,x,t,+,,2,D,+,u,t,,,,其中,y,t,,,x,t,为定量变量;,D,为定性变量。
当,D,= 0 或1时,上述模型可表达为,,D,= 1或0表示某种特征的有无反映在数学上是截距不同的两个函数若,,2,显著不为零,说明截距不同;若,,2,为零,说明这种分类无显著性差异D,= 1,,D,= 0,,0,,0,+,,2,,例,8.3,随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额,Y,i,(千美元) 对年收入,X,i,(千美元) 的回归模型通过对样本点的分析发现,居于上部的6个点(用小圆圈表示)都是代表自己有房子的家庭;居于下部的14个点(用小三角表示)都是租房住的家庭而这两类家庭所对应的观测点各自都表现出明显的线性关系于是给模型加入一个定性变量“住房状况”,用D表示定义如下:,8.4 虚拟变量,(第2版教材第220页),,(第3版教材第189页),,例8.3,建立回归模型,,Y,i,,=,,0,+,,1,,X,i,+,,2,,D,i,,+,u,t,,,得估计结果如下,,,= - 0.3204 + 0.0675,X,t,+ 0.8273,D,i,,,(-5.2) (16.9) (,11.0,),R,2,= 0.99,,,DW,= 2.27,,由于回归系数0.8273显著地不为零,说明对住房状况不同的两类家庭来说,回归函数截距项确实明显不同。
当模型不引入虚拟变量“住房状况”时,得回归方程如下,,,= - 0.5667 + 0.0963,X,i,,,(-3.5) (11.6),R,2,= 0.88,,,DW,= 1.85,,比较回归方程,前者的确定系数为0.99,后者的确定系数仅为0.88说明该回归模型中引入虚拟变量非常必要8.4 虚拟变量,(第2版教材第221页),,(第3版教材第190页),,,,8.4 虚拟变量,“季节”是在研究经济问题中常常遇到的定性因素比如,酒,肉的销量在冬季要超过其它季节,而饮料的销量又以夏季为最大当建立这类问题的计量模型时,就要考虑把“季节”因素引入模型由于一年有四个季节,所以这是一个含有四个类别的定性变量应该向模型引入三个虚拟变,量,例,8.4,市场用煤销售量模型,由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度鉴于是季节数据可设三个季节变量如下:,(第2版教材第222页),,(第3版教材第191页),,,(第2版第224页),,(第3版第192页),以时间,t,为解释变量(1982年1季度取,t,= 1)的煤销售量(,Y,i,)模型估计结果如下:,,,,,= 2431.20 + 49.00,t,+ 1388.09,D,1,+ 201.84,D,2,+ 85.00,D,3,,,(26.04) (10.81) (13.43) (1.96) (0.83),,,R,2,= 0.95, DW = 1.2, F=100.4,,T,=28,,t,0.05,(28-5),,= 2.07,,由于,D,2,,,D,3,的系数没有显著性,说明第二、三季度可以归并入基础类别第一季度。
于是只考虑加入一个虚拟变量,D,1,,把季节因素分为第四季度和第一、二、三季度两类从上式中剔除虚拟变量,D,2,,,D,3,,得煤销售量(,Y,i,)模型如下:,,,,= 2515.86 + 49.73,t,+ 1290.91,D,1,,,(32.03 (10.63) (,14.79,),,R,2,= 0.94, DW = 1.4, F = 184.9,,T,=28,,t,0.05,(25) = 2.06,,这里第一、二、三季度为基础类别8.4 虚拟变量,例8.4,,,2. 测量斜率变动,,以上介绍了用虚拟变量测量回归函数的截距变化实际上,也可以用虚拟变量考察回归函数的斜率是否发生变化方法是在模型中加入,定量变量与虚拟变量的乘积项,设模型如下,,,Y,i,,=,,0,+(,,1,+,,2,,D,i,),X,i,,+,u,i,,,,Y,i,,=,,0,+,,1,,X,i,+,,2,(,X,i,D,i,) +,u,i,,按,,2是否为零,回归函数可有如下四种形式E(,Y,i,) =,,0,+,,1,,X,i,, (当 D = 0),,E(,Y,i,) =,,0,+ (,,1,+,,2,),X,i,, (当 D=1),,(第2版第224页),,(第3版第192页),3. 测量系数变动,,以上介绍了用虚拟变量测量回归函数的截距变化。
实际上,也可以用虚拟变量考察回归函数的斜率是否发生变化方法是在模型中加入,定量变量与虚拟变量的乘积项,设模型如下,,,Y,i,,=,,0,+,,1,X,i,,+,,2,D,i,,+,,3,(,X,i,D,i,) +,u,i,,,按,,2,,,,3,是否为零,回归函数可有如下四种形式E(,Y,i,) =,,0,+,,1,X,i,, (当,,2,=,,3,= 0),,E(,Y,i,) = (,,,0,+,,2,) + (,,,1,+,,3,),X,i,, (当,,2,,0,,,3,,0),,E(,Y,i,) =,,0,+ (,,1,+,,3,),X,i,, (当,,2,= 0,,,,3,,0),,E(,Y,i,) = (,,0,+,,2,) +,,,1,X,i,, (当,,,2,,0,,,,3,= 0),,截距、斜率同时发生变化的两种情形见图8.4 虚拟变量,,,,3. 分段线性回归,1),时间分段,,,Y,t,=,,0,+,,1,t+,,2,(t-t*)D,t,+ u,t,,,,E(Y,t,)=,,,0,+,,1,t+,,2,(t-t*)D,t,,,E(Y,t,)=,,,0,+,,1,t (当t 试检验改革开放前后该时间序列的斜率是否发生变化定义虚拟变量,D,如下,,,,,,以时间,time,为解释变量,进出口贸易总额用,trade,表示,估计结果如下,,,,= 0.2818 + 0.0746,time,- 35.8809,D,+ 1.2559,time D,,(1.35) (6.2),(-8.4) (9.6),,,,,上式说明,改革开放前后相比无论截距和,,斜率都发生了变化进出口贸易总额的,,年平均增长量扩大了近17倍8.4 虚拟变量,(第2版第226页),,(第3版第194页),,补充案例 :香港季节,GDP,数据(,千亿港元,)的拟合,(file:dummy6),8.4 虚拟变量,1990~1997年香港季度GDP呈线性增长1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,1998~2002年底GDP总量几乎没有增长(见上图)对这样一种先增长后停滞,且含有季节性周期变化的过程简单地用一条直线去拟合显然是不恰当的为区别不同季节,和不同时期,,定义季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量DT,如下,,,得估计结果如下:,,= 1.1573+0.0668,t,+0.0775,D,2,+0.2098,D,3,+0.2349,D,4,+1.8338,DT,- 0.0654,DT,,t,,(50.8) (64.6) (3.7) (9.9) (11.0) (19.9) (-28.0),,,R,2,= 0.99,, DW = 0.9, s.e. = 0.05, F=1198.4,,T,=52,,t,0.05,(52-7),,= 2.01,,,对于1990:1 ~1997:4,,= 1.1573 + 0.0668,t,+ 0.0775,D,2,+ 0.2098,D,3,+ 0.2349,D,4,,对于1998:1~2002:4,,= 2.9911 + 0.0014,t,+ 0.0775,D,2,+ 0.2098,D,3,+ 0.2349,D,4,8.4 虚拟变量,例3:香港季节GDP数据(千亿港元)的拟合(file:dummy6),,,,如果不采用虚拟变量拟合效果将很差。 1.6952 + 0.0377,t,,(20.6) (13.9),R,2,= 0.80,, DW = 0.3,,T,=52,,t,0.05,(52-2),,= 2.01,8.4 虚拟变量,补充案例:,,香港季节,GDP,数据的拟合,,,8.5 时间变量,以时间变量,t,作解释变量估计与检验方法与定量解释变量,X,t,相同Y,t,,=,,,+,,,t,+,,0,,X,t,,+,u,t,,,Y,t,,=,,,+,,,t,+,u,t,,如,时间变量,t,在生产函数模型中代表技术进步Lny,t,=,,0,+,,,t,+,,1,Lnx,t,1,,+,,2,Lnx,t,2,+,u,t,,,,第,8,章结束.,,。
