
横截面与时间序列的相关异质三.docx
15页横截面与时间序列的相关异质(三)——再论面板数据模型及其固定效应估计刘学/陈琳2012-9-279:05:42来源:〈〈数量经济技术经济研究》(京)2011年12期第96〜114页推论4在面板模型的估计中,在一般的模型设定下,所谓不可观测的异质性(固定效应)并不是完全不可观测的;固定效应与回归元之间的相关是因为模型设定的遗漏变量导致的本可观测的元素被假定为不可观测而被放到了固定效应中,使得与回归元相关,是遗漏变量导致的结果;我们认为在估计固定效应时正确的模型形式应如式(34)所示的形式,在时间固定效应时加入项估计,在截面固定效应时加入而项估计,在双向固定时两者都加入,否则,模型就会有遗漏解释变量的问题,研究者会面临着损失重要的解释变量的危险前面我们只是在有一个解释变量的情况下做出了直觉的说明,下面以时间固定效应为例,我们给出推论4的一般情况下的证明传统的时间固定效应模型如下:y=XS+Ha+£H的定义与前文相同,a=[aHa2,-aTr,模型仍然遵从经典的面板模型假设,的估计嫩由下式得到:b|=(XrMhXJ'X,Ml(ya的估计则是:Qf=yhi而我们所建议的模型设定,即:y=X«z+(X-X,)鬲+Hy+s=h(htirxp,+mhxp,+h[j(yj)7+(i-j(j*j)-y)]>+c(35)yi=xfiz+(xA—X,)腐+y,+&=(x<—xr)S+5+其中,行的1向址。
为简便起见,令M,=I.j(j,j)T,P,=jGj)・TR=H(H'H)・‘H',我们知道Pj〉=V=[I,-,/]ZT0模型的拟合准则仍然是MMSE,因为(於一分实际上是成分残差的一部分,因此问题为:Mir^S=—(X—XQ(X~X,)Hy]=(HMj7+e)*(HMly+e)=7*MJH,HMJ7♦彩,彩将S展开并分别对Ph?,./微分,得到:.-|^=2X,MHy+2X,MHX^=0=»63=(XzMhX)-,X,Mh3f=^其中,4和0是同一个&计量,X妁的引入不会对X或(X-X,)的估计造成影响□C,*靠=一2X'P"+2X'P总伊一2X'PhHV=Q券=2H〜-2H,PHXp2+2H知=0同时,对Bz和歹的一阶条件产生了同样的估计条件,整理为:M.PHy=M.PHXp2b2=[X,PHM.PHX]-,X/PHM.PHy因此,Bz实际上是通过回归J<=^2+/+er而得到的,这实际上就是我们熟知的组间估计,乌则可用预测误差得到,即勺=云一5一壬",同时,基于经典的线性模型假定我们有E(%|it)=0将的估计带入式(35),并在其两边乘以可以得到7的估计:(H'H)"H'y=力2+(X-X)缶+HrH]=(H'H)TH'Xb2+7整理得到y的表达式:/t=>/—x/>2=y+er因此,我们同样有E(»li«)=/.cov(.,云)=0。
传统的面板模型固定效应为*=以一元^,而对于我们的模型,将02、的估计带入式(35),整理得到:,=X》2+(X—X,)缶+Hx+e=X8z+(X—X61+Hy+e即为:y—Xbi=Xt(缶一缶)+H/+e(37)在式(37)两边乘以(H,H)・W得到:(H,H)-,H,(y-Xb1)=(H#H)-,H,X(b2-bI)+)=a(38)以一三力]=云(缶一缶)+■=%因此,由式(38),我们知道经典面板模型设定下的固定效应(缶一缶)+y,,所以经典的面板模型中的固定效应除了真正不可观测的异质性,还包括了本可观测的元(bi-by)部分,这是遗漏变扭导致的后果更进一步,我们可以得到如下结论:cov(a„xj)i)=cov[xr(6:—6i)+山,Xtb\2=E{[xt(缶一缶)+.—E
以上对应的结论同样可以很容易地推广到横截面固定效应的情况上面我们对推论4给予了说明,实际上容易发现,对式(34)和式(35)做时均值变换,就得到:乂=]&+"=+歹+(/<—/)(41)因此,歹实际上是式(41)回归的常数项,而(/,-/)则可以看做是回归的误差项,固定效应即为式(41)回归的常数项和误差项之和,而式(41)如前面所述,实际上就是我们熟知的组间估计方程对应地,对式(34)和式(35)做时期均值高差变换,得到:义一(xg-X,)岛(42)这与经典的面板模型设定对应的组内估计姑一样的需要注意的是,如果和没有区别,即那么,式(35)就退回到经典的面板模型情况,即:北■姑+(为一丘)^3+/,+€<=+/+(/,—/)+c<因此,问题就在于模型中的02和的异质性问题我们已经知道B2是通过云与元的回归估计得到的,因此它只体现了样本在时序维度E的相关信息,而由前面的推沦1和推论2可知,是主要是基于样本横截面的信息回归得到的,更多体现的是变量在横截面维度上的相关关系,因此,2和B3的异质性实际上体现『样本在时序维度与横截面维度上的相关异质性,而经典的面板模型设定则由于遗漏了邓2而无法体现和控制这种可能的异质性。
另外,上面的讨论是用时期固定效应的情况做出的,而同样的结论可以推广到横截面固定效应和双向固定效应的情况,这里不再补充以上的讨论与Mur[dlak(1978)"分类似,只不过Mundlak是通过再将固定效应分解,即再做辅助回归%=+也得到.但本质上是-致的,同时,我们已经证明式(35)中的*是随机的,与其他回归元无关,因此这实际上等同于随机效)成的情况凸MuNdlak也叩以证明式(35)的模型本质上用固定效应估计和随机效应估计结果是一样的,M血皿的问题是,他探讨了如式(35)这种模型皿野应的估计问题,但是他实际上忽视了这个表面的模型估计问题背后隐蔽的横裁面与时序的相关异质问题,而这是我们更关心的当然,如果现实中有不可观测的时间变量V与壬,是相关的,不可观测的截面变ita,与五是相关的,那么遗漏的这些变量会导致丘和*的估计有偏,而这也是经典的面板模型所声称的情况,确实,实际应用中会存在这个间题,但是将£和后遗漏却是不可接受的如果因为可能有遗漏变量何题导致估计会有偏就不去估计,那组内估计最,比如截面固定效应时的火一歹=《外一云)g,同样也不可避免地总会有遗漏变fit与《工•一M)相关导致其估计可能有偏.盛道这意味着我们就不应该去估计它了吗?解决的方法不是去回避他,而是尽量去寻找遗漏的变量来解决问题,或者用勺遗漏的时间变崖朴或械面变量口,无关的士.成工f的工具变量进行估计早其中,一个相美的讨论KLHausman和1aylor(1981),Breusch等41989)等讨■论的Hausman^FaylorIVE»timalQro不过,诙估计仕对用作1.只变【it的变Lt的外生性及有效性都有一定的要求。
最后,还需要注意的是,在估计我们所倡导的模地中.如式(35),埋论上讲,应可以直接逐用tSDV方法进行估计•方便地直接•次给出结果然而,用LSDV经常嫌以避免的是引入过多的虚拟变量导致的虚拟变贵陷阱或者估计时的近似奇异矩阵问题,而用经典面板模型的组内估计靖WithinEMmatur则无法得到的彷汁◎因此,在估计上述模型时最好用我们在文中所讨论的,即分别用Wi*binEstiruHtor得到P3和£的估计,用九=M&+歹*佑=壬&+/+3—亍)得到4和固定效应%的估计吧类似的结论也可以推广到莪面固定效应以及双效腕下的估计口三、结论面板数据模型的研究和应用,最早可追溯到Kuh(1959)、Mundlak(1961)、Hock(1962)、Balestra和Nerlove(1966)、Wallace和Hussain(1969)等,他们发展了最早的面板模型组间估计、组内估计、GLS及ML估计等方法其中,早在Kuh(1959)的论文中就已经用组间估计发现了横截面样本与时间序列样本可能存在的相关关系不一致的问题,Kuh将这个不一致性解释为时序样本反应了变量的短期关系,而截面样本反应的是均衡的长期关系。
但在之后的研究中,横截面维度与时序维度的样本相关异质问题却一直被忽略了,经典的面板模型设定成为标准的形式,即暗含假设自变量与因变量在不同维度的相关关系是同质的在Balestra和Nerlove(1966)、Wallace和Hussain(1969)之后,研究者们更多地关心面板的估计是应该用组内估计还是考虑协方差矩阵加权的GLS估计,是用固定效应估计还是随机效应估计其中,Maddala(1971)已经注意到,固定效应估计量的使用导致模型消除了组间样本的信息,而如果组间样本的变异程度相对于样本总的变异程度很大的话,模型是不够恰当的,他损失了大量的样本信息,但Maddala的对策则是转向了随机效应的研究而随机效应的问题是其效应的随机性假定常常是不成立的,其估计方法忽视了可能存在的效应与解释变量之间的相关导致结果可能有偏误Mundlak(1978)则通过再将固定效应做辅助回归进行分解,得到了与本文推论4类似的结论,但是他忽视了这个表面的模型估计问题背后隐藏的横截面与时序的相关异质问题,而这是我们更关心的混合效应、横截面固定效应、时间固定效应以及双向固定效应,一步步地,几乎已经成为了使用面板数据模型的标准步骤。
面板数据的使用者可能经常会碰到不同效应的使用对回归元的估计结果有很大的影响的情况,这经常被解释为是因为固定效应控制了所谓的不可观测的异质性,而这个固定效应可能是跟回归元相关的,这导致了使用的效应不同,估计结果就会有变化实际上,严格来讲,我们认为这种解释是不准确的我们在文中证明,横截面固定效应估计实际上做的是有线性约束的时间序列回归,其估计结果是用时序上的样本信息得出的,回归系数等于每个横截面的时间序列回归系数的加权平均,而时间固定效应估计实际上做的是有线性约束的横截面回归,回归的系数等于每个时点的横截面回归的系数的加权平均;而所谓的横截面固定效应(时期固定效应),或者说不可观测的异质性,实际上是约束每个横截面(每个时期)的误差项的均值为0的结果而双向固定效应的估计量则是混合效应、截面固定效应和时间固定效应估计量的加权平均因此,在使用不同的效应时估计结果经常有很大变化的原因有可能是因为在面板数据中自变量与因变量之间的相关关系在横截面维度和时间维度有本身就有显著不同导致的,我们称这种现象为面板数据的横截面维度和时间维度的相关异质,在图1和图5里我们用模拟生成的数据清晰地显示了这种现象基于此,我们认为,在使用面板数据时,研究者需要十分清楚自己要研究的变量之间的相关关系是存在于哪个维度上的,或者说在哪个维度方向上结果才是真实的,依据逻辑和经济的理论来判断需要使用什么样的模型(14),而不是依靠固定效应是否显著的统计检验。
进一步地,本文除探讨了因为其他变量的干扰导致的横截面和时间序列的相关界。












