
面板数据模型入门讲解.docx
26页第十四章 面板数据模型在第五章,当我们分析城镇居民的消费特征时,我们使用的是城镇居 民的时间序列数据;而当分析农村居民的消费特征时,我们使用农村居民 的时间序列数据如果我们想要分析全体中国居民的消费特征呢?我们有 两种选择:一是使用中国居民的时间序列数据进行分析,二是把城镇居民 和农村居民的样本合并,实际上就是两个时间序列的样本合并为一个样 本多个观测对象的时间序列数据所组成的样本数据,被称为 面板数据(Panel Data)通常也被称为综列数据,意即综合了多个时间序列的数 据当然,面板数据也可以看成多个横截面数据的综合在面板数据中, 每一个观测对象,我们称之为一个个体(Individual)例如城镇居民是 一个观测个体,农村居民是另一个观测个体如果面板数据中各观测个体的观测区间是相同的,我们称其为平衡的 面板数据,反之,则为非平衡的面板数据基于面板数据所建立的计量经 济学模型则被称为面板数据模型例如,表5.3.1中城镇居民和农村居民 的样本数据具有相同的采样区间,所以,它是一个平衡的面板数据§14.1 面板数据模型一、两个例子1. 居民消费行为的面板数据分析让我们重新回到居民消费的例子。
在表5.1.1中,如果我们将城镇居民和农村居民的时间序列数据作为一个样本,以分析中国居民的消费特征那么,此时模型(5.1.1)的凯恩斯消费函数就可以表述为:C 二 B +P Y +£it 0 1 it it(14.1.1)8 =卩+尢+ Uit i t it(14.1.2)其中:C和Y分别表示第i个观测个体在第t期的消费和收入i=l、it it2分别表示城镇居民和农村居民两个观测个体,t = 1980、…、2008表示不同年度 u 为经典误差项it在(14.1.2)中,卩随观测个体的变化,而不随时间变化,它反映个i体之间不随时间变化的差异性,被称为个体效应九反映不随个体变化的 t时间上的差异性,被称为时间效应在本例中,城镇居民和农村居民的消 费差异一部分来自收入差异和随机扰动,还有一部分差异是由城镇居民和 农村居民的身份或地域差异决定的,它不随时间变化,这种差异性就由卩1和卩来反映同时,对同一种居民,在收入不变的情况下,消费支出还可2能随时间的变化而变化,这种变化的来源在于除随机扰动以外经济环境的 一些系统性变化,如经济体制的变迁,这种变化是所有居民共同面对的, 所导致的居民消费在时间上的差异性就由时间效应九、九、…、九 来 1980 1981 2008 反映。
实际上,模型(14.1.1)还隐含了一个假定,既假定城乡居民的边际消费倾向相同并且不随时间变化尽管这一假定不一定成立,但作为熟悉面板数据模型基础知识的例子,我们还是暂且保留这一假定2. 农村居民收入分析为了考察中国农民收入及农村要素投入结构之间的关系,同样地,我 们既可以采用全国的时间序列总量数据进行分析,也可以采用各省市自治 区的横截面数据进行分析但是,如果能够综合各省市自治区的时间序列 数据,从而基于面板数据进行分析,一个显而易见的好处就是,我们将会 有更多更具体的信息,估计和检验统计量都会有更大的自由度,从而获得 更可靠的分析结论简单而言,由于农村剩余劳动力的存在,影响农村居民收入的要素配 置因素可以分为以下几个方面:资本拥有量、投资主体结构、劳动的配置 状态等所以,基于省际面板数据,有研究者建立了如下的面板数据模型:In (PIC ) = P +P ln(CSC ) + P RLT +P RCI +sit 0 1 it 2 it 3 it it(14.1.3)£ =卩+尢+ u oit i t iti 二 1,2,…N , t 二 1,2,-T其中:PIC为地区i在第t期的农村人均纯收入,各年份的现值均按本地it区农村消费者价格指数折算为1995年不变价。
RLT为地区i在第t期乡村it劳动力中非农产业从业人数及农林牧渔等传统产业从业人数之比RCIit为地区i在第t期农村集体投资及个人投资的比率CSC为估算的地区i在it第t期农村人均资本存量R和九分别为个体效应和时间效应R反映除i t i劳动力分配比例、投资比例、资本存量的影响以外,各省人均纯收入受本 省内在因素(如地理位置,经济发展基础等)所导致的不随时间变化的差 异性而时间效应反映除解释变量的影响以外,所有省份农村人均纯收入 面对共同的经济环境的变化而形成的时间上的差异性显然,面板模型及我们以前所学的模型之间的区别,就在于存在个体 效应和时间效应简而言之,剔除了解释变量的影响以后,由个体内部不 变的因素所导致的个体之间的差异性,就是个体效应;由所有个体所面对 的共同因素所导致的时间上的变化,就是时间效应二、面板数据的特征及优势基于前面两个例子,我们发现,面板数据既可以看作多个个体时间序 列数据的合并,也可以看作多个时点横截面数据的合并所以,面板数据 的基本特征就是其数据结构的二维性(图 14.1.1)或者说,面板数据是 一个数据平面,这也正是其被以“面板”命名的原因图 14.1.1 变量 X 的面板数据结构那么,有读者会说,我们可以基于全国的总量数据(城镇居民和农村 居民数据加总)来分析中国居民的消费行为,为什么要使用面板数据呢? 实际上,使用面板数据会为我们的计量经济学分析带来很多的好处。
1)扩大信息量,增加估计和检验统计量的自由度显然,及时间序列数据和横截面数据不同,面板数据是二维数据它既包含观测同一个体随时间的变化,也包含同一时间不同个体之间的差异这显著扩大了样本的信息量和样本容量,有助于提高参数估计的精度 和检验结论的可靠性对模型(14.1.1)而言,如果我们基于居民的时间序列数据进行分析, 样本容量为 29而基于城镇和农村的面板数据,样本容量则为 58,如果 基于省市区的面板数据,样本容量将更大,模型估计量和检验统计量的自 由度显著增加更重要的是,基于总量数据进行分析,无法反映两种居民 之间的差异性,其数据信息对于两种居民都有显著的偏差2)有助于提供动态分析的可靠性基于单个个体的时间序列数据进行动态分析,一方面会受到采样区间 的限制,另一方面其研究结论也缺乏普适性而基于面板数据,则可以在 较短的采样区间内反映多个个体共同的动态变化特征,从而弱化样本区间 的制约得到更为可靠的分析结论当我们在模型(14.1.1)中引入预期因素时,其回归模型被表述为:C二卩+卩Y +卩C +£ it 0 1 it 2 i ,t-1 it(14.1.4) 如果使用总量数据,我们只能根据不同年度消费额的变化信息来估计消费 的动态性质,而使用面板数据,我们有两种居民消费的变化信息可供利用。
3)有助于反映经济结构、经济制度的渐进性变化对于所考察的经济体系而言,经济结构和经济制度的变化通常是渐进 性的,我们很难找到一个量化的指标来反映这种渐进性变化幸运的是, 使用面板数据时,时间效应是被解释变量中不随个体变化而只随时间变化 的部分,它反映了所有个体所面对的共同因素的影响所以,时间效应是 对经济结构和经济制度渐变效应的一个很好的度量指标4) 面板数据有助于反映经济体的结构性特征及总量数据相比,面板数据提供了更具微观层次的信息对很多经济 问题的分析而言,某些变量涉及不同观测个体之间的相互关系,例如资本 和劳动在区域和产业之间的流动,技术的溢出,通胀的相互影响等使用 面板数据使得这些结构性变化信息的分析成为可能三、面板数据模型的混合估计既然面板数据有诸多优势,那么,面板数据模型的分析及时间序列或 横截面数据模型有什么不同呢?在(14.1.1)和(14.1.3)中,如果假定个体效应和时间效应为0,那 么,这些模型及我们前面所熟悉的单方程模型没有任何本质上的差异所 以,我们可以直接基于0LS对其进行估计也就是说,我们没有考虑面板 数据的结构特殊性,而直接把各时间序列或各横截面数据混合起来进行估 计,这种估计方法我们称之为面板混合0LS估计。
对于模型(14.1.3),如果假定个体效应和时间效应为 0,则模型可以 表述为:In (PIC) = P +P ln(CSC) + 卩 RLT + 卩 RCI + u0 1 2 3(14.1.5)其中:PIC 二(PIC …PIC …PIC …PIC …PIC )' , PIC it11 1T it N 1 NT it为地区i在第t期的农村人均纯收入也就是说,我们将各个地区的数据堆 积起来,看成是对同一个对象的观测数据其他变量的向量表述也是类似 的如果u为经典误差项,这一模型及第五章所讲的多元线性回归模型没 有任何本质区别,其OLS估计量是线性无偏最优估计量基于中国28个省市自治区(不包括重庆、海南、西藏)1995〜2005 年的面板数据,其面板混合0LS估计的结果为:ln (PIC ) = 7.8158+0.35911ln(CSC ) + 0.2523RLT -0.0104RCIit it it it(14.1.6)t统计值202.273017.25205.7464-3.1736p值 0.00000.00000.00000.0017r 2 = 0.8409R 2 = 0.8393但是,对面板数据而言,把个体效应和时间效应假定为0一般是不符 合经济现实的,尤其是个体效应。
我们很难想象各地区农村居民的消费特 征不存在差异性当我们考虑个体效应及时间效应时,我们会发现,面板 数据在为我们带来更多信息和便利的同时,也带来了一些新的问题§14.2 固定效应及随机效应面板数据模型的一般形式可以表述为:Y =p +p X + …+p X +£it 0 1 1it K Kit it(14.2.1)£ =卩+尢+ uit i t iti = 1,2,…,N t = 1,2,…,T其中:u为经典误差项E(卩)二0 , E(九)二0 , E(R u )二0, E(九u )二0it i t i it t it我们已经知道,及时间序列数据或横截面数据的单方程模型相比,面板数据模型唯一的不同之处就是存在个体效应R和时间效应九根据R和九及i t i t 模型解释变量是否相关,面板数据的个体效应和时间效应又分为两种情 形:固定效应和随机效应如果个体效应卩及模型中的解释变量是相关的,我们就称这种个体效i应是固定效应(Fixed Effect)反之,如果个体效应卩及模型中的解释i变量不相关,我们称之为随机效应(Random Effec t)同样地,如果时间效应九及模型中的解释变量是相关的,我们就称这t种时间效应是固定效应。
反之,则为随机效应例如:在模型(14.1.1)中,如果个体效应卩及收入Y相关,时间效i it应九及收入Y不相关,那么,该模型的个体效应是固定效应,时间效应是t it随机效应如何理解固定效应和随机效应的含义呢?当个体效应及解释变量相关时,因为解释变量反映观测个体的个性化 特征,所以,此时的个体效应反映了观测个体的个性化特征或者说,此 时个体效应的差异及观测个体的特征有内在的联系,所以,我们可以称这 种效应是“固定”的相反,如果个体效应及解释变量不相关,则说明个 体效应的差异及观测个体的特征没有显著的内在联系,在某种程度上,这 种个体差异有可能是“随机”产生的同样,时间效应的固定效应是指时间效应在时间上的差异是及特定观 测时间的经济背景有内在联系,而其随机效应则。












