
第14章自相关.ppt
47页一、一、自相关的涵义自相关的涵义二、二、自相关产生的后果自相关产生的后果三、自相关检验三、自相关检验四、自相关模型的经济计量方法四、自相关模型的经济计量方法五、案例五、案例第第14章章 自相关自相关 :如果误差项相关会有什么结果1 自相关的性质•自相关一词可以定义为,“在时间(如在时间序列数据中)或者空间(如在横截面数据中)按顺序所列观察值序列的各成员间存在着相关”•正如异方差的产生通常是与横截面数据有关,自相关问题通常是与时间序列数据有关(也即,数据按照时间顺序排列)•根据上述定义,在横截面数据中也可能产生自相关问题,这种情况下,称为空间相关(spatial correlation)•在古典线性回归模型中假定在扰动项ui中不存在自相关用符号表示为:E(uiuj)=0 i≠j (1 2 - 1)•也就是说,两个不同误差项ui和uj的乘积的期望为零•简单地说,古典模式假定任一观察值的扰动项不受其他观察值的扰动项的影响•例如,在分析家庭消费支出与家庭收入的横截面数据时,一个家庭收入增加对其消费支出的影响并不会影响另一个家庭的消费支出•但是如果存在这种依赖关系(家庭之间的相互影响),便产生了自相关问题。
用符号表示,E(uiuj)≠0 i≠j 自相关的涵义自相关的涵义 如果对于不同的样本点,随机误差项之间不再如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现是不相关的,而是存在某种相关性,则认为出现了了序列相关性序列相关性 对于模型 Yi=0+1X1i+2X2i+…+kXki+i i=1,2, …,n随机项互不相关的基本假设表现为 Cov(i , j)=0 ij, i,j=1,2, …,n或称为一阶列相关一阶列相关,或自相关自相关(autocorrelation)其中:被称为自自协协方方差差系系数数(coefficient of autocovariance)或一一阶阶自自相相关关系系数数(first-order coefficient of autocorrelation) i是满足以下标准的OLS假定的随机干扰项:如果仅存在 E(i i+1)0 i=1,2, …,n 自相关自相关往往可写成如下形式: i=i-1+i -1<<1 由于序列相关性经常出现在以时间序列为样本的模型中,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标因此,本节将用下标t代表代表i。
自相关的来源二、设定偏误:应含而未含变量的情形三、设定偏误:不正确的函数形式例如:如果真实的回归方程形式为:其中,因变量为边际成本,解释变量为产出及产出的平方如果作回归是选用的是:则会出现自相关,其形式为:四、蛛网现象许多农产品的供给表现出一种所谓的蛛网现象例如,供给价格的反应要滞后一个时期今年种植的作物是受去年流行的价格影响的,因此,相关的函数形式是:这种现象就不能期望扰动项是随机的五、滞后效应例如:在消费支出对收入的时间序列分析中,当期的消费支出除了依赖于其他变量外,还依赖于前期的消费支出即:如果作回归是选用的是:则会出现自相关 计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果: 自相关产生的后果自相关产生的后果 1 1、参数估计量非有效、参数估计量非有效 因为,在有效性证明中利用了 E(NN’)=2I 即同方差性和互相独立性条件 而且,在大样本情况下,参数估计量虽然具有参数估计量虽然具有一致性,但仍然不具有渐近有效性一致性,但仍然不具有渐近有效性。
2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立 其他检验也是如此 3、模型的预测失效模型的预测失效 区间预测与参数估计量的方差有关,在区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准方差有偏误的情况下,使得预测估计不准确,预测精度降低确,预测精度降低 所以,所以,当模型出现序列相关性时,它的当模型出现序列相关性时,它的预测功能失效预测功能失效 然然后后,通过分析这些“近近似似估估计计量量”之间的相关性,以判断随机误差项是否具有序列相关性 序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同: 基本思路基本思路: : 自相关的检验自相关的检验 (一)图示法(一)图示法(二)杜宾(二)杜宾- -瓦森(瓦森(Durbin-WatsonDurbin-Watson))检验法检验法 D-W检检 验验 是是 杜杜 宾宾 (( J.Durbin)) 和和 瓦瓦 森森 (G.S. (G.S. Watson)Watson)于于19511951年年提提出出的的一一种种检检验验序序列列自自相相关关的的方方法法,该方法的假定条件是该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式: i=i-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项DW检验(检验(Durbin-Watson)的使用条件)的使用条件((1)、回归模型中含有截距项;)、回归模型中含有截距项;((2)、解释变量是非随机的(因此与随机扰动项不)、解释变量是非随机的(因此与随机扰动项不相关)相关)((3)、随机扰动项是一阶自相关;)、随机扰动项是一阶自相关;((4)、回归模型中不把滞后因变量做解释变量;)、回归模型中不把滞后因变量做解释变量;((5)、没有缺落数据,样本比较大。
没有缺落数据,样本比较大 该统计量该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到精确的分布很难得到 但是但是,他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关 杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构如下造统计量: D.W. 统计量统计量: D.W检验步骤检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断 若 0 证明:证明: 展开D.W.统计量: (*)如果存在如果存在完全一阶正相关完全一阶正相关,即,即 =1,则,则 D.W. 0 完全一阶负相关完全一阶负相关,即,即 = -1, 则则 D.W. 4 完全不相关完全不相关,, 即即 =0,则,则 D.W. 2这里,为一阶自回归模型 i=i-1+i 的参数估计 如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型 最常用的方法是广义最小二乘法广义最小二乘法(GLS: Generalized least squares)和广义差分法广义差分法(Generalized Difference)四、自相关的经济计量方法四、自相关的经济计量方法 1 1、广义最小二乘法、广义最小二乘法 对于模型 Y=X + 如果存在序列相关,同时存在异方差,即有 是一对称正定矩阵,存在一可逆矩阵D,,使得 =DD’变换原模型: D-1Y=D-1X +D-1 即 Y*=X* + * (*)(*)式的OLS估计: 这就是原模型的这就是原模型的广义最小二乘估计量广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。 是无偏的、有效的估计量 该模型具有同方差性和随机误差项互相独立性该模型具有同方差性和随机误差项互相独立性: 如何得到矩阵如何得到矩阵 ?? 对 的形式进行特殊设定后,才可得到其估计值 如设定随机扰动项为一阶序列相关形式 i=i-1+i 则 2 2、广义差分法、广义差分法 广广义义差差分分法法是将原模型变换为满足OLS法的差分模型,再进行OLS估计如果原模型存在可以将原模型变换为: 该模型为广义差分模型广义差分模型,不存在序列相关问题可进行OLS估计 注意:• 广义差分法广义差分法就是上述广义最小二乘法广义最小二乘法,但是却损失了部分样本观测值 如:如:一阶序列相关的情况下,广义差分是估计这相当于去掉第一行后左乘原模型Y=X + 即运用了GLS法,但第一次观测值被排除了 3 3、随机误差项相关系数的估计、随机误差项相关系数的估计 应应用用广广义义最最小小二二乘乘法法或或广广义义差差分分法法,,必必须须已已知知随随机误差项的相关系数机误差项的相关系数 1, 2, … , L 。 实实际际上上,,人人们们并并不不知知道道它它们们的的具具体体数数值值,,所所以以必必须首先对它们进行估计须首先对它们进行估计 常用的估计方法有:常用的估计方法有:• 科克伦科克伦-奥科特奥科特(Cochrane-Orcutt)迭代法迭代法• 杜宾杜宾(durbin)两步法两步法 (1)科克伦科克伦-奥科特迭代法奥科特迭代法 以一元线性模型为例: 首先首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i求出i新的“近拟估计值”, 并以之作为样本观测值,再次估计 i=1i-1+2i-2+Li-L+i 类似地,可进行第三次、第四次迭代类似地,可进行第三次、第四次迭代 关于迭代的次数,可根据具体的问题来定 一般是事先给出一个精度,当相邻两次1,2, ,L的估计值之差小于这一精度时,迭代终止 实践中,有时只要迭代两次,就可得到较满意的结果。 两次迭代过程也被称为科科克克伦伦-奥奥科科特两步法特两步法((2)杜宾)杜宾(durbin)两步法两步法 该方法仍是先估计该方法仍是先估计 1, 2,, l,,再对差再对差分模型进行估计分模型进行估计 第一步第一步,变换差分模型为下列形式进行OLS估计,得各Yj(j=i-1, i-2, …,i-l)前的系数1,2, , l的估计值五、案例五、案例 某国进口贸易额IM与国民生产总值GDP的数据见表试建立进口贸易额IM与国民生产总值GDP的线性回归模型资料见下页 进口贸易额与国民生产总值的数据序号 IM(y)GDP (x)序号IM (y)GDP (x)1374821777115669281342371122418125628290913401022308135736294504400423319145964307055415124180156501323726456924893166549331527458225310176705337648469725799187104344119475325886197609354291050622686820810036200单位:百万英镑应用最小二乘法得到如下回归方程: s(b)=(248.65) (0.087) R2 = 0.983 d =0.9337给定α= 0.05,查显著性水平为0.05,观测值个数为20及解释变量个数为1的D-W分布表,得到临界值dL=1.20 dU=1.41因为 d<dL,所以随机项u存在一阶正自相关自相关的处理自相关的处理 —杜宾二步法杜宾二步法 ⑴ 估计一阶自相关系数作et关于et-1的线性回归,得到可得 = 0.53⑵令 =0.53,做以下变换对 关于 的线性模型做最小二乘估计,得 补救措施•对模型作变换,使得变换后模型的误差项是序列独立的,然后再用O L S法进行估计,则得到最优线性无偏估计量。 •对变换后的模型使用O L S得到的估计量称为广义最小二乘(generalized least squares)估计量( G L S )在处理异方差问题时,我们也应用了G L S,只不过在那里,我们称为W L S (加权最小二乘法)•变换后的方程称为广义差分方程(generalized difference equation)如何估计p•p = 1:一阶差分法•从杜宾-瓦尔森d统计量中估计•从O L S残差et中估计p小结•本章要点如下:•(1) 在存在自相关情形下O L S估计量,尽管是无偏的,但不是有效的简言之,它们不是最优线性无偏估计量•(2) 在马尔可夫一阶自回归, A R ( 1 )假定下,通常计算的O L S估计量的方差和标准差可能存在着严重的偏差•(3) 结果,标准t显著性检验和F显著性检验可能存在着严重的误导性•(4) 因此,重要的是诊断自相关我们考虑了如下三种方法:•a. 残差图形检验•b .游程检验•c .杜宾-瓦尔森d检验•(5) 如果发现了自相关,通过适当的变换可消除自相关习题•12.1 简要解释下列名词:–(a) 自相关–(b) 一阶自相关–(c) 空间相关•12.2 马尔可夫一阶自相关假定有何重要意义?•1 2 . 3 在A R ( 1 )假定下,古典线性回归模型的假定之一,总体概率分布函数中的误差项不相关的后果是什么?•1 2 . 4 在存在A R ( 1 )自相关的情形下,什么估计方法能够产生B L U E估计量?简述这个方法的具体步骤。 •12.5 在存在A R ( 1 )的情形下,估计自相关参数有哪些不同的方法?•12.6 诊断自相关有哪些不同的方法?说明每一种方法所隐含的假设•12.7 杜宾-瓦尔森d统计量虽广泛使用,但有什么缺陷?•12.8 判断正误并说明理由–(a) 当存在自相关时,O L S估计量是有偏的并且也是无效的–(b) 在形如方程( 1 2 - 8 )的自回归模型中,也就是模型中的一个解释变量是被解释变量的一期滞后值,此时杜宾-瓦尔森d统计量检验是无效的–(c) 杜宾-瓦尔森d统计量检验假设误差项的同方差–(d) 消除自相关的一阶差分变换假定自相关系数必须等于1–( e )两个模型,一个是一阶差分形式,一个是水平形式,这两个模型的R2值是不可以直接比较的。












