好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

计量经济学金玉国第五章.ppt

85页
  • 卖家[上传人]:cn****1
  • 文档编号:610555079
  • 上传时间:2025-05-28
  • 文档格式:PPT
  • 文档大小:845KB
  • / 85 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 单击此处编辑母版标题样式as,,单击此处编辑母版文本样式 sdfsdssd,,第二级,,第三级,,第四级,,第五级,,,,第,*,页,机动 目录 上页 下页 返回 结束,第五章,回归模型中的 变量问题,第一节,解释变量为随机变量,,第二节,多重共线性问题,,第三节,虚拟变量,,第四节,滞后变量,,一、估计量的渐近性质,,二、随机解释变量模型OLS估计特性,,,三、随机解释变量模型的经济计量方法,,四、案例,,第一节,随机解释变量,,,,,要求满足古典假设4,:,随机项,u,与解释变量,x,之间不相关,即:,,,Cov,(,x,i,,,u,i,)=0,i,=1,2,,…,,n,,,只要,解释变量,x,1,,,x,2,,…,,x,k,是确定性变量,则上述假设自动满足对于模型,,i,=1,2,,…,,n,,,,,,,在许多经济现象中,自变量的非随机性假定有时是不符合实际的因为,,,⑴ 许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能是确定的,而是随机的⑵ 又由于随机项包含了模型中略去的解释变量,而略去的解释变量同模型中保留的解释变量往往是相关的。

      ⑶ 自回归模型中,因变量作为解释变量也必定是随机变量了因此,我们必须对模型中的解释变量为随机变量且与随机项相关的情形进行讨论如果存在一个或多个随机变量作为解释变量,则称原模型出现,随机解释变量问题,下面我们就对解释变量为随机变量且与随机项相关的情形进行讨论一、估计量的渐近性质,,线性、无偏性和有效性是评价一个估计量优劣的标准在有的情况下,小样本的估计量不具有某种统计特性,但随着样本容量的增大,估计量逐渐有了这种统计性质,此时称之为估计量的渐近统计性质1 .渐近无偏性,,2. 渐近一致性,,,,,1. 渐近无偏性,记 为样本容量为,n,时参数,θ,的估计量,如果满足,则称 为,θ,的渐近无偏估计量有时,在小样本的情况下, 是有偏的,但随着样本容量的逐步增大, 与,θ,的系统偏差越来越小,逐渐趋于0通过增加样本容量,可以改善参数估计的精度2. 渐近一致性,对真实值,θ,在样本容量为,n,时的估计值 ,如果当样本容量,n,充分大时, 值趋近于真值,θ,的概率接近于1即:,则称 为,θ,的一致估计量可以证明: 为,θ,的一致估计量,当且仅当:,简记为:,,,概率极限有以下运算法则:,,c为一常数,,,二、随机解释变量模型OLS估计特性,以一元线性回归模型为例 说明。

      设给定的模型为,,采用离差形式即为:,式中:,不管自变量,x,是否是随机变量,对上式应用,OLS,,参数的估计量都是,,,我们分下列四种情况进行讨论,,1.,x,是非随机变量,,x,与,u,自然不相关,最小二乘估计量是无偏的2.,,x,是随机变量,但,x,与,u,不相关,且相互独立,,最小二乘估计量仍然是无偏的3.,x,是随机变量,,x,与,u,不相关,但也不独立,,最小二乘估计量是有偏的但由于Cov(,x,,,u,)=0, 即,对式(4.70)两边取概率极限:,说明最小二乘估计量具有一致性也就是说,如果,x,是随机变量,且,x,与,u,不相关但也不独立,虽然小样本的无偏性得不到满足,但在样本容量增加时,OLSE会逐渐逼近真实的总体参数,即在样本足够大时,OLSE仍然是有意义的4.,x,是随机变量,,x,与,u,相关,即使在大样本条件下,仍然存在,对式(4.68),设 ,,x,与,u,之间的相关系数为,ρ,,则式(4.75)变为:,由此可以看出, 是,β,1,的非一致估计量这时OLS失效,必须引进其他方法估计参数和进行统计推论推论模型中出现随机解释变量且与随机误差项相关时,,OLS,估计量是有偏的。

      如果随机解释变量与随机误差项异期相关,则可以通过增大样本容量的办法来得到一致的估计量;,,但如果是同期相关,即使增大样本容量也无济于事这时,最常用的估计方法是,工具变量法,(Instrument variables)三、随机解释变量模型的经济计量方法,,,,1、工具变量的选取,工具变量法的基本思路,:当解释变量与随机项相关时,则寻找另一个变量,该变量与随机解释变量高度相关,但与随机误差项不相关,则称该变量为工具变量,用其替代随机解释变量选择为工具变量的变量必须满足以下条件:,,(1)工具变量必须具有实际经济意义;,,(2)与所替代的随机解释变量高度相关,但与随机误差项不相关;,,(3)与模型中其它解释变量不相关,以避免出现多重共线性;,,(,4,)模型中多个工具变量之间不相关2、工具变量的应用,以一元回归模型的离差形式为例说明如下:,用,OLS,估计模型,,由 可得:,用,,去乘模型 两边、对,i,从1到,n,求和得到:,由古典假定,u,和,x,不相关,即,Cov(,u,,,x,)=0,,因此有:,(4.77),利用该条件就可以略去,(4.77)等式右边的第二项,将,β,1,用,,代替也得到正规方程组。

      如果,u,与,x,相关,则 ,普通最小二乘法失效不能用,,去乘模型 两边,需要另寻找一个变量z,,,z,与,x,高度相关而与,u,不相关,,z,叫做,工具变量,用,,去乘模型 两边、对,i,从1到,n,求和得到:,由于,z,和,u,不相关,即,Cov(,u,,,z,)=0,,因此有:,利用该条件就可以略去,上述等式右边的第二项,将,β,1,用,,代替也得到:,,,从而得到工具变量法估计量:,然后由公式 ,得到,β,0,的,估计值 i,=1,2,,…,,n,如果,x,j,(,j,=1,2,…,,k,),与随机项,u,不相关,用最小二乘原理可得到正规方程组:,对于多元线性回归模型,设模型为:,,解得,:,=,(,X,T,X,),-1,X,T,Y,,,但当,x,j,(,j,=1,2,…,,k,),与随机项,u,相关,即,Cov(,x,j,,,u,),≠,0,或,,,普通最小二乘法失效,此时可采用工具变量法设,x,j,(,j,=1,2,…,,k,)的工具变量为,z,j,,即每一个解释变量都对应一个工具变量,根据工具变量应满足的条件,可得:,,将关系式,:,i,=1,2,,…,,n,代入上式得,:,,,当,,j,=1,2,…,,k,时,上式即可分解为,k,个方程式,与上述正规方程组的第一个方程一起就组成了由(,k,+1)个方程组成的方程组,利用样本数据求解便得到参数的工具变量法的估计量。

      也可将此方程组转化为矩阵的形式求解可见,工具变量法实际上是一种矩方法参数的工具变量估计量无论对一元还是多元的模型都具有有偏且一致的统计性四、案例,,下页表中,x,代表国内生产总值,,y,代表消费,,z,代表投资用表中所提供的某地的三项指标的资料说明工具变量的使用方法国内生产总值、消费、投资数据,年,,份,x,y,,z,年份,x,y,Z,1,7164.3,4694.5,2468.6,9,25863.6,15952.1,9636.0,2,8792.1,5773.0,3386.0,10,34500.6,20182.1,12998.0,3,10132.8,6542.0,3846.0,11,47110.9,27216.2,19260.6,4,11784.0,7451.2,4322.0,12,58510.5,33635.0,23877.0,5,14704.0,9360.1,5495.0,13,68330.4,40003.9,26867.2,6,16466.0,10556.5,6095.0,14,74894.3,43579.4,28457.6,7,18319.5,11365.2,6444.0,15,79853.3,46405.9,30396.0,8,21280.4,13145.9,515.0,,,,,单位:亿元,,,设消费,y,与国内生产总值,x,之间具有线性关系,可建立如下模型:,,由于消费,y,和国内生产总值,x,与随机项,u,相关,而投资,z,与随机项,u,无关,与国内生产总值x高度相关,故可用,z,作为国内生产总值,x,的工具变量。

      参数估计如下:,= 0.568051,876.010088,则样本回归模型为:,,,第二节 多重共线性,一、多重共线性的含义,,二、产生多重共线性的原因,,三、多重共线性引起的后果,,四、多重共线性的检验,,五、消除多重共线性的方法,,六、案例,,,,,一、多重共线性的含义,,如果某两个或多个解释变量之间出现了某种相关关系,则称解释变量之间存在,多重共线性(,Multicollinearity),对于模型,,,y,i,=,,0,+,1,x,1,i,+,2,x,2,i,++,k,x,ki,+u,i,,i,=1,2,…,,n,,其基本假设之一是解释变量是互相独立的,即要求,Rank(,X,)=,k,+1,如果存在不全为零的常数,,,1,,,,,2,, … ,,,,k,使得:,,,,,1,x,1,i,+,,,2,x,2,i,+…+,,,k,,x,ki,=0,i,=1,2,…,,n,,,成立,则称为解释变量间存在,完全共线性,(perfect multicollinearity),对于多元线性回归模型:,解释变量的线性相关性分,完全线性相关,和,不完全线性相关或接近线性相关,两类。

      在矩阵表示的线性回归模型:,Y = X,,+ u,,中,,完全共线性,指:,,rank(,X,)<,k,+1,,即,中,至少有一列向量可由其他列向量(不包括第一列)线性表示如:,x,2,i,=,,x,1,i,,则,x,2,对,y,的作用可由,x,1,代替,当存在不完全多重共线性时,存在存在一组不同时全为零的常数,,,1,,,,,2,, … ,,,,k,使得下式,,,,0,+,,1,x,1,i,+,,,2,x,2,i,+…+,,,k,,x,ki,+,,v,,= 0,i,=1,2,…,,n,(5.20),,,成立,其中,v,为随机误差项,则称解释变量间存在,,近似共线性(approximate multicollinearity)或交互相关(intercorrelated)注意:,,,完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性综上所述,多重共线性就是指解释变量之间存在完全的线性关系或接近的线性关系,,,二、 多重共线性产生的原因,时间序列样本:,经济,繁荣时期,,各基本经济变量(收入、消费、投资、价格)都趋于增长;,衰退时期,,又同时趋于下降。

      横截面数据:,生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小,一般地,产生多重共线性的主要原因有以下三个方面:,1.经济变量相互关系复杂,有共同变化趋势,,,2.利用截面数据建立模型也可能出现多重共线性,(1)对于截面数据,许多变量变化与发展规模相关,会呈现出共同增长的趋势,例如资本、劳动力、科技、能源等投入与产出的规模相关,这时容易出现多重共线性2)有时如果出现部分因素的变化与另一部分因素的变化相关程度较高时,也容易出现共线性如用粮食产量对化肥用量、水浇地面积、农业投入资金进行回归,发现回归效果较差,原因是农业资金的影响已经通过化肥用量、水浇地面积两个因素体现出来3.滞后变量的引入,,在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系例如,,消费=,f,(当期收入,, 前期收入),,显然,两期收入间有较强的线性相关性4.样本资料的限制,一般经验:,,时间序列数据,样本:简单线性模型,往往存在多重共线性截面数据,样本:问题不那么严重,但多重共线性仍然是存在的由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性三、多重共线性的后果,(一)完全多重共线性,,1.多元线性回归模型中如果存在完全的多重共线性,则参数的最小二乘估计量是不确定的。

      对于二元线性回归模型,,如果有,,则有,,我们只能估计出系数的线性组合 的样本估计值,而无法得到 和 的具体估计又由于参数的OLSE为,,,,,在完全多重共线性时, 不存在,无法估计 2.参数估计量的方差为无穷大,,,如果有 ,则,,同理,可以证明 1.,估计结果不好解释,,参数估计值的大小往往与预期相去甚远,甚至可能连回归系数的符号都相反,回归结果无法得到合理解释多重共线性产生的影响具有一定的不确定性在一些模型中,程度并不高的共线性可能带来了严重的后果,而在另一些模型中,较高程度的共线性却没有造成不利影响,甚至参数估计值的标准差也不大一般的,模型中存在多重共线性,便有造成不利后果的可能二)不完全多重共线性,,,,,,,2.参数估计值的方差增大,对于 ,,用OLS法估计回归系数 可以证明,参数的估计量方差和协方差分别是:,,,,,,,其中,,r,12是 、 的样本相关系数,被称为方差扩大因子(Variance Inflation Factor,,VIF,)。

      3.参数估计的置信区间变大,存在多重共线性时,参数估计值的方差增大,其标准误差也增大,导致总体参数的置信区间也随之变大4.假设检验容易作出错误的判断,,,在对回归系数的假设检验中,使用了,t,统计量,在高度共线性时,参数估计值的方差增加较快,会使得,t,值变小,而使本应拒绝的原假设被错误地接受同时,当多重共线性严重时,往往造成样本决定系数较高,,F,检验也高度显著,但对各个参数单独的,t,检验却不显著,不同检验的结果互相矛盾注意:,,除非是完全共线性,多重共线性并不意味着任何基本假设的违背;,,因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息多重共线性检验的任务,是,:,,,(1)检验多重共线性是否存在;,,(2)估计多重共线性的范围,即判断哪些变量之间存在共线性多重共线性表现为解释变量之间具有相关关系,所以,用于多重共线性的检验方法主要是统计方法四、多重共线性的检验,,,(一)直观判断法,,1. 散点图法含有两个解释变量的模型;散点图2. 相关系数法计算两个解释变量之间的简单相关系数。

      注:多个解释变量间,即使两两间呈低度线性相关,但多个解释变量之间可能呈现出较强的共线性),,,3.,经验判断法考察最小二乘估计值的符号和大小是否与实际经济情况或经济理论相符;另外,当增加或剔除一个解释变量,或者改变一个样本观测值时,回归参数的估计值发生较大变化,往往预示着回归方程可能存在严重的多重共线性 4.,“经典”判断法多重共线性的“经典”特征是,R,2,较高,但参数检验值显著的不多,,如果一个回归分析结果中存在这一特征,则应考虑其是否存在多重共线性的问题5. Klein判别法先计算多重样本决定系数,,,然后计算解释变量间的简单相关系数,r,xl,,xj,若有某个,,,r,xl xj,,,>,R,2,则,xl,,,xj,间的多重共线性对回归模型是有害的二)自变量之间的复决定系数和方差扩大因子,,设解释变量为,k,个,即,x,1,,,x,2,,… ,,x,k,我们分别以其中的一个对其它所有的解释变量进行回归,得,k,个回归方程:,对每个回归方程求其决定系数分别为:,在这些决定系数中寻其最大而且接近于1者,比如说,R,j,2,最大,则可以判定解释变量 与其它解释变量中的一个或多个相关程度高,因此就使得回归模型出现高度多重共线性。

      计量经济学中在检验多重共线性时,往往称(,1-,R,j,2,)为自变量,x,j,的容忍度,(Tolerance),其倒数为,方差扩大因子,(Variance Inflation Factor,简记为VIF),即:,,,,,现以二元线性模型,,y,i,=,,0,+,,1,x,1,i,+,2,x,2,i,+u,i,,为例:,恰为,x,1,与,x,2,的线性相关,,系数的平方,r,2,由于,r,2,,,1,,故,1/(1-,r,2,),1,,,多重共线性使参数估计值的方差增大,,,1/(1-,r,2,),为,方差扩大因子,(Variance Inflation Factor, VIF),当,完全不共线,时,,r,2,=0,,当,近似共线,时,,0<,r,2,<1,当,完全共线,时,,r,2,=1,,,,,注:,,,也可以用,k,个自变量所对应的方差扩大因子的平均数来度量多重共线性当模型中全部,k,个自变量所对应的方差扩大因子的平均数大于1时,就表明存在严重的多重共线性经验表明,当,VIF,j,≥10时,自变量,x,j,与其它自变量之间的多重共线性就非常大了,以至于足以影响到OLSE。

      可见,一个自变量与其他自变量的复决定系数越大,即多重共线性越严重,会造成回归系数的OLSE的方差越大,所以我们把VIF,j,称为“方差扩大因子”,它可以反映多重共线性的严重程度三)利用不包括某一解释变量所构成的回归方 程之决定系数,,设多元线性回归模型为以下函数形式:,设其样本决定系数为,R,2,假定依次缺一个解释变量进行回归,则可得到,k,个回归方程 其中,R,j,2,为缺少解释变量,x,j,的回归方程之决定系数,对应的样本决定系数分别为 :,,,在这些决定系数中选取一个最大者比如说,R,j,2,,则,R,j,2,与,R,2,的差为最小,这样解释变量,x,j,从模型中去掉,对样本决定系数的影响不大,由此说明了解释变量,x,j,对因变量的解释能力已由其它解释变量代替了,从而表明,x,j,可能是其它解释变量的线性组合,因此可以判定解释变量中包含,x,j,引起了多重共线性四) 条件指数,,,k,个自变量(不包含常数项)的样本数据构成一个,n,×,k,的矩阵,X,,若自变量间存在共线性,则称,X,为病态的,为一个,k,×,k,的方阵,其特征根由大到小排列 ,依次快速递减,存在非常小的特征根(并且有几个共线关系,就有几个很小的特征根)。

      定义条件数为:,,即,最大特征根为最小特征根的倍数经验判断法则是:若,K,<100,则认为多重共线性的程度很小;若100≤,K,≤1000,则认为多重共线性的程度中等或比较严重;若,K,>1000,则认为多重共线性的程度非常严重五、消除多重共线性的方法,模型中存在多重共线性,是不是一定不好呢?这要视模型的具体用途而定如果模型只是用来进行预测,只要多重样本决定系数(,R,2,, )足够大即可,无需消除多重共线性但如果模型是用来进行结构分析和政策评价,由于多重共线性影响到每个自变量系数估计的正确性和有效性,所以应设法消除多重共线性的影响,确保模型的可用性一)增加样本观测值,,如果多重共线性是由样本引起的(例如测量误差或偶然的样本),但解释变量的总体不存在多重共线性,则可以通过收集更多的观测值增加样本容量,避免或减弱多重共线性对于时间序列资料就是增大观测次数,对于截面数据资料就是增加观测对象,或者把时间序列资料与截面数据资料结合起来使用将增加,,r,12,趋向于总体相关系数,是某一个确定的值,从而 将会减少,这样就会提高估计值 的精度。

      从上两式可以看出,当增大样本容量时,则,注意:,,当解释变量总体存在多重共线性时,增加样本容量也无助于减轻多重共线的程度已知:,,,,(二)删去不重要的解释变量,,对待严重的多重共线性问题,一个最简单的解决办法就是删去那些产生多重共线性、对因变量影响不大且人们认为不重要的解释变量,使模型中剩下那些对因变量起重要作用的解释变量,然后对仅包含重要解释变量的模型应用普通最小二乘法但应注意的是,由于把删去的解释变量对因变量的影响归入随机项中,有可能使随机项不满足零均值的假设,这时所得的参数估计值可能是有偏的,即产生确定性偏倚三)利用“先验”信息,,先验信息既包括从经济理论也包括从实际统计资料中获得的解释变量之间关系的信息如果我们研究的回归模型存在多重共线性,而线性相关的解释变量之间的关系可由事前信息得到则只要把事前知道的关系包含进回归模型中,多重共线性就会消失例如,C—D,生产函数,,y,=,A L,β,,K,α,e,u,,其中,,y,为产出,,K,为资本,,L,为劳动力,,A,,,α,,,β,,为参数将上式转化为对数形式:,,ln,y,= ln,A,+,α,ln,K,+,β,ln,L + u,,因为资金和劳动力之间是高度相关的,所以,ln,K,和,,ln,L,之间也是高度相关的,对数模型存在着多重共线性。

      利用,α,,+,β,,=1将对数模型转化为:,式中,,y/L,为人均产出,,K/L,为人均资本量上式即为人均单位产出对人均资本量的一元回归模型,多元回归存在的多重共线性就被消除了又如,消费函数为:,,,y,为消费支出,,x,1,为收入,,x,2,为财富就变为一元回归模型,多重共线性就消除了从收入与财富的关系来看,是高度相关的但根据大量的统计数据可以总结出:,将该关系式代入,则上式可化为:,令:,则:,,,,,首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计例:,对于中国家用轿车需求模型,,(四)横截面数据与时间序列数据并用,目的是要估计价格弹性 和收入弹性 在时间序列分析中,价格和收入变量一般都有高度共线性的趋势托宾提出了解决此问题的一种方法即如果拥有关于消费者定点追踪的横截面数据,如城镇或农村居民住户调查数据,就可能可靠地估计收入弹性 令收入弹性的横截面估计为 就可以将前述时间序列回归写成,,其中, 五)变量变换,,有时通过对模型中变量进行变换能够实现降低共线性的目的。

      常用的变量变换方式有:,,,使用相对指标,,,将名义数据转换为实际数据,,,将小类指标合并成大类指标,,,(六)变换模型的形式,有时作为解释变量的某些经济变量之间出现了高度相关,但当我们的研究目的是为了预测,并不需要区分这些相关的解释变量单独对因变量的影响时,我们可以根据问题的需要对原模型加以变形,使新的模型不再出现多重共线性例如,某产品的销售量y取决于其出厂价格,x,1,、市场价格,x,2,和市场总供应量,x,3,,设定模型为:,,,通常,x,1,、,x,2,、,x,3,是高度相关的,如果研究的目的主要是为了预测某厂该产品销售量,则可以用相对价格,x,1,/,x,2,代替,x,1,、,x,2,对,y,的影响, 采用 ln(,x,1,/,x,2,)为解释变量,建立如下对数回归模型:,从而克服了,x,1,与,x,2,的相关性七)逐步回归法,,首先计算被解释变量对每一个解释变量的回归方程,这些回归方程叫做,基本回归方程,对每一个基本回归方程进行统计检验,并根据经济理论分析这些回归方程,从中选出最合适的基本回归方程,然后再逐一增加其它的解释变量,重新再作回归根据这个新加的解释变量的,边际贡献,(样本决定系数的增加量)和标准差,并考察对每个回归系数的影响,作如下的分析判断:,,,,,第一,,如果新加进的解释变量,改进了,R,2,,并且其它回归系数在统计上仍是显著的,那么,就可以认为新加进去的解释变量是有用的,作为模型中的解释变量予以保留。

      第二,,如果加进去的解释变量,未能改进,R,2,,对其它回归系数也没有影响,则不作为解释变量第三,、如果新加进的解释变量,不仅改进了,R,2,,,并且,主要是显著地影响了回归系数的,符号,或,数值,,致使某些回归系数达到不能接受的地步,则可断言产生了严重的多重共线性六、案例,,对表5.4的数据,用逐步回归法筛选解释变量建立中国电信业务总量的计量经济模型经初步分析,认为影响中国电信业务总量变化的主要因素是邮政业务总量、中国人口数、市镇人口占总人口的比重、人均GDP、全国居民人均消费水平第二节 虚拟变量,虚拟变量含义,,,虚拟变量单独使用,,,虚拟变量与数值型变量一起使用,,,虚拟变量表现为多种状态,,,一、虚拟变量含义,,,不能用数值表示的现象特征,如企业的所有制形式、所属行业;职工的性别、学历、职务以及战争、天灾、人祸等非数值变量在计量经济学中,我们把这些“变量”叫虚拟变量量化虚拟变量的方法是当虚拟变量起作用时赋其值为“1”,不起作用时赋其值为“0”,这样就可以把表现某种特性的“变量”变为能用数值表示的变量了,这样才可以对模型进行研究虚拟变量既可以单独作为解释变量使用,也可以与一般变量一起使用;既适用于时间序列资料,也适用于截面资料。

      例 :研究性别与收入(,y,i,)的关系:我们可以定义虚拟变量,D,i,,,D,i,=0时表示女性,,D,i,=1时表示男性,即:,二、,虚拟变量单独使用的模型,,对于线性回归模型 而言,,,若假设,H,0,:,β,1,=0成立,则说明收入与性别将没有太大关系;若假设,H,0,:,β,1,=0不成立,则说明收入与性别有关例2 研究学历与收入(,y,i,)的关系:可以建立如下模型:,,,现利用收集的10个样本点的资料作回归分析表5.2为10位人士的学历情况与最初参加工作时的起薪起薪(元),,教育,,(1=大学,0=非大学),,起 薪,,(元),,教育(1=大学,0=非大学),,2300,,1500,,1400,,2100,,2500,,1,,0,,0,,1,,1,,1700,,1300,,900,,1700,,2200,,0,,1,,0,,0,,1,,表5.2 起薪与受教育程度数据,,,由结果可知,估计值的t检验值为2.3,查表易得显著不为0,说明学历对收入有着显著的影响,即说明受教育水平不同的两类人群的起薪是不同的。

      由方程可得,大学毕业的起薪均值为2080元,而非大学毕业的起薪均值为1440元,前者比后者高出640元.,最小二乘估计结果:,,,三、虚拟变量与一般变量一起使用的模型,假定一般情况下,计量模型为:,而虚拟变量为:,引入虚拟变量:,,1.仅影响截距的情况,,(5.39),(5.38),,,,模型5.39实际上是两条截距不同、斜率相同的直线的组合,如图5.5这里斜率相同是在模型设定时隐含的假定图5.5 模型5.39结果示意图,,,2.仅影响斜率的情况,模型5.38可改写为:,于是有以下两种情况:,,(5.40),,,这两种情况仅体现在斜率的差异上,用图形表示如图5.6 模型5.40结果示意图,,,x,y,,,3.既影响截距又影响斜率的情况,模型5.38可改写为:,,于是有,,,这两种情况不仅体现在截距的差异上,又体现在斜率的差异上,用图形示意见图5.75.41),(5.42),,,图5.7 模型5.41结果示意图,,,,x,y,,,四、虚拟变量表现为多种状态时的模型,,虚拟变量可表现为多种状态,如文化程度可区分为大学、中学、小学、文盲四种状态,季节可区分为第一季度、第二季度、第三季度、第四季度,等等。

      含此类虚拟变量模型的建立,应避免犯以下,两类错误,:,第一,建立一个虚拟变量,分别用0,1,2,3,… 表示其不同的状态此方法错误在于,它在设定模型时,假定各种状态均值之间差量为固定值,这显然与事实不符第二,建立与状态数相同个的虚拟变量,分别表示各个不同状态例如文化程度区分为大学、中学、小学、文盲四种状态,如果设置四个虚拟变量,即为:,,此方法,错误,在于,这样的模型存在完全的多重共线性问题因为,,,D,1,+,D,2,+,D,3,+,D,4,=1,,这会使得观测值矩阵中虚拟变量所对应的四列相加等于常数项 此类错误称为虚拟变量陷阱假定,第一季度,,第二季度,,第三季度,,第四季度,,对于上述模型可通过引入季度虚拟变量建立如下模型:,,正确的建模方法,是:如虚拟变量有,k,种表现状态,可建立(,k,-1)个虚拟变量下面以季度虚拟变量为例说明建模的方法5.42),,,,此模型中只引入了第二季度、第三季度、第四季度虚拟变量,分别为,D,2,、,D,3,、,D,4,,第一季度并未引入虚拟变量这三个虚拟变量的取值为:,因此有下面的关系式:,,,下面举一个实例说明例5-5,采用模型(5.42),资料由课本181页表(5-9)给出,,y,t,,代表利润(百万美元),,x,t,代表销售额(百万美元),虚拟变量取,D,it,=1(,i,=2,3,4),估计结果如下:,,,,回归结果表明,只有销售额的系数和第二季度的级差截距在5%水平上统计上是显著的。

      因此可下结论说,每年第二季度有某种季节性因素在运作应结合具体的情况分析第二季度的这种季节效应销售额系数0.038告诉我们,在考虑季节效应之后,如果销售额增加(比如说)1美元,则平均利润可望增加约4美分基底或第一季度平均利润水平虽是6688百万美元,而在第二季度中提高了约1323百万美元即达到了8011百万美元分段回归中的虚拟变量应用,,,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.