好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第六章09虚拟变量教学提纲.ppt

24页
  • 卖家[上传人]:yulij****0329
  • 文档编号:141257945
  • 上传时间:2020-08-05
  • 文档格式:PPT
  • 文档大小:576KB
  • / 24 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第一节 虚拟变量(dummy)及其作用,,许多经济变量定量度量的,如:商品需求量、价格、收入、产量等但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的 一、虚拟变量的定义及设置 根据定性因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D虚拟变量主要是用来代表质的因素,但是有些情况下也可以用来代表数量因素如收入” 虽然是“数量”因素,但是为了方便也可以用虚拟变量表示如:,城镇居民 农村居民,销售旺季 销售淡季,政策紧缩 政策宽松,本科以上学历 本科以下学历,一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为1; 比较类型,否定类型取值为0 0和1只是符号而已,不代表高低意义 变量的划分应遵循穷举与互斥原则二、作用:,1、可以描述和测量定性因素的影响 这是计量经济学研究的重点 2、能够正确反映经济变量之间的相互关系,提高模型的精度。

      从经济意义上来说,能够更好地解释现实经济现象 3、便于处理异常数据 当样本资料中存在异常数据时,一般有三种处理方式,一是在样本容量较大的情况下直接剔除异常数据;二是用平均数等方式修匀异常数据;三是设置虚拟变量(即将异常数据作为一个特殊的定性因素):,异常时期 正常时期,2、乘法方式,虚拟变量D与其他解释变量在模型中是相乘关系 Yi=a+bxi+XDi+i 其中:XDi=Xi*Di,上式等价于: 当Di =0时:Yi=a+bxi+i 当Di =1时:Yi=a+(b+)xi+i,以乘法方式引入虚拟变量,可反映定性因素对斜率的影响,系数描述了定性因素的影响程度 3、一般方式 同时用加法与乘法方式引入虚拟变量,然后再利用t检验判断 、是否显著的不等于零,进而确定虚拟变量的具体引入方式表3-列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料在EViews软件的命令窗口中依次键入以下命令: CREATE 8 建立工作文件 DATA 输入需求量、收入数据 SCAT X Y 绘制相关图 操作演示,从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(即中、高收入家庭)的支出情况存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量:,将我国城镇居民的彩电需求函数设成: Yi=a+bxi+ Di+ XDi+i 同时引入加法和乘法方法,再进行t检验。

      DATA D1 输入虚拟变量的值(前三个为0,后五个为1) (由于D是EViews软件的保留字,所以将虚拟变量取名为D1;另外,此时也可以用SMPL和GENR命令直接生成D1变量) GERXD=X*D1生成变量XD LS D1 XD估计需求函数 结果如下图所示:,中高收入家庭 低收入家庭,我国城镇居民彩电需求函数的估计结果为:,、的t检验都是显著的,表明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异,各自的需求函数为:,低收入家庭:,事实上,现阶段我国城镇居民中高收入家庭的彩电普及率已达到百分之百,所以对彩电的消费需求处于更新换代阶段中高收入家庭:,二、虚拟变量的设置原则,1、 一个因素多个类型 对于有m个不同属性的定性因素,应该设置m-1个虚拟变量来反映该因素的影响 例:设公司职员的年薪与工龄和学历有关学历分成三种类型:大专以下、本科、研究生为了反映“学历”这个定性因素的影响,应该设置两个虚拟变量:,而将年薪模型取成(假设以加法方式引入): Yi=a+bxi+ 1D1i+ 2D2i +i,本科 其他,研究生 其他,其等价于:,Yi=a+bxi+ i 大专以下(D1=D2=0) Yi=(a+1)+ bxi+i 本科(D1=1,D2=0) Yi=(a+2)+ bxi+i 研究生(D1=0,D2=1),上图直观地描述了三类年薪函数的差异情况,通过检验、 1 、2的显著性,可以判断学历层次对职员的年薪是否有显著影响。

      2、多个因素各两种类型,如果有m个定性因素,且每个因素各有两个不同的属性类型,则引入 m 个虚拟变量 例如,研究居民住房消费函数时,考虑到城乡的差异以及不同收入层次的影响,将消费函数取成: Yi=a+bxi+ 1D1i+ 2D2i +i 其中y , x分别是居民住房消费支出和可支配收入,虚拟变量,这样可以反映各类居民家庭的住房消费情况:,农村居民 城镇居民,高收入家庭 低收入家庭,城市低收入家庭 (D1=0,D2=0),Yi=a+bxi+i 城市高收入家庭 (D1=0,D2=1) Yi=(a+2) + bxi +i 农村低收入家庭 (D1=1,D2=0) Yi=(a+1) + bxi +i 农村高收入家庭 (D1=1,D2=1) Yi=(a+1 +2) + bxi +i 推广到更一般的情况,如果有些因素有多个属性水平,则参照“一个因素多种类型”的设置原则来设置虚拟变量第三节 虚拟变量的特殊应用,一、调整季节波动 利用季节或月份资料建立模型时,经常存在着季节波动使用虚拟变量可以反映季节因素的影响 例如,利用季度数据分析某公司利润y与销售收入x 之间的相互关系时,为研究四个季度的季节性影响,引入三个虚拟变量(设第1季度为基础类型):,取利润函数为 : Yi=a+bxi+ 1D1i+ 2D2i + 3D3i + i 系数a、1、2、3分别反映了一、二、三、四季度对利润的平均影响程度,根据这些系数的t检验可以判断季节因素对利润是否显著影响。

      第i+1季度 i=1,2,3 其他季度,二、检验模型结构的稳定性,模型结构的稳定性检验主要有两个用途:一是分析模型结构对样本变化的敏感性,如多重共线性检验;二是比较两个(或多个)回归模型之间的差异情况,即分析模型结构是否发生了显著变化 设根据两个样本估计的回归模型分别为: 样本1: Yi=a1+b1xi +i 样本2: Yi=a2+b2xi +i 设置虚拟变量:,估计以下模型: Yi= a1 +b1xi+ (a2 - a1 )Di+(b2-b1)XDi +i 其中,XDi=xi*Di样本2 样本1,利用t检验判断D、XD系数的显著性,可以得到四种检验结果:,(1)两个系数均等于零,即a2=a1,b2=b1,表明两个回归模型之间没有显著差异,称之为“重合回归” (Coincident Regressions) (2)D的系数不等于零,XD的系数等于零,即a2a1,b2=b1表明两个回归模型之间的差异仅仅表现在截距上,称之为“平行回归” (Parallel Regressions) (3)D的系数等于零,XD的系数不等于零,即a2=a1,b2b1表明两个回归模型的截距相同,但斜率存在显著差异,称之为“汇合回归” (Concurrent Regressions) 。

      (4)D、XD的系数均不等于零,即a2a1,b2b1表明两个回归模型完全不同,称之为“相异回归”( Dissimilar Regressions) 第(1)种情况下模型结构是稳定的,其余情况都表明模型结构不稳定三、分段回归,在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映当解释变量x低于某个已知的临界水平x*时,y与x之间是某种线性相关关系,而xx*时又是另一种相关关系.利用虚拟变量可以很好地解决分段回归问题 取虚拟变量为:,分段回归模型设置成: Yi= a +bxi+ (xi - x* )Di+i 其中,x*是已知的临界水平这样各段的函数为: Yi= a +bxi+i xx* 使用虚拟变量既能如实描述不同阶段的经济关系,又未减少估计模型时样本容量,保证了模型的估计精度xx* x

      居民储蓄的增量(YY),国民总收入GNI,城乡居民的储蓄行为表现出了明显的阶段特征:在1996年和2000年有两个明显的转折点 为了分析居民储蓄行为在1996年前后和2000年前后三个阶段的数量关系,引入虚拟变量D1和D2D1和D2的选择,是以1996、2000年两个转折点作为依据,1996年的GNI为66850.50亿元,2000年的GNI为国为民8254.00亿元,并设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型:,其中:,se=(172.1626)(0.0057) (0.0272) (0.0401) t = (-4.8234) (25.1700) (-10.7192) (13.9581),居民人民币储蓄存款年增加额的回归模型分别为:,分析:1996年以前收入每增加1亿元,居民储蓄存款的增加额为0.1445亿元;在2000年以后,则为0.4133亿元,已发生了很大变化上述模型与城乡居民储蓄存款与国民总收入之间的散布图是吻合的,与当时中国的实际经济运行状况也是相符的四、混合回归,建立计量经济模型时,有时能同时获得变量的时序数据和横截面数据 只要模型参数不随时间而改变,并且在各个横截面之间没有差异,就可以使用混合样本估计模型。

      因此,在合并样本之前,需在比较使用不同样本估计的模型之间是否有显著差异 例3-8表3-12为我国城镇居民1998年、1999年全年人均消费支出和可支配收入的统计资料试使用混合样本数据估计我国城镇居民消费函数 设1998年、1999年我国城镇居民消费函数分别为: 1998年:Yi=a1+b1xi +i 1999年: Yi=a2+b2xi +i,为比较两年的消费函数是否有显著差异,设置虚拟变量:,并且合并两年的数据,估计以下模型: Yi= a1 +b1xi+Di+XDi +i 其中=a2-a1 ,=b2-b1使用EViews软件的估计过程如下: CREATE U 16 建立工作文件 DATA Y X (输入1998、1999年消费支出和收入的数据,18期为1998年资料,916期为1999年资料),1999年 1998年,SMPL 1 8 样本期调为1998年,GENR D10 输入虚拟变量的值 SMPL 9 16 样本期调为1999年 GENR D11 输入虚拟变量的值 SMPL 1 16 样本期调至19981999年 GENR XDX*D1 生成XD的值 LS Y C X D1 XD 利用混合样本估计模型 估计结果为: 操作演示,根据t检验,D、XD的回归系数均不显著,即认为=a2-a1=0, =b2-b1=0;这表明1998年、1999年我国城镇居民消费函数并没有显著差异。

      因此,可以将两年的样本数据合并成一个样本,估计城镇居民的消费函数。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.