
chap06stata基本回归分析PPT优秀课件.ppt
38页主要内容1.小样本的OLS估计与分析2.大样本的OLS估计与分析3.约束回归4.非线性最小二乘分析实验6-1:小样本普通最小二乘分析一、实验基本原理一、实验基本原理二、实验内容和实验数据二、实验内容和实验数据根据统计资料得到了美国汽车产业的横截面数据(1978年) ,变量主要包括:price=汽车的价格,mpg=每加仑油所行驶的英里数,weight=汽车的重量,foreign表示是否是进口车,如果foreign=0代表是国产车,如果foreign=1代表是进口车完整的数据在本书附带光盘的data文件夹的“usaauto.dta”工作文件中利用usaauto数据,对汽车价格的影响因素进行计量分析,分析mpg、weight和foreign对价格的边际影响,包括进行OLS的估计、检验、预测和绘制图形等相关内容三、实验操作指导三、实验操作指导1 1 打开数据文件、观测数据特征打开数据文件、观测数据特征(1)若要进行各种对原始数据的操作,首先必须正确地打开数据文件,在Stata中打开数据文件的方法有多种,其中较为常用的方法是通过命令直接打开或是使用菜单操作打开我们在此使用命令方式,在命令窗口中输入如下命令:sysuse usaauto, clear(2)在进行回归分析之前,可以先关注一下原始数据及其统计特征。
在命令窗口中输入如下命令:edit如果想得到数据的统计特征,则需要在命令窗口中输入如下命令:describe2 2 利用最小二乘法进行模型的估计利用最小二乘法进行模型的估计对模型进行回归的仍然是采用命令方式进行操作,命令的基本格式如下:regress depvar [indepvar] [if] [in] [weight] [,options]其中regress代表“回归”的基本命令语句,depvar代表被解释变量(或称因变量)的名称,indepvar代表解释变量(或称自变量)的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项表6.1的内容显示了options所代表的其他选项的具体内容,主要包括选项的命令语句及其所代表的含义要想得到OLS的回归结果,只需本实验的模型在命令窗口中输入如下命令:regress price mpg weight foreign这个命令就表示以price作为因变量,mpg、weight、foreign作为自变量建立线性回归模型,运用OLS方法进行回归分析3 3 模型的检验模型的检验基本回归分析之后,还要对模型的整体和系数进行检验,以求证其是否符合经济理论或现实情况的要求。
用户可以发现刚才的回归结果中已经给出了最基本的F检验和t检验的结果,下面将介绍其他检验的相关命令,这些检验均为Wald检验(1)线性检验命令的基本格式如下:test (spec) [(spec) …] [, test_options]在这个命令中,test是线性检验的命令语句,而(spec)则表示线性检验的形式,主要包括以下五种:第一种检验所设定的系数都为0,命令形式如下:test coeflist第二种检验所设定的系数表达式都为0,命令形式如下:test exp=exp[=…]第三种检验方程eqno中的变量varlist的系数都为0,命令形式如下:test [eqno] [: varlist]第四种检验不同方程中变量varlist的系数相同,命令形式如下:test [eqno=eqno[=…]] [: varlist]第五种检验方程eqno中的变量varlist系数相同,命令形式如下:testparm varlist [, equal equation(eqno)](2)如果检验为非线性检验,则需要将命令的基本格式调整如下即可:testnl exp=exp[=exp...] [, options]这个命令中,testnl是非线性检验的命令语句,而exp=exp[=exp...]表示系数之间的非线性关系式。
在本实验中,如检验“weight”“foreign”的系数是否同时显著不为零,则需要输入如下命令:test weight foreign(也可以输入 test (weight=0) (foreign=0)这个命令,效果相同4 4 模型的预测模型的预测经济计量模型设定的最终目的是使其能够对社会经济生活有一定的预测功能,所以一个模型在估计和检验之后,就可以用其进行预测了,下面将着重介绍线性预测的主要内容线性预测的基本命令格式如下:predict [type] newvar [if] [in] [, options]在这里,predict是预测的基本命令语句,newvar代表将要进行预测的变量,if代表条件语句,in代表范围语句,options代表其他选项,在预测中起重要作用,表6.2显示了预测命令中options的命令语句和含义利用本实验的数据,预测因变量和残差 “price”和“e”值的具体操作步骤如下:若要得到“price”的预测值,需要输入如下命令:predict yhat, xb这个命令就表示对因变量price进行线性预测,生成的变量名称为yhat若要得到残差序列的预测值,则需要输入如下命令:predict e, residual这个命令就表示对残差值进行预测,生成的变量名称为e。
5 5 基本回归图形的绘制基本回归图形的绘制在回归分析中,图形是十分重要的一种分析工具,其不仅具有直观的视觉优势,且能包含巨大的信息量鉴于图形的画法本书前面章节已经介绍,这里不再赘述,且多元线性回归大部分为超平面图形,所以不宜用散点图和回归线表示,所以这里仅仅介绍简单的残差图形的画法残差对预测值标绘图提供了较为有用的诊断工具,在回归分析之后,我们就可以画出如图6.6所示的残差对预测值的标绘图了这种图形的得到只需要在命令窗口中输入如下命令语句:rvfplot, yline(0)在这个命令中,rvfplot表示自动生成残差e和因变量预测值yhat的散点图,并标识出纵轴值为零的直线当然,图6.6也可以通过更为基本的graph命令得到,命令如下:graph twoway scatter e yhat, yline(0)这个命令的还以就是画一个两轴的散点图,一个轴是残差预测值e,一个轴是因变量预测值yhat,同时还要标出纵轴值为零的直线实验6-2:大样本普通最小二乘分析一、实验基本原理一、实验基本原理二、实验内容和实验数据二、实验内容和实验数据为了检验美国电力行业是否存在规模经济,Nerlove(1963)收集了1955年145家美国电力企业的总成本(tc)、产量(q)、工资率(pl)、燃料价格(pf)及资本租赁价格(pk)的数据。
变量名前面加ln表示取自然对数以后的数值完整的数据在本书附带光盘的data文件夹的“nerlove.dta”工作文件中利用nerlove的数据,我们分别用大样本理论和小样本理论进行回归分析,以比较二者的不同,从而使用户更加深刻地理解这两个理论三、实验操作指导三、实验操作指导1 1 模型的建立模型的建立2 2 使用小样本理论进行回归使用小样本理论进行回归首先,我们假设数据符合小样本理论严格的假设,所以可以直接运用小样本理论进行回归使用use命令打开数据后,在命令窗口中输入回归命令如下:regress lntc lnq lnpl lnpk lnpf这个命令的含义就是以lntc作为因变量,以lnq、lnpl、lnpk、lnpf作为自变量建立线性回归模型之后,我们就可以得到如图6.7所示的小样本理论下的回归结果了3 3 使用大样本理论进行回归使用大样本理论进行回归大样本OLS经常采用稳健标准差估计(robust)稳健标准差是指其标准差对于模型中可能存在的异方差或自相关问题不敏感,基于稳健标准差计算的稳健t统计量仍然渐进分布t分布因此,在Stata中利用robust选项可以得到异方差稳健估计量。
在本实验中,利用稳健标准差进行估计的命令如下:regress lntc lnq lnpl lnpk lnpf,robust这个命令表示是以lntc作为因变量,以lnq、lnpl、lnpk、lnpf作为自变量建立线性回归模型命令最后的robust命令代表使用大样本稳健标准差进行各种预测和检验之后,我们就可以得到如图6.8所示的大样本理论下的回归结果了4 4 大、小样本理论结果对比大、小样本理论结果对比从这两个结果可以看到:稳健标准差与普通标准差的估计的系数相同,但标准差和t值存在着较大的差别,尤其是lnq的标准差 在现实社会的各种数据中,很少有数据能够满足小样本理论的严格假设,所以当样本数据足够大时,我们最好采用稳健标准差进行估计和检验,这样得到的结果将会更加准确实验6-3:约束回归一、实验基本原理一、实验基本原理二、实验内容和实验数据二、实验内容和实验数据本实验中,我们将利用与实验6-1相同的数据,即本书附带光盘data文件夹下的“usaauto.dta”文件中的数据,来研究回归系数存在约束的情况下,价格、汽车重量等因素对每加仑汽油所行驶的路程的影响我们将介绍如何定义约束、列出已定义的约束、取消已定义的约束、以及在定义好约束后如何进行约束回归。
三、实验操作指导三、实验操作指导1 1 约束的定义、列出和取消约束的定义、列出和取消(1)要进行约束回归,首先应对约束进行定义其语法格式如下: constraint [define] n 约束条件 其中,constraint define代表“定义约束”的基本命令语句;define可以省略n必须是位于 [1,1999] 的整数,用于表明这是第几个约束(2)要显示已定义的约束,可以使用如下的语句:constraint dir [numlist|_all] 或者constraint list [numlist|_all]其中,constraint dir或constraint list代表“显示约束”的基本命令语句,numlist指明要显示的约束,_all表示显示所有约束当我们不指定要显示的约束为哪几个时,默认显示所有的约束条件例如,我们想看到所有已定义的约束,输入命令:constraint dir(3)要删掉某个或几个已定义的约束,则可使用以下语句:constraint drop [numlist|_all]2 2 进行约束回归进行约束回归定义完约束之后,就可以进行约束回归了。
约束回归的基本语法格式如下:cnsreg depvar indepvars [if] [in] [weight], constraints(constraints) options其中,cnsreg代表“约束回归”的基本命令语句,constraints可简写为cdepvar代表被解释变量的名称,indepvar代表解释变量的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项options中,我们可以使用异方差稳健标准差(r)或汇报其他水平的置信区间等,详见表6.3下面,让我们通过例子来加深对命令的理解拟合前面的约束回归: cnsreg mpg price weight displ gear_ratio foreign length, c(1-5)命令中,cnreg代表进行约束回归,mpg是被解释变量的名称,price weight displ gear_ratio foreign length为各个解释变量的名称,选项c(1-5)表示在1到5个约束之下进行回归实验6-4: 非线性最小二乘一、实验基本原理一、实验基本原理二、实验内容和实验数据二、实验内容和实验数据使用本书附带光盘的data文件夹的“profunc.dta”工作文件,我们研究劳动投入和资本投入对产量的影响,即进行一个生产函数的回归。
变量包括产出的对数(lnoutput)、劳动(labor )和资本(capital)三、实验操作指导三、实验操作指导1 1 利用非线性最小二乘法进行模型的估计利用非线性最小二乘法进行模型的估计NLS回归的命令格式为:nl (depvar =
(2)用xb命令简化“变量线性组合”的设定(3)用nlcom命令估计回归统计量的非线性组合(Nonlinear combinations of estimators)习题1.利用本书附带光盘data文件夹下的“production.dta”工作文件,进行生产函数的回归分析主要变量包括output=产量,labor=劳动投入,capital=资本投入,lny=产量的对数,lnl=劳动投入的对数,lnk=资本投入的对数图6.16列出了数据的基本情况以lny为因变量,以 lnl, lnk为自变量进行回归分析,并对结果进行解读2.重复习题1中的回归,使用稳健标准差比较使用异方差稳健标准差和不使用时的系数及其他统计量的异同3.在习题1的回归之后,检验lnl和lnk的联合显著性;检验lnl和lnk的系数之积是否为 0.254.在习题1的回归之后,对lny进行预测5.在约束lnl+lnk = 1下,进行习题1中的回归并尝试进行手动的约束回归6.利用本书附带光盘data文件夹下的“consfunc.dta”工作文件,进行指数形式消费函数的估计主要变量包括:year=年度,qtr=季度,realgdp=实际GDP,realcons=实际消费额。
图6.17列出了数据的基本情况要估计的函数形式为先使用默认初始值,再设定 r的初始值为1重新估计7.利用本书附带光盘data文件夹下的“reg.dta”工作文件进行回归分析主要变量包括y、x1、x2、x3,图6.18列出了该文件的部分数据以y为因变量,x1 x2 x3为自变量进行回归分析,检验x1与x2的系数之比是否等于x2和x3的系数之比(使用两种方法)。
