好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

计量经济学一元线性回归模型.ppt

123页
  • 卖家[上传人]:壹****1
  • 文档编号:591916724
  • 上传时间:2024-09-18
  • 文档格式:PPT
  • 文档大小:1.54MB
  • / 123 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第二章第二章 经典单方程计量经济学模型:经典单方程计量经济学模型:一元线性回归模型一元线性回归模型 v基本概念基本概念 v一元线性回归模型的参数估计一元线性回归模型的参数估计v一元线性回归模型检验一元线性回归模型检验v一元线性回归模型预测一元线性回归模型预测v实例实例 §2.1§2.1基本概念基本概念一、变量间的关系及研究方法基本概念一、变量间的关系及研究方法基本概念二、总体回归函数二、总体回归函数( (PRF)三、随机扰动项与总体回归模型三、随机扰动项与总体回归模型四、样本回归函数(四、样本回归函数(SRFSRF)样本回归模型)样本回归模型 一、变量间的关系及研究方法基本概念一、变量间的关系及研究方法基本概念1. 变量间的关系变量间的关系(1)确定性关系确定性关系或函数关系函数关系::研究的是确定现象非随机变量间的关系2)统计依赖)统计依赖或相关关系:相关关系:研究的是非确定现象随机变量间的关系 2、研究方法、研究方法 对变量间对变量间统计依赖关系统计依赖关系的考察主要是通过的考察主要是通过相关分析相关分析(correlation analysis)或或回归分析回归分析(regression analysis)来完成的来完成的((1)相关分析)相关分析•注意注意①①不线性相关并不意味着不相关。

      ②②有相关关系并不意味着一定有因果关系 相关系数公式:相关系数公式: v“回归”名称的由来 “回归”名称和回归分析的思想来源于美国经济学家F.Galton和他的学生K.Pearson对于父母身高与子女身高关系问题的研究 “回归”的名称当时描述了子辈身高y与父辈身高x的关系 现代人们借用这个名词把研究变量x与y之间统计关系的数量方法称为“回归”分析v回归分析回归分析(regression analysis)(regression analysis) 是研究一个变量关于另一个(些)变量的统计依赖关系的计算方法和理论2)). 回归分析的基本概念回归分析的基本概念 v目的目的 在于通过X的已知或设定值,去估计和(或)预测Y的(总体)均值v回归分析中变量名称回归分析中变量名称 Y--Y--被解释变量被解释变量(Explained Variable)或 应变量应变量(Dependent Variable) X--X--解释变量解释变量(Explanatory Variable)或 自变量自变量(Independent Variable)。

      v回归分析构成计量经济学的方法论基础,其主要内容:回归分析构成计量经济学的方法论基础,其主要内容:(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测 ((3)相关分析与回归分析联系与区别)相关分析与回归分析联系与区别™联系联系 回归分析/相关分析都研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系™区别区别 相关分析相关分析研究(两个)变量相互关系,两个变量都被看作是随机变量 回归分析回归分析强调变量的依赖关系,即区分应变量(被解释变量)和自变量(解释变量),并且y是随机变量,x假定是确定型变量 1、含义:、含义:回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律 2、、函数形式:函数形式:可以是线性或非线性的其中,0,1是未知参数,称为回归系数回归系数(regression coefficients)线性函数线性函数二、总体回归函数二、总体回归函数 v例例2.1::一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出家庭消费支出Y与每月家庭可家庭可支配收入支配收入X的关系。

      即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平 为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出 经济现象的图形表示经济现象家庭消费支出家庭消费支出Y与每月家庭可支配收入家庭可支配收入X的关系 v由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;v但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布条件分布(Conditional distribution)是已知的,例如:P(Y=561|X=800)=1/4 v因此,给定收入X的值Xi,可得消费支出Y的条件均值条件均值(conditional mean)或条件期望条件期望(conditional expectation):E(Y|X=Xi)v该例中:E(Y | X=800)=605v描出散点图发现:随着收入的增加,消费“平平均地说均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上这条直线称为总体回归总体回归线线 05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消费支出Y(元) v在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线总体回归线(population regression line),或更一般地称为总体回归曲线总体回归曲线(population regression curve)。

      称为(双变量)总体回归函数总体回归函数((population regression function, PRF)) • 相应的函数: 三、随机扰动项与总体回归模型三、随机扰动项与总体回归模型v总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平v但对某一个别某一个别的家庭,其消费支出可能与该平均水平有偏差1、随机干扰项、随机干扰项(1) 称为观察值围绕它的期望值的离差离差((deviation)),是一个不可观测的随机变量,称为随机干扰项随机干扰项((stochastic disturbance))或 随机误差项随机误差项((stochastic error)) (2)个别值表达式个别值表达式 例2.1中,给定收入水平Xi ,影响个别家庭支出的因素可表示为两部分之和:v该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(系统性(systematic))或确定性确定性((deterministic)部分;部分;v其他随机随机或非确定性非确定性(nonsystematic)部分部分 i ((3 3)引入随机误差项原因)引入随机误差项原因 随机误差项主要包括下列因素:随机误差项主要包括下列因素:™在解释变量中被忽略解释变量中被忽略的因素的影响;™变量观测值的观测误差的影响;™模型关系的设定误差的影响;™其他随机因素的影响。

      2、总体回归模型、总体回归模型 上式称为总体回归函数(PRF)的随机设定形式 (1)形式: (2) 含义:表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响 由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型总体回归模型 四、样本回归函数(四、样本回归函数(SRF))v问题:问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?v例例2.2::在例2.1的总体中有如下一个样本,能否从该样本估计总体回归函数PRF? X8 表表2.1.3 家庭消费支出与可支配收入的一个随机样本家庭消费支出与可支配收入的一个随机样本 001100 14001700 2000 23002600290032003500Y59463811221155 1408 15951969207825852530 • 该样本的散点图散点图(scatter diagram):v由于样本取自总体,由于样本取自总体,求求一条直线以尽量好地拟合该散点图,可以用该直线近似地代表总体回归线。

      该直线称为样本回归线样本回归线((sample regression lines)1、样本回归线与、样本回归线与样本回归函数样本回归函数 v 记样本回归线的函数形式为: 称为样本回归函数样本回归函数((sample regression function,,SRF)) •作用:样本回归线作用:样本回归线看成总体回归线总体回归线的近似替代 样本回归函数样本回归函数是是总体回归函数总体回归函数的近似替代则 2 2、样本回归模型、样本回归模型/ /样本回归函数的随机形式:样本回归函数的随机形式:样本回归函数也有如下的随机形式: 由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型样本回归模型((sample regression model)) ▼回回归归分分析析的的主主要要目目的的:根据样本回归模型/函数,估计总体回归模型/函数即,根据 估计 小结v以下是一元线性回归函数与模型的四种形式 数据范围函数/模型名称 总体(理论) 样本(实际) 回归函数(方程) 估计 回归模型 估计 §2.2 §2.2 一元线性回归模型的参数估计一元线性回归模型的参数估计 五、参数估计量的概率分布及随机干扰五、参数估计量的概率分布及随机干扰项方差的估计项方差的估计一、线性回归模型的基本假设一、线性回归模型的基本假设二、二、参数的普通最小二乘估计(参数的普通最小二乘估计(OLSOLS))三、参数估计的最大或然法三、参数估计的最大或然法(ML)*(ML)*四、最小二乘估计量的性质四、最小二乘估计量的性质 说说 明明v单方程计量经济学模型分为两大类:线性模型和非线性模型。

      v估计方法有多种,其中最广泛使用的是普通最小二乘法(ordinary least squares, OLS)v为保证参数估计量具有良好的性质,通常对模型提出若干基本假设v这些假设与所采用的估计方法OLS紧密相关 一、线性回归模型的基本假设一、线性回归模型的基本假设 假设1. 解释变量X是确定性变量,不是随机变量; 假设2. 随机误差项具有零均值、同方差和不序列相关性: E(i)=0 i=1,2, …,n Var (i)=2 i=1,2, …,n Cov(i, j)=0 i≠j i,j= 1,2, …,n 同方差异方差x1x2xiy1y2yi 假设3. 随机误差项与解释变量X之间不相关: Cov(Xi, i)=0 i=1,2, …,n 假设4. 服从零均值、同方差、零协方差的正态分布 i~N(0, 2 ) i=1,2, …,n 1. 如果假设1、2满足,则假设3也满足;2. 如果假设4满足,则假设2也满足。

      注意:注意: 以上假设也称为线性回归模型的经典假经典假设设或高斯(高斯(Gauss))假设假设,满足该假设的线性回归模型,也称为经典线性回归模型经典线性回归模型(Classical Linear Regression Model, CLRM) 古典线性回归模型的主要假设古典线性回归模型的主要假设用 表示 用 表示 假设零均值 E( )=0 E( )= 同方差Var( )= Var( / )= 无序列相关性Cov( , )=0 Cov( , )=0 另外另外,在进行模型回归时,还有两个暗含的假设: 假设5. 随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数即 假设6. 回归模型是正确设定的 v假设5旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生所谓的伪回归问题伪回归问题(spurious regression problem)v假设6也被称为模型没有设定偏误设定偏误(specification error) 二、参数的普通最小二乘估计(二、参数的普通最小二乘估计(OLSOLS)) 1、条件:给定一组来自总体的样本观测值(Xi, Yi)(i=1,2,…n) 2、要求:样本回归函数 尽可能好地拟合这组值. 3、普通最小二乘法普通最小二乘法(Ordinary least squares, OLS)给出的尽可能好判断标准是:实际值与拟合值之差的平方和最小。

      即在给定样本观测值条件下,选择出 ,能使实际值与拟合值之差平方和最小,或在实际值与拟合值之差平方和最小或在实际值与拟合值之差平方和最小的原则下求出的原则下求出 4、推导:、推导:应用微积分学中多元函数极值原理:函数有极小值的必要条件是 Q 对 的一阶偏导数为0,得到正规方程组正规方程组*公式1……①*……② 计量经济学中,以小写字母表示对均值的离差 记参数估计量可以写成: 称为OLS估计量的离差形式离差形式((deviation form) 由于参数的估计结果是通过最小二乘法得到 的,故称为普通普通最小二乘估计量最小二乘估计量((ordinary least squares estimators)) 公式2计量经济学中,以小写字母表示对均值的离差 5、几个常用结果、几个常用结果:(*)(*)式称为样本回归函数样本回归函数的离差形式离差形式样本回归线经过点样本回归线经过点 *三、参数估计的最大或然法三、参数估计的最大或然法(ML) 最大似然法最大似然法( (Maximum Likelihood,简称ML),是不同于最小二乘法的另一种参数估计方法,是从最大似然原理出发发展起来的其他估计方法的基础。

      1、基本原理基本原理: 对于最大似然法最大似然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型总体中抽取该n组样本观测值的概率最大 在满足基本假设条件下,对一元线性回归模型: 随机抽取n组样本观测值(Xi, Yi)(i=1,2,…n) 那么Yi服从正态分布:2、似然函数、似然函数 因为Yi是相互独立的,所以n个样本观测值的联合概率,定义为似然函数似然函数(likelihood (likelihood function)function): Yi的概率密函数为: 3、求极大似然估计量(1)将似然函数极大化(2)求似然函数的对数的极大化 由于似然函数的极大化与似然函数的对数的极大化是等价的,指在取相同的 时,二者均达到极大值所以,取对数似然函数如下: (3)解得模型的参数估计量为:解得模型的参数估计量为: 可见,在满足一系列基本假设的情况下,模型结构参数的最最大大似似然然估估计计量量与普普通通最最小小二二乘乘估估计计量量是相同的 大样本时最大似然法最大似然法估计参数是较好方法。

      4、估计方法比较、估计方法比较 条件条件 OLS小样本方法 ML大样本方法满足基本假设满足基本假设OLS估计量估计量线性无线性无偏偏有效有效ML估计量与估计量与OLS估计量相同估计量相同不满足基本假设不满足基本假设或非或非线性性有有偏、偏、非非有效、渐有效、渐进进非非有效、有效、非非一致一致一致性估计且渐进一致性估计且渐进有效有效 四、最小二乘估计量的性质四、最小二乘估计量的性质 当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质 一个用于考察总体的估计量,可从如下几个方面考察其优劣性: ((1)线性性)线性性,即它是否是另一随机变量的线性函数; ((2)无偏性)无偏性,即它的均值或期望值是否等于总体的真实值;((3)有效性)有效性,即它是否在所有线性无偏估计量中具有最小方差v 这三个准则也称作估计量的小样本性质小样本性质 拥有这类性质的估计量称为最佳线性无偏估计最佳线性无偏估计量量(best liner unbiased estimator, BLUE)。

      ((4))渐渐近近无无偏偏性性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;((5))一一致致性性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;((6))渐渐近近有有效效性性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差 当不满足小样本性质时,需进一步考察估计量的大样本大样本或或渐近性质渐近性质:: 高高斯斯—马马尔尔可可夫夫定定理理(Gauss-Markov theorem) 在在给给定定经经典典线线性性回回归归的的假假定定下下,,最最小小二二乘乘估估计计量量是是具具有有最最小小方方差差的的线线性性无无偏偏估估计计量 证:证:易知故同样地,容易得出 p35 (2)证明最小方差性其中,ci=ki+di,di为不全为零的常数则容易证明 普通最小二乘估计量普通最小二乘估计量(ordinary least Squares Estimators)称为最佳线性无偏估计量最佳线性无偏估计量((best linear unbiased estimator, BLUE)) 由于最小二乘估计量拥有一个由于最小二乘估计量拥有一个““好好””的估计量的估计量所应所应具备的小样本特性,它自然也拥有大样本特性具备的小样本特性,它自然也拥有大样本特性。

      五、参数估计量的概率分布及随机干扰五、参数估计量的概率分布及随机干扰项方差的估计项方差的估计 2. 随机误差项随机误差项 的方差的方差 2的估计的估计2又称为总体方差总体方差 由于随机项 i不可观测,只能从 i的估计——残差ei出发,对总体方差进行估计 可以证明可以证明, 2的最小二乘估计量最小二乘估计量为它是关于2的无偏估计量公式1公式2 在最大或然估计法最大或然估计法中, 因此,  2 2的的最最大大或或然然估估计计量量不不具具无无偏偏性,但却具有一致性性,但却具有一致性 §2.3 §2.3 一元线性回归模型的统计检验一元线性回归模型的统计检验 一、拟合优度检验一、拟合优度检验二、变量的显著性检验二、变量的显著性检验三、参数的置信区间三、参数的置信区间 说说 明明v回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线v尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值 v那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验统计检验。

      v主要包括拟合优度检验拟合优度检验、、变量的显著性检验显著性检验及参数的区间估计区间估计 一、拟合优度检验一、拟合优度检验 1 1 1 1、含义与目的、含义与目的、含义与目的、含义与目的 ((1 1)拟合优度检验)拟合优度检验::::检验样本回归直线对样本观测值的拟合程度 度量拟合优度的指标:判定系数判定系数(可决系数可决系数)R2 2 问题问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?((2 2)与普通最小二乘估计方法的区别)与普通最小二乘估计方法的区别 ((2 2)与普通最小二乘估计方法的区别)与普通最小二乘估计方法的区别OLS:解决的是 的最佳位置问题拟合优度检验:解决的是 对散点线性趋势的代表性问题散点图p40 则 2 、总离差平方和的分解、总离差平方和的分解 由于: =0所以有: TSS=ESS+RSS记总体平方和总体平方和((Total Sum of Squares))回归平方和回归平方和((Explained Sum of Squares))残差平方和残差平方和((Residual Sum of Squares )) Y的观测值围绕其均值的总离差的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回可分解为两部分:一部分来自回归线归线(ESS),,另一部分则来自随机势力另一部分则来自随机势力(RSS)。

      v在给定样本中,TSS不变,v如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此v拟合优度:回归平方和拟合优度:回归平方和ESS/Y的总离差的总离差TSS 3 3 3 3、可决系数、可决系数、可决系数、可决系数R2 2统计量公式统计量公式统计量公式统计量公式 称 R2 为(样本)(样本)可决系数可决系数/判定系数判定系数 ((coefficient of determination) 公式(公式(1 1):):公式(公式(2 2):):实际计算中,若 已经估计出,则 4、可决系数、可决系数的取值范围取值范围:[0,1] R2 2越接近越接近1 1,说明实际观测点离样本线越近,,说明实际观测点离样本线越近,拟合优度越高拟合优度越高 注:可决系数注:可决系数是一个非负的统计量它也是随着抽样的不同而不同为此,对可决系数的统计可靠性也应进行检验,这将在第3章中进行 二、变量的显著性检验二、变量的显著性检验 回归分析回归分析是要判断解释变量解释变量X是否是被解释变被解释变量量Y的一个显著性的影响因素。

      在一元线性模型一元线性模型中,就是要判断X是否对Y具有显著的线性性影响这就需要进行变量的显著变量的显著性检验 变量的显著性检验所应用的方法是数理统计学变量的显著性检验所应用的方法是数理统计学中的中的假设检验假设检验 计量经济学中计量经济学中,主要是针对变量的参数真值是,主要是针对变量的参数真值是否为零来进行显著性检验的否为零来进行显著性检验的 目的目的 2、变量的显著性检验、变量的显著性检验 ((1 1)) 1检验步骤:检验步骤: (1)对总体参数提出假设:H0: 1=0, H1:10(2)以原假设H0构造t统计量,并由样本计算其值(3)给定显著性水平,查t分布表得临界值t /2(n-2) (4) 比较,判断 若 |t|> t /2(n-2),则拒绝H0 ,接受H1 ; 若 |t| t /2(n-2),则拒绝H1 ,接受H0 ; 对于一元线性回归方程中的 ,可构造如下t统计量进行显著性检验: •假设H0: 0=0,H1:00((2 2))•给定显著性水平,查t分布表得临界值t /2(n-2)• 比较,判断 若 |t|> t /2(n-2),则拒绝H0 ,接受H1 ; 若 |t| t /2(n-2),则拒绝H1 ,接受H0 ; •统计量检验步骤:检验步骤: 在上述收入—消费支出例中, H0: 1=0, H0: 0=0首先计算 的估计值 t统计量的计算结果分别为: 给定显著性水平=0.05,查t分布表得临界值 t 0.05/2(8)=2.306 |t1|>2.306,说明家庭可支配收入在95%的置信度下显著,即是消费支出的主要解释变量;; |t2|<2.306,表明在95%的置信度下,无法拒绝截距项为零的假设。

      假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近” 三、参数的置信区间三、参数的置信区间 目的:目的:检验参数估计量的精确度 要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值这种方法就是参数检验的置信区间置信区间估计估计 如果存在这样一个区间,称之为置置信信区区间间(confidence interval); 1-称为置置信信系系数数(置置信信度度))(confidence coefficient), 称为显显著著性性水水平平(level of significance);置信区间的端点称为置置信信限限(confidence limit)或临界值临界值(critical values) 一元线性模型中一元线性模型中,, i (i=1,,2))的置信区间的置信区间: :在变量的显著性检验中已经知道: 意味着,如果给定置信度(1-),从分布表中查得自由度为(n-2)的临界值,那么t值处在(-t/2, t/2)的概率是(1- )。

      表示为: 即 于是得到:(1-)的置信度下,  i的置信区间是 • 由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好 在上述收入收入- -消费支出消费支出例中,如果给定 =0.01,查表得: 由于于是,1、0的置信区间分别为: (0.6345,0.9195) (-433.32,226.98) §2.4 §2.4 一元线性回归分析的应用:预一元线性回归分析的应用:预测问题测问题 一、一、Ŷ0 0是条件均值是条件均值E(Y|X=XE(Y|X=X0 0) ) 的一个无偏估计的一个无偏估计; ; Ŷ0 0是个值是个值Y Y0 0的一个的一个有偏有偏估计估计二、总体条件均值二、总体条件均值E(YE(Y0 0) )与个值与个值Y Y0 0预测值的置预测值的置信区间信区间 对于一元线性回归函数 给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0 0 ,可以以此作为其条件条件均值均值E(Y|X=X0)或个别值个别值Y0的一个近似估计有点估计与区间估计。

      说说 明明•注意Ŷ0 0的双重身份•预测内容:点估计: Ŷ0 0 E(Y|X=X0) Ŷ0 0 Y0 区间估计: E(Y|X=X0)的置信区间的置信区间 Y0的置信区间的置信区间 一、一、Ŷ0 0是条件均值是条件均值E(Y|X=X0) 的一个无的一个无偏估计,偏估计, Ŷ0 0是个值是个值Y0的的一个一个有偏有偏估计估计1、 Ŷ0是条件均值是条件均值E(Y|X=X0)的无偏估计的无偏估计对总体回归函数总体回归函数E(Y|X=Xi)=0+1Xi,X=X0时 E(Y|X=X0)=0+1X0于是可可见,,Ŷ0是条件均值是条件均值E(Y|X=X0)的无偏估计的无偏估计 对总体回归模型总体回归模型Yi=0+1Xi+,当Xi=X0时于是Ŷ0 0是个值是个值Y0的有偏估计的有偏估计Ŷ0 0不是个值不是个值Y0的无偏估计的无偏估计 二、总体条件均值二、总体条件均值E(YE(Y0 0) )与个值与个值Y Y0 0预测值预测值的置信区间的置信区间 1、总体均值、总体均值E(Y0)预测值的置信区间预测值的置信区间 由于 于是可以证明 因此 故 即 于是,在1-的置信度下,总体均值总体均值E(Y|X0)的置的置信区间为信区间为 其中 2、总体个值、总体个值Y Y0 0预测值的预测区间预测值的预测区间 由 Y0=0+1X0+ 知: 于是 式中 :从而在1-的置信度下, Y0的置信区间的置信区间为 例:在上述收入收入—消费支出消费支出例题中,得到的样本回归函数为: 则在 X0=1000处, Ŷ0 = –103.172+0.777×1000=673.84 而 因此,总体均值总体均值E(Y|X=1000)的95%的置信区间为: 673.84-2.30661.05< E(Y|X=1000) <673.84+2.30661.05或 (533.05, 814.62) 同样地,对于Y在X=1000的个体值个体值,其95%的置信区间为: 673.84 - 2.306130.88

      2.5 实例 v已知全国人均消费金额为Y元,人均国民收入为X元,1981年——1993年样本数据见表2.1,要求:™1、求人均消费金额对人均国民收入的一元线性样本回归方程;™2、对样本回归方程进行统计检验;™3、1993年人均国民收入为2099.5元,预测1993年人均消费金额为多少元?™ v解:1、列计算表2.2,计算表2.3 (1)估计 ,求样本回归方程 由表2.2由表2.3(见后面) (2)统计检验1’、拟合良好性检验由表2.3计算可决系数:2’、参数估计量的t检验由表2.3计算: vt检验: 在 时, ,因为 ,所以在95%的置信度下拒绝原假设,说明截距项在回归方程显著不为零.v在 时, ,因为 ,所以在95%的置信度下拒绝原假设,说明X变量显著地影响Y变量. 3’、求 的置信区间 的置信区间为: 计算得: 的置信区间为: 计算得:v(3)预测 1993年人均国民收入为 元,将值代入样本回归方程,得到1993年的人均消费金额预测值的点估计值 v实际1993年人均消费金额 为1148元,相对误差为1.77%。

      求1993年人均消费金额的预测区间:在95%的置信区间下, E( )的预测区间为: 所以v或,在95%的置信区间下,个别值 的预测区间为: v又:v计算有:2、Eviews结果 v(1)、样本回归方程:v其中, 是回归方程的斜率,它表示1981-1992年期间,全国人均国民收入每增加1元,将有 元用于消费支出; 是回归方程的截距,它表示不受人均国民收入影响的人均消费金额的起始值 的符号大小均符合经济理论及实际情况v(2)统计检验v ,说明总离差平方和的99.6%被样本回归直线所解释,只有0.4%未被解释,因此样本回归线对样本点的拟合优度很高4.82)(51.42) v给出显著性水平 ,查自由度为n-2=10的t分布表,得临界值v拒绝回归系数为零的原假设,说明X变量显著地影响Y变量 时间序列问题时间序列问题 一、一、中国居民人均消费模型中国居民人均消费模型 二、二、时间序列问题时间序列问题 一、中国居民人均消费模型一、中国居民人均消费模型 例例2.5.1 考察中国居民收入与消费支出的关系。

      GDPP: 人均国内生产总值人均国内生产总值(1990年不变价)CONSP:人人均均居居民民消消费费(以居民消费价格指数(1990=100)缩减) 1. 建立模型建立模型 拟建立如下一元回归模型 采用Eviews软件软件进行回归分析的结果见下表 该两组数据是1978—2000年的时间序列数据时间序列数据(time series data); 前述收收入入—消消费费支支出出例例中的数据是截截面面数数据据(cross-sectional data) 一般可写出如下回归分析结果: (13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 R2=0.9927T值:C:13.51, GDPP:53.47 临界值: t0.05/2(21)=2.08斜率项:0<0.3862<1,符合绝对收入假说 2. 模型检验模型检验 3. 预测预测 2001年:GDPP=4033.1(元)(1990年不变价) 点估计:CONSP2001= 201.107 + 0.38624033.1 = 1758.7(元) 2001年实测实测的CONSP(1990年价):1782.2元, 相对误差相对误差: -1.32%。

      2001年人均居民消费的预测区间预测区间 人均GDP的样本均值样本均值与样本方差样本方差: E(GDPP) =1823.5 Var(GDPP) = 982.042=964410.4 在95%的置信度下,E(CONSP2001)的预测的预测区间区间为: =1758.740.13或: (1718.6,1798.8) 同样地,在95%的置信度下,CONSP2001的的预测区间预测区间为: =1758.786.57或 (1672.1, 1845.3) 二、时间序列问题二、时间序列问题 上述实例表明,时间序列完全可以进行类似于截面数据的回归分析 然而,在时间序列回归分析中,有两个需注意的问题: 第一,关于抽样分布的理解问题第一,关于抽样分布的理解问题 能把表2.5.1中的数据理解为是从某个总体中抽出的一个样本吗? 第二,关于第二,关于““伪回归问题伪回归问题””((spurious spurious regression problemregression problem)。

      在现实经济问题中,对时间序列数据作回归,即使两个变量间没有任何的实际联系,也往往会得到较高的可决系数,尤其对于具有相具有相同变化趋势(同时上升或下降)的变量同变化趋势(同时上升或下降)的变量,更是如此这种现象被称为“伪回归伪回归”或“虚假回归虚假回归”。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.