1、1,经济学类核心课程 计量经济学,第二章 一元线性回归模型,3,4,5,1,6,2,2.1 回归分析概述,变量间的相互关系 计量经济学的主要问题之一就是探寻各种经济变量之间的相互联系程度、联系方式以及运动规律。 各种经济变量间的关系可以分为两类:一类是确定的函数关系,另一类是不确定的统计关系。 确定的函数关系例如: 不确定的统计关系例如:农作物产量Y与施肥量X之间的关系。无法确定农作物产量与施肥量之间的函数关系,因为农作物产量还会受到阳光、气温、降雨等因素影响,但是可以通过统计计量方法研究统计相关关系,农作物产量Y是非确定性变量,也称为随机变量。,2.1 回归分析概述,变量间的相互关系 变量间的函数关系与相关关系并不是绝对的,一定条件下,可以相互转化。确定性现象的观测中,往往存在测量误差,函数关系将通过相关关系表现出来,反之,如果将非确定性现象中的影响因素全部识别出来,并将此全部纳入到变量间的依存关系中,相关关系将会向函数关系转化。相关分析和回归分析主要研究非确定性现象间的统计相关关系。,2.1 回归分析概述,相关分析与回归分析 相关分析(Correlation Analysis)主要
2、研究随机变量间的相关形式及相关程度。 变量X与Y的总体线性相关系数为: 样本相关系数为:,2.1 回归分析概述,相关分析与回归分析 具有相关关系的变量间存在因果关系,则可以通过回归分析(Regression Analysis)研究具体依存关系,比如考察可支配收入每1元的变化引起的消费支出的平均变化。 回归分析是研究一个变量(被解释变量,explained variable;因变量,dependent variable)关于另一个(几个)变量(解释变量,explanatory variable;自变量,independent variable)的依赖关系的计算方法和理论。目的在于通过后者的已知或设定值,去估计或预测前者的均值。,2.1 回归分析概述,相关分析与回归分析 相关分析与回归分析既有联系又有区别: 首先,都是研究非确定性变量间的统计依赖关系,并能度量线性依赖程度大小;其次,两者间存在明显的区别,相关分析仅仅测量变量相关程度,无需考察因果关系,因此变量地位是对称的,而回归分析更关注因果关系,地位是不对称的,有解释变量与被解释变量之分;再次,相关分析只关注变量联系程度,不关注具体依赖
3、关系,回归分析更关注依赖关系,可以通过解释变量变化去估计或预测被解释变量的变化。 回归分析主要包括以下内容: 根据样本观察值对计量经济学模型参数进行估计,求得回归方程; 对回归方程、参数估计值进行显著性检验; 利用回归方程进行分析、评价与预测。,2.1 回归分析概述,例2.1.1 以X的给定值为条件的, Y的条件分布是已知的,如 P(Y=561X=800)=1/4。 那么,给定X的值,可以得到 Y的条件均值或条件期望,如 E(YX=800)=605。,2.1 回归分析概述,例2.1.1 从人均可支配收入与消费支出 的散点图看出,虽然消费支出存在 差异,平均来说,随着可支配收入 增加,消费支出也在增加。Y的 条件均值正好落在一条斜率为正的 直线上,称之为总体回归线。,总体回归线,2.1 回归分析概述,总体回归线 给定解释变量X条件下被解释变量Y的期望轨迹称为总体回归线(Population regression line),或总体回归曲线(Population regression curve),总体回归函数(Population Regression Function,PRF)为: 将
4、消费支出看成可支配收入的线性函数,可进一步写成 其中, 和 是未知参数,称之为回归系数(Regression coefficients)。 线性函数主要指回归系数是线性,解释变量可以不是线性的。,2.1 回归分析概述,定义 总体回归函数描述了考察总体的家庭消费支出平均来说随着可支配收入变化的规律,但是对具体一个家庭来说,消费支出不一定是平均值 E(YX),而是在平均支出的周围。 对个别家庭而言,消费支出与平均消费支出的差: 是一个不可观测的随机变量,称为随机误差项(stochastic error)或随机干扰项(stochastic disturbance)。 于是,个别家庭消费支出: (总体回归函数的随机设定形式) 当可支配收入X给定时,个别家庭消费支出由两个部分组成:平均消费支出,系统性部分或确定性部分;随机部分或非系统性部分。,2.1 回归分析概述,引入随机干扰项的原因 代表未知的影响因素,对考察总体认识不完备,未知的影响因素无法引入模型; 代表残缺数据,部分数据无法获得,例如财富拥有量对消费支出的影响; 代表众多细小影响因素,将众多细小变量的影响综合; 代表数据观测误差,数据往
5、往存在测量误差; 代表模型设定误差,模型设定可能与真实的模型有偏差; 变量的内生随机性 ,变量所固有的内生随机性,也会对被解释变量产生随机性影响。,2.1 回归分析概述,定义 由于总体的信息往往无法全部得到,通过抽样得到总体的样本,再通过样本信息来估计总体回归函数。,样本回归线,样本回归线(Sample regression line),函数形式为: 称之为样本回归函数 (Sample Regression Function,SRF) 称之为样本回归模型。,2.1 回归分析概述,目的 用样本回归函数估计,即 去估计总体回归函数 使SRF尽可能接近PRF,右图 显示了样本回归线与总体回归线的 基本关系。 样本回归线并不是唯一的。,2.2 一元线性回归模型的基本假设,一元线性回归模型是最简单的计量经济学模型 其中,Y为被解释变量,X为解释变量, 和 为待估参数, 为随机扰动项,在有n个样本观测点的情况下,得到: 为了保证参数估计量具有良好性质,通过对模型提出若干基本假设: 对模型设定的假设 对解释变量的假设 对随机干扰项的假设,2.2 一元线性回归模型的基本假设,假设1:回归模型是正确设定
6、的 模型的正确设定主要包括模型选择了正确的变量和模型选择了正确的函数形式。 选择了正确的变量指设定总体回归函数时,既没有遗漏重要变量,也没有多选无关的变量。选择了正确的函数形式是指设定的总体回归函数与因变量与自变量呈现的函数形式正好相同。(柯布道格拉斯的幂函数形式) 假设1满足时,称为没有设定偏误(specification error)。,2.2 一元线性回归模型的基本假设,假设2:解释变量X在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量X的样本方差趋于一个非零的有限常数,即满足 通过解释变量的变化来解释被解释变量的变化,因此需要足够的变异性。方差非零假设旨在排除数值取值出现无界的变量作为解释变量,因为这类数据使大样本统计推断变得无效。,2.2 一元线性回归模型的基本假设,假设3:给定解释变量X的任何值,随机扰动项 的均值为零,即 意味着 的期望不依赖于X的任何观测点取值的变化而变化,且总为常数0,表明 与X不存在任何形式的相关性,称X是外生解释变量(exogenous explanatory variable),或X是严格外生的(strictly exogenou
7、s),否则称X是内生解释变量(endogenous explanatory variable)。 同期外生(contemporaneously exogenous)或同期不相关( contemporaneously uncorrelated )。,2.2 一元线性回归模型的基本假设,假设4:随机扰动项 具有给定X任何值条件下的同方差性及不序列相关性,即 条件同方差意味着 的方差不依赖于X的变化而变化,且总为常数 任意两个不同观测点的随机干扰项不相关,2.2 一元线性回归模型的基本假设,假设5:随机干扰项服从零均值、同方差的正态分布,即 以上假设也称为线性回归模型的经典假设(classical assumption),满足假设的模型称为经典线性回归模型(Classical Linear Regression Model,CLRM),前四个假设称为高斯-马尔科夫假设(Gauss-Markov assumption)。 被解释变量Y具有如下分布特征,2.3 一元线性回归模型的参数估计,判断标准 不同的估计方法可得到不同的 和 ,所估计的 也不同。被解释变量的估计值与实际观测值差的平方和最小,
8、即 理想的方法是选择 , 使 与 之差的平方和最小。为什么使用平方和? 求解(正规方程组),2.3 一元线性回归模型的参数估计,求解(离差形式) 其中, 有关估计量与估计值的区别,估计值是具体数值,估计量是一个函数,2.3 一元线性回归模型的参数估计,求解(离差形式) 回归线通过样本均值 估计值 的均值等于实际观测值 的均值,2.3 一元线性回归模型的参数估计,基本思想 对于普通最小二乘法,当从模型总体随机抽取容量为n的样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取容量为n的样本观测值后,最合理的参数估计量应该使得从模型中抽取该样本观测值的概率最大。 要对每个可能的正态总体取得容量为n的样本观测值的联合概率,然后选择其参数能使观测值的联合概率为最大的那个总体,将样本观测值联合概率函数称为变量的似然函数。在已经取得样本观测值的情况下,使似然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。,2.3 一元线性回归模型的参数估计,求解 由于 服从正态分布 于是, 的概率函数为: 联合概
9、率(似然函数)为: 在满足一系列基本假设的情况下,模型结构参数的最大似然估计量与普通最小二乘估计量是相同的。,2.3 一元线性回归模型的参数估计,基本思路 正规方程组可以通过矩估计的思想来导出,矩估计的基本原理是用相应的样本矩来估计总体矩。 于是,相应的样本矩条件可写成 解与普通最小二乘法和最大似然法的结果相同。,2.3 一元线性回归模型的参数估计,例2.3.1,2.3 一元线性回归模型的参数估计,考察参数估计量的统计性质的原因 由于抽样波动的存在,以及所选估计方法 的不同,都会使估计的参数与总体参数的真值 有差距,因此考察参数估计量的统计性质就 成了衡量该统计量“好坏”的主要准则。,2.3 一元线性回归模型的参数估计,线性性 指估计量 , 是 的线性组合。 其中,,2.3 一元线性回归模型的参数估计,无偏性 即以X的所有样本为条件,估计量 , 的均值等于总体回归参数真实值 和 。 所以, ,,2.3 一元线性回归模型的参数估计,有效性(最小方差性) 即在所有线性无偏估计量中,普通最小二乘估计量 和 具有最小方差。,2.3 一元线性回归模型的参数估计,有效性(最小方差性) 假设 是其他估计方法得到的关于 的线性无偏估计量: 其中, 得到: 普通最小二乘估计量具有线性性、无偏性和有效性,是最佳线性无偏估计量,也称高斯-马尔科夫定理。,2.3 一元线性回归模型的参数估计,大样本性质 除了拥有好的小样本性质外,还拥有好的大样本性质,2.3 一元线性回归模型的参数估计,参数估计量的概率分布 为了达到对所估计参数精度测定的目的,还需进一步确定参数估计量的概率分布。 和 概率分布取决于,2.3 一元线性回归模型的参数估计,随机干扰项的方差估计 在估计的参数 和 的方差表达式中,都含有随机干扰项的方差 。由于 实际上是未知的,因此, 和 的方差实际上无法计算,需要对其估计。由于随机扰动项 无法观测,只能从残差 出发,对总体方差进行估计。 最小二乘估计量 最大似然估计量 矩估计量,2.4 一元线性回归模型的统计检验,为什么需要进行统计检验? 尽管从统计性质上已知,如果有足够多的重复抽样,参数估
《计量经济学-第二章一元线性回归模型》由会员F****n分享,可在线阅读,更多相关《计量经济学-第二章一元线性回归模型》请在金锄头文库上搜索。