1、计量经济学 第三章 多元线性回归模型,中国经济的快速发展,使居民收入不断增加,数以百万 计的中国人开始得以实现拥有汽车的梦想,中国也成为世界 上成长最快的汽车市场。 中国交通部副部长在“中国交通可持续发展论坛”上做出预 测 :“2020年,中国的民用汽车保有量将比2003年的数字增长 倍,达到1.4亿辆左右”。 是什么因素导致中国汽车数量的增长? 影响中国汽车行业发展的因素并不是单一的,经济增长、 消费趋势、市场行情、业界心态、能源价格、道路发展、内 外环境,相关政策,都会使中国汽车行业面临机遇和挑战。,引子:中国汽车的保有量会达到1.4亿辆吗 ?,分析中国汽车行业未来趋势,应具体分析这样一些问题: 中国汽车市场发展的状况如何?(用销售量观测) 影响中国汽车销量的主要因素是什么? (如收入、价格、费用、道路状况、能源、政策环境等) 各种因素对汽车销量影响的性质怎样?(正、负) 各种因素影响汽车销量的具体数量关系是什么? 所得到的数量结论是否可靠? 中国汽车行业今后发展前景怎样?应当如何制定汽车的产业政策? 很明显,只用一个解释变量已很难分析汽车产业的发展, 还需要寻求有更多个解释变量情
2、况的回归分析方法。,怎样分析多种因素对汽车市场的影响?,第三章 多元线性回归模型,本章主要讨论: 如何将简单线性回归的研究方式推广到多元的情况 多元线性回归模型及古典假定 多元线性回归模型的参数估计 多元线性回归模型的检验 多元线性回归模型的预测 案例分析,第一节 多元线性回归模型及古典假定,本节基本内容: 一、多元线性回归模型的意义 二、多元线性回归模型的矩阵表示 三、多元线性回归中的基本假定,一、多元线性回归模型的意义,例如:有两个解释变量的电力消费模型 其中: 为各地区电力消费量; 为各地区国内生产总值(GDP); 为各地区电力价格变动。 模型中参数的意义是什么呢?,与简单线性回归模型不同,模型中参数 是 偏回归系数,样本容量为,一般形式:对于有 个解释变量的线性回归模型,可表示为,一、多元线性回归模型的意义,偏回归系数: 控制其它解释变量不变的条件下,第 个解释变量的单位变动对应变量平均值的影响。,对偏回归系数的理解,例如:,对比,和 都是 对 影响的参数,并且,可证明,(证明见古加拉蒂计量经济学附录7A.5),结果:只要 , 是有区别的,指对各个回归系数而言是“线性”的,对变
3、量即可是线性的,也可是非线性的 例如:生产函数 取自然对数,多元线性回归的“线性”,这也是多元线性回归模型,只是这时变量为,的总体条件均值表示为多个解释变量的函数,多元总体回归函数,条件均值表现形式,个别值表现形式,引入随机扰动项,多元样本回归函数,条件均值表现形式,个别值表现形式,的样本条件均值表示为多个解释变量的函数,引入残差项(剩余项),多元线性回归模型有多个解释变量,参数的估计和各种统计量用代数式表达较为困难,需要借助矩阵形式来表述。,二、多元线性回归模型的矩阵表示,个解释变量的多元线性回归模型的 个观测 样本,可表示为,用矩阵表示,多元总体线性回归函数的矩阵形式为,总体回归函数 或 样本回归函数 或 其中: 都是有 个元素的列向量 是有 个元素的列向量 是第一列为1的 阶解释变量数据矩阵 (截距项可视为解释变量取值为1),矩阵表示方式,三、多元线性回归中的基本假定,假定1:零均值假定,用矩阵的形式可表示为:,假定2:同方差和无自相关假定,三、多元线性回归中的基本假定,方差协方差矩阵为:,假定3:随机扰动项与解释变量不相关,三、多元线性回归中的基本假定,可逆,假定5:正态性假定
4、,假定4: 无多重共线性假定 假定各解释变量之间不存在线性关系,或解释变量观测值矩阵 列满秩( 列)。,第二节 多元线性回归模型的估计,本节基本内容: 普通最小二乘法(OLS) OLS估计式的性质 OLS估计的分布性质 随机扰动项方差 的估计 回归系数的区间估计,一、普通最小二乘法(OLS),最小二乘原则:估计的剩余平方和最小 求偏导,令其为0:,注意到,因为样本回归函数为 两边乘 有: 因为 ,则正规方程为:,用矩阵表示的正则方程,偏导数,0,由正规方程 多元回归中参数估计式 当只有两个解释变量时 注意: 和 为 的离差,OLS估计式,OLS回归线的性质 (与简单线性回归相同),回归线通过样本均值 估计值 的均值等于实际观察值 的均值 剩余项 的均值为零 被解释变量估计值 与剩余项 不相关 解释变量 与剩余项 不相关,1、线性特征 因 是非随机的或取固定值的矩阵, 是 的线性函数 2、无偏特性 3、最小方差特性 在 所有的线性无偏估计中,OLS估计 具有最小方差.(证明见书101页) 在古典假定条件下,多元线性回归的OLS估计式是最佳线性无偏估计式(BLUE),二、OLS估计式的性质
5、,基本思想 是随机变量,必须确定其分布性质才可能进行区间估计和假设检验 是服从正态分布的随机变量, 决定了 也是服从正态分布的随机变量 是 的线性函数,决定了 也是服从正态分布的随机变量,三、OLS估计的分布性质,的期望 (由无偏性) 的方差和标准误差: 可以证明 的方差-协方差矩阵为 这里是 矩阵 中第 行第 列的元素,的期望和方差,其中,四、随机扰动项方差 的估计,多元回归中 的无偏估计为(证明见103页) 或表示为 将 作标准化变换:,因 是未知的,可用 代替 去估计参数 的标准误差: 当为大样本时,用估计的参数标准误差对 作标准化变换,所得Z统计量仍可视为服从正态分布 当为小样本时,用估计的参数标准误差对 作标准化变换,所得的t统计量服从t分布:,五、回归系数的区间估计,由于 给定 ,查t分布表的自由度为 的临界值 或: 或表示为:,例3.1从中国统计年鉴中取得西部各地区2002年电力消费量、国内生产总值、电力价格变动等数据作为样本,解:,所以,因为,估计的样本回归模型为,第三节 多元线性回归模型的检验,本节基本内容: 多元回归的拟合优度检验 回归方程的显著性检验(F检验) 各回归系数的显著性检验(t检验),一、多元回归的拟合优度检验,多重可决系数:在多元回归模型中,由各个解释变量联合 解释了的 的变差,在 的总变差中占的比重,用 表 示。 与简单线性回归中可决系数 的区别只是 不同,多元 回归中 多重可决系数也可表示为,特点: 多重可决系数是模型中解释变量个数的不减函数, 这给对比不同模型的多重可决系数带来缺陷,所以 需要修正。,多重可决系数的矩阵表示,思想 可决系数只涉及变差,没有考虑自由度。如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。 自由度 统计量的自由度指可自由变化的样本观测值个数,它等于所用样本观测值的个数减去对观测值的约束个数。,修正的可决系数,总变差 自由度为 解释了的变差 自由度为 剩余平方和 自由度为 修正的可决系数为,可决系数的修正方法,特点 可决系数 必定非负,但修正的可决系数 可能为负值,这时规定,修正的可决系数 与可决系数 的关系:,
《计量经济学课件---第三章》由会员F****n分享,可在线阅读,更多相关《计量经济学课件---第三章》请在金锄头文库上搜索。