
第七讲多元线性回归方程的检验、预测5教学内容.ppt
37页第七讲 多元线性回归模型 的检验、预测 多元回归的拟合优度检验(R2) 方程总体线性检验显 著性检验(F) 变量的显著性(t)正确的态度为什么要学好计量经济学? 你的人生会有所不同!l 独立思考避免人云亦云l 掌握研究问题的方法实证分析l 提高学历含金量同学存在问题: 存在上课走神的现象 课后不看书 缺乏钻研精神必要说明计量经济学其实很简单! 要有自信心 正确的学习方法知识体系本科计量经济学主要讲什么? 统计检验!l 拟合优度检验R2l 单变量显著性检验t检验l 回归方程的显著性检验F检验 计量经济学检验!l 多重共线性l 异方差性l 自相关性则 总离差平方和的分解多元回归的拟合优度检验=0所以有: 注:必要说明: 可决系数该统计量越接近于1,模型的拟合优度越高 问题:在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大(Why?) 这就给人一个错觉错觉 :要使得模型拟合得好,只要增加解释变量即可 但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整多元回归的拟合优度检验 调整的可决系数(adjusted coefficient of determination) 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。
多元回归的拟合优度检验可决系数与调整的可决系数 *赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC)施瓦茨准则(Schwarz criterion,SC) 这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量 如果计算的F值大于临界值,则拒绝原假设,说明回归模型有显著意义;即所有解释变量联合起来对Y确有显著影响如果计算的F值小于临界值,则不拒绝原假设,说明回归模型没有显著意义;即所有解释变量联合起来对Y没有显著影响方程总体线性的显著性检验(F 检验)方程总体线性的显著性检验(F 检验) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断 即检验模型 Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n中的参数j是否显著不为014总变总变 差 TSS= 自由度 N1 模型解释释了的变变差 ESS= 自由度 K剩余变变差 RSS= 自由度 NK-1 变差来源 平 方 和 自由度 方 差归于回归模型 ESS= k归于剩余 RSS= n-k-1总变差 TSS= n-1基本思想: 如果多个解释变量联合起来对被解释变量的影响不显著, “归于回归的方差“ 比“归于剩余的方差”显著地小应是大概率事件。
方差分析表方程总体线性的显著性检验 可提出如下原假设与备择假设: H0: 0=1=2= =k=0 H1: j不全为0 F检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS 如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存性关系,反之总体上可能不存性关系 因此,可通过该比值的大小对总体线性关系进行推断 根据数理统计学中的知识,在原假设H0成立的条件下,统计量 服从自由度为(k , n-k-1)的F分布 给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过 F F(k,n-k-1) 或 FF(k,n-k-1) 来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立 H0: 0=1=2= =k=0 H1: j不全为0方程总体线性的显著性检验关于拟合优度检验与方程显著性检验关系的讨论 由可推出:与或变量的显著性的假设检验(t 检验) 方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中 这一检验是由对变量的 t 检验完成的变量的显著性的假设检验(t 检验) 由于 以cii表示矩阵(XX)-1 主对角线上的第i个元素,于是参数估计量的方差为: 其中2为随机误差项的方差,在实际计算时,用它的估计量代替: 变量的显著性的假设检验(t 检验)因此,可构造如下t统计量 变量的显著性的假设检验(t 检验)(j=1,2,k)变量的显著性的假设检验(t 检验) 设计原假设与备择假设: H1:i0 给定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过 |t| t/2(n-k-1) 或 |t|t/2(n-k-1)来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。
H0:i=0 (i=1,2k) 24注意:一元线性回归中,t检验与F检验一致 一方面,t检验与F检验都是对相同的原假设H0:1=0 进行检验; 另一方面,两个统计量之间有如下关系: 对各回归系数假设检验的作法25给定显著性水平,查t分布表的临界值为如果 就不拒绝 ,而拒绝 即认为 所对应的解释变量 对被解释变量Y的影响不显著 如果 就拒绝 而不拒绝 即认为 所对应的解释变量 对被解释变量Y的影响是 显著的案例分析一例3.5.1 建立中国城镇居民食品消费需求函数模型 根据需求理论,居民对食品的消费需求函数大致为: Q:居民对食品的需求量,X:消费者的消费支出总额P1:食品价格指数,P0:居民消费价格总指数 (*)案例分析 零阶齐次性,当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变 (*)为了进行比较,将同时估计(*)式与(*)式 案例分析 根据恩格尔定律,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系: 首先,确定具体的函数形式对数变换: (*)案例分析考虑到零阶齐次性时(*)式也可看成是对(*)式施加如下约束而得:因此,对(*)式进行回归,就意味着原需求函数满足零阶齐次性条件。
)案例分析对(*)式回归结果案例分析对(*)式回归结果案例分析中国城镇居民对食品的消费需求模型: 可改写为:(*)式回归结果(*)式回归结果案例分析二研究的目的要求 为了研究影响中国地方财政教育支出差异的主要原因,分析地方财政教育支出增长的数量规律,预测中国地方财政教育支出的增长趋势,需要建立计量经济模型研究范围:2011年31个省市区的数据为样本理论分析:影响中国地方财政教育支出的主要的因素有:(1)由地区经济规模决定的地方整体财力;(2)地区人口数量不同决定各地教育规模不同;(3)人民对教育质量的需求对以政府教育投入为代表的公共财政的需求会有相当的影响4)物价水平,影响地方财政对教育的支出5)地方政府对教育投入的能力与意愿模型设定 选择地方财政教育支出为被解释变量 选择“地区生产总值(GDP)”作为地区经济规模的代表; 选择各地区的“年末人口数量”作为各地区居民对教育规模的需求的代表; 选择“居民平均每人教育现金消费”作为代表居民对教育质量的需求; 选择居民教育消费价格指数作为价格变动影响的因素; 由于地方政府教育投入的能力与意愿难以直接量化,选择“教育支出在地方财政支出中的比重”作为其代表。
模型估计的结果为:经济意义检验:在假定其它变量不变的情况下, 地区生产总值(GDP)每增长1亿元,平均说来地方财政教育支出将增长0.0112亿元; 地区年末人口每增长1万人,平均说来地方财政教育支出会增长0.0395亿元; 当居民平均每人教育现金消费增加1元,平均说来地方财政教育支出会增长0.1460亿元; 当居民教育消费价格指数增加1个百分点,平均说来地方财政教育支出会增长22.8162亿元 当教育支出在地方财政支出中的比重增加1%,平均说来地方财政教育支出会增长866.41亿元拟合优度: ,修正的可决系数为 ,说明模型对样本的拟合很好F检验:针对 ,给定显著性水平 ,查F分布表自由度为k-1=5和n-k=25的临界值为 由于F=181.75392.61 ,应拒绝原假设 ,说明回归方程显著统计检验t检验?。












