
计量经济学第6章假设检验.ppt
38页第第6章章 回归模型的假设检验回归模型的假设检验 回归分析回归分析是要判断解释变量解释变量X是否是被解释变被解释变量量Y的一个显著性的影响因素 在一元线性模型一元线性模型中,就是要判断X是否对Y具有显著的线性性影响这就需要进行变量的显著性变量的显著性检验 变量的显著性检验所应用的方法是数理统计学变量的显著性检验所应用的方法是数理统计学中的中的假设检验假设检验 计量经计学中计量经计学中,主要是针对变量的参数真值是,主要是针对变量的参数真值是否为零来进行显著性检验的否为零来进行显著性检验的 第一节第一节 假设检验假设检验 • 所谓假设检验假设检验,就是事先对总体参数或总体分就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设有显著差异,从而决定是否接受或否定原假设• 假设检验采用的逻辑推理方法是反证法假设检验采用的逻辑推理方法是反证法。
先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设• 判断结果合理与否,是基于判断结果合理与否,是基于“小概率事件不易小概率事件不易发生发生”这一原理的这一原理的 1、显著性检验、显著性检验—t检验检验 t t值是用来检验根据值是用来检验根据OLSOLS估计出来的回归系数是否显著估计出来的回归系数是否显著的统计量的统计量 检验步骤:检验步骤: (1)对总体参数提出假设 H0: 1=0, H1:10(2)以原假设H0构造t统计量,并由样本计算其值(3)给定显著性水平,查t分布表,得临界值t /2(n-2)(4) 比较,判断 若 |t|> t /2(n-2),则拒绝H0 ,接受H1 ; 若 |t| t /2(n-2),则拒绝H1 ,接受H0 ;T= 对于一元线性回归方程中的0,可构造如下t统计量进行显著性检验: 在上述收入-消费支出例中,首先计算2的估计值 t统计量的计算结果分别为: 给定显著性水平=0.05,查t分布表得临界值 t 0.05/2(8)=2.306 |t1|>2.306,说明家庭可支配收入在家庭可支配收入在95%95%的置信的置信度下显著,即是消费支出的主要解释变量;度下显著,即是消费支出的主要解释变量; |t2|<2.306,表明在95%的置信度下,无法拒绝截距项为零的假设。
2、显著性检验、显著性检验—F检验检验 F检验属于回归方程的显著性检验,它是对所有参数感兴趣的一种显著性检验其检验步骤为: 第一步:提出假设 原假设H0: ( 同时为零) 备择假设H1: 不同时为零=0第二步:构造F统计量可以证明:(2.4.6)即F统计量服从第一自由度为1,第二自由度为n-2的t分布F统计量的计算一般通过下列方差分析表进行第三步:给定显著水平 ,查F分布临界值得到第四步:做出统计决策[例2.3.2]仍以例2.2.1资料为例,F检验过程如下: 第一步:提出假设 原假设H0: ( 同时为零) 备择假设H1: 不同时为零=0第二步:计算F统计量 因为ESS=1602708.6 (计算过程见表2.4.3) 或直接取自输出结果2.2.1中的方差分析部分“回归分析(行) SS(列)”(1602708.6) =40158.071 (计算过程见计算表2.3.3) 或直接取自输出结果2.2.1中的方差分析部分“残差(行) SS(列)”(40158.071)。
见方差分析表2.3.4)或直接取自输出结果2.2.1中的方差分析部分“回归分析(行) F(列)”(399.09999)见表2.4.4) ,所以我们拒绝原假设0Hy的线性相关,接受备择假设,认为x与y 关系显著即回归方程显著,F检验通过 因为F=399.09999三,结构变化的三,结构变化的F检验检验 结构变化的F检验,也成为Chow test,用于调查,检验经济分析中一个极其重要的问题,即“是否存在结构变化”步骤步骤1:在利用时间序列所做的回归分析中,找出估算期间内发生结构变化的时点(分界点),以此时点为标准,将期间分为前期和后期步骤步骤2::对前期,后期,全部期间进行回归分析,求各自的残差平方和 步骤步骤3::根据结构变化的F检验公式,计算F值步骤步骤4: 利用F分布表,对步骤3计算出的F值进行检验在检验时,分别就上述(1)的情形中,自由度(分子,分母)= ,(2)的情形中,自由度 进行F检验 如果计算出的F值大于F分布表中的判定值,放弃“前期的回归系数与后期的回归系数完全相等”的假设,说明出现了结构性变化。
相反,如果计算出的F值小于F分布表中的判定值,不放弃“前期的回归系数与后期的回归系数完全相等”的假设,说明没有发生结构性变化4、相关系数检验(r-Test)由于一元线性回归方程研究的是变量x与变量y之间的线性相关关系,所以我们可以用反映变量x与变量y之间的相关关系密切程度的相关系数来检验回归方程的显著性 由于总体相关系数定义为为x与y的简单线性相关系数,简称相关系数它表示x和y的线性相 关关系的密切程度其取值范围为|r| 1,即-1 r 1当r=-1时,表示x与y之间完全负相关; 当r=1时,表示x与y之间完全正相关;当r=0时,表示x与y之间无线性相关关系,即说明x与y可能无相关关系或x与y之间存在非线性相关关系5、四种检验的关系 前面介绍了t检验、拟合优度( )检验、F检验和相关系数(r)检验,对于一元线性回归方程来说,可以证明,这四种检验:(2.4.8)(2.4.9)(2.4.10)(2.4.11)因此,对于一元线性回归方程,我们只需作其中的一种检验即可但对于多元线性回归方程这四种检验有着不同的意义,并不是等价的,需分别进行检验是等价的。
5、回归方程的标准记法 为了方便,我们往往将回归方程的参数估计和系数的显著性检验统计量结果放在一起例如,对于例2.2.1,我们可以采用以下标准记法: =363.6891 + 2.028873x S=(62.455288) (0.101558) t=( )( ) 有时S(回归系数的标准差,有时也记为 )也可不写;t统计量右上角*的表示显著性水平的大小,**一般表示在显著性水平1%下显著,*一般表示在显著性水平5%下显著,无*表示5%下不显著 第第2节节 预测与控制预测与控制 一、预测一、预测 (点预测、区间预测)(点预测、区间预测)二、控制二、控制 对于一元线性回归模型给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0 0 ,可以此作为其条件均值条件均值E(Y|X=X0)或个别值个别值Y0的一个近似估计注意:注意:严格地说,这只是被解释变量的预测值的估计值,而不是预测值 原因:(1)参数估计量不确定; (2)随机项的影响一、预测(一)点预测于是,我们把点预测分为两种:一是平均值的点预测,二是个别值的点预测。
利用回归方程,对于x的一个固定值,推算出y的平均值的一个估计值,就是平均值的点预测;如果对于x的一个特定值,推算出y的一个个别值的估计值,则属于个别值的点预测例2.5.1仍以例2.2.1资料为例,若要估计广告费用为1000万元时,所有12个汽车销售分公司的汽车 销售量的平均数为 就是平均值的点预测;若要估计广告费用为602万元的那个汽车销售分公司的汽车销售量为 就属于个别值的点预测 ( (二二) )、区间预测值、区间预测值 1、总体均值预测值的置信区间、总体均值预测值的置信区间 由于于是可以证明 因此故其中于是,在1-的置信度下,总体均值总体均值E(Y|X0)的置信区间为的置信区间为 2、总体个值预测值的预测区间、总体个值预测值的预测区间 由 Y0=0+1X0+ 知:于是 式中 :从而在1-的置信度下, Y0的置信区间的置信区间为在上述收入收入-消费支出消费支出例中,得到的样本回归函数为则在 X0=1000处, Ŷ0 = –103.172+0.777×1000=673.84 而因此,总体均值总体均值E(Y|X=1000)的95%的置信区间为: 673.84-2.30661.05< E(Y|X=1000) <673.84+2.30661.05或 (533.05, 814.62) 同样地,对于Y在X=1000的个体值个体值,其95%的置信区间为: 673.84 - 2.30661.05 二、控制所谓控制实际上就是预测的反问题 即若因变量y取值于一定范围内,例如 , 已经给定,求自变量x应控制在什么范围内这等价于求 与 ,使得当 时,因变量y以1- 的概率取值于 对于个别值的区间预测由但应注意,要实现控制必须 ,即应有同理,对于平均值的区间预测由第第3 3节节 案例:案例:一元线性回归模一元线性回归模型的应用型的应用 已知某地区1978年~2003年的国内生产总值GDP与货运周转量的数据如下表所示:试对其进行一元线性回归分析若2005年国内生产总值GDP达到80亿元,试对其货运周转量做出区间预测 一、相关分析 绘制散点图,以观察国内生产总值GDP与货运周转量之间的关系形态 用Excel软件制作散点图的步骤如下: 第一步:选择“插入”下拉菜单 第二步:选择“图表”选项 第三步:选择XY散点图。 第四步:输入数据区域第五步:定义X轴为“国内生产总值GDP”、Y轴为“货运周转量” 第六步:选择新工作表插入还是作为其中的对象插入(在这里我们选择作为其中的对象插入)按“完成”图形如2.6.1所示由图2.6.1可以看出,国内生产总值GDP与货运周转量之间具有线性相关关系于是我们可以对国内生产总值x与货运周转量y建立一元线性回归方程 二、回归分析 用Excel软件进行回归计算的步骤如下:第一步:选择“工具”下拉菜单第二步:选择“数据分析”选项第三步:在分析工具中,选择“回归”,然后按“确定”第四步:定义自变量、因变量、置信度、输出区域选择“确定”后得到如输出结果62.6.1所示输出结果包括三部分内容: 第一部分是“回归统计”给出了相关系数(Multiple R)、可决系数(R Square)、修正的可决系数(Adjusted R Square)、标准误差和观测值的个数第二部分是“方差分析”给出了自由度(df)、回归平方和与残差平方和(SS)、回归平方和与残差平方和的均方(MS)、F统计量和F检验的显著水平(SignificanceF) 第三部分是参数估计的有关内容给出了回归方程的截距(Intercept)的估计值 (Coefficients)、斜率(X Variable 1)的估计值(Coefficients)、截距和斜率标准误差 t检验中的t统计量(t Stat)、P-值.(P-value)以及截距和斜率标准误差、t检验中的t统计量、P-值。 由输出结果2.6.1知,;Significance F=1.395E-21;P-value=1.395E-21<5%;R=0.9893081;R2=0.9787304; = 1.8803252。












