线性回归模型检验方法拓展-三大检验.doc
27页第四章 线性回归模型检验方法拓展——三大检验作为统计推断的核心内容,除了估计未知参数以外,对参数的假设检验是实证分析中的一个重要方面对模型进行各种检验的目的是,改善模型的设定以确保基本假设和估计方法比较适合于数据,同时也是对有关理论有效性的验证一、假设检验的基本理论及准则假设检验的理论依据是“小概率事件原理”,它的一般步骤是(1)建立两个相对(互相排斥)的假设(零假设和备择假设)2)在零假设条件下,寻求用于检验的统计量及其分布3)得出拒绝或接受零假设的判别规则另一方面,对于任何的检验过程,都有可能犯错误,即所谓的第一类错误P(拒绝H0|H0为真)=和第二类错误P(接受H0|H0不真)=在下图,粉红色部分表示P(拒绝H0|H0为真)=黄色部分表示P(接受H0|H0不真)=整理为word格式而犯这两类错误的概率是一种此消彼长的情况,于是如何控制这两个概率,使它们尽可能的都小,就成了寻找优良的检验方法的关键下面简要介绍假设检验的有关基本理论参数显著性检验的思路是,已知总体的分布,其中是未知参数总体真实分布完全由未知参数的取值所决定对提出某种假设,从总体中抽取一个容量为n的样本,确定一个统计量及其分布,决定一个拒绝域,使得,或者对样本观测数据X,。
是显著性水平,即犯第一类错误的概率既然犯两类错误的概率不能同时被控制,所以通常的做法是,限制犯第一类错误的概率,使犯第二类错误的概率尽可能的小,即在 的条件下,使得,达到最大,或,达到最小其中表示总体分布为时,事件的概率,整理为word格式为零假设集合(只含一个点时成为简单原假设,否则称为复杂原假设)为备择假设集合,并且与不能相交由前述可知,当为真时,它被拒绝(亦即H0不真时,接受H0)的概率为,也就是被接受(亦即H0不真时,拒绝H0)的概率是(功效),我们把这个接受的概率称为该检验的势在对未知参数作假设检验时,在固定下,对的每一个值,相应地可求得的值,则定义称为该检验的势函数统计检验的势(函数)主要用于比较假设检验的优劣于是一个好的检验方程是 或 为了理论上的深入研究和表达方便,我们常用函数来表示检验法定义函数它是拒绝域的线性函数,仅取值0或1反之,如果一个函数中只取0或1,则可作为一个拒绝域也就是说,和之间建立了一种对立关系,给出一个就等价于给出了一个检验法,(我们称为检验函数)那么,对于检验法的势函数为于是,一个好的检验法又可写为整理为word格式称满足上式的检验法为最优势检验。
如果对于复杂原假设和备择假设,则称为一致最优势检验() 奈曼—皮尔逊()基本引理给出于是的充要条件定理 设是来自总体分布密度为的样本,为未知参数,对于简单假设检验问题,检验函数是显著性水平为的最优势检验的充要条件是,存在常数,使得满足这就是著名的奈曼—皮尔逊基本引理,需要指出的是,上述定理中的检验函数通常称为似然比检验函数,若记称为似然比统计量如果较大,意味着较大所以在为真时观测到样本点的可能性比为真时观察到样本点的可能性小,因而应拒绝原假设;反之,如果较小则应接受此外,利用,上述定理中的可写为这说明对于简单假设检验问题,似然比检验是最优的,反之最优势检验法也一定是似然比检验法而大量的文献都已证明了传统假设检验中的检验、检验、检验和检验都是最优势检验整理为word格式于是,我们可以放心地回到这部份的主题——计量经济模型的(假设)检验方法二、一般线性框架下的假设检验设多元回归模型为 (2-43)式(2-43)的统计检验通常包括以下三种情况1、单个系数的显著性检验2、若干个回归系数的联合检验3、回归系数线性组合的检验从检验的方面看,考虑以下典型假设 、。
即解释变量对Y没有影响,这是最常见的参数显著性检验 、 是某一具体值例如表示价格弹性,我们也许希望它是-1 、这里的可以看成生产函数中资本和劳动的弹性,此时检验是否规模报酬不变 、或即检验和的系数是否相同 、即检验全部解释变量都对没有影响 、 这里的含义是把向量分为两个子向量和,分别含有和个元素检验就是检验某一些解释变量(的一部分)对没有影响诸如以上的情形都可归于一般的线性框架整理为word格式 (2-44)注意:这里其中是由已知常数构成的矩阵(),r是各元素为常数(一般是0或1)的矩阵于是,对于上述情形,的具体表示为(i)(ii)(iii)(iv)(v)(vi)将上述假设问题一般化,则为了检验这个假设,应先估计出,计算,若其值较“小”,(接近于0),则不应否定原假设;而如果其值较大,那么应对提出怀疑为此我们先考察的分布 对于OLS的,我们知道这里的是所有解释变量观测值组成的矩阵,其中不含全是1的第一列,的数学期望和方差分别是整理为word格式所以于是,在成立的条件下那么,由有关的数理统计知识可知,其中的方差经过构造,服从自由度为的卡方分布,为参数中非零的个数,即 (2-45) 此外,我们还可以证明 (残差平方和的分布)。
因此,由上述两式,可构造在下的F检验统计量 (2-46)注意,(亦即)于是,检验的程序是,如果计算出的F值大于某个事先选定的临界值,则拒绝具体描述如下、此时为为,即主对角线上的第个元素,是一K阶对称方阵因此整理为word格式 (2-47)取平方根 ,这就是传统的关于回归参数显著性的t检验法类似,这里 (2-48)此时也可以计算,比如的95%置信区间,而不用检验关于的具体假设,这个置信区间是给出了两个估计系数的和,而此时,式中,那么于是检验统计量为 (2-49)或者,也可以计算的95%置信区间、类似,可推得此时的检验统计量为整理为word格式 (2-50)、此时 ,,,那么 (2-51)这就是我们熟悉的关于回归方程显著性的F检验这里对应于把分块为,可以证明(过程略)此时 (2-52)其中,是对做线性回归的残差平方和是对所有回归的通过上述示例,我们看到在一般线性框架下的假设检验,它涵盖了经典计量经济分析中的所有统计检验方法。
有了它,我们可以方便地实现许多实证问题中线性意义下的统计检验三、一般线性假设检验的另一种形式 1、“有约束”与“无约束”检验上面第种情况出现的统计量就是这里所说的另一种形式显然是的特殊情况,而事实上我们还将看到其它的情况也可归于另外,还有一个问题,即类似于第种情况的检验与通常带约束的最小二乘估计的关系是什么?也就是说,对未知参数有约束限制的模型进行回归后的结果,与对没有约束限制的模型回归后的参数检验的结果是否一致?整理为word格式下面的具体分析回答了这一问题事实上,无论还是都可以认为用了两种不同回归的结果第一种回归可看作有约束的回归,或者说中的约束条件实际上是对估计方程施加的即中有约束回归是将从回归式中省略掉,或等价地说,令为零;在中,有约束的回归只用了前面一部分变量()而、两种情况的第二种回归是无约束回归,它们都用了所有的变量记无约束模型的残差平方和是,有约束模型的残差平方和是,现在的问题是对某些的显著性检验也就是对应的加入模型后,残差平方和是否显著减少2、带约束条件的最小二乘估计根据上述第种情形,考虑离差形式的回归方程 对其施加约束,代入回归方程或由变量对的回归便可得到的受约束估计值,而这个回归的就是有约束的,即。
实际上,这就是所谓带约束条件的最小二乘估计而有约束的与无约束的之间有什么样的差异?3、“另一种形式”的得到一般地,在约束条件下,求使达到最小的整理为word格式,构造拉格朗日函数 (2-53)运用约束条件下的OLS方法可得到(过程略) (2-54)其中,是无约束的估计量,有约束回归的残差为将其转置,再与其自身相乘,有再把式(2-54)的代入并化简得 (2-55)与式(2-46)相比,即 (2-46)中除外的分子完全相同,这就得到了检验假设的统计量的“另一种形式”为 (2-56)这也恰好说明前面所述的6种检验的情形都可以用上述方式进行,即拟合一个有约束的回归,用有约束模型的残差平方和与无约束模型的残差平方和之差的大小(或记为)来推断原假设是否成立就是说一般的线性假设情形都是的特例,或者式(2-56)所示的F统计量是普遍适应于一般线性假设的一种重要检验方法即整理为word格式 (2-57)其中,和分别是有约束模型和无约束模型的残差平方和,是约束条件个数同时,这也回答了本小节开始的问题,即对于未知参数有约束限制的模型进行回归后的结果,与对无约束限制的模型回归后的参数检验的结果应该是一致的。
四、似然比检验()由前述可知,在统计推断中,古典检验方法是建立在似然比的基础之上由此可见似然比检验()的重要性(当然它的实用性也会在应用中显现出来)奈曼认为(,1928)检验只适用于对线性约束的检验(在张晓峒教授的教科书里如此说,但这个说法可能存在偏颇在Green的第五版教科书里,描述LR方法是可以用于非线性约束检验的)该检验的基本思路是如果约束条件成立,则相应的约束模型与非约束模型的极大似然函数值应该是近似相等(以下简称似然函数)先看一个二元函数的简单例子,设 (1)其对数似然函数为 (2)假设,则上式为 (3)式(3)是性约束(先验)下估计的,故称有约束对数似然函数(RLLF),而式(2)称为无约束对数似然函数(ULLF)为了检验先验约束的真实性,检验使用如下统计量 (4)整理为word格式式中,,为无约束似然函数,为有约束似然函数可以证明,在大样本下,由式(4)给出的统计量服从自由度为假设中约束条件个数的卡方分布本例中线性约束只有一个,所以自由度为1 检验的基本思想是,如果先验约束是真实的,则有约束与无约束的对数似然函数不应有差异这时,式(4)中的将为0。
但如果先验约束不真,则两个对数似然函数必定相异根据统计知识,在大样本下,服从分布,于是能找出这个差异在或上是否在统计上显著,同时根据值原理,还能计算出相应的值一般而言,似然比被定义为原假设下似然函数的最大值与无约束条件下似然函数的最大值的比率前面我们得到了线性回归模型参数的极大似然估计量它们在无约束条件下,使似然函数值最大化把它们代入似然函数可得无约束的最大似然值(推导过程略) (2-58)式中为一常数,与模型中的任何参数无关,是残差平方和另一方面,如果在约束条件下,使似然函数值最大化,令和为有约束的参数估计值,是约束条件下的最大似然值;令和是无约束的参数估计值,无约束的最大值为,则当然不会超过,但如果约束条件“。





