
第10章模型设定.ppt
45页中南财经政法大学中南财经政法大学刘康泽刘康泽第第第第10 10 10 10章章章章 模型设定模型设定模型设定模型设定 信息系刘康泽信息系刘康泽主要内容主要内容n第一节第一节 选择函数形式选择函数形式 n第二节第二节 模型设定模型设定n第三节第三节 数据问题数据问题 信息系刘康泽信息系刘康泽 为了考察某种经济关系,首先形成一个回归模型,如:为了考察某种经济关系,首先形成一个回归模型,如: 如果如果R2,,t 统计量等令人满意,则接受该模型;否则检验多重统计量等令人满意,则接受该模型;否则检验多重共线性,异方差性和自相关性等等,并进行相关的处置若结果仍共线性,异方差性和自相关性等等,并进行相关的处置若结果仍不能令人满意,则认为模型存在不能令人满意,则认为模型存在“设定误差设定误差”,因此对模型进行修,因此对模型进行修正,这一方法称为正,这一方法称为“一般经济回归一般经济回归”((AER)信息系刘康泽信息系刘康泽 选择模型的基本原则如下:选择模型的基本原则如下: ((1))可识别性可识别性,即能从样本资料唯一地估计参数;,即能从样本资料唯一地估计参数; ((2))拟合性拟合性,即,即R2较高;较高; ((3))经济性经济性,用尽可能少的变量;,用尽可能少的变量; ((4))理论的一致性理论的一致性,与经过检验的理论要符合;,与经过检验的理论要符合; ((5))预测有效性预测有效性。
信息系刘康泽信息系刘康泽第一节第一节 选择函数形式选择函数形式 在前面的回归分析中,在前面的回归分析中,解释变量的选取主要是根据经济理论、解释变量的选取主要是根据经济理论、直觉、以往经验和其他研究来选择的直觉、以往经验和其他研究来选择的 并且在讨论过程中都假设被并且在讨论过程中都假设被解释变量和解释变量之间的关系是线性的但是有时候这个假设是解释变量和解释变量之间的关系是线性的但是有时候这个假设是很糟糕的例如根据经济理论,我们知道平均成本曲线呈很糟糕的例如根据经济理论,我们知道平均成本曲线呈U形,如形,如果我们对平均成本曲线进行估计,那么线性假设就有问题了因此果我们对平均成本曲线进行估计,那么线性假设就有问题了因此模型中函数形式的选择非常关键可以通过选择适当的变换将许多模型中函数形式的选择非常关键可以通过选择适当的变换将许多模型转化为线性模型:模型转化为线性模型:自变量与因变量的代换,参数代换和方程的自变量与因变量的代换,参数代换和方程的转化转化信息系刘康泽信息系刘康泽一一 变量代换变量代换 1、一般形式、一般形式 给定变量给定变量w, z1, z2, …z3的非线性模型的非线性模型:信息系刘康泽信息系刘康泽 例如:例如: ((1)平均固定成本)平均固定成本AFC与产量与产量q 的关系的关系;; ((2))Phillips曲线:货币工资的增长率和失业率的关系曲线:货币工资的增长率和失业率的关系;; ((3))Engel曲线:食物消费支出比重与收入之间的关系曲线:食物消费支出比重与收入之间的关系。
2、倒数函数模型、倒数函数模型信息系刘康泽信息系刘康泽 3、指数函数模型(常数增长率模型)、指数函数模型(常数增长率模型)信息系刘康泽信息系刘康泽 4、对数线性模型(常弹性模型、对数线性模型(常弹性模型)) 弹性弹性 比如比如: Cobb-Douglas函数函数信息系刘康泽信息系刘康泽二二 参数代换参数代换 设设 一般形式一般形式 是一个单射,因此可以解出是一个单射,因此可以解出 模型模型 关于关于 一般不是线性的,但是可以通一般不是线性的,但是可以通过变换过变换 变成线性的变成线性的 若若 为为 的点估计,则的点估计,则 作为作为 的点估计的点估计信息系刘康泽信息系刘康泽双对数双对数对数对数对数二次对数二次对数倒数对数倒数对数线性对数线性交互作用交互作用二次函数二次函数倒数倒数线性对数线性对数线性函数线性函数弹性弹性((x/y))(dy/dx)边际效用边际效用dy/dx函数形式函数形式名称名称信息系刘康泽信息系刘康泽第二节第二节 模型设定模型设定 模模型型的的正正确确设设定定是是非非常常重重要要的的,,如如果果模模型型设设定定正正确确,,接接下下来来就就是是估估计计参参数数和和假假设设检检验验,,如如果果得得到到的的R2、、t、、F和和D·W统统计计量量都都是是令令人满意的,则所选择的模型在某种程度上是正确的。
人满意的,则所选择的模型在某种程度上是正确的 如如果果其其中中的的一一个个或或多多个个统统计计量量不不是是令令人人满满意意,,有有多多种种情情况况::一一是是估计方法可能有问题;二是模型的设定有问题估计方法可能有问题;二是模型的设定有问题 一一 设定误差设定误差 设定误差的产生往往是由于我们在设定误差的产生往往是由于我们在选择变量选择变量、、函数形式函数形式和和误差误差结构结构(即随机误差项及其性质)时犯错误造成的即随机误差项及其性质)时犯错误造成的 信息系刘康泽信息系刘康泽 1、、 省略重要变量省略重要变量 假设真实的模型为假设真实的模型为 而我们选择了模型而我们选择了模型 造成的造成的后果后果有:有: ((1)估计的参数估计量时)估计的参数估计量时有偏的有偏的,从而,从而预测是无意义的预测是无意义的;; ((2)参数的估计方差通常也是有偏的,所以)参数的估计方差通常也是有偏的,所以假设检验是无假设检验是无 效的效的。
信息系刘康泽信息系刘康泽 丢失变量的诊断丢失变量的诊断:: 此检验用以察看对现有模型添加某些变量以后,新变量是否此检验用以察看对现有模型添加某些变量以后,新变量是否对因变量的解释有显著性贡献对因变量的解释有显著性贡献 原假设原假设H0: 检验统计量为检验统计量为: 新模型的对数似然值新模型的对数似然值 渐进地服从自由度为渐进地服从自由度为m的的 分布分布m=1为新为新加入的变量的个数加入的变量的个数若若 ,则,则拒绝拒绝H0原来的对数似然值原来的对数似然值信息系刘康泽信息系刘康泽 2、、 加入无关变量加入无关变量 假设真实的模型为假设真实的模型为 而我们选择了模型而我们选择了模型 造成的造成的后果后果有:有: ((1)估计的参数估计量是)估计的参数估计量是无偏和一致估计无偏和一致估计,但,但不是有效的不是有效的;; ((2)参数的估计方差通常也是无偏的,所以)参数的估计方差通常也是无偏的,所以假设检验是有假设检验是有 效的效的。
信息系刘康泽信息系刘康泽从传统建模理论到约化建模理论从传统建模理论到约化建模理论 n1 1、传统建模理论与数据开采问题、传统建模理论与数据开采问题 n2 2、、““从一般到简单从一般到简单””————约化建模型理论约化建模型理论 n3 3、非嵌套假设检验、非嵌套假设检验 n4 4、约化模型的准则、约化模型的准则 二二 模型建立方法模型建立方法 信息系刘康泽信息系刘康泽 亨德瑞的约化建模理论,吸收了向量自回归建模法与亨德瑞的约化建模理论,吸收了向量自回归建模法与协整理论的部分内容,提出了协整理论的部分内容,提出了““从一般到简单从一般到简单””的建模的建模思想思想,在现代计量经济建模理论方面有着较大影响在现代计量经济建模理论方面有着较大影响 20世纪世纪70年代中叶以来,计量经济学建模方法与建模年代中叶以来,计量经济学建模方法与建模理论得到了迅速发展出现了利莫尔(理论得到了迅速发展出现了利莫尔(Leamer))的的贝叶贝叶斯建模方法斯建模方法,西姆斯(,西姆斯(Sims))的的向量自回归建模型法向量自回归建模型法、亨、亨德瑞(德瑞(Hendry))的的约化建模理论约化建模理论以及以及协整建模理论协整建模理论。
这这些现代建模理论是在对传统建模理论的不断质疑与修正中些现代建模理论是在对传统建模理论的不断质疑与修正中发展起来的,发展起来的, 信息系刘康泽信息系刘康泽 1 1、传统建模理论与数据开采问题、传统建模理论与数据开采问题 传统计量经济学的主导建模理论是传统计量经济学的主导建模理论是““结构模型方法论结构模型方法论””:: 以先验给定的经济理论为建立模型的出发点,以先验给定的经济理论为建立模型的出发点, 以模型参数的估计为重心,以模型参数的估计为重心, 以参数估计值与其理论预期值相一致为判断标准,以参数估计值与其理论预期值相一致为判断标准, 是一个是一个““从简单到复杂从简单到复杂””的建模过程(的建模过程(simple-to-general approach)): : 对不同变量及其数据的偿试与筛选过程对不同变量及其数据的偿试与筛选过程. . 从有信心的基本设定开始,然后再看是不是应该增加变从有信心的基本设定开始,然后再看是不是应该增加变量,此方法中常用到的一个诊断工具是量,此方法中常用到的一个诊断工具是Lagrange乘数乘数((LM))检验检验。
信息系刘康泽信息系刘康泽 设模型为:设模型为: 如果模型增加如果模型增加m-k个新变量,模型变为:个新变量,模型变为: 因此需要检验的假设为:因此需要检验的假设为: 信息系刘康泽信息系刘康泽 LM检验法的步骤如下:检验法的步骤如下: 步骤步骤1::使用使用OLS方法估计模型(方法估计模型(1)中的参数,并得到残差)中的参数,并得到残差 ;; 步骤步骤2::让让 对常量和所有的变量对常量和所有的变量x回归(此二次回归通常称为回归(此二次回归通常称为辅助回归辅助回归),并求得),并求得R2 步骤步骤3::给定显著性水平给定显著性水平 ,如果,如果 ,就拒绝,就拒绝原假设信息系刘康泽信息系刘康泽 这种传统的建模方法却有着某些固有的缺陷其中备受这种传统的建模方法却有着某些固有的缺陷其中备受质疑的是这种建模过程的所谓质疑的是这种建模过程的所谓““数据开采数据开采””((Data minimg))问题 数据开采数据开采: :对不同变量及其数据的偿试与筛选对不同变量及其数据的偿试与筛选 这一过程对最终选择的变量的这一过程对最终选择的变量的t t 检验产生较大影响检验产生较大影响 当在众多备选变量中选择变量进入模型时,其中当在众多备选变量中选择变量进入模型时,其中t t 检验检验的真实的显著性水平已不再是事先给出的名义显著性水平。
的真实的显著性水平已不再是事先给出的名义显著性水平 显著性水平意味着将一个无关变量作为相关变量选入模显著性水平意味着将一个无关变量作为相关变量选入模型而犯错误的概率型而犯错误的概率 信息系刘康泽信息系刘康泽 罗维尔(罗维尔(Lovell))给出了一个从给出了一个从c个备选变量中选取个备选变量中选取k个变量进入模型时,真实显著性水平个变量进入模型时,真实显著性水平 *与名义显著性与名义显著性水平水平 的关系:的关系: *=1-(1- )c/k 如:如: 给定给定 =5%,,如果如果有有2 2个相互独立且与被解释变个相互独立且与被解释变量无关的备选变量,误选一个进入模型的概率就成了量无关的备选变量,误选一个进入模型的概率就成了 1-(1-0.05)2=0.0975 传统建模方法的另一问题是它的传统建模方法的另一问题是它的“随意性随意性” 其结果是:对同一研究对象,使用同一数据,但不同其结果是:对同一研究对象,使用同一数据,但不同的建模者往往得出不同的最终模型的建模者往往得出不同的最终模型。
信息系刘康泽信息系刘康泽2 2、、““从一般到简单从一般到简单””————约化建模型理论约化建模型理论 该该理理论论认认为为::在在模模型型的的最最初初设设定定上上,,就就设设立立一一个个“一一般般”的的模模型型,,它它包包括括了了所所有有先先验验经经济济理理论论与与假假设设中中所所应应包包括括的的全全部部变变量量,,各各种种可可能能的的“简简单单”模模型型都都被被“嵌嵌套套”((nested))在在这这个个“一一般般”的的模模型型之之中中然然后后在在模模型型的的估估计计过过程程中中逐逐渐渐剔剔除除不不显显著著的的变变量量,,最最后后得得到到一一个个较较“简单简单”的最终模型的最终模型 这这就就是是所所谓谓的的“从从一一般般到到简简单单”((general-to-specific))的建模理论的建模理论信息系刘康泽信息系刘康泽 (1)(1)约化建模理论提出了一个对不同先验假设的更为系约化建模理论提出了一个对不同先验假设的更为系统的检验程序;统的检验程序; (2) (2) 初始模型就是一个包括所有可能变量的初始模型就是一个包括所有可能变量的““一般一般””模模型,也就避免了过度的型,也就避免了过度的““数据开采数据开采””问题;问题; (3)(3)由于初始模型的由于初始模型的““一般一般””性,所有研究者的性,所有研究者的““起点起点””都有是相同的,因此,都有是相同的,因此,在相同的约化程序下,最后得到在相同的约化程序下,最后得到的最终模型也应该是相同的的最终模型也应该是相同的。
特点:特点:信息系刘康泽信息系刘康泽 “ “从一般到简单从一般到简单””的建模理论的建模理论 例例: 建立一个中国城镇居民食品消费模型:建立一个中国城镇居民食品消费模型: Q=f(X,P1,P0)然然而而,,有有理理由由认认为为X、、P1、、P0的的变变化化可可能能会会经经过过一一段段时时期期才才会会对对Q起起作作用用,,因因为为消消费费者者固固有有的的消消费费习习惯惯是是不不易易改改变的于是,可建立如下更变的于是,可建立如下更“一般一般”的模型:的模型:tttttttttPPPPXX d dd dg gg gb bb ba aa a+ ++ ++ ++ ++ ++ ++ ++ += =- -- -- -- -1010111211121110lnlnlnlnlnlnlnln信息系刘康泽信息系刘康泽 在估计该模型之前,并不知道食品消费需求是怎样在估计该模型之前,并不知道食品消费需求是怎样决定的,但可以考察几种可能的情况决定的,但可以考察几种可能的情况: :tttttPPXQ d dg gb ba a+ ++ ++ ++ += =011110lnlnlnln也可以认为,也可以认为,(2)(2)由于食品是必需品,由于食品是必需品,P1 1的变化并不对的变化并不对Q产生影响,但仍受产生影响,但仍受P0 0与与X变动的影响,然而后者的影响却变动的影响,然而后者的影响却有着一期的滞后:有着一期的滞后: ttttttPPXXQ d dd db bb ba a+ ++ ++ ++ ++ += =- -- -102011210lnlnlnlnln 如如,,(1)(1)对食品的消费需求是一个对食品的消费需求是一个““静态静态””行为,只有行为,只有当期的因素发生作用:当期的因素发生作用: 可以看出,可以看出,( (*)、、( (**)都是都是原一般模型原一般模型的特例,即都的特例,即都可通过对可通过对原一般模型原一般模型施加约束得到。
施加约束得到 ((*))((**))信息系刘康泽信息系刘康泽 如果一个模型可通过对如果一个模型可通过对““一般一般””模型施加约束得到,模型施加约束得到,则称该模型则称该模型““嵌套嵌套””在一般模型之中在一般模型之中 tttttttttPPPPXX d dd dg gg gb bb ba aa a+ ++ ++ ++ ++ ++ ++ ++ += =- -- -- -- -1010111211121110lnlnlnlnlnlnlnlnttttttPPXXQ d dd db bb ba a+ ++ ++ ++ ++ += =- -- -102011210lnlnlnlnln 约束约束:: 1= 1= 2=0tttttPPXQ d dg gb ba a+ ++ ++ ++ += =011110lnlnlnln约束约束:: 1= 2= 2= 2=0ttttttPPPXQ g gb ba a+ ++ ++ += =)/ln()/ln(ln011010 约束约束:: 1+ 1+ 1=0 信息系刘康泽信息系刘康泽 一般地,一个一般地,一个““一般模型一般模型””具有如下两个重要特性:具有如下两个重要特性: 第第一一,,与与所所考考察察问问题题相相关关的的不不同同的的先先验验理理论论与与假假设设都都“嵌套嵌套”在该一般模型中;在该一般模型中; 第第二二,,能能较较好好地地拟拟合合数数据据,,并并能能满满足足模模型型设设定定偏偏误误的的各各种检验。
种检验 该该两两条条性性质质是是相相互互关关联联的的例例如如,,如如果果某某一一重重要要理理论论被被忽忽略略,,则则相相关关的的变变量量也也就就被被排排除除在在该该“一一般般”模模型型之之外外,,从而使得该模型不能通过模型设定偏误的多种检验从而使得该模型不能通过模型设定偏误的多种检验 一一个个“一一般般”的的模模型型是是能能够够进进行行诸诸如如遗遗漏漏相相关关变变量量、、多多选无关变量以及误设函数形式的多种设定偏误检验的选无关变量以及误设函数形式的多种设定偏误检验的信息系刘康泽信息系刘康泽 ““从一般到简单从一般到简单””的建模程序面临的主要问题的建模程序面临的主要问题在于无在于无法在两个没有嵌套关系的模型间进行选择法在两个没有嵌套关系的模型间进行选择 这时,可能通过通常的拟合优度检验、池赤信息准则这时,可能通过通常的拟合优度检验、池赤信息准则来帮助决策,更主要的检验是来帮助决策,更主要的检验是非嵌套假设检验非嵌套假设检验 3 3、非嵌套假设检验、非嵌套假设检验 假设要检验下面两个非嵌套模型:假设要检验下面两个非嵌套模型: H0: Y= 0+ 1X+ 2Z+ H1: Y= 0+ 1X+ 2W+ 信息系刘康泽信息系刘康泽 上述两模型之间没有嵌套关系,无法进行约束检验。
上述两模型之间没有嵌套关系,无法进行约束检验 同时,同时,H0与与H1不是对立假设,拒绝假设不是对立假设,拒绝假设H0未必意味未必意味着接受假设着接受假设H1因此,因此,通常的假设检验程序无法直接使通常的假设检验程序无法直接使用 g gg gg gg g+ ++ ++ ++ += =WZXY3210于是,可针对一般模型于是,可针对一般模型(*)(*)分别检验分别检验H0与与H1 (*) 为此,一种称为为此,一种称为包容性包容性F 检验检验((encompassing F tests))被提了出来这种检验是人为地构造一个被提了出来这种检验是人为地构造一个““一般一般””模型:模型:信息系刘康泽信息系刘康泽n包容性包容性F检验主要存在以下问题检验主要存在以下问题: :(1)(1)人为构造的一般模型没有实际的经济意义人为构造的一般模型没有实际的经济意义,尤其在,尤其在H0与与H1分别反映两种对立的经济理论的情况下更是如此;分别反映两种对立的经济理论的情况下更是如此;(2)(2)有可能出现同时接受或拒绝有可能出现同时接受或拒绝H0与与H1的现象的现象;;(3)(3)当当Z与与W高度相关时,往往导致既不能拒绝高度相关时,往往导致既不能拒绝H0 ,,也不也不能拒绝能拒绝H1 ,,因为在一般模型中去掉任何一个变量,都因为在一般模型中去掉任何一个变量,都不会使拟合优度下降很多。
不会使拟合优度下降很多 信息系刘康泽信息系刘康泽另一个解决办法是建立如下的一般模型:另一个解决办法是建立如下的一般模型: 如果如果 =0,则为模型,则为模型H0,, 如果如果 =1,则为模型,则为模型H1 因此,可通过检验施加的约束因此,可通过检验施加的约束 =0是否为真来判断是否为真来判断H0是否为正选模型是否为正选模型 问题是由该模型无法直接估计出问题是由该模型无法直接估计出 的值戴维森的值戴维森((Davidson))和麦金农(和麦金农(Mackinnon))建议通过下面步骤建议通过下面步骤估计估计 :: ( () )( () )( () )e ea aa aa a b bb bb b + ++ ++ ++ ++ ++ +- -= =WXZXY2102101信息系刘康泽信息系刘康泽 第一步第一步,对模型,对模型H1进行进行OLS估计,得到估计,得到Ŷ:: 第二步第二步,用估计值代替,用估计值代替““一般模型一般模型””中的中的 0+ 1X+ 2W,,并进行并进行OLS估计:估计: 戴维森和麦金农证明:戴维森和麦金农证明:在大样本下,在大样本下,H H0 0为真时为真时,, 的的OLSOLS估计量的估计量的t t统计量服从标准正态分布统计量服从标准正态分布:: t t~N N(0,1)(0,1)。
因此,如果因此,如果 的的t 统计量的绝对值大于给定显著性水统计量的绝对值大于给定显著性水平下的临界值,就拒绝模型平下的临界值,就拒绝模型H0信息系刘康泽信息系刘康泽 如果要检验模型如果要检验模型H1是否为真是否为真,仍可通过上面两个步骤,仍可通过上面两个步骤进行,但需先对进行,但需先对H0进行进行OLS估计,得到估计,得到Ŷ,,以它为另一以它为另一解释变量估计如下模型:解释变量估计如下模型: 如果如果 显著地异于显著地异于0,则拒绝模型,则拒绝模型H1为真的假设为真的假设 该非嵌套假设检验也被称为该非嵌套假设检验也被称为J检验检验((J test),),因为需因为需将两非嵌套模型联合起来进行参数的联合估计(将两非嵌套模型联合起来进行参数的联合估计(joint estimation) 注意注意::(1)(1)拒绝拒绝H H0 0( (或或H H1 1) )不意味着接受不意味着接受H H1 1( (或或H H0 0) );;(2)(2)J检检验仍然存在同时接受或拒绝验仍然存在同时接受或拒绝H0与与H1的现象 信息系刘康泽信息系刘康泽4 4、约化模型的准则、约化模型的准则 从一般到简单的建模过程,同样存在着从一般到简单的建模过程,同样存在着数据开采问题数据开采问题。
一个一个““一般一般””模型经过模型经过k步约化后得到最终的简化模步约化后得到最终的简化模型,可以证明,每一步中的名义显著性水平型,可以证明,每一步中的名义显著性水平 与最终模型与最终模型中各种检验的实际显著性水平中各种检验的实际显著性水平 *间有如下关系:间有如下关系: *=1-(1- )k信息系刘康泽信息系刘康泽 然而,与然而,与““从简单到复杂从简单到复杂””这一传统建模方法相比,这一传统建模方法相比,““从一般到简单从一般到简单””的建模过程能够展现模型建立的全过程;的建模过程能够展现模型建立的全过程; 同时建模过程的程式化(同时建模过程的程式化(systematic manner))也避也避免了过度的免了过度的“数据开采数据开采”问题 由于一定程度的数据开采不可避免,由于一定程度的数据开采不可避免, “ “从一般到简单从一般到简单””建模理论倡导更加关注模型的建模理论倡导更加关注模型的样本外预测样本外预测((out-of-sample forecast) “从一般到简单从一般到简单”的建模方法,初始模型就可能包括了的建模方法,初始模型就可能包括了所有的相关变量,没有必要再进行遗漏相关变量的设定偏所有的相关变量,没有必要再进行遗漏相关变量的设定偏误检验。
误检验信息系刘康泽信息系刘康泽 “ “从一般到简单从一般到简单””的建模过程本身就是一项十分艰巨的建模过程本身就是一项十分艰巨复杂的工作各约化步骤往往是需要反复进行的,约化复杂的工作各约化步骤往往是需要反复进行的,约化步骤的顺序也需要灵活按排步骤的顺序也需要灵活按排 而且,从实践上看,由于各种因素的影响,所建立的而且,从实践上看,由于各种因素的影响,所建立的最终的简化模型不一定就是最最终的简化模型不一定就是最““理想理想””的模型亨德瑞的模型亨德瑞给出了一个给出了一个约化模型的基本准则:约化模型的基本准则: 第一,第一,模型必须具有数据一致模型必须具有数据一致(data-coherent)(data-coherent)性,即性,即模型能够正确地解释已有的数据模型能够正确地解释已有的数据约化过程中需不断进行约化过程中需不断进行设定偏误检验设定偏误检验 信息系刘康泽信息系刘康泽 第二,第二,模型必须与经济理论相一致(模型必须与经济理论相一致(consistent with economic theory)) 第三,第三,解释变量必须是弱外生的解释变量必须是弱外生的( (exogenous) ),,即解释变量应与随机扰动项不同期不相关。
即解释变量应与随机扰动项不同期不相关 第四,第四,模型具有恒定的参数模型具有恒定的参数( (constant parameters) 第五,第五,模型具有包容性,模型具有包容性,即模型应包容相竞争的对手模型即模型应包容相竞争的对手模型 第六,第六,模型具有简洁性模型具有简洁性(parsimonious),,即在具有相同即在具有相同解释能力的情况下,一个拥有较少解释变量的模型优于拥解释能力的情况下,一个拥有较少解释变量的模型优于拥有较多解释变量的模型有较多解释变量的模型 信息系刘康泽信息系刘康泽第三节第三节 数据问题数据问题 数据(资料)缺失的主要原因数据(资料)缺失的主要原因:: 抽样调查抽样调查::被调查者拒绝提供某些数据被调查者拒绝提供某些数据;; 统计口径统计口径::如将季度数据用于月度模型如将季度数据用于月度模型信息系刘康泽信息系刘康泽 1、因变量资料缺失的情况、因变量资料缺失的情况 设设n=nA+nB,,首先利用无缺口的部分作回归,得到首先利用无缺口的部分作回归,得到OLS估计估计信息系刘康泽信息系刘康泽 现在以现在以YB的某个预测值的某个预测值 填补的缺口,以便能利用所包含的信填补的缺口,以便能利用所包含的信息,并作回归。
息,并作回归信息系刘康泽信息系刘康泽 【【注注】】::预测值的选择:预测值的选择: (1) 全部用全部用YA的均值作为预测值:的均值作为预测值: (2) 直接用回归的预测值:直接用回归的预测值:信息系刘康泽信息系刘康泽 2、自变量资料缺失的情况、自变量资料缺失的情况 缺失的数据通常用缺失的数据通常用X1A, X2A, …, XkA的的均值代替均值代替 特别地特别地,如果,如果Y 的均值的均值 不会随着不会随着YB加入而变化,则只利用已加入而变化,则只利用已有的数据得到的估计值和加上均值后的估计值是完全一样的,只是有的数据得到的估计值和加上均值后的估计值是完全一样的,只是拟合优度拟合优度R2可能降低可能降低信息系刘康泽信息系刘康泽第四节第四节 举例举例我国进口商品需求弹性的研究我国进口商品需求弹性的研究n研究关税变化、贸易政策、加入研究关税变化、贸易政策、加入WTO等影响的需等影响的需要要n模型所分析的数据类型:模型所分析的数据类型:时间序列数据时间序列数据n被解释变量:被解释变量:所研究商品进口数量或金额所研究商品进口数量或金额;; 解释变量:解释变量:进口商品价格(到岸价、国内市场价)进口商品价格(到岸价、国内市场价)、国产替代品价格、收入水平等。
国产替代品价格、收入水平等信息系刘康泽信息系刘康泽。
