生物统计补充二预测及模型选择.ppt
20页1,第二节 预测,一、预测的概念和类型 (一)预测的概念 金融计量学中,所谓预测就是根据金融经济变量的过去和现在的发展规律,借助计量模型对其未来的发展趋势和状况进行描述、分析,形成科学的假设和判断2,(二)预测原理 条件期望(conditional expectations),在t期Y的t+1期的条件期望值记作 ,它表示的是在所有已知的t期的信息的条件下,Y在t+1期的期望值 假定在t期,我们要对因变量Y的下一期(即t+1期)值进行预测,则记作 3,在t期对Y的下一期的所有预测值中,Y的条件期望值是最优的(即具有最小方差),因此,我们有:,(2.65),4,(三)预测的类型: (1)无条件预测和有条件预测 所谓无条件预测,是指预测模型中所有的解释变量的值都是已知的,在此条件下所进行的预测 所谓有条件预测,是指预测模型中某些解释变量的值是未知的,因此想要对被解释变量进行预测,必须首先预测解释变量的值5,(2)样本内(in-sample)预测和样本外(out-of-sample)预测 所谓样本内预测是指用全部观测值来估计模型,然后用估计得到的模型对其中的一部分观测值进行预测 样本外预测是指将全部观测值分为两部分,一部分用来估计模型,然后用估计得到的模型对另一部分数据进行预测。
6,(3)事前预测和事后模拟 顾名思义,事后模拟就是我们已经获得要预测的值的实际值,进行预测是为了评价预测模型的好坏 事前预测是我们在不知道因变量真实值的情况下对其的预测7,(4)一步向前(one-step-ahead)预测和多步向前(multi-step-ahead)预测 所谓一步向前预测,是指仅对下一期的变量值进行预测,例如在t期对t+1期的值进行预测,在t+1期对t+2期的值进行的预测等 多步向前预测则不仅是对下一期的值进行预测,也对更下期值进行预测,例如在t期对t+1期、t+2期、t+r期的值进行预测8,二、预测的评价标准 、平均预测误差平方和(mean squared error,简记MSE)平均预测误差绝对值(mean absolute error,简记MAE) 变量的MSE定义为: MSE= (2.66) 其中 的预测值, 实际值,T时段数,9,变量的MAE定义如下: MAE= ,变量的定义同前 (2.67) 可以看到,MSE和MAE度量的是误差的绝对大小,只能通过与该变量平均值的比较来判断误差的大小,误差越大,说明模型的预测效果越不理想10,2、Theil不相等系数 其定义为: (2.68) 注意,U的分子就是MSE的平方根,而分母使得U总在0与1之间。
如果U=0,则对所有的t, 完全拟合;如果U=1,则模型的预测能力最差因此,Theil不等系数度量的是误差的相对大小11,Theil不等系数可以分解成如下有用的形式: 其中 分别是序列 和 的平均值和标准差, 是它们的相关系数,即:,(2.69),12,定义不相等比例如下:,(2.70),(2.71),(2.72),13,偏误比例 表示系统误差,因为它度量的是模拟序列与实际序列之间的偏离程度 方差比例 表示的是模型中的变量重复其实际变化程度的能力 协方差比例 度量的是非系统误差,即反映的是考虑了与平均值的离差之后剩下的误差 理想的不相等比例的分布是 比例 分别称为U的偏误比例,方差比例,协方差比例它们是将模型误差按特征来源分解的有效方法( )14,第三节:模型选择,一、“好”模型具有的特性 1、节省性(parsimony) 一个好的模型应在相对精确反应现实的基础上尽可能的简单 2、可识别性(identifiability) 对于给定的一组数据,估计的参数要有唯一确定值15,3、高拟合性(goodness of fit) 回归分析的基本思想是用模型中包含的变量来解释被解释变量的变化,因此解释能力的高低就成为衡量模型好坏的重要的标准。
4、理论一致性(theoretical consistency) 即使模型的拟合性很高,但是如果模型中某一变量系数的估计值符号与经济理论不符,那么这个模型就是失败的16,5、预测能力(predictive power) 著名经济学家弗里德曼(M.Friedman)认为:“对假设(模型)的真实性唯一有效的检验就是将预测值与经验值相比较”因此一个好的模型必须有对未来的较强的预测能力17,二、用于预测的模型的选择 因为R2将随着模型解释变量的增多而不断增加,按照此标准我们将不会得到最佳的预测模型 因此必须对由于解释变量增多而造成自由度丢失施加一个惩罚项,其中的一个标准就是:,18,对自由度丢失惩罚更为严格的标准: Akaike的信息准则(Akaike information criterion,简记为AIC)和Schwarz的信息准则(Schwarz information criterion,简记为SC),19,其中 是方程随机误差项方差的估计值,k是解释变量的个数,T是样本容量 可以看到,AIC和SC 的惩罚项 、 比 更为严厉,而且相对来说SC标准对自由度的惩罚比AIC更为严厉无论是AIC标准还是SC标准,从预测的角度来看,度量值越低,模型的预测会更好。
20,补充内容小节,在这一节中,我们首先介绍了最小二乘法及其估计量的性质和分布在用模型进行预测时,主要有两种情况:即有条件预测和无条件预测最后一小节我们简单介绍了模型的选择。





