
统计学(第四版 贾俊平等)第十三章 时间序列分析和预测.ppt
105页上节内容,1.多元线性回归 1).回归模型(总体) 2).回归方程(总体) 3).估计的回归方程(样本) 2.因变量离差平方和的分解: 3.判定系数(多重判定系数和调整的多重判定系数),,上节内容,4.估计标准误差 5.线性关系的显著性检验 6.回归系数的显著性检验,,上节内容,7.多重共线性 8.虚拟变量的线性回归 如果定性自变量有k个水平,需要引入k-1个虚拟变量第13章 时间序列分析和预测,,第13章 时间序列分析和预测,§13.1 时间序列及其分解 §13.2 时间序列的描述性分析 §13.3 时间序列预测的程序 §13.4 平稳序列的预测 §13.5 趋势型序列的预测 §13.6 季节型序列的预测 §13.7 复合型序列的分解预测,,§13.1 时间序列及其分解,1.时间序列(time series)是同一现象在不同时间上的相继观察值排列而成的序列经济数据中大多数都以时间序列的形式给出 2.表现形式上是由时间和现象在不同时间上的观察值两部分组成,即t和对应的Yt 3.根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式§13.1 时间序列及其分解,时间序列的分类: 1.平稳序列(stationary series)是基本上不存在趋势的序列。
这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的 2.非平稳序列(non-stationary series)是包含趋势、季节性或周期性的序列,它可以只含有其中的一种成分,也可能是几种成分的组合因此,非平稳序列又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列§13.1 时间序列及其分解,非平稳序列的成分: 1.趋势(trend)是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称为长期趋势时间序列中的趋势可以是线性的,也可以是非线性的 2.季节性(seasonality),也称季节变动,它是时间序列在一年内重复出现的周期性波动比如,“销售旺季”或“销售淡季”,“旅游旺季”或“旅游淡季”,等等季节性中的“季节”一词是广义的,它不仅仅是指一年中的四季,其实它是任何一种周期性的变化在现实生活中,季节变动是一种普遍的现象,它是诸如气候条件、生产条件、节假日或风俗习惯等各种因素作用的结果例如,农业生产、交通运输、建筑业、旅游业、商品销售以及工业生产中都有明显的季节性§13.1 时间序列及其分解,3.周期性(cyclity) ,也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。
周期性通常是由于商业和经济活动而引起的,它不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相间的交替波动;它也不同于季节变动,季节变动有比较固定的规律,且变动周期大多为一年,而循环波动则无固定规律,变动周期多在一年以上,且周期长短不一周期性通常是由于经济环境的变化而引起的 4.随机性(random) 也称不规则波动,是指除去趋势、周期性和季节性之后的偶然性波动§13.1 时间序列及其分解,时间序列构成要素的分解: 1.时间序列的构成要素分为四种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)非平稳序列 2.传统时间序列分析的一项主要内容就是把这些成分从时间序列中分离出来,并将它们之间的关系用一定的数学关系式予以表达,而后分别进行分析按4种成分对时间序列的影响方式不同,时间序列可分解为多种模型,如: 乘法模型 Yt=Tt×St×Ct×It 加法模型 Yt=Tt+St+Ct+It,,§13.2 时间序列的描述性分析,13.2.1 图形描述 13.2.2 增长率分析,,13.2.1 图形描述,在对时间序列进行分析时,首先需要作出散点图(折线图),然后通过图形观察数据随时间的变化模式及变化趋势。
作图是观察时间序列形态的一种有效方法,它对于进一步分析和预测有很大帮助 【例13.1】下表给出了我国人均国内生产总值、轿车产量、金属切削机床产量和居民消费价格指数的时间序列13.2.1 图形描述,做出人均GDP序列对时间的散点图,人均GDP序列呈现一定的线性趋势,,13.2.1 图形描述,轿车产量序列呈现一定的指数变化趋势,,13.2.1 图形描述,金属切削机床产量序列呈现一种三阶曲线形态,,13.2.1 图形描述,居民消费价格指数序列没有趋势,呈现一定的随机波动,,13.2.2 增长率分析,1.增长率 1).增长率(growth rate),也称增长速度,它是时间序列中报告期观察值与基期观察值之比减1后的结果,用%表示 2).由于对比的基期不同,增长率可以分为环比增长率和定基增长率 环比增长率是报告期观察值与前一时期观察值之比减1,说明现象逐期增长变化的程度; 定基增长率是报告期观察值与某一固定时期观察值之比减1,说明现象在整个观察期内总的增长变化程度环比增长率 定基增长率 2.平均增长率 平均增长率也称平均增长速度,它是时间序列中逐期环比值也称环比发展速度的几何平均数减1后的结果,计算公式为:,13.2.2 增长率分析,,13.2.2 增长率分析,【例13.2】根据13-1中的人均GDP数据,计算1990-2004年的平均增长率,并根据平均增长率预测2005年和2006年的人均GDP。
解:根据公式有:,2005年和2006年人均GDP的预测值分别为:,,13.2.2 增长率分析,3.增长率分析中应注意的问题 对于大多数时间序列,特别是有关社会经济现象的时间序列,经常利用增长率来描述其增长状况尽管增长的计算与分析比较简单,但实际应用中,有时也会误用或滥用 1).当时间序列中的观察值出现0或负数时,不宜计算增长率例如:假定某企业连续五年的利润额分别为5、2、0、-3、2万元,对这一序列计算增长率,要么不符合数学公理,要么无法解释其实际意义在这种情况下,适宜直接用绝对数进行分析 2).在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析13.2.2 增长率分析,【例13.3】 假定有两个生产条件基本相同的企业,各年的利润额及有关的速度值如下表,解:仅用增长率分析,可知乙企业增长率高于甲企业,但它们的基数是不同的而增长率是一个相对值,不能正确反映它们的实际增长情况,需要将增长率与绝对水平结合起来进行分析13.2.2 增长率分析,我们采用,增长率每增长一个百分点而增加的绝对量来弥补增长率分析中的局限性 计算公式为,甲企业增长1%绝对值=500/100=5万元 乙企业增长1%绝对值=60/100=0.6万元 这说明甲企业的生产经营业绩并不比乙企业差,而是更好。
13.3 时间序列预测的程序,13.3.1 确定时间序列的成分 13.3.2 选择预测方法 13.3.3 预测方法的评估,,13.3 时间序列预测的程序,时间序列分析的一个主要目的是根据已有的历史数据对未来进行预测 由于时间序列含有不同成分,如趋势、季节性、周期性和随机成分等,对于一个具体的时间序列,它可能只含有一种成分,也可能同时含有几种成分 含有不同成分的时间序列所用的预测方法是不同的对时间序列进行预测时,有以下几个步骤: 1).确定时间序列所包含的成分,就是确定时间序列的类型 2).找出适合此类时间序列的预测方法 3).对可能的预测方法进行评估,以确定最佳预测方案 4).利用最佳预测方案进行预测13.3.1 确定时间序列的成分,1.确定时间序列的成分 确定趋势成分是否存在,可以从绘制时间序列的线图入手从线图中可以看出时间序列中是否存在趋势,以及所存在的趋势是线性的还是非线性的 判断趋势成分是否存在的另一种方法是利用回归分析拟合一条趋势线,然后对回归系数进行显著性检验如果回归系数显著,就可以得出线性趋势显著的结论13.3.1 确定时间序列的成分,【例13.4】一种股票连续16周的收盘价如下表所示。
试确定其趋势及其类型13.3.1 确定时间序列的成分,解:设自变量为时间t,因变量为股票收盘价格Y,在0.05的显著性水平下得到的回归方程为:,由于,时间序列两端有高于趋势线的数值,表明存在非线性趋势选择用二阶曲线拟合13.3.1 确定时间序列的成分,,13.3.1 确定时间序列的成分,2.确定季节成分 1).确定季节成分是否存在,至少需要两年的数据,而且数据需要是按季度、月份、周或天等来记录的 2).确定季节成分需要绘制年度折叠时间序列图绘制方法是:将每年的数据分开画在图上,即横轴只有一年的长度,每年的数据分别对应纵轴 3).如果时间序列只存在季节成分,年度折叠时间序列图中的折线将会有交叉;如果时间序列既含有季节成分又含有趋势,那么年度折叠时间序列图中的折线将不会交叉,而且如果趋势是上升的,后面每年的折线将会高于前面年度的折线;如果趋势是下降的,后面每年的折线将会低于前面年度的折线13.3.1 确定时间序列的成分,【例13.5】下表是一家啤酒生产企业2000-2005年各季度的啤酒销售量数据试绘制年度折叠时间序列图,并判断啤酒销售量是否存在季节性解:由右图可知,啤酒销售量数据中既含有季节成分,也有上升趋势。
13.3.2 选择预测方法,1.确定时间序列的类型后,预测程序的第2步是选择适当的预测方法利用时间序列进行预测时,通常假定过去的变化趋势会延续到未来,这样就可以根据过去已有的形态或模式进行预测 2.时间序列的预测方法既有传统方法,如简单平均法、移动平均法、指数平滑法等,也有较精确的现代方法,如Box-Jenkins的自回归模型(ARMA) 3.一般来说,任何时间序列都会有不规则成分存在,而商务与管理数据中通常不考虑周期性成分,所以只剩下趋势成分和季节成分本章介绍的预测方法主要是针对平稳序列、含有趋势成分或季节成分的时间序列13.3.2 选择预测方法,时间序列数据,是否存在季节,是否存在趋势,平滑法预测 简单平均法 移动平均法 指数平均法,季节性预测法 季节多元回归模型 季节自回归模型 时间序列分解,趋势预测方法 线性趋势推测 非线性趋势推测 自回归预测模型,是否存在季节,,13.3.3 预测方法的评估,在选择了某一种特定的方法进行预测时,需要评价该方法的预测效果或准确性评价的方法是找出预测值与实际值的差距,这个差距就是预测误差最优的预测方法也就是预测误差达到最小的方法 预测误差的方法有: 1.平均误差 所有预测误差Yi-Fi的平均数就是平均误差(mean error),用ME表示,公式为 由于预测误差的数值可能有正有负,求和的结果会相互抵消,故平均误差会低估误差。
13.3.3 预测方法的评估,2.平均绝对误差 平均绝对误差(mean absolute deviation)是将预测误差取绝对值后计算的平均误差,用MAD表示,公式为 平均绝对误差可以避免误差相互抵消的问题,可以准确反映实际预测误差的大小 3.均方误差 均方误差(mean square error)是通过平方消除误差的正负号后计算的平均误差,用MSE表示, 公式为,,13.3.3 预测方法的评估,4.平均百分比误差和平均绝对百分比误差 ME,MAD和MSE的大小受时间序列数据的水平和计量单位的影响,有时并不能真正反映预测模型的好坏,它们只有在比较不同模型对同一数据的预测时才有意义 平均百分比误差(mean percentage error)和平均绝对百分比误差(mean absolute percentage error)则不同,它们消除了时间序列数据水平和计量单位的影响,是反映误差大小的相对值 公式分别为:,,§13.4 平稳序列的预测,13.4.1 简单平均法 13.4.2 移动平均法 13.4.3 指数平滑法 平稳时间序列只含有随机成分,预测方法有简单平均法、移动平均法、指数平滑法等。
这些方法主要通过对时间序列进行平滑以消除其随机波动,因而也称为平滑法平滑法既可以用于对平稳时间序列进行短期预测,也可以用于对时间序列进行平滑以描述序列的趋势(包括线性趋势和非线性趋势)。












