
基于HP滤波与ARMA模型的生产安全事 故时序预测.doc
6页基于HP滤波与ARMA模型的生产安全事 故时序预测颜峻中国劳动关系学院安全工程系摘要:为了研究月度生产安全事故变化规律并进行预测,采用Hodrick-Prescott滤波 将事故序列分解为长期稳定趋势和短期波动两部分对长期事故序列进行了平稳 性检验,建立了线性回归预测模型通过比较不同形式模型变量的显著性,建立 了反映事故短期波动的自回归移动平均模型,短期预测值用于修正长期趋势预 测值结果表明,事故序列在长期上符合线性回归模型;事故短期波动预测ARMA (4, 6)模型显示,事故波动变量与前1、2、4期存在自相关特征关键词:安全;事故;趋势周期分解;Hodrick-Prescott滤波;ARMA;作者简介:颜峻(1977-),男,中国劳动关系学院安全工程系,副教授,博士, 安全工程E-mail :)^anjunn@sina. com基金:中国劳动关系学院2014年院级科研项冃(14YY002)国内生产安全事故时间序列具有长期稳定下降和短期波动等2种变化趋势,即 事故在长期上具有线性下降趋势,短期上则围绕长期趋势线上下波动未对变化 趋势加以分解而直接采用数据处理方法去除某种趋势成分的研究方法,不能对 事故变化规律进行全面的判断。
因此,事故趋势预测的前提是将共存的趋势特征 序列加以分解,分别研究每种趋势内在特征并建立事故预测模型事故预测方法主要包括自回归单整移动平均丄口、灰色预测也、马尔科夫预测 [3-5].线性回归回、神经网络m、指数平滑法宜等生产安全事故时间序列 预测是在对生产安全事故统计基础上,采用时间序列分析方法对事故变化规律 进行研究,找到事故趋势变化特征的预测方法直观上看,生产安全事故变化过 程具有较大的随机性,但安全生产状态会受到多种客观因素影响,其时间序列 变化趋势不仅具有长期稳定变化特征而且在短期上表现为非线性波动,这一特 征会影响到传统时间序列分析方法的预测效果因此,有必要将事故变量序列中 的长期下降和短期波动成份进行分解,再对分解后的事故序列加以分析和研究 本文基于2011年1月至2016年8月间造成3人及以上人员死亡(包括下落不明) 的牛产安全事故月度统计数据,从事故时间序列长期变化和短期波动趋势分解 入手,建立事故长期趋势和短期波动修正预测模型论文将釆用 Hodrick-Prescott滤波方法提取事故序列中的长期趋势成分,建立事故变化稳 定趋势成分的线性回归模型;对分解后的短期波动序列,采用自回归移动平均模 型(ARMA)预测生产安全事故短期上围绕长期趋势线波动变化程度,用于对长 期趋势模型进行修正。
1数据与预处理2011年1月至2016年8月的生产安全事故月度时间序列,如图1回直观上判 断,月度事故序列具有长期波动下降趋势,为非平稳时间序列为了验证序列具 有的非平稳性,采用E-viewsl 10|软件中的ADF Fisher单位根检验方法J 1 I对 月度事故序列进行平稳性检验,检验模型为:式中: t—时间变量,代表序列的时间变化趋势;Q—常数项;P 一时间项系数; 一前一期变量系数;模型假设均为Ho: 5=0,即存在单位根图1显示序列具有 时间趋势项,因此检验模型也包含时间趋势项,检验结果,见表1图1月度事故序列 下载原图下载原表表1月度事故序列平稳性检验(水平值)表1显示,检验结果显著拒绝零假设,月度事故序列具有趋势平稳特征进一步 把时间趋势项去掉后,再进行检验,检验结果不能拒绝原假设,为非平稳时间 序列综合两种不同检验模型结论确定,月度事故序列为趋势平稳序列,具有确 定性趋势趋势平稳过程代表了一个时间序列长期稳定的变化过程,用于进行长 期预测更为可靠2长期趋势平稳模型上述“事故时间序列为趋势平稳序列”的检验结果证明了木文关于序列具有长 期趋势的判断是正确的,也为下一步研究提供了理论依据。
下面着手将长期趋势 和波动成分进行分解本文采用HodrickPrescott滤波方法]辺提取事故序列具 有的长期趋势成分设Y,是包含趋势成分和波动成分的时间序列,Y:是长期趋势 成分,Y,是波动成分,则HP滤波是通过对趋势成分进行约束,将比分离出来,其约束条件为损失函数(3) 达到最小,即其中,X为调节参数,X越大,估计趋势越光滑;X趋于无穷大时,估计趋势 将接近线性函数,通常对于月度数据X取14400采用HP滤波方法对事故序列 进行分解,分解结果,如图2可知,原始序列围绕趋势线波动,采用最小二乘 法对趋势序列进行拟合,得到长期趋势方程:图2 HP滤波后的趋势成分Yt 下载原图估计结果的调整R值为0. 9893,说明模型的拟合度较好;常数项和时间趋势项系 数估计值均达到1%显著性水平至此,完成了对月度生产安全事故数(起)序 列的长期趋势项分解和拟合结果表明,事故序列的长期变化趋势符合吋间的一 元线性回归模型,这一结论与平稳性检验中“时间趋势项显著,为趋势平稳序 列”结论一致3短期波动修正ARMA模型要对分解后的波动序列建立预测模型,首先仍需要对波动序列的平稳性进行检 验根据波动序列走势,采用仅有常数项的ADF Fisher单位根检验模型对月度 事故序列波动成分Y进行平稳性检验,检验结果显著拒绝零假设,即原序列不 存在单位根,波动序列是平稳的。
同时发现,检验模型中上一期变量系数显著不 为零,说明波动序列中当期变量与上一期变量之间可能存在自相关为了验证这 一判断,对波动序列出自相关函数和偏自相关函数进行计算山1,结果,见表2o表2事故波动序列相关性分析 下载原表从自相关函数图和偏自相关函数图中看到,偏自相关系数和自相关系数在滞后 6阶的时候落在2倍标准差的边缘上述计算结果还不能充分证明序列具有的相 关性特征,因此当采用ARMA模型进行建模时,难以采用传统的Box-Jenkins方 法确定模型的阶数[13]因此,有必要通过反复对ARMA (p, q)模型进行估计, 比较不同模型变量的显著性来确定模型阶数波动成分的自回归移动平均模型, 数学公式为:其中,J是一个白噪声采用不同的模型进行拟合,根据参数显著性t检验结 果去除不显著项,并对AIC检验值和SBC检验值进行比较模型结果,见表3表3波动序列ARMA模型识别结果 下载原表该模型拟合结果显示,调整后的可决系数R为0.31,赤池信息准则检验值为7. 40,施瓦兹信息准检验值为7. 67,误差项方差的估计值为9. 23该种模型识 别结果为AIC和BIC信息准则最小,模型系数的t检验统计量的p值显示,模型 解释变量参数估计值均在0.01的显著性水平下是显著的。
最终,确定模型形式 为ARMA (4, 6) o短期波动修正模型表示为:对模型残差序列的自相关偏自相关性进行检验,自(偏)相关函数值、以及Q-Stat及其p值显示,残差序列不存在自相关(为白噪声),因此模型是适合 的4组合模型构建及预测以上完成了对月度生产安全事故长期趋势和短期波动趋势的建模,分别如公式 (4、6)所示最终的组合预测模型应为:首先对长期趋势进行预测,结果如图3结果表明,模型均方根误差(RMSE)为 2. 01;绝对平均误差为1. 69使用该模型对2016年9月和10月事故起数进行预 测,结果分别为44、43起该预测值并未采用波动模型进行修正下一步还应 采用波动模型对修正值进行预测在E-views中的ARMA模型预测方法包括静态 预测和动态预测等2种区别在于前者每预测一次后用真实值代替预测值,再进 行向前一步预测;后者每一步都是采用前面的预测值计算新的预测值已知样木 范围内(2011M01-2016M08)的序列实际值是已知的因此,样本内的预测选用 静态预测,而样本外(2016M09-2016M10)预测选用动态预测方法首先,对长 期趋势进行预测,预测结果,如图4图3长期趋势序列预测效果图 下载原图图4波动序列预测效果图 下载原图样木内静态预测结果显示,模型均方根误差(RMSE)为8. 64;绝对平均误差为7. 19o样本外动态预测结果显示,9月和10月事故起数修正值分别为8、13起。
最终预测结果为长期趋势预测值和短期波动修正值之和,因此2016年9月和10 月国内生产安全事故起数预测值最终为52、56起,实际事故数均为60[14]ARMA 模型预测的基础是对近期数据变化趋势的判断,因此事故预测值间的变化幅度 较实际值会有所滞后5结论基于生产安全事故月度数据,采用HodrickPrescott滤波将事故时间序列分解 为长期趋势和短期波动2部分,分别建立了预测模型,得到以下结论:(1) 月度牛产安全事故数据在时间域上表现为趋势平稳序列,由于受到多重因 素影响,其变化过程隐含着长周期稳定趋势和短周期性波动变化2种趋势2) 事故序列的长期变化趋势符合时间的一元线性回归模型,并且平稳性检验 表明时间趋势项显著,事故序列为趋势平稳序列3) 通过比较ARMA模型变量显著性水平,并依据模型阶数选择AIC和BIC原则, 事故短期波动预测模型符合ARMA(4, 6)模型,事故波动当期值与前1、2、4 期存在自相关特征参考文献[1] 孙轶轩,邵春福,计寻,等•基于ARIMA与信息粒化SVR组合模型的交通事故 时序预测[J]・清华大学学报(自然科学版),2014, 54 (3) : 348-353[2] 陈国华,陈珑凯,张华文•安全事故指标多变量灰色预测方法及应用[J] •工 业安全与环保,2014, 40 (6) : 47-50[3] 兰建义,周英.基于改进灰色马尔柯夫模型的煤矿事故百万吨死亡率预测[J]. 数学的实践与认识,2014, 44 (17) : 145-152[4] 杨灿生,黄国忠,陈艾吉,等•基于灰色马尔科夫链理论的建筑施工事故预 测研究[J]・中国安全科学学报,2011, 21 (10) : 102-106[5] 兰建义,乔美英,周英•煤矿事故预测的马尔可夫SCGM (1, 1)模型的建立 与应用[J] •安全与环境学报,2016, 16 (5) :6-9[6] 彭东,罗周全,秦亚光,等•基于加权线性回归模型组的湖北省工矿事故死 亡人数分析预测[J] •中国安全生产科学技术,2015, 11 (11) : 167-173[7] 周荣义,钟岸,任竞舟,等•基于主成分分析和神经网络的事故预测方法及 应用[J]・中国安全科学学报,2013, 23 (7) :55-60[8] 王洪德,曹英浩•道路交通事故的三次指数平滑预测法[J]•辽宁工程技术大 学学报(自然科学版),2014, 33 (1) : 42-46[9] 李生才,笑蕾.2016年3~4月国内生产安全事故统计分析[J]・安全与环境学 报,2016, 16 (3) : 395-396[10] 何剑.计量经济学实验和EVIEWS使用[M].北京:中国统计出版社,2010[11] Dickey D A, Fuller W A. Distributioii of the Estimators for Autoregressive Time Series with a Unit Root[J]. Journal of the American Statistical Association, 1979, (74) :427-431[12] Hodrick RJ, Prescott EC. Postwar U.S. Business Cycles:An EmpiTical Investigation. Discussion 卩aper No. 451, Camegie-Mellon University, 1980[13] (美)沃尔特•恩徳斯.应用计量经济学一一时间序列分析[M].杜江,谢志 超。
