赵玲,许宏科,程鸿亮
1.长安大学电子与控制工程学院,西安 710064
2.西安邮电大学通信与信息工程学院,西安 710121
基于最优加权组合模型的道路交通事故预测
赵玲1,2,许宏科1,程鸿亮1
1.长安大学电子与控制工程学院,西安 710064
2.西安邮电大学通信与信息工程学院,西安 710121
道路交通事故预测对于探究道路交通事故的发生规律,分析现有道路交通条件下交通事故的未来发展趋势以及道路交通安全控制等具有重要意义。国内外学者对于道路交通事故预测进行了多方面的研究,提出了一些较实用的事故预测方法[1-7]。文献[1-2]提出基于灰色理论的交通事故预测模型;文献[3]提出灰色马尔可夫的预测模型;文献[4]提出一种基于车速的交通事故贝叶斯预测模型;文献[5-6]提出借助人工智能系统的理论,建立神经网络模型的方法进行交通事故预测的模型;文献[7]提出运用ARIMA模型进行交通事故预测的方法。这些方法都能够对交通事故进行预测,但效果都不够理想,模型中均缺少对多模型、多机理的综合考虑,仍有许多值得继续深入研究的地方。
近年来,组合预测方法[8]在交通事故预测中开始应用。文献[9]提出基于ARIMA-FNN的道路交通事故最优加权组合预测模型,其借助ARIMA在时间序列上进行线性拟合同时用FNN在空间上进行非线性逼近来提高预测精度;文献[10]建立了基于GM(1,1)模型和Verhulst模型道路交通事故最优组合模型。文献[9-10]是从不同角度选择各自的单一模型,在具体问题的应用中都表现出了较高的预测精度,但模型个数还有待考虑和增加。
道路交通事故的影响因素十分复杂,单一预测模型都有其自身局限性,如何更好地利用各个模型的优点和有效信息,提高交通事故的预测精度就显得尤为重要。本文在充分研究各个单一模型的工作原理和适用条件的基础上,分别建立了灰色GM(1,1)模型、灰色Verhulst模型[11]、单因子系统云灰色SCGM(1,1)c模型[12]三个单一模型,并在此基础上建立了它们的组合预测模型,以最优加权法确定组合预测模型中各个模型的权重系数。预测结果表明本文提出的最优加权组合预测能有效地提高预测精度,为制定交通安全对策提供理论依据。
2.1 灰色GM(1,1)模型
自从20世纪80年代我国学者邓聚龙教授创立灰色系统理论以来,众多学者开始将灰色系统思想与交通事故预测研究内容紧密结合,并取得了大量研究成果。其中,GM(1,1)模型是灰色系统理论中最具代表性且应用最广泛的灰色预测模型。建模原理如下:
因为预测方程是对累加数据列的预测方程,所以进行累减还原,可以得到原始数据列的预测值:
2.2 灰色Verhulst模型
Verhulst模型是德国生物学家费尔哈斯(Verhulst)于1837年提出的一种生物生长模型。Verhulst模型主要用来描述具有饱和状态的过程,即S形过程,常用于人口预测、繁殖预测及产品寿命预测等。近年来中国道路交通事故表现为具有饱和状态的S形过程,故可采用Verhulst模型对其进行预测。建模原理如下:
2.3 系统云灰色SCGM(1,1)c模型
SCGM(1,h)模型是GM(1,1)模型最有力的发展模型,在许多领域已得到成功应用[14]。SCGM(1,1)c模型较其他灰色预测模型的理论基础更扎实,它不必考虑众多复杂的影响因素,而是从自身时间序列数据中寻找有用信息,探究其内在规律,建立模型进行预测,因此SCGM(1,1)c模型成为道路交通事故预测的较理想模型[15-16]。建模原理如下:
对Xˆ(1)(k)进行还原处理,得原始数据的系统云灰色SCGM(1,1)c预测模型为:
组合预测是使用多种预测方法对同一预测对象进行预测,在此基础上通过加权组合形成一个预测模型,以提高预测精度的方法。最优加权法就是依据某种最优准则下构造目标函数Q,在约束条件下(如使权重之和为1)极小化Q,求得组合模型的加权系数[17]。因此,组合预测的建模步骤是:(1)构造单个的预测模型;(2)求出各单个模型在组合模型中的最优权重;(3)计算出加权组合预测模型。
组合模型的最优权重系数求解,就是对拟合误差平方和在最小二乘原理下求解数学规划的问题,其目标函数和约束条件为:
使用以下3个指标比较单一模型之间以及最优加权组合模型的统计特性。
(1)误差平方和(MSE)。其表达式为:
现以我国2001—2010年的道路交通事故死亡人数为例(见表1),根据上述方法,分别建立三个单一模型以及最优加权组合模型,进行交通事故的拟合与预测分析。其中,用2001—2007年的数据作为建模数据,用2008—2010年的数据为验证数据。
5.1 单一模型预测
(1)灰色GM(1,1)模型为:
表1 2001—2010 年我国道路交通事故死亡人数统计1)
表2 不同模型对2001—2007年交通事故死亡人数的拟合结果
表3 不同模型对2008—2010年交通事故死亡人数的预测结果
生成数列:
运用上述三个单一模型对2001—2007年的交通事故死亡人数进行拟和,结果见表2;运用3个统计指标对各个单一模型进行评价,结果见表2。
5.2 最优加权组合模型预测
假设f1为GM(1,1)模型的预测值,f2为Verhulst模型的预测值,f3为SCGM(1,1)c模型的预测值。利用建模数据的实际值,可以计算出每种模型在每一时刻的预测误差,进而可以得到预测误差信息矩阵E,再由公式(14)计算得:
即组合模型中GM(1,1)模型的权重为0.332,Verhulst模型的权重为0.187,SCGM(1,1)c模型的权重为0.481,于是得到组合模型的形式为:
将三个单一模型的预测值代入式(19),即可得到最优加权组合模型的预测值,结果见表2。
5.3 预测结果及模型评价
应用建立的单一预测模型和最优加权组合预测模型,对2008—2010年我国道路交通事故死亡人数进行预测,预测结果见表3。分别应用3个评价指标对三种单一预测模型和最优加权组合模型的预测精度进行检验,结果见表3。
由表3可知,单一预测模型中GM(1,1)模型预测值与实际值的三个统计指标均最小,说明该模型预测交通事故死亡人数性能最好,Verhulst模型的预测效果最差。单一模型中GM(1,1)模型、Verhulst模型以及SCGM(1,1)c模型的平均相对误差分别为10.87%、35.76%和17.21%,而组合模型的误差为5.20%。可以看出:采用最优加权组合后,组合模型预测结果的误差在可接受范围内,且更能够逼近实际值,预测精度大幅提高。
5.4 模型的特性比较及应用讨论
前述结果表明,最优加权组合预测能明显提高预测精度,但也带来算法复杂度的提升。最优加权组合模型的核心是加权系数的确定,而加权系数大小与拟合误差矩阵紧密相关,所以最优加权组合预测的运算时间主要取决于拟合误差矩阵Q的确定,其运行时间最长。在单一预测模型中,Verhulst模型的建模原理中无需进行还原处理,因而算法的复杂度最低,运行时间最短。SCGM(1,1)c模型涉及很多的求和、指数、除法及对数等运算,使得算法的复杂度有所提升,运行时间最长。将各模型从预测精度及算法复杂度方面作一比较,详见表4所示。
表4 不同模型预测精度及复杂度的比较
前述已应用三个单一模型和最优加权组合模型对2001—2010年我国道路交通事故死亡人数进行了拟合及预测分析,结果表明最优加权组合模型的拟合及预测精度明显优于任何一个单一模型。由于灰色预测适用于时间序列短、数据量少的波动不太大的动态过程预测,再结合新信息优先的思想,故本文选取2001—2010年的数据构建模型。事实上,我国从1994年以来交通背景和条件发生了很大变化,导致1994年以后的交通事故分布特性如死亡人数一直处于长期增长趋势,但自2002年以后我国交通事故死亡人数又保持了较稳定的下降态势,这归咎于我国宏观政策的调整、道路设施的改善、公民素质的提高等多种因素。如果直接把1990—2000年的数据纳入进来和后续数据放在一起进行预测,必然会造成预测的巨大误差,但如果依托1990—2000年的数据建模,却能够准确预测出2002年的拐点。因此最佳组合预测模型主要适用于随机波动不太大且序列长度不太长的参数动态过程预测。
本文建立了基于GM(1,1)模型、Verhulst模型、SCGM(1,1)c模型三种单一预测方法的最优加权法组合预测模型。基于实证分析,通过预测误差评价指标比较,得出最优加权法组合预测能有效降低预测误差,提高预测精度。此外,还应注意以下几点:
(1)交通事故预测是一项复杂的系统工程,不同的场合应选用不同的预测方法。2001—2007年我国道路交通事故原始数据虽有波动,但从2003年起原始事故数据呈单调下降趋势,因此,GM(1,1)模型具有较好的预测结果,而Verhulst模型适用于具有饱和状态的S形过程,预测结果最差。
(2)最优加权组合模型综合利用了GM(1,1)模型、Verhulst模型、SCGM(1,1)c模型的有效信息,预测结果最为理想。运用Matlab程序很容易实现上述模型的计算过程,是一种切实可行的科学建模方法。多个单一模型通过科学的组合,可以不同程度地提高模型的预测精度。
(3)交通事故的影响因素是多方面的,涉及到人、车、路及道路环境等因素。因此,在进行交通事故预测时,尽可能综合使用多种预测方法进行组合预测,其预测结果才能更加可靠。当然,事故预测的结果还有赖于原始数据的精确程度,这是任何一种预测方法都不可回避的,在进行事故预测时不得不给予足够的重视。
[1]韩文涛,张倩,贾安民.基于灰色系统的道路交通事故预测模型研究[J].西安建筑科技大学学报:自然科学版,2005,37(3):375-377.
[2]Dai Leilei,Yu Chunjun,Gu Jingang.Improvement and application of grey prediction model for road traffic accident[C]// Proceedings of FSKD 2011.Shanghai,China:IEEE Press,2011,3:2040-2043.
[3]李相勇,张南,蒋葛夫.道路交通事故灰色马尔可夫预测模型[J].公路交通科技,2003,20(4):98-101.
[4]林震,杨浩.基于车速的交通事故贝叶斯预测[J].中国安全科学学报,2003,13(2):34-36.
[5]Lee S,Lee T,Kim H J,et al.Development of traffic accidents prediction model with intelligent system theory[C]// ProceedingsofICCSA 2005.Berlin:Springer-Verlag,2005:880-888.
[6]Yu Rujun,Liu Xiuqing.Study on traffic accidents prediction model based on RBF neural network[C]//Proceedings of ICIECS 2010.Wuhan,China:IEEE Press,2010:1083-1087.
[7]张杰,刘小明.ARIMA模型在交通事故预测中的应用[J].北京工业大学学报,2007,33(12):1295-1299.
[8]商勇,丁咏梅.最优组合预测方法评述[J].统计与决策,2005(9):122-123.
[9]王臻,张兴强.基于ARIMA-FNN的道路交通事故最优加权组合预测模型[J].交通信息与安全,2010,28(3):89-92.
[10]郑建湖.基于最优加权的道路交通事故组合预测模型[J].中国安全科学学报,2009,19(9):37-40.
[11]王福建,李铁强,俞传正.道路交通事故灰色Verhulst预测模型[J].交通运输工程学报,2006,6(1):122-126.
[12]张超,马存宝,许家栋.基于灰色马尔可夫SCGM(1,1)c模型的空难人数预测[J].系统工程理论与实践,2006(5):135-139.
[13]刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].北京:科学出版社,2004.
[14]张曙红,陈绵云,戴德宝.系统云灰色预测模型及其应用[J].佛山科学技术学院学报,2001,19(4):1-6.
[15]陈绵云.SCGM(1,h)c模型和灰色预测模型控制[J].华中理工大学学报,1993,21(3):47-52.
[16]赵玲,许宏科.基于灰色加权马尔可夫SCGM(1,1)c的交通事故预测[J].计算机工程与应用,2012,48(31):11-15.
[17]耿悦敏.基于最优加权的组合预测模型及应用[J].五邑大学学报:自然科学版,2008,22(1):63-67.
ZHAO Ling1,2,XU Hongke1,CHENG Hongliang1
1.School of Electronic and Control Engineering,Chang’an University,Xi’an 710064,China
2.School of Communication&Information Engineering,Xi’an University of Posts and Telecommunications,Xi’an 710121,China
The prediction of traffic accident is the basis of transportation safety,assessment and decision-making.Aimed at solving the limitations in various single grey forecasting methods,a combined forecasting model of road traffic accidents based on optimal weighted method is put forward.According to the characteristics of traffic accident in China,a model combining GM(1,1), Verhulst and SCGM(1,1)c is established and the weight coefficients of combined forecasting model are determined by optimal weighted method.The deaths of traffic accident in China from 2001 to 2007 are taken as original data to establish forecasting model predicting the deaths of traffic accident from 2008 to 2010.The results demonstrate that the forecast accuracy of combined model is better than that of GM(1,1)model,Verhulst model and SCGM(1,1)c model.
transportation security;traffic accident;optimal weighted;combined forecasting
交通事故预测是交通安全评价、规划和决策的基础。针对各种单一灰色预测模型存在的局限性,建立了一种基于最优加权的灰色组合预测模型。根据我国道路交通事故的发展情况,建立了GM(1,1)、Verhulst和SCGM(1,1)c相结合的组合预测模型,运用最优加权法确定组合预测模型的权重系数。利用2001—2007年我国道路交通事故死亡人数的实际值作为原始数据,构建各个单一预测模型和最优组合预测模型,预测其2008—2010年交通事故死亡人数。预测结果表明,组合预测模型比单一GM(1,1)模型、Verhulst模型和SCGM(1,1)c模型具有更高的预测精度。
交通安全;交通事故;最优加权;组合预测
A
U492.3
10.3778/j.issn.1002-8331.1305-0324
ZHAO Ling,XU Hongke,CHENG Hongliang.Road traffic accidents prediction based on optimal weighted combined model.Computer Engineering and Applications,2013,49(24):11-15.
国家自然科学基金(No.60804049);中央高校基本科研业务费专项资金项目(No.CHD2012JC056)。
赵玲(1977—),女,博士生,讲师,研究方向为交通事故预测、交通安全;许宏科(1963—),男,博士,教授,研究方向为交通安全、现代交通信息系统;程鸿亮(1977—),男,博士生,讲师,研究方向为道路交通安全。E-mail:zhaoling9543@163.com
2013-05-24
2013-08-05
1002-8331(2013)24-0011-05
CNKI出版日期:2013-09-26http://www.cnki.net/kcms/detail/11.2127.TP.20130926.1644.010.html