基于改进灰色预测模型的交通事故预测模型研究

2022-05-27 16:57潘翱翀赖健琼
计算机时代 2022年5期
关键词:预测值残差交通事故

潘翱翀 赖健琼

摘  要: 为了提高交通事故数据预测的准确度,采取GM(1,1)和OSDGM(1,1)等单一模型,对2008-2019年我国交通事故死亡人数数据进行分析。根据GM(1,1)和OSDGM(1,1)模型建立最优加权组合模型,使用Verhulst模型对建立的加权组合模型进行残差修正,并借助灰色模型精度评价指标对预测结果进行检验。预测结果表明,GM(1,1)、OSDGM(1,1)模型和改进的灰色预测模型的预测结果的平均相对误差分别为4.35%、4.30%和1.19%,且改进的灰色模型通过精度指标检验,说明改进灰色预测模型具有较高的精度。

关键词: GM(1,1)模型; OSDGM(1,1)模型; Verhulst模型; 最优加权组合模型

中图分类号:U491.31          文献标识码:A     文章编号:1006-8228(2022)05-33-05

Research on traffic accident prediction model based on improved grey prediction model

Pan Aochong, Lai Jianqiong

Abstract: In order to improve the accuracy of traffic accident data prediction, a single model such as GM(1,1) and OSDGM(1,1) is used to analyze and predict the traffic accident fatalities data in China from 2008 to 2019. According to the GM(1,1) and OSDGM(1,1) models, the optimal weighted combination model is established. The Verhulst model is used to correct the residuals of the established weighted combination model, and the prediction results are tested with the grey model accuracy evaluation index. The prediction results show that the average relative errors of the prediction results of the GM(1,1), OSDGM(1,1) models and the improved grey prediction model are 4.35%, 4.30% and 1.19%, respectively. The improved grey model has passed the accuracy index test. It shows that the improved grey prediction model has higher accuracy.

Key words: GM(1,1) model; OSDGM(1,1) model; Verhulst model; optimal weighted combination model

引言

在交通事故分析領域主要有如下模型:时间序列模型[1]、马尔科夫链模型、灰色模型[2]、支持向量机模型[3-4]、贝叶斯网络模型[5]和BP神经网络模型[6]等,从相关资料和实验数据中可以发现,使用单一的模型会受到其自身模型特性的影响,不能达到较好的效果。

在目前,较为常用的灰色模型有GM(1,1)模型、Verhulst模型以及灰色马尔科夫模型等。GM(1,1)模型往往要求数据具有较强的指数型增长的特性。Verhulst模型则更加适用于非单调的摆动发展序列或具有饱和状态的S形序列。离散灰色模型相较于GM(1,1)模型,可拓展性更强,且当进行长期数据预测时,离散模型具有较高的预测精度[7],而OSDGM(1,1)模型则不仅继承了离散灰色模型的优点,还在原有基础上进行了优化。为了更好地预测交通事故数据,本文将分别建立GM(1,1)模型和OSDGM(1,1)模型等单一模型,在此基础上对2008-2017年的数据,建立最优加权组合模型,利用Verhulst模型对模型进行残差修正,最终对模型的精度指标进行检验。

1 改进灰色预测模型关键技术及评价指标

1.1 灰色模型(Grey Model,即GM(1,1))[8]

GM(1,1)模型的原理和计算方法如下:

定义1 设交通事故原始数据序列为[x0=x01,x02,…,x0n],其中,1-AGO序列[x1=x11,x12,…,x1n],其中[x1k=i=1kx0i,k=1,2,…,n],则定义[x1]的灰导数为[dk=x0k=x1k-x1k-1]。令[z1]为序列[x1]的紧邻生成序列,即[z1k=0.5x1k+0.5x1k-1,k=2,3,…,n]则[z1=(z12,z13,][…,z(1)(n))]。

定义GM(1,1)灰微分方程模型为[d(k)+az(1)(k)=b],即

记[Y=x(0)(2)x(0)(3)?x(0)(n)],[B=-z(1)(2)1-z(1)(3)?-z(1)(n)1?1],参数列[u=(a,b)T],则由最小二乘法可得,[u=(a,b)T=(BTB)-1BTY],与⑴式相对应的白化微分方程为[dx(1)dt+ax(1)(t)=b],其中[t]表示时间,则该白化微分方程的解为

将求得的参数代入式⑵中,即可得到累加预测值[x(1)(k+1)],根据[x(0)(k+1)=x(1)(k+1)-x(1)(k),k=1,2,…,n-1]求出交通事故数据预测序列[x(0)=(x(0)(1), x(0)(2),…,x(0)(n))]。

1.2 Verhulst模型[9]

Verhulst模型的基本原理和计算方法如下。

定义2 [x(1)]为交通事故数据原始序列,则[x(1)=(x(1)(1),x(1)(2),…,x(1)(n))],[x(0)]为[x(1)]的一次累减生成序列,即[x(0)=(x(0)(1),x(0)(2),…,x(0)(n))],[x(0)(k)=x(1)(k+1)-x(1)(k)(k=1,2,3,…,n)]

[z1]为[x1]的紧邻生成序列:

[z1=z11,z12,…,z1n]

[z(1)(k)=0.5(x(1)(k)+x(1)(k-1))(k=2,3,…,n)],则称[x(0)+az(1)=b(z(1))2]为Verhulst模型,[a]和[b]为待求参数。称

为Verhulst模型的白化方程,其中[t]为时间。

定理1 设[β=[a,b]T]为所求参数列,且构造如下矩阵[B]和向量[Y]:

则参数列[β]的最小二乘估计满足[β=[a,b]T=(BTB)-1BTY],由此,可以得到Verhulst模型白化方程的解为

Verhulst模型的时间响应序列为

[x(1)(0)]取为[x(0)(1)]则上式变为

1.3 优化初始点离散灰色模型(the Optimized Starting-point fixed Discrete Grey Model,简称OSDGM(1,1))[7]

OSDGM(1,1)模型的原理和计算方法如下:

定义3 设交通事故原始数据序列为[x(0)=(x(0)(1),x(0)(2),…,x(0)(n))],其中,1-AGO序列[x(1)=(x(1)(1),x(1)(2),…,x(1)(n))],[x(1)(k)=i=1kx0i,k=1,2,…,n]则称

为OSDGM(1,1)模型。其中,[x(1)(k)]为[x(1)(k)]的预测值,[β1],[β2]和[β3]为模型参数,[x(1)(1)]是模型迭代基值。

OSDGM(1,1)模型是由离散型灰色模型(Discrete Grey Model,简称DGM(1,1))在模型初始点处进行优化得到的。因此,在OSDGM(1,1)模型中的参数[β1]和[β2]的求解方式相同,可以借助最小二乘法,也可以通过公式⑼、公式⑽得到参数[β1]和[β2]的值。

在OSDGM(1,1)中,为了求解[β3],建立如下无约束优化问題:[mink=1nx(1)(k)-x(1)(k)2]。其本质是求解当残差平方和最小时,[β3]的取值。即得到

由公式⑼到公式⑾,可以进一步得出[x(1)]的表达式

得交通事故预测值[x0k+1=x1k+1-x1k]

[k=1,2,3,…,n-1]。

1.4 最优加权组合模型[10]

为了提高对交通事故数据预测的准确度,本文将采用最优加权组合模型对原有单一模型进行优化,进而提高对原始数据的预测效果。最优加权组合模型,本质上是将求解权重问题转化为在最小二乘原理上的数学规划问题[9],其基本计算步骤如下:

设交通事故数据预测问题中有[p]个子预测模型,[q]个待预测点,即[yit(i=1,2,…,p;t=1,2,…,q)]。[yit]代表第[i]个模型在第[t]个时间点的实际值,而[yit]则代表与之对应的预测值,权向量[w=(w1,w2,…,wp)T]中的元素为组合模型中各个子模型的权重值,因此可以得到组合预测模型为[Y=i=1pwiyi],设子模型的拟合残差为[eit=yit-yit],则拟合残差矩阵为

进而将权重求解问题转化为如下问题解决:

设[R=(1,1,…,1)T],则

对式⒂使用拉格朗日法,得到最优组合权重:

1.5 模型评价指标[12]

一般地,灰色模型通常有四种精度检验等级(如表1所示),本文将选择相对误差和绝对关联度作为模型精度评价的指标。其中残差计算为[e(k)=x(0)(k)-x(0)(k),k=1,2,…,10],相对误差为[E(k)=e(k)x(0)(k),k=1,2,…,10],平均相对误差:[ε=1nk=1nE(k)]。绝对关联度计算方法,首先设真实值序列和预测序列的始点零化像分别是[x(0)0]和[y0],[x(0)0=(x(0)0(1),x(0)0(2),…,x(0)0(n))],[y0=(y0(1),y0(2),…,y0(n))]。其中:

记[s0=k=1n-1x(0)0(k)+0.5x(0)0(n)],

[s1=k=1n-1y0k+0.5y0n,]

[s1-s0][=k=1n-1(y0(k)-x(0)0(k))+0.5(y0(n)-x(0)0(n))],则绝对关联度可以表示为

2 交通事故灰色预测模型及应用

2.1 改进的灰色预测模型简述

改进的灰色预测模型根据2008-2017年交通事故死亡人数数据分别建立GM(1,1)模型和OSDGM(1,1)模型等单一模型,在得到单一模型预测数据的基础上,建立最优加权组合模型,利用Verhulst模型对建立的组合模型进行残差修正,最终对模型的精度指标进行检验,并将改进的灰色预测模型、GM(1,1)和OSDGM(1,1)模型进行比较。

2.2 实验数据

灰色模型的主要特点是需要的样本少,具有相对较好的精度,且交通事故的发生又和多种因素相关,符合灰色模型的适用范围。本文的数据基础是我国2008-2017年交通事故死亡人数数据(来源于《各年全国道路交通事故统计年报》)如表2所示。

2.3 改进灰色交通预测模型及应用

本文根据我国交通事故死亡人数数据建立GM(1,1)和OSDGM(1,1)模型,并通过最优加权组合模型将两种模型进行加权组合。根据所建立的模型预测未来几年我国交通事故数据,并依据灰色模型精度检验等級对预测模型的科学性和有效性进行检验,最后对2018-2019年交通事故数据进行预测。具体的工作流程如下。

⑴ 改进灰色预测交通事故模型建立

根据上述模型,构建GM(1,1)、OSDGM(1,1)模型等单一预测模型,并借助python求解得到如下结果:

GM(1,1)模型为:

OSDGM(1,1)模型为:

(21)

为了建立最优加权组合模型,选取2008-2017年交通事故数据作为样本数据,记GM(1,1)、OSDGM(1,1)模型对2009-2017年的预测结果分别是:

[y1]=(64202.001,63619.968,63043.211,62471.683,

61905.336,61344.123,60787.998,60236.915,59690.828),

[y2]=(64059.508,63510.616,62966.850,62428.156,61894.484,61365.784,60842.006,60323.010,59809.018)

所对应的真实值为2009年-2017年交通事故数据,则可以求出各模型与真实数据之间的误差[eit],进而求得拟合残差矩阵:

(22)

设列向量[R=[1,1]T],则可根据[w0=E-1RRTE-1R]计算得到各模型在组合模型中的权向量[w0=0.53750.4625],即在最优加权组合模型中GM(1,1)和OSDGM(1,1)模型的权重分别为0.5375和0.4625,可以得到如下组合模型表达式:

(23)

其中,[y]表示最优加权组合模型的预测值,[yi(i=1,2)]表示各个单一模型的预测值,将GM(1,1)和OSDGM(1,1)模型的预测值分别代入式(23)即可求出组合模型的预测值,并得到表3所示结果。

⑵ 精度检验

根据1.5节平均相对误差和绝对关联度的计算方法,可以计算得到平均相对误差[ε=0.04349],绝对关联度[g=0.65]。

绝对关联度[g=0.65>0.6],则表明该模型仍存在问题,模型表现不够理想,未达到预测的合格水平,因此对该模型进行残差修正。

[13]

记通过GM(1,1)和OSDGM(1,1)模型经过最优加权组合之后的模型值和真实值之间的误差为残差,即

(24)

利用残差对原有模型进行修正,根据式(24)建立残差序列,即[e(0)1=(e(0)1(2),e(0)1(3),…,e(0)1(n))]。对残差序列做非负处理,得到[e(0)=(e(0)(2),e(0)(3),…,e(0)(n))]

其中,[e(0)(k)=|e(0)1(k)|,k=2,3,…n]。

由于Verhulst模型适用于非单调的摆动发展序列,而残差序列往往具有类似的摆动不确定的特点,因此,对残差序列[e(0)]进行Verhulst建模,得到如下预测模型:

(24)

用[e(0)]修正[x(0)]得到灰色残差修正的组合加权模型[x(0)e(k+1)=x(0)(k+1)±e(0)(k+1),k=1,2,…,n]。

其中,每一个残差的符号应该和[e(0)1]的符号保持一致,由此得到如表4所示的残差修正后的结果。

由此可以得到残差修正加权组合模型的平均相对误差[ε=0.014<0.05],且[ε]显然更接近于0.01,绝对关联度[g=0.83>0.8],表明预测等级合格,因此残差修正过的模型可用,即可以利用该模型预测2018-2019年我国交通事故死亡人数,如表5所示。

2.4 交通事故死亡人数预测结果分析

选用2008-2017年交通事故死亡人数数据,利用改进后的灰色交通预测模型得到的实验结果如表6所示。从表中可以看出各模型的平均相对误差均在5%以下,表明本文中采用GM(1,1)和OSDGM(1,1)模型对于交通事故数据的分析和预测是有效的。从3种模型比较结果可以看出,组合预测模型预测效果最好,即平均相对误差最小,且2008-2019年改进的灰色预测模型、GM(1,1)和OSDGM(1,1)模型预测结果的平均相对误差分别是1.19%、4.35%和4.30%。

根据表6,可以得到如图1所示改进的灰色预测模型、GM(1,1)和OSDGM(1,1)的相对误差的对比图。由图1可以看出,除2011年以外,在其他各年份中改进的灰色预测模型的相对误差明显低于GM(1,1)和OSDGM(1,1)的相对误差,即改进的灰色预测模型的预测值更接近于真实值,预测效果优于GM(1,1)和OSDGM(1,1)。

由2008-2019年交通事故死亡人数模型值和真实值对比图(图2)可以看出,从2008年到2019年的交通事故死亡人数总体呈现下降的趋势,且模型值和真实值的拟合程度较好。由此可见,将各个单一模型组合之后,模型精度得到了提高,克服了单一模型的局限性,进而使模型预测的能力大大提升。

3 结束语

本文以2008-2017年我国交通死亡人数数据作为样本内数据,分别采取GM(1,1)和OSDGM(1,1)模型对数据进行预测,在得到单一模型预测数据的基础之上,建立最优加权组合模型,并借助Verhulst模型对建立的最优加权组合模型进行残差修正,使预测结果更加接近实际结果,最终得到2008-2019年交通事故预测模型GM(1,1)、OSDGM(1,1)以及改进模型的平均相对误差分别为4.35%、4.30%和1.19%,由此可见,组合模型误差大大降低。从单一模型的角度来看,GM(1,1)模型则适合于具有较强指数增长型的数据;Verhulst模型则利用了自身模型趋于稳定的特点,可以更好地处理残差序列波动性较强的问题;OSDGM(1,1)模型是离散型灰色模型的在初始条件上的优化模型,该模型继承了原有离散型灰色模型的特点,且相较于离散型灰色模型更加接近真实曲线。综合上述模型,本文提出的最优加权组合模型可以结合三种模型的优点,为相关部门的进行有效的科学管理提供理论依据。

参考文献(References):

[1] 邵辉,王钰,李保安,等.交通事故损失的时间序列分析[J].中国

安全科学学报,2007(7):10-13

[2] 赵江平,丁佳丽.基于小波分析的灰色GM(1,1)模型道路交

通事故预测[J].数学的实践与认识,2015,45(12):119-124

[3] 戢小辉.基于灰色关联的LS-SVM道路交通事故预测[J].

计算机应用研究,2016,33(3):806-809

[4] 胡启洲,高宁波,叶茂.基于支持向量机的道路交通事故数据

统计模型研究[J].中国安全科学学报,2013,23(6):39-44

[5] 许洪国,张慧永,宗芳.交通事故致因分析的贝叶斯网络建模[J].

吉林大学学报(工学版),2011,41(S1):89-94

[6] 刘卫宁,王鹏,孙棣华,解佳.基于改进BP神经网络的道路交

通事故预测[J].计算机系统应用,2010,19(10):177-181

[7] Nai-mingXie,Si-feng Liu. Discrete grey forecasting model

and its optimization[J].AppliedMathematical Modelling,2008,33(2)

[8] 张小允,李哲敏.基于GM(1,1)模型的中国小杂粮种植面积

预测分析[J].中国农业资源与区划,2018,39(9):81-86

[9] 赵玲,许宏科,程鸿亮.基于最优加权组合模型的道路交通事

故预测[J].计算机工程与应用,2013,49(24):11-15

[10] 杨英明,李全生,方杰.基于最优加权组合模型的煤炭消费

预测分析[J].煤炭工程,2018,50(5):156-160

[11] 楊红军,王胜辉,李潇潇.基于最优加权组合模型的光伏出

力预测[J].沈阳工程学院学报(自然科学版),2019,15(4):300-305

[12] 王福建,李铁强,俞传正.道路交通事故灰色Verhulst预测

模型[J].交通运输工程学报,2006(1):122-126

[13] 杜文然,陆航,杨涛存,徐贵红.基于灰色GM(1,1)残差修正

模型的动车组故障率预测[J].铁道机车车辆,2021,41(2):17-21

收稿日期:2021-10-08

作者简介:潘翱翀(2000-),男,江苏南京人,本科在读,主要研究方向:机器学习。

猜你喜欢
预测值残差交通事故
基于双向GRU与残差拟合的车辆跟驰建模
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
基于残差学习的自适应无人机目标跟踪算法
不同寻常的交通事故
预防交通事故
法电再次修订2020年核发电量预测值
基于递归残差网络的图像超分辨率重建
一起高速交通事故院前急救工作实践与探讨
平稳自相关过程的残差累积和控制图