张喜强 赵静
摘要:文章以近几年全国道路交通安全相关数据为样本数据,分析了数据间的特性。为此,分别利用标准灰色预测模型和支持向量机(SVM)模型建立道路交通安全预测模型,利用MATLAB R2012b对两种预测模型算法进行建模并应用数据进行仿真测试,得出相关的参数值和误差值,最后将预测结果数据与实际值进行对比分析。
关键词:交通安全;数据分析;预测结果
在过去的几十年里,我国经济迅速发展,机动车制造工业有着惊人的进步,道路基础设施也进入了发展的高潮。这些都推动了我国交通运输行业的发展,具体表现为公路里程数、机动车保有量、客货周转量等都以惊人的速度增长。截至2016年底,全国公路总里程超过450万公里,其中高速公路总里程达到10.8万公里,居世界第一;机动车保有量达到2. 79亿辆,机动车驾驶人达3. 27亿人,已超越美国成为世界汽车消费第一大国。在经济发展繁荣、基础建设兴起的同时,机动车过多、道路交通事故率居高不下已成为一个严峻的社会难题。
一、模型算法
(一)灰色预测模型
灰色预测模型的研究对象是数据不够完备的不确定性系统。对于少样本的系统,可以通过部分数据的规律提取,并演化成有规律的有效信息,开发部分数据的运动行为,将动态数据进行正确和有效的描述。文章以道路交通安全预测系统为例。道路交通系统是一个动态系统,其发展变化受到很多因素的影响,于是它又是一个动态的灰色系统。因此,可以运用灰色系统的理论和方法来研究道路交通安全系统。
(二)支持向量机(SVM)模型
由Vapnik首先提出的支持向量机(SVM)通常可用于模型分类和线性回归。支持向量机描述了如何在多层感知器网络或径向基函数网络中构建一个分类超平面,并将它作为决策面,使得正例和反例之间的隔离边缘最大化。相对于神经网络,支持向量机是结构风险最小化的一种近似实现。
支持向量机是解决非线性、复杂性、多维问题的一种方法,其实质是建立非线性回归方程,通过非线性函数φ(g)把数据映射到高维特征空间,然后在此空间建立线性回归函数。具体函数为:
二、道路交通安全预测建模
(一)灰色预测建模的应用
根据样本数据的回归性进行选取后,计算得出发展灰数
在MATLAB中运行模型程序得到预测计算标准差比C=0.0883,估计小误差概率P=1 。
由表1不难发现,在2012年以前实际值和预测值相差不大,误差较小;从2012年起,预测值比实际值明显误差增大。如果预测越长,精度势必越低。
(二)支持向量机预测建模
根据道路交通安全预测值中样本数值的特性,文章选择高斯核函数,根据上述SVM公式综合得出基于SVM的道路交通安全预测模型,偏置b的表达式如下:
选取评价体系中全国死亡人数、受伤人数、事故次数、直接经济损失这4重指标集合。影响因子集合为近20年全国公路运输距离、机动车保有量、货运量、旅客周转量、货物周转量作为影响因子的集合。根据构建的交通安全预测模型公式2.2,在MATLAB R2012b中编程运行,并需要确定三个参数值,即正规化参数C和高斯核函数参数σ2,以及误差 e。文章选择用交叉验证来确定三个参数值。在有限的学习数据中获取尽可能多的有效值,从而获得更合适的权值是交叉验证的优点。
三、仿真结果
本模型实验是在标准支持向量机在MATLAB中搭载C语言环境下调用libsvm3.17的環境下进行的。抽取样本数据中随机6个年份的道路交通事故次数指标作为训练集,其余为测试集,分别进行测试和训练。文章把样本集合分为5份,做5折交叉验证,轮流选择其中4份训练,剩余的1份做验证。根据模型在验证集合上的性能,进行两次寻优求得,第一次确定粗略的参数,即C=1,σ2=9.1896,e=0.01353%,第二次确定精细的参数,即C=0.70711,σ2=11.3137,e=0.01323%。通过对比可以发现,将灰色预测理论应用于长期预测数据时,会产生误差增高的现象,而应用支持向量机模型构建的模型,误差均在0.20以下,在精度上有显著的提升。
参考文献
[1]孙科达.基于GA的BP神经网络道路交通事故预测模型研究[D].浙江工业大学,2012.
[2]安杰,董龙洋.基于BP神经网络的道路交通安全预测模型研究[J].公路与汽运,2014(3):63-67.
[3]房靖,高尚.基于支持向量机的交通事故组合预测方法研究[J].交通与计算机,2007(2):103-105,11.
[4]张文峰,成卫,董玉佩.道路交通事故神经网络预测研究[J].昆明理工大学学报(理工版),2015(5):5.
[5]孙浩.基于支持向量机的交通安全预测模型研究[D].合肥工业大学,2009.