基于数据分类的高速铁路运营事故预测方法

2016-01-08 02:47:44高宁波,胡启洲,张兵
交通信息与安全 2015年1期
关键词:灰色模型交通安全高速铁路

基于数据分类的高速铁路运营事故预测方法*

高宁波1胡启洲1▲张兵2郑丽媛1

(南京理工大学自动化学院南京 210094;华东交通大学土木建筑学院南昌 330013)

摘要高速铁路运营事故预测方法是度量铁路安全管理水平的重要指标。为提高高速铁路的安全运营水平,引入工业数据分类方法,分析反向传播(BP)神经网络和灰色模型在高速铁路安全运营事故预测过程中的适应性。首先,运用事故次数、事故联动系数、月均事故率3个参数对高速铁路安全运营水平进行度量;然后,根据工业数据分类方法判别高速铁路运营事故数据属于块状型,据此建立反向传播(BP)神经网络运营事故预测模型;针对运营事故数据具有波动大的特点,利用均值聚类方法建立K-GM(1,3)预测模型。以近年来高速铁路运营事故数据为样本对模型进行训练和分析,结果表明:BP神经网络、K-GM(1,3)、GM(1,3)预测模型的预测误差分别为8.92%,13.68%,345.25%,BP神经网络在高速铁路安全运营事故预测过程中的适应性要优于灰度模型。

关键词交通安全;事故预测;数据分类;高速铁路; 神经网络;灰色模型

中图分类号:X913.3文献标志码:A

收稿日期:2014-07-22修回日期:2014-09-27

基金项目*国家自然科学(批准号:51178157)、中央高校基本科研业务专项

作者简介:第一高宁波(1990-),硕士研究生.研究方向:交通拥堵,交通安全.E-mail:916747600@qq.com

通讯作者:▲胡启洲(1975-),博士,副教授.研究方向:交通管理与控制.E-mail:qizhouhu@163.com

An Accident Prediction Model of High-Speed Railway

Operation Based on Data Classification

GAO Ningbo1HU Qizhou1ZHANG Bing2ZHENG Liyuan1

(1.SchoolofAutomation,NanjingUniversityof

science&Technology,Nanjing2100984,China;

2.EastChinaJiaoTongUniversity,Nanchang330013,China)

Abstract:Accident prediction models for high-speed railway are important measurements for safety management. In order to improve the safety of high-speed railway, the capability of back propagation (BP) neural network and grey model in the process of estimating accidents of high-speed railway are analyzed. Firstly, the number, the coefficients of causal factors and average number of accidents per month are used to assess the safety management of high-speed railway in this paper. Then, the accident prediction models for high-speed railway is developed based on BP Neural Network and GM(1,3). Due to the fact that the accident data is quite unstable, combined with k-means clustering method, the K-GM(1,3) models are developed. The accident data of the high-speed railway collected in recent years are used to train and test the models developed. Study results show that the mean relative error of BP Neural Network, K-GM(1,3) and GM(1,3) models are 8.92%, 13.68% and 345.25% respectively. It is found that the BP neural network model perform much better than the grey model.

Key words:Transportation safety; Accident prediction; Data classification; High-speed railway; Neural Network; Grey Model

0引言

2013年国内高速铁路运营里程达到11 028 km,分别是德国和日本的11.6倍和4.6倍,跃居世界第1位。同时,随着运营速度的提升,高速铁路运营安全问题已成为社会各界关注的热点问题。中国2011年7月23日从北京开往福州的D301与D3115追尾事件敲响了高速铁路安全运营的警钟,如何提高高速铁路安全运营水平是当下亟待解决的重大课题。

高速铁路运营事故预测是高速铁路行车安全的重要保证,针对高速铁路运营事故的特点,选择合适的高速铁路安全态势预测方法对提高高速铁路安全运营水平具有重要意义。近年来随着马尔科夫链理论、灰色模型、神经网络,以及支持向量机[1-3]等预测方法的提出受到了各界关注,国内外许多学者将其运用在铁路安全预测中取得了一定的成果。国内,李洪等[4]通过对1971~2008期间铁路事故烈度分析,提出基于马尔科夫链的铁路事故预测模型,并利用状态转移矩阵对2009年的铁路事故进行预测,结果显示该预测方法能够对铁路事故从宏观上进行初步评估;王富喜等[5]通过建立铁路事故灰色预测模型,开发了相应的铁路事故预测软件,并对国内多条铁路线路的安全事故进行了预测,其最大的优点是将预测过程程序化,输入条件标准化;此外,王卓等[6]还对铁路行车事故的预测方法进行了系统的分析,利用BP神经网络对美国铁路事故进行预测。国外对铁路安全事故的研究较早,N. M. Radaev[7]通过对铁路危险物运输过程风险源分析,建立了事故发生概率预测模型,并被运用于美国铁路危险品运输安全分析;Wen Chao[9]定义了7种铁路安全运营冲突种类,提出了运营冲突判定方法,并基于铁路运营计划对运营事故进行动态预测[8],其优点在于通过跟踪铁路运营计划,实时预测铁路运营事故发展趋势。实际上,铁路安全影响因素多、数据获取难是铁路安全预测面临的难题,特别是高速铁路运营事故受线路线型、运营时间、地域环境等因素影响巨大,通常难以建立简单线性模型描述事故与致因之间的隐含关系。

通过收集国内高速铁路的相关运营数据,参考城市轨道交通安全运营评价标准,结合高速铁路运营事故具有烈度高、影响范围广、时间波动明显的特点定义事故次数、事故联动系数、月均事故率作为高速铁路安全运营的评价指标来分析国内高速铁路的安全运营态势,结合工业数据预测中的先降噪、后预测的数据分类方法对高速铁路安全运营事故进行预测。

1高速铁路运营事故分析方法

1.1运营事故测定指标选取

通常评价铁路安全运营的指标有铁路事故率及事故件数、铁路伤亡人数、铁路经济损失[10]等,但是这些指标偏重于对普通铁路的安全评价。随着高速铁路安全管理水平的提高,高速铁路安全运营目标从减少伤亡人数向提高正点率等方面转变,意味着普通铁路的安全运营评价指标不完全适用于衡量高速铁路的安全运营水平。因此,根据对高速铁路安全运营内涵的理解,结合普通铁路的安全运营评价指标,最后确定选取高速铁路运营的事故次数、事故联动系数、月均事故率作为高速铁路安全运营的评价指标,各个指标的含义如下。

1) 运营事故次数。根据铁路行车的D类事故定义:行车设备耽误列车1 h以上或者固定设备耽误列车2 h以上的均属于列车行车事故[11]。高速铁路的最低平均行驶速度达到275 km/h,为常规火车速度的2.75倍,所以定义行车设备耽误高速铁路行车20 min或者固定设备耽误高速铁路行车40 min及其以上属于高速铁路行车事故,计算方法

(1)

2) 事故联动系数。联动系数是经济学中用以分析某一商品价格变化的影响范围的评价指标[12],高速铁路属于复杂的线网结构,列车在运行过程中易受到线网中其他列车故障的影响发生延误等情况,铁路线网具有故障扩散的联动特点,这里引用联动系数反应线网车辆调度管理的合理性。

(2)

式中:λ为事故联动系数;C为发生故障列车数量;ki为受到第i次事故影响而发生事故的列车数量。

3) 月均事故率。月均事故率反映了高速铁路线路每月发生运营事故的频率(概率),能够消除高速铁路运营时间不均的影响,更加客观地评价高速铁路的安全运营水平。

(3)

式中:P为每月平均运营事故发生率;M为有效运营时间。

1.2国内高速铁路运营事故现状分析

利用南京理工大学高速铁路安全运营评价与测度方法研究课题组收集的国内10条较有代表性的高速铁路线路从2010~2013年的运营资料(包括晚点、人员伤亡等情况),根据运营事故、事故联动系数、月均事故率3个评价指标的定义和量化式(1),(2),(3),分别得到中国2010~2013年期间高速铁路的安全运营评价指标数据,见表1。

表1 2010~2013中国高速铁路线路安全运营数据

为进一步分析我国高速铁路运营事故分布特征,以运营里程、事故联动系数、月均事故率作为评价指标,利用系统聚类方法对高速铁路运营情况分析,将国内高速铁路线路划分为表2中4级(类):

表2中:①一级线路有Line(3),Line(5),Line(7),Line(9),Line(10),事故联动系数和月平均事故率最大为2和1.03,属于高速铁路运营线路中事故发生频率最小的一类,处于比较高的运营安全水平;②二级线路为Line(8),事故联动系数和月平均事故率分别为6和0.98,事故联动系数大的特点是线路事故扩大效应易导致线路的其它列车受到影响;③三级线路为Line(6),事故联动系数和月均事故率分别为1和1.23,线路运营里程短,但是月均事故率较大;④四级线路为Line(1),Line(2),Line(4),事故联动系数和月均事故率

表2 高速铁路线路安全运营态势分类

最大分别为21和3.92,这些线路运营里程长、时间久、列车多,属于运营安全风险最大的一类。

2高速铁路运营事故预测方法

2.1高速铁路运营事故数据特征分析

在工业材料和航空零件供给需求预测中,通常根据数据序列的变异系数(见式(4))和周期间隔(见式(5))2个指标将数据序列分为平缓、间歇、随机、块状等4种特征类型[13](见图1),并且Syntetos 等[14]通过大量数据分析得到事故变异系数的临界值可为0.7,事故间隔的临界值可为1.32。

(4)

(5)

因此,依据式(4),(5)可计算高速铁路运营事故数据的变异系数v2=1.02、月均事故率ε=1.95(月/起),判断此类数据属于块状型,具有强变异性、变化波动大的特点。

图1 数据特征类别划分区间

根据不同特征类型数据选择相应的预测方法(见表3),发现适用高速铁路运营事故的预测模型有神经网络、支持向量机、灰色函数等,为进一步分析现代智能算法和灰色模型在高速铁路安全运营事故预测过程中的适应性,据此分别建立基于经典的BP神经网络和灰色函数的高速铁路预测模型。

表3 不同数据类型与预测方法的适用性比较

2.2高速铁路运营事故BP神经网络预测模型

神经网络是通过模仿生物神经系统功能结构处理非线性问题的数学动力系统,对多输入与多输出的数据具有较好的拟合能力,其基本组成单元是神经元,主要功能是将输入经过函数转化为期望输出。 BP神经元模型预测机制主要通过3步实现。

步骤2。输出信息转化。pj大于神经元兴奋阈值θ时,神经元信息转换函数f对pj转化得到输出信息yj,这里采用Sigmoid函数作为转化函数:

(6)

式中:yj为输出信息;θ为阈值,通常用它来修正神经系统的内部偏差,取值0~1之间,通常建议取值0.01。

(7)

误差修正函数。

高速铁路安全运营态势与运营里程、运营时间、地理环境、气候条件等因素有关,由于未来的气候条件不可知,月平均事故率可利用事故总数推算。因此,最后确定将运营里程、运营时间2个条件做为输入,将运营事故总数、事故联动率2个指标作为输出,以2010~2013年内发生过运营事故的10条高速铁路线路运营事故数据为训练样本,对其安全态势进行预测。

依据Kolmogorov定理:1个具有n个输入单元、2n+1个中间单元和m个输出单元的3层网络可以精确地表达任何映射,并且同时可以使中间层容量和训练时间最优,所以确定建立2-5-2的BP神经网络,如图2。

图2 基于BP神经网络的高速铁路安全态势预测模型

2.3高速铁路安全运营事故灰色预测模型

本节首先对高速铁路安全事故指标进行灰色关联度分析,选择运营里程和运营时间作为灰色预测模型变量因子,以运营事故作为因变因子,建立GM(1,3)预测模型。然后根据运营事故数据属于块状型,具有波动大的特点,利用K均值聚类的方法将运营事故数据序列划分为不同集合,建立K-GM(1,3)预测模型。

2.3.1灰色关联度分析

假设存在以下2个数列:

以Xi(k)为参考数列,Xj(k)为比较数列,定义:

(8)

存在关联函数:

(9)

则比较序列Xj(k)对根据序列Xi(k)的灰色关联度为

(10)将高速铁路线路Line(1)到Line(10)的运营事故数作为参考序列,以运营里程数和运营时间作为比较序列,根据式(8)~(10),计算运营事故数和运营里程以及运营时间的灰色关联度分别为0.74和0.75,根据经验,当指标间关联度大于0.6时便可建立灰度预测模型[15]。因此,选择线路里程和运营时间作为运营事故预测模型的变量因子,分别构建GM(1,3)模型和K-GM(1,3)模型。

2.3.2构建GM(1,3)模型

GM(1,3)模型的建立过程可以分为原始数据一阶累加、构建白化微分方程、微分方程离散化、参数标定四个步骤,具体过程如下。

(11)

(13)式(13)微分方程模型记为GM(1,n),令 n=3,得到GM(1,3)白化微分方程

(15)按照最小二乘法,有

(16)式中:

(17)

可得微分方程的近似解为

(18)

步骤4。参数标定。通过式(11),(12)和(17)计算得到Line(1)~Line(10)的GM(1,3)模型参数矩阵。

依据式(16),估计线路Line(1)~Line(10)的GM(1,3)模型参数为

a=1.019 2,b2=0.110 0,b3=-0.102 5

最后得到Line(1)~Line(10)的GM(1,3)模型为

(19)

2.3.3构建K-GM(1,3)模型

K-GM(1,3)模型是按照先降噪,后预测的思路进行,具体方法是首先根据K均值聚类方法对数据分类,然后对每一类数据建立GM(1,3)模型,目的是降低数据变化波动带来的影响,提高预测的精度。

步骤1。运营事故K均值分类。通过表1知高速铁路安全运营事故指标数据最大的值为141,最小的为2,两极分化严重。为能够更好地对数据进行预测和分析,首先将运营事故利用K均值聚类方法进行分类。

根据以上步骤,利用SPSS软件对Line(1)~Line(10)线路的运营事故次数进行K均值聚类,最后得到以下分类结果。

即将Line(1),Line(2),Line(4),Line(6),Line(8),Line(9)划分为事故率较大的一类,将Line(3),Line(5),Line(7),Line(10)划分为事故率较小的一类。

图3 K均值聚类过程

步骤2。K-GM(1,3)模型参数标定。依据式(11)~(17),计算获得A1类线路和A2类线路的K-GM(1,3)模型参数。

将模型参数带入式(18)得到得A1类线路和A2类线路的K-GM(1,3)模型。

(20)

2.3.4预测结果和误差分析

灰色模型的预测结果是将式(18)计算结果通过累减还原为相应变量的预测结果。

(21)

(22)

式中:MSE(k)为相对误差序列。

3案例分析

为验证上述建立的BP神经网络和灰色预测模型的有效性,将表1中运营数据代入预测,通过对预测结果的误差分析,比较BP神经网络、GM(1,3),以及K-GM(1,3)预测模型在高速铁路安全运营态势预测中的适用性。

3.1高速铁路运营事故神经网络预测结果

根据图2设计的神经网络和2.2节中BP神经网络的计算流程,利用Matlab(R2012a)编程求解。由于高速铁路运营事故数据序列长度较短,因此这里采取交替迭代的方法训练神经网络,具体过程是先任意选取8条线路作为训练样本,剩下其他2条线路作为预测样本(对比样本)。第1次预测结束后,再选择未预测的2条线路替换已预测的线路,继续训练和预测,经过5次迭代过程,最后获得10条线路事故的预测结果见表4。

表4 基于BP神经网络的高速铁路运营事故预测结果

上述预测过程中,BP神经网络的其它参数设置见表5。

表5 BP神经网络参数设置

3.2高速铁路运营事故灰色模型预测结果

同样将表1中的运营事故数代入GM(1,3)模型(见式(20))和K-GM(1,3)模型(见式(21)),得到运营事故预测结果,见表6。

对比表6和表7,未经K均值降噪而直接建立的GM(1,3)模型的预测相对误差达到345.25%,经过分类降噪的K-GM(1,3)模型的A1类和A2类的预测误差精度分别为13.42%和14.08%,平均相对误差为13.68%。表明对于高速铁路运营事故这类块状型数据而言,在预测前进行数据分类降噪将会显著提高灰色模型的预测精度。

表6 基于GM(1,3)和K-GM(1,3)模型的

表7 高速铁路运营事故GM(1,3)和

3.3预测模型适应性分析

为便于对BP神经网络模型和灰度模型在高速铁路运营事故预测过程中的适应性分析,将BP神经网络和K-GM(1,3)模型的预测相对误差(MSE)绘制成下图4。

图4 BP神经网络和K-GM(1,3)

在高速铁路事故的预测过程中,BP神经网络的最大误差为12.00%,平均误差为8.92%,K-GM(1,3)模型的预测最大相对误差为48.42%,平均误差为13.69%,从预测精度上来说,BP神经网络在高速铁路安全事故预测过程中要优于K-GM(1,3)模型。进一步分析,可以得出以下结论。

1) K-GM(1,3)模型的预测精度随着数据在序列中的前后位置关系呈现从大到小的变化趋势,在本实例分析中,K-GM(1,3)对于数据顺序前4的Line(1)~Line(4)的平均预测误差为1.74%,数据顺序后6的Line(5)~Line(10)的平均预测相对误差为21.64%,表明在K-GM(1,3)模型中预测精度与数据位置顺序有关。

2) BP神经网络预测过程中,高速铁路运营事故数预测平均误差为8.92%,联动系数预测精度为10.09%,联动系数数据序列的变异系数为1.43,事故数据序列的变异系数为1.02,表明数据的平稳性与预测精度成正比关系。

3) BP神经网络模型与K-GM(1,3)模型相比,BP神经网络和K-GM(1,3)模型在预测过程中预测误差的方差分别为0.10%和2.43%,表明BP神经网络在预测过程中更加平稳,误差波动范围更小。

4结束语

笔者运用事故次数、事故联动系数、月均事故率作为高速铁路运营事故评价指标,根据高速铁路运营事故属于块状型,具有强变异性的特点建立了基于BP神经网络和灰色模型的安全态势预测模型。在构建了灰色模型过程中,根据事故极差大的特点,利用K均值聚类方法将高速铁路线路分为A1类和A2类,构建K-GM(1,3)预测模型,提出了先数据分类降噪后预测的思路。实证分析表明,灰度模型与BP神经网络相比,灰色模型预测精度更依赖于数据稳定性,BP神经网络更适合于高速铁路安全运营事故等块状型数据预测。本文是基于假定国内CRH系列型号列车安全性能无较大差别的基础上提出的,若能进一步对各种型号的列车事故进行统计分析,再进行预测分析则更具科学性。

高速铁路运营事故致因复杂且数据采集困难一直是影响高速铁路安全预测研究的重要原因,因此对高速铁路运营安全进行更深层次的影响因子机理分析,构建高速铁路运营事故统计数据库平台有待于后续工作的深入研究。

参考文献

[1] 朱茵,张翔宇,隋晓庆,等.道路交通安全状况预测及管理规划方案研究[J].中国安全科学学报,2011,21(3):139-144.

ZHU Yin,ZHANG Xiangyu,SUI Xiaoqing.Study on road traffic safety tendency forecasting and management planning scheme[J].China Safety Science Journal, 2011, 21(3): 139-144.(in Chinese).

[2]曹占辉,李言俊.基于支持向量机和蚁群算法的空间目标分类[J].航空计算技术, 2008,38(3):15-18.

CAO Zhanhui,LI Yanjun.Space object classification based on SVM and ACO[J]. Aeronautical Computing Technique, 2008, 38(3):15-18.(in Chinese).

[3]董四辉,史卓屾.道路交通事故BP神经网络预测研究[J].中国安全科学学报, 2010,20(9):16-20.

DONG Sihui,SHI Zhuoshen.Study on road traffic accident forecast based on BP neural network[J]. China Safety Science Journal, 2010, 20(9):16-20.(in Chinese).

[4]李洪,赵望达,徐志胜.马尔可夫预测模型在铁路事故预测方面的应用[J].中国公共安全:学术版,2009,14(3):149-151.

LI Hong,ZHAO Wangda,XU Zhisheng.The markov application on railway accident prediction[J]. China Public Security:Academy Edition, 2009,14(3):149-151.(in Chinese).

[5]王喜富,陈建广.铁路运输安全事故灰色预测方法研究[J]. 中国安全科学学报, 2003,13(7):45-48.

WANG Xifu,CHEN Jianguang. Study on obscure prediction method for railway transportation accident[J]. China Safety Science Journal, 2003, 13(7):45-48.(in Chinese).

[6]王卓,贾利民,秦勇,等.铁路行车事故预测方法分析与比较[J]. 中国安全科学学报,2009,19(8):34-39.

WANG Zhuo,JIA Limin,QIN Yong,et al.Analysis and comparison of predication methods for railway train accident[J].China Safety Science Journal,2009,19(8):34-39.(in Chinese).

[7]Radaev N M.Prediction of the probability of an accident during shipment of radiation-hazardous objects by railway[J].Atomic Energy,1999,58(5):824-829.

[8]WEN Chao.Prediction methods of train operation conflict for high-speed railway[J].Journal of Transportation Security,2010,3(4):275-286.

[9]马法学.浅析铁路交通事故成因及安全对策研究[J].物流工程与管理,2011,33(8):144-145.

MA Faxue.Analysis on the causes and safety countermeasure of railway traffic accident[J].Logistics Engineering and Management,2011,33(8):144-145.(in Chinese).

[10] 冯运卿,李雪梅,李学伟.基于熵权法与灰色关联分析的铁路安全综合评价[J]. 安全与环境学报,2014,13(2):73-79.

FENG Yunqing,LI Xuemei,LI Xuewei.Comprehensive evaluation method for the railway safety based on the entropy method and the grey relation analysis[J]. Journal of Safety and Environment,2014,13(2):73-79.(in Chinese).

[11]中华人民共和国铁道部.铁路交通事故处理规则[S].北京:中华人民共和国铁道部,2007.

Ministry of Railways of the People′s Republic of China.Railway traffic accident processing rules[Z].Beijing:Ministry of Railways of the People′s Republic of China,2007.(in Chinese).

[12]余秋玲,朱宏泉.宏观经济信息与股价联动:基于中国市场的实证分析[J]. 管理科学学报,2014,22(3):15-26.

YU Qiuling,ZHU Hongquan.Macroeconomic information and stock price synchronicity: Empirical analysis in Chinese stock markets[J]. Journal of Management Science in China,2014,22(3):15-26.(in Chinese).

[13]张永莉,梁京.航材需求预测方法研究综述及启示[J].中国民航大学学报,2014,31(1):92- 96.

ZHANG Yongli,LIANG Jing.Overview and enlightenment of demand forecasting method research about aircraft spare parts[J]. Journal of Civil Aviation University of China,2014,31(1): 92- 96. (in Chinese).

[14]Ghobbar A A,Friend C H Evaluation of forecasting methods for intermittent parts demand in the field of aviation: a predictive model [J]. Computers & Operations Research, 2003,30(14):2097-2114.

[15]李玲玲,仇蕾.基于灰色神经网络组合模型的水上交通事故预测[J].交通信息与安全,2014,32(3):110-113.

LI Lingling,QIU Lei.Vessel traffic accident forcasting using a combination gray neural network model[J].Journal of Transport Information and Safety,2014,32(3):110-113.(in Chinese).

猜你喜欢
灰色模型交通安全高速铁路
《高速铁路技术》征稿启事
《高速铁路技术》征稿启事
基于改进支持向量机的船舶纵摇预报模型
中国水运(2016年11期)2017-01-04 12:26:47
乡镇道路交通安全
青春岁月(2016年22期)2016-12-23 16:34:20
农村道路交通安全问题
青春岁月(2016年22期)2016-12-23 15:58:54
基于交通安全的高速公路路线平纵组合设计
公路设计应考虑的交通安全因素研究
三种电力负荷预测模型的比较
基于TD-LTE的高速铁路WiFi通信系统
河南省能源消费与经济增长实证分析
商情(2016年11期)2016-04-15 20:04:07