胥红敏,郭 湛,李晓宇,习年生
(中国铁道科学研究院 铁道科学技术研究发展中心,北京 100081)
基于遗传算法优化BP神经网络的道口事故预测
胥红敏,郭 湛,李晓宇,习年生
(中国铁道科学研究院 铁道科学技术研究发展中心,北京 100081)
针对铁路事故发生的偶然性和事故发生原因的复杂性,提出应用BP神经网络对铁路事故进行较长期预测的建议,并以美国高速公路-铁路道口事故为实例,应用BP神经网络方法和遗传算法优化的BP神经网络方法对美国高速公路—铁路道口未来3年的事故进行预测,并将预测结果进行对比,结果表明,遗传算法优化的BP神经网络可以用于铁路事故的中长期预测。
铁路道口;事故预测;遗传算法;BP神经网络
安全是铁路行车的重中之重,铁路事故一旦发生,轻则造成财物的损失,重则危及到旅客、乘务人员或其他人员的生命。据此,以预防事故为目的的事故预测逐渐成为研究人员关注的焦点,通过研究发现,事故的发生短期内看起来似乎没有规律可谈,可是随着时间的延长、累积数据的增加,其客观规律性变得比较明显。把握事故发生的规律,有利于相关部门客观地检查和总结安全工作,有效地预防和控制事故发生,科学地制定未来安全工作的目标。
铁路事故常用的预测方法包括时间序列法、灰色理论法以及神经网络法[1]。其中时间序列法和灰色理论法的短期预测效果明显,研究者也进行了不少灰色理论法预测事故的实践[2~4]。神经网络法在函数逼近以及预测方面具有很广泛的应用[5],但在事故预测方面鲜有报道。本文分别应用神经网络法和遗传算法优化的BP神经网络法对美国高速公路—铁路道口事故进行研究,并对其2014年~2016年的事故件数进行了预测。研究证明,BP神经网络法可用于铁路事故的中长期预测,并且通过遗传算法的优化,其预测结果更加稳定。
1.1 数据来源
美国地域广阔,截止上世纪末,在美国28万km铁路线路上就有公共道口15万余个[6],每年发生的铁路事故中,公路—铁路平交道口事故数量占绝对优势。实例数据来源于美国联邦铁路管理局网站[7]1978年~2013年共36年的公路—铁路平交道口事故。
1.2 BP神经网络
BP神经网络是一种多层前馈型神经网络,1986年由Rumelhart和McCelland为首的科学家小组提出。它包含输入层、隐含层和输出层,隐含层可以一层或多层,具有很强的学习、联想和容错功能,以及高度非线性函数映射功能,预测精度较高,泛化能力好。
对于一个三层BP神经网络,设其输入信号为xi,隐含层节点输出为yj,输出节点输出为zk,输入层节点到隐含层节点的连接权值为wij,隐含层节点到输出层节点的连接权值为wjk,隐含层节点的阈值为θj,输出层节点的阈值为ϕk,则输出层节点的输出为:
其中,n1为输入层的节点数,n2为隐含层的节点数, 为作用函数,其形式通常为线性函数、S型函数或双曲正切S型函数。BP神经网络算法的思想就是根据输出与实际数据的误差来修改连接权值和节点阈值,当输出和实际数据的接近程度达到既定要求时,即固定连接权值和节点阈值,完成模型的建立。
20世纪80年代,RobertHecht-Nielson证明了一个三层的BP网络(只有单隐层的BP网络叫做三层BP网络),可以完成任意的n维到m维的映射,即对于任何一个在闭区间的连续函数都可以用三层BP网络逼近。
1.3 遗传算法
遗传算法是20世纪60年代由美国密歇根大学的John Holland教授提出,是一种自然适应优化方法。该算法将要解决的问题模拟成一个生物进化的过程,通过复制、交叉和突变等操作产生下一代的解,并逐步淘汰到适应度低的解,增加适应度高的解,以达到进化N代后找到适应度满足要求的解。在本文中应用遗传算法,通过优化预测函数中的参数(层间权值和节点阈值)达到优化神经网络预测结果的效果。该算法是常用的一种优化普通BP神经网络的方法,得到的预测效果一般优于未优化的BP网络。
2.1 模型参数及作用函数
建立的模型为有一个单隐层的三层BP神经网络模型,在模型中,参见公式(1),输入层的节点数n1取为30。隐含层节点数的选取在程序中采用试算法,步骤为:(1)输入不同的隐含层节点数;(2)训练网络进行预测;(3)计算预测数据和训练数据的均方误差,选取预测数据和训练数据的均方误差最小时的隐层单元数为网络模型的隐层单元数。作用函数f根据输出与实际数据的吻合程度选取双曲正切S型函数,其表达式为:
2.2 权值和阈值更新滚动算法
在实际应用中,通过研究表明,已经训练好的BP神经网络的预测误差会随着时间的推移而增大。这是因为训练好的BP神经网络的权值和阈值不再随时间改变,从而造成权值和阈值不适应若干时间点后的事故件数预测。为此,本文采用滚动方式训练BP神经网络,使训练数据实时更新。其方法是:利用事故件数数据Nj,Nj+1,…,Nj+e-1为输入,Nj+e,Nj+e+1,…,Nj+e+m-1为输出训练BP神经网络,再以Nj+t,Nj+t+1,…,Nj+e+t-1为输入,用以预测Nj+e+t,Nj+e+t+1,…,Nj+e+m+t-1;然后以Nj+t,Nj+t+1,…,Nj+e+t-1为输入,Nj+e+t,Nj+e+t+1,…,Nj+e+m+t-1为输出训练新的BF网络,再以Nj+2t,Nj+2t+1,…,Nj+e+2t-1为输入,用以预测Nj+e+2t,Nj+e+2t+1,…,Nj+e+m+2t-1。其中,N为事故件数,e为输入的数据数,m为输出的数据数;t为下一次计算的步长。
具体步骤如图1所示:(1)利用1978年到2007年每月的数据为输入,2008年到2010年每月的数据为输出,建立BP神经网络模型1并进行训练,再以1978年到2007年的事故数据为输入模拟2008年到2010年的事故数据,用以与2008年到2010年实际发生的数据进行对比,验证数据的吻合程度,如图2所示。(2)以1981年到2010年事故数据为输入进行模拟,预测2011年到2013年的事故数据,并与2011年到2013年实际发生的数据对比,验证预测的合理性,如图3所示。(3)由于训练好的BP神经网络的预测误差会随着时间的推移而增大,训练数据随着时间的推移进行改变,所以,利用1981年到2010年每月的数据为输入,2011年到2013年每月的数据为输出,建立BP神经网络模型2并进行训练,模拟2011年到2013年的数据,如图4所示。(4)预测2014年到2016年的数据,如图5所示。
2.3 参数优化
在本研究中,为了优化预测结果,还引入了遗传算法优化BP神经网络中的层间权值和节点阈值,进行了图1过程的模拟预测计算,并与未引入遗传算法的结果进行了对比。该算法过程通过MatLab的遗传算法工具箱GAOT实现,在遗传算法中,种群规模为50,遗传代数为100。
图1 事故预测技术路线图
图2 2008年~2010年事故数据吻合程度曲线图
图3 2011年~2013年事故数据预测
3.1 2011年~2013年事故数据预测
图2为用神经网络模型预测的2008年~2010年事故数据与原始训练数据的对比,图3为神经网络模型预测的2011年~2013年事故数据与实际发生的数据的对比,其中图2(a)和图3(a)使用的网络未经优化,而图2(b)和图3(b)使用的网络经过遗传算法优化。可以看出,尽管遗传算法优化的神经网络预测的2008年~2010年事故数据与原始训练数据的吻合程度稍差,但是其预测的2011年~2013年事故数据与实际发生的数据差别明显小于未经优化的BP神经网络的预测结果,据此认为,遗传算法优化BP神经网络得到的预测结果更为可信。
3.2 2014年~2016年事故数据预测
图4为用神经网络模型预测的2011年~2013年事故数据与原始训练数据的对比,图5为神经网络模型预测的2014年~2016年事故数据。由图5(b)可以看出,2014年1月~4月、10月~12月以及2015年全年为高速公路—铁路事故高发时间区段。
图4 2011年~2013年事故数据吻合程度曲线图
图5 2014年~2016年事故数据预测
表1 BP网络预测年事故件数与实际发生事故件数对比表
3.3 事故总数分析
表1为BP网络预测年事故件数与实际发生事故件数对比,表中,BP网络1是由1978年~2007年数据为输入、2008年~2010年数据为输出建立的BP网络;BP网络2是由1981年~2010年数据为输入、2011年~2013年数据为输出建立的BP网络。可以看出,遗传算法优化后的BP网络预测的事故数据件数和实际发生的件数更加接近,用BP网络1预测的2011~2013年(共36个月)事故件数与实际仅相差85件,平均每月误差小于3件;而未经优化的BP网络1预测的2011~2013年事故件数与实际相差712件,平均每月误差接近20件,所以遗传算法优化BP网络比单纯的BP网络更可靠。根据优化BP网络预测, 2014年1月~4月、10月~12月以及2015年全年为美国高速公路—铁路事故高发时间区段,根据预测,2014年到2016年的事故发生的总件数为5 733件,具体到每年预计分别为1 975件、2 223件和1 535件。相对来说,2015年是事故多发年。
通过以上研究,可以得到如下结论:
(1)相对于其它预测方法,BP神经网络对于长期预测效果显著;(2)遗传算法优化可提高BP神经网络的准确性。
[1] 王 卓,贾利民,秦 勇,等.铁路行车事故预测方法分析与比较[J].中国安全科学学报,2009,19(8):34-39.
[2] 罗金保.基于GM(1,1)模型的铁路行车事故预测[J].中国安全科学学报,2004,14(6).
[3] 钱武生.铁路中间站事故的灰色系统理论预测模型研究[J].中国科技信息,2006(9):144-145,136.
[4] 欧春霞,田蘅晖.铁路行车安全预测初探[J].中国安全科学学报,1995,5(2):40-43.
[5] 陈 莺,徐 晨,张维强.基于Huang变换和BP神经网络的时间序列预测方法[J].计算机工程与应用,2007,43(30):242-244.
[6] 贾明涛.铁路道口事故分析与预测研究[D].北京:北京交通大学,2007,4.
责任编辑 杨琍明
Prediction on crossing accident based on BP neural network of optimized Genetic Algorithm
XU Hongmin, GUO Zhan, LI Xiaoyu, XI Niansheng
( Railway Science and Technology Research and Development Center, China Academy of Railway Sciences, Beijing 100081, China )
According to the unpredictability and the complexity of the railway accidents happening, the suggestions using the BP neural network to predict the railway accidents during a long period were presented.And taking the USA highway-railway crossing accidents as examples, the American highway-railway crossing accident in the next three years were forecasted using the BP neural network method and the BP neural network method optimized by the Genetic Algorithm.The forcasted results obtained using the two methods were compared.It was shown that, the BP neural network method optimized by the Genetic Algorithm could be used for the railway accident long-term prediction.In 2014, from January to April and from October to December, and in the whole 2015, was the periods that the USA highway-railway crossing accidents happening frequently.
railway crossing; accident prediction; Genetic Algorithm; BP neural network
U298.55∶TP39
A
2015-06-03
中国铁道科学研究院院基金项目(2013YJ095)。
胥红敏 ,副研究员;郭 湛,副研究员。
1005-8451(2016)03-0008-05