任正平 黄文博
摘要 智能交通系统作为工业物联网最重要的应用之一,旨在提高交通网络的效率和安全性。文章回顾了当前面向智能交通的研究工作,分析了当前研究的重点方向和挑战,对当前的交通预测方法进行分类,给出两种不同类型的预测模型的预测结果,最后提出了智能交通预测领域中潜在的研究方向。
关键词 智能交通;系统框架;预测方法
中图分类号 U491.112 文献标识码 A 文章编号 2096-8949(2022)03-0001-030 引言
由于我国交通设施和交通环境的具体国情和世界上多数发达国家存在差异,国外在智能交通管理系统(ITS)方面的研究偏重于高速公路路网,而在大规模城市地面路网方面的研究成果较少,缺少相应的能够参考和借鉴的成果。因此,需要研究适合我国大型城市路网的ITS。
ITS的核心技术是短时交通预测算法。交通系统是复杂的时变系统,具有高度的不确定性和非线性特征,交通数据也有着周期性、突发性等特点。短时交通预测是根据当前或历史信息预测几分钟或几小时后的情况[1],相较于中长期预测,短期预测的影响因素更多,更加难以预测。可以将周期性变化看作中长期预测需要做的预测,而短期预测则是要考虑到突发状况,而突发性状况需要根据近期交通数据进行预测。由于ITS用于实时管理交通状况,因此短时交通预测算法应具有以下特点:
(1)实时性。由于是短时预测,因此算法需要有快速计算能力。
(2)准确性。ITS一般用于动态路径诱导,不准确的预测会使使用者丧失信息,预测也失去了意义。
(3)可靠性。交通状况受到的影响因素很多,比如事故、临时交通管制等等,而交通数据本身由于采集技术的原因也可能不完整或不准确,因此,短时预测算法需要有很强的抗干扰能力。
针对当前短时交通预测中存在的问题,从影响交通数据切入,分析影响交通状态的因素,梳理并分析当前常用的预测算法的性能、特点及存在的问题,结合交通数据的三个特点,给出最合适的交通预测方法和研究方法架构。
1 系统框架
研究地面主干路网交通短时预测与报警的系统化方法,包括数据与处理、数据预测、应用等流程,为后续研究形成一套可应用的方法架构。其架构如图1所示。
整个地面主干路网交通短时預测与报警研究主要分为五个阶段:
(1)数据获取阶段。根据从当前研究现状中了解到的交通短时预测的影响因素,首先获取相关数据。数据主要包括磁感线圈、GPS等探测数据,也是进行预测的主数据,包括速度、流量等。
(2)数据预处理。数据的质量直接影响预测算法的精确度,但直接采集到的数据质量较差,存在噪声、数据缺失等情况,需要对采集到的数据进行滤噪、数据补全等处理,将数据处理成可以使用的高质量数据。常用的提高数据质量的方法有小波变化、使用相近数据补全、多源数据融合等。不同的算法也需要不同的数据形式,聚合是对速度、占有率和交通流等采集数据的处理,滤波和差分是将交通数据转换为平稳数据的技术,特征提取是某些算法为提高效率对交通数据进行降维处理。
(3)使用短时预测算法预测交通状态。短时预测算法是地面主干道路网短时预测与报警技术的核心。目前使用的算法主要包括四类:简单算法(又叫简单技术)、参数化技术、非参数化技术和混合技术。每种技术都有其优缺点,目前最常用的是ARIMA系列和LSTM相关的混合技术。每种算法都有其优缺点,针对不同的数据和目的可选用不同的算法。该文对这些算法的特点进行研究,结合大城市地面交通的特点进行相应的改进,最终得到更加适用的算法。
(4)功能。基于这些预测算法可以产生许多应用,如交通流量、速度和占有率预测、突发事件预警、事故风险预测、行程时间估计等。这些功能是ITS等系统的核心。
(5)系统。通过对这些功能的集成可以实现如ITS、ATIS等系统,应用到现实中。最终达到协助交通管理部门进行决策,高效有序地管理交通的目的。
2 预测方法分类
目前的预测算法分为四类:简单算法、参数化技术、非参数化技术和混合技术,其结构如图2所示。表1详细分析了各种算法的适用范围和优缺点。
分析表1可以发现,单个预测算法中,LSTM最适合对短时交通数据进行短时预测,将其发展为深度神经网络精确度将更高。当前对LSTM的改进为加入时空关系,提升了预测精度。但是随着精确度的提高,模型越来越复杂,时间复杂度也越来越高,训练模型花费的时间也越来越多。相反,ARIMA模型的精确度不高但简单、易于构建,实时性较好。
组合模型是多种种算法进行组合预测,基本为聚类、粒子群、遗传算法、交叉熵算法、非参数模型和参数模型之间的组合。其中,聚类可以分析道路网之间的时空关系,粒子群、遗传算法、交叉熵算法常用来优化模型参数。为提高复杂模型的训练效率,将特征提取算法如PCA与其他模型结合。
3 预测案例
利用从上海交通中心获取的2017年5月1号到2017年8月31号之间的交通速度数据,分别使用了ARIMA和LSTM进行了预测,速度数据时间间隔为2 min。
ARIMA 差分整合移动平均自回归模型,又称整合移动平均自回归模型(移动也可称作滑动),时间序列预测分析方法之一。ARIMA(p,d,q)模型可以表示为公式(1)。其中p为自回归项数,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。L是滞后算子。
(1)
使用数据集中某一天的速度数据进行预测,其结果如图3~4。从图中可以直观发现,预测精度较高。
LSTM是一种时间循环神经网络,适合处理和预测时间序列中间隔和延迟非常长的数据。作为非线性模型,LSTM可作为复杂的非线性单元用于构造更大型深度神经网络。该文使用数据集中的部分数据为训练集训练模型,使用训练好的模型预测交通速度,直观发现精度较高。
4 总结
交通状况影响因素很多,早期预测模型可以有效预測单一数据的变化,但在城市交通中,道路复杂,不能仅针对某一路段的历史数据进行预测。神经网络模型可以有效捕捉复杂情况下的特征,是以后智能交通系统中的重要组成技术。
参考文献
[1]Kehagias D,Salamanis A,Tzovaras D. Speed pattern recognition technique for short-term traffic forecasting based on traffic dynamics[J]. Intelligent Transport Systems Iet,2015(6):646-653.
[2]Xia D,Wang B,Li H,et al. A distributed spatial-temporal weighted model on MapReduce for short-term traffic flow forecasting[J]. Neurocomputing,2016(C):246-263。
[3]Wu C H,Ho J M,Lee D T. Travel-time prediction with support vector regression[J]. IEEE Transactions on Intelligent Transportation Systems,2004(4):276-281.
[4]Ma X,Tao Z,Wang Y,et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C,2015(54):187-197.
[5]Lv Y,Duan Y,Kang W,et al. Traffic Flow Prediction With Big Data: A Deep Learning Approach[J]. IEEE Transactions on Intelligent Transportation Systems,2015(2):865-873.
[6]Zhao Z,Chen W,Wu X,et al. LSTM network: a deep learning approach for short-term traffic forecast[J]. Iet Intelligent Transport Systems,2017(2):68-75.