基于多元时间序列预测的智能交通系统

2019-10-21 08:08李家鑫宋佳怡李冠辰宋琳刘翰宸
现代信息科技 2019年12期
关键词:智能交通

李家鑫 宋佳怡 李冠辰 宋琳 刘翰宸

摘  要:随着城市化进程的高速发展,交通拥堵已成为困扰和阻碍城市发展的重要问题。道路大多数是部分拥堵、部分畅通,准确预测出道路拥堵状态可以更好地实现汽车分流,缓解交通压力。本文分别运用VARMA(向量自回归移动平均)和LSTM(长短期记忆网络)算法对首都机场附近的57条道路的拥堵数据进行建模分析,在此基础上将LSTM处理多元时间序列的核心思想加入到多元回归算法中,使多元回归算法拥有处理多元时间序列的能力。之后对三个算法的预测准确度和建模复杂度进行对比,找出适合用于不同场景的算法。得出结论,VARMA模型适用于短期精准预测、RNN适用于长期大规模的波动预测、改造后的多元回归模型适用于中长期快速预测。本文中的算法和结论可以更好地帮助公安和交警及时把控道路拥堵状况,针对道路拥堵情况提前做出预案和防范措施。减轻出行压力,提高居民幸福感。

关键词:交通拥堵指数预测;VARMA算法;LSTM算法;多元线性时序回归算法;智能交通

中图分类号:TP311.13;U495      文献标识码:A 文章编号:2096-4706(2019)12-0104-02

Abstract:With the rapid development of urbanization,traffic congestion has become an important problem that puzzles and hinders urban development. Most of the roads are partially congested and partially unobstructed. Accurate prediction of road congestion can better realize vehicle diversion and relieve traffic pressure. In this paper,we use VARMA (Vector Autoregressive Moving Average) and LSTM (Long-term and Short-term Memory Network) algorithms to model and analyze the congestion data of 57 roads near the Capital Airport. On this basis,the core idea of LSTM processing multiple time series is added to the multiple regression algorithm,so that the multiple regression algorithm has the ability to deal with multiple time series. Then the prediction accuracy and modeling complexity of the three algorithms are compared to find out the suitable algorithm for different scenarios. It is concluded that VARMA model is suitable for short-term accurate prediction,RNN model is suitable for long-term large-scale fluctuation prediction,and the modified multiple regression model is suitable for medium-term and long-term fast prediction. The algorithm and conclusion in this paper can better help the public security and traffic police to control the road congestion situation in time,and make plans and preventive measures in advance for the road congestion situation. Reduce travel pressure and improve residentswell-being.

Keywords:traffic congestion index prediction;VARMA algorithm;LSTM algorithm;multiple linear time series regression algorithm;intelligent transportation

1  緒论

1.1  研究背景

中国是一个拥有14亿人口的大国,城市化和汽车数量的增加都会加剧道路的拥堵。以北京为例,北京城区接近90%的道路已经达到饱和状态,拥堵问题十分严重。

1.2  国内外研究现状

国内外学者在这个问题上的研究已经做了很多努力并有了很多突破,主要的研究方向可以分为非参数回归、参数回归、神经网络、时间序列分析等。我国交通智能化和公安信息化有了很大进步。然而在警务情报整合、时间序列数据的挖掘以及后续的分析结果利用上仍存在不足之处。

1.3  课题研究的内容和意义

1.3.1  研究内容

我们选择了T3航站楼附近的57条道路作为研究的对象。数据包含从2016年到2017年的路况信息,以一小时为间隔。我们选用VARMA(向量自回归移动平均)模型和LSTM(长短期记忆网络模型)进行预测,并对模型做验证和评价。之后对多元回归模型做改进,使多元回归模型拥有处理多元时间序列的能力。为此,我们将时间的因素以自变量的形式加入模型中,并对模型做一系列验证。最后比较三个模型,通过指标选出最优。

1.3.2  研究意义

在现有的道路的基础上,将大数据技术和计算机处理技术有效地运用到交通管理体系中,充分挖掘现有数据的价值。当道路出现拥堵迹象时能发出预警信号并及时采取措施,减少拥堵带来的损失,对预测算法进行创新,找出收敛速度更快、预测准确度更高和使用更为简便的方法。

2  数据预处理

2.1  数据预处理

VARMA算法具备基于时间序列的拥堵数据对数据做变形和拼接系统管理员的功能模块。对于LSTM算法我们需要将数据按照不同的道路进行划分,划分到不同的Excel表中。对于多元线性回归算法,我们需要将不同的道路和道路的前三期的拥堵指数都作为自变量。

2.2  描述性统计

针对57条道路,按照拥堵等级作为划分依据绘制饼图。可以看到其中60%的时间首都机场附近的道路是畅通级别,40%的时间都存在不同程度的拥堵。而拥堵指数超过1.6的情况占到了5.5%左右。

3  交通拥堵建模分析与预测

3.1  VARMA

3.1.1  变量选择

在明确研究目标之后,我们对手中的道路数据做相关分析。如果使用57个变量建立模型,不仅会影响模型的准确率,而且模型的建立和使用都会比较烦琐。因此我们做相关分析之后选出和研究对象相关性较高的变量作为模型输入。

3.1.2  平稳性检验

使用时间序列算法的第一步需要对时间序列进行一系列的检验,用以验证序列是否满足建模的要求。选择用ADF检验来验证,四个变量的ADF检验的结果P值都小于0.05,证明四个变量都是平稳的。

3.1.3  模型定阶

VARMA模型在建立之前需要确定阶数,一个是自回归AR模型的中的P与移动平均模型MA中的Q,我们选择了AIC来确定模型的阶数。AIC通过加入模型复杂度的惩罚项来防止模型出现过拟合的现象。

3.1.4  模型检验

自相关检验:为了验证分析模型的残差之间不存在自相关性。

白噪声检验:对残差做Ljung-Box检验。

正态性检验:为了检查残差列的正态性,绘制了残差列的QQPlot。

3.1.5  模型预测

我们用模型对测试数据做预测,其中测试数据共包括4160条。

越靠后准确率会下降,尤其是对于前五十个数据的预测,预测和实际数据十分贴近。

3.2  LSTM

LSTM模型处理的对象同之前一样,将不同的道路分别存储到Excel表中,并创建一个道路名单表供LSTM模型调用。利用Python语言实现LSTM神经网络模型的建立并预测交通拥堵状况。

3.3  多元线性时序回归

运用最小二乘法计算自变量系数,建立多元线性回归模型。

(1)拟合优度检验:通过模型汇总,检验拟合情况。

(2)显著性检验:在多元线性回归方程中,部分是对回归方程整体的F检验,另一部分是对回归系数的T检验。

(3)多重共线性检验:本文用方差膨胀因子来检验多重共线性。

4  模型对比

对VARMA、LSTM、多元线性时序回归算法采用相同的训练数据,对比VARMA、LSTM、多元线性时序回归算法的性能和特点。之后总结三个模型分别适用于什么场景的拥堵预测。定义步骤如下:

(1)首先给出三个模型在建立过程中的主要步骤,绘制流程图,为后续的对比和介绍奠定基础。

(2)定义试验结果分析的物理量,使后续对比的意义更加明了。

(3)定义建立模型所使用的训练集和测试集。

(4)模型能力测试,本实验的目的是探究三种算法在处理多元时间序列时的预测能力和对数据的挖掘能力。尽可能在三个模型都达到最佳状态时改变训练数据和测试数据的比例来探究算法的预测能力。

5  结  论

VARMA算法更加适用于预测近期交通拥堵指数,并且对数值的准确性要求较高。但VARMA算法对数据质量的要求较高,而且建立时间较长,这就需要有关人员具备较高的模型处理能力。RNN算法更加适用于长期的交通拥堵预测,可以利用RNN模型对首都机场的警力资源做长期的部署,因为RNN模型对拥堵数据的抖动有很强的感知力,在拥堵高发期和波动期RNN的预测效果会更好。只是RNN算法对于不同的数据需要改变大量的参数,这一过程会耗费很多时间。根据改造后的多元回归模型,我们可以看出,对于前、中、后三个阶段数据的预测效果都在可以接受的范围之内,而且多元回归算法建立耗时短、预测精度高、数据要求低。所以多元回归算法很适合公安部门使用。

我国现在正处于信息化建设的高速发展期,需要我们将挖掘数据的算法和工具进行升级和换代。我们相信人工智能和机器学习算法会更加多样化,算法的效果会更好。这将会减轻人们的出行压力,警力资源也会得到更合理的分配。

参考文献:

[1] 崔承颖.基于累积Logistic模型的城市交通拥堵概率估计研究 [D].北京:北京交通大学,2015.

[2] 陈岳明,萧德云.基于跳转模型的路网交通流预测 [J].控制與决策,2009,24(8):1177-1180+1186.

[3] 陈韫.基于LSTM深度网络的城市道路短时交通状态预测模型研究 [D].福建工程学院,2018.

作者简介:李家鑫(1997.04-),男,汉族,北京人,本科在读,研究方向:大数据方向。

猜你喜欢
智能交通
基于自适应虚拟线圈的多车道车流量检测算法
基于大数据的智能停车场管理系统设计
基于智慧城市智能交通系统的交通运行态势分析系统设计
“互联网+”模式下上班族出行方式分析
大数据时代城市智能交通的数据技术
基于物联网的智能交通系统架构
基于支持向量机的车牌字符识别方法
智能交通中的车辆检测专利技术综述
可视化智能交通体系对货运车辆运营的优化