张晓晗,冯爱民,2*
(1.南京航空航天大学计算机科学与技术学院,南京 210000;2.南京航空航天大学人工智能学院,南京 210000)
随着社会经济发展,私家车和人均汽车保有量激增,交通拥堵问题日益严重,交通管理部门面对当前交通压力,提出两种有效解决方案:其一,可通过扩大车道数量以增大道路汽车容量。但由于额外的土地成本和政府巨额支出,通常在许多地区并不可行。基于此,使用流量控制策略以有效利用现有道路网络成为主要技术手段,不仅开支较低且多数情况下均可行,因此更为实用。本文提出一种流量控制策略以合理分配交通资源,从而节省时间并避免交通拥堵。
本文的主要工作如下:
1)长短期记忆神经网络解决了数据长期依赖问题,通过寻找长短期记忆(Long Short-Term Memory,LSTM)神经网络最优参数,可提高交通时序数据预测准确性;
2)将原始交通数据流经过经验模态分解(Empirical Mode Decomposition,EMD)降噪,降低交通数据噪声对预测的影响;
3)应用在实际交通数据集的实验结果表明提出的EMDLSTM算法可有效提高交通数据预测精度。
目前,基于流量控制策略人们提出了大量的流量预测模型,以关注不同模型结构的预测性能,它们可以分为两类:参数方法和非参数方法。参数方法包括历史平均值[1]、灰色预测模型[2]、指数平滑方法[3]、卡尔曼滤波方法[4-6]、自回归综合移动平均值(AutoRegressive Integrated Moving Average,ARIMA)[7]模型、季节性自回归综合移动平均值(Seasonal AutoRegressive Integrated Moving Average,SARIMA)[8]、多元时间序列模型[9-10]、频谱分析[11-12]和结构时间序列模型[13]等。而非参数模型包括人工神经网络(Artificial Neutral Network,ANN)[14]、非参数回归模型[15]、模糊逻辑系统方法[16-17]、支持向量回归(Support Vector Regression,SVR)[18-20]等。这些算法在某些特定应用中表现出高性能,然而也各自有局限性,比如当交通状况急剧变化时,历史平均方法在应对意外事件方面具有关键缺陷;卡尔曼滤波方法容易产生过冲,从而降低预测精度值。非参数法中如刘明宇等[21]、罗文慧等[22]基于深度学习的神经网络结构,交叉验证法了非参数模型的预测性能,具有较高的精准度。而非参数模型采用未指定数量的参数来隐式存储交通数据的微妙方面,由于运输系统的外部环境复杂以及交通系统时空变化的不确定性,从检测器收集的原始交通数据可能会受到一些不可观察的因素干扰,这些干扰,称之为噪声,非参数模型不可避免地包括噪声,这些噪声将导致交通流量预测的可靠性和准确性下降,严重影响预测性能,所以非参数模型需要更多的时间和计算量来学习最佳参数。
因此,原始数据增加去噪过程是提高交通流量预测准确度的有效手段。本文提出了一种短期交通预测算法称之为EMD-LSTM,可预测短期内的交通量,经验模态分解(EMD)可以帮助确定复杂的非线性时间序列的特征,将原始时间序列信号分解为少量的振荡模式以达到降噪目的,这些振荡模式可以表示为某些本征模函数(Intrinsic Mode Function,IMF)和残差,IMF 和残差会保留原始信号的非周期性趋势以及任何周期性波动。长短期记忆神经网络在长时间视野预测方面较其他通用的机器学习算法如ARIMA、ANN 等表现更为突出。
本章主要介绍实验方法以及原理,包括经验模态分解以及长短期记忆神经网络。
经验模态分解(EMD)是一种将瞬时数据分解为多个本征模函数(IMF)和一个残差r(t)同时获得瞬时频率模式的方法,这是Huang 等[23]在1998 年提出的一种时频分析的自适应方法。EMD 不仅突破了傅里叶变换的局限性,而且在确定小波基函数时避免了小波变换的主要问题。EMD 具有良好的时频分辨率和适应性,能够完美地重建原始信号,同时具有突出信号中可能忽略的精细结构的潜力。在噪声抑制方面,EMD可以在将包含噪声的信号分解后,将噪声和有效信号分离为不同的本征模式函数和残差,IMF 分量反映了原始时间序列的不同时间尺度的振荡特性,残差反映了原始数据的长期趋势。也可以通过合理选择IMF来重构信号来达到消除噪声的目的。分解后的IMF与原始交通数据序列相比具有更强的规律性,去除了一定噪声影响。EMD 已应用于图像分析[24]、短期负荷数据降噪[25]、变速箱故障诊断[26]等许多领域,经验模态分解方法完全基于顺序数据的固有信息,不同于傅里叶变换以及小波变换,该方法无需任何预定义的模式,并由于其具有数据自适应功能而取得了巨大的成功。EMD 方法可以处理分析非线性、非平稳数据,这对于探索交通预测模型的隐藏时间序列关系起了至关重要的作用,该方法有助于揭示复杂的非线性时间序列的特征。IMF由以下步骤确定。
对于原始时序数据x0(t),根据其上下极值点,分别确定其上包络线u0(t)和下包络线l0(t),如图1所示。
图1 原始信号的上下包络线Fig.1 Upper and lower envelopes of original signal
a)平均包络线m0(t)是上包络线与下包络线的平均值,通过计算原始数据x0(t)和平均包络线m0(t)的差异,得出第一个IMF,即c0(t)以及第一个残差r0(t)。
b)残差r0(t)将会作为下一轮的原始数据,返回式(1)、(2)计算,得到一系列残差,如式(4)所示,原始数据将被分解成一系列IMF和一个残差rn:
LSTM 神经网络是一种特殊类型的递归神经网络(Recurrent Neural Network,RNN)架构,以解决长期依赖问题。LSTM神经网络在确定时间序列之间的影响的基础上,在长时间预测方面比其他非参数模型表现更好。长短期记忆神经网络引入了三个门来控制和保护存储单元中的信息。门定义为输入门、输出门和遗忘门,每个门的状态由变量通过梯度下降的训练来控制。LSTM模型中的每个门都有独特的功能,遗忘门以一定的概率控制是否遗忘上一层的细胞状态h(t-1),而输入和输出门控制输入数据的流动方向。yt的每个输出都取决于外部输入xt和前单元细胞的输出yt-1,图2 为LSTM 细胞单元更新详细过程。式(5)列出了LSTM 更新公式,运算符和×和+表示矩阵与元素的乘法和加法,Wi(i=f,h,u,o)是Ri(i=f,h,u,o) 对应门的权重度量,相应偏差是bi(i=f,h,u,o)。
图2 LSTM细胞单元更新详细过程Fig.2 Detailed process of LSTM cell unit update
本章将原始数据进行了经验模态分解,根据分解得到的IMF以及残差构建了基于EMD-LSTM预测模型。
使用图3 所示的EMD-LSTM 预测模型,实现步骤如下所示:
图3 LSTM-EMD预测模型Fig.3 LSTM-EMD prediction model
输入 原始时序数据x0(t)。
以3 个周期的数据为例,原始交替数据经过EMD 如图4所示。从图4 可以看出:IMF1、IMF2、IMF3 频率较高,为交通数据中高频分量;IMF4、IMF5、IMF6 周期性明显,为交通数据中低频分量;残差R为整体变化趋势,为交通数据中的趋势分量。EMD 分解了3 个周期的交通数据,表明IMF 比原始数据更稳定。
图4 EMD结果Fig.4 Results of EMD
本章主要介绍实验数据集、实验评价指标、实验设置,将参数法ARIMA 和ANN 与LSTM 分别对比分析,解决数据长期依赖问题,将LSTM 与EMD-LSTM 混合模型进行对比预测,并在不同时间步中分析预测结果。
本实验使用加利福尼亚州所有高速公路交通数据集,如图5 所示,其中包含部分路段2000 年至今近20 年的流量监测数据。该数据集由加州Caltrans 性能测量系统(PeMS)每30 s实时采集一次,截止目前该系统在加州各大城市的高速公路上部署了约4.5 万个探测器。数据集提供聚合以后的5 min粒度的数据,主要字段包括流量、速度、占有率等,也包含传感器站的地理信息。
图5 加利福尼亚交通数据集Fig.5 California traffic dataset
数据集部分特征值如表1 所示,时间一列记录间隔开始的日期和时间,例如,时间08:00:00 表示聚合包含在08:00:00和08:04:59之间收集的数据信息;方向一列代表公路的方向;道路类型一列表示公路类型,比如ML(Mainline)表示主干道,OR(On Ramp)表示斜道等;车流量一列表示5 min 内所有车道的流量总和;车道平均占用率一列表示所有车道的平均占用率,取值为0 到1 之间;平均速度一列表示所有车道在5 min内的流量加权平均速度。
表1 实验数据集部分特征值Tab.1 Some engenvalues of experimental dataset
1)平均绝对误差(Mean Absolute Error,MAE)。平均绝对误差能更好地反映预测值误差的实际情况,公式如下:
其中:fi为预测值,yi为真实值。
2)平均绝对百分误差(Mean Absolute Percentage Error,MAPE):范围为[0,+∞),MAPE 越小表示模型效果越好。公式如下:
其中:fi为预测值,yi为真实值。MAPE 只比MAE 多个分母,MAE考量绝对误差,MAPE考量相对误差。
当使用1 h 的交通数据预测时间步长为1 即5 min 后的交通流量时,表2显示了LSTM 神经网络使用不同数量的层和神经单元个数时训练集以及测试集不同MAPE,可以得出,采用如图6所示的LSTM 神经网络(每层有32个神经单元的3层网络)能够在训练集上产生非常低的误差,再持续增加层数和神经元只会改善训练集的精度,不仅不会提高测试数据的性能,还会增加算法时间复杂度,增加模型训练时长。为了提高测试数据,采用Dropout为正则化方法,优化器使用RMSProp[27],损失函数使用可使模型有效收敛的MSE 指标,其余参数包括学习速率等使用默认参数,迭代1 000次得到训练模型。数据集70%用于训练数据,30%用于测试。
当输入为12 维、步长为1 的LSTM 最优网络结构如图6所示。
图6 步长为12的LSTM神经网络结构Fig.6 LSTM neural network structure with step size of 12
首先解决交通数据长期依赖的问题。为了比对预测结果,此处选用了参数法ARIMA 和非参数法ANN 与LSTM 进行交通流量预测,而考虑到实际应用场景,这里使用1 h 的流量数据分别预测5 min后以及1 h后的流量,结果如表3所示。
表3 ARIMA、ANN、LSTM交通流量预测结果对比Tab.3 Comparison of ARIMA,ANN,LSTM traffic flow prediction results
如实验结果可见,在预测5 min的交通时序数据上,LSTM算法的MAE 比ARIMA 以及ANN 的分别低了2.802 19 和0.042 53,MAPE 比ARIMA 以及ANN 的分别低了3.613 48 个百分点和0.106 个百分点;在预测1 h 的交通时序数据上,LSTM 算法的MAE 比ARIMA 以及ANN 的分别低了4.030 49和0.069 4,MAPE比ARIMA以及ANN的分别低了5.323 08个百分点和0.143 75 个百分点。ARIMA 算法较为适用于稳定交通流量预测,当有外界干扰导致数据不稳定时会使预测准确率降低,非参数法比参数法性能更好;LSTM 比ANN 算法预测精度更高,而且在长时预测中较ANN表现也更为突出。
进一步降低交通数据集的噪声影响,将2019 年1 月份数据的70%作为的训练集,30%作为测试集,进行EMD 得到9个IMF和1个残差,一共10个分量分别进行预测,使用12 h的数据预测1 h 后的交通数据,最后进行结果重构。其中1 d 后的预测结果如图7所示,实验得到的预测指标如表4所示。
图7 LSTM与EMD-LSTM预测结果Fig.7 Prediction results of LSTM and EMD-LSTM
表4 各算法交通流量预测效果对比Tab.4 Comparison of prediction effects of different algorithms
图7 可以看出,本文所提出的EMD-LSTM 模型的预测曲线更接近于原始交通曲线。在噪声影响较多的时间段(图中23:00~5:00)的预测准确性远远高于单一模型。在表4 中,将通过降噪处理以及未降噪模型进行对比分析,总体精度性能从表4 中可以明显看出,EMD-LSTM 的MAE 比LSTM 低了1.916 32,EMD-LSTM 的MAPE 比LSTM 降低了4.645 45 个百分点,混合模型的预测效果明显优于单个LSTM神经网络。
进一步研究表明,通过重构结果即去除部分本征函数IMF的影响,如表4所示可进一步提高预测精度,实验证明,去除IMF1和IMF2的效果是最好的,比全预测结果重构的MAPE降低了0.368 08个百分点,而仅去除IMF2之后的任何一个本征模函数都没有全IMF 预测重构预测精度高,如图8 所示。实验表明EMD 方法将含有噪声的数据分成单独的IMF 并确定实时序列的总体趋势,降低了交通数据噪声对预测的影响,从而有效地提高了预测性能和模型的鲁棒性。
最后为了验证预测模型在不同时间步中的表现,使用12 h 的数据分别预测1 h 后、24 h 后以及48 h 后的交通数据,结果如表5所示。
实验结果所示,准确性随着预测时长增加而降低,EMDLSTM 混合模型的表现均比LSTM 好,在短期(1 h)预测上性能提升最明显,较中长期(24 h、48 h)的预测准确性虽有提升,但是不明显。两个不同的预测时间尺度之间的比较表明,虽然LSTM神经网络可以最大限度地提高原始数据的准确性,可解决所预测数据依赖长期的具有时序性输入的问题,但是在短期预测上比长期预测的准确率要高。
图8 各算法交通流量预测效果对比Fig.8 Comparison of prediction effects of different algorithms
表5 不同时间步的交通数据预测效果对比Tab.5 Comparison of prediction effects of traffic data with different time steps
本文提出了EMD-LSTM 模型,解决了交通数据长期依赖的问题,LSTM在长时间视野预测方面较参数法以及其他人工智能方法表现更为突出。对于高度不稳定的交通流量分布,引入降噪算法EMD,以便在进行预测之前将原始交通数据分解为更多固定的分量,这使原始时间序列信号分解为固定的振荡模式以达到降噪目的,因此只需分别这些分量构建合适预测模型,重构最终预测结果。研究结果表明,将原始交通数据降噪后分别进行预测,预测精度明显优于为降噪处理的单一模型。但是准确性随着预测时长增加而降低,短期预测的效果最优。未来工作将考虑如何优化对于中长期的预测,并且本文研究只考虑了数据的时序性,并没有考虑交通数据的空间性,未来工作将考虑如何加入空间性进一步提高预测精度。