李世杰, 王景升, 牛帅
(中国人民公安大学交通管理学院, 北京 100038)
城市交通问题是城市发展过程中不可回避的问题,随着汽车保有量逐渐增加,城市道路交通流量进而逐渐增长。行程时间作为反映道路运行状况的重要指标,可以衡量道路的通行效率[1]。行程时间在城市交通出行诱导起着关键作用,通过预测未来道路行程时间,可以为交通参与者提供路径选择。如何对行程时间进行预测是研究缓解城市交通压力的主要热点和难点,因此精准预测行程时间对于道路交通诱导至关重要[2]。
近年来,随着智能交通系统和人工智能技术的迅速发展,交通预测成为城市交通领域的热点之一。中外学者提出的预测方法可以从以下角度进行分类。分别为基于统计模型、基于机器学习模型和基于深度学习模型等预测方法。基于统计的预测方法主要有线性回归、ARIMA(auto-regressive integrated moving-average model)模型[3-4]、 Kalman(Kalman filter) 滤波[5]等方法,由于实际交通具有非线性和混沌特性,此类模型通常依赖于数据平稳的假设,且不适应大规模数据处理。机器学习模型的预测方法主要有支持向量机[6]、贝叶斯网络[7]、XGBoost(extreme gradient boosting)[8]、K近邻算法[9]等。Long等[10]使用人工鱼群算法对SVM(support vector machine)模型进行优化,将优化后的SVM模型用于高速公路行程时间预测,能够获得较高的准确率。Meng等[11]将KNN(k-nearest neighbors)与SVM模型结合对高速公路行程时间进行预测,能够在加速训练的同时保证预测的准确性。基于深度学习模型的预测方法如长短期记忆(long shot-term memory, LSTM)[12]、门控循环单元(gated recurrent unit, GRU)[13]等。Li等[14]使用基于LSTM的卷积神经网络对时空特征进行学习以准确预测道路行程时间;张明等[15]将改进注意力机制与GRU模型结合预测城市道路行程时间,预测精度相较于仅使用GRU模型有较大提高;虽然深度神经网络模型与机器学习模型相比,在处理大规模数据时具有显著优势,但由于行程时间序列具有较强的非线性和非平稳性,单一神经网络在预测精度越来越难以满足出行者与交通管理着日益增长的精度需求。与单个模型相比,组合模型[16]能够提供更加准确的预测结果。
因此,现借鉴金融学和地理学等领域中广泛应用的自适应信号分解方法(variational mode decomposition,VMD)[17],将原始行程时间序列进行分解,以降低原始时间序列的非稳态性。考虑到GRU模型在时间序列预测中具有较高的精度,提出一种新的组合预测模型,简称VMD-GRU,以实现对非平稳性较强的行程时间进行预测。
变分模态分解(VMD)是一种能够有效处理波动信号的自适应信号分解算法,可以有效降低复杂度高和非线性较强的时间序列非平稳性[18]。VMD将原始时间序列进行分解为若干个相对平稳且不同频率的时间子序列,以减少模态混叠现象的发生。VMD算法流程如下。
步骤1构造变分模型。将原始序列分解为K个分量,构造其约束变分函数为
(1)
式(1)中:K为模态数目,即分解信号的个数;uk(t)为第t个模态分量;ωk为中心频率;k为第k个分解信号;∂t为随着时间变化的偏导数;δ(t)为狄克拉分布函数;f(t)为原始序列信号;*为卷积;j为虚数单位;t为时间参数。
步骤2利用其约束变分模型引入拉格朗日乘子和二次惩罚因子来降低干扰,同时将上述问题转化为非约束变分问题。
(2)
式(2)中:L为增广Lagrange函数表达式;α为二次惩罚因子;λ为拉格朗日因子。
步骤3使用交替方向乘子法进行求解,中心频率ωk与模态uk的求解公式为
(3)
门控循环网络(GRU)是应用最为广泛的循环神经网络(recurrent neural network,RNN)变种之一,同时作为LSTM的改进版,使用“门”结构选择性地丢弃或保留一些信息,在某些情况下能产生较为优异的效果。GRU包含更新门和重置门两个门结构,它将LSTM模型中的3个门合并成更新门和重置门,其更新门相当于LSTM的输入门和遗忘门,结构变得更加简单,从而相对于LSTM提高了模型整体的训练速度。
GRU模型结构如图1所示。更新门帮助模型决定要将多少前一时刻的信息传递到当前时刻中,更新门的值越小,代表更少的前一时刻信息被传递到当前时刻;重置门用于控制遗忘前一时刻信息的程度,重置门的值越小,代表忽视前一时刻的信息越多。
图1 GRU内部结构Fig.1 Internal structure of GRU
zt=σ(Wz[ht-1,xt]+bz)
(4)
rt=σ(Wr[ht-1,xt]+br)
(5)
(6)
(7)
式中:zt和rt分别为GRU的更新门和重置门;xt为t
行程时间序列具有非平稳性与波动性等特点,使用单一的预测模型难以得到较精准的预测结果。考虑到VMD分解算法在处理非线性数据方面的优势以及GRU模型能够较好地捕获时间序列的特征。文本使用VMD-GRU组合模型对行程时间进行预测。VMD-GRU组合预测模型首先将原始行程时间序列分解为若干相对平稳且不同频率的时间子序列,实现行程时间序列的降噪,有效缓解原始序列的非平稳性与波动性,其次针对其子序列建立预测模型,通过使用GRU模型独立预测若干时间子序列使预测风险分散,最后将各个时间子序列的预测结果进行融合。为了更好地捕获城市道路行程时间序列的非线性和非平稳特征,通过使用VMD算法将原始行程时间序列分解为若干相对平稳的IMF(intrinsic mode function)分量,然后为每个IMF分量构建GRU预测模型,最后将每个IMF分量预测的结果进行汇总融合,以产生最终行程时间预测结果。设计城市道路行程时间VMD-GRU组合预测模型如图2所示。VMD-GRU组合算法的具体步骤如表1所示。
表1 VMD-GRU模型的预测步骤Table 1 The prediction steps of the VMD-GRU model
图2 VMD-GRU模型流程图Fig.2 VMD-GRU model flowchart
本文数据来源于河北省唐山市北新西道部分路段电子警察卡口数据。该数据包含交叉口编号、交叉口名称、车牌号、采集时间、方向编号等字段属性。通过提取上下游交叉口电子警察过车记录,计算15 min时间间隔内车辆经过上下游交叉口的行程时间,然后对行程时间进行清洗,剔除异常值,最后对15 min时间间隔内的行程时间取均值,作为下文行程时间的训练与预测数据集。经数据处理后,得到行程时间样本数据,为连续12 d的15 min粒度构成的时间序列,共计1 152段行程时间数据,如图3所示。
图3 行程时间序列图Fig.3 Travel time series plot
将行程时间序列采用VMD算法分解为5个IMF时间子序列分量,降低原始时间序列的复杂程度,分解后的时间子序列图像如图4所示。
图4 行程时间序列分解结果Fig.4 Travel time series decomposition results
为有效验证模型的预测效果,将数据集前80%作为训练集,后20%作为测试集。为消除数据量纲所带来的影响,将VMD分解后的时间子序列数据分别进行归一化处理,并分别使用GRU、LSTM模型对其进行预测。在GRU神经网络中,GRU层包含80个神经元,Dropout层可随机断开网络层之间的连接,有效防止过拟合,经过多次实验,设置为0.3时效果较好,滑动时间窗口长度设置为60,损失函数选用均方误差,使用Adam优化器对模型参数进行优化,迭代次数设置为50,Batch_Size设置为32。为进行组合模型对比验证,在LSTM神经网络预测模型中,仅将GRU层改变为LSTM层,其余设置不变。为检验模型预测效果,采用均方误差(mean squared error,MSE)、均方根误差(RMSE)、平均绝对误差(MAE)作为评价指标。
(8)
(9)
(10)
式中:xit为时间序列的真实值;xip为时间序列的预测值;n为数据个数。
VMD-GRU模型与VMD-LSTM模型的各分量IMF的预测对比结果如表2所示。从表2可以看出, GRU模型中各个分量的MSE、RMSE、MAE值均小于LSTM模型中的值,其中MSE降低0.05~0.50,RMSE降低0.10~0.26,MAE降低0.07~0.21。说明GRU模型在预测时间子序列的预测精度高于LSTM模型,这是因为GRU模型具有独特的门结构特征,能够有效地学习各分量的数据特征,提高模型训练速度与预测精度。
表2 各分量IMF预测评价结果Table 2 Each component of the IMF predicted evaluation results
为了验证VMD-GRU组合预测模型的精确性,将单一的RNN、LSTM、GRU、BiLSTM神经网络模型以及VMD-LSTM模型作为对照组,对行程时间序列进行预测,各个预测模型输出的测试集拟合结果如图5所示,各个模型相应的RMSE、MSE、MAE值如表3所示。
表3 各模型评价结果Table 3 Evaluation results of each model
true表示实际的行程时间数值图5 各模型预测结果Fig.5 Predicted results of each model
由图5可知,VMD-GRU组合预测模型的拟合曲线与真实值的吻合程度较高。由表2可知,组合模型相较于单一模型预测精度提升较大,说明组合模型能更好地捕获行程时间的变化,比单一模型适用于波动性较强的城市道路行程时间预测。主要原因是使用VMD分解算法后,可以有效降低原始行程时间序列较强的非线性特征,使得模型在训练时能够更容易捕获其特征,从而提高预测精度。VMD-GRU组合预测模型的RMSE、MSE、MAE、MAPE值相较于其他模型均较低,其中MSE降低4.81~79.98,RMSE降低0.34~4.37,MAE降低0.22~3.35。表明VMD-GRU模型在行程时间序列预测中相较于其他对照模型具有优越性。
城市道路行程时间序列具有非线性、非平稳性,因此单一预测模型较难达到满意的预测结果。提出了融合VMD与GRU的行程时间组合预测模型,将原始时间序列分解,并分别与门控循环单元神经网络结合,最后将各自预测的结果进行融合,产成最终的行程时间序列预测结果。通过实例得出以下结论。
(1)通过使用VMD算法将原始行程时间序列分解为5个IMF分量,能够有效降低了原始时间序列的波动性。
(2)使用VMD-LSTM模型作为对照组,来证明VMD-GRU模型在处理行程时间子序列具有较高的预测精度。
(3)将RNN、LSTM、GRU单一模型和VMD-LSTM模型的行程时间预测结果与本文所提出的VMD-GRU模型进行对比验证,证明VMD-GRU模型在行程时间预测中的优越性。
但城市道路行程时间仍受交通环境、天气、道路状况等因素的影响,下一步考虑将获取相关因素的数据,在预测时综合考虑相关因素的影响。