基于小波分解和长短时记忆网络的地铁进站量短时预测

2019-09-02 11:56:10高梦琦昌锡铭王欢
山东科学 2019年4期
关键词:客流量进站小波

高梦琦,昌锡铭,王欢

(北京交通大学交通运输学院,北京 100044)

地铁以其可靠性和安全性成为人们出行的首要选择,客流量是地铁项目设计与建设、运营与管理的基础[1]。由于居民的出行会受到天气、突发事件等影响,具有一定的随机性,中长期预测已经难以反映地铁客流的实时变化趋势。因此,需要对地铁客流量进行短时预测,使管理部门把握客流的动态变化规律,加强对市场的应变能力,适时调整客运服务计划,加强对客流的动态管理。

由于短时客流量具有非线性与波动性,对其的预测依旧是一个有难度的问题。国内外学者都对短时客流预测做了大量研究,现有的基于数据的短时预测方法主要分为参数和非参数两大类。参数方法中,未来交通量和历史数据的函数关系是已知的,未知参数可以从训练集中估计。Li等[2]对交通流量的时间序列数据的趋势与波动进行分解,之后用套索回归进行预测。Ding等[3]提出了ARIMA-GARCH模型,考虑地铁进站量的波动特征对其进行预测。Ma等[4]提出了一种时空阈值矢量误差校正模型(TS-TVEC),考虑了路段流量与其上下游的时空关系。Ma等[5]提出了时间序列模型与卡尔曼滤波的组合模型。但是,这些参数方法不能反映数据的随机性和复杂的非线性特性。非参数方法主要有神经网络的方法,对模型不会做出很强的假设。Zhang等[6]将遗传算法与深度信念网络结合,对高速公路的车流量进行了预测。Zhao等[7]对公交乘客数据进行小波分解并通过BP神经网络对分解序列进行预测,重构得到预测结果。Ouyang等[8]用粒子群算法优化后的BP神经网络对小波分解后的子序列分别进行预测,将子序列相加得到最终预测结果。Li等[9]用多尺度径向基函数网络,对北京有突发事件的几个地铁站的出站量进行了多步预测研究。这些方法考虑了时间序列的非线性特性,但没有考虑交通数据在时间上的规律,而交通数据在时间上有一定的周期性。Kang等[10]用循环神经网络中的长短时记忆网络(LSTM)对高速公路的5 min交通流量进行了预测,考虑了时间序列数据在时间上的规律,但单一的运用LSTM没有处理短时客流数据的波动性。

地铁的进站量数据在时间尺度较小时随机性与波动性更强,同时具有一定的周期性。本文提出了小波分解与长短时记忆网络的组合模型(Wavelet-LSTM),全面考虑了短时进站量数据的波动性、非线性特性和时间相关性,弥补了以往文献只考虑单一特性的不足。用小波变换处理小时间尺度数据的波动性,LSTM在普通神经网络能处理非线性数据特性的基础上还可以学习数据的时序信息。通过与其他方法比较可知,此方法可以得到较为精确的预测结果,能够使管理部门及时获得动态客流信息,以便适时调整运营管理计划,改善地铁系统的运营管理水平。

1 预测模型

地铁的短时进站量数据具有一定的非线性特性,因所取时间段较短,数据较多,每个数据之间都存在一定差异性,并且短时的客流量数据受时间等随机因素的干扰较大,工作日早晚高峰客流量大且集中,瞬时客流量巨大,因此地铁短时进站量数据有一定波动性。而小波分析能分离趋势信息和波动信息,具有解决非稳定时间序列的能力,其分解后的低频近似信号可以反映时间序列的趋势,减少数据的波动性,因此常被用来解决时间序列问题。LSTM属于神经网络的一种,可以捕捉数据复杂的非线性特性并能考虑时间上的规律。本文的基于小波分解和LSTM的短时预测方法(Wavelet-LSTM),对数据的性质考虑较为全面。因为小波分析主要用来提取趋势信息、过滤波动信息,分解层数不需要太多,于是先通过小波分解对小时间尺度上的客流量的时间序列数据进行三层分解和单支重构得到分解后的四个子序列,以达到提取特征趋势并分离噪声的效果。对小波分解出来的每个子序列分别用能记忆时间特征信息的LSTM进行预测,最后对预测得到的子序列进行相加,得到预测的进站量。预测模型的结构见图1。

图1 小波分解与长短时记忆网络的预测模型Fig.1 The Wavelet-LSTM forecasting model

1.1 小波变换

城市地铁客流量的时间序列数据可看作一个一维信号,对其做小波分解得到分解系数,再通过分解后的小波系数进行信号的单支重构,可以将具有早晚高峰趋势的低频信号与包含噪声信息的高频信号分开,从而能达到提取特征的目的。

本文中,可把客流量当作一维的信号进行小波分解与重构。客流量为离散时间序列,因此使用离散小波变换中的快速二进正交小波变换[11](Mallat算法)对其进行分解和单支重构。

分解过程可表示为:

Dm=HAm-1,

(1)

Am=GAm-1,

(2)

式中,H和G分别为正交镜像滤波器组中具有低通特性的滤波器和具有高通特性的滤波器;m为分解次数,A0为原始时间序列。经过第一次分解后,可得到包含原始信号主要信息的低频近似信号A1,以及包含误差的高频细节信号D1;下一次分解将近似信号A1分解为A2和D2,…,直至得到平滑的低频信号。经过m次分解后可以得到m+1个序列(D1,D2,…,Dm和Am),分解过程如图2所示。

图2 小波分解过程Fig.2 The wavelet decomposition process

采用Mallat算法进行小波分解时,每次分解后的时间序列的长度都会减少,较短的时间序列数据对接下来的预测是十分不利的,但可以用重构算法对分解后的每个分量进行单支重构,从而使每个分解序列的长度和原来相同。单支重构过程可表示为:

am-1=H*Am+G*Dm,

(3)

式中,H*和G*分别是H和G的对偶算子。通过单支重构可以增加序列的长度,对D1,D2,…,Dm和Am分别进行重构,得到序列d1,d2,…,dm和am,其长度和原始序列相同,并且和原始序列有如下关系:

A0=d1+d2+…+dm+am。

(4)

本文中采用db4小波对原始数据进行分解并重构,由于小波分析的目的在于提取数据的主要变化趋势,过滤随机性信息,不需要进行过多的层数分解从而增加计算量,因此对进站量数据进行3层的分解与重构,将时间序列分为4个子序列(d1,d2,d3和a3),对这些子序列分别利用LSTM进行预测,再相加得到原始序列,能有效提高预测精度。

1.2 长短时记忆网络

神经网络适用于非线性预测,但传统的神经网络模型不具有对历史信息的记忆功能。神经网络中的循环神经网络(RNN)可以将先前神经元的输出信息应用到当前的任务上,RNN的结构示意图如图3所示。

图3 RNN结构示意图Fig.3 Schematic of the RNN structure

但普通的RNN存在梯度消失或爆炸的问题[12]。长短时记忆网络(LSTM)属于循环神经网络的一种,可以学习长期依赖的信息。LSTM将隐藏层的RNN神经元替换为LSTM神经元,不但具有RNN的记忆功能,而且克服了模型的长期依赖问题,能选择性地遗忘无效信息并更新记忆有效信息,可以在一定程度上解决梯度弥散的问题。经过小波分解与重构后的序列依旧为时间序列,可通过LSTM对各序列进行预测。LSTM神经元的结构如图4所示。

图4 LSTM神经元结构Fig.4 Structure of the LSTM neuron

输入序列为x=(x1,x2,…,xT),即为时间序列数据,经过LSTM计算后的隐藏层序列为h=(h1,h2,…,hT),输出序列为y=(y1,y2,…,yT),通过下式迭代:

ht=H(Wxhxt+Whhht-1+bh),

(5)

yt=Whyht+by,

(6)

其中W是权重系数矩阵(如Wxh是输入层到隐藏层的权重系数矩阵,Whh为隐藏层之间的权重系数矩阵),b为偏置向量(如bh表示隐藏层的偏置向量),为隐藏层的转换函数,由以下一系列函数实现:

it=σ(Wxixt+Whiht-1+Wcict-1+bi),

(7)

ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf),

(8)

ct=ftct-1+itg(Wxcxt+Whcht-1+bc),

(9)

ot=σ(Wxoxt+Whoht-1+Wcoct+bo),

(10)

ht=oth,

(11)

式中,i,f,c,o分别为输入门、遗忘门、神经元状态和输出门的输出值。这里σ(·)是标准逻辑函数:

(12)

g(·)和h(·)是中心对称的逻辑函数。

模型的训练过程即为权重的迭代更新过程,训练结果需与真实值相对比。本文LSTM中各个权重的更新是通过ADAM优化算法最小化目标函数et来实现的:

(13)

式中,pt为t时刻的真实值,yt为t时刻的预测结果,et即为均方误差。训练多次直到et最小,即为最终的模型。

本文对小波变换后的每个子序列都分别输入LSTM进行预测,之后对每个子序列输出的预测结果进行相加,可得到最终的地铁站进站量预测结果。

1.3 误差分析

对于地铁站进站量的预测结果,本文采用平均绝对百分误差(δMAPE)、均方根误差(δRMSE)和希尔不等系数(CTIC)来检验其精度。几个误差公式定义如下:

(14)

(15)

(16)

2 数据来源与模型结构

本文选取北京地铁2号线的西直门地铁站作为研究对象,对其进站客流量进行预测。西直门地铁站作为重要的换乘站点,有3条换乘线路,客流量较大,其进站量的预测对于站点内部的规划、紧急事件下的乘客疏散等都有着重要意义。由于工作日和节假日的客流量规律相差较大,且工作日的出行为必要出行,所以对于工作日的进站量预测更加重要。

本文选取2014年3月3日—14日连续10个工作日7:00—22:00的地铁刷卡数据作为研究样本,对其进行预处理。以5 min为时间步长,每天可划分为180个时间段,分时段来预测短时进站量。经过处理后,3月3日的进站量变化趋势如图5所示,呈现出明显的早晚高峰趋势,并具有波动性,且在高峰时段波动性较强。

图5 3月3日进站量Fig.5 Passenger flow on March 3

其他几个工作日的进站量也与3月3日相似,连续10个工作日的进站量见图6,趋势比较稳定。进站量在时间上的特性,表示适合用LSTM处理这种时间序列数据,因为模型可以记忆时间上的信息。

图6 连续10个工作日进站量Fig.6 Passenger flow on ten consecutive working days

对该10 d的时间序列数据进行3层的小波分解并单支重构,得到4个有效的子序列,且每个子序列的长度都和原始序列相同。3月3日的进站量数据的重构结果见图7,4个序列的长度相同,其中a3为最终得到的平滑低频信号,有前后两个高峰,反映了进站量的趋势;其他3个序列反映了其他因素的干扰,波动性较强,且波动最大的地方对应于a3两个高峰的位置。

图7 3月3日进站量小波分解与重构Fig.7 Wavelet decomposition and reconstruction of the passenger flows on March 3

本文选取的循环神经网络模型共3层,含有一个输入层、一个隐藏层和一个输出层,隐藏层即为LSTM层,层中神经元个数为10个。因为分解后的子序列数值有正有负,所以输出层激活函数选择tanh函数。将子序列中预测时段之前的5个时段的数据作为输入向量,经过模型的计算,输出为预测时段的进站量重构数据,再对其进行相加,得到最后的预测结果。

把前7 d的数据作为训练集,后3 d作为测试集。训练过程中,对各个分解序列的训练次数达到1000时,均方误差波动较小,几乎不会再减小,因此把其定为模型的训练次数。对LSTM得出的所有分解序列相加,即可得到后3 d的进站量预测结果。

另外,本文将提出的模型与LSTM、经验模态分解[13](EMD)与LSTM相结合(EMD-LSTM)这两个模型的预测精度进行对比,比较模型的优劣。

3 预测结果

将西直门地铁站10个连续工作日的进站量数据经过本文的小波分解与LSTM进行预测后,3天测试集的子序列预测结果见图8。

图8 子序列预测结果Fig.8 Prediction results ofsubsequence

将子序列的预测结果进行相加,即可得到进站量的预测结果。图9为Wavelet-LSTM、LSTM、EMD-LSTM的预测结果与实际进站量的对比图。

图9 预测结果Fig.9 Prediction results

对3个模型的预测结果和实际进站量进行误差估计,以评价每个模型与真实值的拟合程度。对比结果表明本文采用的模型有明显优势,模型的预测误差如表1所示。

表1 不同模型的预测误差

由表1可知,Wavelet-LSTM模型的预测结果的误差与另外两个相比最小,其平均绝对百分误差、均方根误差和希尔不等系数分别为5.48%、18.13和0.03,与另外两个模型相比均有下降。这表示数据的波动性对预测结果影响较大,且小波变换更适合处理这一特性,通过小波分解与重构分解时间序列数据、提取时间序列的特征趋势之后再进行预测可以提高预测精度,比经验模态分解更加有效;LSTM的记忆特性在时间序列数据上的应用较适合,与小波变换结合后,预测效果更好。因为本文的主要关注点在于提高模型的预测精度,而没有过多关注运行效率,所以运行时间约为15 min,效率有待提升。

4 结论

本文使用了小波分解和LSTM相结合的方法来进行交通流量的预测,同时考虑到了短时进站量数据的波动性和在时间上的相关性,有效提高了预测精度。以北京西直门地铁站为例,先对每天的进站量数据进行小波分解与单支重构,再对其用LSTM模型进行预测,得到的序列进行相加,从而得到进站量的预测结果。实验结果表明,因为小波分解对数据有提取趋势和减少波动性的作用,使时间序列的趋势更加明显,LSTM 可以学习记忆时间上的信息,适用于在时间上具有相关性的数据,从而得到了较好的预测结果。该研究为运营管理部门更好地捕捉地铁客流动态变化规律、制定短时运营策略、管理车站动态客流提供了数据基础,还能为乘客及时提供动态客流信息,促进城市交通合理规划。本文的不足之处在于算法效率有待提升,并且没有考虑天气、季节等因素对进站量的影响,未来可以结合其他因素进行研究并改进算法效率。

猜你喜欢
客流量进站小波
构造Daubechies小波的一些注记
科技风(2021年19期)2021-09-07 14:04:29
基于MATLAB的小波降噪研究
电子制作(2019年13期)2020-01-14 03:15:32
进站口上下行载频切换时引起ATP制动问题分析
春运期间北京西站共有154.8万人次刷脸进站
祖国(2018年6期)2018-06-27 10:27:26
地心游记(四)一位向导
基于嵌入式系统的商场客流量统计算法
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
基于AFC数据的城轨站间客流量分布预测
基于FPGA小波变换核的设计
电测与仪表(2014年8期)2014-04-04 09:19:38
重庆轨道交通三号线列车进站警示功能接口电路的分析