城市轨道交通进出站短时客流预测模型研究

2021-09-29 08:53蔡昌俊
城市轨道交通研究 2021年9期
关键词:进站客流次数

蔡昌俊

(广州地铁集团有限公司,510335,广州/正高级工程师)

0 引言

在城市轨道交通网络化运营时期,客流过饱和情况时有发生,这对车站运营组织工作提出了很高的要求。准确预测车站短时客流量,并据此制定科学的客运计划和组织方案,将有助于实现车站客流的动态管理,提高车站的运营效率。

目前,针对短期交通量预测的模型主要包括:数理统计模型,如时间序列模型[1]、卡尔曼滤波模型[2]等;人工智能模型,如支持向量机(SVM)[3]、长短时记忆网络(LSTM)、径向基函数(RBF)神经网络等;混合模型,如小波变换(WT)与自回归滑动平均模型(ARMA)的组合模型[8]、完全总体经验模态分解与LSTM的组合模型[9]、灰狼优化算法(GWO)与小波神经网络(WNN)的组合模型[10]、卷积神经网络(CNN)与LSTM的组合模型、WT与SVM的组合模型[14]等。以上研究成果对城市轨道交通客流预测具有重要的意义。但短时客流存在随机性、突变性、动态性等难以被精确预测的特点,对于短时客流预测,现有模型存在预测精度不够高或泛化能力不强等问题。数理统计模型对数据的随机变化不够敏感,针对随机性较强的短时客流,其预测性能比较有限[11];人工智能模型能够描述城市轨道交通短时客流量数据的非线性特征,但对于海量的小粒度短时客流数据,其预测精度还有待进一步提高。混合模型综合了各种单一预测模型的优势,在一定程度上能够提高预测精度。但是,组合模型的组合方式及组合内容对预测精度的影响较大,因此需根据数据特点选择合适的组合模型。

循环神经网络(RNN)是一种强大的深度学习方法,可以将数据传递到先前的或同一层的神经元。LSTM是一种特殊的RNN,在各种各样现实问题上的表现都非常好[16]。Adam算法结合了Momentum和RMSProp两种算法的优点,可通过计算梯度的一阶矩估计和二阶矩估计,为不同参数设置自适应学习率,其学习率的取值接近Momentum算法,其收敛速率显著高于固定学习率的算法[17]。小波变换是一种数据预处理方法,在时域和频域都有着良好的局部分辨能力,在处理非线性和非稳定性数据方面具有很大的应用价值[18],可以弥补传统LSTM模型没有考虑数据波动性的缺陷。因此,本文提出了一种基于小波变换和LSTM(即WT-LSTM)的组合模型,并利用Adam算法作为LSTM的训练算法,使用非饱和激活函数ReLU函数替代饱和函数激活函数Tanh函数。

1 组合预测模型构建

1.1 小波变换

城市轨道交通进出站客流量是随时间变化的信息,原始数据几乎都会受复杂因素的影响而携带一定的噪声,因此,需要采取一些方法提取、消除噪声。小波变换是目前应用最广泛的去噪方法,可克服傅里叶变换无法有效分辨时域信息的缺陷。小波变换分为连续型变换和离散型变换。本文采用离散型变换,其表达式为:

(1)

式中:

Ψj,k——离散型小波变换;

t——时刻;

a0——尺度参数;

b0——平移参数;

y(t)为基本信号函数;

Ψ(t)——母小波;

Ψ*——复共轭函数;

m——缩放常数;

n——平移常数。

常用的小波基函数包括Symlets、Daubechies、Haar等。

1.2 LSTM

LSTM可使用新的单元格解决通用RNN的长期依赖问题,从而确定信息的实用性。如图1所示,一个逻辑单元包含忘记门(Forget Gate)、输入门(Input Gate)和输出门(Output Gate)。

图1 LSTM结构图[19]

非饱和激活函数ReLU函数相对饱和激活函数(如Sigmoid和Tanh函数),能解决“梯度消失”的问题,收敛速度更快。因此,本文利用ReLU函数来替代Tanh函数。 LSTM的工作过程如下:

步骤1:忘记门ft控制和选择逻辑单元所需要的信息,其由输入值xt和t-1时刻的隐藏层输出ht-1决定。表达式如下:

ft=σ(Wf[ht-1,xt]+bf)

(2)

式中:

σ——Sigmoid激活函数;

Wf——权重矩阵;

bf——偏置项。

it=σ(Wi[ht-1,xt]+bi)

(3)

(4)

(5)

式中:

Wi——权重矩阵;

bi,bc——偏置项;

Wc——权重矩阵。

步骤3:隐藏层单元输出值ht由输出门ot和单元状态值ct计算获得,表达式为:

ot=σ(Wo[ht-1,xt]+bo)

(6)

ht=ot*ReLU(ct)

(7)

式中:

Wo——权重矩阵;

bo——偏置项。

步骤4:根据ht,进而可构造计算模型的均方误差。通过Adam算法最小化目标函数、Adam算法优化LSTM模型的过程见文献[20]。

1.3 WT-LSTM模型

WT-LSTM组合模型预测流程如图2所示。

图2 WT-LSTM组合模型预测流程图

WT-LSTM组合模型实现步骤如下:

步骤1:从车站的AFC(自动售检票)设备终端获取历史客流数据,预处理后作为WT-LSTM模型的输入参数。本文数据预处理主要包括归一化处理,使原始值归一化为区间[0,1]中的值[21]:

(8)

xmid=(xmin+xmax)/2

(9)

式中:

xi——原始数据;

xmin,xmax——分别为原始数据的最小值和最大值。

步骤2:确定小波函数Ψ(t)和分解层数N。对原始信号采用Mallat算法作N层分解,得高频子序列D1,D2,…,DN和低频子序列AN;再利用Mallat算法重构公式,得重构高频子序列d1,d2,…,dN和低频子序列aN。重构后的序列与原始序列长度相同。小波分解和重构公式如式(10)和式(11)所示。

Di=GAi-1;Ai=HAi-1,i=1,…,N

(10)

式中:

H,G——分别为低通滤波器和高通滤波器;

i——分解层数;

A0——原始客流数据(当i=1时)。

ai-1=H*Ai+G*Di,i=N,N-1,…,1

(11)

式中:

H*,G*——分别为低通滤波器和高通滤波器的对偶算子。

步骤3:将高频子序列d1,d2,…,dN和低频子序列aN,分别代入到LSTM模型中进行分析及预测。通过变量控制方法确定LSTM模型的隐藏单元数量和迭代次数,并将Adam算法用于LSTM的短时客流预测中。

步骤4:汇总各子序列的预测结果,得最终预测结果。

步骤5:以广州塔站进出客流为例,评估基于Adam优化的WT-LSTM模型的优越性。选取平均绝对误差(EMAE)、均方根误差(ERMSE)、平均绝对百分比误差(EMAPE)以及决定系数(R2)4个常用指标作为本文模型的评估指标。

(12)

(13)

(14)

(15)

式中:

yi——实际值;

ypi——预测值;

yom——实际值的平均值。

2 案例分析

2.1 数据分析

广州塔站为广州地铁3号线和广州地铁APM(旅客自动运输系统)线的换乘站。本文选取广州塔站3号线2021年2月26日至2021年5月8日的进出站客流作为WT-LSTM组合模型的数据来源(剔除了清明节、五一的节假日数据与4月19日的异常数据)。为保证数据的完整性,指定每日记录时段为06:00—23:00。本文选取5min的时间间隔作为短时客流的统计时长,15 min的时间间隔作为短时客流的预测时长。此外,本文客流预测的分析长度为30 d,即采用时刻t的前30 d历史客流数据来实现时刻t的客流预测。以低频子序列aN为例,自第一个样本数据块[(a1.i,a2.i,…,a30.i),a31.i]起,依次下滑数据最后得[(aT-30.i,aT-29.i,…,aT-1.i),aT.i],这样滑动共获得T-30个数据块。对于aN的全部数据,本文以5.0∶2.5∶2.5的比例分成训练集、验证集和测试集。

为直观地分析广州塔站的客流特征,随机选取一周的进出站客流,如图3所示。由图3可见,广州塔站工作日进出站客流曲线的整体分布相似,具有周期性特征。其中,工作日出站客流高峰集中在07:30—10:00之间,进站客流高峰则集中在17:00—21:00之间;周末的进出站高峰都集中在晚高峰,出站客流高峰在17:00—21:30之间,周六的进站客流高峰在19:00—22:30之间,周日的进站客流高峰在19:00—22:00之间。这说明广州塔站是典型的商业区。工作日进站客流高峰的进站人数为619人/5 min,出站客流高峰的出战人数为571人/5 min;周末进站客流高峰的进站人数为580人/5 min,出站客流高峰的出站人数为512人/5 min。由图3可知,06:00—07:00及23:30—24:00的客流量较少,因此,本文预测数据不包括这两个时间段的客流量。

图3 广州塔站样本数据中其中一周的进出站客流量

2.2 WT-LSTM模型参数调优

2.2.1 小波函数的选择

文献[22]指出,Daubechies(dbN)和Symlets(symN)小波函数对城市轨道交通客流数据的去噪效果都很好。因此,本文分别利用dbN和symN小波函数对车站客流数据进行分解,并对出站客流的预测结果进行比对。小波分解深度为2层,LSTM的优化采用Adam算法,LSTM最大迭代次数为90,LSTM隐含层节点数为25,试验结果如表1所示。

表1 不同小波函数性能对比

由表1可知:当WT-LSTM组合模型的小波函数为db4时,进出站客流数据的预测精度最高。进站客流数据的EMAE、ERMSE和EMAPE分别为32.68、51.67和7.35;出站客流数据的EMAE、ERMSE和EMAPE分别为63.01、94.28和13.02。

2.2.2 小波分解深度选择

小波分解层数选取数值越大,细节分量的低频信息体现得越明显,但其自身的高频信息也会被渐渐分离开;同时,高频子序列也含有一定的低频信息,这会增加客流量分析的复杂程度。因此,本文分别选择两层和三层分解深度对车站的客流数据进行分解。小波函数为db4,LSTM的优化采用Adam算法,LSTM最大迭代次数为90,LSTM隐含层节点数为25,试验结果如表2所示。

表2 不同小波分解深度性能对比

由表2可知,WT-LSTM组合模型的小波分解深度为2时,进出站客流数据的预测精度更高。

2.2.3 LSTM优化算法选择

分别利用RMSProp、SGD和Adam算法对LSTM进行寻优。小波函数为db4,小波分解层数为2层, LSTM的迭代次数90,隐含层节点数为25,试验结果如表3所示。由表3可知,Adam算法优于RMSProp和SGD算法。

表3 不同算法性能对比

2.2.4 LSTM节点数和迭代次数选择

LSTM隐含层节点数和迭代次数对模型预测精度的影响很大,因此,本文首先选取隐含层节点数为20、25、30,迭代次数90,对出站客流进行预测比对。选取迭代次数为80、85、90、95、100,隐含层节点数25,进行比对(出站客流数据的迭代次数为95时,同时选取30的节点数。),以获取合适的迭代次数。小波分解层数为2层,小波函数位db4,LSTM的优化采用Adam算法。试验结果如表4和表5所示。

表4 不同隐含层节点数性能对比

由表4可知:LSTM隐含层节点数取25时,进站客流数据预测精度更高;LSTM隐含层节点数取30时,出站客流数据预测精度更高。由表5可知:LSTM迭代次数为95时,进出站客流数据的预测精度更高;迭代次数为95时,隐含层节点数为25时,出站客流数据的预测精度更高。

表5 不同迭代次数性能对比

综合表1~5参数调优可知:本文 WT-LSTM组合模型的小波函数为db4、小波分解层数为2层、LSTM优化算法为Adam、LSTM最大迭代次数为95、LSTM隐含层节点数为25时,模型的预测效果最佳。此时,进站客流数据的EMAE、ERMSE和EMAPE分别为30.39、47.30和7.25;出站客流数据的EMAE、ERMSE和EMAPE分别为43.20、59.05和10.77。

2.3 LSTM和WT-LSTM组合模型的比较

本文WT-LSTM组合模型选取小波函数为db4,小波分解层数为2层,LSTM的优化采用Adam算法,LSTM最大迭代次数为95,LSTM隐含层节点数为25,并与传统LSTM模型进行比较。经模型计算,LSTM模型预测结果如图4所示,WT-LSTM组合模型的预测结果如图5所示。预测性能对比如表6所示。

图4 LSTM模型的进出站客流预测结果

图5 WT-LSTM模型的进出站客流预测结果

表6 LSTM和WT-LSTM模型的预测性能对比

由图4和图5对比可知,LSTM模型的预测结果能够在一定程度上预测实际数据的变化,但预测误差较大;WT-LSTM组合模型的预测结果与实际数据非常接近。由表6可知:WT-LSTM组合模型相比LSTM模型,在EMAE和EMAPE方面都有较大提升,ERMSE和R2也佐证了WT-LSTM模型的预测优势。

3 结语

针对城市轨道交通短时客流的特征,结合小波变换理论和LSTM模型设计了WT-LSTM组合预测模型,并利用Adam算法对LSTM进行优化,使用非饱和激活函数ReLU函数替代饱和函数激活函数Tanh函数。经参数调优后可得:WT-LSTM组合模型的小波函数为db4、小波分解层数为2层、LSTM优化算法为Adam、LSTM最大迭代次数为95、LSTM隐含层节点数为25时,组合模型的预测效果最佳。

为了验证所建WT-LSTM组合模型的预测效果,将组合模型与传统的LSTM模型进行比对。研究结果表明,WT-LSTM组合模型在EMAE、ERMSE、EMAPE和R2方面均优于LSTM模型。WT-LSTM组合模型的优势是,仅考虑数据本身,不用考虑站外天气、其他车站客流情况、站外大型活动等影响因素。此外,该模型对于具有时间序列特征的客流数据都具有较高的预测精度。

猜你喜欢
进站客流次数
客流增多
机场航站楼年雷击次数计算
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
一类无界算子的二次数值域和谱
进站口上下行载频切换时引起ATP制动问题分析
春运期间北京西站共有154.8万人次刷脸进站
地心游记(四)一位向导
依据“次数”求概率
基于自学习补偿的室内定位及在客流分析中的应用
人工免疫算法在电梯客流时段划分的应用