基于Bi-LSTM网络的广珠城际短期客流预测方法

2022-03-05 07:12吕秋霞钟晓情任雅思
关键词:发送量客流量城际

吕秋霞,钟晓情,任雅思

(五邑大学 轨道交通学院,广东 江门 529020)

近年来,随着我国经济的发展,城市的空间边界快速外延,城际铁路客流规模不断扩大. 如何科学把握城市间客运需求状态,合理配置运输资源,从而持续提升运输服务质量是一个重要问题. 客流预测是把握客运需求的重要途径,是铁路企业运营决策和动态调整运营的决定因素. 以日为单位的短期客流预测尤其具有挑战性,因为日客流量受到周末、节假日、大型活动等因素的影响,呈现出波动性大、随机性强的特点,为提高预测的准确性增加了难度.

传统的预测模型多为参数模型,如灰色预测模型、指数平滑模型[1]、ARIMA[2]模型等,但当原始数据存在非线性、不平稳性等特征时,预测的准确性不够. 神经网络模型[3-4]凭借其适应性、非线性和映射力强等特点,在客流预测中获得了较好的预测效果,但是这类模型对已有数据的依赖性较大,对于开始运营时间较短的线路,即历史数据不充分情况,仍需要进一步的改进. 近年来,随着深度学习的兴起,长期短期记忆网络(LSTM)因适合预测时序数据,被应用于客流预测中[5-6],有效提高了预测精度. Zhang等[7]设计了一种基于车站类别的长短期记忆网络(CB-LSTM)模型预测地铁短期客流,证明了使用有限的数据集来预测网络规模的短期客流的可行性. 但是,由于LSTM模型只能进行前向或者后向一个方向的传播计算,容易导致前后时间段记忆关联的信息缺失.

为了解决以上问题,本文考虑了前后多天日客流的相关性,选择双向长期短期记忆网络(Bi-LSTM)建立广珠城际日客流量预测模型,以期更加准确地预测不同日期的城际铁路客流量.

1 广珠城际客流特征分析

1.1 客流周期性分析

广珠城际铁路是广东省内首条城际客运专线铁路,广州南站、小榄站和珠海站因其特殊地理位置,日均旅客发送量在全线总发送量中的占比分别为47%、10%和21%. 文中选择广州南、小榄、珠海3个典型的车站进行客流预测研究. 分析全年日旅客发送量,发现3个车站的客流呈现出相似的波动规律,如图1所示,工作日旅客发送量的峰值都出现在4月初、5月初和9月底,日客流量分别高达114 362人次、27 556人次、44 107人次. 选取11月5日至12月2日4周的旅客发送量进行分析,如图2所示,发现各个车站的发送客流量均呈现出了周期为7天的变化规律,从周四至周日客流呈现出明显增长势态,并且在周日到达顶峰. 周一又开始出现回落势态,周二和周三的客流相对平稳. 因此,在客流预测时平日客流可考虑按星期的不同种类来进行.

图1 2018年车站旅客日发送量

图2 每周各车站旅客发送量周期性变化

1.2 节假日客流分析

在元旦、清明、五一、端午、中秋、十一等节假日,客流相较于平日会有明显的增长,如图3所示,节假日3个车站的日均旅客发送量远高于全年工作日日均旅客发送量,其中广州南站“国庆”期间日均客流量约为平日的2倍. 以“清明”、“五一”、“端午”3个小长假为例,如图4所示,图中Q1、D1、H1分别表示节假日的前一天,第一天和后一天,其余的符号含义以此类推. 对比分析节假日3天、节前4天和节后3天的日客流量,不同节假日的日客流量均呈现出了较为相似的变化规律,即节前一天以及假期第一天的客流量最大,第二天的客流量出现下降趋势,假期最后一天又出现了新的高峰,直至节后客流逐渐恢复到平日水平. 综上可知,节假日对于广珠城际铁路客流的影响显著突出,在进行客流预测时要考虑节假日因素.

图3 节假日与工作日日均旅客发送量对比

图4 广州南站、小榄站和珠海站节假日旅客发送量

2 广珠城际客流数据处理

2.1 基础数据处理

本文将元旦、清明节、劳动节、端午节、中秋节以及国庆节的客流从全年日客流数据中剔除,最终得到2017~2018年的512组日客流量数据.除了受到节假日的影响,平日客流数据仍可能存在一些较大的波动,这会影响模型的预测效果. 因此,有必要通过相关的统计分析作进一步的数据处理,以识别和修复平日客流中的一些异常值. 以广州南站进站客流数据为例,通过SPSS软件的箱线图法进行异常值识别,样本中有3个离散群点,分别是第55、第64和第154个数据,说明这3个值为异常值,需要进行异常值修复处理. 本文采用平均值法对异常值进行修复,即取前3周同一天的日客流量求其平均值作为修复值.计算方法如式(1)所示.

2.2 数据归一化处理

神经网络在提取数据特征的过程中,每一层的参数都会随着上一层参数的更新而改变,如果参数变化很大,就会导致协变量偏移的现象出现. 由于客流量数据变化范围较大,因此需要对数据进行标准化处理,让数据的分布不产生太大的变化. 由于权重取0~1之间的值,通常在标准化过程中把数据也处理成0~1之间的数值,以方便权重值的计算. 如式(2)所示:

式中,x是原始样本;y是标准样本;xmin、xmax是原始样本的取值范围;ymin、ymax是标准样本的取值范围.

3 基于Bi-LSTM的短期客流预测方法

3.1 LSTM模型

长短期记忆网络(LSTM)是对循环神经网络(RNN)的改进,RNN因对前面时段的输入信息具有记忆功能,并可以对输出结果产生影响,对于时序数据的处理非常有效,但模型在训练时存在梯度消失的情况,LSTM模型为了改变隐含层结构,设置了细胞状态及输入门、遗忘门和输出门3种结构,用遗忘门和输入门来控制细胞状态的内容,用输出门来控制细胞状态对输出值的影响,从而有效解决了RNN对信息的长期依赖,避免了梯度消失问题,其模型结构如图5所示.

图5 长短期记忆网络(LSTM)结构图

输入门决定了当前时刻网络的输入tx有多少保持到细胞状态tc,它由两部分组成:一是sigmoid函数,如式(3)、(4)所示,其输出结果用ti表示,取值在0到1之间,输出为0表示不允许任何信息通过,输出为1则允许全部信息通过,输出在0到1之间表示允许部分信息通过;二是tanh激活函数,输出记作ta,如式(5)、(6)所示.ti和ta两者按位相乘后更新细胞状态.

式中,Wi,Ui,bi,Wa,Ua,ba为线性关系的系数和偏移量.遗忘门决定了上一时刻的细胞状态ct1-有多少保留到当前时刻tc,其输出用ft表示,代表着遗忘上一层细胞状态ct1-的概率. 如式(7)所示.

式中,Wf,Uf,bf为线性关系的系数和偏移量.σ为sigmoid激活函数.

细胞状态tc的更新受两部分的影响,如式(8)所示,第一部分是遗忘门决定上一个序列的细胞状态ct1-要保留及遗忘的信息,即ct1-和遗忘门的输出ft的乘积,第二部分是将当前序列的信息加入到细胞状态中,即输入门的输出ti和ta的乘积.

式中,*表示Hadamard积.

输出门状态th的更新由两个部分组成. 第一部分由上一个序列的状态h(t-1)根据sigmoid函数来决定输出的状态to;第二部分由当前序列的状态tc和tanh激活函数决定输出状态th,如式(9)、(10)所示.

式中,Wo,Uo,bo为线性关系的系数和偏移量.

3.2 Bi-LSTM模型

本文采用的双向长短期记忆网络(Bi-LSTM)结构如图6所示,是由前向LSTM和后向LSTM结合而成的,将其应用于交通时间序列数据的预测中,能够考虑到前后时刻信息之间的规律,进行双向的预测,其输出层是由前向层和后向层共同决定的,这样能够更好地提高预测精度,其函数表达式为:

图6 双向长短期记忆网络(Bi-LSTM)结构图

3.3 评价指标

为验证预测模型的准确性,本文选取了均方误差(MSE)、均方根误差(RMSE)以及平均绝对百分比误差(MAPE)作为评价指标,从不同的角度来刻画客流实际值和预测值的偏差,指标值越小说明预测值和实际值越接近,预测效果越好;反之,则预测效果越差. 计算公式如下:

1)均方误差

2)均方根误差

3)平均绝对百分误差

式中iy是第i天的实际客流值;iy′是第i天的预测客流值;N是测试样本个数.

4 广珠城际短期客流预测

4.1 基于Bi-LSTM网络的客流预测

本文以广珠城际铁路的广州南、小榄以及珠海3个车站的日客流量为例. 对2017年1月1日到2018年12月31日的3个车站的日客流量数据进行处理. 根据1.2节客流量周期性变化的规律及相邻日期客流量的相关性,综合考虑了模型复杂度、预测效果及样本量等多种因素,进行了两种设计:① 以本周前两天的日客流量作为输入,当日客流量作为输出. ② 以本周前两天及前两周同一周次共4天的日客流量作为输入,当日客流量作为输出,例如预测本周四的日客流量,则以本周二、本周三、上周四、上上周四的日客流量作为输入. 按照时间窗步长分为2、4整理得到客流量时间序列,并将时间序列按照 :

8 2的比例分别设为训练集和测试集.在Bi-LSTM网络训练时,先前向计算并输出预测值,再后向计算输出另一个预测值,接着将两个预测值与实际值进行对比,以更新前向、后向计算的模型梯度参数和权重系数. 模型的主要参数有迭代次数、隐含层神经元个数、批处理数量、时间窗步长等. 本文对参数的取值如表所示. 其中优化器选择Adam,学习率learning-rate设置为0.001.

表1 Bi-LSTM模型参数取值组合情况

对2017、2018两年广州南、小榄、珠海3个车站的日进站客流量进行预测,评价结果如表2所示.

表2 Bi-LSTM模型预测结果情况

当时间窗步长为4时,广州南站、小榄站和珠海站客流预测的3个误差指标值都更小,其中MAPE分别为11.380 2%、12.372 9%、11.955 6%,模型的预测精度较高.

4.2 模型预测结果对比

选取同等条件下的模型参数,将Bi-LSTM网络与LSTM网络的预测结果进行对比分析,如表3所示. 发现Bi-LSTM网络的MSE、RMSE、MAPE3个评价指标均比LSTM网络的小. 其中对小榄站客流预测中,Bi-LSTM网络比LSTM网络预测精度高了近3%.

表3 Bi-LSTM网络与LSTM网络预测结果对比

综上所述,本文构建Bi-LSTM模型在城际铁路日客流预测上能获得较高的预测精度,具有较好的实用性.

5 结论

针对城际铁路短时客流量难以准确预测的问题,本文构建了基于Bi-LSTM网络的车站日进站客流预测模型,以广州城际广州南、小榄、珠海3个车站为例进行实证分析,发现Bi-LSTM网络与LSTM网络相比能获得更好的预测效果,且时间窗越长,预测效果越好. 未来本文的方法可以考虑短期客流的日波动规律,将日期因素作为一个输入量进行训练,以增强模型对不同类别日期的适用性.

猜你喜欢
发送量客流量城际
城际列车
基于数据挖掘的景区客流量预测模型研究
云南:铁路客流持续回暖 单日旅客发送量连续超20万
地铁开,玩起来
基于灰色预测理论在交通枢纽客流量的实际应用
基于灰色预测理论在交通枢纽客流量的实际应用
我国首款时速160公里城际动车组投入运营
春运来了