张永阳,张文斌,陈 堃,李士香,周竹萍,李 卫
(1.南京忠设智能科技有限公司,南京 210013;2.扬州市交通建设管理有限责任公司,江苏 扬州 225012;3.中建交通建设集团有限公司,北京 100000;4.南京理工大学 自动化学院,南京 210094)
随着动车组列车和高速列车的发展,铁路出行旅客日益增多。2019年国家铁路旅客发送量完成35.79亿人,比上年增加2.61亿人,增长7.9%;2020年和2021年,在疫情影响下,国家铁路旅客发送量仍分别完成21.67亿人、25.33亿人[1]。出租车作为铁路枢纽与城市交通衔接的重要方式,其客流集散量约占铁路客流集散总量的10%~30%[2],目前,铁路枢纽难以根据实际需要进行出租车调度,常出现“车等人”或“人等车”情况,造成了资源浪费,因此,如何提升出租车调度的智慧性已成为亟待解决的问题。
为提高枢纽出租车换乘系统的运输效率和服务水平,国内外专家学者展开了较多的理论研究。如林建新等[3]从优化上车点数量出发,考虑乘客体验和管理难易度,建立多阶段、多目标整数优化模型,并以南京南站为例进行仿真验证,结果表明综合指标优化42%;纪杰周等[4]结合排队论的思想分析机场乘客数量的变化规律和出租车司机的收益,建立收益损益模型,对提高机场出租车的运作效率提供了指导;Wang等[5]基于排队论、仿真模型以及传感器和无线通信技术,在终点站建立带有模拟方法的出租车-乘客调度模型,通过模型曲线得到最优乘客释放数量;Zhong等[6]提出基于大数据方法的出租车指标预测模型,构建了一套反映机场枢纽集散系统独特属性的出租车运营与服务评价指标体系,为其他交通方式和枢纽的整体评价提供参考;Yang等[7]推导了乘客和出租车的相关排队指标,提出一种乘客-出租车相匹配的排队模型,揭示了多点位出租车停靠站中乘客和出租车的排队动态,有助于根据交通状况改善枢纽的服务水平;田冰等[8]从交通延误、时间成本、供求关系出发,提出一种基于AHP-模糊综合决策模型,平衡短途和长途司机的收益;Abid等[9]将用户偏好和乘客、出租车之间的距离作为参数,建立基于多准则决策问题的出租车调度模型,结果表明乘客对该模型满意度更高;Youngrae等[10]提出基于上下文匹配矩阵的区域不确定贪婪出租车调度算法,实现收益和利润最大化;Rajendran[11]采用混合仿真目标规划算法对大城市的空中出租车进行实时调度,对枢纽出租车调度具备一定的借鉴意义。
综上所述,目前国内外学者的研究主要集中在宏观层面的效率、利益最大化,在微观层面的调度时间和数量确定等方面有所欠缺,且较少考虑乘客实际需求。基于此,文中提出了一种考虑实际需求、乘客需求优先的铁路枢纽出租车调度优化模型,并以扬州东站为例进行验证,结果表明该模型能显著提升铁路枢纽出租车换乘系统服务水平。
近年来,机器视觉技术在目标检测方面取得了惊人成就,以其无接触、自动化、智能化的优点成为各种智能交通设施的技术选择[12],且目前铁路枢纽出租车上客区域均安装了摄像头,摄像头视角如图1所示。
图1 出租车排队区域摄像头视角
该视角下排队乘客遮挡比较严重,无法对乘客整体进行检测,因此用较为显眼的乘客头部来替代乘客整体进行检测和跟踪。文中采用目标检测算法Yolov5系列的s、m、l、x 4个版本中最轻量级且运行速度最快的Yolov5s模型对乘客进行检测,在检测速度和检测精度上均能满足实际需求[13]。
Yolov5所使用的CSP结构主干网络内存需求大、运算量大,为提高头部检测速率,使用MobileNet-v3取代Yolov5s的Backbone主干网络[14],有效减少模型参数的总量与运算量,以满足实时性需求。MobileNet-v3通过加入DW卷积、PW卷积使网络运算参数大幅度减少(约为原来普通卷积的1/8~1/9)。DW卷积和PW卷积原理如图2~3所示。
图2 DW卷积
图3 PW卷积
在摄像头视角中,靠近摄像头的人头往往较大,远离摄像头的人头较小,排队乘客头部尺度变化大,且背景杂乱,头部遮挡严重,传统方法使用单一的特征图进行检测往往不能取得很好效果,检测精度不高。为解决上述问题,基于Yolov5s,在特征处理层增加多尺度特征融合模块(MSFFM)[15],该模块可以融合不同层的特征,降低特征层的独立性,保留不同层次的特征信息。使用多尺度特征融合模块将提取的特征融合后分层进行检测,能够检测不同尺度的乘客头部,提升检测精度。
通过改进的Yolov5s算法能实时检测出租车上客区域乘客的头部数量,从而检测实时排队人数,在检测算法上增加Deepsort追踪算法对排队乘客进行跟踪,检测得到每名乘客的上车时间,从而获取乘客的上车时间间隔。Deepsort主体采用卷积神经网络(CNN)来提取被检测物体的外观特征,每生成一次检测和追踪的结果,都会对物体外观特征进行提取并保存,计算被检测物体在当前帧的外观特征和前一帧存储的外观特征的相似度,若相似度高于阈值则认为是同一目标,有效减少目标的丢失情况[16]。利用检测和追踪算法对即将上车区域内检测到的乘客头部进行追踪,分别按顺序记录排队区域内每名乘客上车时间。
误差反向传播神经网络(BP)是较为经典的时间序列预测方法,在交通领域多应用于公交车到站时间的预测。模型能将实时更新的到站时间作为输入值预测公交车到站时间,且不断更新的实际到站时间会反馈到模型,进行自我改进[17]。
Informer是一个基于注意力机制的监督学习模型,近年来在很多场景的时间序列预测上明显优于Transformer模型,但在交通领域应用较少。其整体上由编码器(Encoder)和解码器(Decoder)两个部分组成[18]。其中,解码器用于获得原始输入序列鲁棒性的长期依赖,解码器进一步实现序列预测,模型整体结构如图4所示。
图4 Informer模型结构
根据目标检测和跟踪获得每名乘客上车时间的历史数据,将数据应用于Informer模型训练,根据实时检测的乘客上车时间数据作为Informer模型的输入值,实时输出预测结果即为后面每名乘客的上车时间,其实现流程如图5所示。
图5 排队时间预测流程
首先,通过实时检测的排队人数获取当前出租车需求量,并对未来出租车客流量进行预测,确定未来时间段内出租车的总需求量。通过铁路枢纽出租车蓄车池管理系统,获取当前蓄车池内出租车数量,从而确定调度车辆数。通过对乘客数量排队时间的预测,即可预测蓄车池内车辆全部离开的时间,在蓄车池车辆全部离开前完成所需数量的出租车调度,实现出租车调度系统的精准化和智能化。
基于此,提出基于乘客需求优先的实时调度模型,模型的基本假设如下:
1)蓄车池出租车“富余量”为10辆;
2)每辆出租车平均乘车人数设定为1.5人;
3)调度决策模型每5 min计算一次;
4)每次调度需满足未来20 min的需求。
模型假设可根据各枢纽实际进行修正,调度流程如图6所示。
图6 出租车调度流程
通过检测出租车上客区每名乘客的上车时间,能得到出租车客流数据,因此可以根据历史客流数据来预测未来客流数据。LSTM算法广泛应用于流量预测,且能很好地反应节假日和不同时段的流量变化特征,但铁路枢纽客流数据较为冗杂且繁多,在利用LSTM进行预测时会出现梯度消失情况。注意力(attention)机制的出现能很好解决这一问题,使用注意力机制对LSTM的权值进行处理,降低特征遗忘对特征权值的影响,以便更准确地进行预测。该模型结构如图7所示。
图7 LSTM-attention模型结构
对于LSTM部分[19],xt表示t时刻的信息输入;it为输入门,控制从当前xt中输入至细胞中的信息量;ft为遗忘门,控制t-1时刻的细胞状态Ct-1输入t时刻隐层状态Ht的信息量;ot为输出门,控制Ct传递至t时刻隐藏状态Ht的信息量,则可以将其算式表示为
it=σ(WhiHt-1+Wxixt+bi)
(1)
ft=σ(WhfHt-1+Wxfxt+bf)
(2)
ot=σ(WhoHt-1+Wxoxt+bo)
(3)
式中:Whi,Whf,Who,Wxi,Wxf,Wxo为权重矩阵;bi,bf,bo分别为输入门、遗忘门、输出门的偏置量;σ(·)为sigmoid激活函数。
细胞更新式和记忆细胞式为
Ct=tan h(WhcHt-1+Wxcxt+bc)
(4)
Ht=ot⊗tan h(Ct)
(5)
式中:tan h(·)为双曲正切激活函数;⊗为两个同阶矩阵中对应元素相乘的运算,表示Hadamard乘积。
加入attention机制[20-21],将LSTM隐藏层的输出Ht经过一层非线性转化得到ut,如式(6)、式(7)所示。
ut=tan h(wiHt+b)
(6)
(7)
模型训练不断更新﹐然后通过softmax函数进行归一化得到注意力权重矩阵at,如式(8)所示。
(8)
式中:ut为隐藏层单元。
将at和Ht经过注意力机制得到最终向量vt,如式(9)所示。
vt=∑atHt
(9)
为体现节假日和每日客流高峰,对不同日期、不同时间段进行概率权重的分配,反应关键时间段的特征﹐使预测更加准确,将Attention机制的输出vt通过softmax函数进行归一化﹐输出y如式(10)所示。
y=softmax(ωivt+b)
(10)
未来20 min出租车客流总需求x:x=a+b,a为LSTM-attention算法的预测结果获得,b由摄像头实时检测排队人数获得。
蓄车池车辆运量y:y=蓄车池车辆数×每辆车平均运载人数, 当蓄车池运量需求人数超过15人时,即认为蓄车池内仍有10辆车“富余”,暂时不需要调度。
蓄车池车辆全部上车时间m:当前出租车系统输送y名乘客所需要的时间,即为后续y名乘客上车时间间隔预测值之和。
调度车辆数n为
n=-(y-x)/1.5+10
(11)
式中:1.5为出租车车辆平均载客数,人。
调度流程每5 min更新一次,该更新速度可随着算法流程的成熟逐渐进行修改。
采用改进的Yolov5s算法对扬州东站出租车上客区域实时排队乘客人数进行检测,检测效果如图8所示。
图8 实时排队人数检测效果
经过实际检测,当排队人数低于20人时,检测准确率能达到98%以上;当人数超过20人时,检测准确率能达到95%以上。对某高峰时期实时排队人数每分钟进行一次检测,检测结果如图9所示。
图9 高峰期出租车实时排队人数
对全天客流进行分析,出租车客流高峰期几乎都在固定时间段出现,即高铁列车到站时段。此时间段排队人数较多,当排队人数接近最大时开始上下波动,整个排队现象持续时间较长;在平峰期和低峰期人流到达缓慢,排队现象仅持续几分钟即会消散。高峰时期,乘客需要根据排队等待时间来决策是否乘坐出租车,因此,精准预测排队等待时间能有效提升乘客体验。
检测划定区域内乘客离开排队区域的时间,即检测图10中检测框内乘客头部离开检测框左侧框线的时间。分别按顺序记录检测区域内每名乘客头部从黄色框左侧离开的时间,记为该名乘客的上车时间,为突出乘客上车时间差异,通过相邻乘客之间上车时间间隔来反映此特征,其散点如图11所示。
图10 乘客头部追踪检测区域
图11 乘客上车时间间隔分布
由图11可知,乘客的上车时间间隔主要分布在10 s以下。且由于偶然因素的影响,如存放行李过多或者逗留时间过长会导致间隔时间过长,甚至会超过40 s,相当于正常状况下多名乘客的上车时间间隔。
利用历史数据分别对BP模型和Informer模型进行训练,测试生成的预测值与实际值对比如图12所示。Informer模型在出现偶发因素和长时预测时表现出更好的效果,更符合实际需要。经过实际检验,排队时间预测值与实际值差距较小,在乘客接受范围之内。从方便旅客角度看,将实时排队结果在微信小程序上进行信息共享,便于乘客和出租车司机做出决策,极大节约两者时间,提升服务体验。小程序界面如图13所示。
图12 BP模型与Informer模型预测结果与实际结果对比
图13 微信小程序显示出租车等待人数和预计等待时间
使用LSTM-attention算法对扬州东站高峰时期未来20 min出租车客流量进行预测,结果表明准确率在92%以上,符合实际需求。基于预测结果,进行出租车调度。改进后的出租车调度系统在蓄车池连续有车的情况下,出租车司机的平均等待时间降低了20 min以上。
1)使用MobileNet-v3取代Yolov5的Backbone主干网络,能有效提升检测头部速度,加入特征融合模块能提升监控视角下头部检测精度,在检测的基础上增加追踪算法达到实时检测排队乘客人数和排队乘客离开时间的效果,优于传统的目标检测算法。
2)创新地将Informer模型用于出租车乘客排队时间预测,在用历史数据对模型进行训练后,将实时检测结果作为模型的输入值,与传统的“人数×平均时间”和BP模型预测的方法相比,在客流高峰期准确性有所提升,但在客流较少或时间较短时效果不优。
3)通过LSTM-attention深度学习算法对铁路枢纽出租车客流进行短时预测,提出基于乘客需求优先的出租车调度模型,减少扬州东站“车等人”和“人等车”现象,提升服务水平。不足之处在于模型部分参数需要根据各枢纽实际情况进行调整。