樊博,刘洋,李怡凡
(中国民用航空总局第二研究所,成都 610041)
随着中国机场业务规模和汽车保有量的不断增长,各地机场停车设施供需矛盾逐渐突出。停车诱导系统通过发布强时效性和高准确性的停车信息,为相关管理人员提供了有效的决策依据。准确预测机场短时停车需求对提高停车诱导系统诱导效果、维持机场停车场秩序、保障周边道路网络交通安全以及提升机场整体形象均具有重要意义。
根据预测时间间隔长短,可大致将停车需求预测分为长时和短时停车需求预测两大类,前者从宏观层面出发,通过建立停车生成率模型[1]、交通量停车需求模型[2]等来预测较长时间内(通常以年为单位)的停车需求,预测结果多用于服务停车设施规划决策、停车政策制定以及停车资源供需分析评价等;后者偏向于微观层面,通常是针对某特定停车设施,通过分析其在某一段时期内的停车需求特征,然后建立模型来预测指定时间间隔内(通常以分钟为单位)的停车需求,预测结果多用于服务停车设施管理与控制、停车共享策略制定[3]、停车收益管理[4]等。通过分析机场停车场的停车需求特征,建立面向机场精细化管理的短时停车需求预测模型,预测结果主要服务于停车诱导系统,因此属于短时停车需求预测研究。
已有研究通常从进入停车场的车辆数、车辆存量数或车位占有率等角度来开展分析预测工作,即将停车需求定义为观测时段内所有到达停车设施的车辆数(或者到达率),或观测时段内到达和离去停车设施的车辆数之差与设施内原有车辆数的总和,或观测时段内的停车位占有率大小等。因此,多数研究通常是以车位占有率预测[5-6]和车位需求数量预测[7-8]等停车需求表征方式开展短时停车需求研究。Zhao等[9]使用多种方法(支持向量回归、神经网络等)来预测多个城市不同类型(商业区、办公楼和综合功能停车场)、不同规模的多个停车场的停车占有率,实验结果显示,模型对不同类型、不同规模的停车场适用情况有所差异;Yu等[10]建立整合移动平均自回归模型来预测某城市中央商务区停车场可用车位数量,实验结果表明:模型的预测精度优于传统神经网络模型;Ji等[11]构建了小波神经网络停车位数量预测模型,并以多个停车场实际运营数据对模型进行了验证,实验结果表明:建立的模型能有效预测多个停车场的可用停车位数量。建立短时停车需求预测的方法还有多元自回归模型[12]、连续时间马尔科夫链[13]等。
已有研究建立的预测模型大多能根据停车场内车辆到达和离开动态特征或者明显的停车需求时序变化规律,较好地完成短时停车需求预测任务,为停车管理和停车诱导工作提供有效的决策依据。然而,既有前人研究对象绝大多数以城市一般公共停车场(如商业区停车场、办公楼停车场、体育馆停车场、医院停车场等)为主[5,7,14],较少关注机场停车场的停车需求特征,更缺乏考虑航班计划的机场停车需求研究;若将已有研究模型直接应用于机场短时停车需求预测,则有可能由于模型适用范围受限、不同停车设施的停车需求特征存在差异或影响因素考虑不充分不全面等原因,导致模型输出的预测结果不准确,甚至与理想预测效果之间存在较大偏差。
综上,为准确有效地预测机场短时停车需求,进一步提升停车诱导系统对优化管理机场停车资源的能力,在分析机场短时停车需求特征的基础上,同时考虑机场航班计划和实时气象对短时停车需求的影响,建立基于Conv1D-长短期记忆(long short-term memory,LSTM)神经网络结构的机场短时停车需求模型,并通过对比其他常用短时停车需求模型的预测结果,进一步评价模型的预测能力以及确认模型的适用性。
以上海虹桥国际机场T2航站楼两侧P6、P7两个停车场为研究实例对象,研究数据主要包括2019年1—4月、9—10月和2021年1—4月、9—10月的停车数据,以及相应研究时间范围内的航班计划以及气象信息等。
对于停车数据,一条完整数据记录所包含的必要字段有停车场编号、车牌号码、车辆类型、车辆进出场时间、进出口编号及停车费用等,由于设备问题、系统误差或人工操作失误等,数据中存在部分错误或无效的数据记录,为避免这类数据对后续建模造成影响,对该类数据采取删除处理。
对于航班计划,由于从机场出发和到达机场的旅客都可能使用机场停车设施,因此需要同时考虑到离机场的所有国内和国际计划航班,航班计划信息主要包括航班号、飞机型号、计划起飞/到达机场及时间等。对于气象信息,根据民航局公开资料显示,天气原因是造成不正常航班的主要因素,尤其是恶劣天气对航空运输系统的平稳运行影响更为严重[15];同时考虑到天气情况对旅客选择何种交通方式到离机场也有所影响,因此提取虹桥机场气象监测站采集的信息,选择保留温度和降雨量字段。
数据处理的主要目的是将原始停车数据、航班计划和气象信息按照指定的时间间隔匹配在同一时间间隔内,为后续建立停车需求模型提供必要的数据基础。既有研究中,通常取5~15 min的时间间隔为一个周期[5,9-11],考虑到到离机场航班的密集程度以及气象信息半小时一次的更新发布频率,若研究时间间隔过短则会对观测相应周期内机场到离航班和气象情况带来影响,因此以15 min的时间间隔作为一个研究周期,并根据原始停车数据为各周期匹配相应的车辆进/出停车场数量。
通常情况下,考虑到飞机离站前30~45 min停止办理乘机手续,离港旅客会提前到达机场候机,以及到港旅客从飞机落地到通往停车场驾车离开机场也需要一定的时间,因此将为各研究周期(15 min)匹配其相应时段1 h内的到离航班计划;气象信息同理,考虑到气象信息发布频率实际情况,将为各研究周期匹配其相应时段半小时内的气象信息,处理后的数据概况如表1所示。
表1 数据概况
任意选取某月P6和P7两个停车场的停车数据,统计t时刻与t+1时刻进场车辆数的关系,结果如图1所示。图1表明两个停车场在t时刻与t+1时刻的进场车辆数均分别接近于线性关系,并且综合考虑两个停车场下的进场车辆时,拟合优度R2为0.934 8,即同样具有明显的线性关系。
图1 t时刻与t+1时刻进场车辆数
任意选取某周P6和P7停车场停车数据,统计每15 min内驶入、驶出停车场的车辆数,结果如图2所示。可以看出:首先,该周内每日驶入和驶出虹桥机场停车场的车辆数具有明显的规律性和周期性;其次,工作日与非工作日的机场短时停车需求特征相似,以及该周内每日同时段车位需求量也大致相同,这与一般城市公共停车场之间存在较大差异[5,8],根据文献[5]分析结果,城市商业、办公和体育场停车场的车位占有率在工作日和非工作日下的时变特征差异明显,这主要是由于城市公共停车场的停车需求规律与城市潮汐式通勤和社会活动时间规律类似,因此为了确认机场停车场的停车需求通常与航班计划之间的是否存在一定的关联关系,图3统计了研究时间所处航季每周虹桥机场到港、离港以及到离港航班数。
结合图2、图3可知,在研究时间所处航季内,虹桥机场停车场每日进出场车辆变化曲线与每日到离机场的航班计划时间规律相似,即与一般城市公共停车场不同,机场停车场在工作日与非工作日的停车需求特征并无明显区别,这主要是由于机场停车场的服务对象以到离机场的旅客为主,而旅客前往或离开机的场时间又与航班计划存在一定的关联,因此机场停车场每日停车需求特征与当日是否为工作日无关。
图2 驶入驶出停车场的车辆数周变化曲线
图3 研究航季内虹桥机场每周到离港航班计划
根据上述虹桥机场停车场需求特征分析结果,结合数据实际情况,构建停车需求模型输入变量。对停车场本身需求规律而言,为P6、P7以及P6与P7停车场构建变量进场车辆数、进场车辆率(单位研究周期内进场车辆数在小时进场车辆数中所占比重),出场车辆数、出场车辆率(单位研究周期内出场车辆数在小时出场车辆数中所占比重;对航班计划而言,构建变量(小时内)到港航班数、离港航班数和到离港航班数,以及根据各航班计划执飞机型计算得出的到港、离港和到离港最大载客人数;对于气象信息而言,构建变量温度和降雨量等。
综上,考虑停车场本身随时间变化的停车到达率与离开率的需求规律、机场到离港航班计划和气象信息共构建变量18 个。
将构建结合了用于特征提取的卷积神经网络(convolutional neural networks,CNN)和用于时序处理的长短期记忆神经网络(long short-term memory,LSTM)的Conv1D-LSTM网络结构,来建立面向机场的短时停车需求预测模型。
3.1.1 CNN
CNN是一种多层神经网络结构模型,其核心隐藏层通常由若干卷积层和池化层交替组成,主要功能是对通过输入数据采取卷积和池化等处理来提取数据特征。在训练网络模型时,一般使用梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过频繁的迭代训练获得相对理想的权重参数,图4为包括两次最大池化处理和一次卷积操作CNN模型结构示例。
图4 CNN模型结构示例
3.1.2 LSTM
LSTM是一种特殊的循环神经网络,其通过增设门控结构(输入门、遗忘门和输出门)有效克服了梯度消失问题,其计算方式如下。
ft=σ(Wf[ht-1,xt])+bf)
(1)
it=σ(Wi[ht-1,xt])+bi)
(2)
(3)
(4)
ot=σ(Wo[ht-1,xt])+bo)
(5)
ht=ottanhCt
(6)
3.1.3 Conv1D-LSTM
Conv1D-LSTM模型结构如图5所示,模型结构主要包括输入层、卷积层、LSTM层全连接层和输出层。Conv1D-LSTM模型中,卷积层起到局部特征提取器的作用,当数据传入卷积层时,使用卷积核对输入数据进行卷积处理,当数据传入池化层时,对传入而来的特征图采取压缩即池化处理,通过一系列点积计算后更新特征图,并将其通过输出层输出到LSTM层;LSTM层接收到CNN层传入的特征图后可开始提取时序特征,即通过式(1)~式(5)完成LSTM网络构建、训练与预测输出,然后使用全连接层将输出值进行维度变换,输出最终预测值。
图5 Conv1D-LSTM模型结构
选择平均绝对误差(mean absolute error,MAE)和均方根误差(root mean square error,RMSE)作为模型评价指标,其计算公式分别为
(7)
(8)
选取2019年2月18日—3月24日为期五周数据作为模型训练集,训练集数据中80%用于训练,20%用于测试;选取2019年3月25日—3月31日一周作为验证集,分别使用AR模型、CNN、LSTM和Conv1D-LSTM神经网络模型对虹桥机场P6与P7停车场停车需求进行预测。
对于CNN、LSTM和Conv1D-LSTM神经网络而言,网络结构和参数设置对模型预测能力十分重要,需根据实际情况来设计合适的网络结构以及设置合适的参数,模型通过Python调用Kears库实现。
表2给出了所构建的CNN、LSTM以及Conv1D-LSTM网络结构各层参数设置及其输出情况。另外,3个网络结构激活函数均选择ReLU;CNN和Con1D-LSTM网络中,涉及的CNN层Kernel size为1。其他参数例如Batch size设置为192,Epochs设置为100,训练集Validation split设置为0.2,Optimizer 设置为Adam,损失函数设置为MSE,评价函数设置为MAE。
表2 CNN、LSTM及Conv1D-LSTM网络结构
根据上述模型网络结构和参数设置,使用验证集数据进行实验,图6为预测结果,表3为根据模型预测结果计算的误差。预测结果表明,所构建的Conv1D-LSTM能有效预测机场停车场停车需求,并且预测效果优于其他模型。
图6 不同模型预测结果
根据表3给出的模型误差,对比分析模型预测效果。首先,神经网络模型预测效果均优于传统的自回归模型(auto-regressive,AR),这主要由于AR模型只使用的是历史数据进行预测,即仅考虑了历史停车需求特征对未来停车需求的影响,而神经网络模型不仅算法相对更复杂、适用性更强,而且模型还考虑了航班计划和气象信息对停车需求的影响;其次,从MAE和RMSE误差结果上来看,构建的CNN预测模型优于LSTM预测模型,更适用于本文实例短时停车需求预测;最后,与上述模型相比,Conv1D-LSTM网络模型利用了CNN和LSTM模型优势,在为期一周的验证集上,平均绝对误差和均方根误差分别为12.057辆、14.237辆,能有效应用于机场停车场短时停车需求短时预测。
表3 不同模型误差对比
准确地停车需求预测结果是优化和管理有限停车资源的先决条件,使用Conv1D-LSTM网络模型,构建了短时机场停车场短时停车需求预测模型,得到如下结论。
(1)根据虹桥机场实例分析结果,由于机场停车场服务对象以到离机场的旅客为主,停车需求特征与航班计划存在较强关联性,因此考虑了航班计划和气象信息的影响,能有效提升模型预测能力。
(2)与其他预测模型相比,所构建的Conv1D-LSTM模型预测效果更好,误差更低,平均绝对误差和均方根误差分别为12.057 辆、14.237 辆,能应用于机场停车场短时停车需求预测。后续研究将获取其他类型的数据,进一步提高模型适用范围。