唐小卫,陈祯,张生润,丁叶
(南京航空航天大学,民航学院,南京 211106)
为改变繁忙机场交通拥堵状况,利用机场协同决策 (Airport Collaborative Decision Making,ACDM)机制提高停机坪、滑行道和跑道的利用率是有效的管理措施之一,而对航班离港滑行时间的精准预测是ACDM 机制效能提升的关键[1]。离港滑行时间起于飞机在机位被推出,止于在跑道离地,在ACDM 机制下每个航班在停机坪的推出时刻是由计算起飞时刻(Calculated Take-Off Time,CTOT)减去预计的离港滑行时间倒推得到的,所以离港滑行时间的预测精度不仅直接影响航班在停机坪的推出次序,而且会关联跑道上CTOT的最终执行率,对优化场面运行管理和提高跑滑系统效率具有重要的作用。
航班离港滑行时间预测的已有研究主要聚焦于特征构建与预测模型两个方面[2]。在特征构建方面,Brownlee 等[3]和Clewlow 等[4]考虑了滑行距离、进离港交通量等特征;刘继新等[5]验证了进离场航空器数量、运行时间段与滑行时间具有显著的相关性;Ravizza等[6]根据欧洲机场滑行道的特点构建滑行转弯角度与距离特征;冯霞等[7]引入飞机推出前15 min内离港航班的平均离港滑行时间特征;李楠等[8]引入跑道运行模式的特征后提高了预测的精度。上述研究中特征的选取范围已从单跑道扩展至多跑道,但大多聚焦滑行道和跑道空间范围上的航空器运动特征,较少关注停机坪构型对滑行时间的影响。与单跑道机场相比,繁忙机场拥有多座航站楼和多条跑道,前者影响机位布局,导致不同机坪构型下航空器在停机坪相互影响程度增大,进而增加机坪管理难度;后者致使场面交通复杂性显著增加。两者共同作用导致航班离港滑行时间预测的不确定性增大[9],因此,亟需构建新的特征变量以满足繁忙机场多航站楼多跑道运行对离港滑行时间预测精度的要求。在预测模型研究方面,传统统计学模型要求样本符合独立同分布假设,且当输入变量复杂度提升,或自变量与因变量之间的相关关系不显著时,仅依靠统计学模型预测可能遗漏部分本可以表征离港滑行时间影响因素的关键特征,导致预测精度难以提高。近年来研究发现,机器学习算法在离港滑行时间预测上呈现出更好的学习能力和预测效果[10]。Herrema 等[11]将神经网络、回归树、强化学习和多层感知机等机器学习方法运用于欧洲机场滑行时间预测,结果表明,回归树模型预测效果最佳。
鉴于航班离港滑行时间的精准预测有助于提高ACDM 机制下CTOT 的最终执行率和优化停机坪航班推出次序,本文以北京首都国际机场(简称“首都机场”)作为繁忙机场典型案例,提出机坪构型及其与跑滑系统相对位置关系特征构建方法,并基于回归树预测模型量化其对离港滑行时间的影响,最后对比验证新特征引入对预测精度提高的有效性。
首都机场拥有3 座航站楼和3 条远距平行跑道。本文选取该机场2018年9月—2019年8月的航班滑行数据开展研究,以避免新冠疫情后航班量波动过大带来的非常态预测误差。数据关键字段包括日期、航班号、停机位、机型、航空公司、起飞跑道、进港航班的实际落地时刻(Actual Landing Time,ALDT)和实际上轮挡时刻(Actual In-Block Time,AIBT)、离港航班的实际撤轮挡时刻(Actual Off-Block Time,AOBT)和实际起飞时刻(Actual Take-Off Time,ATOT)等。经过数据清洗获得291616 个离港航班样本。用于分析机坪构型及其与跑滑系统相对位置关系的场面CAD底图由机场提供。
繁忙机场一般建有多座构型不同的航站楼,使得机坪区域空间结构具有不规则性,因此,同一机场不同构型航站楼所连接机坪的机位布局方式具有较大差异性,不同机场同一构型航站楼所连接机坪的机位布局方式也可能不同,带来机坪区域空间结构类型的多样性,由此导致不同机坪构型下航空器在机坪运动相互影响程度具有差异性[12],进而影响航班离港后续进程。如何系统量化繁忙机场多航站楼下机坪构型的差异并将其用于航班离港滑行时间预测模型构建是首要研究问题。进一步,不同机坪构型下,机坪与跑滑系统相对位置关系的复杂性对离港滑行时间预测也具有影响。无阻碍离港滑行时间(Unimpeded Departure Taxitime,UDTT)已被证明是影响航班离港滑行时间的重要影响因素[13],指航空器从停机位推出后滑行至跑道头起飞的过程中,在没有受到任何阻碍情况下的滑行时间,主要由跑道、滑行道和机坪的相对位置决定。已有研究[13]大多基于“承运航司-跑道”的第20百分位数计算方法来统计UDTT,其前提是同一航司的航班均集中于同一机坪。但在中国繁忙机场同一航司的航班大多分布在不同机坪,机坪构型差异及其与跑滑系统相对位置关系的复杂性意味着亟需提出新的UDTT计算方法,以适应中国繁忙机场运行实际。
因此,根据中国繁忙机场如首都机场和浦东机场实际运行情况,本文提出“机位组”的概念表征机坪构型。同一机坪内某些机位航空器的运动受其他机位航空器的影响程度类似且前往相应跑道端的距离接近。基于机坪构型和跑滑系统相对位置关系,将同一机坪内具有相同进离港滑行路径且彼此影响的若干机位视为一组,称为“机位组”。机位组内航班的离港滑行时间值差异较小,机位组间差异较大。
此外,ACDM机制下为显著提高航班离港滑行时间的预测精度,对场面动态航班流量统计的实时性提出更高要求,繁忙机场拥有的多跑道系统增加了统计难度。首都机场3 条跑道的中线分别相距1960 m 和1525 m,其间距符合多跑道之间独立平行仪表进近和独立平行离场的运行要求,每条跑道可同时用于进港和离港混合运行,即单一跑道可同时服务于3个航站区的进离港航班,滑行道也可同时服务于使用所有跑道的进离港航班。已有研究大多仅考虑单一跑道交通流量对离港滑行时间的影响[2],仍缺乏针对ACDM机制下多条跑道场面实时动态航班流量的计算方法。多跑道系统下,场面上其他航班运行时间与被预测航班离港滑行时间窗之间具有一定的交互重叠,因此,本文根据航班之间的相对时序构建场面实时动态航班流量特征。
综上,本文将从上述3个方面分别构建表征繁忙机场机坪构型及其与跑滑系统相对位置关系的特征变量,并将其用于航班离港滑行时间预测模型的构建。
离港滑行时间预测问题所需数据量大且特征集较为复杂,鉴于分类回归树(Classification and Regression Tree,CART)算法对高维数据预测性能较强,本文选取该算法构建离港滑行时间预测模型。CART 算法递归地将航班样本空间划分为有限数量的子空间,采用子空间观察到的滑行时间均值作为预测值,具体的一次划分过程如下。
(1)当前样本空间共有N个航班样本,第i个样本包括特征集xi与离港滑行时间集yi,特征集包含M个特征变量,即xi=(xi1,xi2,…,xiM)。取第j个特征xij及其取值s作为划分特征与划分点,构造两个子空间R1,R2,即
分别计算两者的平均离港滑行时间作为输出值c1,c2,即
计算每个子空间的误差平方和L1,L2,得到该(j,s) 划分情况下的损失函数L′为
(2)遍历当前样本空间的所有(j,s)对,以损失函数值最小为求解目标,寻找最优(j,s)对划分,将当前样本空间划分为两个子空间,构造一个二叉树分支。
递归地进行上述划分过程,最终将训练集输入空间划分为K个子空间,计算第k个子空间Rk的平均离港滑行时间ck,则航班样本x和离港滑行时间预测值f(x)的对应关系为
式中:I(x∈Rk)为指示函数。
由上可知,在特征构建中,特征的含义和数量是CART算法进行分枝的关键。
2.2.1 机坪构型相关特征变量构建
(1)场面实时动态航班流量特征
根据航班相对时序影响和进离港性质共构建16 个表征场面实时动态航班流量的特征。航班相对时序影响指场面上其他航班运行时间与被预测航班离港滑行时间窗之间的交互重叠关系。图1表示单一跑道有8 种存在相对时序影响的航班。假设当前离港航班d0的滑行时间窗为[tAOBT,tATOT],tAOBT为航空器在机坪上的实际撤轮挡时刻,tATOT为航空器在跑道上的实际起飞时刻。与当前离港航班d0存在相对时序关系的其他离港航班可分为d1,d2,d3,d4这4 类。d1表示推出时间在tAOBT前,起飞时间位于[tAOBT,tATOT]的航班;d2为推出时间在tAOBT前,起飞时间在tATOT后的航班;d3为推出时间在tAOBT后,起飞时间在tATOT前的航班;d4为推出时间位于[tAOBT,tATOT],起飞时间在tATOT后的航班。类似,与d0存在相对时序关系的进港航班也分为a1,a2,a3,a4这4 类,定义同上。由图1可知,d1,d2,d4,a1,a2,a4与当前预测航班d0的离港滑行时间窗仅部分重叠,它们之间的区别在于重叠发生时间节点不同;而d3和a3的时间窗与d0则完全重叠。基于上述计算方法,将统计范围从单一跑道扩展至所有跑道上的不同类型航班数量,构建单一跑道和所有跑道的场面流量特征,分别标记为
图1 不同航班间离港滑行时间相互影响示意图Fig.1 Schematic diagram for mutual influence of departure taxi time between different flights
(2)无阻碍离港滑行时间特征
计算各机位组UDTT的步骤如下。
Step 1 建立机位组内航班实际离港滑行时间线性回归模型,选取与离港滑行时间相关性最强的进港流量值和离港流量值作为解释变量,即
式中:为第m个机位组内第n个航班的实际离港滑行时间,m∈{1,2,…,M},M为机位组总数,n∈{1,2,…,N},N为第m个机位组内的航班总数;、分别为与相关性最高的进港流量、离港流量;αm为常数项;βm,γm为系数;εm为随机误差项。
Step 2 根据所构建回归模型,计算无进港航班(0)、无其他离港航班(1)时的,即为所在机位组的UDTT,用T(U DTT)表示。
(3)机位组空间影响指数
为量化不同机坪构型下机位之间的相互影响程度,提出机位组空间影响指数I(SI),第m个机位组的I(SI)计算方法为
式中:为某个机位的飞机在机坪运行时影响的周边机位个数;p为飞机在机坪的离港滑行过程,分为推出和开车滑行2个阶段;l为第m个机位组的第l个机位;L为第m个机位组的机位总数。推出阶段机位间的空间影响取决于机位大小和分布、机型大小、飞机推出方向和推出路径,开车滑行阶段取决于飞机发动机的尾喷范围和推出等待滑行点设置。不同机坪构型下机位之间的相互影响如图2所示,同一机坪不同位置的机位相互影响如图3所示。
图2 不同机坪构型下的机位影响示意图Fig.2 Schematic diagram of aircraft stand influence under different apron configurations
图3 同一机坪不同位置的机位影响示意图Fig.3 Schematic diagram of different aircraft stands influence under same apron configuration
2.2.2 其他特征变量构建
除了上述表征繁忙机场机坪构型及相关的特征,特征集还包括滑行距离、机场容量、相邻时段航班平均离港滑行时间、起飞跑道、机型类别、航空公司类别、运行时段等常用特征,共18 个,如表1所示。
表1 其他常用特征变量对照表Table 1 A list table for other feature variables
通过分析首都机场的空间布局、停放机型分布以及停放航班性质,探究机位之间的相互影响,最终将整场共353 个机位划分为50 个机位组,如图4所示。以T2 航站楼为例,其周边35 个机位被分为7组,如图5所示,以205~208为例,这4个机位的航班均被推至Z1 滑行道再开车滑行,且任一机位被推出时对组内其他机位均存在影响,因此将它们纳入同一组内,编号为“3”。同理,T2 航站楼周边其他近机位依次被编为“4~9”组。根据式(5)和式(6)计算得到每个机位组的T(U DTT)与I(SI)。如图6所示,不同机位组的T(U DTT)具有较大差异,最长为23 min,最短为12 min,离跑道端的距离越近,滑行路线相对简单,对应机位组的T(UDTT)越短,否则越长。如图7所示,I(SI)值少于2 个的机位组占56%,大于4 个的占18%,主要分布于1、2 和4 号等机位布局较紧凑的机坪。
图4 首都机场机位组的划分结果Fig.4 Result of grouping stands for Capital Airport
图5 T2航站楼周边机位分组示意图Fig.5 Schematic diagram of grouping stands around T2 terminal
图6 基于机位组的平均无阻碍离港滑行时间分布Fig.6 Average UDTT distribution based on stand groups
图7 基于机位组的空间影响指数分布Fig.7 I(SI)distribution based on stand groups
如图8~图10所示,3个与繁忙机场机坪构型相关的特征变量与离港滑行时间的相关性分析结果表明,与离港滑行时间相关系数绝对值大于0.3 的变量包括12个场面实时动态航班流量特征和无阻碍离港滑行时间,而空间影响指数与离港滑行时间的相关性较小。
图8 场面实时动态航班流量特征与离港滑行时间相关性分析Fig.8 Correlation analysis of real-time dynamic flight flow and departure taxi time
图9 无阻碍滑行时间与滑行时间相关性分析Fig.9 Correlation analysis of unimpeded departure taxi-time and departure taxi time
图10 空间影响指数与离港滑行时间相关性分析Fig.10 Correlation analysis of spatial index and departure taxi time
以CART算法为基础构建预测模型,特征集共32 个特征,包括14 个机坪构型相关特征和18 个被普遍证明影响离港滑行时间预测的特征。将处理好的数据集以7∶3的比例划分为训练集与测试集,对比分析机坪构型特征变量引入前和引入后的预测精度。预测精度为模型输出的时间与实际滑行时间的差值在某一设定范围内的数量与总预测样本数之比,范围包括±3 min、±5 min。预测结果如表2所示,±3 min 精度由75.32%提高到80.2%;±5 min预测精度由86.55%提高到93.01%。首都机场2019年高峰小时离港架次为45,则±3 min和±5 min 预测精度的提高可以减少约2~3 个起飞时隙的浪费。模型R2高于0.75,拟合优度较好;MAE均低于2.4 min,误差较小,验证了特征变量集构建的有效性。在引入机坪构型相关指标后模型的预测精度和拟合优度均得到提升,同时平均绝对误差MAE 减小,表明新引入的机坪构型特征变量增强了所构建CART 模型对离港滑行时间的预测效果。
表2 机坪构型相关特征引入前后的模型预测精度对比Table 2 Comparison of model prediction accuracy before and after introducing characteristics of apron configuration
根据CART模型可计算各特征的重要度,它反映了各个特征对离港滑行时间预测精度的贡献能力,特征重要度越大,则贡献越大。各特征的重要度排序如图11所示。
图11 对离港滑行时间预测贡献最大的前20个特征变量Fig.11 Top 20 feature variables with the greatest impact on departure taxi-time prediction
(1)场面实时动态航班流量特征的重要度
在首都机场多航站楼多跑道构型下,反映场面整体流量的6 个特征的重要度之和为60.2%,远超过单一跑道流量特征,其中排名分别为第1、3、4、5、8 位次,比单一跑道流量特征D1,D3,A3的排名更靠前。进一步,与当前预测航班时间窗重叠程度更高的航班对预测精度贡献最大,相关特征A′3和A3的重要度排前两位,分别为40.7%和26.7%。可见当航班间相对时序关系持续时间越长,对离港滑行时间预测的影响也越大。
从进离港航班特征看,进港航班相关特征对离港滑行时间预测的贡献高于离港航班相关特征,重要度分别为69.1%和24.4%。首都机场3 条平行跑道的中线间距决定了每条跑道均可起降混合运行,且在高峰时段进港航班的优先级高于离港航班。研究结果与实际情况相符,表明本文提出的场面动态交通量计算方法及所构建模型的合理性。
(2)无阻碍离港滑行时间和机位组空间影响指数的重要度
无阻碍滑行时间和机位组空间影响指数的重要度分别排第9、20位,超过了部分传统特征,如相邻时段航班平均离港滑行时间和运行时段等。因此,针对繁忙机场的离港滑行时间预测模型需考虑机坪空间构型及其和跑滑系统的相对位置。根据我国繁忙机场容纳多家基地航司且同一航司航班分散于多个不同机坪的现实,进而导致机坪利用效率不高、航空器冲突增加和机坪空间拥堵的现状,基于机位组的无阻碍离港滑行时间计算方法能够在机位资源利用效率和离港滑行时间预测精度两方面取得平衡,为繁忙机场与其基地航司合作促进机坪管理方式革新提供理论支撑。
(1)繁忙机场航班离港滑行时间预测需考虑机坪构型及其与跑滑系统相对位置关系,据此构建场面实时动态航班流量、无阻碍滑行时间和机位组空间影响指数等新特征变量,预测结果显示新特征对模型预测精度贡献较大。
(2)通过构建分类回归树模型验证了新引入的机坪构型相关特征变量有助于模型预测精度的提高,将预测模型用于运行实践可帮助首都机场每高峰小时减少约2~3个起飞时隙的浪费。
(3)提出根据航班相对时序影响程度识别场面运动航班类型的方法,实现了场面实时动态航班流量特征变量的精细刻画,结果表明,繁忙机场多航站楼多跑道构型下场面整体流量特征对滑行时间预测精度的贡献超过单一跑道流量特征。相对时序关系持续时间越长的航班以及进港航班的相关特征对离港滑行时间预测的贡献较大。