许保光,刘倩倩,高敏刚
(1.中国科学院科技战略咨询研究院,北京 100190;2.中国科学院大学公共政策与管理学院,北京 100049)
航班延误是全球航空运输业面临的一大难题。根据中国民航局每年发布的民航行业发展统计公报[1],中国民航航班正常率呈下降趋势,从2008年的82.14%下降到2013年的72.34%,只不过2011年比2010年略有回升;且自2010年以来,航班正常率一直未达到80%。航班延误造成巨大的经济损失,美国五所大学的研究者联合发布的技术报告显示,2007年美国航班延误共造成312亿美元的总成本,其中旅客延误成本占到54%,占比排在第一位,航空公司直接运营成本为83亿美元,排在第二位[2]。为治理航班延误,民航局将“提高航班正点率”写入民航业十二五发展规划。然而,由于机场繁忙、恶劣天气、飞机故障和航空公司计划等原因,航班延误不可避免。而且,由于前后连续航班往往共享飞机和/或机组资源,前一个航班的到达延误和过站时间的延长直接影响后一个航班的正点起飞,这样一个航班的延误波及到下游航班,进而导致更多后续计划航班延误。本文主要研究机场繁忙程度对连续航班延误波及的影响。机场的飞机起降架次反映机场的载运能力和服务水平,表现出机场工作人员和跑道的繁忙程度,据此以及数据可获性,本文选择每小时飞机起降架次作为刻画机场繁忙程度的指标,每小时航班起降量越大,机场越繁忙。
国内外许多学者一直致力于航班延误波及的相关研究。比较早提及航班延误波及问题的是Jarrah等[3]。他们在研究干扰发生后的航班计划恢复时,指出由于航班计划紧密相连,当一个航班延误,后续航班被迫相应延误,导致航班延误波及。后来的学者们对航班延误及波及的研究,角度和方法各不相同。如Pyrgiotis等[4]构造了一个近似网络延误模型AND(The Approximate Network Delays model)来研究规模机场网络中的波及延误问题,用排队论模型计算单个机场的航班延误。Rebollo和Balakrishnan[5]通过构造航空网络延误状态变量,利用随机森林方法预测航班对上的平均离港延误,延误分类误差率只有19%,但他们的研究只针对航班对,不能细化到单个航班。靖德果等[6]利用正部函数的性质给出一个基于概率论模型的计算航班出发延误时间的公式,从而可以估计每个航班的正点率。而Wong和Tsai[7]借鉴在临床医疗领域广泛应用的生存分析方法,通过Cox比例风险模型进行影响航班延误的多因素分析,并得出结论:对于离港延误,影响因素包括过站缓冲时间,机型以及8种延误原因,对于到港延误,影响因素包括飞行缓冲时间以及天气。此外还有一些典型的统计方法,如延误树[8-9]、Petri网[10-11]、贝叶斯网络[12-16]。
Beatty等[8]最早采用航班延误树的方法研究延误波及,并引入延误乘子的概念来表示延误波及。他们给出初始延误发生的时间、延误时间和航班计划中飞行资源(飞行员,机组,飞机)调度之间的线性关系,通过建立航班延误树来计算延误乘子值以表示延误综合效果。但他们的研究并没有用到实际航班数据。Ahmadbeygi等[9]也利用建立延误波及树的方法来研究飞行资源相关性(主要指飞机相关和飞行员相关)对于航班延误波及的影响,提出两大类分析指标:以波及延误时间除以根延误时间得到的延误放大倍数,和以纵向延误波及航班数除以延误波及航班数表示的延误波及深度,并且发现延误波及深度越小(表示飞行资源分离越多),延误放大倍数越大。
丁建立等[10]建立了单架飞机执行多个连续航班任务的时间Petri网模型,并利用仿真数据来研究初始航班延误时间对后续延误波及航班数以及延误时间的影响。王珊珊等[11]在基本Petri网基础上定义了有色出现网,描述由飞机和机组这两个关键资源衔接所引起的航班延误的链式波及。但作者只是运用有色出现网直观表示航班延误的波及链条,没有对波及延误进行量化处理。
Xu Ning等[12]首先利用贝叶斯网络对美国的三个枢纽机场间的航班延误数据进行分析,其构建的贝叶斯网络模型中考虑了天气、航班取消、时间等因素。刘玉洁等[13]利用贝叶斯网络分析了进港延误和航班取消、时间对离港航班延误波及的影响。曹卫东和贺国光[14]分析了连续航班延误的波及,构建的贝叶斯网络中考虑了延误原因和过站时间偏差。徐涛等[15]用一个ASN(Airline Schedule Network)网来表示航班计划,并对计划中的离港/到港事件构建贝叶斯网络分析模型,考虑的因素包括机场天气、航班所属航空公司、航线类型(国际/国内)、时间段、机型,该分析模型可以对航班计划中各航班的到港延误、离港延误是否发生及延误等级进行概率预测。邵荃等[16]用贝叶斯网络分析机场航班到达延误到起飞延误的波及,模型中考虑了航线类型(国际/国内/地区)、航班起飞到达时段、延误原因三个因素。
影响航班延误波及的原因众多[17]。民航管理干部学院的王文俊和白福利[18]根据我国民航运行实际,把航班延误的主要原因划分为自然原因、民航主体运行单位(航空公司、机场、空管单位)原因、民航保障单位原因、旅客原因、公共安全事件原因和军事活动原因。根据该划分标准,前面综述的相关研究往往只考虑了自然原因(如天气)、航空公司原因(如航班计划),而没有考虑机场繁忙程度对航班正常起飞的影响。当机场起降航班增多时,由于停机坪、跑道等设施的容量、地面工作人员服务水平、航班起降程序等的限制,容易导致航班空中或地面等待,从而导致延误并波及到下游航班。针对这点,本文采用贝叶斯网络方法分析航班到港延误对离港延误的波及,并用算例验证两个不同贝叶斯网络模型的离港延误预测效果,其中,AD模型用到港延误预测下一个航班的离港延误,ATD模型用到港延误和机场繁忙程度预测下一个航班的离港延误。算例结果表明,考虑机场繁忙程度的延误预测模型对航班延误波及预测更加准确。如果航空公司能预测航班延误程度并及时采取有效措施应对延误,对提升航空公司延误管理和形象有积极作用。
飞机是航空公司重要的生产资源,一架飞机一天往往执行多个连续的航班任务,称之为航班环。当航线环的某一节航班发生起飞延误(或者到达延误)后,导致后续航班发生延误,我们称之为航班延误波及。
图1表示由同一架飞机执行的两个连续航班间的延误波及。
图1 延误波及模型
其中,航班i,j表示同一个航班环上的两个连续航班;STD和ATD分别表示计划和实际离港时刻;STA和ATA表示计划和实际到港时刻;SBT=STA-STD和ABT=ATA-ATD表示计划和实际飞行时间;STTij=STDj-STAi和ATTij=ATDj-ATAi表示计划和实际过站时间。
由以上8个变量可推出如下4类延误时间变量:
DDT=ATD-STD表示航班离港延误时间,BDT=ABT-SBT表示飞行延误时间,ADT=ATA-STA表示航班到港延误时间,TDT=ATT-STT表示过站延误时间。
延误波及可以表示为DDTj=ADTi+TDTij,即航班i的到港延误通过过站过程波及到下一个航班j的离港。
本研究提取同一飞机一天中执行航班环的数据,建立贝叶斯网络模型,对数据进行分布检验,通过参数学习得到的概率分布进行贝叶斯网络推理,研究机场繁忙程度对航班延误波及的影响程度。我们给出如下的问题描述:
给定:1、某航空公司的航班时刻表,以航班环形式给出,各航班信息包括航班号,起飞机场,降落机场,计划起飞时间,计划降落时间;2、航班环中各航班到港延误时间;3、航班环中各航班过站机场的繁忙程度(以小时飞机起降架次描述)。
预测:此航班环中后续航班的离港延误。
对于航班延误波及问题而言,贝叶斯网络的拓扑结构定性地描述了延误原因对于航班延误以及延误间的相互影响,而条件概率表则定量地描述了这种影响。贝叶斯网络的构造方法有两种,一种是通过咨询专家手工构造,另一种是通过数据分析获得[22]。本文首先通过数据分析即贝叶斯网络结构学习得到分析机场繁忙程度的网络,再结合民航行业专家经验构造延误波及分析的贝叶斯网络。
3.1.1 机场繁忙程度的刻画
将一天按小时分成24个时段,分别为(t0,t1),(t1,t2),…,(t23,t24),以每个小时机场实际起降飞机架次作为刻画机场繁忙程度的指标,记为TBSk。对于每个在第k个时段,即(tk-1,tk),离港的航班,根据其是否有前续航班和两个连续航班是否晚点,将连续航班可能出现的情景列于表1,以S1-S8表示。
表1 延误波及情景分析
我们以图2说明机场实际起降架次动态变化的过程。假定我们要预测机场i在第k个时段的实际起降架次,在时段k,机场i首先要安排本机场前面时段(时段k-1及以前时段)延误过来的未起飞的航班(以延误离港航班集合表示)和延误到本时段降落的航班(以延误到港航班集合表示),其次要安排计划在时段k起降的航班,而这些计划航班,有可能按计划在本时段起降(以正常到港航班集合和正常离港航班集合表示),也有可能延误到后面时段(时段k+1及以后时段)起降。图2中,延误到港航班集合对应延误情景S8,正常到港航班集合对应延误情景S7,正常离港航班集合包含延误情景S1,S4和S6,延误离港航班集合包含延误情景S2,S3和S5。
图2 机场繁忙刻画概念图
从图2我们可以看到,机场每小时实际起降的航班数,除了本时段计划起降的航班外,还包括前面时段延误到本时段的航班。下文中我们统计由于各种原因延误到机场i时段k的航班数,以及第k个时段机场计划起降的航班数,作为要研究的机场繁忙程度的影响变量。
模型中所考虑的影响变量列于表2。
表2 机场繁忙程度的影响变量
我们以某机场若干时段为例,给出机场繁忙程度的贝叶斯网络结构学习过程及结果。我们共得到5078组样本(部分见表3)。基于K均值聚类对各变量进行离散化处理,每个变量分成3类或4类,该示例中的每个变量的类中心列于表3。
表3 贝叶斯网络建模的部分样本(航班数)(以某机场若干时段为例)
采用K2算法[23]对数据进行贝叶斯网络结构学习。假定的变量顺序为TQ、LL、AP、AL、LK、JH、TBS,父节点的上限为6个。初步学习结果中,变量AL、AP、LK没有对最后的实际起降架次起到直接影响关系,因此考虑去掉这3个变量。用K2算法再次学习,最终得到的影响机场繁忙程度的贝叶斯网络结构如图3所示。图3表示机场繁忙程度主要受天气原因延误过来的航班数、空中管制原因延误过来的航班数以及本时段计划起降航班数三个变量的影响。
图3 机场繁忙程度影响关系的最终学习结果
按照图3所示的网络来预测某个时段的机场繁忙程度,结果表明平均预测准确率能达到80%。
3.1.2 延误波及分析的贝叶斯网络
通过咨询专家经验,手工构造贝叶斯网络步骤如下:
(1)确定网络结构。确定建模对象范围,选定一组问题的随机变量,分析变量之间的因果影响关系,
确定节点状态,建立模型结构;
(2)确定网络参数。贝叶斯网络的参数,即各变量的概率分布,一般是根据贝叶斯规则通过样本进行参数学习获得,有时也可以从问题的特性直接得到。
本文建立的航班延误波及的贝叶斯网络模型结构如图4所示,我们定义为ATD(Arrival-Terminal- Departure)模型。图4表示4个连续航班组成的航班环,DDT_1至DDT_4表示航班的离港延误时间,ADT_1至ADT_4表示航班的到港延误时间,TBS_2至TBS_4表示过站机场的繁忙程度。首个航班的离港延误为根节点;后续3个航班的离港延误程度,有两个父节点,一个是前一个航班的到港延误程度,另一个是过站机场的繁忙程度。表示航班到港延误程度的变量的父节点只有一个,即本航班的离港延误程度。过站机场的繁忙程度有3个父节点。
图4 ATD贝叶斯网络模型拓扑结构
我们把只用到港延误预测离港延误的贝叶斯网络模型定义为AD(Arrival-Departure)模型。AD模型结构如图5所示。图5中的节点,除去根节点,其余节点均只有一个父节点。
图5 AD贝叶斯网络模型拓扑结构
延误时间与延误等级对应见表4。
表4 航班延误等级表
机场时段起降架次划分标准见表5。
表5 TBS_i(i=2,3,4)取值范围
注:CAN-广州白云机场,HGH-杭州萧山机场,KMG-昆明长水机场,PEK-北京首都机场。
有两种常用的参数学习方法,即极大似然估计和贝叶斯估计[24]。相较于极大似然估计,贝叶斯估计多了一个均匀分布的先验样本。由于航班延误波及问题的特殊性,比如当前续航班出现2个小时以上的延误时,后续航班不可能正点起飞,因而均匀分布作为先验分布并不适用,所以本文采用极大似然估计进行参数学习。
训练样本和测试样本具有相同的分布下,进行预测才是比较合适的。因而在每次验证前,先进行训练样本和测试样本的分布检验。本文采用非参数估计中的Kolmogorov-Smirnov检验,简称K-S检验。K-S检验的原假设为两个样本来自同样的连续分布。该检验思路如下:统计得到两个样本的概率累积分布,计算两个分布的最大差值作为K-S统计量,如果该统计量伴随概率P值小于显著水平(通常P的阈值为0.05),则认为两个样本总体分布具有显著性差异。
概率推理是给定贝叶斯网络一部分节点的值,称为证据,求未知节点称为观测节点的后验分布。贝叶斯网络具有双向推理功能,既可以从作为原因的父节点推理作为结果的子节点的概率,称为预测推理,也可以由作为结果的子节点推理作为原因的父节点发生的概率,称为诊断推理。本文要预测后续航班离港延误等级,因而是正向推理,由原因推理结果。蒙肖莲等[25]采用期望风险或成本总和最小原则作为贝叶斯决策准则,而本文采用的后验概率最大化等价于0-1损失函数时的期望风险最小化。
航班数据取自国内某航空公司某年航班生产数据。本文共以4个航班环为例来说明,各航班环上航班的航班号、起飞机场、起飞时段见表6。
表6 航班环信息
注:flt1-flt4表示航班号,ap1-ap4表示起飞机场三字码,t1-t4表示起飞时段。
在网络建立后,通过极大似然估计方法进行参数学习,限于篇幅,我们仅以第一个航班环样本的第二个航班的离港延误等级的参数学习结果为例进行说明,表7和表9分别表示AD模型和ATD模型下第二个航班的离港延误等级条件概率表。
表7 DDT_2的条件概率分布表(父节点为ADT_1)
表7说明,当第一个航班的到达延误时间小于等于10分钟即第一个航班正点到达时,第二个航班正点起飞的概率达到了87%,但当第一个航班的到达延误时间超过10分钟且小于30分钟时,第二个航班正点起飞的概率降到了45.6%,以此类推。
表8 TBS_2的条件概率分布表
表8给出图3所示机场繁忙程度影响关系下,机场繁忙程度的参数学习结果(以第一个航班环样本的第二个航班的起飞机场和起飞所处时段为例)。可以看到,随着延误航班数和计划航班数的增加,机场繁忙的几率增加。
表9给出不同的到达延误和机场繁忙程度下,后续航班的离港延误时间的概率分布。当第一个航班准点到达时,无论过站机场多么繁忙,第二个航班准点起飞的概率均超过了80%;当第一个航班发生到达延误且延误时间小于30分钟时,当机场处于极其繁忙状态时,第二个航班准点起飞的概率只有50%。
预测前都要进行K-S检验,由于K-S检验对于样本数有一定的要求,仅给出满足样本数条件下的分布检验结果,见表10和表11。其中,k值为构造的检验统计量,表示两个样本的概率累积分布的最大差异,取值范围为0到1;p为与检验统计量相对应的概率值,阈值为0.05,且p值与样本数有关;h值表示检验结果,当p值大于0.05时,h等于0,表示保留原假设,当p值小于0.05时,h等于1,表示拒绝原假设。表10和表11分别表示AD模型和ATD模型各自父节点下第二个航班离港延误的分布检验结果(以第一个航班环的第二个航班的离港延误时间分布检验为例)。
表9 DDT_2的条件概率分布表(父节点为ADT_1和TBS_2)
表10 DDT_2的分布检验结果(AD模型)
表11 DDT_2的分布检验结果(ATD模型)
表10说明,在前续航班不延误或者延误时间小于半个小时的情况下,后续航班离港延误时间测试样本和训练样本具有相同的分布。表11给出在前续航班不延误或者延误时间小于半个小时的情况下,当机场处于各繁忙等级时的后续航班离港延误时间的测试样本和训练样本的检验结果;表11表明对于有足够样本数的前续航班延误和机场繁忙程度分类,后续航班离港延误时间的测试样本和训练样本具有相同的分布。
在通过检验后,利用学习得到的概率分布进行预测。本文采用10折交叉验证[26]方法给出最后的离港延误预测准确率,预测准确率定义为预测正确的样本数占样本总数的百分比。10折交叉验证的做法如下:把样本随机均匀分成相同数量的10份,每次取1份做测试,剩下9份做训练;共进行10次,每次的测试集均不相同。10次测试结果取平均作为最终预测结果。为保证结果的稳健性,共进行10次10折交叉验证。表12给出10次10折交叉验证后取平均的预测准确率。对于样本涉及的12个航班,ATD模型的预测准确率均大于AD模型的预测准确率,表明机场繁忙程度对延误波及确实有一定影响。另外,接近一半的航班,ATD模型能将预测准确率提高到80%以上。
表12 预测准确率比较
影响航班延误波及的因素众多,不同于以往只考虑自然原因或者航空公司原因的研究,本文提出基于机场繁忙程度的航班延误波及贝叶斯网络分析方法,以机场小时飞机起降架次作为刻画机场繁忙程度的指标,并通过贝叶斯网络结构学习得到机场繁忙程度的影响关系图。采用10折交叉验证方法计算离港延误预测准确率,并以10次结果的平均值作为最终结果,以保证结果的稳健性。算例结果表明,与不考虑机场繁忙程度的贝叶斯网络模型相比,考虑机场繁忙程度的模型能够更准确地预估航班延误波及情况。
本文的研究中,许多影响航班延误的因素诸如航路天气等并没有包括进模型中,只要获得更多更准确的数据,模型能进一步提高预测精度。另外,现实生活中,延误时间为右偏分布,即较长延误时间出现的频率较低,如何利用这一信息构造先验分布以得到更为准确的条件概率表是下一步研究的重点。