航班延误预测研究概述

2020-03-12 07:43付振宇徐海文
科技与创新 2020年3期
关键词:数据挖掘航班对象

付振宇,徐海文,傅 强

(1.中国民用航空飞行学院 空中交通管理学院,四川 广汉618307;2.中国民用航空飞行学院 计算机学院,四川 广汉618307)

1 引言

随着中国经济快速平稳发展,民航业也得到了较好的发展。客运量从2005 年的13 827 万人次增长到2018 年的61 000 万人次,增长超过4 倍。但随着航班量的增加,航班延误问题也越来越突出,航班延误问题已然成为民航关注的重点。造成航班延误的原因有多方面,目前是无法消除的,但是对航班延误的提前预测,并及时通知旅客和相关部门,让各方根据航班延误预测结果做好相关应对工作,具有重要的实际意义,因此如何高效和准确地对航班延误情况进行预测具有较高的研究价值。

航班延误预测旨在航班延误发生前对航班发生延误的可能进行预测,将预测结果提供给航空公司、机场和空管单位,以便其提前采取措施将航班延误经济损失降低到最低,同时将预测结果提供给旅客,以便旅客做好行程安排。

虽然许多研究学者就航班延误预测问题展开了深入的研究,但国内对于航班延误研究的概述较少,整理和归纳航班延误预测研究的现状对于航班延误预测研究有较为实际的意义。本文对航班延误预测问题的研究进行梳理和概述。本文首先对国内外航班延误的的定义进行对比分析,并对航班延误预测的内涵进行分析,随后对国内外关于航班延误预测的研究进行分类和总结,最后提出一种航班延误预测的一般性流程,并对航班延误预测研究的方向进行展望。

2 航班延误及航班延误预测

2.1 航班延误定义对比分析

“航班延误”这一说法最早出现在1929 年国际第一部航空航空运输公约即《华沙公约》中,其第19 条规定航空承运人应为航空运输途中发生的旅客、货物未按时到达的产生的损失提供赔偿,但是其并没有给出航班延误的明确定义[1]。1955 年的《海牙议定书》和1999 年的《蒙特利尔公约》对航班延误也没有给出明确的定义。由于世界各国的民航运输体系不同,所以各国对于航班延误的定义也不尽相同。中、美、欧以及世界航空运输协会关于航班延误的相关定义如表1 所示。

表1 航班延误相关定义

通过表1 不难发现,各国民航管理部门对于航班延误的定义往往是通过比较实际进(离)港时间与计划进(离)港时间加上一定阈值后是否一致,作为评判航班是否延误的标准。但从旅客角度而言航班延误往往是指实际起飞时间晚于计划起飞时间(机票上时间)[2]。

综上,可以看出航班延误指航班实际到港或离港时间晚于计划到港时间和离港时间的情况。

2.2 航班延误预测

预测是指在一定的理论指导前提下以事物的发展历史和现状为出发点,以统计数据和调查研究资料为依据对事物的发展规律过程进行深刻原理分析和严格数学推导,在计算的基础之上研究并认识事物的发展规律,进而对事物发展的未来变化预先做出科学的推测[3]。简而言之,预测是在一定前提下对未来发生的事物的一种提前推测和估计。航班延误预测指分析与研究和航班延误相关的各种因素寻找航班延误与其中的关系,进而利用已知数据和信息对航班未来是否会发生延误或者延误发生的程度进行推测和估计。

3 航班延误预测研究

许多学者对航班延误预测进行了深入研究,对其进行归纳、总结和分类具有一定的必要性。从航班延误预测研究的机理出发,可以将国内外关于航班延误的预测研究分为基于航班延误传播的航班延误预测和基于数据挖掘的航班延误预测两类。

3.1 基于航班延误传播的航班延误预测研究

为了充分利用飞机这一资源,航空公司往往会安排同一架飞机在一天中连续执飞多个航班,称之为航班串(链),如图1 所示。当航班串某一航班发生延误时,将会可能导致后续航班发生延误,这种航班延误传播的现象被称为航班延误波及。

图1 航班串(链)

基于航班延误波及的航班延误预测研究如表2 所示。从表2 可以看出,基于航班延误传播的航班延误预测研究的贝叶斯网络模型应用广泛。经典的贝叶斯网络模型由两部分组成[15],一部分是一个有向无环图G=(V,E),V={v1,v2,…,vn}为节点的集合,E={e1,e2,…,em}为有向边的集合,节点Vi代表要解决问题的变量,有向边ej代表节点之间的依赖关系;另一部分是一个概率分布表,用于表示每个节点的概率分布,根节点是它的边缘分布P(Vroot),非根节点Vi为条件概率分布为节点Vi的父节点。根据条件独立性,节点V 的联合概率分布为:

表2 基于航班延误波及的航班延误预测研究

利用贝叶斯网络进行航班延误预测,是利用贝叶斯网络来表征各种与航班延误相关因素与航班延误之间的关系,进而得到航班延误概率,实现航班延误预测。由于基于航班延误传播的航班延误预测研究在有前序航班的延误数据后才对后续航班进行预测,这使得航班延误预测的时效性不佳。另外,可以看出利用航班延误传播对航班延误进行预测的对象并无统一标准,其预测模型评价指标有预测精度、预测误差等。

3.2 基于数据挖掘的航班延误预测研究

基于数据挖掘的航班延误预测是指利用一定的数据挖掘方法,对收集到的与航班延误相关的数据包括航班数据、气象数据、流量控制数据等,挖掘数据之间的关系以便实现对航班延误的预测,如图2 所示。

基于数据挖掘的航班延误预测表示如下:

式(1)中:yp为航班延误预测对象;P 为数据挖掘方法;F,W 为与航班延误相关的数据。

图2 基于数据挖掘的航班延误预测研究

基于数据挖掘的航班延误预测研究如表3 所示。通过表3 可以发现,国内外研究学者利用数据挖掘进行航班延误预测的主要方法有决策树、随机森林、支持向量机等传统的机器学习方法和深度神经网络、循环神经网络、卷积神经网络等深度学习方法。同时发现利用数据挖掘进行航班延误预测的预测对象中航班延误判别较为常见。另外,利用数据挖掘方法对航班延误预测的研究其模型评价指标中最为常用的是模型的预测精度。利用数据挖掘方法对航班延误进行预测常用的数据集主要是航班数据和气象数据。

表3 基于数据挖掘的航班延误预测研究

4 航班延误预测的一般性流程

通过总结归纳国内外关于航班延误的预测研究的成果和技术,得到航班延误预测的一般性流程,如图3 所示。

图3 航班延误预测的一般性流程

确定航班延误预测对象:航班延误预测主要目的是给航空公司、机场和旅客以及其他相关单位提供一定的预警以便其做好应对航班延误的准备。但服务于不同的对象,航班预测对象往往也不相同,所以根据客户需求确定航班延误预测对象至关重要。

数据的收集与预处理:根据航班延误预测对象,分析预测对象,确定预测的角度,收集相关数据并预处理。

选择预测方法,建立预测模型:根据预测对象和收集到的数据,选择预测方法,建立初始预测模型,需要根据模型评价对模型进行修改。

预测模型的评价:选择评价指标,对模型进行评价以便改进模型,提高预测精度。

航班延误预测模型的保存:对最终模型进行保存,实现对模型的复用。

5 总结及展望

航班延误预测对于减缓航班延误有着重要意义,本文从航班延误定义出发,对航班延误预测的内涵进行分析,将航班延误预测研究根据研究机理分为基于航班延误传播的航班延误研究和基于数据挖掘的航班延误预测研究两类,对两类研究的现状进行概述,并提出了一种航班延误预测的一般性流程。通过研究航班延误预测的现状,发现目前关于航班延误预测研究的方法主要是机器学习和深度学习的相关方法。同时还发现目前关于航班延误预测的预测对象还没有统一标准。另外发现目前航班延误预测的时效性和准确性没有统一标准。最后,目前关于航班延误预测的研究大多针对单一机场或单一航线,没有考虑全局性航班网络下的航班延误预测。

猜你喜欢
数据挖掘航班对象
改进支持向量机在特征数据挖掘中的智能应用
山航红色定制航班
山航红色定制航班
山航红色定制航班
山航红色定制航班
晒晒全国优秀县委书记拟推荐对象
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
攻略对象的心思好难猜
图说车事