刘莉雯
摘 要:QAR数据记载着飞机运行中的上千种飞行参数数据,涵盖了飞机运行的各个方面。但QAR数据的数量大、种类多,目前对QAR数据的认识和应用还很有限。随着数据处理技术的不断发展,数据挖掘方法被应用到QAR数据处理中,取得了比较好的成果,为航空安全提供了有力支撑和保障。本文阐述了数据挖掘的基本原理,介绍了数据挖掘在飞机系统故障诊断、飞行品质评估、飞机健康评估等方面的应用,最后总结了数据挖掘所面临的问题和挑战。
关键词:QAR数据;数据挖掘;航空安全
中图分类号:V247 文献标识码:A
1 绪论
安全,是航空永恒的话题。近年来,随着航空安全保障技术的发展,民航安全运行平稳可控,飞行事故的发生率较低,但飞行事故征候却时有发生。
为了保障飞行安全,局方要求商业飞机安装快速存取记录器(Quick Access Recorder,简称QAR)。QAR可连续记录飞机长达数百小时的原始飞行数据,并且采集飞机的高度、速度、姿态、加速度等上千种飞行参数,涵盖了飞机运行的各个方面。如何将QAR数据充分利用起来用起来,深入发掘其中有价值的信息,为飞行安全评估、飞行事故调查提供数据支持,为飞机维护工作提供决策依据,是目前航空安全领域研究的热点。数据挖掘是从海量数据中找出有价值信息的过程,并将这些有用信息归纳整理成结构模式,为使用者进行评价和决策的参考。随着信息科技的飞速发展,数据挖掘技术已经广泛应用于工程设计和科学探索的各种领域,航空领域中QAR数据的数据处理就是它的一个典型应用。
2 数据挖掘的原理
数据挖掘是从海量数据中找出有价值信息的过程,并将这些有用信息归纳整理成结构模式,为使用者进行评价和决策的参考。
2.1 數据挖掘的方法
(1)分类。通过在已经分好类的训练集上运用数据挖掘技术建立分类模型,将该模型用于数据分类。
(2)估值。与分类类似,但估值最终输出的是连续型的数值。
(3)预测。通过分类或估值的训练得到的模型,如果经检验准确率较高,则可将该模型用于对未知变量的预测。
(4)关联规则。其目的是发现哪些事情总是一起发生。
(5)聚类。自动寻找分组规则,判断样本间的相似性,把相似的样本划分在一起。[1]
2.2 数据挖掘流程
数据挖掘系统流程如图1所示。首先,必须要对目标有一个清晰明确的定义。然后,建立数据挖掘库。QAR所记录的飞行参数涉及多个部件和系统,数据的感知、传输、存储、译码的过程中,任一环节出现问题,都可能会造成数据失真。在建立数据库时,需要对数据进行预处理:尽量补全缺失数据,通过滤波平滑噪声数据,删除孤立点等,将原始数据转化为挖掘算法所接受的操作数据类型。同时,由于QAR数据属于多传感器参数流数据,有特征维度高、数据量大等特性,从几千个飞行参数中找到对输出结果影响最大的参数,排除冗余,对数据进行降维就很有必要。接下来就可以采用合理的挖掘算法,先用一部分数据建立模型,再对这个模型进行测试验证[2]。模型建立好之后,评价得到的结果,解释模型的价值,最后将挖掘算法结果转化为知识。
3 数据挖掘在QAR数据处理的应用现状
3.1 特征提取
由于QAR数据来自于不同系统的多个传感器,具有维度多、时间长、数量大等特性,从海量数据中寻找到有效数据是应用QAR数据的首要问题。
主成分分析法(Principal Component Analysis,PCA)基于最大方差理论,用少数几个综合指标提取了原多个指标主要成分的方差信息,去除原始飞参数据的冗余,降低数据维度,有效地找出数据中主成分,能够有效实现飞行数据的特征提取[3]。但PCA忽略了方差较小方向的数据信息,也就是信息提取不完整;其次,它不能获取不同样本之间差异特征,而且对非线性数据特征提取的效果不是很理想。
为解决以上问题,奇异值分解、深度置信网络[4]、卷积神经网络与长短时记忆网络[5]等有监督的学习方法也被用于QAR数据的特征提取,提高了特征提取的效率。
3.2 在飞行品质监控中的应用
QAR数据最初的应用就是飞行品质监控,保障飞行的安全。其在飞行品质监控中的应用于超限分析和安全风险预测。
(1)超限分析:指对在飞行中QAR所记录的参数超出监控标准的不安全事件进行分析[6]。目前航空公司普遍采用的基于QAR的超限分析方法为:筛选出超限事件所对应的航班信息,随后由专业人员对照航班信息判读筛选。国内一些航空公司,建立了以QAR数据解译码系统为基础的云平台,根据飞行超限事件中部分指标的重要性不同赋予不同的权重,对飞行员驾驶等级进行量化评定。或者结合飞行管理系统的航后管理功能,对超限事件涉及的机组人员进行复训,以保证飞行员的操作符合标准,保障飞行安全。这样做固然可以得到超限事件的统计结果,但人力成本巨大。为此,学术界尝试基于数据挖掘用更智能的方式,如:黄金分割法等,对超限事件进行判定,并基于离差最大化原理或聚类理论对飞行参数赋予不同的指标权重,来构建飞行安全评估模型[7][8]。
超限分析大多是飞行超限事件出现后以风险事故调查的形式展开。这就忽略了没有超限但有风险倾向的飞行操作行为。
(2)风险行为识别:在现代运输航空中,大部分时间飞机都是在按照预先设定好的程序自动飞行,飞行员主要起监督作用。区别在于,当外界环境变化时,优秀的飞行员总是能及时根据外界环境变量的变化,通过飞行操作,实现对飞行器的平稳控制。为此,航空公司作开展了较多有风险倾向的操作行为识别与飞行品质评估工作。基于海量QAR数据建立飞行风险分析平台,用飞行风险系数来评价飞行员的驾驶行为级别。除了各大航空公司以外,学术界对于风险行为识别的讨论主要集中在起飞和着陆飞行操作较密集的阶段,通过随机森林[9]、贝叶斯网络、专家经验数据库等方法对特定动作所表征的风险进行讨论数据。
3.3 在故障诊断中的应用
故障诊断是查找设备或系统的故障的过程。对于飞机而言,故障诊断的难点在于从参数中提取反映系统运行状态的特征向量,对系统运行状态和异常情况作出判断,建立系统故障模型,通过特征向量与标准值比较,诊断故障类型,推导故障成因。
QAR数据的故障诊断流程如图2所示,首先需要建立数据库信息,数据库信息包括飞机QAR数据和时间、机场条件等其他相关因素。然后根据具体需要分析的对象,运用知识库中间的四类知识来进行故障模式识别,最终对事件进行评估[10]。
飞机是一个复杂系统,飞机上某元件、子系统发生故障会影响其他部件或子系统也出现异常,呈现出极其复杂的故障乱象。在故障诊断过程中,面对海量故障信息,最关键的是构建故障诊断知识库。常采用数据挖掘中关联规则或聚类的方法,通过主成分分析、模糊理论、深度置信网络等方法提取故障特征,再利用极限学习机、支持向量机、卷积神经网络算法等构建故障诊断模型。
3.4 在飞机故障预测与健康管理中的应用
故障预测与健康管理PHM(Prognostics Health Management)要求通过数据监控与分析预测故障的发生。为了达到这个目标,首先必须对海量数据进行分析。QAR完整记录了飞机飞行过程中上千个参数,对这些参数进行深入分析,通过关联规则挖掘出数据属性的潜在联系,建立故障预测模型,判断飞机相应部件的故障发生时间,为预防性维护提供决策支撑。故障预测与健康管理的难点在于健康模型怎么评价,预测的模型如何创建。现在主流的方法是依据以往数据进行分析,这类办法实现简单但精确度不高。另外,还有很多新方法应用到了PHM当中,也取得了比较好的效果,例如贝叶斯理论、时间序列分析法等[11]。
4 结语
自飞机加装QAR了几十年以来,国内的航空公司累积了海量的QAR数据,提高QAR数据利用率对于保障飞行安全有非常重要的意义。近年来数据挖掘技术飞速发展为深入分析、发掘QAR数据信息提供了新的思路。本文汇总了目前数据挖掘技术在QAR数据处理中的应用。通过将数据分类、估值、聚类、发掘数据隐藏的关联,为进行飞机系统故障诊断、飞行品质评估、飞机健康评估等提供支持。然而现有的研究多侧重于理论、方法层面,对飞行参数数据的挖掘利用还不够,同时缺乏面向工程实际的体系化研究与应用。
参考文献:
[1]张曾莲.基于非营利性、数据挖掘和科学管理的高校财务分析、评价与管理研究:首都经济贸易大学出版社,2014.05:70.
[2]杨良斌.信息分析方法与实践[M].东北师范大学出版社,2017.01:213.
[3]冯兴杰,冯小荣,王艳华.基于核函数的PCA在QAR数据分析中的应用[J].计算机工程与应用,2009,45(14):207209.
[4]戴婧睿,吴奇,仁和,等.基于深度置信网络的QAR飞行数据特征提取分析[J].电光与控制,2017,24(11):7882.
[5]張鹏,杨涛,等.基于CNNLSTM的QAR数据特征提取与预测[J].计算机应用研究,2019,36(10):29582961.