一种航空发动机运行可靠性评估方法

2021-11-01 12:42马红亮冯蕴雯刘骞刘佳奇
航空工程进展 2021年5期
关键词:决策树排气可靠性

马红亮,冯蕴雯,刘骞,刘佳奇

(1.中航西飞民用飞机有限责任公司 客户服务中心,西安710089)

(2.西北工业大学 航空学院,西安710072)

0 引 言

航空发动机被誉为“工业之花”,是飞机的核心部分,运行在高温、变载荷等极端条件下,其正常运行可以保证飞机的性能及可靠性[1-2]。随着技术不断迭代发展,长时间的实验实现难度较大且成本较高,基于故障数据的传统可靠性分析方法受到了限制。在这种背景下,面向飞行任务的航空发动机运行过程中的可靠性分析受到广泛关注[3-4]。运行可靠性基于运行过程中每台发动机监测的信息,考虑运行过程中多因素影响,搭建运行可靠性模型,计算其运行过程中的可靠性[5-6]。对于航空发动机而言,其运行可靠性定义为:在规定的运行时间内,规定的运行条件下,完成运行过程中规定功能的能力。由于航空发动机具有可靠性高、失效样本不足、试验费用高昂等特点,同时不同架次、不同机型、不同航线运行的发动机故障及性能退化并不相同,每一台发动机的可靠性对于运营商和主机厂都十分重要。

国际民航组织(International Civil Aviation Or‐ganization,简称ICAO)在安全管理体系中指出,危险的识别应该是积极而具有前瞻性的,有必要积极查明尚未发生的危害[7];美国联邦航空管理局(Federal Aviation Administration,简称FAA)提出了安全性“监视/数据分析”过程[8]。然而,航空组织尚未提供具体的航空发动机运行可靠性实施方法。运行可靠性除了考虑时间相依的概率外,还需考虑设备自身健康状况、外部环境、系统运行条件和系统运行行为等因素的影响。长期以来,飞行数据的记录与获取并不规范,基于运行数据的可靠性研究并不充分。近年来,随着先进的传感器技术、数据采集及传输技术的发展,在一定程度上为结合运行数据的航空发动机运行安全评估创造了条件[9-10]。国内外研究者通过数据分析的方法对航空器运行可靠性开展了初步的研究,H.Lee等[11]使用飞行数据记录器的传感器数据来预测可能发生的飞行性能异常,提出了一个发动机健康监测框架,用于检测性能异常从而保障系统安全性;C.Petcharin等[12]针对随着时间推移发动机可靠性下降问题,基于CF6发动机开展了运行可靠性和维护优化研究;洪骥宇[6]使用深度学习算法,依托复杂可靠性与运行可靠性分析理论,研究了状态参数与航空发动机运行可靠性之间的时变、非线性问题;周媛[13]基于数据驱动方法,围绕航空大数据问题,开展了发动机数据采集及状态监测过程中的诸多问题研究,其中关于状态监视、数据重构、退化模式识别三个方面的研究具有很高的指导价值;陈保家等[14]为了提高少失效或零失效数据条件下的航空发动机轴承运行可靠性评估精度和可信性,提出了一种基于比例协变量模型和Logistic回归模型混合的可靠性评估方法;孙闯等[15]针对小样本条件下的航空发动机运行可靠性评估提出了有效手段;赵军等[16]基于典型的民航发动机的飞行快速存取记录器(Quick Access Re‐corder,简称QAR)数据,对案例发动机进行性能分析。为了实现对研究对象的运行条件、工作状态、可靠性裕度等方面的综合评价,冯蕴雯等[5,17]面向飞机运行过程,应用智能算法开展了航空发动机运行可靠性、运行安全性研究,达到了较好的效果。然而,由于航空发动机运行过程中所涵盖的数据具有类型多、数量大、时变、强耦合、非线性等特点[17],导致航空发动机运行可靠性分析的效率和精度还不够高。

为了合理解决上述问题,本文提出一种航空发动机运行可靠性评估方法。结合航空发动机工作特性、航空发动机工作状态、飞机运行状态及外部环境等多重因素评估航空发动机运行过程中动态温度裕度以体现运行可靠性;将随机森林算法和分层抽样法结合后对运行数据进行分析,计算各特征重要度;以某型号飞机一次北京—乌鲁木齐的飞行任务为例对所提出方法进行验证。

1 随机森林与分层抽样法结合

随机森林(Random Forest,简称RF)作为一种基于决策树的机器学习算法由美国研究者Leo Breiman[18]于2001年提 出,通 过 训 练多 个 弱 模 型(决策树)来组成一个强模型,具有性能优越、结构简单、可解释性强的优势。RF作为实现人工智能的一种方法,其在航空领域广泛应用,例如叶博嘉等[19]以航空器在进近飞行为标签,采用RF算法建立了基于机器学习的航空器进近飞行时间预测模型。RF基于决策树原理,抽取随机化bagging样本于原始样本中,采用bootstrap技术[20]构建单棵决策树。在决策树的各个节点上,RF采取随机特征子空间的策略筛选分裂点并将其分裂。分裂后,将决策树进行组合,再采取投票方式获得预测结果[20]。

1.1 随机森林

假设X∈R D,n个样本(X,Y)包含于数据集Dn中。基于Leo Breiman提出的方法[18],将诸多具有独立训练特性的决策树构成森林。其中,单棵树的构建流程可以视为一个数据空间的划分。换言之,假设R D是一个完整的数据空间,则分支节点可作为R D的一个分区,其中每个分区可认为是超矩形单元。RF算法步骤为:

(1)首先,采取等权重有放回随机抽样方式,在Dn中抽取数量相等的n个数据点,为构造树做准备工作,称为bootstrap采样[20]。

(2)然后,分别在步骤(1)中得到的数据集中构造决策树。对节点而言,从D个特征中抽取m个特征(m

(3)最后,独立地预测各个基分类器决策树,采用多数投票的方式,在各个树的结果基础上,计算得出最后的结果。

一般情况下,研究人员常选用为均方差、均方根误差和绝对平均误差来评价RF在回归分析过程中结果的好坏,三个评价指标分别用MSE、RMSE和MAE表示。三个评价指标的计算公式如式(1)~式(3)所示[5]。

式中:N为训练集的样本数;yi为RF训练中的实际值;为RF训练中的预测值。

本文中,决定系数γ2用于评估RF的拟合效果,其值越大,拟合结果越优(γ2<1),其计算如式(4)所示[5]。

式中:yi为RF训练中的实际值;ŷi为预测值;yˉi为期望值。

然而,当高维数据多、特征数量大时,真实有用的信息特征的占比会少,易导致简单随机抽样方法创建的特征子空间不包含有用信息的特征。因此会造成构建的决策树的性能低,对决策树的性能产生影响,导致RF的性能也随之降低。为了优化这个问题,本文中将分层抽样法与随机森林算法结合。

1.2 随机森林算法结合分层抽样法

为了获得具有代表性的数据样本,分层抽样(Stratified Sampling)法通过引入分层变量的方式将数据分成若干个子组,依据子组与目标样本的大小比例进行随机抽样。

本文采用基于主成分的规则将特征集划分为若干子集。将变换后的特征集用累积特征值比率的方式划分为信息量多和少两部分,其中主成分和特征值一一对应。假设已经按降序排列的协方差矩阵的特征值为λ1,λ2,…,λF(l),则累积特征值比率R定义为

式中:R为若保留前r个特征值,保留数据中的100R%的差异。

基于累积比率R,把前r个特征值对应的特征分配给A1,作为信息丰富的部分。将后F(l)-r个特征值对应的特征分配到A2,作为信息较少的部分。从A1和A2两个部分随机选择特征进行子空间的分层抽样,如式(6)~式(7)所示。

式中:p为子空间的特征数;D1为A1中的特征数量;p1为A1的特征数;p2为A2的特征数。

将两部分特征合并形成用于构建树的特征子空间。通过上述过程,各节点的子空间包含丰富的信息且其特征含信息量较少,进而构建出较优的树。

通过随机森林算法与分层抽样法结合,增加了基本决策树的强度和决策树之间的差异性,可以提升随机森林算法在高维数据下的性能。

2 运行可靠性分析方法

2.1 特征提取

QAR记录数据量大,参数广且频率高,通常认为QAR数据用于日常运行监控[21]。随着快速发展的无线QAR传输技术逐渐得到应用,QAR数据的分析与应用方法受到研究者的重视。

航空发动机运行在高温、变载荷等极端条件下,其运行可靠性受运行状态、运行环境、自身健康状况等多因素影响。通过简化归类,本文考虑当前运行环境、飞机瞬时状态、发动机当前工作状态3大类影响因素,以提取的QAR数据为依据,对运行过程中的11个具体特征进行提取,如表1所示。

表1 3类因素及11个特征Table 1 3 types of factors and 11 characteristics

2.2 运行可靠性评价

以往研究认为,监视及预测气动热力性能参数在航空发动机状态监控领域十分重要。结合前述航空发动机运行可靠性影响因素及特征的提取,本文以瞬态排气温度裕度RT来表示飞机运行过程中发动机的运行可靠性,如式(8)所示。

式中:T为随时间变化的排气温度;Ta为许用排气温度。

“为政以德,譬如北辰,居其所而众星共之”[1],“七十者衣帛食肉,黎民不饥不寒,然而不王者,未之有也。”[2],无论是执行政事坚持以德为重,强调君主身具高德还是施政的目的与结果是造福百姓以申民德都是儒家强调以德治国的鲜明体现并且儒家找到了礼作为判断行为是否具备德的标准,提倡以礼的重建来挽救礼崩乐坏的现实社会。

运行可靠性分析流程如图1所示。

图1 运行可靠性分析流程图Fig.1 Flow chart of operation reliability analysis

3 案例分析

本文以B737-800飞机为例,基于某航空公司北京—乌鲁木齐一次航班的QAR数据,进行航空发动机运行可靠性研究,提取包含3类因素11个子特征的QAR数据。B737-800配备了两台CFM 56-7B发动机,该发动机性能优良且传感器丰富。根据第1节中介绍的运行可靠性分析方法,先提取影响发动机运行可靠性的特征并依据指标RT进行运行可靠性评价;结合评价结果,采用结合分层抽样的随机森林法进行拟合、预测;随后对提取的11个特征进行重要度评价并总结航空发动机运行可靠性规律。

3.1 运行可靠性

以排气温度裕度RT表示航空发动机运行可靠性,M表示从QAR数据中提取的3类因素11个子特征的值的集合,RT与M的关系可以表示为

在本案例中,设定许用排气温度Ta取值为950℃,结合所提取的QAR数据,依据提出的航空发动机运行可靠性分析方法,对案例航班任务过程中航空发动机的时变排气温度裕度RT进行计算,结果如图2所示(其中1 kn=0.514 444 m/s)。

图2 特征时序图Fig.2 The time varying eigenvalues

运行过程中的排气温度裕度如图3所示。

图3 运行过程中的排气温度裕度Fig.3 The value of exhaust temperatare magin during operation

在时刻8∶55至9∶00期间RT值较高,此阶段为起飞之前,低压转子和高压转子转速较低,排气温度值较低,排气温度裕度值在0.55附近;随后飞机进入起飞阶段,此时低压转子和高压转子转速处于高值(在95%rpm附近),期间燃油流量大、滑油温度高、排气温度高,排气温度裕度在0.15~0.25之间,数值较小且波动较大。在时刻9∶20至12∶15期间,飞机处于巡航阶段,气压高度保持在36 000 ft(1 ft=0.304 8 m)附近,此时飞机运行平稳,低压转子转速、高压转子转速、燃油流量和排气温度等较起飞阶段有所降低,排气温度裕度较起飞阶段有所提高。

时刻12∶15之后飞机处于下降阶段,此时舱外温度不断升高,计算空速、气压高度、马赫数不断降低。由图2(c)、图2(d)显示的左右迎角和高、低压转子转速变化可知,在此区间内,飞机姿态调整频繁,转子转速不断变化,排气温度不断变化,导致排气温度裕度变化剧烈。但是,此区间内排气温度裕度均值较高,为0.4~0.65,这是由于在降落阶段飞机阶梯式下降,对发动机动力需求相对较小。

3.2 拟合分析

在上述提取的运行数据中,以时间为序随机抽取5 000组数据,其中3 750组数据用于创建训练样本,1 250组数据用作测试样本。计算结果如图4所示。

图4 排气温度裕度的预测结果Fig.4 Prediction results of exhaust temperature margin

各特征对于排气温度裕度的重要度计算结果如图5所示,可以看出:对排气温度裕度影响最大的前三个特征分别是左发n2、左发n1和运行时间;航空发动机排气温度裕度与发动机当前工作状态因素中的高压转子转速、低压转子转速以及飞机运行状态中的运行时间关联性最大。这是由于一方面高低压转子转速从侧面体现了发动机运行功率;另一方面飞机运行过程中按照航空公司的计划进行飞行,导致运行时间与排气温度相关度较大。此外,对航空发动机排气温度裕度影响较小的三个特征分别为舱外温度、右侧迎角和左侧迎角。综合实际运行经验,以上关于排气温度裕度的特征重要度分析具有合理性。

图5 排气温度裕度的各特征重要度Fig.5 The importance of each characteristic of exhaust temperatare magin

根据拟合结果,结合式(1)~式(4)得出结合分层抽样的森林算法分析的平方平均误差为1.501 6×10-5,均方根误差为0.003 9,绝对平均误差为0.002 4,决定系数γ2为0.980 1。

通过传统随机森林算法进行拟合计算,其中,传统随机森林算法可参照叶博嘉等[19]关于机器学习算法的研究。拟合计算结果通过式(1)~式(4)得出平方平均误差为9.231 0×10-5,均方根误差为0.021 0,绝对平均误差为0.014 8,决定系数γ2为0.972 2。

结合分层抽样的随机森林性能验证结果如表2所示。

表2 结合分层抽样的随机森林性能结果Table 2 Performance results of RF based on stratified sampling

从表2可以看出:相较于传统随机森林算法,结合分层抽样的随机森林算法拟合结果的MSE、RMSE和MAE值均变小,决定系数γ2更接近于1,相较于传统随机森林算法拟合结果有了明显提升。综上所述,通过结合分层抽样的随机森林算法拟合精度得到提高。

4 结 论

(1)本文提出了一种支持评估飞机任务过程中航空发动机运行可靠性的方法。所提方法考虑当前运行环境、飞机瞬时状态、发动机当前工作状态3类因素,将随机森林算法与分层抽样法有机结合对数据进行拟合、预测并计算特征重要度,在一定程度上解决了运行数据量大、维度高导致的数据处理困难问题。

(2)对航空发动机运行可靠性影响较大的前三个特征分别是高压转子转速、低压转子转速和运行时间。

(3)本文所提出的方法可为航空发动机运行可靠性评估提供理论支撑。为制定飞机维修计划和综合保障方案提供一定的参考。

猜你喜欢
决策树排气可靠性
发动机原理教材中四冲程柴油机换气过程的讨论
排气系统对车外加速噪声的影响分析
某车型排气消声器冰堵问题的分析及优化
某重卡线束磨损失效分析与可靠性提升
医疗器械可靠性研究现状与发展趋势
高密度存储服务器可靠性设计与实现①
可靠性增长试验与相关概念的关系及作用研究
简述一种基于C4.5的随机决策树集成分类算法设计
决策树学习的剪枝方法
How fast does a fart travel?