旷 典,付尧明,房丽瑶
(中国民航飞行学院 航空工程学院,四川 广汉 618307)
大数据挖掘分析在航空发动机状态监控与故障诊断中的应用
旷 典,付尧明,房丽瑶
(中国民航飞行学院 航空工程学院,四川 广汉 618307)
受到发动机数据收集的限制,发动机状态监控和故障诊断结果较为模糊。随着科学技术的不断改进,发动机维修数据、使用数据和其它相关数据积累得越来越多,为进一步提高发动机监控水平和诊断精度,在发动机状态监控和故障诊断中应用大数据方法提供了可能。由初始数据库、运行数据库、维修数据库和其他相关数据库组成发动机大数据,在分析了多元多维度大数据来源的基础上,建立了大数据模型的构架,提出了发动机大数据关联规则挖掘方法、状态量关联度分析和加权分析,对未来的应用给予展望。
航空发动机;大数据挖掘分析;状态监控;故障诊断
航空发动机状态监控与故障诊断,是指通过适当方式监控发动机各工作状态的相关参数,根据现有数据对发动机的工作状态进行有效的判断,完成已发生故障的诊断及未发生故障的预测,并提出维修技术建议[1]。状态监控与故障诊断技术可对发动机进行健康评估、寿命追踪、维修决策、航材储备等管理工作,以及对发动机及部件故障进行检测、隔离、诊断和预测等工作,提高了飞行的安全性和维修保障的经济性。
目前,航空发动机的状态监控与故障诊断的数据来源主要是发动机传感器测量参数。传感器测量参数具有参数类型少、样本量小、数据单一的特点。在针对测量参数的分析处理上,如神经网络[2]评估方法、信息融合技术专家诊断方法[3]、网络化Internet远程监控方法[4]、智能技术方法[5]等都较为明显的出现故障诊断准确率低、定位精度差、预判结果模糊等问题。随着科学技术的不断改进,发动机可测量的数据和新类型数据越来越多,发动机数据已初具大数据的模型,进一步增大了发动机诊断与预测的难度。基于数据的状态监控与诊断方法是对数据进行特性提取,从而构建数学模型,实现故障检测和诊断预测的目的。因此,提高数据的选择精度和宽度将使发动机的诊断精度得到提高,而选择科学的方法将进一步提高其精度。
目前,国内外对大数据技术越来越重视,电力行业运用大数据挖掘技术在性能评估和异常检测方面取得了很好的效果[6],GE公司通过predix大数据平台已在发动机监测工作方面取得优异成绩[7],大数据方法在发动机状态监控与故障诊断领域的运用已成为必然趋势。大数据挖掘技术增大了各状态参数的可用容量,将模式识别和数理统计相结合,并进行深度分析,重点是对各潜在影响因素之间的关联度进行深度挖掘分析。本文提出构建发动机大数据源,在分析多元多维度大数据来源的基础上,建立大数据模型的构架,提出了大数据挖掘方法,以期将新的方法和算法引入到发动机监控与故障诊断方法中。
航空发动机状态监控与故障诊断需要对测量参数进行选择和采集,参数的来源主要是通过传感器进行收集。发动机的直接测量参数包括风扇振动值、油门杆角度、气路热力参数(如发动机各主要截面压力P、温度T、流量W,高低压转速n1、n2,推力值F等)、燃油流量FF、燃油消耗率sfc、滑油值N、可调静子叶片VSV和可调引气活门VBV角度等信息。涉及其它信息,如飞机测量参数包括马赫数、飞行高度、真空速、大气总温总压或发动机进口总温总压等。发动机可用参数类别较少,数据较单一,虽然随着航班量的增加会提高相关参数的数据量,但数据限制会降低发动机状态监控与故障诊断的精准度,很难作出适当决策。如高压压气机、高压涡轮两者效率下降故障都会引起低压转子转速差Δn1、高压转子转速差Δn2、排气温度差ΔEGT、燃油流量差ΔFF的改变,只对这四个参数进行分析就无法达到精确诊断和故障隔离。为使诊断准确,考虑引入高压压气机和高压涡轮相关联的其他数据,如使用设计制造数据确定使用特性、使用历史排故数据确定是否存在故障或拆装人为因素,使用运行环境参数确定是否存在影响因素(大气PM2.5值会对涡轮导向器气膜冷却有影响),使用孔探数据监控叶片有无损伤,使用材料特性数据确定金属工作极限,使用相关部件数据确定是否有影响等对压气机和涡轮故障诊断更精确,应用适当算法处理数据将使诊断效率更高。发动机数据的融合务必使诊断精度提高,而发动机数据既独立多样,又相互关联,该数据的发展趋势符合大数据容量大、处理速度快、类型多样化、价值大的特征[8]。
发动机状态监控与故障诊断技术可对发动机设计、制造、使用、维护、报废等全寿命过程的所有数据进行收集和分析,多元多维度数据构成发动机数据库的大数据来源,包括:
(1)发动机初始数据库。发动机初始数据库主要是发动机设计与制造阶段的数据,包括发动机构型、适航等各类清单和维修手册。涉及到发动机出厂信息、运行参数、使用信息、维修保障信息以及与使用、维修保障过程相关的政策、法规、标准的信息总和。发动机设计公式、资料、文件、规章制度、理论、代码等也都可作为初始数据库的一部分。
(2)发动机运行数据库。发动机运行数据库由发动机运行环境、时限和自身状态信息构成。运行环境包括选择航班航线、飞行时间、天气状况等。发动机自身状态涉及地面启动、起飞、巡航及近各阶段收集数据。采集参数主要包括飞机速度、高度、位置、转子速度、排气温度、气路及油液压力和温度、发动机振动值等。
(3)发动机维修数据库。航空发动机的维修包括航线使用维护、车间修理以及涉及相关维护的设备、航材和维修、管理人员等数据。航线使用维护数据通常是指涉及发动机的原始报文、修理报告、飞行员或机组成员在事件发生时的观察报告、由厂家提供的相关技术支持、孔探和瓷堵等检查数据、航线和定检排故数据、发动机拆换和水洗记录、各项工作工卡签署、有关发动机适航指令、特情维护等。车间修理数据通常是指发动机事后修理构型清单、服务通告SB、适航指令AD、车间排故数据、零部件制造人批准书PMA的相关记录数据、各项修理及进程数据记录、维修大纲、维修成本、排故方案等。维修设备数据主要包括厂房设施、普通工具、专用工具、特殊设备等。维修人力资源数据主要包括维修人员的学历、维修经历、个人技能、培养方案、工作时间、工作内容等。航材数据主要包括航材使用、周转件库存、报废件记录、消耗件记录、返修件修理状态水平、可用件状态等。
(4)其它相关数据库。相关数据库是与发动机有关却还未发现的相关联数据。如不同地区的PM2.5值会对发动机气路产生不同影响。又如发动机尾气数据能在一定程度上反映发动机燃烧室的燃烧情况。
“大数据技术”是指从海量数据中快速提取到有价值信息的技术。大数据处理包括数据采集、数据处理与集成、数据挖掘分析、数据解释和用户呈现等流程[8]。对发动机状态监控与故障诊断进行大数据技术的应用,则需重点关注数据的收集处理和挖掘分析。发动机大数据结构复杂、数据多样,对收集、存储和处理的要求高,Hadoop的分布式文件系统HDFS可以有效的完成工作[9]。数据的挖掘过程则需运用分布式并行化技术,Hadoop的Map Re duce平台可有效完成映射、归约、分类等功能,能对分析系统的期望特征进行表征[10]。
大数据的关键是集合所有的参数,把样本作为整体,将所有参数都作为状态量,而数据的组成也并非有效并行。通过Map Re duce平台可对发动机全部新数据进行转化,成为可识别的状态参数。将状态参数应用于发动机状态监控与故障诊断中,利用大数据科学算法进行深度挖掘,便可构建出发动机正常、故障、缺陷和失效等状态的关系图,并对故障进行判别和预测。如图1所示是发动机状态监控与故障诊断大数据处理系统框图,与传统的方法相比,大数据深度挖掘方法需更大的数据量和更好的科学算法,能对发动机的预测和状态识别更加准确和可靠。
图1发动机状态监控与故障诊断大数据处理系统框图
发动机状态监控与故障诊断大数据挖掘技术的思路是对发动机全状态量数据进行关联性深度挖掘,分别得到发动机正常运行模式所对应的参数指标和发动机故障缺陷时所对应的参数,将得到的数据进行比较,可得出发动机各测量参数相对应的发动机健康状况并作出预测判断。其中大数据挖掘分析方法的重点是各发动机全参数的关联规则、发动机状态量相应关联度及其加权[11]。
3.1 发动机全参数关联规则挖掘
设I={i1,i2,…,im}为所有项目的集合,D为事务数据库。X、Y是I的子集,即X⊆I,Y⊆I且X∩Y=Ø,逻辑蕴含式X→Y就是关联规则。关联规则最重要的指标是支持度sup port(X→Y)=P(X∪Y)和置信度confidence(X→Y)=P(X|Y)。要使关联规则有意义,需确定支持度和置信度的最小量阈值[12]。
发动机全参数关联规则挖掘系统框图如图2所示。发动机维修大数据库则可看作项目数据库I。X1、X2、Y1、Y2则分别为发动机初始数据库、发动机运行数据库、发动机维修数据库、其它相关数据库。其中,关联1-6则为X1、X2、Y1、Y2相互之间的支持度和置信度,空白部分为未发现部分数据库。在对发动机某种故障进行诊断或监控时需确立故障事务数据库D,通过关联规则对X1、X2、Y1、Y2子数据库全参数进行关联性挖掘分析,在给定两个最小阈值量的情况下,可确定异常模式所对应的所有参数,包括不同模式下多参数的组合、各参数的提取和合并、参数权重的细分等结果。
图2 发动机全参数关联规则挖掘系统框图
3.2 发动机状态量关联度分析
前面提到,目前发动机状态监控和故障诊断主要数据来源是发动机测量参数和飞机测量参数,数据较为单一。较少的状态量信息对发动机的健康状况很难反映完全,相关性较小。对航空发动机而言,输入量与输出量可看成一个强非线性的方程组,而发动机大数据概念是将所有的数据看作是全状态量,无输入输出的区别,重点关注发动机各状态参数的关联度。
发动机状态关联度分析是对发动机多元多维度状态量进行关联性分析。通常,协方差矩阵可表征状态量之间的“状态关联度”。设
为发动机的全部状态参数大集合,其中xij代表i状态下第j个状态量的值。矩阵的每一行xi=[xi1,xi2,…,xij](j=1,2,…,n) 代表发动机工作的各种状态向量,其中每一项代表一个参数值,如xi=[n1,n2,EGT,FF,F,T3,…],则发动机的“状态量关联度”可用X的相关系数定义为Ω=corr(X)。
发动机状态监控和故障诊断对信息量的反馈要求较大,而“状态变动关联度”则恰好满足条件。它能反映发动机的运行状况,可对发动机的调控方式进行评估。因此令x0=[x01,x02,…,x0j]为发动机正常工作状态的向量,Δxi=xi-x0为发动机各工作状态改变异常量,则
在某状态下发动机的状态参数变化值为Δxi=[Δn1,Δn2,ΔEGT,ΔFF,ΔF,ΔT3,…],则发动机的“状态变动关联度”可用ΔX的相关系数定义为∑=corr(ΔX)。
3.3 发动机状态量加权分析
发动机状态量加权反应了其重要程度,对构建决策模型影响较大,选择合适的权重系数和必要的模型修正能提高发动机的故障预测能力和诊断精度。权重参数的设定原则如下:
依照维修大纲、风险管理办法、特情维护等对发动机各部件进行重要度分析,并按照重大故障发生率/维修记录统计等情况,对发动机各状态量的重要度进行加权。根据发动机故障排故时间统计、人力资源安排、航班延误率数据等,考虑发动机故障对公司正常运营的影响和严重后果,对发动机及部件故障进行严重度加权。根据已有监控数据和实时监控数据,判断监测方式监测状态量获取程度的准确性和有效性,对监测方式设定成熟度权重系数。
依据维修/运行历史数据和实时数据,对发动机的工作状态进行长期的实时监测和分析管理,通过数学算法和数据挖掘等方式,不断修正权重系数,可高效利用状态参数并进行发动机健康状态的评估。
随着航空业的高速发展,发动机的数据越来越海量化。发动机状态监控与故障诊断要跟随大数据化发展,关键之处在于有更好的大数据挖掘算法,如基于粒度计算的关联挖掘算法[13]和基于云计算平台的并行关联规律挖掘算法[14]。
美国通用电气公司已经开发了predix数据平台,负责接收大约35000台发动机的关键飞行数据包,而相关CFM56数据包飞行参数从280个增至480个,数据采集容量宽度增大。predix根据收集的大数据进行分析并将通知记录单(CNR)反馈给客户。该系统预测异常事件的精准率达到86%[7]。
在我国,国航、南航、东航等大型航空公司目前都有自主或与IT企业合作开发的数据管理分析系统。涉及的方向包括旅客服务、空中管制、飞行状态等各个方面[15-16]。大数据的发展积极推动着整个航空业的发展。
目前,在国内的航空发动机维修市场和研发领域中,大数据挖掘分析技术在发动机状态监控与故障诊断的具体运用都较少,但随着与发动机相关的各项数据的跨越式增长,大数据方法的精准化评估也会越来越多的在发动机状态监控与故障诊断领域得到应用。
本文指出传统状态监控与故障诊断数据量单一的局限性,提出构建航空发动机全参数大数据库,建立大数据挖掘模型,在发动机状态监控与故障诊断领域引入大数据挖掘分析方法,并深入分析发动机大数据之间的相互关系。对大数据技术在发动机状态监控与故障诊断领域进行了展望。大数据关联分析应结合具体数据进行关联和加权,而在发动机状态监控与故障诊断方面的具体应用则有待进一步的研究。
[1] 范作民,孙春林,白杰.航空发动机故障诊断导论[M].北京:科学出版社,2004:1-20.
[2] 赵军,侯宽新,赖安卿.基于径向基神经网络的航空发动机气路故障诊断[J].计算机测量与控制,2016,24(7):76-81.
[3] 王志鹏.基于信息融合技术的故障诊断方法的研究及应用[D].大连:大连理工大学,2001.
[4] 张天宏.民航发动机远程故障诊断技术研究[D].南京:南京航空航天大学,2001.
[5] 郝英.基于智能技术的民航发动机故障诊断和寿命预测研究[D].南京:南京航空航天大学,2006.
[6] 严英杰,盛戈皞,王辉,等.基于高维随机矩阵大数据分析模型的输变电设备关键性能评估方法[J].中国电机工程学报,2016,36(2):435-445.
[7] BRODERICK S.GE力推以结果为导向的大数据分析[J].航空维修与工程,2016(5):74-75.
[8] 刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报(工学版),2014,48 (6):957-972.
[9] DAS T K,KUMAR P M. BIG Data Analytics:A Framework for Unstructured Data Analysis[J].International Journal of Engineering and Technology.International Journal of Engineering & Technology,2013,5(1).
[10] 王秀磊,刘鹏.大数据关键技术[J].中兴通讯技术,2013,19(4):17-21.
[11] 宫宇,吕金壮.大数据挖掘分析在电力设备状态评估中的应用[J].南方电网技术,2014,8(6):74-77.
[12] 元昌安.数据挖掘原理与SPSS Clementine应用宝典[M].北京:电子工业出版社,2009.
[13] 苗苗苗.数据挖掘中海量数据处理算法的研究与实现[D].西安:西安建筑科技大学,2012.
[14] 陈勇.一种基于云计算的大数据关联规律挖掘分析方法[J].无线电工程,2017,47(3):8-11.
[15] CHEN S,HUANG Y,HUANG W.Big Data Analytics on Aviation Social Media The Case of China Southern Airlines on Sina Weibo[C].IEEE Second International Conference on Big Data Computing Service & Applications,2016:152-155.
[16] 王立鑫.航空企业基于大数据技术进行数据分析的研究[C].中国航空学会.探索 创新 交流——第六届中国航空学会青年科技论坛,沈阳,2014:914-917.
[责任编辑、校对:周千]
Abstract:Limited by data collection,the results of engine condition monitoring and fault diagnosis are vague.With the continued development of technology,more and more engine maintenance data,use data,and other relevant data are accumulated,making it possible to further improve the monitoring level and diagnosis precision of engines and to apply big data method in engine condition monitoring and fault diagnosis.This article presents the engine big data consisting of initial database, operated database,maintenance database and other related database,establishes the structure of large data model on the basis of analyzing the multiple dimensional large data sources, puts forward the engine large data association rule mining method,states correlation analysis and weighted analysis,and puts forward the outlook for the future application.
Keywords:aircraft engine;large data mining analysis;condition monitoring;fault diagnosis
ApplicationofBigDataMiningAnalysisinAircraftEngineConditionMonitoringandFaultDiagnosis
KUANGDian,FUYao-ming,FANGLi-Yao
(Aviation Engineering College,Civil Aviation Flight University of China,Guanghan 618307,China)
TP311.13;V263.6
A
1008-9233(2017)05-0042-05
2017-06-19
中国民用航空飞行学院研究生创新项目(X2016-32)
旷典(1990-),男,四川绵竹人,硕士研究生,主要从事航空发动机故障诊断与状态监控研究。