基于相似体系的民机结构超手册维修案例分析

2022-09-03 02:19:52王峻洲王华伟侯召国
系统工程与电子技术 2022年9期
关键词:民机手册指标体系

王峻洲, 王华伟, 侯召国

(南京航空航天大学民航学院, 江苏 南京 211106)

0 引 言

民机维修是飞机稳定运行的重要保障,是飞机满足持续适航要求的手段,不恰当的维修将影响飞机运行、导致可靠性降低,乃至诱发灾难性事故,为航空业带来巨大损害[1]。据统计,民机维修成本一般占航空公司民机运行总成本的10%~20%[2]。因此,实现更有效率的维修成为航空业和航空公司共同寻求的目标。

民机维修以维修手册为基础[3],但与国外长期投入使用的飞机手册不同,由于国产民机手册完善性不足,超出手册记录范围的案例经常出现,对于这类案例的修理称为民机超手册维修。

民机超手册修理包括结构超手册修理和系统超手册修理,其中结构超手册修理问题更为突出,不仅直接影响飞机的安全性,同时也是影响签派可靠度的重要因素,造成了巨大的经济损失。结构作为飞机设计中的基础环节,对飞机整体运行有着决定性的影响,而结构维修则是民机维修中最重要、最关键的环节[4]。

在分析结构超手册维修案例时,一般情况下,需要对维修案例进行具体分析,重新设计方案并向制造方和运行方征询意见。

为了提高超手册维修案例处理效率,民机案例维修系统成为了研究的重点。空客与波音已将民机全周期安全管理系统投入使用,其中包括维修管理系统[5-6]。国产民机运行初期,手册也在逐步成熟过程中,提升超手册修理效率,促进民机修理手册成熟,意义更为重大。国内的研究稳步进行中,蔡鹏、闫伟等从不同角度出发提出了维修管理系统的思想[7-8]。刘树乾基于浏览器/服务器(browser/server, B/S)模式设计飞机维修管理系统,实现了对飞机故障的记录、维修和相关文件的管理[9]。冯蕴雯从平台构建的可行性与功能上设计出基于B/S的民用飞机结构修理方案平台[10],而这些系统平台实现的前提是建立合理的民机维修指标体系。

在过去20年内,机器学习的概念已经广泛用于案例分类与案例匹配[11],如使用支持向量机[12](support vector machine, SVM)进行故障案例的匹配计算,基于最大熵算法[13]、神经网络[14]以及聚类算法[15]对案例匹配和分类,利用规则算法[16]对案例进行标题搜寻,从朴素贝叶斯(naive Bayes, NB)方法[17]出发结合案例语义进行分类或从案例文本的频率(document frequent, DF)、信息增益(information gain, IG)、互信息(mutual information,MI)等[18]多维方法出发实现案例的匹配等,这样的数据库方法都离不开对飞机本身属性的分析。

传统的案例匹配方法都是从案例特征属性出发,在不考虑维修方案与指标工程意义的基础上,实现案例之间的匹配关系。本文提出一种新思路,利用现有记录中的手册内容以及超手册维修案例,建立民机结构维修数据库,选取指标特征并用数据形式描述维修案例的特征,研究信息指标间的相似度,用两个案例指标的相似度代替单个指标的属性,建立案例相似度指标体系,确定体系特征指标的权重分配,从而实现维修案例的相似度匹配与体系性能分析。

1 案例相似度指标体系

1.1 案例损伤信息指标选取

在研究指标体系之前,首先要筛选指标作为分析对象。一份飞机维修案例内容包括损伤信息与维修信息两部分。首先需要从损伤信息中提取重要特征作为建立民机结构超手册维修案例相似体系的指标。一份飞机维修案例可提取的信息如表1所示。

表1 维修案例损伤信息Table 1 Damage information of maintenance cases

损伤信息指标的选取需要满足代表性与独立性两方面,代表性表现为指标能鲜明地表现出维修案例的特点,独立性表现为指标间相互独立,不相互影响。考虑到在损伤信息中存在一些相互关联的属性,本文将关联指标归为一类,保证大类指标间相互独立。

根据损伤信息提取过程,可以发现,损伤信息复杂多样,数字、文字描述以及选择判断都存在其中。并非所有信息都对维修方案有着显著影响,需要选择合理、有代表性的信息作为指标。通过对维修方案统计分析,得出的指标如表2所示。

表2 指标列表Table 2 List of indicators

1.2 案例维修方案信息处理

维修方案是一种复杂的文本信息,相对其他单一形式的指标,维修方案文本长度长,难以归纳且主观性强,在不同编写过程中一种语义可能出现多种表达方式。

维修方案独立于损伤信息指标,作为所有指标综合处理后的输出结果,维修方案的相似度对模型的映射关系有着十分重要的意义。在对维修方案信息进行处理时,首先对文本的冗余信息进行剔除,一些不能体现文本区分度的词句、段落都不应该进行计算,如装配工艺、紧固件等步骤都可忽略;材料和检查方法对应维修方案中使用的维修材料和检测方法单独处理。其次,对文本进行简短化,对每一个筛选处理后的案例进行专有用词的总结,使其达到高度概括性与计算可行性的统一。最后进行文本确认,确保处理后的维修方案信息的词句在应用的专业词典之中,符合进一步的分析要求。

1.3 损伤信息指标相似度分析

在提取损伤信息与维修方案信息后,需要对损伤信息指标与维修方案进行相似度分析,并将损伤信息相似度作为案例相似度指标体系的输入基本元素,维修方案相似度作为案例相似度指标体系的输出基本元素。考虑到指标的独特性与联动性,本文使用对应的相似度度量方法如表3所示。

表3 特征指标相似度计算方法选取Table 3 Selection of calculation methods for similarity of characteristic indexes

1.3.1 飞机机型相似度

飞机属性分类如图1所示[19-20],4种属性对应4种相似度因子,通过如图2所示的属性度量法[18]进行相似度计算。

建立决策矩阵后计算设计相似度因子:

(1)

式中:α,β为不同机型的决策矩阵展平后得到的一维向量。

计算几何、重量、性能相似度时将不同单位的数据进行归一化后按列写出特征向量:

(2)

式中:xi和yi表示两个不同机型列向量的第i个元素,simj为几何相似度因子;simz为重量相似度因子;simx为性能相似度因子;Dj为几何相关度因子的相似度距离;Dz为重量相似度因子的相似度距离;Dx为性能相似度因子的相似度距离。

飞机机型相似度计算公式为

sim=αssims+αjsimj+αzsimz+αxsimx

(3)

式中:αs,αj,αz,αx为各相似度因子影响系数。

1.3.2 飞行循环相似度

飞行循环指标为单个数字形式,将飞行循环分为如表4所示的4个阶段。对运行阶段进行相似判定,如果案例的飞行循环在相同运行阶段,相似度计算[21]公式为

(4)

式中:S为飞行循环相似度;i和j为运行阶段下界和上界;m和n为两个案例中飞行循环具体数值。

表4 飞行循环与运行阶段Table 4 Flight cycle and operation phase

如果案例中的飞行循环在不同阶段,且飞行循环阶段相邻,相似度计算公式为

(5)

式中:i1,j1为m所在阶段的下界与上界;i2,j2为n所在阶段的下界与上界。如果案例中的飞行循环在不同阶段,且飞行循环不在相邻阶段,相似度计算公式为

S=0

(6)

1.3.3 手册信息相似度

对章节号体系相似度分析:

(7)

式中:α1表示章节号与部位的相关系数;α2表示部位与部件编号的相关系数;S1为章节号相似度;S2为部位相似度。

在计算章节号与部位相似度时,使用布尔赋值运算。零件相似度计算公式为

(8)

式中:p为文字布尔赋值;q为数字布尔赋值。

根据关系系数以及每个部分的相似度计算:

(9)

式中:Sk为手册信息相似度;k1,k2,k3为各层指标影响系数。

1.3.4 损伤结构相似度

损伤结构采用布尔值表示相似度,即当损伤结构一致时,相似度计为1,否则计为0。

1.3.5 损伤类型体系相似度

在损伤类型相似度计算中将再次使用图3中的属性度量方法,对损伤类型属性进行分析。构造属性矩阵,构造所使用属性如表5所示。根据损伤成因、损伤数量、损伤尺寸维度构造属性矩阵,对于属性矩阵展平后的一维向量按照式(1)计算,作为损伤类型体系相似度。

表5 损伤类型属性Table 5 Damage type attribute

1.3.6 其他信息相似度

材料的复杂性增加了对其属性分析的难度,每一种材料对应其维修方案中所使用的材料,使用布尔赋值法。而损伤方法分为一般目视、详细目视和无损检测,使用布尔赋值进行相似度运算。

1.4 维修方案相似度分析

维修方案信息的相似度分析本质上是文本相似度的分析,文本相似度分析的主要出发点分为词型[22]、词频[23]、词义[24]。本文以余弦相似度为基础,利用文本总体制造语料库,从词频的角度出发,使用术语频率-逆DF(term frequency-inverse DF, TF-IDF)方法建立模型[25],进行文本相似度分析。

TF-IDF权重计算法基于频率统计的原则,具有高效的线性复杂度,适用于系统文本库中文本数量较大的情况。TF-IDF的核心思想在于人为地减小高频率词语的重要度,增加低频词语的重要度。

TF-IDF实际上是TF与IDF的乘积,TF在文本中代表词频,一个词出现的频率越高,在文本中就更加具有区分度。DF代表文本频率,即文本中某个特征出现的次数,IDF是反比文档频率,IDF越大,说明该特征越集中分布,更具有区分意义。IDF计算公式为

(10)

式中:L由实验确定;N为总文本数;n为N中出现特征t的文本数。

案例维修方案文本预处理完成后去除民航领域停用词,分词[26]并使用dictionary方法获取词袋,使用doc2bow制作语料库,最后使用TF-IDF方法对语料库建模,计算结构维修案例文本相似度,其步骤如图3所示。

1.5 案例相似度指标体系建立

利用从飞机结构维修案例中提取损伤信息指标相似度以及维修方案相似度,建立案例相似度指标体系,如图4所示。每个信息块代表相似度信息,通过已知的损伤信息相似度以及维修案例相似度分析信息处理过程。

在传统的案例匹配指标体系中,大多数使用平行逻辑指标结构,如图5所示。指标相同特征值计为1,指标不同则计为0,且指标之间视作不具有关联性,每个指标独立对维修方案产生影响。

与传统案例匹配指标体系不同的是,案例相似度指标体系反映了指标间的相互联系,侧重于寻找案例与案例之间的关系,将案例间特定特征的相似度而非特征值作为研究对象,并进一步分析每个指标的相似度。对于不同属性特征指标的相似度分析,单一地使用布尔赋值法是无法体现指标的工程意义,需要选择特定的相似度计算方法来分析特定的指标。下一步将进行对两种体系的权重分配与模型分析对比,并通过实例来验证案例相似度指标体系的匹配性能。

2 案例相似度指标体系分析

2.1 案例相似度指标体系权重分配

在已经建立的体系中,在信息处理集成方案过程中需要赋予特征指标权重,但在实际应用中,指标之间存在关联性、影响性。将所有指标分为两种:第一种为自变量指标,不论其他指标的系数怎么变化都无法影响对自身的计算;第二种指标为关系变量指标,其他的一个或多个指标的变化会对其相似度计算造成影响,这种影响的程度用关系系数α表示。在已知所有指标相似度的情况下,维修方案相似度计算公式为

(11)

式中:ωi为自变量权重;simi为自变量相似度;ωp为关系变量权重;simp为关系变量相似度;αp为关系系数;simt为维修方案相似度。

对于传统案例指标体系,指标之间没有相关性,指标体系建立下总相似度的计算公式为

(12)

而对于案例相似度指标体系,在指标相似度分析过程中,已经通过层次法将所有关系变量指标转化为自变量指标,在完整的指标体系建立下总相似度的计算公式与式(12)一致。在案例信息提取的基础上,simt及其对应simi已知,需要确定方法来获得权重系数ωi。

在权重分配过程中,为形成全面的模型对比,对于案例相似度指标体系与传统案例指标体系,同时采取先分类后回归[27]的方法确定权重分配,如图6所示,下一步进行实例性能分析。

2.2 实例性能分析

选取航空公司提供的A、B、C 3种国内外民机结构维修案例共300例作为研究对象。提取损伤信息与维修方案后进行相似度分析,建立案例相似度指标体系并进行权重分配计算,接着使用传统案例指标体系进行权重分配,指标的权重分配结果如图7和图8所示。

在案例相似度指标体系中,机型、飞行循环、手册信息以及损伤类型占比分布平滑,而在传统案例指标体系中出现了飞行循环指标权重极低,损伤发现方法指标权重过高的不合理情况,损伤结构的权重在两种指标体系中均较低。

在使用SVM算法对相似度数据集进行分类[28-29]的过程中,两种指标体系计算精度如表6、图9和图10所示,准确率是所有类别预测正确的比重,精确率是正确预测为正的占全部预测为正的比例,接受者操作特性(receiver operating characteristic, ROC)曲线下与坐标轴围成的面积(area under curve, AUC)代表分类器的分类性能。根据表6的准确率与精确率结果,相似指标模型的预测准确性略高于传统案例指标模型;根据表6以及图9、图10,案例相似度指标模型的分类性能达到了89%,相比于传统案例模型提高了27%,在第一步案例相似度数据分类中相似指标模型有更优秀的性能。

表6 模型分类性能评估Table 6 Model classification performance evaluation

两种指标体系在分类后进行弹性网络回归[30]计算,结果如表7所示,准确率为测试集中符合权重分配的占比,精确率为验证集中符合权重分配的占比,可决系数反映模型进行弹性回归后的可靠度,平均绝对误差(mean absolute error, MAE)、均方误差(mean squared error, MSE)、均方根误差(root mean squard error, MSRE)为3种不同的误差度量尺度[31]。

表7 模型回归性能评估Table 7 Model regression performance evaluation

传统案例指标体系在回归计算中的表现较差,精确率和准确率在50%左右,而案例相似度指标体系达到75%以上,并且其可靠度达到82.3%,相比传统案例指标体系提高了6%,3项误差度量数值总体也更低。

传统案例指标体系由于其指标特征值为二进制的特性,无法精确确定权重,而案例相似度指标体系却在这方面有着较高的准确率,在继承了高区分度的基础上,案例相似度指标体系进一步细化了每种特征指标的数值,更精确地计算出权重系数。除此以外,传统案例指标体系忽略了指标的工程特征,仅从数学的角度诠释体系。而案例相似度指标体系在一定程度上考虑了指标的工程特性,将工程属性体现在数值之中,充分利用数据,实现了分类与回归的结合,在保证一定准确率的基础上可靠地完成了指标权重计算。

3 案例相似度匹配应用分析

当一个新的民机结构超手册维修案例出现时,使用案例相似度指标体系确定权重后,便可对新案例进行匹配分析,并得到一个按照相似度排布的案例序列,给出最相近案例的相似度以及维修方案,从而为民机结构超手册维修案例提供一定参考。

为确定指标体系的匹配性能,从案例库中选取几组特殊的案例组对案例相似度指标体系以及传统案例指标体系进行应用分析,对比两种体系的应用特点与准确度。共设立4组对比案例组:1号案例组主要对比不同损伤结构在指标体系计算下的相似度;2号案例组主要对比不同飞行循环在指标体系计算下的相似度;3号案例组主要对比不同损伤类型在指标体系计算下的相似度;4号案例组主要对比在损伤信息发现方法外其他指标都不相同的情况下案例的参考性。表8~表11提取了代表性的案例组指标信息。表12为案例相似度匹配分析的结果。

表8 1号案例组损伤信息Table 8 Damage information of case group 1

表9 2号案例组损伤信息Table 9 Damage information of case group 2

表10 3号案例组损伤信息Table 10 Damage information of case group 3

表11 4号案例组损伤信息Table 11 Damage information of case group 4

表12 案例组相似度Table 12 Case group similarity

从总体上讲,案例相似度指标体系对于飞行循环的区分效果较差,这与飞行循环对损伤类型的影响有关,在低飞行循环值下,出现的损伤多为偶然损伤,而在高飞行循环值下,出现的损伤多为疲劳损伤,没有考虑这一关系,是案例相似度指标体系的一个缺陷。对于其他的特征指标,案例相似度指标体系的匹配则更加符合实际维修方案,更具有工程性。而在无指标相同的维修方案相似度匹配上,案例相似度指标体系的参考性度量更加合理。

4 结 论

本文以航空公司维修案例数据库为基础,从民机结构维修案例中提取信息进行相似度分析后,建立案例相似度指标体系,在进行权重分配后用实例进行了性能分析与匹配应用分析,结论如下。

(1) 案例相似度指标体系分类回归的性能优于传统案例指标体系,并在保证可靠性的前提下从方法上体现出特征的工程意义。这验证了案例相似度指标体系的可靠性。

(2) 通过案例相似度指标体系进行案例匹配,实现了飞机结构超手册维修案例的相似度排序,相似度高的案例为维修方案决策提供参考。

(3) 案例相似度指标体系对飞行循环的区分性存在误差,但区分其他指标的性能均接近真实案例的情况,并且对于大部分指标都不相同的案例组,案例相似度指标体系实现了更有效的损伤信息利用。在保证可靠度的基础上进一步符合工程实际。

未来的相似度指标体系模型将进一步实现指标间关联性的优化,并考虑加入一些自适应功能,从而更好地实现民机结构超手册维修案例的相似度匹配。

猜你喜欢
民机手册指标体系
基于Stateflow的民机液压控制逻辑仿真与验证
未来民机座舱显示控制系统初探
电子测试(2018年18期)2018-11-14 02:30:20
民机复合材料的适航鉴定
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
美食修炼手册
民机研制风险管理浅析
测土配方施肥指标体系建立中‘3414
土地评价指标体系研究
School Admission择校