祖月芳,吕永顺
(1.陆军工程大学野战工程学院,江苏 南京 210004 ;2.96761 部队,河南 灵宝 472500)
在故障案例检索后,选择出最佳的相似度故障案例有效解决新问题是装备故障诊断的目标。在检索出的故障案例中,需要对案例从实际应用和理论两个方面进行评判;实际应用方面主要通过案例的引用成功次数确定,理论方面依据不同等级的专家对案例打分进行评判。最后将案例的成功引用次数和专家打分两方面结合起来对检索出来的案例顺序进行优化,以更有效地实现故障的辅助诊断。
故障案例的实用性可以通过在实际使用过程中被成功引用的次数c 来体现。故障案例在使用过程中被成功引用的次数越多,说明案例的质量越高,实用性越强。由于案例被成功引用的次数是客观存在的,在实际解决故障中可以通过统计得到,通过案例被成功引用次数对故障案例的实用性进行量化分析。假设通过语义相似度匹配方法检索出了一组案例X,每个案例被成功引用的案例次数可以表示为C={c_1,c_2,…,c_i,…c_n},则每个故障案例的在实际应用中得分为:
其中,表示第个案例已被成功引用的次数;min{ci}表示在案例X 中被成功引用次数最小的c 值;min{ci}表示案例被成功引用次数最大的c 值;a 是一个超参,它保证了任何情况下分子分母的值均不为零。
专家打分法是对定性的指标进行评价的一种常用方法,它是依据专家经验对某一指标进行量化评价的过程。在装备故障案例库中,通过专家评判可以优化案例权重,提升案例库中的案例质量。但是,专家打分法存在不同等级的专家对故障案例的了解程度、把握程度不一的情况,导致一些专家可能由于人为因素出现打分过高或过低的情况,影响故障案例的真实评价和案例库的有效维护。鉴于这种情况,对故障案例的专家打分权重以不同级别的专家对案例的了解程度、把握程度以及专家个人打分与专家组平均分差为依据,综合考量建立一种使专家个人打分尽可能趋近于专家组平均分的迭代算法,降低个别异常分值对案例实际评分的影响,确保专家评价故障案例的有效性。
(1)专家权威性指标量化分析在装备故障案例的评价过程中,主要依据专家的权威性确定专家打分的权重。专家的权威性主要包括硬指标和软指标两个方面;硬指标主要包括专家等级、学术成果等实际存在的指标,软指标指不同级别的专家对故障案例的了解和把握程度。在评价过程中,本文将软指标和硬指标作为两个关键因素,专家的硬指标越高,对故障案例的了解和把握程度越高,打出的分数越科学合理。设W 为专家打分的合理性权重,则W 与专家的硬指标F 和软指标G 呈线性关系,如式(2)所示。
其中,专家的硬指标F 和软指标G 的取值范围均为[0,1],若专家对故障案例属于跨领域完全不了解,则G 值为0;若同领域非常了解则为1。同理,硬指标F 值的设定方式也如此。另外,为防止两个指标互相影响,设定F 和G 为线性无关变量,如式(3)所示。
由于专家的硬指标F 和软指标G 具有一定的主观性,基于这两个指标进行权威性评价无法客观体现公正性。因此,将专家的权威性评价设定为的指标函数处理。
(2)分值差异分析
专家在打分过程中,主要是进行案例理论层面的打分,评分应综合考虑故障案例的完整性以及故障原因和解决方案的有效性等方面。由于打分存在一定的人为因素影响,容易出现某个专家个人打分与同组专家打分差异性较大的情况,这里采用方差计算方法对分值差异进行量化。假定为n 个装备领域专家对案例的打分数据,方差D 的计算方法如式(4)所示。
其中,E(S)代表同组装备领域专家打分的平均值,是S的数学期望,E(S)的计算方法如式(5)所示。
由式(4)可以看出,D 值的大小与分值差异成正比,分值差异越大,D 值越大,对权重W 的干扰越大。为了降低干扰,将W 和D 进行线性耦合得到式(6)。
(3)综合评分权重
通过式(2)和式(6)可以看出,专家打分的合理性权重W 与专家的硬指标F 和软指标G 以及专家打分的分值差异D 三个指标呈线性关系,共同决定权重W 的取值。因此,可以得到式(7)。
其中k1,k2,k3,为归一化线性相关系数;专家的硬指标F 和软指标G 为固定值用指标函数代替;表示专家对故障案例评价的分值差异。
(1)专家综合评分
在计算综合评分过程中,常用的方法是专家打分与权重乘积的累加,如式(8)。
其中,wi代表专家打分的综合权重,在式(7)中已经可以得出第个专家的评分权重可以表示为:
式(9)中,ci为固定值,是评判专家权威性的线性量化函数;ki表示对几个指标归一化的线性系数;di表示第个专家打分的量化偏差。将式(9)代入式(8),可得式(10)。
通过式(9)可以看出,最终专家的综合评分包括两部分内容,左半部分是所有专家对故障案例评价的认同度基准分值,右半部分是专家对故障案例评价的干扰值。
(2)加权迭代算法
为降低干扰值对故障案例评价的影响,需要对每个专家打分的权重进行调整。从式(9)中可以发现,di值越小,专家对案例评价的一致性认同度越高,当时di=0,可以得到式(11)。
其中,表示没有加权的专家打分平均值;此时,加权平均值与的差值即为所有专家对故障案例评价的一致性认同分值。由此可以得出,专家对故障案例的客观打分可以通过加权均值迭代相减得到,具体算法如图1。当同组专家打分的量化偏差值均为0 时,可以得到最公平有说服力的专家评分值。
图1 加权迭代算法流程图
在故障案例的评判过程中,从实际应用和理论两方面考虑,通过故障案例引用成功的次数和专家评判两个方面分别对故障案例进行了评价。接下来通过对实际应用和理论赋予不同的比例对案例进行综合评判,以进一步优化故障案例的推理顺序。
式(12)中,r1,r2为两个相关系数,且r1+r2=1,表示对实际应用和理论两方面分配的权重,和均采用百分制。
假定通过相似度检索出5 个故障案例,下面以5 个案例的实际应用评分和理论得分情况对故障案例的综合评判方法进行说明。
(1)实际应用得分
如表1 所示,根据故障案例的成功引用次数,依据式(1)计算得到案例的实际应用的得分情况(此时式(1)的超参值)。
表1 故障案例的实际应用情况
抽取一组专家,根据专家实际的软硬指标设定专家的权2 所示。通过迭代算法调节个别专家由于权威性不高对故障案例的理解把握不够导致打分异常的权重,获得大部分专家对项目认同度的分值。
从表2 中可以看出,专家5 的权威性系数只有0.6,在案例1 和案例4 中打分情况明显高于其他专家,因此判定专家5 给出的这两个案例的分数不合理。以故障案例1 的打分为例,通过迭代算法调节权重得到专家5 的权重为0.79,此时,而其他四位专家的平均分为71,相差不大,调节权重后的得到的分值更合理。同理,通过迭代算法计算所有其他专家对每个案例的打分权重如图2 所示。
表2 专家对故障案例的理论打分情况
图2 专家打分权重
最终,通过调整权重后得到专家对5 个案例合理性评分,如表3 所示。
表3 理论得分
(3)综合得分
根据式(12)可知,综合得分由实际应用和理论得分两部分构成,已知两部分的系数,每一部分应该分多大的比重使得综合得分比重更合理,通过实际计算得到给实际应用得分分配比例由0.4 到0.9的综合得分情况,如表4 所示。
表4 综合得分
通过实验可以看出,结合案例被成功引用的次数和不同权威性的专家评判进一步优化案例的推荐顺序,有利于实现故障的辅助诊断。