基于分层式证据推理的信息融合故障诊断方法

2020-09-05 04:50徐晓滨叶梓发徐晓健侯平智王琪冰茹晓英
控制理论与应用 2020年8期
关键词:参考值信度证据

徐晓滨 ,叶梓发,徐晓健† ,侯平智,2,王琪冰,茹晓英

(1.杭州电子科技大学自动化学院,浙江杭州 310018;2.杭州言实科技有限公司,浙江杭州 310018;3.森赫电梯股份有限公司,浙江湖州 313013)

1 引言

在工业生产中,如何提高设备运行的安全性和可靠性是一个至关重要的问题.采用多传感系统对关键设备进行状态监测,并对所获故障特征信息进行综合分析,进而研发在线故障检测与诊断新技术,是保证设备安全高效运行的重要途径.通常来说,同一种故障特征的变化可由不同种类的故障所引起,反之,同一种故障变化可以在多种故障特征上得以反映[1].所以需要将多个信息源(传感源)提供的特征信息进行综合,从而得到比任何一个单一信息源更为可靠和准确的故障诊断结果.但是,同时需要考虑监测环境噪声、传感器自身性能差异和安装调试等因素,会使得所获故障特征信号表现出随机性、非平稳、不完备等不确定性,从而对综合诊断结果的准确性造成影响.

多源信息融合技术非常契合解决上述信息综合处理中的不确定性问题,它能够将不同时间域、不同空间域、各种途径获得多类不确定性信息,在数据层、特征层和决策层上进行综合处理利用,以至得到一个更准确、更客观的故障决策结果[1-3].本质上,故障诊断可以看作是多源不确定信息融合中的模式分类决策问题.由此可见,故障决策问题中的各种不确定性,都可以通过信息融合范畴内的各种理论或方法进行解析,并推理得到故障模式分类结果.信息融合的方法一般包含贝叶斯理论、Dempster-Shafer(DS)证据理论,以及神经网络、模糊集理论和专家系统等人工智能领域内的方法[4-6].其中,基于DS证据理论的“决策级”融合方法,利用Dempster组合规则将各种故障特征提供的“诊断证据(特征支持各个故障发生的一个信度分布函数)”进行综合处理,通过“证据的融合”实现了对不同诊断证据获取方法的综合.因而DS证据理论可以提供综合性的策略解决多源不确定环境下的故障诊断问题,并且在机械、化工、电子等高端装备的状态监测与故障诊断中得到了较为广泛的应用[3,7-8].

在证据理论框架下,新近被提出的证据推理(evidence reasoning,ER)规则是对传统Dempster组合规则的扩展[9-10],它明确区分了证据重要性和可靠性的概念[11].证据重要性权重反映证据与其他证据融合时的相对重要性;可靠性因子反映了单一特征及其证据给出正确分类结果的能力.Dempster规则将可靠性折扣后的剩余信度分配给辨识框架本身,而ER规则将剩余信度分配给辨识框架的幂集,这确保了证据的特异性没有发生改变,从而实现了一个广义的概率推理过程.最近,一些研究人员将ER规则应用于故障诊断中,文献[12]给出了一种基于ER规则的故障诊断方法.它使用故障特征训练样本区间投点和似然函数归一化的方法[13],求取各信息源的参考证据矩阵(reference evidence matrix,REM)和测试样本的诊断证据;从传感器误差以及故障特征对各故障模式辨别能力的差异出发,给出获取诊断证据可靠性因子的方法;给出双目标优化模型训练得到诊断证据的重要性权重,最后利用ER融合规则融合经可靠性因子和重要性权重修正后的诊断证据,利用融合结果进行故障决策,并通过旋转机械故障诊断实例说明所提方法的有效性[12].

为了提升ER融合模型解决故障诊断与决策问题的适应性与精确性,本文在前人研究的基础上进一步考虑以下问题:1)诊断证据的精细化获取问题:文献[12]中区间型的REM对于特征信息描述较为粗略,导致从故障特征中获取的诊断证据不够准确;2)在线诊断时可用信息量受限问题:由于故障的变化是个连续的过程,每次诊断一般要在传感器采样周期内完成,所以用于诊断的故障特征信息只能来自于该采样周期,所以信息量有限,从而较难反映故障状态在连续采样周期内的动态变化.在此情况下,若能加入与当前特征相似的历史特征样本充实诊断信息,则有望提升融合诊断的精准性.

为了解决以上两个问题,本文提出分层式ER模型来增进信息融合故障诊断的精准度.具体的,在证据获取步骤中,给出故障特征参考值投点方法,按比例求取训练样本点对相邻参考值的相似度,并构建点值型REM,它能更加精细化地描述诊断信息,从而有效提升所获诊断证据的精准度;在证据融合步骤中,设计分层式ER融合模型.第1层融合中利用k-NN算法找到在线测试特征样本的近邻历史样本(无标签),然后实现在线测试样本与近邻历史样本对应证据的融合.在第2层融合中,将多个特征源(传感源)提供的第一层融合结果进行再次融合,并根据两层融合所获证据进行故障决策.在双层融合模型中,根据证据之间的欧氏距离构造目标函数及相应的重要性权重优化方法.最后,通过与文献[12]中单层ER模型诊断结果的比较,说明了所提新方法通过提升诊断证据的精确性、利用历史样本增加诊断的信息量等策略,能够有效提升故障诊断(识别)的精准度.

2 证据推理(ER)规则

定义辨识框架Θ={D1,D2,···,DN},其中的D是需要研究的命题,且各个命题之间是两两互斥的,在故障诊断问题中,D即表示不同的故障模式.Θ的幂集记为P(Θ)或2Θ.ER规则中,从信息源中获取的证据被表示为

其中数对(θ,pθ,j)表示证据ej支持θ的信度为pθ,j,命题θ可取幂集P(Θ)中的任一元素,也就是辨识框架Θ中的任意一个元素(命题)或者元素组成的任何子集.

ER规则中,定义了证据ej的可靠性因子rj和重要性权重wj.其中rj表示证据ej的信息源能够对给定元素或元素子集提供精确信度评估的能力,wj定义了ej相较于其它证据的相对重要性,它取决于什么样的证据参与融合、由谁来使用这些证据以及证据使用的具体场合,信息源的不同决定了各自证据的重要性权重也不同.由此可知rj和wj的物理意义完全不同,前者单纯依赖于信息源的固有可靠性,而后者需要根据参与融合的信息源的不同来确定,带有主观性.

带有可靠性因子rj和重要性权重wj的证据定义如下[11]:

ER规则中定义了可靠性因子折扣后的剩余信度(1-rj),其表示了证据的不可靠程度,并将它赋予幂集P(Θ),即该信度可能支持全集Θ及其任何子集.这种做法保证了ej和mj具有相同的概率特性,也就是对于各个θ的信度赋值的相对比率是不变的,没有改变信度分布的相对比率结构.

对于两个信息源提供的相互独立的证据e1和e2,利用ER融合规则对它们进行融合,得到e1和e2联合支持命题θ的信度函数pθ,e(2)

由上文可知,ER规则首先在证据中引入可靠性因子rj和重要性权重wj,从而得到了含有可靠性和重要性权重的信度分布函数,接着将两个独立的信度分布函数利用ER规则进行融合,从而获得两个独立证据联合支持辨识框架中某个命题的程度.

对于n个信息源提供的n组相互独立的证据{e1,e2,···,en},则可将式(4b)扩展为多证据的ER融合形式,获得融合后的证据为

式(6a)中mθ,e(j-1)与mP(Θ),e(j-1)(j=1,2,···,n)分别由式(6b)-(6c)得出:

式(6b)中mj表示第j个待融合的证据,可由式(2)计算得到.融合迭代计算过程中存在

3 基于ER规则的分层式诊断证据融合与故障决策

在第2节ER融合规则的基础上,本节为了解决诊断证据的精细化获取问题和在线诊断时可用信息量受限问题,进一步研究了点值型参考证据矩阵获取方法,这是获取在线测试样本对应证据的基础,然后给出了在线样本和近邻样本证据的融合方法.具体内容在以下小节中给予详细介绍.

3.1 点值型参考证据矩阵(REM)的构造方法

设故障集合Θ={D1,···,Dn,···,DN},Dn代表故障集合Θ中的第n个故障,n=1,2,···,N,N为故障模式的个数.设fi是能够反映故障集合Θ中每个故障Di的故障特征变量,该特征变量的取值由相应传感器测量范围决定.

设训练样本数据集

其中:TS≤T,TS为训练样本集个数,T为样本总数,Sfi是fi的值域,M为故障特征变量总数,其中Y 是对应于特征变量fi的故障模式.这里需要构建样本对(fi,Y)的投点统计表,将特征变量fi和故障模式Y 之间的映射关系转变成fi的参考值集合,···,Ji}与Y 的参考值集合Θ={Dn|n=1,···,N}之间的对应关系,Ji为fi的参考值个数.对于一个特征变量fi,它关于参考值Ai的相似度分布为[14]

αi,j表示输入值fi(t)匹配参考值的相似度.

将训练样本集S中的所有样本经由上述方法进行投点统计,表1中给出了反映特征变量参考值和故障模式之间关系的投点统计表,其中an,j表示特征变量fi(t)匹配并且故障模式Y(t)为Dn的所有样本对(fi(t),Y(t))的相似度之和;表示所有故障模式为Dn的样本对的相似度之和;表示所有fi(t)匹配的样本对的相似度之和,显然有

表1 样本对(fi(t),Y(t))对参考值投点的统计表Table 1 Casting matrix of sample pair(fi(t),Y(t))for the reference values

从表1中的每一行可得当Y 取值为Dn时,fi取值为的似然函数cn,j如下:

接着对似然函数cn,j进行归一化,可以生成参考值所对应的关于D1,D2,···,DN的证据(表2),那么fi(t)取时,Y(t)为Dn的信度为

表2 特征变量fi的点值型参考证据矩阵(REM)Table 2 The reference evidence matrix(REM)with the form of point values of input fi

3.2 基于k-近邻的历史样本扩充方法

k-近邻(k-nearest neighbor,k-NN)算法是一种常用的机器学习算法[15-16],其基本思路是:一个样本的属性由该样本在特征空间中K个最邻近样本所决定,通过某种距离度量(例如欧氏距离)找出特征空间中与其最邻近的K个样本,然后基于这K个最近邻样本信息来进行决策.在本文的分层式ER模型中,可以利用k-NN算法从训练集S中获取与在线样本相似的历史样本参与融合推理过程.

对于多输入特征变量下的故障诊断模型,各特征变量由于物理意义或信号采集方法等方面存在差异,通常具有不同的量纲和数量级.如果某一个特征变量的值域范围非常大,那么k-NN算法在进行距离度量时就主要取决于这个特征,从而可能得到与实际情况不相符的近邻检测结果.因此,为了确保各个信息源提供的故障分类信息都能充分发挥各自的作用,在使用k-NN算法确定近邻历史样本之前,需要对原始特征变量数据进行标准化(归一化)处理.

数据的标准化是将各特征变量数据按比例缩放,消除不同单位和量纲对数据的影响,便于不同单位或量级的指标能够进行相互比较.这里运用最为常用的min-max标准化方法,具体为

其中t ∈{1,2,···,Ts}.

对原始数据进行标准化之后,接下来就可通过k-NN算法获取在线样本的K个近邻历史样本.若将当前的在线样本记为F′(t)=[f1(t)f2(t)··· fM(t)],则可求得它与历史样本F(τ)=[f1(τ)f2(τ)···fM(τ)]的欧氏距离为

其中τ=1,···,TS,将计算出的dτ按照从小到大的顺序进行排列,从中选出距离最小的K个历史样本,记为|k=1,2,···,K},显然K取值越大,在第1层融合中的计算量就越大.

3.3 基于REM的在线测试样本证据获取以及分层式融合

由第3.2节的k-NN算法从训练样本集中获得了在线样本的K个近邻历史样本,接下来获取在线样本和K个近邻历史样本的证据.对于某信息源提供的特征样本fi(t)(在线样本或历史样本),它的取值必然属于某个特定的参考值区间,因此它必定激活表2(REM)中的两条相邻证据,那么,fi(t)激活的证据ei可以表示为的加权和:

其中pn,i表示在线或历史样本对于故障模式Dn的支持信度.

对于某个包含M个特征的在线样本

然后,将M个特征变量的第1层融合结果e1(K+1),e2(K+1),···,eM(K+1)进行第2层融合,获得最终的融合结果(具体过程见图1).

基于上式的故障决策规则如下:最终融合结果中最大信度所指向的故障模式即为在线获取的测试样本对应的故障模式[1].

因为可靠性较高的证据理应具有相对较高的证据权重,所以设定当前测试样本证据以及近邻历史样本证据的初始重要性权重w等于该证据对应的可靠性因子r.下一节将对证据的可靠性因子的计算方法和证据重要性权重等参数的优化方法进行详细介绍.图1中wi为第i个特征变量的重要性权重,用于第2层融合;依次为第i个特征变量第一层融合时,在线测试样本和K个历史样本的重要性权重.

图1 分层式ER融合示意图Fig.1 The diagram of fusion model based on hierarchical ER

4 分层式ER融合模型中证据可靠性和重要性参数的计算方法

4.1 基于特征变量变化区间的证据可靠性因子获取方法

其中Vi表示能够直接根据特征变量fi判断为某个故障模式的样本数量,Vi越大,那么特征变量fi越可靠.进一步的由式(16)可知,可以通过与最可靠特征变量相比较而得到其余特征变量的可靠性.图2中给出了一个例子进行说明,表示了当故障模式个数为3时,如何得到特征变量的可靠性,其中Ln和Rn分别为故障模式Dn(n=1,2,3)下,特征变量f的最小值和最大值.从图中可以得到特征变量能够独立诊断出各故障模式的样本数量分别为v1,v2,v3,则有V=v1+v2+v3,而剩余的o1+o2个样本处于重叠区间,由于支持两种故障模式的发生,所以是含有不确定性的样本.

显然,dk越小则相应的历史样本证据的相对可靠性越大,亦即与距离越近,则可靠性越高.例如,这里若设定d1≤d2≤d3,则.

图2 特征变量f的样本分布Fig.2 The distribution of samples for the feature variable f

4.2 基于遗传算法的参数优化模型与诊断结果评价

仅靠初始参数建模的分层ER模型不能准确地给出特征变量fi和故障模式Y 之间的复杂关系,所以需要利用训练样本集合S对这些参数进行进一步的优化调整,从而达到著提升融合模型精度的目的.因此,以误差最小化为目标函数构建参数优化模型

其中:ξ(P)表示目标函数,

(即式(15)中的信度向量)和参考信度向量φ(t)之间的距离(一般取欧氏距离即可).参考信度向量φ(t)指的是将绝对信度分配给特征向量f(t)指向的实际故障模式Dn.例如,如果f(t)的实际故障模式为D3,那么相应的参考信度向量为φ(t)=(0,0,1,0,···,0).

本文引入遗传算法(genetic algorithm,GA)作为优化引擎,按照适者生存和优胜劣汰准则,对初始种群逐代演化产生出更优的近似解.在每一代,根据待优化的参数集合中个体的适应度值大小选择个体,并借助于自然遗传学的遗传算子进行组合交叉和变异操作,产生出代表新的解集的种群[18].随着种群的迭代优化,参数集P也在不断地变化,表2所示的参考证据矩阵中的信度也将逐步达到最优.

通过以上优化模型获得的故障诊断结果,可以构造出如下所示的混淆矩阵,其中定义第n个故障模式的确诊率如下:

表3中,Ml,s(l,s=1,···,N)表示真实故障模式为Dl而诊断结果为Ds的样本数量,其中混淆矩阵对角线上的元素表示各故障模式被正确诊断的样本个数.

表3 分层式ER模型诊断结果的混淆矩阵Table 3 The confusion matrix for diagnosis results of hierarchical ER model

5 在电机转子故障诊断中的实验验证

5.1 电机转子的故障设置

本文以电机转子故障诊断为例,验证分层式ER融合模型的有效性.实验设备为ZHS-2型多功能柔性转子试验台,将振动位移传感器和加速度传感器分别安置在转子支撑座的水平和垂直方向采集转子振动加速度信号.经HG-8902采集模块将信号传输至计算机,然后利用Labview环境下的HG-8902数据分析软件得到转子振动加速度频谱以及时域振动位移平均幅值作为故障特征信号[1,3].

实验中设置了4种典型故障模式:正常运行D1,转子不平衡D2,转子不对中D3,基座松动D4.通过对大量实验数据的分析可知,引发异常振动的故障源都会产生一定频率成分的振动幅值增加或减少[1].因此,这里选取1X~3X倍频以及时域振动位移平均幅值作为故障特征变量.设定转子转速为1500 r/m,则基频1X为25 Hz,n倍频nX(n=1,2,3)为(n×25)Hz.这里,将频域的1X~3X的振动幅值以及时域振动位移作为特征变量f1-f4进行综合做出决策.

5.2 构造特征变量的参考证据矩阵

首先可确定本实验中的故障辨识框架为Θ={D1,D2,D3,D4}.对于1X,2X,3X的幅值和时域振动位移平均幅值这4个特征变量,分别在4种典型故障模式下,以时间间隔Δt=16 s连续采集δ=800次测量值,即可获取3200个测量样本.从每种故障模式的800组样本中随机选取500组构建训练样本

剩余1200组样本作为测试集.

根据经验,设故障特征变量f1初始参考值为

f2的参考值为

f3的参考值为

f4的参考值为

然后根据第3.1节的信息转换技术和似然函数归一化方法可获得这些样本的投点统计表和点值型参考证据矩阵.可根据第4.1节提供的可靠性评估方法计算每个特征变量证据的可靠性因子,分别为r1=0.9591,r2=0.7519,r3=1,r4=0.8464.相应的证据重要性权重wi(i=1,···,4)的初始值被设定.

对于训练样本集S中任意一组样本,可以利用分层式ER融合模型辨识出它对应的故障模式.再根据第4.2节所提的目标函数和训练样本,获取最优参数集合P.对于测试样本集中的任意一组样本,可利用训练后的分层ER融合模型判断它的故障模式.表4-11列出了基于最优参数集构造的投点统计表和点值型参考证据矩阵.

表12列出了训练后两层融合中各个证据的最优重要性权重(与图2中的标识符号对应).

表4 最优参考值下故障特征变量1X的投点统计表Table 4 The casting result of the fault feature variable 1X under the optimal reference value

表5 最优参考值下故障特征变量2X的投点统计表Table 5 The casting result of the fault feature variable 2X under the optimal reference value

表6 最优参考值下故障特征变量3X的投点统计表Table 6 The casting result of the fault feature variable 3X under the optimal reference value

表7 最优参考值下时域振动位移平均幅值的投点统计表Table 7 The casting result of the fault feature variable“displacement”under the optimal reference value

表8 故障特征1X的点值型参考证据矩阵Table 8 The REM with the form of point values of fault feature 1X

表9 故障特征2X的点值型参考证据矩阵Table 9 The REM with the form of point values of fault feature 2X

5.3 典型测试样本的融合推理流 程展示与结果分析

在获取最优的点值型REM之后,接下来可利用1200组测试样本对构造的分层式ER融合模型进行诊断测试,这里给出了两种典型的测试样本情况,对融合模型的计算过程及优点进行详细阐述.

情况1在线测试样本与近邻历史样本指向的实际故障模式不完全一致.

给定测试样本[0.1792 0.1693 0.1834 4.3620](实际故障模式为D3).根据表8-11可知,它的特征变量f1=0.1792以相似度α1,6=0.9811和α1,7=0.0189分别激活了;f2=0.1693以相似度α2,4=0.4308和α2,5=0.5692分别激活了;f3=0.1834以相似度α3,4=0.3323和α3,5=0.6677分别激活了;f4=4.3620以相似度α4,4=0.6179和α4,5=0.3821分别激活了.根据式(12)按照相似度对相应的参考证据进行加权后获得该测试样本证据,如表13中所示.

表10 故障特征3X的点值型参考证据矩阵Table 10 The REM with the form of point values of fault feature 3X

表11 时域振动位移平均幅值点值型参考证据矩阵Table 11 The REM with the form of point values of fault feature“displacement”

表12 两层融合中各个诊断证据的最优权重Table 12 The optimized importance weight of every piece of diagnosis evidence during the hierarchical fusion

表13 测试样本及其近邻历史样本的诊断证据(情况1)Table 13 Diagnosis evidence in testing dataset and their nearest neighboring samples(Case 1)

由式(11)找到该测试样本的K=3个近邻历史样本为[0.1786 0.1689 0.2006 4.4087](实际故障模式为D2),[0.1810 0.1711 0.1954 4.3700](实际故障模式为D3)和[0.1775 0.1723 0.1938 4.3920](实际故障模式为D3).再次利用式(12)获得测试样本fi的近邻样本的诊断证据如表13中所示.

表14 近邻证据的可靠性因子(情况1)Table 14 The reliability factors of the evidence activated by nearest neighboring samples(Case 1)

利用计算得到的证据可靠性因子(表14)和优化后得到的重要性权重(表12)对证据进行分层ER融合(如图1所示流程),得到第1层融合结果为

可以看出,特征变量f1(t),f2(t)和f4(t)对应的第1层融合结果中,信度都在不同程度上更加聚焦于真实故障模式D3.然后将e1(4),e2(4),e3(4)和e4(4)进行第2层融合,得到最终融合结果为e(4)={(D1,0),(D2,0.1963),(D3,0.8023),(D4,0.0014)}.D3对 应有最大信度,因此判断故障模式为D3,与测试样本的真实故障模式一致.

观察各个近邻历史样本实际故障模式,它们并不一定都和测试样本的实际故障模式保持一致,亦即这些历史样本所对应证据的信度分布也与测试样本证据的信度分布有差异.但是,它们对测试样本都具有一定的相似性,所以经证据融合后信度仍然能够聚焦到真实的故障模式.而使用文献[12]中单层ER融合方法得到的结果为(D1,0),(D2,0.5021),(D3,0.4302),(D4,0.0677),判断的故障模式为D2,与真实故障模式不一致.这说明所提出的分层式ER融合方法,在提升诊断证据精细化程度的同时,引入更多的历史样本信息参与融合推理,最终取得了更好的故障分类效果.

情况2在线测试样本与近邻历史样本指向的实际故障模式一致.

给定测试样本[0.1621,0.1682,0.1903,4.5045](实际故障模式为D2).利用“情况1”中给出的同样流程,可获得该测试样本的诊断证据,如表15中所示.根据式(11)找到该测试样本的K=3个近邻历史样本为[0.1611 0.1655 0.1999 4.5103],[0.1594 0.1721 0.2007 4.5375]和[0.1595 0.1660 0.2013 4.4940],它们都指向D2,相应的诊断证据如表15中所示.

表15 测试样本及其近邻历史样本的诊断证据(情况2)Table 15 Diagnosis evidence in testing dataset and their nearest neighboring samples(Case 2)

利用计算得到的证据可靠性(表16)和优化后得到的重要性权重(表4)对证据进行两层ER融合,得到第1层融合结果为

表16 近邻证据的可靠性因子(情况2)Table 16 Reliability factors of the evidence activated by nearest neighboring samples(Case 2)

显然,4个特征的第1层融合结果都将信度聚焦于真实故障模式D2.然后进行第2 层融合得到e(4)={(D1,0),(D2,0.9876),(D3,0.0124),(D4,0)}.D2对应有最大信度,因此判断故障模式为D2,决策正确.

然而使用文献[12]中单层ER融合方法得到相应的结果为{(D1,0),(D2,0.7057),(D3,0.2937),(D4,0.0006)},判断的故障模式为D2.虽然该方法正确判断了故障模式,但是计算得到的D2信度远小于分层式ER模型给出的信度赋值,这说明本文所提出的分层式ER融合方法,通过引入更多的历史样本信息参与融合推理,得到对于真实故障模式更加高的信度赋值,那么给出的决策就更加可靠.

表17-18列出了分层式ER模型对训练样本集和测试样本集融合诊断的结果,并与文献[12]中单层ER模型进行了对比.

从表17-18中可以看出,在同样的训练和测试样本下,相比单层ER模型,分层式ER模型在总体上都有更高的故障确诊率.

为了获得更可靠的结果反映分层式ER模型的性能,重复上述实验100次,每次试验都从总样本中随机生成训练样本2000个和测试样本1200个.通过统计得到,在100次随机试验中,分层式ER模型对于测试样本的平均确诊率为96.6%,具体对于每种故障模式的平均确诊率如表19所示,而单层ER模型的平均确诊率为95.1%,平均确诊率如表20所示.从此可以看出,所提方法诊断效果相对稳定,并且整体上高于单层ER模型.

表17 训练样本集诊断结果对比(混淆矩阵)Table 17 Comparison of diagnosis results of training samples(confusion matrix)

表18 测试样本集诊断结果对比(混淆矩阵)Table 18 Comparison of diagnosis results of testing samples(confusion matrix)

表19 分层式ER模型测试样本的平均混淆矩阵Table 19 Average confusion matrix in testing samples given by hierarchical ER model

表20 单层ER模型测试样本的平均混淆矩阵Table 20 Average confusion matrix on testing samples given by single ER model

6 结论

本文针对多源不确定性故障特征信息融合决策问题,给出基于分层ER规则的故障诊断方法.首先通过参考值投点获得参考证据矩阵,生成点值型参考证据矩阵(REM)和在线故障特征样本的诊断证据;给出分层式ER融合模型,第1层融合中实现在线测试样本与近邻历史样本对应证据的融合;在第2层融合中,将多个特征源提供的第1层融合结果进行再次融合,并根据两层融合所获证据进行故障决策;在双层融合模型中,根据证据之间的欧氏距离构造目标函数及相应的重要性权重优化方法;最后通过对比故障确诊率,可以得出本文的方法有效提升了故障诊断的精度.

本方法不仅继承了单层ER方法处理不确定性信息融合问题的优势,还进一步解决了诊断证据的精细化获取问题和在线诊断信息量受限问题.其优点在于:1)所提方法在诊断证据获取过程中,给出故障特征参考值投点方法,按比例求取特征样本点对相邻参考值的相似度,生成点值型参考证据矩阵(REM)和在线故障特征样本的诊断证据,实现了诊断信息的精细化提取;2)引入更多的相关历史样本参与融合推理过程,增加推理模型接纳的有效信息量,以增进辨识精度.

此外,本文还有一些问题值得进一步探讨和研究:1)式(11)使用了基于距离的k-NN方法确定近邻样本,本质是求取历史样本到中心样本的距离,除此之外也可以进一步讨论使用其他距离度量方法如马氏距离,当然还可以考虑使用多种距离算法,并对多个距离算法结果进行综合,后续的研究中可以就这一方面进行相关的验证;2)文中给出的实验案例所使用的样本数据集是完备的,然而实际上会存在无法确定样本的故障特征变量或者故障模式的情况,未来的研究中,可以就该方面对所提方法进行进一步的讨论和扩展.

猜你喜欢
参考值信度证据
萍乡市体检人群甲状腺功能正常参考值范围及甲状腺结节患病率的调查
作为数学教育研究质量分析的信度
来华留学生对全英文授课教学服务满意度量表的信度和效度分析——以昆明医科大学为例
中国健康成年人甘油三酯参考值的空间变异特征
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
妊娠妇女甲状腺功能血清指标参考值的建立
手上的证据
家庭暴力证据搜集指南
手上的证据
大蒜洋葱治好高血脂