张 弢, 王金波, 张 涛
(1. 中国科学院大学, 北京 100049;2. 中国科学院空间应用工程与技术中心, 北京 100094)
随着航空航天、机械、信息等领域的快速发展,复杂工作环境对系统装备的快速反应需求日益提高,系统级故障快速诊断、以及信息获取不充分或不确定条件下的故障模糊诊断正成为研究的热点[1-10]。围绕故障诊断问题,国内外学者已基于信息流、多信号等系统可测性模型开展了大量卓有成效的研究[11-13];文献[14-15]基于节约覆盖集理论推理出故障最大似然概率诊断模型;文献[16-19]提出基于机器学习及证据理论的故障诊断改进方法;文献[20-22]提出基于图论方法的诊断改进模型;文献[23-24]提出基于贝叶斯网络的混合诊断方法。上述研究成果已成功应用于航空航天、高压输变电、电子信息、机械控制等工程领域。
对于复杂系统而言,故障与其征兆之间通常存在不确定性,此时诊断问题将超出理想假设下故障推理方法的适用范围,并且故障源发概率通常难于获取,传统基于贝叶斯理论的故障诊断方法也将面临失效。针对此问题,基于有向图模型的模糊故障诊断算法[3]提供了新的解决思路,该算法将故障发生的判定依据选取为测试向量与故障特性向量的空间向量夹角大小,并已在航天工程领域验证了算法的有效性。但该算法未从故障特征模糊性角度深入剖析模糊诊断机理,未能利用概率空间中的标量运算特性降低算法复杂度,未考虑利用最小模原则筛选故障诊断结果以降低虚警,在载人航天、载人深潜等快速反应需求较高的应用场景中存在明显局限性。
本文基于故障测试传感器的测试不确定性分析提出了一种故障模糊诊断方法,通过建立故障-测试相关矩阵,在故障特征空间中考察非理想测试条件下故障出现某种征兆的概率值,并利用概率最值原则推理故障、以及最小模原则进行故障筛选以降低虚警,实现了对复杂系统故障的高效便捷诊断。对实验结果分析易知,本文所用方法的首选结论诊断正确率及故障覆盖率均可达到100%,相比文献[3],本文方法的运算复杂度更低、并且支持现场应急条件下人工图形化快速诊断。
相关矩阵是一种表述两组对象序列间多重因果关系的有效方法。在系统测试性分析和故障诊断工作中,通常采用基于信息流、多信号流图等方式进行可测性设计,继而可建立故障-测试相关矩阵以支持故障的定位与隔离。相关矩阵的基本概念[25]简要介绍如下。
定义1相关关系:是指两个对象之间的因果关系。由对象a可直接推知对象b,则称a与b是1阶相关。若由对象a推知对象b,再由对象b推知对象c,则b与a、c与b分别为1阶相关,c与a为2阶相关。两个对象间的N阶相关关系,可同理推知。
定义2相关性矩阵:反映各对象间各阶相关关系(也称全阶相关关系)的布尔矩阵。矩阵的行向量和列向量均由对象组成,若某行对象与某列对象相关,则矩阵相应行列位置的元素取值为1,否则取值为0。
在故障诊断领域,常用如式(1)所示的矩阵DFT表达故障-测试相关关系,其中以标记f表示故障对象、标记t表示测试对象、标记r表示故障与测试对象间的相关关系。当故障fi可被测试tj检测到,则矩阵对应位置元素rij=1,否则rij=0。矩阵的行向量Fi=[ri1,ri2,…,rin]代表了故障的征兆向量(又称特征向量),其定义了故障fi发生时对应的全部测试的外在表达。矩阵的列向量Tj=[r1j,r2j,…,rmj]T描述了测试tj可检出的全部故障,体现了其可检测的最大故障包络。
t1t2…tn
(1)
在工程实践中,通常可对复杂系统进行测试性建模,建立故障-测试相关矩阵,进而获得故障对象与测试对象之间完整的相关关系。下面以文献[13]中的某型飞机燃油系统为例,简要说明以多信号流图为基础的DFT矩阵建立方法。
图1为某型飞机燃油系统的多信号流图,其实质为基于系统结构的分层有向信息流图。因系统级故障可分解为各部件的故障集合,故图中的“矩形”符号也兼具表征了各部件、以及系统级可能发生的故障。通过前期可测性分析知,系统电源可能有“过压”和“欠压”两种故障状态,且均可由置于电机上的电压传感器间接获知,其故障征兆分别对应测试信号T3和T4;电机及其测试级联的电流传感器、电压传感器的故障可分别由测试信号T1、T5反映;燃油泵故障及电源过压情况,由测试信号T2予以监测。限于篇幅关系,本文仅对上述部件(故障)1~5和测试1~5的关联关系简要说明,并给出如表1所示的故障-测试相关矩阵,系统中其余部件及测试的相关矩阵同理可得。多信号流图原理及用法可参见相关文献,本文不做展开论述。
图1 某型飞机燃油系统多信号流图示例Fig.1 Multi-signal flow graph of an aircraft fuel system
故障测试123451.1 电源欠压000101.2 电源过压011002 电机工作故障100013 电流传感器故障100004 电压传感器故障000015 燃油泵工作故障01000
在已知故障范围内,若不考虑故障特征发生消减及变异,则DFT矩阵中各故障特征向量(行向量)的“逻辑或”运算可用于表示系统中多故障并发的情况。对于上述多故障情况,可将待考察多故障(故障组合)的逻辑运算结果作为新的行向量添加至DFT矩阵的最下端,并将该新矩阵定义为“DFT扩展矩阵”。DFT扩展矩阵与DFT矩阵(规模m×n维)性质相同,其列向量数目为n、行向量数目最大可为2m-1。
系统故障诊断的实质是根据已观测到的征兆推理定位故障。在实际工作中,受限于观测方法、设备特性、运行环境等多方面影响,观测到的故障征兆也将存在不确定性,通常需要引入概率方法来进行故障诊断。在概率空间中,系统故障诊断问题可定义为一组条件概率的最值关联问题,即
定理1对于给定的故障-测试条件概率集合
Pr(Cj)={p(F1|Cj),p(F2|Cj),…,p(Fm|Cj)},
j=1,2,…,n
(2)
若存在关联函数E,使得对任意Cj均有max(Pr(Cj))=E(Fi)成立,则可诊断为故障Fi发生。式(2)中,Fi表示系统故障,Cj表示故障征兆测试向量。关联函数E通常应具有正相关特性,并且满足节约原则,例如最小模原则,可用于对诊断结果按需筛选。
为便于表述,本文给出故障模糊检出率定义。
定义3故障模糊检出率γij=p(Cj|Fi)/p(Cj)。
利用条件概率公式展开,并将定义3中的γij算式代入,则式(2)中故障后验概率可变为
p(Fi|Cj)=p(Fi)×γij
(3)
易知式(3)的取值区间为(0,γij),故式(3)的含义为:在非理想测试条件下,故障被检出的上限概率为γij。
对于复杂系统而言,在故障先验概率p(Fi)难于获取并且测试非理想情况下,γij可用于衡量测试Cj对故障Fi的最大检出程度,与p(Fi|Cj)相比,γij是故障Fi被检出的乐观估计。在工程应用中,测试人员通常会计算两个故障的γij相对值(例如“比值”或“差值”)进而找出γij最大值,以此获得诊断结果。上述计算过程可消减γij部分估计误差,因此以γij作为故障模糊诊断的衡量标准具有合理性。特别地,对于已观测到的故障征兆,因其为确定事件,所以γij存在等效值为p(Cj|Fi)。
综上所述,非理想测试条件下γij值(或等效值p(Cj|Fi))可作为故障模糊诊断的判据,将γij代入定理1可得到故障判别式:
max(γij)=max(p(Cj|Fi))=E(Fi),j=1,2,…,n
(4)
分析易知,仅需将函数E取为故障与其模糊检出率最大值的直接关联,式(4)即可用于模糊诊断。
系统故障征兆观测的不确定性直接导致了故障诊断结论的模糊性,对于既定的系统征兆和待考察故障而言,上述模糊性将表现为故障-测试依赖关系的多映射特性,即:在观测存在不确定性条件下,系统DFT矩阵中的行向量将表现为多重故障的特征属性,而不是某故障独有的特征表现。为便于表述,现对比DFT矩阵的故障特征向量Fi,定义其在概率空间中的模糊特征向量如下:
步骤1建立DFT矩阵(m×n维),并获得系统故障检测概率(fault detection rate,FDR)、虚警概率(false alarm rate,FAR)等统计数据;
步骤3对于给定的故障征兆Cj,将其与Sp中每个元素故障的模糊特征向量进行比对,若完全相同,则按步骤4进行诊断结果筛选;否则,增大考察故障数量i并扩大集合Sp的范围并重新执行步骤2,直至i=2m-1且Sp=Sa;
步骤5诊断结束,输出结果。
下面对故障模糊诊断方法的应用做示例说明。
案例1已知某系统需考察的故障有2个且仅有2个故障观测点,其故障-测试相关矩阵如表2所示。故障发生概率及观测点工作状态概率均相互独立。
表2 案例1的DFT矩阵
经前期数据统计,测试点1和测试点2对故障1的FDR分别为0.957 5和0.991 2,FAR分别为0.003 8和0.002 5;相应地,对故障2的故障检测概率分别为0.963 7和0.974 2,虚警率分别为0.315 6和0.238 8。因此,对故障1和故障2的诊断辨识过程如下:
(1) 待考察故障数i=2,对应的待考察故障集合Sp={F1,F2};
(2) 集合Sp中元素故障的模糊特征向量及其出现概率如表3所示;
表3 案例1中各故障的模糊特征向量及概率值
(4) 输出全部Nop=2个候选诊断结果:最可能为F1故障,次可能为F2故障。
对案例1而言,未列出的故障模糊特征向量{0,1}对应系统中未定义故障(或非故障情况),因不具备诊断条件,故不做考察。一般来说,系统的FDR应大于50%且FAR小于50%,否则与工程实际不符(工程实际中FDR通常“远大于”FAR)。在上述条件下,容易证明,若获得的故障征兆Cj可与某故障Fi的固有特征向量相同,则故障Fi可作为优先候选诊断结论,诊断结果具体排序依据节约原则确定。基于高阶DFT矩阵的复杂系统故障诊断与案例1类似。
对于“快速粗诊断”等现场应急诊断场景,可在本文故障模糊诊断方法基础上,进一步合理假定所有故障-测试的故障检测率取值同为FDRarg、故障虚警率取值同为FARarg。本文将以此假设为前提的简化诊断方法定义为“快速诊断模式”。
(5)
因系数ω可利用故障虚警率为来定义故障漏检率的等效值,相对于理想测试条件而言,可实现测试结果“偏离”理想条件下系统故障的量化比较,故本文定义其为“征兆偏离系数”,工程实用中可对其进行“取整”运算以简化分析。
基于本文故障模糊诊断方法,在参数统一量化条件下可得到故障快速诊断模式,其主要操作过程可简记为“建矩阵、标区域、换零值、做加法”。
案例2假定某系统的DFT矩阵如表4所示,测试与故障间的FDR最大值为0.95、FAR最大值为0.01,故障发生概率及测点工作状态概率均相互独立,在模拟注入F2故障且获得故障征兆Cj=[0,1,1,0]条件下,可有如下快速诊断过程。
表4 案例2的DFT矩阵
(1) 预备:计算征兆偏离系数并取整有ω=5;
(2) 建矩阵:假设选定需考察故障个数为4,对应的故障集合Sp=Sa={F1,F2,F3,(F1,F2)},则考虑组合故障的DFT扩展矩阵如表5所示;
(3) 标区域+换零值:根据Cj中取值为1的列对表5标定区域(如表6中阴影部分所示),将标定区域中所有数值“0”替换为“5”(即ω值);
(4) 做加法:计算表6的DFT扩展矩阵中各行向量元素的数值累加和分别为{7,2,12,3};
(5) 诊断:依据故障模糊征兆概率“偏离”理想条件的程度越小,故障发生概率越高原则,得到的诊断结果为:最可能F2故障,次可能F1和F2组合故障,第三可能F1故障,第四可能F3故障。
由以上诊断过程可看出,快速诊断模式支持简洁的图形化操作,运算效率更高。
表5 案例2的DFT扩展矩阵
表6 案例2的DFT扩展矩阵数值替换及求和
本文选取阿波罗飞船发射前的系统状态为例,证明所提出诊断方法的有效性和实用性,实验对象数据源自文献[26]。阿波罗飞船系统中包含了10个故障状态及15个故障观测传感器,其故障-测试相关矩阵DFT如表7所示,其中字符Y表示测试发现故障征兆,字符N表示测试未发现故障征兆。
表7 飞船发射前系统状态故障-测试相关矩阵
为方便比对故障诊断性能,本文采用了与文献[3]相同的实验假设条件:
(1) 系统传感器的FDR值均为90%,FAR值均为1%,且各值相互独立;
(3) 备选诊断结论中包含的最大疑似故障数Nop=3。
将诊断算法运行在CPU主频1.83 GHz,内存1.5 G的PC机上。
实验结果表明,在单故障及双故障仿真注入情况下,本文基于故障模糊检出率计算的诊断方法的“首选诊断结论的正确率”和“故障覆盖率”均达到100%,与文献[3]方法结论一致。容易证明,在相同实验条件下,本文提出的快速诊断模式也可获得相同的诊断结论。
表8给出了本文基于故障模糊检出率计算的诊断方法与文献[3]方法的主要实验数据对比,因两种方法所用的衡量指标(“相似度”与“故障模糊检出率”)不同,故表中两列“判据值”之间并无量值比较意义。
表8 理想情况下故障注入的诊断结果比较
续表8
值得说明的是,考虑到“帕列托定律”对于工程系统的故障诊断问题有一定的适用性(系统80%的故障常出现在20%的部件上),对于空间站、大型客机等复杂系统而言,在故障组合的数目巨大、多故障或故障组合具有相同模糊检出率的条件下,本文按“最小模”原则筛选出的故障疑似范围更小,将比文献[3]中按任意次序确定诊断结果的方式获得更低的FAR。
在诊断时间方面,本文提出的两种方法均优于文献[3]方法。表9给出了文献[3]方法、本文提出的基于故障模糊检出率的概率计算方法、以及本文提出的快速诊断模式等3种方法的运算复杂度对比。其中,数值m和n分别表示DFT矩阵的行数和列数,故障考察范围为所有故障的可能组合(即共需考察2m-1行故障特征向量),同时假定各测试FDR、FAR分别相等,运算复杂度计算时忽略了取值“高阶无穷小”部分。
由表9可以看出,本文提出的两种方法的计算复杂程度均低于文献[3]方法。这是因为文献[3]方法未考虑概率空间中的标量运算特性。文献[3]方法将故障特征向量和观测向量均映射至矢量空间、并计算两向量间夹角的大小,这隐含了观测向量中各元素(测试)间相互独立的前提,若在概率空间中考虑上述处理过程,并附加相同的测试独立性前提、以及故障-测试间4种可能的条件概率信息,则上述矢量夹角运算可对应为本文观测向量中所有元素(测试)的条件概率乘积,但将矢量运算转换为标量运算使得本文方法的诊断效率更高。
表9 算法运算复杂度比较
特别地,本文提出的快速诊断模式中不含乘法及开平方操作(仅有加法运算),特别适用于对系统故障的快速粗略估计、或者脱离自动化诊断系统辅助状态下的人工故障分析,可为载人航天、载人深潜等快速反应需求较高的应用场景提供故障诊断新方法。
本文针对航空航天等急需快速反应的应用场景引入了一种新的系统故障诊断方法。通过建立故障-测试相关矩阵,从概率角度推理出非理想测试条件下的故障判据,并利用最小模原则优选故障以降低虚警,实现了对复杂系统故障的高效便捷诊断,避免了获取复杂系统源发故障概率或建立精确数学模型的难题。与文献[3]相比,本文方法可在保持100%的首选结论诊断正确率及故障覆盖率的同时,具有更低的运算复杂度,并且具备图形化快速诊断模式,便于操作人员现场应急使用。
[1] SUN Y, GUO L, MA Z S. A fault diagnosis system design for space application[C]∥Proc.of the IEEE International Conference on Electronic Measurement & Instruments, 2015: 8-12.
[2] YAO J Y, LI J, LI H Z, et al. Modeling system based on fuzzy dynamic Bayesian network for fault diagnosis and reliability prediction[C]∥Proc.of the Reliability and Maintainability Symposium, 2015: 1-6.
[3] 连可, 黄建国, 龙兵. 一种基于有向图模型的模糊多故障诊断算法[J]. 系统工程与电子技术, 2008, 30(3): 568-571.
LIAN K, HUANG J G, LONG B. Fuzzy multiple fault diagnosis algorithm based on digraph models [J]. Systems Engineering and Electronics, 2008, 30(3): 568-571.
[4] 马骏, 倪世宏, 解武杰, 等. 改进的强跟踪飞机舵面快速故障诊断方法[J]. 系统工程与电子技术, 2015, 37(11): 2566-2573.
MA J, NI S H, XIE W J, et al. Fast fault diagnosis of improved strong tracking aircraft actuator [J]. Systems Engineering and Electronics, 2015, 37(11): 2566-2573.
[5] LI H Y, GAO Y B, SHI P, et al. Observer-based fault detection for nonlinear systems with sensor fault and limited communication capacity [J]. IEEE Trans.on Automatic Control, 2016, 61(9): 2745-2751.
[6] DENG W L, QIU D W. State-based decentralized diagnosis of bi-fuzzy discrete event systems [J]. IEEE Trans.on Fuzzy Systems, 2015, 25(4): 2745-2751.
[7] GE X L, PU J K, GOU B, et al. An open-circuit fault diagnosis approach for single-phase three-level neutral-point-clamped converters [J]. IEEE Trans.on Power Electronics, 2017, PP(99): 1-12.
[8] KEMALKAR A K, BAIRAGI V K. Engine fault diagnosis using sound analysis[C]∥Proc.of the International Conference on Automatic Control and Dynamic Optimization Techniques, 2016: 943-946.
[9] SHEN Y H, LU C H. Research on method for information standardized description and transmission in networked fault diagnosis[C]∥Proc.of the International Conference on Computer Science and Applications, 2015: 333-338.
[10] HU M. A unified AC fault diagnosis method for analog circuits based on iterative simulation before test[C]∥Proc.of the IEEE International Conference on Electronic Measurement & Instruments, 2015: 13-19.
[11] DEB S, PATTIPATI K R, RAGHAVAN V. Multi-signal flow graphs: a novel approach for system testability analysis and fault diagnosis [J]. IEEE Aerospace & Electronic Systems Magazine, 1995, 10(5): 14-25.
[12] ZAD S H, KWONG R H, WONHAM W M. Fault diagnosis in discrete-event systems: framework and model reduction [J]. IEEE Trans.on Automatic Control, 2003, 48(7): 1199-1212.
[13] 梁爽,于劲松,唐荻音,等.基于多信号流图与分支定界算法的故障诊断[J]. 北京航空航天大学学报, 2016, 42(1): 180-186.
LIANG S, YU J S, TANG D Y, et al. Research on fault diagnosis based on multi-signal flow graph and branch-and-bound algorithm [J]. Journal of Beijing University of Aeronautics and Astronautics, 2016, 42(1): 180-186.
[14] PENG Y, REGGIA J A. A probabilistic causal model for diagnostic problem solving part I: integrating symbolic causal inference with numeric probabilistic inference [J]. IEEE Trans.on Systems, Man and Cybernetics, 1987, 17(2): 146-162.
[15] 杨莉,尚勇,周跃峰,等.基于概率推理和模糊数学的变压器综合故障诊断模型[J].中国电机工程学报,2000,20(7):19-23.
YANG L, SHANG Y, ZHOU Y F, et al. Probability reasoning and fuzzy technique applied for identifying power transformer malfunction[J]. Proc.of the Chinese Society for Electrical Engineering, 2000, 20(7): 19-23.
[16] PACHECO F, CERRADA M, SANCHEZ R V, et al. A methodological framework using statistical tests for comparing machine learning based models applied to fault diagnosis in rotating machinery[C]∥Proc.of the IEEE Latin American Conference on Computational Intelligence, 2016: 1-6.
[17] CHEN S P. A kind of semi-supervised classifying method research for power transformer fault diagnosis [C]∥Proc.of the IEEE International Conference on Software Engineering and Service Science, 2016: 1013-1016.
[18] ZUQUI G C, RAUBER T W, MUNARO C J, et al. Robust fault detection and diagnosis for multimode processes[C]∥Proc.of the IEEE International Conference on Industry Applications, 2016: 1-6.
[19] CHEN J, YE F, LI Y B. A robust rotary machinery fault diagnosis approach based on entropy fusion and DS theory[C]∥Proc.of the IEEE International Conference on Signal Processing, 2016: 1424-1428.
[20] JIANG Z Y, LI Z W, WU N Q, et al. A Petri net approach to fault diagnosis and restoration for power transmission systems to avoid the output interruption of substations [J]. IEEE Systems Journal, 2017, PP(99): 1-11.
[21] YANG Z M, ZHANG C C, LIU M Z, et al. Graph-based fault diagnosis method for complex electronic systems[C]∥Proc.of the IEEE International Conference on Electronic Measurement & Instruments, 2015: 63-68.
[22] HU Y G, GUO Z L, LI B, et al. Fault diagnosis using directed graph[C]∥Proc.of the IEEE International Conference on Software Engineering and Service Science, 2016: 466-470.
[23] YU G, ZHANG L Z. An intelligent approach for bearing fault diagnosis based on Bayesian networks and alpha-stable distribution[C]∥Proc.of the International Conference on Computational Intelligence and Communication Networks, 2015: 76-78.
[24] ZHANG J B, QI M C, LI B. Hybrid diagnosis of fault tree and Bayesian network in BIW automatic welding production line[C]∥Proc.of the IEEE Advanced Information Management, Communicates, Electronic and Automation Control Conference, 2016: 297-300.
[25] U.S. Department of Defense. Basic Dependency Modeling Terminology [EB/OL].[2016-11-01].http:∥www.testability.com/Reference/Glossaries.aspx? Glossary=Dependency Modeling.
[26] WOHL J G. Information automation and the Apollo program: a retrospective [J]. IEEE Trans.on Systems, Man and Cybernetics, 1982, 12(4): 469-478.