基于信息熵的液压状态监测系统故障诊断方法

2021-08-23 04:11王佳晨张宇来
计算机工程与设计 2021年8期
关键词:网络结构贝叶斯变量

王佳晨,张宇来,岑 岗

(浙江科技学院 信息与电子工程学院,浙江 杭州 310023)

0 引 言

液压状态监测系统(hydraulic condition monitoring system,HCMS)作为一种通过减少机器停机时间来提高生产过程的规划安全性的系统被广泛使用[1,2]。在HCMS的使用过程中,其监测过程所需数据一般通过各类传感器获取[3,4],然而在实际应用中,HCMS内的传感器所处工况环境恶劣,传感器在工作过程中易于导致自身故障、老化等问题[5],从而对其监控设备的健康程度进行误判,影响其监控设备本身的工作状态,甚至引发系统故障[6]。同时随着系统承载的子系统的增加,系统搭载的传感器数量不断增多[7],系统由于传感器发生问题而导致故障的可能性也急剧提高。现阶段针对监测系统的故障诊断方法一般通过添加相应异常监控模块,在系统出现异常数据后进行判断[8,9],该类方法无法快速定位具体传感位置,且无法在故障产生前预测故障,因此实际应用效果较差。当前故障监测系统的底层都是由各种传感器实现的,液压监测系统的各种故障也都对应于各类传感器故障。所以本文计划将HCMS故障诊断方法定性为传感器故障诊断,通过预测系统中传感器是否出现故障判断该传感器所处区域是否发生故障,该方法可以在故障发生前定位并解决故障,解决了传统方法的不足。

由于贝叶斯网络针对不确定数据预测具有先天优势,其针对传感器故障预测有着极强的适用性,因此本文采用贝叶斯网络对HCMS中的传感器故障进行预测。但是传统的贝叶斯网络在进行预测时,贝叶斯网络结构往往依赖于专家人为给出,缺乏可靠性与准确性。目前,许多针对贝叶斯网络结构的构建方案已被提出,主要可以归结为以下两类:第一类是结合神经网络相关概念生成贝叶斯网络[10-12],第二类方法是将传统方法与新的数理方法或者因果推断技术相结合[13,14]。基于时间效率与理论的可解释性考虑,本文提出一种基于结合信息几何理论与K2评分搜索策略优化贝叶斯网络结构的生成方法,生成高可靠性的贝叶斯网络结构,从而提高贝叶斯网在HCMS中传感器故障诊断的准确率。

本文具体工作如下:①提出一种基于信息几何理论与K2评分搜索策略的优化BN结构的生成方法IGCS-k2,并通过理论与实验验证其有效性;②将IGCS-K2方法构建的BN应用于HCMS中,为其进行传感器故障诊断。

1 相关背景知识

1.1 贝叶斯网络模型

贝叶斯网络(Bayes network,BN)也称可信度网络,是由因果推理方法的奠基人Pearl在1988年提出的一种基于贝叶斯规则的不确定概率推理模型,是目前解决不确定性问题最有效的理论模型之一[15]。该网络的概率推理过程依托于贝叶斯公式,即

(1)

其中,P(Bi)称为事件Bi的先验概率,P(Aj)称为事件Aj的先验概率,贝叶斯公式得到的条件概率P(Bi|Aj)称为后验概率。

BN模型是一个有向无环图,是概率图模型的一种,该模型通过图像的形式直观地描述随机变量之间的因果关系,并通过计算每个变量的条件概率来进行概率推理。具体表现形式如下

B= 〈G,P〉

(2)

其中,G表示的是一个有向无环图,由节点和连接各个节点的单向弧线组成,网络参数P由G中所有节点的概率分布组成,描述每个节点在其父节点影响下的条件概率。

BN概率推理的过程即为在利用给定证据变量集合E=e后,对需要计算的变量集X={X1,>X2,>…,>Xn}在第q种状态下的概率分布进行估算,其计算过程如下

(3)

1.2 信息几何因果推断方法

信息几何因果推断(information-geometric causal infe-rence,IGCI)是一种基于因果函数模型的因果关系方向推断方法,该方法以结构方程模型为基础,结合信息几何理论,提出了基于信息熵的因果推断方法[16],该方法利用原因变量分布的独立性和基于给出原因的结果的独立性,利用因果之间的不对称性来判断变量间的因果关系[17]。当我们假定f(x)是[0,1]的严格单调递增的可分辨双射时,我们可以得出下式

(4)

进而变量x的概率密度函数p(x)、变量y的概率密度函数p(x)与函数f(x)的关系如图1所示。

图1 IGCI方法变量与函数关系图解

因此,我们可以得出如果p(x)与f的斜率无关,则在f斜率较低(f-1斜率较高)的区域p(y)的密度较高。此时,p(y)与f的反函数f>-1关系如下

(5)

由于该式当且仅当法f′是常数时成立,因此由下式可知(f-1)′和p(y)是正相关的

(log(f-1)′·p(y))-(log(f-1)′)·E(p(y))>0

(6)

因此只要变量X的概率分布X不包含Y|X的信息时,就会存在X|Y,除了f是线性的这种情况。

基于上述方法证明得出的不对称性,IGCI方法引入如下表达式

(7)

(8)

2 贝叶斯网络优化方法

利用海量数据进行学习,得到一个关系网络是BN进行后续工作的基础,然而现有BN结构学习方法均存在许多问题,特别是在连续型数据的贝叶斯网络结构生成方面,存在网络结构准确度低、计算时间过长、结果方差大等问题。因此为了提高针对连续数据的贝叶斯网络结构生成准确度,本文引入信息几何因果推断方法(information-geometric causal inference,IGCI),借鉴该方法的思路引入信息几何因果强度(information-geometric causal,IGCS)的概念,利用IGCS将变量排序后输入到最有效的结构学习方法之一的K2评分搜索策略[18]中,形成了一种新的BN结构生成方法IGCS-K2,具体流程如图2所示。

图2 改进的BN结构生成方法流程

下面本文将基于该流程图详细展开。首先为了验证该方案的合理性,同时模拟连续数据在现实世界中的情况,本节将利用一个简单的贝叶斯网络进行说明,本节中使用的贝叶斯网络结构如图3所示。

图3 实验数据下的贝叶斯网络结构

其次,利用上述BN模拟生成的数据,本文通过如下算法计算出各个变量的IGCS序列:

算法1:IGCS序列算法

输入:一组变量数为N,样本个数为任意数的完整数据集data

输出:根据IGCS排序后的序列order

步骤1建立一个N*N的矩阵CRD用于存放变量两两之间的信息几何因果推断方法评分,其中行用i表示,列用j表示;

步骤2设置IGCI方法的参数methodpars,为了使由IGCI方法计算的分数可以在”X→Y”和”Y→X”两个方向上应用于IGCS的计算,因此在此处我们选择基于熵的IGCI估计器——">org_entropy”,其它参数采用默认参数;

步骤3计算所有变量两两之间的IGCI分数,储存与矩阵CRD中,其中由于选取基于熵的IGCI方法,其“X→Y”与“Y→X”的值相反,因此可以在计算出右上三角矩阵后自己通过加上自身的转置获得完整的CRD矩阵;

步骤4将矩阵的每一行进行相加,并将计算得出的值进行排列,按值的大小将其所代表的变量序号形成新的序列输出。

其中,IGCS(i)的值代表了变量i针对其它变量的信息几何因果关系强度的出度,本文将利用其作为K2评分搜索策略序列输入K2评分搜索策略中进行BN结构的构建。在K2评分搜索策略中,K2策略将按顺序逐个考察输入序列中的变量确定其父节点,然后添加相应的弧,该策略的目的在于使得BN中层级越高的节点在输入序列中出现的越早,K2策略计算获得的BN结构将越接近真实的BN结构。因此BN相关学者普遍认为K2策略最佳输入序列是利用真实BN获得的变量之间通过拓扑排序获得的序列。IGCS算法借鉴该思路,利用转移熵值计算每个变量与其它变量因果关系强度,通过和运算得到其作为其它变量“原因”的可能性大小。

为了验证“多个变量之间的关系符合IGCS的值越大,其在BN网络中作为其它变量的祖先节点可能性越大”的假设,只需要证明在贝叶斯网络中的任意3个节点中,处于父节点位置的IGCS值大于其子孙节点。

在贝叶斯网络中,任意3个节点可能存在的关系如图4所示。

图4 任意3个节点之间存在的因果关系

其中A、B、C代表任意3个节点所代表的变量,①、②、③代表利用IGCI方法计算的熵转移值,其中箭头方向代表正向转移方向。针对图4(a),当3个变量之间没有因果关系时,各变量之间不存在父子节点关系,无需证明。针对图4(b)、图4(c)、图4(d),变量之间的关系直接由IGCI公式给出,无需证明。针对图4(f),由于假设讨论的情境设定为贝叶斯网络下,该情境下不存在有环图,因此不在考虑范围之内。最终,要证明此假设仅需证明图4(e)的情况即可。为了证明该情况下的假设正确性,本文引入如下定理和引理:

定理贝叶斯网络是一种信念网,是基于有向无环图来刻画属性之间的依赖关系的一种网络结构[15]。

引理如果转移熵Tx→y,Tx→z,Tz→y都大于0,则在这种情况下,我们需要区分从x到y的因果影响是否只是通过中间变量z的间接途径,或者是否存在另一种从x到y的直接途径[19]。

证明:由于变量A、B、C是贝叶斯网络中任取的3个节点所代表的变量,因此其符合贝叶斯网络的特性,由定理可得,当①>0且②>0时,如变量A和变量C之间存在因果关系,则变量A是变量C的父节点。

由引理可得,当变量A、B、C之间关系如图4(e)所示,且熵转移值①、②、③均大于0时,当且仅当③>①+②时变量A才是变量C的父节点。

因此,③>①+②成立。

由IGCS原理可得,变量A的IGCS值IGCS(A)=①+③,变量B的IGCS值IGCS(B)=-①+②,变量C的IGCS值IGCS(C)=-②-③。综合上式可得

IGCS(A)=①+③>2×①+2>-①+②=

IGCS(B)>2×②-③>-②-③= IGCS(C)

(9)

因此,IGCS(A)>IGCS(B)>IGCS(C),假设成立,多个变量之间的关系符合IGCS的值越大,其在BN网络中作为其它变量的祖先节点可能性越大,IGCS的值作为K2评分搜索策略的输入序列具有理论依据,证明成立。

为对生成的N个IGCS值进行排序形成递减序列,本文设定v为原始索引向量,即当k1

(10)

在完成IGCS的计算与排序后,将其输入K2评分搜索策略中进而生成BN网络,形成完整的IGCS-K2方法。

最后,为了验证本文所提出的BN结构生成方法优于其它常见的BN结构生成方法,在比较各个BN结构生成方法的过程中,我们提出基于结构汉明距离(structural hamming distance,SHD)的模型准确度判别方法“汉明距离结构精确度(hamming distance structural accuracy,HDSA)”,该方法在计算两个BN网络汉明距离后,根据BN网络是有向无环图的基本逻辑,计算正确弧占所有弧的百分比。具体算法如下:

算法2:HDSA算法

输入:学习得到的DAG图dag1、正确的DAG图dag2

输出:两个DAG之间的汉明距离结构精确度hdsa

步骤1计算可能存在的边数 edg =(输入DAG变量数-1)>^2

步骤2计算学习得到的DAG图与正确的DAG图的结构汉明距离sdh

fori← 1 to 输入DAG变量数

forj← 1 to 输入DAG变量数

ifdag1(1,j)=dag2(i,j) dosdh++

步骤3计算两个DAG之间的汉明距离结构精确度hdsa

hdsa=1-(sdh/edg)

为了对本文IGCS-K2算法进行测试,此次的实验是在一台CPU 是Inter(R) Core(TM) i7-6500U 2.50 GHz,内存为8 GB,操作系统为windows7的电脑上进行的,使用的编译器为MATLAB R2018a。

基于上述方法,本文随机生成的20组数据样本间隔为1000条,数据样本量由2000条至20 000条,样本量的选取参考各类BN结构学习方法能正确学习贝叶斯网络的数据最低值。通过IGCS-K2方法、随机K2方法、MCMC方法、MMHC方法、PC方法、TPDA方法分别生成BN结构,并通过HDSA 算法计算其模型准确度。

为了减少运算量的同时保证BN结构的精确度,各方法的超参数设置见表1。

表1 BN结构学习超参数设置

最终,各BN结构生成方法模型准确度均值与方差见表2。

表2 BN结构学习结果对比分析

由上表可知,本文所提出的方法针对上述假设形成的BN具有更高的BN结构精确度与稳定性,且收敛速度最快,可以为后续HCMS传感器故障诊断提供更好的基础。

3 贝叶斯网络在HCMS中的传感器故障诊断方法

在HCMS中,为了对工业过程进行更加全面的监控,往往采用多个多源传感器对整条工业流程中各个装置及系统进行监控,同时由于在整个工业流程中,传感器的值变化代表其监测装置中物质或能量变换,因此本文认为在工业流程下游位置的传感器变化会随着在工业流程上游位置的传感器变化而变化,即上游位置的传感器是下游位置传感器的“原因”。因此,本文将传感器在工业流程中的位置认为是其在BN网络中的理论实际位置。

在明确BN的理论结构后,本文通过如图5所示方法进行传感器故障诊断。

图5 HCMS传感器故障诊断方法流程

由于在实际的工业过程中,每个传感器的值代表了其对应装置所处的状态,而工业过程本身是一个重复的生产过程,因此当我们选取传感器状态正常的数据进行学习时,我们可以利用已知的其它传感器处于某一个时刻的数值,对该传感器的理论值进行正确估计。

依照该思路具体展开,本文首先将已知的正确传感数据进行贝叶斯结构学习,获得BN结构,并利用该数据对学得的BN进行参数学习,获取变量之间的关系权重。其次,我们选取满足数据情况的贝叶斯推理引擎,并选取需要判断传感器是否存在故障之外的多条传感器数据观测值,作为证据输入到BN中,生成每组数据的后验概率。最后,本文将生成的后验概率作为理论上的正确值,与观测得到的传感器数据值进行比对,判断该传感是否存在故障。

在具体到是否存在传感器故障的判断过程中,本文将传感器故障分以下4个大类:完全失效故障(CFF)、固定偏差故障(FBF)、漂移偏差故障(DPF)和精度下降故障(ADF)。当存在上述每种故障时,观测数据与理论数据将会发生如下图6所示的偏差,其中实心点代表观测数据,空心点代表理论数据。

图6 传感器故障类型

当通过本文方法计算出该传感器最近几次的理论值yt后,通过其与观测值yo的比较,计算两者相对误差,当发现两者相对误差较大时,则认为该传感器存在故障。确认传感器存在故障后,通过对yt、yo与两者差值Δyt,o呈现出的特征进行分析,利用专家经验判断其出现该种类型故障。具体方法如下:

(1)如果传感器观测值yo保持不变,则判定传感器发生完全失效故障(CFF)。

(2)如果传感器观测值yo变化,且差值Δyt,o为某一恒定常数,则判定传感器发生固定偏差故障(FBF)。

(3)如果传感器观测值yo变化,而差值Δyt,o随时间发生线性变化,则判定传感器发生漂移偏差故障(DPF)。

(4)如果传感器观测值yo变化,且差值Δyt,o时正时负,且平均值趋于零,则判定传感器发生精度下降故障(ADF)。

4 计算实例

为了验证本文提出的传感器故障诊断的有效性,本实验数据集选取来自kaggle的Condition Monitoring of Hydraulic Systems数据集,在一台CPU 是Inter(R) Core(TM) i7-6500U 2.50 GHz,内存为8 GB,操作系统为windows7 的电脑上进行实验,使用的编译器为MATLAB R2018a,部分代码使用Matlab CausalExplorer_1.5-master工具箱与Matlab Bayes Net Toolbox工具箱。

该数据集将Nikolai Helwig论文[20]中的数据按传感器进行数据分叉,该文中的数据集是通过实验从液压实验装置获得,实验装置由一级工作和二级冷却-过滤回路组成,通过油箱连接,系统周期性地重复恒定的负载循环,每个周期持续时间为60 s。分叉后的数据集包括各传感器测量过程值(例如压力、体积流量和温度)与4个液压组件(冷却器、阀门、泵和蓄能器)的状态定量变化情况。

本文的实验将抽取该数据集中的一级工作台中的8个实际传感器数值进行实验,根据其在系统中所处的上下游位置,我们可以获得其理论贝叶斯网络如图7所示。

图7 实验数据理论贝叶斯网络结构

在明确所需要选取的数据后,由于每种传感器的属性不同,本文通过获取数据的变化均值的预处理方法得到每个传感器的唯一属性,从而进行后续的贝叶斯网络结构及参数学习。基于样本集本身的特性与BN特性,本文认为该系统前1000次循环时传感器不存在故障。在此处,为了验证本文提出的IGCS-K2算法在BN结构精度精算上的确优于其它传统方法,选取该方法与第二节中效果较好的PC方法和MMHC方法分别计算其HDSA值,并进行比较。通过计算得出,在样本选取数据集中前1000条数据时,结果见表3。

表3 算法HDSA值比较

由上表可知,传统方法在该数据集下无法获取其正确的BN结构,而本文所提到的IGCS-K2方法基本可以得到正确的BN结构,且较PC、MMHC两种传统方法在BN结构精确度上有39.3%的提升。

在完成BN结构学习后,针对数据为离散随机变量的自身特点,BN参数学习方法采用最大似然估计,条件概率分布节点类型设置为高斯节点,推理引擎选取gaussian_inf_engine引擎构建完整的BN。完成上述步骤后,本文设定数据集最后8个样本作为证据输入,分8次选取其它传感器的数值预测需要判断是否存在故障的传感器值,利用该模型预测每个传感器的理论值,同时与其观测值进行对比,具体结果如图8所示。

图8中,每张图各代表一个传感器的理论值与观测值的偏差情况,其中X轴代表测试样本序号,Y轴代表测试样本数据均值,实线代表通过BN预测得出的各传感器理论值,点划线代表各传感器观测值。

图8 实验数据传感器理论值与观测值偏差

同时通过计算可知,该8个传感器在其数据集的最后8个样本的平均相对误差见表4。

表4 传感器相对误差

由上表及上图可知,实验数据中的8个传感器相对误差均小于1%,且数据偏差极小,理论值与观测值基本吻合,因此可以判断上述8个传感器不存在传感器故障,不需要进行后续的传感器故障种类判断。

5 结束语

本文通过结合信息几何理论与K2评分搜索策略,提出了一种BN结构生成方法IGCS-K2算法。该方法针对BN结构构建中较难处理的连续性数据学习问题,提出通过计算变量的因果几何强度序列作为K2评分搜索策略的输入序列的方法,并通过理论与实验证明其有效性,随后通过实验验证该方法在BN结构生成的准确度与方差均优于各类传统方法。

在工业领域,HCMS作为提高生产过程的规划安全性的系统被广泛使用,现阶段监测系统的监控过程完全依赖传感器的数据反馈,因此可以通过对HCMS中的传感器故障进行诊断,进而判断系统是否存在故障。本文基于IGCS-K2算法提出了一种用于HCMS传感器故障诊断的方案,并通过实际数据验证了该方案具备用于实际工业流程的能力。

在未来的研究中,希望以该方法为基础研究可以进行处理海量数据处理的高性能并行计算方法,以应对如今大数据的浪潮。

猜你喜欢
网络结构贝叶斯变量
抓住不变量解题
也谈分离变量
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习
知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用
沪港通下A+ H股票网络结构演化的实证分析
一种基于贝叶斯压缩感知的说话人识别方法
复杂网络结构比对算法研究进展
SL(3,3n)和SU(3,3n)的第一Cartan不变量
分离变量法:常见的通性通法