基于改良CGN的冷水机组故障检测与诊断

2021-11-03 12:13丁书久田佳
建筑热能通风空调 2021年9期
关键词:连续型冷水机组概率

丁书久 田佳

西安建筑科技大学建筑设备科学与工程学院

0 引言

冷水机组发生故障时会造成大量能耗,将故障检测与诊断(FDD)方法应用到冷水机组领域,及时发现冷水机组故障并确定故障类型,具有重要意义。

贝叶斯网络(BN)适合处理不确定性问题,且具有强大的融合能力,在 FDD 领域广泛应用。赵阳等人[1]开发了三层BN,通过专家调查和统计学确定参数。王亚兰等人[2]将离散化算法融入BN,避免了依赖专家的主观性,但会造成信息缺失。何所畏等人[3]提出了条件高斯网(CGN),实现了连续节点变量的概率推理。

CGN 方法需假设连续型节点服从高斯分布,导致方法普适性较差,F DD 准确率也下降。针对以上方法的局限性,本文在 CGN 的结构基础上,融入 KDE 估计连续型节点的条件概率分布,在实现故障检测诊断过程一体化的同时,提高了 FDD 的准确率。

1 理论方法

1.1 条件高斯网(CGN)

贝叶斯网络(BN)是基于贝叶斯公式的判别模型,由结构和参数两部分组成[4]。BN 的结构是一个有向无环图,包括节点和有向边,其中节点代表随机变量,节点之间的有向边代表变量之间的依赖关系[5]。BN 的参数包括所有根节点在所有可能状态下的先验概率和所有子节点在给定父节点状态下的条件概率表[4]。在BN 中,节点的数学意义为变量各状态的概率。有向边的数学意义为给定父节点状态下,子节点的条件概率。将BN 应用到 FDD 中时,已知各故障的先验概率和各类故障发生时各特征参数的条件概率后,通过贝叶斯公式可计算检测到各特征参数时,各故障发生的新概率,即后验概率。后验概率最大的故障可作为最后的判断结果。

条件高斯网(CGN)是 BN 的一种特殊形式,可以实现检测和诊断过程同时进行。相比一般 BN 相比,CGN 最大特点为实现了连续型节点变量的概率推理。图1 显示了一个简单的CGN,其中,节点S(S1,S2,,Sk)为节点F的父节点,S为离散型节点,F 为连续型节点,CGN 假设节点F服从高斯分布。CGN 规定对于一个高斯节点 F,若其只有一个离散的父节点S,那么在给定S的任一种可能的取值Si(i=1,2,,k)时,F的条件分布可用式(1)表示[5]:

图1 一个简单的条件高斯网(CGN)

式中:μS i和ΣS i分布为总体Si的均值向量和协方差矩阵,其值可使用极大似然估计法对样本数据参数估计获得。

GGN 模型中存在一个假设:连续型节点为高斯节点,即在计算连续型节点的条件概率时,假设该节点服从高斯分布。这使CGN 方法的普适性较差,一旦节点的真实分布与高斯分布的偏离度较大,就会严重影响诊断的准确率。

1.2 非参数核密度估计(KDE)

本文针对连续型节点,在 CGN 的结构基础上,将非参数核密度估计(KDE)方法融入到 CGN 模型中,KDE 是一种不对数据总体做任何假设,完全从样本数据本身出发,估计数据总体概率密度函数的方法,定义如下:

对于单变量的情况,设X1,X2,……X n是一元总体X的样本,在任意点x处的总体密度函数f(x)的核密度估计定义如下[6]。

式中:K()称为核函数,h称为带宽,n为样本容量。

由以上定义可知,核函数和带宽是估计核密度的两个因素。在实际应用中,若核函数选择 Gaussian 核函数时,最优带宽的计算用式(3)来计算,其中S为样本标准差。

2 模型建立

假设冷水机组有k类故障,用S1,S2,…,S k来表示,正常状况用Normal 表示,特征参数有n个。构建用于FDD 的改良 CGN(KDE-CGN)模型:第一步,构建CGN 结构,如图 2,C GN 共两层,状态层(State Layer)和特征层(Feature Layer),每一层分别有一个节点,父节点为S节点,为离散型节点;子节点F节点,为连续型节点;有向边由S节点指向F节点。S1,S2,…,S k和Normal 为S节点的k+1 个状态,F节点服从 n维分布。第二步,设置BN 参数,如表 1,F节点的条件概率分布可通过KDE 方法对各类故障数据和正常数据非参数估计获得。

表1 用于FDD 的KDE-CGN 模型参数

图2 用于FDD 的KDE-CGN 模型

表1 中:Hn表示利用 KDE 方法非参数估计出的F节点的n维真实分布;其中X为S 节点状态下F节点的样本数据;h和K(u)分布为Hn的带宽和核函数。

基于改良条件高斯网(KDE-CGD)的 FDD 流程图如图3 所示。

图3 基于KDE-CGN 模型的FDD 流程

3 实验验证与结果讨论

3.1 实验对象

本文所提出的研究方法采用 ASHEAE RP-1043的实验数据进行验证。实验对象是一台 90 冷吨(约316 kW)的离心式冷水机组,制冷剂选用 R134a,冷水机组工作过程图见图4,压焓图见图5。实验通过改变参数模拟了27 个运行工况,并在27 个工况下采集冷水机组正常数据和故障数据,其中,故障数据通过实验模拟获得,共模拟了7 类典型软故障,且每类故障划分为 4 个劣化等级,从低到高依次为 SL1,S L2,S L3,SL4。7 类典型故障见表2。该实验通过传感器测量以10 秒的间隔进行数据采样,共需要采集 29 组数据集,其中包括一组正常数据集和28 组故障数据集(7 类故障,每类故障分4 个劣化等级)。每一组数据包含64 个特征参数,每一个特征参数包含5191 个数据。

图4 冷水机组系统的理想工作过程图

图5 冷水机组热力循环压焓图

表2 7 类典型软故障

3.2 数据预处理和特征选择

本文首先选用移动平均滤波器法对原始数据进行平滑处理,然后选用 Glass 提出的计算几何加权运行平均值和几何加权运行方差的方法对平滑数据进行稳态筛选[7]。

基于成本和敏感度角度从 64 个特征中选出 8 个特征,8 个特征见表3。

表3 特征选择后8 个特征

经过数据预处理和特征选择后,本文正常样本和7 类故障的所有劣化等级样本中共随机选取 1800 个样本,并划分为1200 个样本的训练集和600 个样本的测试集。训练集的样本数据用于确定 FDD 模型的参数,测试集的样本数据用于对模型的验证。

3.3 KDE-CGN 模型构建

KDE-CGN 模型的结构如图2 所示,其中父节点S为离散型节点,共有 8 个状态,分别为 Normal 和本文选取的 7 类典型软故障。子节点F为连续型节点,由于通过特征选择选出了8 个特征,所以F节点服从 8维真实分布。

本文假设8 个状态的先验概率初值相等且相加之和为1,均为0.125,详细结果见表4。

表4 S 节点各状态的先验概率

S节点各状态下,F节点的条件概率分布可分布利用各自的 1200 个训练样本通过 KDE 方法进行非参数估计获得,其中 KDE 方法中的核函数,本研究选用Gaussian 核函数,KDE 方法中的带宽,本研究通过式(3)计算。由于F节点服从8 维真实分布,可得F节点的8 维条件概率密度的核密度估计为:

式中:K()表示高斯核函数;h1,h2,…,h8分别表示 8 个特征在S节点各状态下的数据带宽,具体数值见表5。

表5 8 个特征在S 节点各状态下的数据带宽

3.4 FDD 验证结果

1)首先用未融合KDE 的CGN 模型分别对冷水机组8 个状态下的600 个测试样本进行FDD 判定,结果见表6。

表6 未融合KDE 的CGN 模型FDD 结果矩阵

2)利用构建好的 KDE-CGN 模型分别对冷水机组8 个状态下的600 个测试样本进行FDD 判定,结果见表7。

表7 KDE-CGN 模型的FDD 结果矩阵

3.5 分析与讨论

FDD 的精度评价指标主要表现 FDD 方法的检测诊断准确性,F AR 指正常状态被误判为故障状态的概率。在 HVAC 领域,由于用户对舒适度要求较高,相对而言,设备发生故障产生的危害没那么严重,所以厂家和用户对于 FAR 的容忍度较低,F AR 通常为在HVAC 系统FDD 过程中最优先控制的精度指标。因此本文选用FAR 作为验证FDD 结果的评价指标。

由表6 和表 7 可计算 CGN 和 KDE-CGN 的 FAR分别为22.7%(136/600)和 5.3%(32/600)。由图6 可看出,融入 KDE 后的 CGN 在 FDD 精度方面好于传统CGN,此时FAR 可被大部分用户所接受。

图6 两种方法的FAR 对比图

4 结论

本文提出了基于改良 CGN(KDE-CGN)的 FDD方法,并用ASHEAE RP-1043 实验数据对所提方法进行验证,结论如下:

1)C GN 能够用概率的形式解决不确定性问题,适合作为 FDD 方法的判别模型,且 CGN 模型的结构能够实现故障检测诊断过程一体化。

2)用 KDE 方法估计CGN 模型中连续型节点的真实分布,代替传统CGN 中假设的高斯分布,增加了模型的普适性。与 CGN 相比,K DE-CGN 将 FAR 由22.7%降到了5.3%,提高了诊断性能。

猜你喜欢
连续型冷水机组概率
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
思维建模在连续型随机变量中的应用
水冷磁悬浮变频离心式冷水机组
连续型美式分期付款看跌期权
精品样板
基于晶圆优先级的连续型Interbay搬运系统性能分析
关于二维连续型随机变量函数分布的推广和运算