基于GMM 的流体旋转设备运行可靠性在线评价方法

2024-04-07 01:59吴贤慧王莉静张建业
流体机械 2024年2期
关键词:离心机可靠性聚类

郗 涛,王 博,吴贤慧,王莉静,张建业

(1.天津工业大学 机械工程学院,天津 300387;2.天津城建大学 控制与机械工程学院,天津 300384)

0 引言

随着水轮机、涡轮发动机、离心机等流体旋转设备的广泛应用,相应的设备运行与维护也越来越受重视,目前各大企业为了降低运维成本,相继建立了基于物联网的设备运行实时监控系统,但只能对关键参数进行在线监测,无法对设备运行的可靠性进行评价。因此研究准确高效的设备在线运行可靠性评价方法,实现准确的可靠性预测,对于降低设备故障频率、延长设备安全运行时间、指导预防性维修具有重要意义。

在设备运行可靠性评价领域,荆岫岩等[1]提出了一种基于比例协变量模型的抽水蓄能机组轴系运行可靠性评估方法,该方法需要获取故障数据计算初始故障率,但是由于设备故障种类多,导致难以得到准确的初始故障率;URBAHA 等[2]提出一种基于声发射监测评估飞机燃气轮机转子叶片的可靠性评价方法,但该方法仅适用于故障发生后的维修期间,无法实现运行中的实时评估;陈卫冲等[3]通过对轴承温升、机组振动信号识别分析,实现泵站故障的原因分析与智能预警,完成了大型泵站运行状态的评价;王红军等[4]对振动信号进行处理,构建高维特征空间,计算当前状态与正常状态的特征子空间的夹角,来表征设备的运行可靠性。但是旋转设备在实际运行中,振动源多且复杂,存在振动信号不易提取,安装振动传感器增加运维成本的问题[5]。

由于流体旋转设备内部流体物料的不固定性与不稳定性,设备往往在多种工况条件下运行。而工况变化进一步导致电流、温度等监测参量的变化[6]。针对流体旋转设备存在多工况运行的问题,本文提出分工况进行设备运行可靠性评价的方法。通过建立监测数据、工况条件、运行状态与系统可靠性之间的联系,基于高斯混合模型(Gaussian Mixture Model,GMM)实现设备运行可靠性在线评价。

1 构建运行工况划分模型

在不同环境温度和不同负载情况下,基于传感器采集的设备运行数据存在较大差异,若只考虑单一工况,势必影响可靠性评价的准确性,为了提高可靠性评价的准确性、可靠性、普适性,故进行工况划分。由于流体旋转设备无法简单的通过重力传感器实现工作负载识别,故本文通过设备历史运行数据采用聚类的方法实现工况划分。

分别使用基于密度的空间聚类算法(DBSCAN)和基于快速搜索和发现密度峰值的聚类算法(DPC)在公开数据集上进行对比分析。本文采用C-MAPSS 公开数据集中的test_FD002数据作为测试数据集进行聚类分析,该数据集由美国航天航空局创建,模拟了涡轮风扇发动机的实际退化过程,包括6 种工况下21 个传感器参数信息,最后采用3 种常用的聚类性能评价指标评价算法性能,选择聚类性能较好的算法应用于设备的工况划分。

1.1 DBSCAN 聚类算法

DBSCAN 是一种能够很好地识别噪声点,可以实现快速聚类[7]。该算法主要根据设定的邻域半径(Eps)和样本在邻域半径内包含的最小邻域点个数(Minpts)实现聚类。但是该算法存在邻域半径和最小领域点个数难以确定,且参数对聚类效果特别敏感的缺点。

1.2 DPC 算法

DPC 算法是由ALEX RODRIGUEZ 等[8]于2014 年提出,该聚类算法不需要提前指定聚类个数,能够自动发现聚类中心点,实现高效聚类。对于每一个数据点,都可以计算它的局部密度ρi和该点距离高密度点的最小距离δi,其局部密度定义为:

式中,χ(·)为逻辑判断函数;dij为xi与xj之间的距离;dc为截断距离。

δi是通过计算数据点xi与其他更高密度点的最小距离,δi定义为:

1.3 聚类效果评价

使用聚类评价指标对上述2 种聚类算法在公开数据集C-MAPSS 上进行聚类效果评价。已知数据集X={x1,x2,…,xn},真实类标签为U={U1,U2,…,UT},聚类划分结果为V={V1,V2,…,VC},采用聚类精度(ACC)、调整互信息指数(AMI)、调整兰德系数(ARI)评价聚类性能为:

式中,N1为正确聚类的样本数;N为总样本数;H(U),H(V)分别为U和V的熵;MI(U,V)为互信息;E{MI(U,V)}为互信息的期望值;a为在真实和试验情况下都属于同一个簇的点对数目;b为在真实情况下属于同一个簇而在试验情况下不属于同一个簇的点对数目;c为在真实情况下不属于同一个簇而在试验情况下属于同一个簇的点对数目;d为在真实和试验情况下都不属于同一个簇的点对数目[9]。

借助公开数据集对上述2 种聚类算法的聚类结果进行对比分析,得到聚类效果见表1。

表1 聚类效果分析Tab.1 Clustering effect analysis

可以发现,DPC 具有更高的聚类精度,故本文选择DPC 聚类方式对设备运行工况进行划分。

2 构建运行工况在线识别模型

为了实现对设备运行工况的实时在线识别,本文选择XGBoost 算法[10]对含工况类别的历史数据集进行训练,构建工况识别模型。

XGBoost 树模型以CART 作为基分类器,通过Gradient Boosting 实现多棵CART 树组合的集成学习算法[11-12],XGBoost 的模型定义为:

式中,fK(xi)表示第K棵决策树。

XGBoost 的目标函数定义为:

式中,L(y i)为损失函数;Ω(fk)为正则项;γ,λ为超参数、控制惩罚程度;T为叶节点个数;ω为每个叶子节点的权重分数。

3 构建设备运行可靠性评价模型

3.1 特征选取

为了降低评价模型的复杂度,避免引入冗余特征,故进行特征选择,挑选出与设备运行状态更具相关性的特征,构建合理的特征向量作为评价指标。首先选用ReliefF 算法计算每个特征对设备运行状态的重要度,保留贡献度大的特征,为了避免强相关性特征对模型准确率的影响,利用Pearson 算法计算每个特征之间的相关性,针对具有强相关性的2 个参量,只保留重要度较大的参量,去除冗余特征。

3.2 构建基于GMM 的运行可靠性基准模型

高斯混合模型[13-15]是一种无监督学习算法,其原理是通过多个高斯概率密度函数的线性组合表示数据的空间分布,可以实现任意类型分布数据的有效拟合。

现假设数据样本集合D中包含m维样本特征,n个样本数据,第i个样本Xi={x1,x2,…,xm},各样本均符合高斯分布,某一时刻样本观测值Xi的概率表示为:

式中,P(x)为高斯混合模型的概率密度函数;ωk,μk,σk分别为第k个样本的权重、均值、协方差,且为高斯概率密度函数。

利用公开数据集中某一工况下正常运行阶段的数据进行训练,得到三维基准高斯混合模型如图1 所示。

图1 基准高斯混合模型的三维Fig.13 d graph of the datum Gaussian mixture model

3.3 构建运行可靠性评价指数

将经特征选择后的设备实时监测数据作为一个特征向量,基于马氏距离来度量当前特征向量偏离基准高斯混合模型的距离,当前特征向量与第个高斯模型马氏距离表示为:

则特征向量与高斯混合模型的偏离程度表示为:

为更直观地了解当前设备的运行可靠性程度,将马氏距离映射到[0,1]之间作为设备运行可靠性评价指数(Operational Reliability Index,ORI),其中,可靠性指数越接近于1 表示设备运行越可靠。

式中,α为调整系数,取α=0.015。

4 实例分析

为了验证上述所提方法的有效性,以矿用离心机设备为实例进行分析,离心机是运用高速旋转离心原理实现固液分离的装置[16]。针对离心机载荷变化明显,存在多种运行工况的问题,本文分工况实现对离心机设备的运行可靠性评价[17]。

本文以北京某矿用离心机设备生产厂商所生产的WL1200 型卧式振动离心机作为研究对象,利用离心机远程监控平台采集设备实际运行数据进行验证,其中包括正常运行状态下的数据和故障数据,部分监测特征参量见表2。

表2 监测参量Tab.2 monitoring parameters

4.1 基于DPC 算法的工况划分

本文对历史数据集采用DPC 算法进行聚类分析,分别得到图2 的决策和图3 的二维可视图,可以看出离心机历史数据集被划分为5 种典型工况。

图2 离心机数据集上得到的决策Fig.2 Decision diagram obtained from centrifuge dataset

图3 离心机数据集上得到的二维聚类效果Fig.3 Two-dimensional clustering effect graph on centrifuge dataset

将聚类后的数据点还原到原来的数据空间,分别得到工况1~5 的工况情况见表3~7。

表3 矿用离心机工况1 模型Tab.3 Working condition 1 model of mining centrifuge

表4 矿用离心机工况2 模型Tab.4 Working condition 2 model of mining centrifuge

表5 矿用离心机工况3 模型Tab.5 Working condition 3 model of mining centrifuge

表6 矿用离心机工况4 模型Tab.6 Working condition 4 model of mining centrifuge

表7 矿用离心机工况5 模型Tab.7 Working condition 5 model of mining centrifuge

4.2 基于XGBoost 算法的运行工况在线识别

为了验证XGBoost 算法在离心机工况识别上的准确率,随机提取历史运行数据作为测试集并带入到训练好的模型中进行测试,测试结果如图4 所示。

图4 工况预测结果分析Fig.4 Analysis of condition forecasting results

由图中可以看出,使用该算法进行工况识别具有较高的准确率。

4.3 特征选择

使用ReliefF 算法计算每个特征对离心机运行状态的重要度,得到24 个参量的平均重要度见表8。

表8 监测参量的平均重要度Tab.8 Average importance of monitoring parameters

由于ReliefF 算法无法有效去除冗余特征,本文选择保留重要度大于0.5 的特征参量,然后使用Pearson 算法去除冗余参量,将Pearson 相关系数的阈值设定为0.9,若相关性超过0.9,则只保留重要度较高的参量。经过上述特征选择,最终选择主电机A 相电流、振动电机1A 相电流、振动电机2A 相电流、主电机绕组温度,振动电机1 温度、振动电机2 温度、油泵电机温度、主振弹簧温度、筛篮位移、润滑油温度、主轴转速、主轴温度、前后轴承温度共14 个参量作为评价指标。

4.4 基于GMM 方法的运行可靠性基准模型构建

在设备正常运行数据集中分别提取5 种不同运行工况下的历史运行数据,利用上述14 个状态参量分别构建5 种不同工况下的运行可靠性基准模型。为实现运行可靠性评价,将实时在线采集的14 个状态参量作为一个特征向量,对该特征向量进行工况识别后再将此特征输入到对应工况下的基准高斯混合模型中,测量该特征与基准模型的马氏距离,再将马氏距离映射到[0,1]之间得到运行可靠性指数(ORI)。

4.5 结果分析

为了验证本文所提算法能够有效反应设备的劣化过程,取3 台设备从投入运行至第一次维修之前的运行数据。由于数据量太大,每间隔10 h 提取一条运行数据,构成测试数据集进行验证。计算得到设备运行期间的运行可靠性指数变化趋势如图5 所示。

图5 设备全寿命周期的运行可靠性指数Fig.5 ORI of equipment life cycle

随着设备运行时间的增加,运行可靠性指数不断下降,且设备故障点越多,运行可靠性指数越低,符合实际。

为了进一步验证故障点个数与运行可靠性的关系,分别提取工况1,2,4 下的正常运行数据、含有1 种故障、含有2 种故障和含有3 种及以上故障的设备运行数据,得到对应的运行可靠性指数ORI。对应工况1,得到各运行条件下的ORI分布,如图6 所示。

图6 工况1 不同运行条件下的ORIFig.6 ORI in different operating conditions of condition 1

对应工况2,得到各运行条件的ORI,如图7所示。

图7 工况2 不同运行条件下的ORIFig.7 ORI in different operating conditions of condition 2

对应工况4,得到各运行条件的ORI,如图8所示。

图6~8 分别示出了工况1、工况2、工况4 下,故障点个数与运行可靠性指数的关系,可以看出随着设备故障点数的增多,设备运行可靠性不断降低。对5 种工况不同运行条件下的运行可靠性指数分布情况进行统计,得到不同工况不同运行条件下的ORI分布见表9。

表9 不同工况运行条件下的ORI 分布Tab.9 ORI distribution under different operating conditions

为了建立统一的评价标准,对表9 作进一步分析,按正常运行状态、含1 种故障状态、含2 种故障状态、含3 种及以上故障状态划分评价等级,依次为高可靠性阶段、低可靠性阶段、警告和危险阶段。以工况内取中值和工况间取均值的方法建立表10 所示的整机运行可靠性评价标准。

根据表10 可知,当整机设备运行可靠性指数小于0.857 时,可以认为设备开始出现故障特征,离心机开始进入劣化状态,工作人员可以对离心机进行适当维修。

表10 离心机设备整机运行可靠性评价标准Tab.10 Standard for reliability evaluation of centrifuge equipment

为了验证评价准确率,取正常状态下的运行数据并计算运行可靠性指数,得到ORI分布如图9 所示。可以发现,设备在正常运行状态下仅有少数样本点的ORI指数低于0.857,通过统计发现评价准确率达到98%以上。

图9 正常样本点的ORI 分布Fig.9 ORI distribution of normal samples

有学者针对矿井通风机的运行可靠性提出了基于PCA-MSET 的运行可靠性评价方法,对13个监测变量降维后建立可靠性评价模型,利用欧式距离计算残差得到可靠性指标[18]。但是该方法仅考虑了单工况运行情况,若将该方法用于多工况运行的设备,则会导致评价不准确。基于上述方法,不再考虑多工况问题,使用离心机处于健康状态下的运行数据建立评价模型并进行可靠性评价,得到图10 示出的设备ORI分布。

图10 仅考虑单工况下的ORI 分布Fig.10 ORI distribution under single working condition

由图中可以看出,基于PCA-MSET 的单工况运行可靠性评价模型,采用本文所用的离心机处于健康状态下的运行数据进行仿真,评价结果不准确且存在明显分层现象,也验证了工况类别对设备运行可靠性评价存在较大影响。因此本文所提方法在处理多工况运行的设备上效果更好。

5 工程应用

本文依托北京某公司离心机设备远程监控与运行可靠性评价项目,验证本文所提方法的有效性,将其集成到远程监控系统中并应用到选煤厂的离心机设备上。

首先采集离心机设备运行数据并传输到远程监控系统中,现场设备PLC 通过传感器采集得到设备运行状态参数,通过DTU 将数据上传至远程监控系统中。大型选煤厂一般将所有信号接回集控中心,小型选煤厂为节省布线成本,一般会在现场进行数据采集,现选用1 台WL1200 型卧式振动离心机和现场电气控制柜,完成设备控制、数据采集和数据远程传输。

离心机远程监控系统包括多个功能模块,离心机的部分重要运行数据可以直观得到。

使用Python 语言对运行可靠性评价相关算法完成编写后,将其嵌入到远程监控系统后台,通过程序调用实现对离心机设备的运行可靠性评价,选择界面左侧“设备信息管理”下的“运行可靠性评价”选项,选择对应的项目便可以查看该项目下所有设备的运行可靠性指数,同时运行状态异常的特征数据点也会显示在对应的设备上。

本文选取1 台由于主电机温度过高发出预警的设备进行验证。该设备在2020 年10 月12 日17 时发出主电机温度报警,图11 示出了故障前、后主电机温度的变化曲线。

图11 主电机绕组温度变化曲线Fig.11 Temperature change curve of main motor winding

得到故障发生前、后的设备ORI的变化曲线,如图12 所示。

图12 ORI 变化曲线Fig.12 ORI curve

由图12 可以看出,大概在17:00 左右温度超出阈值范围,触发报警,由图13 可以发现,随着绕组温度偏离正常温度区间,设备ORI逐渐减小,大约在13:30 左右,ORI已经低于正常运行状态。由此可以看出,本文所提方法可以有效地实现设备运行可靠性的评价,可以早于阈值报警发出故障预警,更早的识别出设备性能力恶化状况,起到提早发现故障的作用。

6 结论

(1)针对流体旋转机械运行可靠性的问题,提出了一种基于GMM 的运行可靠性的评价方法。

(2)以离心机设备为例进行实例分析,考虑到离心机运行过程中存在多种工况,为了提高评价模型的适用性和评价准确率,进行分工况处理,共得到5 种典型工况;为了降低模型的复杂度,提高效率,进行特征选择,从24 个监测参量中选择14 个特征参量作为评价指标参与高斯混合模型构建。最后基于马氏距离得到ORI,结果表明,当ORI低于0.857 时,便可认为离心机设备进入低可靠性运行阶段,且评价准确率达到98%以上。

(3)在实际应用中,本文所提方法可以提前预测设备的劣化状态,有效地帮助设备管理人员实时掌握当前设备的运行情况,及时做出维修决策。

猜你喜欢
离心机可靠性聚类
可靠性管理体系创建与实践
LP60型双级活塞推料离心机的研制与应用
基于DBSACN聚类算法的XML文档聚类
5G通信中数据传输的可靠性分析
基于高斯混合聚类的阵列干涉SAR三维成像
离心机转速及相对离心力的正确表示
基于可靠性跟踪的薄弱环节辨识方法在省级电网可靠性改善中的应用研究
ZPJ-40型高速转盘离心机减振技术
土工离心机研制概述
一种层次初始的聚类个数自适应的聚类方法研究