基于自动化机器学习的故障诊断系统研究

2024-10-01 00:00:00丁艳玲
无线互联科技 2024年18期

摘要:针对泵站监测系统缺少状态关系分析和故障诊断系统功能扩展性差的问题,文章研究实现了可自动构建诊断算法的故障诊断系统。在故障诊断领域,样本容易出现不平衡问题。为解决该问题,文章探索研究了样本平衡性检验方法、样本不平衡下算法训练和效果验证方法。通过研究基于遗传算法的自动化机器学习实现该功能,系统可以方便地实现功能扩展与更新。

关键词:监控平台;故障诊断;样本平衡;诊断算法

中图分类号:TP332 文献标志码:A

0 引言

南水北调工程属于国家战略性工程,具有巨大的社会意义与经济意义。泵站机组作为南水北调工程中的核心装置,其运行状况的好坏直接影响泵站的调水功能是否能够正常发挥。万一机组在抗洪救灾等紧急情况下出现故障,而且得不到及时的排查维修,那么会造成巨大的经济损失和社会负面影响。对于梯级泵站,由于运行方式是串联,如果某一级泵站机组出现故障,将影响到梯级泵站中的其他泵站乃至整个调水工程的正常运行[1]。

从有关故障诊断技术的国内外研究现状可知,诊断技术多种多样,有在简单故障诊断任务中应用的专家系统,有基于数据驱动的机器学习和深度学习,有综合多种故障诊断算法的方法。相比专家系统,机器学习方法能诊断更加复杂的故障,相比深度学习方法,机器学习方法对故障样本数据量的需求少很多[2]。本文研究对象泵站机组具有大型化、政策性开停性和故障发生率低的特点,因此主要研究基于数据驱动的机器学习故障诊断算法。

1 泵站机组故障诊断简介

泵站机组是主泵体、主电机和辅助设备的总称。在泵站中使用的水泵有很多类型,有离心泵、轴流泵和混流泵等,其中,轴流泵因具有流量大、扬程低的特点在南水北调东线工程中被大量使用。

轴流泵的工作是以流体力学为基础的。其叶片截面与机翼的形状相似,称之为翼型。根据流体力学知识,当流体流过流线型翼型时,会在翼型的首端处分成两股流,它们分别经过翼型的上表面和下表面,由于沿翼型下表面的流程要比上表面流程长一些,会造成翼型下面流速大、压力小,上面流速小、压力大[3]。这样在不断高速旋转运动的翼型叶片的作用下,流体因获得能量而被提升。

2 状态监测平台组成

泵站机组状态监测平台须要对机组的各种状态数据进行采集处理、存储和预警,以保障机组正常运行。在硬件方面,首先选择合适的传感器安装在合适部位。为保证数据在传输存储过程中的准确性和稳定性,就要选择合适的数据传输和存储硬件。在软件技术部分,数据采集传输会涉及与下位机的通信,状态报警需要专家系统的支持。监测平台结构系统组成如图1所示。

本项目所用状态监控平台为中水三立数据股份有限公司的SCADA平台,该平台共提供8个状态监测数据表:报警事件表、人员操作事件表、数据查询事件表、变量值上下限设定表、机组运行数据实时记录表、公共参数表、供配电信息表、叶片调节事件表[4]。公共参数表中包括油温、水位、泵站扬程、总抽水量和相关水位、轴流泵电机功率。样本平衡性检验结构如图2所示。

3 自动化机器学习故障诊断算法

基于自动化机器学习的故障诊断系统既具有故障诊断算法训练功能,也具有算法部署功能[5]。可以使用自动化机器学习方法找出最优机器学习流程,并将该流程训练好保存下来,然后使用Web服务器对故障诊断算法进行部署。基于自动化机器学习的故障诊断系统工作流程如图3所示。

在自动化机器学习方法中使用遗传算法就是将一个机器学习流程作为个体,将一定数量机器学习流程组成的集合作为种群,使用遗传算法里的选择、交叉和变异产生新的机器学习流程种群,不断重复此过程对流程种群进行迭代,最终将得到指定代数内最优的机器学习流程[6]。

4 系统功能模块的实现

系统日志管理工具使用Logging模块实现(主要使用Logging下的logger对象),logger对象可以避免多个程序使用同一个日志文件时产生重复记录的问题。系统日志管理工具被打包成一个独立的文件,方便不同任务的复用[7]。实现的系统日志管理工具如下:

配置文件的格式有ini、toml、yaml、json和xml等,其中ini格式最为简单直观,本文使用的配置文件就是ini格式。故障数据库里存放泵站机组多个部件的故障数据,一个数据库里有多张数据表,每个数据表以部件名称命名[8]。

平衡性检验是对故障数据进行统计,让使用者了解故障数据的类间和类内分布。平衡性检验工具的实现是先使用Pandas筛选数据,然后使用Collections模块的Counter工具进行统计。

故障特征提取工具以独立的代码文件形式进行存放,该工具是多个特征提取函数的集合。想使用哪个特征提取函数,只须要在配置文件里指定函数名;若使用的函数不存在,模仿已有的函数添加编辑即可[9]。通过这样的设计,无须更改主函数就可改变系统功能。泵轴故障特征提取函数如下:

使用泵轴故障数据对本文实现的故障诊断系统结果进行测试,横坐标代表机器学习流程组成的种群代数,纵坐标代表每代种群中最优机器学习流程的AUC评分[10]。通过测试可以发现,机器学习流程优化的速度一开始比较快,后来逐渐变缓直至稳定。

5 结语

本文以水利工程泵轴故障数据为例,分析了转子不对中、转子不平衡等故障的产生原因与表现特征,设计了泵轴故障特征提取方法。泵站机组结构复杂、组件众多,导致状态关系复杂、故障类型多样。通过使用数据挖掘和自动化机器学习技术,本文在状态关系分析与故障诊断技术上取得了一定进展,后续将进一步研究更多的故障特征提取方法。

参考文献

[1]杨茜芝.基于运行监控数据分析的风电机组状态监测[D].吉林:华北电力大学,2017.

[2]史杰.基于模糊层次法的水泵机组维修评价模型研究[J].科技风,2011(14):45-46.

[3]孟德远,赵武.基于神经网络和专家系统的乳化液泵站故障诊断研究[J].煤矿机械,2008(10):218-220.

[4]张鹏乐.基于最大联合信息系数的多元数据关联性分析方法及应用研究[D].长沙:国防科学技术大学,2015.

[5]刘勇,任文锋,卢娜.基于改进RBF神经网络的泵站机组故障诊断[J].中国农村水利水电,2013(5):145-148.

[6]秦正飞.基于SVM智能混合方法的水电机组故障诊断与预测研究[D].昆明:昆明理工大学,2016.

[7]田源.水电机组智能故障诊断方法与振动趋势预测研究[D].成都:西华大学,2013.

[8]孙文回.基于深度学习模型的感应电机故障诊断方法研究[D].南京:东南大学,2017.

[9]龚志鹏.大型污水输送泵站的智能控制模型和优化运行研究[D].上海:同济大学508f7b88e6715bf8f168ece4f59cbc7e,2007.

[10]朱文龙.水轮发电机组故障诊断及预测与状态评估方法研究[D].武汉:华中科技大学,2016.

Research on fault diagnosis system based on automated machine learning

Abstract: In response to the lack of state relationship analysis and poor functional scalability of the fault diagnosis system in the pump station monitoring system, this paper studies and implements a fault diagnosis system that can automatically construct diagnostic algorithms. In the field of fault diagnosis, samples are prone to imbalanced issues. To address this issue, explore and study methods for sample balance testing, algorithm training under sample imbalance, and effectiveness verification. By studying automated machine learning based on genetic algorithms to achieve this function, the system can easily expand and update its functions.

Key words: monitoring platform; fault diagnosis; sample balance; diagnostic algorithm