摘要:水泵是供水系统的重要加压设备,对其进行异常检测并及时发现运行异常,对保障供水安全具有重要意义。针对现有人工智能方法在水泵异常检测中存在的异常样本获取困难、检测精度低等问题,提出一种基于特征分布对齐与多传感器融合的水泵异常检测方法。该方法以多通道传感信号的对数梅尔谱为输入;利用卷积自编码网络来融合多传感器信息;以最小化信号重构损失和特征分布损失为目标,训练卷积自编码网络;基于重构损失计算样本的异常分数,实现水泵的异常检测。实验结果表明,该方法有效提高了水泵异常检测的性能。
关键词:水泵异常检测;数据重构;特征分布对齐;多传感器融合
中图分类号:TP311.5 """"""""""文献标志码:A """""""""文章编号:1674-2605(2025)01-0005-06
DOI:10.3969/j.issn.1674-2605.2025.01.005""""""""""""""""""""开放获取
Water"Pump Anomaly Detection Method Based on Feature Distribution Alignment and Multi-sensor Fusion
LIN Zhaohui LIAO"Yixiao ZHAO Zhiming WAN Zhiyong ZHOU"Songbin
(1.Shimen Waterworks, Guangzhou Water Supply Co.,"Ltd., Guangzhou 510000, China
2.Institute of Intelligent Manufacturing, Guangdong Academy of Sciences, Guangzhou 510070, China)
Abstract:"The water pump is an important pressurization device in the water supply system. Conducting anomaly detection and timely detection of operational abnormalities is of great significance for ensuring water supply safety. A water pump anomaly detection method based on feature distribution alignment and multi-sensor fusion is proposed to address the problems of difficulty in obtaining anomaly samples and low detection accuracy in existing artificial intelligence methods for water pump anomaly detection. This method takes the logarithmic Mel spectrum of multi-channel sensing signals as input; Using convolutional autoencoder networks to fuse multi-sensor information; Train a convolutional autoencoder network with the goal of minimizing signal reconstruction loss and feature distribution loss; Calculate the anomaly score of samples based on reconstruction loss to achieve anomaly detection of water pumps. The experimental results show that this method effectively improves the performance of water pump anomaly detection.
Keywords:"anomaly"detection of water pump; data reconstruction; feature distribution alignment; multi-sensor fusion
0 "引言
水泵是供水系统的核心设备,其非计划停机不仅会给水厂造成经济损失,还会影响人们的日常生活和工业生产秩序[1-2]。通过对水泵进行异常检测和故障诊断,可降低因设备故障而引发的非计划停机频率,提高水厂的运维效率,保障供水安全[3]。
近年来,随着人工智能技术的发展,学者们针对水泵的异常检测和故障诊断开展了大量的研究工作[4]。文献[5]通过稀疏自编码网络重构输入信号,利用重构信号与原始信号的残差对水泵进行异常检测,可有效识别水泵的早期异常。文献[6]利用振动信号频谱和振动时域特征来检测水泵轴承的异常,实现水泵的实时健康监测。文献[7]提出基于自校准注意力机制和分布边缘预测策略的故障诊断方法,在小样本场景下实现了水泵的故障诊断。文献[8]针对小样本下的水泵故障诊断,提出基于深度迁移卷积神经网络和支持向量机的故障诊断方法,可有效识别水泵的异常状态。文献[9]提出基于小波相关分析和卷积神经网络的离心泵故障诊断方法,提高了离心泵故障的识别精度。文献[10]提出改进的辛几何重构数据增强方法,用于水泵的故障诊断,提高了故障诊断模型的精度和收敛速度。上述方法大多需要异常样本参与模型训练,但在实际工业场景中,难以获得大量的异常样本,无法满足模型高精度训练的需求。另外,基于信号重构的异常检测方法虽然不需要异常样本参与模型训练,但未充分考虑隐藏层特征分布与多传感器融合,限制了异常检测的性能。
针对以上问题,本文提出一种基于特征分布对齐与多传感器融合的水泵异常检测方法(以下简称水泵异常检测方法)。该方法以多通道传感信号的对数梅尔谱为输入;利用卷积自编码网络来融合多传感器信息;以最小化信号重构损失和特征分布损失为目标,训练卷积自编码网络;基于重构损失计算样本的异常分数,实现水泵的异常检测。
1 "水泵异常检测方法
水泵异常检测方法以多通道传感信号的对数梅尔谱为异常检测模型的输入,并针对模型的输入特征,构建卷积自编码网络来融合多传感器信息,原理如图1所示。
异常检测模型的输入为多通道的二维数据,编码器网络由多个二维卷积层和二维池化层堆叠而成,解码器网络由多个二维反卷积层和二维反池化层堆叠而成。利用最小化输入多通道传感信号的对数梅尔谱和卷积自编码网络输出的重构对数梅尔谱之间的重构损失,以及编码器网络倒数第2层输出特征及其重构特征之间的特征分布损失,训练异常检测模型。
由于异常样本不参与模型训练,训练后的异常检测模型仅对正常样本具有良好的重构能力,无法有效重构异常样本与正常样本之间的差异特征。因此,在异常检测模型训练完成后,通过输入和重构之间的均方误差来实现水泵的异常检测。
1.1 "对数梅尔谱
1.2""卷积自编码网络
1.3""特征分布对齐
1.4""水泵异常检测方法流程
1.4.1 "模型训练流程
1) 对正常和异常样本进行分割和去直流预处理,获取对数梅尔谱样本,并对该样本进行标注;
2) 将部分正常样本划分为训练数据集,用于异常检测模型的训练,剩余的正常样本与异常样本组成测试数据集,用于异常检测模型的测试;
3) 从训练数据集中选取一批次的训练数据,通过前向传播计算该批次数据的损失值,并利用梯度下降法反向传播损失值训练卷积自编码网络;
4) 重复步骤2),以遍历整个训练数据集;
5) 重复步骤2)、3),直至迭代次数达到设定值,获得最终的异常检测模型。
1.4.2 "模型测试流程
2""实验设置
本实验采用公开数据集MIMII[15]中的水泵数据集对本文方法进行验证。该数据集包含4台水泵(编号分别为00、02、04、06)运行状态的声音数据。每个声音数据样本包含8通道声音信号,采样频率为16"kHz,样本长度为10"s。水泵数据集的具体描述如表1所示。
2.1 "数据集划分与预处理
将水泵数据集划分为训练集和测试集,划分详情如表2所示。
实验中,将水泵的原始声音信号转换为对数梅尔谱,设置傅里叶变换的窗口长度为2"048个样本点,滑动窗口的步长为1"580个样本点,梅尔特征维度为128。对对数梅尔谱进行逐通道的最大-最小归一化,得到异常检测模型的输入维度为8×128×100。
2.2""网络结构参数
本文采用的卷积自编码网络结构参数如表3所示。
除最后一个二维反卷积层ConvT2D(64, 8, (9, 9))采用线性激活函数外,其他卷积层均采用Leaky_"ReLU激活函数。
2.3""评价指标
本实验采用ROC曲线下与坐标轴围成的面积(area under curve, AUC)、精确度(precision)、召回率(recall)、F1分数(F1-score)作为异常检测模型的性能评价指标。
本实验采用DCASE2020比赛提出的阈值确定方法对训练样本的异常分数进行分布统计,取最佳分布的90%分位点对应的数值作为异常阈值。基于此阈值判定样本为正常或异常,并结合样本实际标签计算精确度、召回率、F1分数等评价指标。
3""实验结果分析
为验证本文方法的有效性,与文献[16]方法(DAE)进行对比实验,结果如表4~7所示。
4""结论
本文针对水泵异常检测存在的异常样本获取困难、检测精度低等问题,提出了一种基于特征分布对齐与多传感器融合的水泵异常检测方法。经实验验证,本文方法通过特征分布对齐与多传感器融合,有效提高了水泵异常检测的性能。该方法的主要贡献如下:
1) 异常检测模型在训练过程中,仅需要正常样本参与训练,无需异常样本参与训练,降低了训练数据获取难度,有利于模型在实际工业现场的推广应用;
2) 融合多传感器信息,全面获取水泵的健康状态信号,提高了异常检测模型的检测能力;
3) 结合隐藏层特征分布对齐策略,使卷积自编码网络能更好地重构正常样本,增大正常、异常样本的判定边界。未来可以结合迁移学习开展水泵异常检测研究,利用现有的水泵数据和异常检测模型,在仅采集少量或不采集水泵正常样本的情况下,构建目标水泵的异常检测模型,以提高异常检测精度。
©The author(s) 2024. This is an open access article under the CC BY-NC-ND 4.0 License (https://creativecommons.org/licenses/ by-nc-nd/4.0/)
参考文献
[1] 顾祖坤.基于无线传感网络的水泵振动状态监测系统设计[D].江苏:江苏大学,2018.
[2] 刘煜辉,高艳强.多传感器融合的工业生产线故障预警技术 [J].自动化与信息工程,2024,45(2):41-44.
[3] 郑日晖,岑健,陈志豪,等.基于EMD样本熵与改进DS证据理论的故障诊断方法[J].自动化与信息工程,2020,41(2):19-26.
[4] 范国栋,李博涵.基于机器学习的工业机械设备故障预测方法[J].自动化与信息工程,2023,44(4):13-18;50.
[5] LIANG X, DUAN F, BENNETT I, et al. A sparse autoencoder-based unsupervised scheme for pump fault detection and isolation[J]. Applied Sciences, 2020,10(19):6789.
[6] 舒相挺,杨璋,徐逸哲,等.某循环海水泵振动故障诊断与趋势分析[J].振动.测试与诊断,2022,42(4):791-796;831.
[7] ZOU F, SANG S, JIANG M, et al. A few-shot sample augmentation algorithm based on SCAM and DEPS for pump fault diagnosis[J]. ISA Transactions, 2023,142:445-453.
[8] 吴佳,李明宸,唐文妍.基于DTCNN-SVM的工业循环水系统供水泵故障诊断[J].振动与冲击,2023,42(13):226-234.
[9] ULLAH N, AHMAD Z, SIDDIQUE M F, et al. An intelligent framework for fault diagnosis of centrifugal pump leveraging wavelet coherence analysis and deep learning[J]. Sensors, 2023,23(21):8850.
[10] LIU S, YIN J, HAO M, et al. Fault diagnosis study of hydraulic pump based on improved symplectic"geometry reconstruction data enhancement method[J]. Advanced Engineering Infor-matics, 2024,61:102459.
[11]"DENG J, CUMMINS N, HAN J, et al. The university of Passau open emotion recognition system for the multimodal emotion challenge[C]//Pattern Recognition: 7th Chinese Conference, CCPR 2016, Chengdu, China, November 5-7, 2016, Proceed-ings, Part II 7. Springer Singapore, 2016: 652-666.
[12] MAO X, SHEN C, YANG Y B. Image restoration using very deep convolutional encoder-decoder networks with symmetric skip connections[J]. Advances in Neural Information Processi-ng Systems, 2016,29:1-9.
[13]"MÜLLER A. Integral probability metrics and their generating classes of functions[J]. Advances in Applied Probability, 1997, 29(2):429-443.
[14] GRETTON A, BORGWARDT K, RASCH M, et al. A kernel method for the two-sample-problem[J]. Advances in Neural Information Processing Systems, 2006,19:1-43.
[15] PUROHIT H, TANABE R, ICHIGE K, et al. MIMII Dataset: Sound dataset for malfunctioning industrial machine investi-gation and inspection[C]. Proceedings of the Detection and Classification of Acoustic Scenes and Events 2019 Workshop (DCASE2019), 2019:209-213.
[16]"DONG Yul Oh, Il DONG Yun."Residual error based anomaly detection using auto-encoder in SMD machine sound[J]. Sen-sors, 2018,18(5):1-14.
作者简介:
林朝晖,男,1968年生,硕士研究生,高级工程师,主要研究方向:水处理技术。E-mail:"feyln@139.com
廖奕校,男,1992年生,博士研究生,主要研究方向:智能传感与检测。E-mail:"yx.liao@giim.ac.cn
招智铭(通信作者),男,1995年生,本科,工程师,主要研究方向:电气自动化技术。E-mail:"960716032@qq.com
万智勇,男,1996年生,硕士研究生,助理工程师,主要研究方向:智能传感与检测。E-mail:"zy.wan@giim.ac.cn
周松斌,男,1978 年生,博士研究生,研究员,主要研究方向:智能传感与检测。E-mail: sb.zhou@giim.ac.cn