基于TrellisNet和注意力机制的电力设备故障检测模型

2024-12-14 00:00:00罗金满叶思琪王海彬黎玉青封祐钧
南京信息工程大学学报 2024年6期
关键词:长短期记忆网络注意力机制故障检测

摘要电力设备故障检测模型的性能受到多种因素的影响,如故障种类的多样性、故障特征的复杂性和图像质量的差异等.为此,本文提出一种基于TrellisNet和注意力机制的新型电力设备故障检测模型.首先,将长短期记忆(Long Short-Term Memory,LSTM)网络和卷积神经网络(Convolutional Neural Network,CNN)进行融合,构建LSTM-CNN来获取图片中的故障特征,以有效区分不同故障类型的特征,并减少噪声和干扰因素的影响.然后,将LSTM-CNN获得的特征数据作为输入,并将注意力机制嵌入到TrellisNet中,构建具有高分辨能力的AT-TrellisNet网络来检测不同电力设备的故障类型.最后,选取5种常见的电力设备故障进行模型验证.实验结果显示,本文模型与一些现有的检测模型相比,检测精确率较高,最高可达90%以上,可满足实际电力设备故障检测需求.

关键词故障检测;TrellisNet;长短期记忆网络;卷积神经网络;注意力机制;图像识别

中图分类号TP183;TM507

文献标志码A

0 引言

目前,基于计算机视觉的配网设备故障自动识别已经成为配网设备状态监测和故障预警的重要手段. 对于故障检测,计算机视觉提供了一种高效、准确的方法用来监测设备的状态、识别异常情况,并及时预警或报警.特别是在高温、高压等高风险的环境中,计算机视觉技术可以替代人工进行实时、安全的监测.计算机视觉算法通过特征提取和识别[1-2],为故障检测带来了极大的便利.近年来,卷积神经网络(Convolutional Neural Network,CNN)在图像识别与检测方面应用广泛[3-4].与人工特征提取方法相比,能够自动学习图像特征的神经网络可以有效地减少工作量以及降低特征提取误差.2015年,冯俊[5]基于红外图像分析提出一种电力设备故障检测方法,通过设备的温度不同,相对应的红外图像不同的原理进行故障诊断.但是该方法对温度较为敏感,检测失误率较高.2017年,旷可嘉[6]利用CNN进行缺陷检测,可以检测出缺陷的种类和缺陷的相对位置,但准确率较低.同年,芦竹茂等[7]基于设备红外图像和温度系数修正方法提出一种电力设备故障检测方法,通过识别电力设备并给出温度区间来检测故障,精度较高.但是红外图像只适合温度变换,对于常温设备无法检测.2021年,Ji等[8]通过均匀分布的卷积神经网络对铸件X光照片进行缺陷检测,在背景简单的情况下效果较好,但是在检测电力设备故障的实际应用中,由于设备所处环境复杂,各种故障难以分辨.2022年,陈富国等[9]利用YOLO v3对电力设备状态进行检测,通过分析设备特性和故障特性对算法进行优化,使得故障识别率达到90%.但是该方法对设备种类要求较为严格,局限性较大.上述方法仅通过红外图像检测设备是否存在故障,或者仅检测某个固定位置的状态,但由于电力设备种类多,每种设备的故障类型各不相同,且故障的位置和大小也各不相同,故障检测的难度非常大,因此,上述方法无法满足实际电力设备故障检测需求.

本文提出一种基于TrellisNet和注意力机制的新型电力设备故障检测模型.该模型首先使用长短期记忆(Long Short-Term Memory,LSTM)网络和CNN构建LSTM-CNN来获取图片中的故障特征;然后将注意力机制引入到TrellisNet中构建AT-TrellisNet来达到增强模型的故障检测能力的目的;最后将获得的特征输入到AT-TrellisNet中进行训练.实验结果表明,该模型的检测精确率高于现有的检测模型"""(ED-CNN、Dense-YOLO和DCNN-3),可用于实际电力设备的故障检测.

1 相关工作

TrellisNet是一种特殊的时间卷积网络,它具有两个不寻常的特征.首先,权重是跨层绑定的.也就是说,权值在所有的网络层上都被共享,而不仅仅是共享所有的时间步长,并且它们被绑定到一个规则Trellis模型上.其次,将输入信息注入所有的网络层中.也就是说,在给定的时间步长下的输入不仅提供给第1层,而且还直接提供给网络中的所有层.

在最基本的层上,一个特征向量z(i+1)t+1在TrellisNet的时间步骤t+1和i+1层是通过3步计算的,如图1所示.

通过在时间和深度上构建上述基本过程来建立一个完整的TrellisNet,如图2所示.

需要注意的是,在TrellisNet每一层都注入了相同的输入序列,可以预先计算出所有层i的线性变换xt+1=Wx1 xt+Wx2 xt+1.

在网络的每一层上,对隐藏单元zi1:T 进行一维卷积,层i计算总结如下:

2 基于TrellisNet和注意力机制的电力设备故障检测模型

2.1 注意力机制

学习故障特征是为了更好地捕获有效的信息.根据输入故障特征的重要性,需要对每个特征配备不同的权重,即,注意机制会权衡输入特征的重要性,并将更大的权重赋予对结果影响较大的特征.然而,在本文模型中直接应用注意力机制是不合适的,因为故障类型会根据设备种类的变化而变化.

本文引入一种遵循两种数据结构的特征注意力机制,希望能够准确判断故障类型与不同电力设备类型之间的关系,其结构如图3所示.图3中:{e1,e2,…,eN}表示特征数据的向量;es表示设备类型向量;{w1,w2,…,wN}是输入数据{e1,e2,…,eN}和es经过激活单元所计算出的权重;ws是设备类型对应的权重;代表向量乘积.模型输入分为故障特征数据和设备类型数据两部分.激活单元层用来计算故障类型和设备类型之间的权重,可以认为是一个独立的神经网络,如图4所示.两个通道的es是相同的,表示对应关系.

在激活单元中,故障特征数据是输入量之一,是注意机制的key向量.同时,设备类型是另一个输入,即查询向量.在数学上,特征数据的向量变成了设备类型向量的函数,即:

其中:a(·)表示前馈神经网络;ei表示故障特征数据向量;wj表示ei和es的权重;ws表示设备类型的权重;es表示设备类型向量;s表示设备类型;S表示将设备类型数据作为函数的自变量.

2.2 AT-TrellisNet模型

根据故障图像数据的输入特征可以判断故障类型.因此,不同设备的故障类型可以看作是一个时间序列[10-11].TrellisNet网络的结构集成了CNN和RNN,可以将CNN和RNN的优点继承下来.因此,在多项式序列建模问题上,它优于目前的CNN、RNN和自注意模型.为了提取故障类型之间的关系,本文举例说明一个基于注意力的TrellisNet网络.图5为注意力TrellisNet(Attention TrellisNet,AT-TrellisNet)模型.AT-TrellisNet由一个输入层、一个注意力机制层、一个网络层、一个全连接层和一个输出层组成.首先,将数据集输入输入层,并对其进行归一化处理.然后将归一化后的数据输入注意力机制层,利用注意力机制提取特征并计算相应的权重,随后输出加权后的数据序列.再将数据序列输入TrellisNet层,学习故障图像的特征.最后通过全连接层,将上一层计算出的特征空间映射到样本标签空间.为了使检测效果更好,在输入层之前,需要将故障图像数据输入LSTM-CNN进行特征提取.也就是将故障图片先输入LSTM中,然后将LSTM的输出作为CNN的输入.因为电力设备故障图像不仅种类繁多,而且细节复杂,因此,为了能更好地提取细节特征,CNN卷积层中卷积核为3×3,LSTM单元数与卷积核宽度相同,也为3.卷积步长设置为1,填充类型为“SAME”类型,池化操作选择最大池化.

由于LSTM在循环网络中具有较好的效果,因此在AT-TrellisNet模型中使用LSTM作为一个非线性激活函数单元.LSTM网络的具体结构如图6所示.

在LSTM中,三个信息控制门同时在t时刻进行计算.其中,输入门单元状态不参与隐藏-隐藏的转换,而是使用激活结果进行更新,具体的计算公式如下:

2.3 算法评价指标

为了全面而公正地评估模型的性能,本文选取精确率(Precision,P)和召回率(Recall,R)作为核心评价指标.精确率,即模型正确分类样本的概率,其数值大小直接反映了模型在识别设备故障类型时的准确度.根据式(13)的定义,精确率的提升意味着模型能够更加精确地识别出各种故障类型.而召回率,作为另一个重要评价指标,它衡量了模型检测到所有真实故障类型的能力.根据式(14)的定义,召回率的提高意味着模型在故障检测方面的能力得到了增强,从而降低了漏检的可能性.通过综合考虑精确率和召回率,能够更加全面地了解模型的性能表现.

其中:TP表示正确判断故障类型的次数;FP表示错误判断故障类型的次数;FN表示判断故障为正常的次数.

此外,为了更准确评估预测效果,本文还使用了均方误差(MSE)、平均绝对误差(MAE)、R平方(R2)、均方根误差(RMSE)和平均绝对百分误差(MAPE)来评估模型的性能.

3 仿真实验

3.1 实验准备

1)数据集

电力设备场所环境复杂,且相同功能设备的厂家不同,样式也就不同,这就给检测工作带来了困难.实验采集3 000张包含5种电力设备常见故障的原始电力设备故障图像并人工给出相应的故障类型标签,如表1所示.一些受噪声等因素影响的电力设备图像质量较差,为了便于模型学习训练数据集中各种电力设备故障特征,先对拍摄图像进行亮度、颜色、对比度和锐度的增强.因为数据集中不同类型图像数量的均匀性对模型训练结果影响较大,所以为了尽可能使图像数据均匀分布,并让模型的泛化能力增强,通过镜像和旋转的方式对数据集进行扩展,并做无序化打乱处理,使数据集总数量达到30 000.随机选取扩展后的数据集中80%的数据作为训练集,选取20%的数据作为测试集.

2)硬件条件

操作系统为Windows 10,CPU型号为Intel Xeon Gold 5218,内存64 GB,GPU型号为GeForce RTX 2080Ti,显存容量为11 GB,采用TensorFlow深度学习框架.

3.2 实验结果分析

随机选取一张有故障的电力设备图像,并用训练好的AT-TrellisNet故障检测模型对其进行检测.识别结果如图7所示.其中,图7a为电表外壳出现破损原图,图7b为检测后的结果.由图7可以看出,本文的模型正确检测出了图像中的故障,并给出了故障类型,达到了预期的要求.

除此之外,将本文方法与ED-CNN[3]、Dense-YOLO[12]和DCNN-3[13]]方法进行故障分类效果比较.在对各模型输入电力设备故障数据集进行学习后,可以得到其平均损失曲线,结果如图8所示.由图8可知:本文模型在前2 000次的迭代中,平均损失迅速下降,并且随着训练次数的增加,本文模型平均损失值快速下降至0.2左右,远小于其他模型;其他模型的平均损失在迭代次数达到3 000左右才开始趋于缓慢下降,且最终平均损失均在0.5以上,远高于本文模型的平均损失.这一结果显示了本文所提模型的优越性.图9为模型的精确率召回率曲线,可以看出本文模型的P-R曲线面积最大,也反映了该模型性能的优越性.

表2中列出了各模型对5种故障类型的识别精确率.可以看出,由于故障类别2和类别3的特征相对较为明显,学习起来也相对容易,因此故障类别2和3的识别精确率超过90%,而故障类型1、4和5,由于面积和形状变化较大,且比较相似,故难以分辨,且因为设备的相似性也容易相互混淆,所以其识别精确率相对较低.但是总的来说,本文模型在不同故障类型的检测上都比其他模型具有更高的精确率.表3显示了不同模型识别不同故障类型的召回率,因为随着精确率的提高召回率会下降[14-18],所以本文模型对不同故障类型的召回率最低.

从模型的故障识别的精确率和召回率对比中可以看出,本文方法在所有实现的方法中检测性能最好,对各故障识别的精确率都相对较高.与其他的方法相比,本文方法不仅在整体图像上实现了故障目标的检测和定位,而且实现了故障目标的分类,在检测中取得了较好的效果.但是由于电力设备图像中目标尺寸的差异很大,难以精确学习其特征,要实现准确分类是一个很大的挑战.由表4可以看出,与其他模型相比,AT-TrellisNet模型识别电力设备故障类型平均精确率最高,平均召回率最低,该模型的优越性得到了进一步的验证.由表5可以看出,本文模型与其他几个模型相比,在各个指标上都表现出了较好的性能,进一步验证了AT-TrellisNet模型的优越性.

4 结论

本文提出一种新型的电力设备故障检测模型——AT-TrellisNet,并对5种常见电力设备故障进行检测.该模型通过引入一个激活单元来使TrellisNet和注意力机制相结合.为了更好地获得图像特征并减少计算量,使用LSTM-CNN获取图像中的故障特征作为AT-TrellisNet的输入.将本文方法与其他3种方法进行比较,结果表明,AT-TrellisNet的检测精确率较高,可满足实际需要.当前的模型主要关注电力设备的横向分类(不同类型设备的故障检测),未来将会考虑引入纵向扩展模块,对设备进行纵向分类(如设备健康状态评估、故障严重程度评估等),使得模型具有更全面的设备状态监测能力.

参考文献References

[1]Duan J J,Shi D,Diao R S,et al.Deep-reinforcement-learning-based autonomous voltage control for power grid operations[J].IEEE Transactions on Power Systems,2020,35(1):814-817

[2] Yang B Y,Liu R N,Zio E.Remaining useful life prediction based on a double-convolutional neural network architecture[J].IEEE Transactions on Industrial Electronics,2019,66(12):9521-9530

[3] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):84-90

[4] Shao H D,Jiang H K,Zhao K,et al.A novel tracking deep wavelet auto-encoder method for intelligent fault diagnosis of electric locomotive bearings[J].Mechanical Systems and Signal Processing,2018,110:193-209

[5] 冯俊.基于图像分析的电力设备故障检测技术研究[J].现代电子技术,2015,38(24):7-11

FENG Jun.Research on power equipment fault detection technology based on image analysis[J].Modern Electronics Technique,2015,38(24):7-11

[6] 旷可嘉.深度学习及其在航空发动机缺陷检测中的应用研究[D].广州:华南理工大学,2017

KUANG Kejia.Research on deep learning and its application on the defects detection for aero engine[D].Guangzhou:South China University of Technology,2017

[7] 芦竹茂,王天正,俞华,等.基于红外图像分析的电力设备热故障检测技术研究[J].现代电子技术,2017,40(11):123-126

LU Zhumao,WANG Tianzheng,YU Hua,et al.Research on electrical equipment thermal fault detection technology based on infrared image analysis[J].Modern Electronics Technique,2017,40(11):123-126

[8] Ji X Y,Yan Q Y,Huang D,et al.Filtered selective search and evenly distributed convolutional neural networks for casting defects recognition[J].Journal of Materials Processing Technology,2021,292:117064

[9] 陈富国,蔡杰,李中旗.基于机器视觉的高压隔离开关设备状态判别与故障诊断技术[J].微型电脑应用,2022,38(2):191-194

CHEN Fuguo,CAI Jie,LI Zhongqi.State discrimination and failure recognition technology of high voltage disconnector equipment based on machine vision[J].Microcomputer Applications,2022,38(2):191-194

[10] Goodfellow I J,Pouget-Abadie J,Mirza M,et al.Generative adversarial networks[J].arXiv e-Print,2018,arXiv:1406.2661

[11] Bai S J,Kolter J Z,Koltun V.Trellis networks for sequence modeling[J].arXiv e-Print,2018,arXiv:1810.06682

[12] 仇旭阳,黄影平,郭志阳,等.基于深度学习的障碍物检测与深度估计[J].上海理工大学学报,2020,42(6):558-565

QIU Xuyang,HUANG Yingping,GUO Zhiyang,et al.Obstacle detection and depth estimation using deep learning approaches[J].Journal of University of Shanghai for Science and Technology,2020,42(6):558-565

[13] 张西宁,刘书语,余迪,等.改进深度卷积神经网络及其在变工况滚动轴承故障诊断中的应用[J].西安交通大学学报,2021,55(6):1-8

ZHANG Xining,LIU Shuyu,YU Di,et al.Improved deep convolutional neural network with applications to bearing fault diagnosis under variable conditions[J].Journal of Xi’an Jiaotong University,2021,55(6):1-8

[14] Wen L,Li X Y,Gao L.A transfer convolutional neural network for fault diagnosis based on ResNet-50[J].Neural Computing and Applications,2020,32(10):6111-6124

[15] Wang B,Lei Y G,Yan T,et al.Recurrent convolutional neural network:a new framework for remaining useful life prediction of machinery[J].Neurocomputing,2020,379:117-129

[16] 韩金磊,熊萍萍,孙继红.基于LSTM和灰色模型的股价时间序列预测研究[J].南京信息工程大学学报(自然科学版),2023,15(6):631-642

HAN Jinlei,XIONG Pingping,SUN Jihong.Stock price time series prediction based on LSTM and grey model[J].Journal of Nanjing University of Information Science & Technology (Natural Science Edition),2023,15(6):631-642

[17] Wang Z J,Zhou J,Wang J Y,et al.A novel fault diagnosis method of gearbox based on maximum kurtosis spectral entropy deconvolution[J].IEEE Access,2019,7:29520-29532

[18] 冉瑞生,石凯,江小鹏,等.基于双注意力CrossViT的微表情识别方法[J].南京信息工程大学学报(自然科学版),2023,15(5):541-550

RAN Ruisheng,SHI Kai,JIANG Xiaopeng,et al.Micro-expression recognition based on dual attention CrossViT[J].Journal of Nanjing University of Information Science & Technology (Natural Science Edition),2023,15(5):541-550

A fault detection model for power equipment based on TrellisNet and attention mechanism

Abstract The performance of power equipment fault detection models is affected by various factors including fault type,fault complexity,and image quality.Here,a fault detection model based on TrellisNet and attention mechanism is proposed for power equipment.First,Long Short-Term Memory (LSTM) is integrated with Convolutional Neural Network (CNN) to construct LSTM-CNN to obtain fault characteristics in images,which can effectively distinguish features of different fault types and reduce the influence of noise and other interference factors.In addition,the feature data obtained by LSTM-CNN are used as input,and by embedding the attention mechanism into TrellisNet,an AT-TrellisNet network with high resolution is constructed to detect the fault type of different power equipment.Finally,five common power equipment faults are selected for model validation.The experiment results show that compared with some existing detection models,the proposed model has higher detection accuracy,with a maximum of over 90%,which can meet the actual needs of power equipment fault detection.

Key words fault detection;TrellisNet;long short-term memory (LSTM);convolutional neural network (CNN);attention mechanism;image recognition

猜你喜欢
长短期记忆网络注意力机制故障检测
多种算法对不同中文文本分类效果比较研究
软件导刊(2019年5期)2019-05-24 14:17:58
基于深度学习的问题回答技术研究
餐饮业客流预测的深度联合模型
商情(2018年47期)2018-11-26 09:12:38
基于LSTM?Attention神经网络的文本特征提取方法
基于LSTM的媒体网站用户流量预测与负载均衡方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
软件工程(2017年11期)2018-01-05 08:06:09
InsunKBQA:一个基于知识库的问答系统
基于LSTM自动编码机的短文本聚类方法
电子电路的故障检测技术
新型探测线圈浅析
科技视界(2016年21期)2016-10-17 17:53:37