基于分布式光纤传感系统的有载变压器故障检测技术研究

2023-10-26 08:30董贯雷姜晓东孙鹏杨光耿俊琪王家文渠帅黄胜王晨尚盈
山东科学 2023年5期
关键词:故障检测模式识别神经网络

董贯雷 姜晓东 孙鹏 杨光 耿俊琪 王家文 渠帅 黄胜 王晨 尚盈

摘要:提出基于分布式光纤传感技术的人工神经网络有载变压器故障检测预报模型,通过人工模拟变压器的故障状态及正常运行状态,并通过k-means SMOTE数据扩充方法,可以有限扩充少量故障数据集,使故障数据量可以和正常数据量达到一致,将扩充后的故障数据与正常运行的数据一起送入长短期记忆卷积神经网络(convolutional neural networks long short term memory, CNN-LSTM)识别模型,最终可以将故障的识别率提升到100%,这对采用分布式光纖传感技术在有载变压器故障识别系统上的发展具有重要意义。

关键词:神经网络;分布式声传感器;有载变压器;故障检测;SMOTE算法;模式识别;数据增强

中图分类号:TN247   文献标志码:A   文章编号:1002-4026(2023)05-0052-08

On-load transformer fault detection based on distributed optical fiber sensing system

DONG Guanlei1,JIANG Xiaodong1,SUN Peng1,YANG Guang1,GENG Junqi1,WANG Jiawen2* ,

QU Shuai2, HUANG Sheng2, WANG Chen2, SHANG Ying2

(1. Zibo Power Supply Company,State Grid Shandong Electric Power Company,Zibo 255000, China;2.Laser Institute,Qilu University of Technology(Shandong Academy of sciences),Jinan 250014,China)

Abstract∶This paper proposes an artificial neural network-based fault detection and prediction model for on-load transformers using distributed fiber optic sensing technology. By artificially simulating the fault and normal operating states of transformers and using the k-means synthetic minority oversampling technique data expansion method, a small number of fault datasets can be limitedly expanded so that the amount of fault data can be consistent with that of normal data. Therefore, the expanded fault data and normal operation data can be input into the convolutional neural networks long short term memory identification model. Finally, the fault recognition rate can be increased to 100%, which has significant implications for the development of fault recognition systems for on-load transformers based on distributed fiber optic sensing technology.

Key words∶neural network; distributed acoustic sensor; on-load transformer; fault detection; smote; SMOTE algorithm; Pattern recognition; data enhancement

随着我国电力工业的快速发展和持续转型升级,电力系统的结构形态及运行日趋复杂,因电力设备故障而引发的系统事故也越来越多,造成了严重的经济损失和负面影响[1]。因此,为有效预防并减少电力设备故障的发生,需根据实际需求开展对其运行状态进行监测的技术研究工作,这对确保电力设备及电力系统的安全稳定运行具有重大意义。

电力变压器是电力系统中不可或缺的核心设备[2],具有不可替代的作用,其运行状况对整个供配电系统的可靠运行影响极大。其中,有载分接开关(on-load tap-changer,OLTC)作为变压器的重要部件[3],发挥着稳定负荷中心电压、增加电网灵活度、改善电能质量等重要功能。因此,OLTC 被广泛安装于重要的输、配电调压变压器中,有助于实现电网的安全稳定运行和电力的可靠供应。OLTC 运行可靠性随着运输、装配及投入使用之后受到大量的电气冲击和机械冲击逐渐降低,轻则调压失败,重则造成电力变压器的烧毁。此类故障的发生难免会造成电气设备的损坏和人力物力的浪费,也会给电力系统带来不良的经济和社会影响。据统计,国内OLTC故障约占变压器故障的20%,且呈现逐年上升的趋势。国外发达国家由于OLTC的高使用率导致其异常工作而引发的变压器故障高达40%,尤其是OLTC主要故障类型为机械故障,给变压器造成了严重的安全威胁[4]。目前OLTC故障检测器主要采用加速度传感器等一系列点式传感器,但此类传感器由于本身带有金属装置,会受到电磁干扰影响以及其本身不耐腐蚀,在测试时仅测试有限个数点的信息,同时,其安全性不佳。近年来,为了弥补传统传感器的不足,分布式光纤声传感器(distributed acoustic sensing, DAS)逐渐走进研究者的视野中,DAS系统是一种能够对光纤沿线范围内的物体进行远程实时监测的传感系统,具有抗电磁干扰、抗腐蚀、灵敏度高、实时性好等特点[5],目前已在各个领域取得广泛的应用,包括重要领域的安全监测、管道监测、海底电力电缆监测等。虽然DAS系统的发展迅速,但事件识别能力一直是制约其在现场应用的瓶颈,复杂的环境和额外的人为干扰会显著降低其识别能力。而以机器学习和深度学习为基础的数据驱动模式识别如今已经成为基于DAS系统识别领域的趋势[6-7]。Sun等[8]提出了一种以形态特征提取和相关向量机(RVM)为基础的分类方法,实现了对光纤沿线信号特征的识别。孙钢[9]提出了一种基于小波能量谱和RVM的识别方法,简化了SVM分类器,并构造了更加具有针对性的子分类器。Jia等[10]提出了一种基于近类别支持向量机(NC-SVM)的事件识别方法,利用k-最近邻(KNN)算法将分类器扩展为多分类问题,神经网络的分类方式根据样本自动提取特征,无需人工寻找信号的特征。Zhang等[11]提出了基于训练卷积神经网络(CNN)的图像去噪模型,极大地消除DAS传感系统中不需要的噪声,提高了DAS在故障判别中的准确性。Wu等[12]将Spiking神经网络引入分布式声传感器系统,可以在不平衡数据集下提高DAS系统判断的准确性。

以上的方法在获取大量数据集的情况之下,在识别率等方面都可以取得很好的效果。但是,在实际的数据采集过程中,往往会出现某一类别的数据集数量极少的情况。比如,在OLTC的运行中,故障发生就必须及时断电进行设备维修,只能获取少量的故障样本数据。同时,训练数据的减少会导致深度学习网络的过拟合,进而影响这类数据的分类精度。而小样本学习(few-shot learning,FSL)是一种只需要少量训练样本的机器学习方法[13]。人工数据增强[14]是FSL中能够有效缓解过拟合问题的方法之一。Ma等[15]提出了一种基于合成少数过采样技术(SMOTE)的方法,可以有效改善在传统方法由于类别样本数量较少而导致的精度不高的问题。

SMOTE是一种常用的人工样本合成方法,其通过在少数样本之间进行线性插值来实现新样本的生成,其将占比多的一方与离它最近的占比少的另一方配对,将这个配对删去,更有利于样本的分类。

Wu等[16]使用了一种新的过采样技术Radius-SMOTE,强调基于安全半径距离创建合成数据的初始选择方法,可以有效提高系统判别的准确率。

本文提出一种基于瑞利散射的分布式声传感系统对OLTC故障进行实时监测,相较于点式传感器,分布式声传感器具有极好的抗电磁干扰能力,同时由于变压器园区里有诸多OLTC变压器件,选择分布式声传感器可以同时检测各个变压器的运行状态,进一步实现智能电网监测要求。由于OLTC故障发生的低概率性,导致难以获得足够多的故障数据量,为提高数据多样性,增强系统性能,本文在算法方面进一步提出了一种基于k-means SMOTE的数据增强方法,可以有效提高小样本数据量,进而优化系统性能,并将增强后的数据送入CNN-LSTM的网络架构。选用CNN-LSTM的原因在于DAS系统采集率高达20 kHz,导致DAS系统采集到的信息数据都是长序列数据,而CNN-LSTM可以很好地解决长序列问题。对于数据采集与增强的方法如下:首先,采集设备故障运行和设备正常运行的数据量。其中某些数据量是充足的,例如被测系统正常运行时,此为多数类别;而有些类型的数据量是不充足的,例如当被测系统发生故障时,此为少数类别。其次,将采集到的数据集通过k-mean SMOTE方法进行数据量扩展,使得少数类别数据量可以达到多数类数据量。最后,将所得数据集作为预训练输入CNN-LSTM网络,用于数据训练。

1 原理与方法

1.1 分布式声传感器

本文采用的DAS系统的实验设置如图1所示,选取线宽约3 kHz的窄线宽激光器作为光源,激光器发出的连续光经隔离器进入声光调制器(AOM)调制成脉冲信号,脉冲信号的重复频率为20 kHz,脉宽为50 ns的脉冲方波信号;之后,调制后的脉冲光进入掺铒光纤放大器1进行脉冲放大,掺铒放大器1内置有滤波器,可以滤除放大器的自发辐射噪声,放大后的脉冲信号经环形器1进入传感光纤。后向瑞利散射信号经传感光纤返回进入另一个掺铒光纤放大器2进行放大。放大后的后向瑞利散射信号经过另一个环形器2进入非平衡迈克尔逊干涉仪,其由3×3耦合器和两个法拉第旋转镜组成,法拉第旋转镜用于反射经过3×3耦合器的后向瑞利散射光,反射回的瑞利散射光信号由3个探测器(PD)进行探测,最后由数据采集卡采集并在计算机(PC)中处理[17]。数据采集卡的采样频率为100 MHz,扫描频率为20 kHz,声光调制器频移为200 MHz,脉冲带宽为50 ns,传感光纤为G652单模光纤,长度约为200 m,覆盖在OLTC顶部和外壁上。

本实验设置故障事件为小类别事件。故障事件的样本数量只有24个,正常样本有9 084个。在此,每个样本采集的时间为1 s,由于发生故障事件必须及时进行维护,因此只取1 s的反应时间以保证设备的安全运行。PD将采集到的后向瑞利散射信号作为数据矩阵的一行,其中行是指某一时刻内的所有位置信息,列指某一位置所有的时间信息,可理解为横行表示空间域,纵列表示时间域。经过解调相位信息,得到每个点在每个时刻的具体信息。再将保存的信息由labview读取,作为原始数据集的输入。

1.2 数据采集方法

对于实验数据,为了验证对小样本事件的识别,将小样本事件設置为一个短时冲击信号。在实验室模拟了OLTC设备故障信号的发生。实验设备有封闭水箱一个,内部安放扬声器,扬声器连接信号发生器,同时将光缆放置在密闭水箱的管壁周围和密闭水箱的顶部,将信号发生器频率设置为600 Hz,幅值设置为8 V,采集时长为1 s的样本,信号发生器发出信号后通过扬声器将信号发出,共发出24次,设为24个样本数,并将此样本设为小样本事件;随后设置信号发生器频率为20 Hz,幅值为6 V,将此事件设置为正常运行状态,取9 024 s,每1 s为一个样本,共9 024个样本数;并通过布置在水箱周围的分布式光纤传感器进行信号采集,并进行数据存储,随后对数据进行处理与分析。

1.3 数据增强方法

当少数类别事件发生时,基于深度学习的类识别方法由于缺少对小类样本数据分析的信息,因此对少数类别事件的识别能力较差。而数据增强可以改善这个问题,传统的数据增强手段有SMOTE,基于k-means的SMOTE数据增强手段等[18]。在此采用基于k-means的SMOTE数据增强进行改进,一般的k-means聚类手段应用于少数类别事件内,只保留少数类样本比例高的聚类,将比例低的聚类删除,此方法对于SMOTE算法有很大的改进。在此将k-means聚类后的结果在进行SMOTE改进,按照k-means聚类后的比例进行数据扩充,使得SMOTE后的数据仍然与k-means聚类后的类别比相同,这极大地保留了少数类别事件的特征。基于k-means的SMOTE数据增强算法[19]过程如下。

步骤一 选择1 s为样本长度,分别将故障数据与正常数据切片,构成原始数据集。

步骤二 将原始数据集取出一部分数据,作为验证集,其余作为训练集和测试集。

步骤三 将训练集数据单独取出,对其中的小类别事件的数据进行k-means聚类分析,其是最常用的基于欧式距离的聚类算法,具体过程为:

(1) 导入数据,通过轮廓系数法获取相对最好的k值。轮廓系数法的核心指标轮廓系数S为

(2) 初始化聚类中心,常使用随机数;

(3) 计算每个点到K个聚类中心的距离,即欧氏距离,根据距离最小原则将数据分配到K个类中;

(4) 利用K个类中数据,计算并更新均值更新K个聚类中心;

(5) 重复步骤(3)~(4),直到收敛。

步骤四 将聚类后的数据进行SMOTE算法分别进行数据扩充,SMOTE算法流程图见图2,其中图2(b)是对原始数据进行SMOTE数据增强,将原始数据的数据量进行扩充,用小类别数据集中的相邻点相连接,红线为两个点相连线,中间为新生成的数据,然后得到新的数据集。

经过扩充之后,小样本数据集从原始的24个样本增到9 024个样本,与正常样本的数目相同,再将所得的数据作为训练集输入给CNN-LSTM网络,进而提高DAS系统的判准率。

2 神经网络结构

2.1 整体网络结构

基于k-means Smote CNN-LSTM的DAS系统识别方法概述的网络整体结构图如图3所示,主要包括4个步骤:(1)信号采集;(2)数据扩充;(3)模型调试;(4)在线测试。选取DAS系统采集的振动位置的时域信号作为原始数据。由于多数类别事件的数据量足够多,可以直接作为CNN-LSTM系统的数据集,对于少数类别事件,则需要进行k-means SMOTE数据扩充,最后将扩充后的数据与多数类别事件一起作为数据集送入CNN-LSTM网络。

将扩充后的数据集作为CNN-LSTM的原始数据集,由于故障样本数较少,单凭准确率不能说明建立系统的优越性,尤其是在OLTC故障检测中,若发生故障而系統并没有监测出来,这对于OLTC的伤害是极大且不可逆的。所以本论文选取混淆矩阵作为系统性能的判别指标,混淆矩阵的判别结果如表1所示。

其中预测结果为真,可以理解为预测没有发生故障,且实际结果也为真时,即实际结果没有发生故障,我们将这类判别情况为TP。预测结果为真,即预测没有发生故障,而实际结果为假,即实际发生了故障,那么我们将这类情况判别为FP。而预测为假,即预测为发生了故障,而实际结果为真,即没有发生故障,将此类别判别为FN。预测为假,即预测为发生了故障,而实际结果为假,即发生故障,将此类别判别为TN。

此外,我们定义精确率= TP/(TP+FN),召回率=TP/(TP+FP)。式中精确率表示预测对的比率,而召回率表示对于发生故障的事件在预测中的准确率。由于OLTC故障发生后对于电力系统的危害过大,所以在本文中更加重视召回率指标。

2.2 CNN-LSTM网络结构

卷积神经网络是一类特殊的人工神经网络,其最主要的特点是卷积运算操作。卷积神经网络主要由卷积层和池化层组成。卷积层能够保持图像的空间连续性,能将图像的局部特征提取出来。池化层可以采用最大池化或平均池化,池化层能降低中间隐含层的维度,减少接下来各层的运算量,并提供了旋转不变性。长短时记忆网络在输入、输出、忘记过去信息上分别加入了输入门、输出门、遗忘门来控制允许多少信息通过。而CNN-LSTM则是将CNN处理之后连接LSTM,将CNN的输出作为长短时记忆网络的输入,再进行网络模型的训练。由于我们的数据集是时间序列的数据集,在CNN 进行卷积处理后再由LSTM处理可以更好地解决时序问题,提高模型的精准率,图4为CNN-LSTM网络架构。

在本文中,采集到的数据集一共有多数类别事件和少数类别事件。对采集到的少数类别事件进行数据扩充操作,而将采集到的多数类别事件的数据集直接作为原始数据集进行操作。需注意的是,将采集到的数据提前取出一部分作验证集,用扩充后的数据作为模型训练用的数据集,训练后的模型再用从未见过的数据进行测试,以此验证系统的性能。

3 实验结果与分析

基础数据集共有一个多数类别和一个少数类别事件作为CNN-LSTM的输入数据。为了对比更加明显,一共分设4种训练类别。在此,混淆矩阵都是测试集的训练结果,最终得出如图5所示的4种混淆矩阵的结果,其中0代表为正常运行状态,1代表故障运行状态,图5(a)代表为无k-means SMOTE的ANN网络中真实状态为正常运行的共有9 084个样本,预测结果为正常运行的有9 080个样本,故障状态共有24个样本,预测为正常运行的有12个样本。图5(b)为无k-means SMOTE的CNN-LSTM网络,正常运行的共有9 084个样本,预测结果为正常运行的有9 081个样本,故障状态共有24个样本,预测为正常运行的有24个样本。图5(c)为经过k-means SMOTE的ANN网络,正常运行的共有9 084个样本,预测结果为正常运行的有9 084个样本,故障状态共有24个样本,预测为正常运行的有22个样本。图5(d)为经过k-means SMOTE[JP]的CNN-LSTM网络,正常运行的共有9 084个样本,预测结果为正常运行的有9 084个样本,故障状态共有24个样本,预测为正常运行的有24个样本。

根据上图所得的混淆矩阵图像,可以得出4种不同网络结构预测结果的精确率、召回率、准确率、F1值,见表2。

从表2可以得出,经过SMOTE的CNN-LSTM网络结构所取得的结果是最好的,无论是识别率还是召回率都可以达到100%,意味着在面临不均衡样本的条件下,可以取得很好的识别效果。

4 总结

由于有载变压器系统具有短时冲击,发生故障的频率低等特点,所以如何扩充故障样本集并实现对故障运行状态的检测是难点问题。本文通过k-means SMOTE方法扩充了样本集,同时由于实验数据量过大而采用了CNN-LSTM深度学习的处理方法,可以有效实现对于故障事件的识别,同时本文首次将分布式光纤传感系统应用到有载调压开关监测方向,经过实验室模拟试验,通过DAS采集到OLTC的模拟故障数据与正常运行数据,再通过k-means SMOTE算法增强故障数据集,最终将所有数据集送入到自行搭建的CNN-LSTM网络中,对于故障的识别率可以达到100%,这对于OLTC的故障识别具有极大的提高,表明了将DAS系统应用到OLTC是可行的,具有开创意义,为将来DAS应用于OLTC提供了指导意义。

参考文献:

[1]林明霞. 一种实现φ-OTDR系统长距离监测的方法及系统:CN201410817348.X [P]. 2015-03-25.

[2]张知先, 陈伟根, 汤思蕊, 等. 基于互补集总经验模态分解和局部异常因子的有载分接开关状态特征提取及异常状态诊断[J]. 电工技术学报, 2019, 34(21): 4508-4518. DOI: 10.19595/j.cnki.1000-6753.tces.181320.

[3]聂鹏. 浅谈电力变压器故障分析及其诊断方法[J]. 科技创新与应用, 2014(12):121.

[4]石秀立.基于振动信号特征的有载分接开关机械故障诊断策略研究[D].焦作:河南理工大学,2018.

[5]钟龙申,高学军,王振友. 一种新的基于K-means改进的SMOTE算法在不平衡数据分类中的应用[J]. 数学的实践与认识, 2015, 45(19):198-206.

[6]赵彤. 有载分接开关机械状态的在线监测与故障诊断技术研究[D]. 济南: 山东大学, 2008.

[7]SHI Y, WANG Y Y, WANG L Y, et al. Multi-event classification for Φ-OTDR distributed optical fiber sensing system using deep learning and support vector machine[J]. Optik, 2020, 221: 165373. DOI: 10.1016/j.ijleo.2020.165373.

[8]SUN Q, FENG H, YAN X Y, et al. Recognition of a phase-sensitivity OTDR sensing system based on morphologic feature extraction[J]. Sensors (Basel, Switzerland), 2015, 15(7): 15179-15197. DOI: 10.3390/s150715179.

[9]孫钢. 基于SVM的入侵检测系统研究[D]. 北京: 北京邮电大学, 2007.

[10]JIA H Z, LIANG S, LOU S Q, et al. A k-nearest neighbor algorithm-based near category support vector machine method for event identification of φ-OTDR[J]. IEEE Sensors Journal, 2019, 19(10): 3683-3689. DOI: 10.1109/JSEN.2019.2891750.

[11]ZHANG T, LI Z N, ZHU Q, et al. Improved procedures for training primal Wasserstein GANs[C]//2019 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computing, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation (SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI). Leicester, UK. IEEE, 2020: 1601-1607. DOI: 10.1109/SmartWorld-UIC-ATC-SCALCOM-IOP-SCI.2019.00286.

[12]WU H J, CHEN J P, LIU X R, et al. One-Dimensional CNN-Based Intelligent Recognition of Vibrations in Pipeline Monitoring With DAS [J]. Journal of Lightwave Technology, 2019, 37(17): 4359-4366. DOI:10.1109/JLT.2019.2923839

[13]SNELL J, SWERSKY K, ZEMEL R S. Prototypical networks for few-shot learning[EB/OL]. 2017: arXiv: 1703.05175. https://arxiv.org/abs/1703.05175.

[14]吴飞. 人工智能: 从规则学习, 到数据驱动, 再到能力增强[J]. 杭州科技, 2017(2): 51-53.

[15]MA G M, SHI C, QIN W Q, et al. A non-intrusive electrical discharge localization method for gas insulated line based on phase-sensitive OTDR and Michelson interferometer[J]. IEEE Transactions on Power Delivery, 2019, 34(4): 1324-1331. DOI: 10.1109/TPWRD.2019.2892306.

[16]WU L W, HUANG S S, WU F, et al. Protein subnuclear localization based on radius-SMOTE and kernel linear discriminant analysis combined with random forest[J]. Electronics, 2020, 9(10): 1566. DOI: 10.3390/electronics9101566.

[17]张俊楠, 娄淑琴, 梁生. 基于SVM算法的φ-OTDR分布式光纤扰动传感系统模式识别研究[J]. 红外与激光工程, 2017, 46(4): 219-225. DOI: 10.3788/IRLA201746.0422003.

[18]刘明山, 于艳玲, 周原, 等. 基于k-means改进的SMOTE算法: CN110852388A[P]. 2020-02-28.

[19]沈艳, 余冬华, 王昊雷. 粒子群k-means聚类算法的改进[J]. 计算机工程与应用, 2014, 50(21): 125-128. DOI: 10.3778/j.issn.1002-8331.1401-0357.

猜你喜欢
故障检测模式识别神经网络
神经网络抑制无线通信干扰探究
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
新型探测线圈浅析
暖通空调系统故障检测与诊断技术探讨
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
第3届亚洲模式识别会议
电气设备的故障诊断与模式识别