吴卫堃,宫士营,郑耀华,单超,董传友
(1.广东电网有限责任公司肇庆供电局,广东 肇庆 526000;2.山东科汇电力自动化股份有限公司,山东 淄博 255087;3.哈尔滨理工大学电气与电子工程学院,黑龙江 哈尔滨 150080)
交联聚乙烯(XLPE)绝缘电缆被广泛应用于电力网络的输、配电系统,XLPE电缆的健康状况与电力系统的稳定和持久密不可分。对XLPE电缆故障进行智能化诊断,可为检修维护、资源更换提供指导性意见。
目前,机器学习算法被广泛应用在电气设备的智能化诊断与检测,深度学习方法(即具有多层次非线性变换的机器学习方法)已成为电气设备智能诊断的有效工具[1]。为了取代传统的人工特征提取,深度学习方法从原始局部放电信号中自主学习特征,建立故障种类与特征间的映射关系。各类深度学习已经用于电缆的故障诊断,如文献[2-3]采用卷积神经网络和深度置信网络进行直流XLPE电缆的局部放电模式识别;文献[4]提出了一种多尺度卷积神经网络的电缆故障诊断方法;文献[5]提出了一种基于卷积神经网络的高压电缆局部放电模式识别方法,并研究了不同网络层数、不同激活函数以及不同池化方式对识别效果的影响。然而,对于传统的深度学习方法来说,参数优化往往需要耗费大量工作时间;此外由于误差函数的梯度值必须逐层反向传播,经过若干层后传播逐渐变得不准确,导致初始层中的可训练参数不能有效优化[6]。而深度残差网络(residual network,ResNet)作为卷积神经网络的变体,通过短路连接来缓解参数优化的问题[7]。
由于现场采集电缆的局部放电十分微弱,且容易被运行环境中多种较高水平的噪声严重干扰甚至淹没。在处理含高噪声局部放电信号时,ResNet的特征学习能力往往会下降,由于噪声的干扰,基于卷积核作为局部特征抽取器的ResNet可能无法检测出故障相关特征[8]。在这种情况下,输出层学习到的高级特征往往不足以区分故障。因此,有必要研究高噪声环境下局部放电故障诊断的深度学习方法。
文中提出了一种深度残差收缩网络(deep residual shrinkage network,DRSN)的高噪声环境下XLPE电缆故障识别方法,即通过将软阈值作为非线性变换层嵌入到网络深层结构中,并引入软注意力机制对软阈值进行加权优化,使得网络具有通道共享阈值的能力,从而加强深度神经网络从高噪声局部放电信号中特征学习的能力,进而提高电缆故障诊断精度。
ResNet是近年来引起广泛关注的一种新兴深度学习方法[9]。残差建造单元(residual building units,RBU)是ResNet的基本组成部分,其结构如图1所示,在RBU结构中包含2个批量归一化单元(batch normalization,BN)、2个整流线性单元(rectifier linear unit,ReLU)、2个卷积层和短路连接构成。
图1 RBU结构Fig.1 RBU structure
通常在传统的深度学习方法中,交叉熵误差的梯度是逐层反向传播的,经过若干层的传播后,梯度值逐渐变得不准确,导致初始层中的可训练参数不能有效优化。而ResNet使用短路连接的方式使梯度值可以有效地流向靠近输入层的初始网络层,从而更有效地更新训练参数。图2为ResNet的总体架构,ResNet由输入层、卷积层、全局池化层(global average pooling,GAP),RBU,BN,ReLU和输出全连接层组成。
图2 ResNet结构Fig.2 ResNet structure
软阈值处理是很多信号去噪方法的关键步骤[10]。通过将绝对值小于某个阈值的特征删除,将绝对值大于某个阈值的特征朝着零的方向进行收缩。例如,小波阈值法作为一种经典的信号去噪方法,通常由小波分解、软阈值法和小波重构三个步骤组成。为了保证良好的信号去噪性能,小波阈值法的核心关键是设计滤波器,将有用信息转化为极正或极负的特征,将噪声信息转化为接近零的特征。然而,设计这样的滤波器需要很多信号处理方面的专业知识,这限制了小波阈值法的广泛应用。
深度学习为解决上述问题提供了新的途径,通过梯度下降算法自主学习滤波器特征,将软阈值处理与深度学习相结合进行噪声相关信息的消除和高分辨特征的重构。软阈值函数可表示为
式中:x为输入特征;y为输出特征;τ为阈值,即正参数。
软阈值处理并未将ReLU激活函数中负特征设置为零,而是将接近零值的特征设置为零,这样就保留了有用的负值特征。
在经典的信号去噪算法中,很难设定一个合适的阈值。而且最佳阈值应该根据处理对象的不同做一定程度上的改变。针对这一问题,如何智能化确定阈值成为了关键。
DRSN将软阈值作为非线性变换层嵌入到网络深层结构中,并引入软注意力机制对软阈值进行加权优化,使得网络具有通道共享阈值的能力,从而加强深度神经网络从高噪声局部放电信号中特征学习的能力。
图3为具有通道域共享阈值的残差收缩单元(residual shrinkage building unit,RSBU)。不同于RBU结构,RSBU具有阈值学习模块,可将阈值学习模块理解成一种特殊的注意力机制:当注意到与当前任务无关的特征时,通过软阈值化,将它们置为零;当注意到与当前任务有关的特征时,将它们保留下来,以此实现深度注意力机制下的软阈值化[11]。通过虚线框内的子网络,对各个特征通道进行软阈值化。
图3 RSBU结构Fig.3 RSBU structure
阈值学习模块工作原理如下:首先,对输入特征图进行全连接和全局池化,并取所有特征的绝对值,记为x;然后,将绝对值化后的特征经过归一化和线性化,此时特征记为z;最后,将特征点z输入到以Sigmoid函数作为最后一层的全连接网络,将输出值归一化到0~1之间,获得系数a。最终阈值w可由下式表示:
基于该方法进行阈值学习,不仅保证了阈值为正,而且不会太大,这样就保证了不同的样本有了不同的阈值。堆叠一定数量的RSBU模块以及输入层、卷积层、GAP,RBU,BN,ReLU和输出全连接层就得到了完整的深度残差收缩网络,DRSN结构如图4所示。
图4 DRSN结构Fig.4 DRSN structure
文中选取全新10 kV XLPE电缆进行实验,结构如图5a所示,根据运维、检修经验制作了4种典型的终端故障,如图5b所示。内部气隙多形成于挤包绝缘电缆的挤出过程中,气体副产物在XLPE绝缘中残留而形成的微小气隙[2];绝缘表面划伤是由于终端制作过程中工艺不过关、制作流程不严谨等原因,常会划伤电缆主绝缘;外半导电层残留常见于电缆接头制作过程中,外半导电层未完全剥除;导体毛刺多形成于绝缘挤出之前绞合导体产生毛刺,导致毛刺刺破内屏蔽直接进入绝缘层[2]。
图5 XLPE电缆结构及缺陷制作Fig.5 XLPE cable structure and defect manufacture
基于脉冲电流法对局部放电信号进行采集,图6为XLPE电缆局放实验检测系统,图中Zn为10 kΩ保护性水阻;Ck为100 kV/300 pF的耦合电容;Zm为检测阻抗;电压探头用于获取相位信息,并作为局部放电信号的触发装置;示波器采样频率为100 MHz;宽带放大器将高频电流互感线圈(high frequency current transformer,HFCT)耦合的信号调整至合适范围。局部放电实验在高压屏蔽大厅中进行,背景噪声2 pC左右,后文将针对原始的局部放电数据进行专门的加噪处理。
图6 XLPE电缆局放实验检测系统Fig.6 XLPE cable partial discharge test system
为了保证数据的可靠性,每种缺陷电缆终端各制作5根试样,每根试样长1.3 m左右。同时为了增加数据的多样性,采集电压以阶梯式升压,分别采集5 kV,10 kV和15 kV电压等级下的局部放电数据,每隔2 min采集一次局部放电PRPD谱图,表1为每次局部放电测量时的电压等级及获取的原始数据数量。
表1 典型缺陷电缆的局部放电测试电压和数据量Tab.1 Partial discharge test voltage and data quantity of typical defect cable
图7为不同缺陷样本的PRPD谱图,由于数量较多,此处仅选取代表性具有差异的PRPD谱图进行展示,图中展示的为10 kV电压等级下的部分谱图,从谱图形状和数据点分布上可以看出较为明显的差异,因此以PRPD谱图作为故障诊断的对象是可行的。
图7 典型缺陷PRPD谱图(部分)Fig.7 PRPD spectrum of typical defects(part)
上述局部放电实验在高压屏蔽大厅中进行,背景噪声基本可以忽略不计,这样做的目的是为了人为控制噪声类别及幅值,更好地研究含不同噪声强度下的局部放电诊断方法有效性。
通常,局部放电信号中包含白噪声、周期性脉冲干扰和周期性窄带干扰。周期性脉冲干扰由于其幅值具有一定规律性,较容易滤除,而白噪声和周期性窄带干扰的滤波难度较大,文中主要针对这两类干扰进行添加,白噪声采用均值为0、方差为0.3分布的高斯白噪声;根据现场测量经验,周期性窄带干扰主要由载波信号和通信信号干扰组成[12],可通过不同频率正弦信号叠加产生,表达式如下:
式中:Ai为各窄带干扰信号幅值,设为1 mV;h为窄带干扰数量,设为5;fi为窄带干扰频率,分别设为f1=100 kHz,f2=500 kHz,f3=1.2 MHz,f4=5 MHz,f5=7 MHz(频率范围的选取依据为:既符合文中HFCT采集的PD频带范围,又符合PD周期性窄带干扰的频率范围)。
将叠加白噪声与周期性窄带干扰后局部放电信号进行编号,如表2所示。
表2 染噪局部放电信号类型分布Tab.2 Distribution of partial discharge signal types with noise
文中以十折交叉验证方案进行分析,即将数据集分为10个子集,每次实验中将1个子集用作测试集,其他9个子集用作训练集,以此重复10次,最后的结果取10次实验结果的均值进行分析。此外,文中分别对CNN,ResNET和DRSN中超参数的初始化和选择进行了介绍。表3为文中讨论的网络结构,CNN网络中的卷积构建单元(convolution building units,CBU)中无“短路连接”结构;在括号中的第1个、第2个数字分别表示卷积核的数目和大小;“/2”表示以2的步长移动卷积核来减小特征图的宽度;最后的FC输出层有4个神经元,对应文中的四种典型缺陷。
表3 网络结构Tab.3 Network superparameter
网络中超参数值如下:学习率0.1,0.01,0.001;惩罚系数0.000 1;batch size为64;迭代步数100。网络的学习率在前40个周期设置为0.1,中间40个周期设置为0.01,最后20个周期设置为0.001,这样就可以使网络在开始训练时以较大的步长更新参数,在结束训练时对参数进行微调;L2正则化用于减少过拟合的影响,并产生更高的测试精度,通过在目标函数中加入一个惩罚项,使权重趋于零。这样,权值的绝对值就不太可能被优化到非常大的程度,在处理相似的输入时,深度神经网络的输出与权值相乘后也不会有很大的变化,文中将惩罚项的系数设置为0.000 1;batch size是指一次训练所选取的样本数,batch size太小会使训练速度很慢,太大会加快训练速度,但同时会导致内存占用过高,并有可能降低准确率。由于GPU对2的幂次的batch可以发挥更佳的性能,因此通常设置为16,32,64,128等,作者根据自身处理器性能选择为64;由于文中算法均在80~100步内收敛,因此网络迭代步骤取值为100。
在不同程度染噪局部放电数据集下,CNN,ResNet和DRSN的诊断结果如下:图8为平均识别精度柱状分布,网络训练时间和识别精度具体值如表4所示。由图8和表4可以看出,当局部放电数据未含噪声(p0)或含低强度噪声(p1)时,三种方法的识别精度相差不大;但当局部放电信号包含的噪声强度逐渐增强时,DRSN方法的诊断优势凸显,对于强噪声环境(p4和p5),DRSN方法的识别精度在75%~80%,而ResNet和CNN识别精度已下降到60%~65%左右,高噪声环境下DRSN方法整体识别精度比传统ResNet和CNN方法的识别精度高15%左右。但是DRSN训练时间比其他两类方法多耗费40%左右,这也是深度复杂网络的不足。
图8 平均识别精庞柱状图Fig.8 Average recognition accuracy histogram
表4 平均识别精度和训练时间Tab.4 Average recognition accuracy and training time
图9为三种方法训练误差曲线,可以看出ResNet的训练误差低于CNN,说明使用“短路连接”方式可以方便地进行参数优化,得到更精确的训练模型。同时文中DRSN方法比经典的ResNet具有更低的训练误差,原因是:DRSN在网络深层结构中采用软阈值作为收缩函数,可以减少噪声相关的特征,使全连接后的特征具有更强的识别能力。
图9 训练误差曲线Fig.9 Training error curves
文中提出一种基于深度残差收缩网络的高噪声环境下XLPE电缆故障识别方法,结论如下:
1)将软阈值作为可训练的收缩函数嵌入到深层结构中,使不重要的特征变为零,从而使学习到的高层特征具有更强的识别能力。同时,软阈值学习基于注意力机制结构进行设计,因此不需要信号处理方面的专业知识。
2)通过与传统深度学习方法的实验比较,验证了文中方法在高噪环境下提高诊断准确率的有效性。高噪声环境下DRSN方法整体识别精度比传统ResNet和CNN方法高15%左右。