母卓元
(内蒙古国合电力有限责任公司,呼和浩特010060)
作为电力系统中的重要设备,开关柜起着电力设备控制与保护的作用,但是会出现绝缘故障、机械故障、温度升高、误操作和电弧故障,其能否安全运行直接影响用户的用电感受与供电的安全可靠性[1-2]。尤其是开关柜工作地点环境复杂,在长期运行过程中极易出现绝缘老化以及因柜内湿度过高而引起的电晕放电、触点和母线温度升高等问题,从而引发断电甚至火灾,导致巨大的经济损失,因此对开关柜进行故障诊断具有重要意义[3]。随着智能电网建设和发展,利用先进传感技术实现开关柜故障诊断,可预防或尽早发现开关柜运行存在的异常状况。文献[4]提出利用人工免疫原理进行网络在线跟踪开关柜机械状态变化,以达到开关柜机械故障诊断的目的;文献[5]给出了开关柜局部放电分类的关联规则算法,但只针对开关柜的某个单项性能进行诊断,无法从多个角度全面综合的判别开关柜的健康状况;文献[6]提出以样板为基础、以规则为基础的诊断方法,这种方法比较依赖已知的故障种类,对新增的故障类型无能为力;文献[7]则提出利用RBF神经网络进行开关柜故障诊断的方法,但是诊断出的故障类型少,网络训练时间长、效率低。
近些年发展起来的深度信念网络算法,其具有训练速度快、泛化能力强、噪声鲁棒性好、不易陷入局部最优等优点,在工程上易于实现,适于实时控制等对时间要求高的场合,在特征识别、数据降维、分类预测等方面性能突出,目前被广泛应用于图像处理、语音识别等领域。概率神经网络为开发以人工神经网络为框架的故障诊断系统提供了理论基础,鉴于此本文以35kV开关柜为对象,提出了基于ReLU深度信念网络的开关柜故障诊断模型,并通过实际案例进行了验证。
深度信念网络(Deep Belief Networks,DBN)是由若干层受限玻尔兹曼机(restricted boltzmann machine,RBM)和分类输出层组成的一种深层神经网络。RBM由用于输入训练数据的可视层v和作为特征检测器的隐藏层h组成,结构如图1所示[8]。
定义给定状态(v,h)的联合组态能量为:
式中:vi为可视层显元,hj为隐藏层隐元,ai和bj分别为显元i和隐元j偏置,wj,i为连接权重。
图1 受限玻尔兹曼机结构
基于能量函数的状态联合概率分布为:
第j个隐元和第i个显元的条件激活概率为:
式中:σ()表示激活函数。
神经网络学习中常用激活函数为sigmoid函数和tanh函数,这两种函数存在导数及饱和值缩放特性,进行递进式多层反向传播时,梯度误差会不断累积增大,导致网络学习效率大幅降低。ReLU函数梯度为1,且只有一端饱和,可在深层反向传播过程中保持稳定性,结构收敛性良好,公式(5-7)是这三种激活函数的数学表达式,相应对比曲线如图2所示。
图2 3种激活函数对比
ReLU函数的优良特性可以提高网络整体学习速率及分类准确率,本文选用该函数取代传统激活函数来训练DBN网络。ReLU-DBN网络采用对比散度算法对RBM逐层快速训练得到权重。由于每层网络都是独立学习,只能保证该层权重对特征向量映射达到最优,并不能确保整个网络特征提取和映射达到最优,因此采用梯度下降算法将网络输出与标准数值标签之间的误差自顶向下反向传播至每一层RBM,微调整个ReLU-DBN网络,使得权重参数全局最优。
35kV开关柜按其使用环境可分为室内开关柜和室外开关柜,本文的监测对象是室内开关柜。室内开关柜工作环境没有室外开关柜那样恶劣,对于监测传感器的工作环境要求没有室外开关柜严格。35kV开关柜的主体结构主要包括柜体、断路器、控制设备及导线等,其外观如图3所示。各种传感器监测信号分别从不同角度反映开关柜的当前工作状态,因此监测信号中特征参量的提取对开关柜故障诊断至关重要。根据开关柜的结构,从进线到出线,依次经过母线室、断路器室和电缆室,表征开关柜状态的特征参量,从属性上可分为电气参量(电压、电流等)和环境参量(温度、湿度等),考虑到各个分室不同特征量的差异化和可观测性[9],采取的信号传感器监测点布置方案如图4所示,具体阐述说明如下:
图3 开关柜外观
图4 传感器监测点布置
(1)母线室。在母线室布置三类传感器,分别是采集母线电压数据的电压互感器,采集母线和断路器连接处温度数据的光纤温度传感器以及采集母线室温湿度数据的无线温湿度传感器。
(2)断路器室。在断路器室布置三类传感器,分别是采集断路器触头温度数据的光纤温度传感器,采集断路器室内温湿度数据的无线温湿度传感器和采集分合闸线圈电流数据的电流互感器。
(3)电缆室。在电缆室布置三类传感器,分别是采集电缆接头温度数据的光纤温度传感器,采集出线电流数据的电流互感器以及采集电缆室温湿度数据的无线温湿度传感器。
(4)开关柜外。在开关柜外装有采集环境温湿度数据的无线温湿度传感器。
表1给出了各类传感器所监测的具体特征参量,通过采集列表中的信号特征参量,可以获得反应开关柜当前工作状态的丰富原始数据源。
表1 35kV开关柜监测特征参量
由于开关柜结构复杂,运行过程中很难直接分清故障产生原因,通过对35kV开关柜故障案例搜集整理,综合正常运行状态数据,本文对开关柜状态标签编码为如下9种状态模式:1正常,2母线电压过高,3电缆电流过大,4母线室温湿度过高,5母线与断路器连接处温度过高,6合闸线圈电流过大,7断路器室温湿度过高,8电缆室温湿度过高,9电缆接头温度过高。通过识别这9常见状态模式可以更方便快速地推算出具体的故障原因,例如因电流过大或绝缘老化引起的母线室、电缆室、断路器室温度过高;母线室、电缆室、断路器室湿度过高而引起裸露金属部分腐蚀;电阻增大或电流增大导致的各小室接头部分温度过高;湿度过大造成电阻增大或电流增大引起绝缘击穿;断路器机械故障导致的断路器合闸线圈电流过大等[10]。
针对35kV开关柜状态识别一非线性多分类问题,本文提出基于ReLU-DBN网络的故障诊断模型,如图5所示,通过提取监测信号中的特征参量并输入到深度信念网络进行信息处理,可实现开关柜工作状态的自动判定,具体实现步骤如下:
(1)选取开关柜状态传感器监测信号中的特征参量作为模型的输入,将计算获取的特征参量输入到搭建的诊断网络模型前,应该对特征参量进行归一化处理。已有研究表明,对模型的输入数据进行归一化处理存在两个明显好处:一是可以大幅提高网络的学习速度,二是可以大大降低冗余数据的干扰影响。本文将计算获取的特征参量转化到[0,1]之间进行归一化处理,表达式如下:
其中 Xi、Xmin、Xmax分别表示同一特征参量的第个数据、最小值和最大值,X是归一化结果。需要特别指出,所有的温湿度监测量均以开关柜外部环境温湿度作为参考,其归一化过程是在当前监测值减去同时刻开关柜外部环境温湿度监测值的基础上实现。
(2)按照一定比例将样本数据划分为训练样本和测试样本。
(3)对ReLU-DBN网络进行无监督预训练,通过反向传播算法和随机梯度下降法利用状态模式标签对网络参数微调,实现模型参数最优化。
(4)利用训练样本最优参数对测试样本进行测试,通过Softmax分类器输出结果得出诊断结论。
(5)依据新增样本及故障诊断准确率,对网络重新训练,实现参数更新。
图5 基于ReLU-DBN的开关柜诊断模型
通过布置的各类型传感器对35kV开关柜运行过程中的实际信号进行持续采集,对实测信号源进行分类,每种类型信号源包含多个数据样本,将信号样本划分为训练样本和测试样本,具体分布见表2,提取表1所列的信号特征参量,将其作为ReLU-DBN网络输入,用于后续开关柜故障识别。
表2 样本数据具体分布
参考相关文献[11],初始化 ReLU-DBN 网络连接权重为服从正态分布N(0,1)的随机数,偏置项为0。设定权重学习率、偏置学习率分别为0.5,权重衰减项为0.1。为改善反向传播算法的收敛速度与算法不稳定性间的矛盾,初始动量项为0.1,在重构误差处于平稳增加状态时动量项设为1。通过研究发现,网络层数与诊断准确率的关系如图6所示。当层数从1层增加至4层,识别正确率大幅提升,由4层增加至8层,准确率提升效果微弱。综合模型诊断效果及运算效率,本文确定网络结构为4层,由于输入为12种信号监测特征量,输出为开关柜9种工作状态,因此ReLU-DBN网络整体结构为12-20-20-10-9。
图6 网络层数与诊断准确率关系曲线
本文采用混淆矩阵考察算法的诊断效果,混淆矩阵如图7所示。
图7 混淆矩阵
其中,目标类型p和n表示样本真正类别,输出类型p,和n,表示样本被ReLU-DBN诊断模型判定的类别。真正(TP)表示被模型诊断为正的正样本,假正(FP)表示被模型诊断为正的负样本,假负(FN)表示被模型诊断为负的正样本,真负(TN)表示被模型诊断为负的负样本。
混淆矩阵各项评价指标如下:
将数据按照表2中分布进行训练、测试,其中训练样本诊断准确率为95.3%。图8为基于ReLUDBN诊断模型在测试样本数据上的混淆矩阵,其中序号1-9对应本文2.2部分所定义的开关柜工作状态编码。由图8可见模型的总体诊断准确率较高,达到94.4%,其中编码8和9对应的开关柜工作状态识别精度分别为97.0%和96.2%,召回率分别为97.0%和100%。50例电缆接头温度过高样本全部识别正确,33例电缆室温湿度过高样本数据中,仅有1例误诊,表明ReLU-DBN诊断模型有较强的复合故障判定能力。通过对温度、湿度复合状态特征提取,该模型可得到表征温度过高兼顾湿度过大状态的特征量,将其与开关柜正常状态进行区分。ReLU-DBN网络通过深层学习,样本数据间相关信息得以充分表示,更利于故障模式诊断。
图8中编码1对应的正常状态数据,相对其它样本类型诊断精确度略低,仅为88.2%。通过对原始监测信号分析发现,综合案例库在开关柜已经发生异常而监测信号特征参量尚未达到警示值时,样本类型划分较为粗犷。编码6对应的合闸线圈电流过大类型样本召回率仅为85.3%,通过对原始案例文件分析发现,有一小部分数据实际监测信号呈现特征与所上报的状态类型有所不符,存在部分分歧,因为这些干扰样本的存在,对诊断模型参数存在一定影响,导致诊断精度有所降低。
图8 ReLU-DBN测试集混淆矩阵
下面利用较为先进的最小二乘支持向量机(LSSVM)[12]和卷积神经网络(CNN)[13]与本文提出的ReLU-DBN网络诊断效果进行对比,采用相同的样本分布进行训练、测试。其中LSSVM模型选用径向基核函数(radial basis function,RBF),通过交叉验证得最优正则因子为0.1,RBF核参数为100。CNN网络中学习率为0.1,学习周期为200。LSSVM模型和CNN模型对训练样本的诊断准确率分别为90.1%和87.8%。在测试集上的识别效果如图9所示。针对开关柜故障诊断问题,LSSVM和CNN方法的识别准确率分别为89.5%和 86.6%。其中LSSVM模型对编码8、9类型的诊断精度分别为94.1%和 79.7%,召回率分别为 97.0%和 94.0%。CNN网络模型对8、9类型的识别精度分别为85.7%和 75.8%,召回率分别为 36.4%和 94.0%,开关柜工作状态模式间的误识别率与本文提出的ReLU-DBN模型相比更高,诊断效果不佳。
图9 LSSVM和CNN测试集混淆矩阵
保持测试集规模不变,将训练集逐步减小为3600、2700、1800、900、400,训练集和测试集比例分别为 4:1、3:1、2:1、1:1、1:2,考察三种算法的诊断效果,如表3所示。
表3 不同训练集时诊断准确率
逐步减小样本集为 4000、3000、2000、1000、500、250,按照6:4的比例将样本库划分为训练集和测试集,考察三种算法的诊断效果变化,可以得到如表4所示的结果。
表4 不同样本集时诊断准确率
对比表3和4可知,开关柜诊断准确率与模型训练样本中所包含的特征信息密切相关,随着训练样本减少,诊断模型从训练样本中提取的特征信息越稀少,诊断精度会随之降低。开关柜故障模式因型号、电压等级、运行状态等不同所呈现的多样性,被大样本空间所覆盖,同LSSVM、CNN模型相比,ReLU-DBN网络模型可以全面地提取出样本空间中更深层的抽象特征,能正确处理各种复杂信息,具有良好的容错能力,诊断正确率高,为解决35kV开关柜状态识别问题提供了一种有效手段。
开关柜内环境复杂,故障类型多种多样,针这一问题,本文提出基于深度信念网络的35kV开关柜故障诊断方法,利用先进的传感器技术,采集多路在线监测信号,以实时在线监测信号状态特征参量作为ReLU-DBN网络的输入,可实现开关柜工作状态的准确判定。实际案例分析结果表明,该方法简单方便、训练时间短、扩充性能好、收敛速度快、分类能力强、易于实现、可以最大程度地利用工程先验知识。如果将样本集逐步完善,随着状态知识的逐渐积累,ReLU-DBN网络可以不断扩张从而进一步提高诊断准确率,有望获得更佳的诊断效果。