江俊飞,罗颖婷,许海林,鄂盛龙
(广东电网有限责任公司电力科学研究院,广东 广州 510000)
电力变压器实际运行过程中,环境温湿度、负荷、油温等均会直接或者间接地使油色谱发生变化。文献[1]通过计算油色谱数据的李雅普诺夫(Lyapunov)指数,证明油色谱本身是个复杂混沌的问题。现有的文献中已经有大量油色谱时间序列的研究,多是基于油色谱数据进行电力变压器潜伏性故障与缺陷的诊断和分析,针对在线装置本身准确性研究的文章较少[2-4]。目前文章采用支持向量机来解决在线油色谱数据失真的问题,但是模型过于简单,且需要离线数据作为对比支持,在实际应用中可行性不强[5]。文献[6]将油色谱在线装置的故障分解为固定偏差故障、漂移偏差故障、变比偏差故障、精度失真故障以及完全失效故障5类,并通过极值阈值判据、变异系数判据、产气率斜率等判据对油色谱数据的有效性进行评估,但是由于油色谱数据的复杂性,基于阈值的方法在实际应用过程中因为阈值的选择不当容易导致大量的漏报和错报。
因此,如何在油色谱数据分析中降低被监测量本身的影响,从而突出监测装置本身信号的变化是个非常困难的问题。本文首先采用B-EMD对油色谱进行模态分析,其次建立深度置信网络进行有效性评估,最后实现对油色谱在线监测装置的可靠性评估。
对于油色谱信号的分析,传统的信号处理方法需要预先定义基函数(如傅里叶分析、小波分析),而实际在线装置采集的油色谱信号是非平稳信号,其信号的功率谱、相关函数等是时变的函数,因此难以选取统一的基函数进行分解。
1998年,黄鄂博士提出了一种新的信号处理方法,即经验模态分解(Empirical Mode Decomposition,EMD)。其核心思想是将非平稳复杂信号分解成一系列固有模态函数(Intrinsic Mode Function,IMF),各个IMF包含信号在不同尺度上的局部特性,通过信号自身的特征分解得来,因而不需要预先定义基函数,在非平稳信号中具有很好的自适应性。目前,在电力设备检测信号分析方面已经有一些基于EMD的研究[7-10]。
标准EMD方法的计算过程为:假设输入信号为x(t),搜索得到x(t)的所有极大值/极小值序列x+(t)和x_(t),对极大值/极小值序列x+(t)和x_(t)分别进行3次样条插值得到原输入信号x(t)的上/下包络线,分别表示为e+(t)和e_(t)。通过公式计算x(t)的均值信号m(t)为
将x(t)与其本身的均值信号m(t)相减,得到其准模态信号h(t)。
由上述可知,该方法的关键在于求取原始信号的上下包络线,而包络线的获取非常依赖输入信号的极值点位置和取值信息的准确性。若想得到一组信号稳定准确的EMD分解结果,其采样率须远大于信号的奈奎斯特频率。
假设原始油色谱数据曲线为y(t),其p阶B样条拟合曲线g(t)可以表示为
式中:cj为B样条拟合待求解参数;Bj,p为p阶B样条函数。假设原始油色谱监测序列u={u0,u1,u2,…,un+p},p阶B样条函数Bj,p可使用Cox-deBoor 递归公式计算为
记B样条拟合曲线g(t)与原始油色谱信号y(t)的差值为ε(t),计算公式为
因此,B样条拟合中待求解参数cj可以通过ε(t)的最小二乘求取
在理想情况下,假设被测量信号为恒定值μ,油色谱监测装置测量得到的信号应该满足以μ为均值,σ为方差的正态分布(σ与油色谱装置的测量精度、老化程度有关)。油色谱在线监测装置实际运行过程中,油色谱采样频率大多为每天1~3次,以最高频率计算,其信号的频率范围如图1所示。考虑到B-EMD分解出的每个IMF均可看做一个窄带信号,结合B-EMD实际分解效果,由油色谱测量装置引起的误差信号主要分布在IMF1~IMF3中。
图1 油色谱信号B-EMD分解示意
基于经验模态分解和多参量深度置信网络的变压器油色谱在线监测数据有效性评估网络如图2所示,分为EMD分解模块、深度置信网络(Deep Belief Networks,DBN)识别模块、权重排序模块3个部分。对输入信息进行B样条拟合和EMD分解,得到其前3个固有模态函数IMF1~IMF3,分别接入到3个独立的DBN网络中,再将DBN网络的输出结果输入BP网络中进行权重因子排序,综合得出最终的结果。
图2 油色谱信号有效性评估网络
2.2.1 训练样本的选择
油色谱信号有效性评估网络的训练样本数据可以分为无标记样本数据和标记样本数据。无标记样本数据主要来源于油色谱的实际在线监测数据,剔除数据中断、零值、无穷大等特别异常数据。有标记样本主要来源于有过校验记录的油色谱在线监测装置,主要包括以下内容。
(1)变压器油色谱正常且监测装置校验合格的监测数据(正面样本)。
(2)变压器油色谱离线试验数据异常但校验正常装置正常的监测数据(正面样本)。
(3)校验不合格监测装置的监测数据(负面样本)。
考虑到实际油色谱数据的不平衡性问题,可以通过随机过采样、SMOTE算法、EasyEnsemble 算法、BalanceCascade算法等方法进行数据的扩充。
2.2.2 油色谱有效性评估网络训练整体过程
整个训练过程可以描述为3个阶段。第一阶段对所有样本进行B样条拟合和EMD分解,得到IMF1~IMF3样本。第二阶段利用未标记的IMF1~IMF3分解样本根据公式对DBN网络1~3分别进行预训练。第三阶段利用已标记IMF1~IMF3分解样本对DBN网络1~3通过BP反向传播算法分别进行训练。
为了最大程度上提取数据特征,本文选择DBN、循环神经网络(Recurrent Neural Network,RNN)和FCN这3种具有代表性的神经网络进行算例分析,使用的样本一致,图3所示为不同网络对油色谱的识别精度结果。
图3 DBN、RNN、FCN网络误差
随着模型不断训练迭代发现,DBN网络在识别精度与训练速度都有较好的效果,因此本文选择该网络为所用网络。
本文提出基于B样条插值的油色谱数据经验模态分解方法,可以有效提高油色谱数据低采样下的经验模态分解稳定性。提出基于多参量深度置信网络的油色谱固数据有效性分析网络,可以对油色谱在线监测装置的有效性进行判别。