赖 奎,戴雄杰,潘松波,苏博波
(广东电网有限责任公司江门供电局,广东 江门 529000)
配电终端作为配电自动化中重要的监测与控制设备,其可靠性对配电网安全、稳定运行有重要作用[1-2]。在实际运行过程中,受安装环境与产品性能、质量的差异影响,配电终端容易发生异常甚至故障[3-4]。配电终端的采集模块作为配电网分段点、分支点、柱上开关、环网柜等线路与设备的实时计量装置,如果发生故障,将会导致测量数据与真实数据差距过大。失真的数据会使得电网人员因对设备运行状态误判而导致操作失误,从而影响整个配电网的运行、降低配电网的可靠性[5]。传统的配电终端诊断方式依赖人工,效率低下,不能及时发现故障并识别故障类型,已经无法满足当前对配电自动化设备可靠性的需求[6-7]。
文献[8]通过云模型以及Dempster-Shafer证据理论,对配电终端的健康状态进行综合评估。文献[9]以配电终端的运行状态为依据,对配电终端的状态序列进行判定,并进一步对其进行故障诊断。但这2种配电终端的故障诊断方法只能检测出设备故障与否,并不能检测出设备具体故障类型。文献[10]采用融合关联规则Apriori算法,通过分析关联配电终端的故障产生原因及特征,对配电终端采集模块故障进行诊断。但这种方法所需提供的配电终端相关数据较多,分析较为复杂。上述文献研究对配电终端故障诊断具有一定效果,但是均未针对采集模块的具体故障诊断类型识别展开深入研究。
本文提出1种基于卷积神经网络(convolutional neural network,CNN)和Attention机制的配电终端采集模块故障诊断方法,通过采集模块电气数据识别故障类型。由于配电终端运行环境复杂,采集到的数据往往是由故障数据、噪声数据等多种数据混合而成的复杂信号,直接对其进行故障识别较为困难。因此,本文首先使用短时傅里叶变换(short-time Fourier transform,STFT)对复杂信号进行时频特征提取,强化数据特征,以形成具有频域特征的时频图;然后使用CNN-Attention模型对时频图进行故障诊断。Attention机制能够赋予不同通道特征图权重,强化有利于故障诊断的特征通道,并抑制不利于故障诊断的特征通道,使模型在训练时收敛得更快、准确率更高,从而有效地在噪声环境中识别配电终端采集模块的具体故障类型。
对配电终端采集模块监测的电气数据进行分析,能够反映采集模块互感器、转换器等测量系统部件是否正常。这将有助于确保采集数据的真实性,进而保证配电网的安全。
故障对应逻辑如图1所示。
在配电终端电压、电流采集过程中,由于采集值受现场环境因素的影响,其与真实值会存在偏差。偏差在一定范围内的测量数据并不会对配电终端的可靠性造成影响,属于正常的配电终端采集数据。但是,当配电终端采集模块中的某一部件发生损伤或故障时,会导致配电终端采集到的电气数据与真实数据产生较大差异。这种情况下,需要及时确定故障发生部位并对其进行检修。常见的配电终端故障类型有测量设备老化、互感器故障、滤波电路故障。有可能引发的故障现象为采集数据偏离均值甚至无采集数据。
根据配电终端采集模块故障原因,可将采集数据分为正常数据、噪声故障数据、震荡衰减故障数据以及谐波干扰故障数据。本文通过建立故障对应数据模型,验证后续故障诊断方法的可靠性。
①采集模块正常时的数据模型。由于配电终端采集模块中互感器、模数转换器等装置在现场实际运行过程中会受到温度、湿度等环境因素干扰,使得采集值含有随机噪声。该噪声一般呈高斯分布。
采集模块测量误差的正常数据模型如式(1)所示。
f1(t)=Asin(ωt+φ)+N(0,δ2)
(1)
式中:N(0,δ2)为均值为0、方差为δ2的高斯噪声;t为时间;ω为测量电压或者电流的角频率;A为测量电压或电流的幅值;φ为测量电压或电流的相角。
②噪声干扰采集模块故障模型。在配电终端采集模块中,互感器等信号处理装置或信号传输单元发生故障时均有可能导致测量值的精度失真。这样的故障情况采集到的数据一般带有噪声偏大的特性,因此被称为大噪声故障数据。此时的故障数据模型如式(2)所示。
(2)
③震荡衰减采集模块故障模型。当配电终端中的测量设备老化或性能衰减时,测量数据往往具有一定的震荡衰减特征。此时的故障数据模型如式(3)所示。
f3(t)=e-btAsin(ωt+φ)N(0,δ2)
(3)
式中:b为衰减指数。
④谐波干扰采集模块故障模型。当配电终端中的测量元件受到环境干扰或元件故障时,会使得测量的交流量偏离基频。如电磁式互感器的励磁特性劣化时,会发生铁磁谐振,致使测量量中含有高次谐波分量。此时的故障数据模型如式(4)所示。
f4(t)=Asin(ωt+φ)+A2sin(2ωt+φ2)+
A3sin(3ωt+φ3)+…+N(0,δ2)
(4)
式中:A2、φ2、A3、φ3分别为产生的2次和3次谐波幅值与相角。
以上建立的模型为配电终端采集模块故障时的时域模型,只能反映采集模块故障时所采集到的数据与时间的关系。为了反映不同类型数据特征,本文引入STFT,使得信号在时域和频域中联系,并经过STFT将时域数据转化为含有时域和频域特征的时频图。
STFT是一种针对时变、非平稳信号的时频分析方法,实质是信号在进行傅里叶变换之前增加了1个时间限定的窗函数h(t)。本文假定非平稳信号在一定的短时间内为平稳信号,窗函数h(t)在信号上进行移动,对信号进行逐段转换。STFT如式(5)所示。
(5)
式中:S为STFT;f(t)为变换前的时域信号;h(t-τ)为窗函数,τ为窗函数的中心。
本文选取海明窗函数作为本文窗函数。
(6)
式中:T为周期,即窗长。
通过STFT对数据进行时频分析,可以将采集模块所采集到的不同类型时域数据转换为时频图,以作为后续故障诊断模型的输入。
CNN具有稀疏连接、权值共享的特点。其中,卷积层、池化层是CNN拥有强大特征提取能力的关键。CNN在图像识别及诊断方面具有高效性。CNN模型如图2所示。
图2 CNN模型示意图
采集数据时频图经预处理后进入CNN模型,经过卷积层、池化层、激活函数以及全连接层完成时频图特征的提取、数据的降维,以及故障类型的识别与匹配。卷积层使用卷积核对时频图进行卷积操作,并通过激活函数得到特征图。卷积过程如式(7)所示。
(7)
f(x)=max(0,x)
(8)
在池化层,通常以最大池化作为池化方式。该方式能够在保留经过卷积层的明显数据特征的同时降低模型的计算量,以减少训练时间,防止模型过拟合。全连接层将经过卷积、池化操作后的特征图展开,并通过激活函数得出分类类型。由于本文为多分类研究,因此本文以Softmax作为激活函数,并将输出结果映射为(0,1)之间的概率分布。
Softmax函数如式(9)所示。
(9)
式中:zi为第i个节点的输出;C为分类类别的个数。
由于模型的目的是故障诊断与识别,可采用样本交叉熵损失函数的平均值作为目标函数。模型的训练过程可以看作是寻找神经元参数最优解的问题,通过梯度下降法对目标函数反向传播以进行参数优化。
卷积运算所提取的特征经常会出现冗余的情况[11]。这类冗余的特征会干扰模型训练时的收敛甚至精度。Attention机制能够有效解决这类问题。本文的Attention机制选择通道注意力机制(channel attention mechanism,CAM)。CAM能够通过分析来自不同通道的特征信息,增强对故障诊断有利的特征信息通道权重,并削弱干扰故障诊断的信息通道权重。CAM运行原理如图3所示。
图3 CAM运行原理
CAM利用全局平均池化层将每个通道的输入特征图平均成1个值。该值带有一定的全局特征。CAM通过2个全连接(full connected,FC)层以及激活函数对每个通道进行加权,以生成每个通道的权重。本文采用的FC层为2个卷积核大小为1的卷积层,以ReLU作为激活函数增加网络的非线性能力。Sigmoid函数能够将权重变量进行归一化变换,对原始输入特征图赋予权重后可得到新的特征图。归一化式如式(10)所示。
(10)
式中:p为归一化前的权重变量。
通过上述分析,本文对配电终端采集模块数据进行STFT,得到1 600张包含各类型数据特征时频图的故障数据集。该数据集包含正常样本400张、噪声故障样本400张、震荡故障样本400张、谐波故障样本400张。本文随机选取数据集中的60%作为训练集用以训练神经网络模型、20%作为测试集用以评价模型优劣,剩余20%作为验证集。为说明本文提出方法的有效性,本文设置3组模型,以对比故障诊断效果。
CNN-Attention故障诊断过程如图4所示。
图4 CNN-Attention故障诊断过程
方法一是采用CNN-Attention模型进行故障诊断。原始采集模块数据通过STFT之后得到特征更为明显的时频图。训练集的时频图作为CNN-Attention神经网络模型的输入,经多个卷积层、池化层、全连接层以及Attention机制学习其数据特征后,可确定模型参数。每轮训练后使用测试集测试模型故障识别准确率并通过反向传播优化模型参数。为避免模型产生过拟合现象,在全连接层中加入Dropout以随机丢失20%神经元。神经网络模型设置学习率为0.01、迭代次数为100次,即可得到较好的诊断效果。
方法二是采用CNN模型进行故障诊断。其诊断流程与方法一类似,均为采用训练集训练神经网络模型并通过反向传播优化模型参数。但方法二在神经网络模型的特征提取环节取消了Attention机制环节,因此特征图经过第一个池化层后直接进入第二次卷积操作。
方法三是采用极限学习机(extreme learning machine,ELM)进行故障诊断[12]。ELM模型不用经过多次迭代训练,通过选取随机的输入层权重和隐藏层偏置,以及广义逆矩阵运算即可得到输出层参数。方法三使用的数据和预处理方法与上述2种方法相同。神经网络模型替换为ELM。
由于CNN需要经过多次训练,模型收敛后准确率仍然存在一定波动。为保证故障诊断的可靠性,本文选取模型训练收敛后的平均准确率作为模型准确率。CNN-Attention模型在迭代100次后,模型的平均准确率可以达到97.31%。CNN模型在迭代100次后,模型的平均准确率可以达到96.09%。ELM模型无需进行迭代训练,但其准确率仅为92.91%。
方法一与方法二训练时的准确率和损失值对比如图5所示。
图5 训练时的准确率和损失值对比
由图5可知,方法一和方法二的故障诊断准确率大于方法三。这说明CNN在图像特征提取与分析能力方面优于传统神经网络。CNN能够有效提高故障诊断准确率。
方法一故障诊断准确率大于方法二。在训练过程中,CNN-Attention表现得比CNN更好,在迭代10次以后,CNN-Attention的损失值表现得比CNN更低。这说明此时CNN-Attention模型故障诊断结果更加接近实际值。当迭代30次以后,CNN-Attention准确率比CNN更高且趋于收敛。CNN在迭代40次以后才趋于收敛并且后续准确率波动较大。对比结果说明,Attention机制能够自学习每个特征通道的重要程度,通过赋予不同重要程度特征通道相应的权重值,在模型诊断过程中抑制不利于故障诊断的特征通道、加强有利于故障识别的特征通道,从而加快了神经网络训练时的收敛速度、提高了故障诊断的准确率。
方法一验证集混淆矩阵如图6所示。
图6 方法一验证集混淆矩阵
由图6可知,模型对谐波故障和震荡故障的识别率能够达到100%。模型将6个噪声故障样本识别为正常,并将1个正常样本识别为噪声故障。这是因为噪声故障与正常样本的特征差异仅在于信号中夹杂噪声的大小。特征不够明显会导致模型误判。但整体诊断结果表明,所提方法可以有效识别配电终端采集模块的故障类型。
准确的故障类型识别能够为配电终端采集模块的运维提供参考。本文提出的基于STFT和CNN-Attention的故障诊断模型对于配电终端采集模块具体故障类型具有较高的识别率。CNN能够有效提取经STFT后的时频图特征。Attention机制使CNN训练时能够更加注重有利于故障诊断的特征,从而加快模型收敛速度、提高模型准确率。本文方法能为配电终端智能化运维提供参考。后续研究将进一步考虑配电终端采集模块的复合故障。