苏婷婷,彭贺翔,王灿,李波,廖凯,刘世峰
(1.西南交通大学,四川 成都611756;2.国网湖南省电力有限公司电力科学研究院,湖南 长沙410007;3.湖南大道电气设备有限公司,湖南 岳阳414022)
电压暂降是现代电力系统中常见的电能质量问题之一[1-3],影响继电器、可编程逻辑控制器等设备的正常运行,从而导致产品品质下降,带来巨大的经济损失[4-6]。电压暂降原因的准确辨识是综合治理电压暂降的重要前提,为电网-用户责任划分、工厂选址等提供有效参考[7]。
电压暂降原因辨识的两个主要步骤分别是电压暂降特征选取、分类器构建[8]。电压暂降特征选取,顾名思义就是提取具有良好表现力的电压暂降特征。文献[9]提出一种基于特征值综合法的电压暂降原因辨识方法,根据三相电压的不平衡度和二次谐波电压含量,结合马氏距离与概率神经网络,实现复合暂降源的辨识。文献[10]提出一种基于监测点电压有效值的识别方法,该方法从暂降幅值、暂降结束时的电压跳变、三相电压不平衡度等方面综合考量对比,设定相应阈值,从而识别暂降源的类型。但是随着分布式电源、储能、电动汽车的并网规模日益增大,电网的结构更加复杂,电压暂降经由各级变压器等元件传播,其特征会发生显著变化[11],导致不同类型暂降的特征范围之间存在交叠,阈值选取困难。一般来说,增加特征类别可以提高辨识准确率,但分类器的输入维度过大,可能导致分类器参数选取困难、过拟合、计算量增大等问题。所以,特征间的冗余问题不得忽视。文献[12]提出一种基于主成分分析(Principal Component Analysis,PCA)的特征约简方法,使用该方法对提取的原始电压暂降特征指标进行约简处理,有效抑制特征间的相关性。近年来,深度学习在电力系统中的应用成为研究热点。深度学习具有强大的数据挖掘能力,克服传统机器学习泛化能力弱的缺点[13]。文献[14]通过将卷积注意力模块融入改进辅助分类生成对抗网络,提高电压暂降原因辨识模型的性能。文献[15]提出一种基于深度置信网络(Deep Belief Network,DBN)的电压暂降原因辨识方法,该方法将暂降信号压缩成固定大小作为网络的输入,利用DBN网络的特征自提取能力实现电压暂降特征的提取,辨识各类暂降源。与文献[12]对比,文献[14]和文献[15]不需要人工选取特征类别,但网络提取的特征不具有物理意义,模型复杂、调试困难,不适合直接应用于现场监测终端,并且未考虑输入特征之间的依赖关系。
本文提出一种基于BiLSTM的电压暂降原因辨识方法。该方法首先构建原因辨识综合特征指标作为BiLSTM的输入,然后训练BiLSTM网络,实现电压暂降扰动源的分类和识别。通过与DBN、支持向量机(Support Vector Machines,SVM)、决策树(Decision Tree,DT)方法之间进行对比仿真,验证了所提方法的有效性与准确性。
电压暂降是指电力网络某节点的工频电压均方根值快速下降至额定电压的90%~10%的电能质量现象。引起电压暂降的原因有很多,本质为流经系统阻抗的电流突然增大,导致临近节点的电压暂时跌落。不同的电压暂降原因对治理具有显著影响,在此主要分析短路故障、大容量电机启动和变压器投运引起的电压暂降现象,总结其波形变化规律,为后续电压暂降原因辨识奠定基础。
短路故障是引起系统中电压暂降的主要原因之一,其中单相接地故障引起的暂降事件占总事件的66%以上。
单相接地故障、两相相间短路故障、两相短路接地故障引起的电压暂降均为不对称暂降,三相短路故障引起的暂降为对称暂降。由线路短路引起的电压暂降深度和持续时间主要受故障类型、故障距离、短路阻抗以及故障切除时间等因素影响,其波形如图1所示。
图1 不同类型短路故障引起的电压暂降波形
感应电机作为现代生产行业中应用最广泛的电机,是电力系统中重要的负荷之一。大容量感应电动机启动瞬间,转子静止,定子侧产生正常工作时几倍的启动电流,该电流在流经网络阻抗时产生分压,引起公共节点处电压下降。
由感应电机启动引起的电压暂降一般为对称暂降,此类暂降发生瞬间,三相电压快速下降至最低点后缓慢恢复。暂降深度和持续时间与电机容量、电网短路容量、电机惯性等因素有关,其波形如图2所示。
图2 大容量感应电机启动引起的电压 暂降波形
电力变压器是电力系统重要的基础设备。变压器投运时,由于铁芯的磁饱和特性,变压器终端会产生较大的激磁涌流,导致公共节点的电压下降。
由于三相电压的初相角始终相差120°,变压器铁芯的磁饱和程度也不相同,此类暂降为不对称暂降。各相电压快速下降到不相同的最低点后缓慢上升,暂降深度、恢复时间与投运时的电压初相角以及变压器铁芯剩磁等因素有关。其仿真波形如图3所示。
图3 变压器投运引起的电压暂降波形
由上述分析可知,不同原因造成的暂降具有不同的特征。为实现电压暂降的原因辨识,需要构建有效的特征指标作为分类识别的依据[16]。
选取5个能够突出暂降波形变化差异的时域特征参数,构成时域特征向量FTd,如式(1)所示。不同原因引起的暂降会使得FTd呈现出不同的数据特点。
①均值FMean:电压暂降期间电压幅值的平均值,短路故障引起的电压暂降电压均值较小,其他两种原因引起的电压暂降电压均值较大。均值计算公式如下:
②方差FStd:电压暂降期间电压幅值偏离其均值的程度,短路故障引起的电压暂降方差较小,其他两种原因引起的电压暂降方差较大。方差计算公式如下:
③波形因数FFfa:表示暂降波形变化的平坦程度,对矩形暂降和非矩形暂降有良好的区分效果。波形因数计算公式如下:
④斜度FSkew:电压暂降波形的非对称程度,短路故障引起的电压暂降斜度较低,其他两种原因引起的电压暂降斜度明显。斜度计算公式如下:
⑤峭度FKur:电压信号在暂降发生时的频率变化,变压器投运引起的电压暂降波形峭度大,其他两种原因引起的电压暂降波形峭度小。峭度计算公式如下:
S变换是一种可逆的时频分析方法,适用于分析具有突变特性的非平稳信号。基于S变换熵理论,首先对电压暂降信号进行S变换,其次提取基于S变换能量熵作为电压暂降时频域特征。S变换能量熵体现电压暂降信号在时域和频域上的能量分布信息[17]。
2.2.1 S变换基本原理
信号x(t)的一维连续S变换S(τ,f)为:
式中,ω(τ-t,f)为高斯窗口,τ为控制高斯窗口在t轴上位置的参数;f为频率。
将连续信号x(t)离散化,得到离散序列x[k]。则S变换的离散形式可表示为:
式中,N为x[k]长度;k=0,1,2,…,N-1。
对电压暂降信号进行S变换后,得到S矩阵。S矩阵是一个二维的复时频矩阵,矩阵的行表示频率、列表示采样点。
2.2.2 S能量熵提取
对S矩阵的元素进行求模,得到S模时频矩阵,记为矩阵Dm×n。将矩阵D等行分为3个部分,并基于熵理论对不同频段构成的矩阵进行分析,提取S变换能量熵特征FE1、FE2、FE3。利用3个S能量熵可构成时频域特征向量FFd,如式(11)所示。
S能量熵计算公式如下:
对发生暂降时各相电压的5个时域特征及3个时频域特征进行提取,最终构成电压暂降原因辨识特征向量。
BiLSTM是循环神经网络的一种改进形式,可以保持输入特征之间的依赖关系,适用于电能质量信号的分类与辨识。BiLSTM由双层长短期记忆神经网络(Long Short Term Memory,LSTM)组合而成,网络结构如图4所示。h1表示前向的LSTM,h2表示后向的LSTM。这种双层结构可以同时提取输入序列的前向和后向的数据关系,拼接成一个输出。
图4 BiLSTM网络结构模型
LSTM神经元的结构如图5所示,x(t)表示在t时间步的输入;分别表示遗忘门、输入门和输出门在t时间步的输出;h(t-1)、h(t)分别表示LSTM神经元在t-1和t时间步的隐藏层输出状态;c(t-1)、c(t)分别表示LSTM神经元在t-1和t时间步的记忆单元;σ为Sigmoid函数,tanh为双曲正切函数。
图5 LSTM神经元结构
遗忘门控制c(t-1)中需要保留的信息,并传递到下一时刻的记忆单元c(t)中。输出Of(t)的表达式如下:
式中:W xf表示输入与遗忘门之间的权重矩阵;W hf表示隐藏层和遗忘门之间的权重矩阵,b of为遗忘门的偏移向量。
输入门控制x(t)中需要传递给t时间步记忆单元c(t)的信息,其输出Oi(t)为:
式中,W xi表示输入与输入门之间的权重矩阵;W hi表示隐藏层和输入门之间的权重矩阵,b oi为输入门的偏移向量。
t时间步的记忆单元c(t)是t-1与t时间步LSTM单元状态的信息组合,其表达式为:
式中,·*表示矩阵中对应的元素相乘;W xc表示t时间步输入x(t)的权重矩阵;W hc表示h(t-1)的权重矩阵;b c表示记忆单元的偏移向量。
输出门控制t时间步记忆单元状态c(t)流入t时间步隐藏层输出h(t)的信息,其输出Oy(t)如式(16)所示。此时,h(t)由输出门Oy(t)和记忆单元c(t)共同决定,如式(17)所示。
式中,W xy表示输入与输出门之间的权重矩阵;W hy表示隐藏层和输出门之间的权重矩阵,b oy为输出门的偏移向量。
LSTM通过引入3个门控结构(遗忘门、输入门和输出门),选择性地保留或遗忘过去时刻的信息,解决传统RNN梯度消失和梯度爆炸的问题。LSTM为单向神经网络,仅能使用当前时间步t之前的信息,而BiLSTM可以充分利用过去和未来的信息,辅助网络做出更有效的决策。
综上所述,基于BiLSTM的电压暂降原因辨识方法主要包括以下5个步骤:①建立含分布式电源的电压暂降仿真模型,获取电压暂降原始数据集;②对电压暂降原始数据进行预处理,包括数据归一化、计算电压有效值、提取暂降数据段;③分别提取电压暂降的时域特征和时频域特征,构建不同类型电压暂降综合特征指标向量,并将样本划分为训练集和测试集;④建立BiLSTM网络,使用训练集对BiLSTM网络进行训练;⑤利用训练好的BiLSTM网络对测试集进行电压暂降原因辨识,验证该方法的有效性。
采用Matlab平台搭建含分布式电源的电压暂降仿真模型,如图6所示。图6中F为故障位置,S为电压暂降测量点。设置采样率为5 kHz,仿真总时长为1 s,暂降持续时间取值范围为(0.01 s,0.5 s)。通过调节短路故障类型、暂降持续时间及系统短路阻抗,获得单相接地(C1)、两相短路(C2)、三相短路(C3)样本各100组;通过调节感应电机的额定电压、电流和容量,获得感应电机启动(C4)样本80组;通过调节变压器的额定容量、线路负荷,获得变压器投运(C5)样本80组。
图6 电压暂降仿真模型
对获得的电压暂降原始样本进行预处理,将数据归一化,计算其电压有效值,并提取电压幅值小于0.9 p.u.大于0.1 p.u.的暂降数据段;求取电压暂降特征,形成电压暂降原因辨识综合特征向量,并将样本随机按照8∶2比例划分为训练集和测试集。
采用的BiLSTM网络共有4层,分别为输入层、BiLSTM层、全连接层和输出层。输入层负责输入样本集和标签集,输入维度为1;BiLSTM层设置50个隐藏单元,用于提取输入样本的特征;全连接层汇总BiLSTM层提取的特征信息;输出层通过利用特征信息,获得样本的概率分布,并输出其预测标签。
4.2.1 评价指标
电压暂降的原因辨识是一个多分类问题,因此选用多分类问题中的准确率(acc)、精确率(prc)、召回率(rec)和F1值作为分类结果的评价指标。评价指标如式(18)—(21)所示。
式中,TP为分类正确的样本数量;TN为不属于此类别且没有被分到此类别的样本数量;FP表示不属于此类别但被分到此类别的样本数量;FN表示属于此类别但被分到其他类别的样本数量。
准确率表示分类正确的样本占被分类总样本的比重;精确率又称作查准率,表示预测为此类别的样本中真实为此类别样本的比重;召回率又称为查全率,表示真实为此类别样本中被预测为此类别样本的比重;F1值为精准率和召回率的加权平均。对于电压暂降原因辨识,准确率、精确率、召回率和F1值越大,说明辨识效果越好。
4.2.2 仿真结果及分析
电压暂降原因辨识结果的混淆矩阵如图7所示。横坐标表示样本的预测类别,纵坐标表示样本的实际类别,对角线表示被正确分类样本的数量,非对角线表示被错误分类样本的数量。
图7 混淆矩阵
根据混淆矩阵,求解指标见表1。其中,一组实际类别为C1的样本被预测为C4,除此组样本预测错误外,实际类别为C2、C3、C4、C5的样本均被正确预测。由式(18)~ (21)计算可得,样本C1、C2、C3和C5的辨识精确率为100%;C2、C3、C4和C5的召回率均为100%;每个样本的F1值均大于95%。电压暂降原因辨识结果的整体准确率为98.91%。
表1 基于BiLSTM的电压暂降原因辨识结果%
为了进一步验证本算法具有较好的辨识性能,将本算法与其他算法作比较,辨识结果见表2。
表2 不同电压暂降辨识方法仿真结果对比 %
由表2可知,与其他方法相比,基于BiLSTM的电压暂降原因辨识方法辨识准确率和F1值均高于其他方法,验证了该方法的有效性。
本文提出一种基于BiLSTM的电压暂降原因辨识算法,实现不同类型的电压暂降分类,并进行仿真验证,得到如下结论:
1)提取电压暂降时域特征并结合S变换提取电压暂降时频域特征,构建电压暂降原因辨识综合指标,具有较好的识别精度。
2)基于BiLSTM的电压暂降原因辨识方法的准确率达到98.91%,高于其他方法,验证了该方法的有效性和准确性。
本文将电压暂降分为5类,未考虑复合型电压暂降的辨识,这是本课题的进一步研究方向。