基于卷积神经网络的交直流输电系统故障诊断

2022-03-12 07:46张大海张晓炜和敬涵
电力系统自动化 2022年5期
关键词:交直流池化直流

张大海,张晓炜,孙 浩,和敬涵

(1. 北京交通大学电气工程学院,北京市 100044;2. 国网山西省电力公司长治供电公司,山西省长治市 046000)

0 引言

随着中国特高压交直流输电系统日趋大型化、复杂化和智能化,电网运行特性随之发生深刻变化,电网调度也面临着新的重大挑战[1]。一方面,特高压输电受到地区气候多变、运行环境复杂等因素的影响,迫切需要同步掌控电网运行态势;另一方面,特高压电网送受端、交直流耦合密切[2],容易引发全局安全风险。因此,在全网层面实时进行跨区域安全预警和风险防范控制对协助调度运行极为重要。

当电网发生故障时,监测系统采集的海量故障警报数据(涵盖正确报警信息、错误报警信息、重复报警信息和不相关信息)从本地自动装置上送至调度中心[3]。电网故障诊断能够从故障数据中迅速分析得出故障关联特征,准确判断故障原因,辅助调度运行人员及时、准确地分析与处理事故,同时也为检修和运维人员的故障恢复提供可靠依据,对于电网的安全可靠运行和快速自愈恢复具有重要意义[4]。

近年来诸多学者广泛采用专家系统、解析模型、贝叶斯网络、Petri 网、粗糙集、人工神经网络等方法[5-8]研究电网故障诊断问题。文献[9]为增强面对复杂系统故障时的诊断推理能力,提出基于有限状态机的离散事件专家系统,并搭建简化推理模型;文献[10]结合动态因果推理链与贝叶斯网络检查漏报、误报的告警信息,有效降低了故障信息不准确对诊断的影响;文献[11]提出一种多目标优化诊断模型,采用基于模糊技术的优化方法进行求解,具有更强的容错能力。文献[12]为增强故障诊断结果的准确性,提出一种容纳时序约束的模糊Petri 网故障诊断模型。可见,现有的电网故障诊断方法能够获得较好的诊断结果[13],但未考虑电网结构复杂时存在建模困难、诊断准确性难以有效保证等问题,同时在系统扰动或人工阈值设定[14]的影响下,诊断效果很难达到调度中心预期要求。

深度学习方法为电网故障诊断提供了新思路、新途径[15-16],无须建立精确模型,就能够快速准确提取海量数据中隐藏的深层抽象特征[17],适用于结构复杂的电网故障诊断问题。文献[18]运用基于时间序列的循环神经网络将提取的故障特征数据进行分类;文献[19]将故障特征转化为灰度图,并应用卷积神经网络(CNN)完成故障特征的分类识别。上述文献采用端到端的学习模型,有效解决了复杂系统建模困难的问题。可见,深度学习方法基本具备应用于交直流输电系统故障诊断的条件,但具体应用还需展开深入研究。

本文提出了一种基于CNN 的交直流输电系统故障诊断方法,主要用于对单一故障事件(故障线路及故障类型)进行诊断,旨在作为常规故障诊断方法的补充。通过对输入数据统计分析,将分层训练与整体微调相结合,提高模型的非线性拟合能力。该方法可以将不同属性的数据源作为同一故障样本进行学习,处理交直流输电系统中的复杂多维特征;运用卷积与池化相结合的结构,有效削弱行波延迟的影响;具有优秀的特征提取能力、较好的容错性和泛化能力,能够准确、可靠、快速地描述故障特性。

1 电网故障信息与CNN 结构原理

1.1 交直流输电系统故障信息

不同于传统交流电网,交直流输电系统的输电线路故障时,由于换流器的非线性时变特性以及直流控制系统的复杂性,换流站两侧交、直流系统的电气量存在强耦合关系[20]。交流线路故障时,会导致直流侧电气量发生变化,从而改变直流侧的故障特征,进而影响直流保护性能。故障严重时甚至会引发直流系统逆变器换相失败,直流控制系统的调节过程会对交流系统产生二次冲击,容易引起交流保护误动作。因此,在交直流输电系统中,仅依据保护动作信息无法及时准确地诊断出真实故障。

现阶段交直流输电系统的故障诊断过程中需要高效获取准确、完备的诊断信息。电网发生故障时,故障信息时序变化过程如图1 所示。故障发生首先反映在电气量信号的变化,随后保护控制装置才由于电气量超过预设阈值而启动并发送跳闸信号,使断路器跳闸,隔离故障[21]。

图1 电网故障时的信号时序Fig.1 Signal time sequence in the case of power grid fault

由上述时序分析可知,电网运行状态主要由电气量和开关量表征,而保护启动和开关动作信号明显在电气量变化之后,且开关量信息含量少,不足以充分反映故障特征。

因此,本文在交直流输电系统的故障诊断过程中,采用交流母线及换流站出口的电压、电流量作为输入对故障线路诊断。

1.2 CNN 结构与原理

CNN 常用于图像识别,本质上是一种分类处理方法。而电网的故障诊断即是判断输入数据的故障性质,故障性质主要涉及多条故障线路和多种故障类型,显然故障诊断是多分类问题。在运用CNN 对电网进行故障诊断时,CNN 主要包括故障特征提取和故障分类两部分神经网络[22-23],CNN 内部结构如图2 所示。

图2 CNN 内部结构Fig.2 Internal structure of CNN

1.2.1 故障特征提取网络

故障特征提取网络主要包括输入层、卷积层和池化层。输电线路故障诊断需要线路两侧母线及换流站出口的电气量数据。为保证采集的数据在时域上的同步性,设置启动判据寻找各测点截取窗口的起始位置,启动判据如式(1)所示。

式中:iφ为电流值,交流侧取有效值,直流侧取极电流;Δiφ为电流变化量;In为电流额定值。

|iφ|>1.1In为稳态判据,|Δiφ|>0.1In为暂态判据,任一启动判据满足时,即开始采集数据。

考虑到CNN 作为一种监督学习场景下的深度训练模型,适合二维数据结构,采集电气量数据即可构成二维数据输入样本[24]。输入为n×m的矩阵,行数n表示采样点个数,列数m表示采集的电气量数目。输出则为对应于输入的故障性质,这里将故障类别转换为“one-hot 编码”。输入与输出特征共同构成故障诊断的样本。

为了消除数据量纲对模型训练的影响,还需要对样本集进行Min-Max 归一化处理,变换函数如式(2)所示。

式中:x∗为采集量归一变换后的数据;x为采集的原始数据;xmin和xmax为样本数据中的最小值和最大值。

卷积层通过滑动二维卷积核遍历输入矩阵进行内积运算来实现特征映射,初步提取输入数据的故障特征,同时还能削弱行波延迟对数据采集的影响,卷积运算过程见附录A 图A1。

卷积层提取故障特征受到多种因素影响。设计适用于交直流输电系统故障诊断情形下,需要明确输入矩阵大小h1×w1×d1(h1、w1、d1分别为输入样本的高度、宽度、通道数)、卷积核大小F、卷积核数量K、滑动步长S及输出矩阵大小h2×w2×d2这几者之间的关系,如式(3)所示。

卷积运算通过完成输入的线性激活响应得到输出特征映射图,并利用非线性激活进一步提取故障特征。为缓解网络梯度消散现象且使其表达稀疏化,激活函数采用线性整流函数(rectified linear unit,ReLU),通过将小于0 的值改写为0,使特征图稀疏化,实现相关特征的提取。

池化过程是将卷积特征映射图的邻近元素合并为单个代表值,被合并元素数量的选取是电网故障诊断训练模型的关键过程。池化可以降低故障特征图的尺寸,从而减小网络参数的规模,在一定程度上能降低数据处理的计算量、减轻过拟合现象[25-26]。池化层在某种程度上可以补偿故障发生时刻随机而导致故障特征偏移的情况[27],增强故障诊断模型的容错性能。

目前,应用于CNN 模型的池化操作包含最大池化(max-pooling)和平均池化(mean-pooling)。故障诊断中采用最大池化能使CNN 具有一定的抗噪声能力。若故障特征提取网络输入层中出现噪声干扰情况,微小变化未必会影响区域内最大值的选取,能够提高网络的抗噪声能力。

故障特征提取网络通过多层卷积池化作用将输入样本中提取到的故障特征传递给故障分类网络,随后由其运算完成分类输出。

1.2.2 故障分类网络

故障分类网络将输出特征转化为线性全连接结构。为使故障分类网络关注到输入层整体信息和输出节点的关联性,采用Softmax 函数对故障特征分类输出。Softmax 函数φ(υi)的表达式和约束条件分别如式(4)和式(5)所示。

式中:yi为Softmax 函数第i个输出节点的输出值;υi为第i个输出节点的加权和;M为输出节点的数目。式(5)考虑到各输出值的相对大小,设置其和恒等于1,有助于呈现多分类神经网络。

综上,针对交直流电网的运行特点,基于CNN构建的故障特征提取和分类模型充分考虑对海量故障数据的深层故障特征的挖掘能力,有利于网络结构与电网故障情况的紧密贴合。

2 基于CNN 的故障诊断原理与网络优化

随着交直流输电系统日趋复杂化、大型化和智能化,电气量特征数据量不断丰富。基于CNN 的交直流输电系统的故障诊断方法需要对网络结构及参数进行优化分析。

2.1 基于CNN 的故障诊断原理

所构建基于CNN 的故障诊断模型见附录A 图A2。首先,获取输电线路两侧母线及换流站出口的电气量采样数据,然后根据诊断内容分别生成诊断故障线路和故障类型的训练样本集和测试样本集。训练样本集用于训练并优化CNN 的诊断网络参数,训练效果最终由测试样本集对故障线路和故障类型的分类准确性进行检验。

2.2 故障诊断网络结构与优化训练

在运用CNN 诊断故障性质的过程中,每个样本的电气信号数据量大且复杂,需要求解CNN 的参数,以提高该方法在电网故障诊断方面的适用性。参数求解本质上是一个优化问题,因此需要对网络结构与训练参数进行优化。

2.2.1 CNN 结构配置

影响CNN 电网故障诊断性能的因素有很多,可以从网络层结构、卷积核大小、卷积核个数3 个方面来考虑。

1)网络层结构

卷积池化层数往往影响故障特征提取深度以及降维效果。随着卷积池化层数量的增加,数据特征提取能力越强,越有可能挖掘到关键特征。然而,网络层结构又受到误差反向传播训练的约束,层数过大会导致网络结构复杂化,甚至会出现梯度消失现象,限制参数优化效率。因此,选择合适的卷积池化层数对CNN 而言至关重要。

2)卷积核个数

卷积核个数通常影响故障特征提取的效率。在输电系统故障场景中,卷积核数目越多,意味着网络的卷积层提取故障特征能力越强。但是卷积核个数过多,会造成训练参数数目规模显著扩大,甚至会出现数据提取的过拟合现象,严重影响提取效率;而个数过少时提取效果不能满足诊断要求。

3)卷积核大小

从生物学角度探究卷积核大小产生的影响,发现卷积核与感受野存在较强的关联性[28]。较大的卷积核表示卷积层可以接收更多的故障信息,有利于提高卷积层特征提取效率。但卷积核规模过小的情况下难以消除行波延迟的影响。因此,选取适合于交直流输电系统结构的卷积核规模对于网络训练过程非常重要。因此,以上3 个方面的选值构成博弈,在选定结构参数的过程中,需权衡各个因素,才能匹配到最适合电网故障诊断的网络。本文以交叉熵最小为目标函数优化网络参数,选取合适的网络结构,如式(6)所示。

式中:E为交叉熵代价函数,用来表示交叉熵与误差之间的关系;y和d分别为故障诊断网络的实际输出和目标输出。

式(6)表明交叉熵函数与故障分类网络的Softmax 激活函数相结合,共同影响故障诊断网络优化过程。当d=1,输出y=1 时,误差d−y=0;相反地,当y趋近于0 时,误差增加。通过式(6)可以得知交叉熵函数随着误差的增大而呈几何上升趋势,能够敏感感知误差。因而将交叉熵最小作为网络结构优化配置的目标有利于实现较好的故障诊断效果。

2.2.2 CNN 优化训练

为提升网络诊断效率、降低故障诊断各环节的误差,网络优化训练是该CNN 模型中极为重要的一环。局部连接是该模型在卷积和池化过程中始终贯穿的思想,虽然能达到快速降维的目的,却也是误差传播的直接原因。为了最小化诊断模型产生的误差,使卷积、池化快速降维和深度挖掘的能力得到充分体现,需要反向优化训练参数。

目前常用的优化算法包括随机梯度下降法(SGD)、均方根传递法(RMSprop)和Adam 算法等。本文所提方法结合了Adam 算法内存占用率小、易于处理复杂海量故障数据的优势,有助于快速高效提取故障特征,具体实现过程为:

式中:m̂t和n̂t分别为mt和nt的偏差修正;η为学习步长;θt为t时刻的网络参数;ε为调节参数,使分母避免为零,这里取ε=10−8。

2.3 可视化分析方法

CNN 故障诊断模型的网络配置充分适应算例并优化训练后,仅凭借诊断准确率难以直观呈现其分类效果。本文采用t-分布随机邻域嵌入(t-SNE)算法[29]将高维空间的数据降维表达,使数据分布规律可视化展示,便于评估故障特征提取能力。

基于CNN 的故障诊断方法如图3 所示。

图3 基于CNN 的故障诊断方法Fig.3 CNN-based fault diagnosis method

3 算例分析

3.1 算例描述

本文以Kundur 提出的四机两区域交直流混联模型[30]为基础,在MATLAB/Simulink 仿真平台上改进得到如图4 所示的交直流输电系统模型,具体参数见附录A 表A1。

图4 交直流混合输电系统模型Fig.4 AC/DC hybrid transmission system model

模型中的直流输电系统采用单极常规高压直流输电模型,与部分交流系统并联运行。四机两区域交直流输电系统线路故障分为交流线路故障和直流线路故障。交流故障类型包括常见的单相接地故障、两相短路故障、两相接地故障以及三相短路故障,总计4 大类10 小种,直流故障只有单极接地故障。本文以直流线路8-9 单极接地故障和线路3-4单相接地故障为例,得到原始数据波形见附录A图A3。

附录A 图A3(a)为直流侧单极接地故障波形。在稳定状态下,整流器的触发延迟角在15°附近;t1时刻直流侧发生金属性单极接地故障,直流电压迅速降低,当其达到直流侧低压限流控制启动阈值时,低压限流控制启动并抑制故障电流增加;在故障消失前,直流电压在故障点作用下等于0;移相控制设置在故障发生10 ms 时将触发角强制移相为166°,持续时间为300 ms;t2时刻移相控制投入,换流站处于逆变工作模式,而晶闸管是单向导通元件,直流侧无电流馈入,直流侧的电流迅速降低至0;t3时刻故障消失后,在移相控制作用下,直流电压反向;t4时刻移相控制解除,系统逐渐恢复运行。直流故障对交流侧的影响为:直流侧单极接地故障时,直流侧电流为0,由于晶闸管单向导通,整流侧交流电流也为0。

附录A 图A3(b)所示为假定阀侧交流输电线路在0.7 s 发生A 相金属性接地故障的波形,交流侧A相电压迅速降低;由于失去了交流电压支撑,直流电压也随之降低,直流侧控制模块快速响应以稳定直流侧电压电流。由此可知,交直流输电系统中输电线路故障时,换流站两侧交、直流系统的电气量存在强耦合关系,由于换流器的非线性时变特性,换流站的传递特性较为复杂,两侧电气量之间的关系难以解析表达。而采用本文所提的基于CNN 的电网故障诊断方法能够自动挖掘电气量的深层故障特征,有利于实现故障的准确诊断。

3.2 故障特征设计与模型构建

算例采集四机两区域交直流输电系统的7 条交流母线和2 个换流站出口共9 个测点的电压、电流量作为一组输入对线路故障性质进行诊断,每个输入矩阵的列数为46。采样窗口宽度为10 ms,采样频率设为10 kHz,则矩阵行数为100。因此,输入矩阵大小为100×46。通过批量化仿真采集不同故障位置、故障类型含过渡电阻共计14 418 组故障样本,见附录A 表A2。

先将样本集做归一化处理,再以7∶3 的比例划分为训练集和测试集[31],即可得到网络的输入层。

训练过程中常用的分集比例有6∶4、7∶3 和8∶2。分集比例为5∶5 时训练集太小,网络难以得到充分训练;分集比例为9∶1 时测试集太小,在样本集较小时,难以对网络的训练效果进行客观检验。本文分别将分集比例为6∶4、7∶3 和8∶2 时的网络训练效果在表1 中呈现,观察得知训练集和测试集以7∶3 的比例划分时,训练效果最佳。

表1 不同分集比例对诊断准确率的影响Table 1 Effect of different set allocation ratios on diagnostic accuracy

CNN 应用于算例的故障诊断,还需要建立合适的网络模型。首先是逐层筛选、逐层叠加,进而确定网络结构;然后在算例基础上分别对各组参数做详细对比,详见附录A 图A4。

以交叉熵最小化为目标,根据诊断结果,初步选定故障诊断网络为2 层时诊断效果最佳。卷积核个数和卷积核尺寸还需根据各层分类效果及最终诊断效果选取。

在训练过程中发现不论诊断故障线路还是故障类型,Adam 算法的准确率都是最高,详见附录A 图A5。因此,本算例选取Adam 算法进行优化训练。

3.3 基于CNN 的故障诊断结果分析

交直流输电系统的故障诊断主要包括故障线路判别和故障类型判别,接下来将从两方面来验证基于CNN 的故障诊断模型的优越性。

3.3.1 故障位置诊断

结合各种参数对故障位置诊断效果的影响,线路诊断网络配置如附录A 表A3 所示,为了提高模型的泛化能力,加入了节点丢弃(Dropout)机制,即让某个神经元按照一定的概率暂时停止工作。

为充分解读CNN 交直流故障诊断网络设置的合理性,应用t-SNE 算法对其输出结果进行可视化展示,见附录A 图A6。从图A6(a)第1 层卷积池化可视化分类结果分析得出,同一条故障线路提取的特征基本呈现聚集现象,仅有极少数结果存在重叠。例如,线路1 与线路4 故障的数据存在部分交叉现象,线路4 的部分故障数据甚至叠于线路3 数据之下,这清晰解释了第1 层卷积池化对线路故障特征挖掘存在不充分、不全面的问题。但从图A6(b)第2 层卷积池化分类效果明显观察到,不同故障线路数据之间界限分明,表明第2 层卷积池化充分学习到了8 类数据特征,CNN 仅需2 层即可充分挖掘故障线路的特征。

从测试集检验结果来看,诊断准确率高达99.95%,结果见附录A 表A4。该方法受过渡电阻的干扰较小,能够基本满足调度中心对故障诊断准确率的需求。

3.3.2 故障类型诊断

同理,诊断故障类型的网络配置如附录A 表A5所示,网络的可视化分类结果如附录A 图A7 所示。

图A7(a)、(b)分别表示两层卷积池化的输出可视化的结果。从图A7(a)中可以看出,通过第1 层卷积池化对原始输入进行特征提取,分属各种故障类型的数据大部分呈聚集状态,还有部分数据仍有重叠,例如,B 相接地故障与BC 两相短路和BC 两相短路接地故障、AB 两相短路与三相短路故障、A相接地短路故障与AC 两相短路和AC 两相短路接地故障均有交错。从这几种故障类型的故障特征来分析,两相短路和两相短路接地必须挖掘到零序分量特征才能将两者区分开,单相故障与两相故障本质区别在于发生变化的电量的个数。从结果来看,第1 层故障挖掘并不充分深入。将输入样本两层卷积池化后见图A7(b),12 种类型的数据分区而据,少有混淆,表明两层卷积池化充分掌握了12 种故障类型的独特特征。

测试集检验结果表明该方法在故障诊断上具有良好的应用价值。诊断结果见附录A 表A6,故障类型诊断准确率为99.62%。

3.4 不同程度噪声干扰对故障诊断效果的影响

设置3 组噪声干扰,分别为30、35、40 dB。在噪声干扰下,本文提出的故障诊断方法对故障线路和故障类型诊断准确率有不同程度的下降,结果如表2 所示,但是总体维持在较高水平。

表2 不同噪声干扰下故障诊断准确率Table 2 Fault diagnosis accuracy under different noise interferences

实验结果表明,本文所提方法在一定程度上能够消除噪声干扰带来的不利影响,具备较好的抗干扰能力,但是还有改进提升的空间。需要进一步研究提升模型的抗干扰能力。

3.5 不同诊断模型应用结果对比分析

为验证本文所构建模型在交直流输电系统故障诊断上的优势,本节将CNN 与现有传统机器学习及深度学习方法进行对比分析。

机器学习方法主要有K近邻(KNN)和C4.5 决策树,深度学习方法选取堆栈稀疏自编码机(stacked sparse autoencoder,SSAE)和CNN。4 种方法的故障诊断结果如图5 所示。图中,AG 表示A相接地故障,AB 表示AB 相间故障,ABG 表示AB相间接地故障。

图5 不同模型故障诊断准确率Fig.5 Fault diagnosis accuracy of different models

由图5 可知,CNN 模型对故障线路、故障类型的诊断准确率总体较高,几种方法的具体诊断结果如表3 所示。

表3 故障诊断结果对比Table 3 Comparison of fault diagnosis results

1)KNN 模型常用于处理非线性分类问题,K值的选取会对分类结果产生巨大影响。当采集的样本受到干扰时,由于特征挖掘不充分而导致分类结果被异常值影响。

2)C4.5 决策树模型学习数据特征常用于增强其泛化能力,使其能够处理新型数据,常用于处理离散型数据,但是训练过程中极易发生过拟合,影响诊断效果。

3)SSAE 模型通过多层自编码器堆叠形成深度挖掘故障特征的结构,训练过程中施加稀疏性限制使部分神经元失活来提取故障本质特征,但是在训练过程中会加剧误差传播,降低诊断性能。

4)CNN 模型首先对数据预处理,然后利用多层卷积池化层充分挖掘故障深层特征。结合t-SNE 可视化分析方法优化诊断网络的结构和训练过程,从结果可以看出,其诊断效果优于传统方法。

4 结语

本文将CNN 应用于交直流输电系统的故障诊断。通过设计充分适应算例的网络结构并优化其训练参数,构建了完整的诊断模型,并采用t-SNE 可视化方法对诊断效果加以分析,最终得出以下结论:

1)本文所提方法省去了人工整定阈值的过程,提高了故障诊断的工作效率。该方法将电压、电流两种电气量数据有效融合,能够提取交直流输电系统中的复杂多维特征,提升了电网故障诊断准确率,可以帮助运维调度人员高效诊断电网故障。

2)利用t-SNE 降维可视化方法,清晰地展示了CNN 模型的特征提取效果。算例结果表明,所提方法不受过渡电阻、故障位置、故障类型的影响,具有很强的可靠性和抗干扰能力。

3)与传统的机器学习算法相比较,本文所构建的CNN 模型能充分挖掘海量故障数据的深层故障特征。相比于SSAE、KNN 等方法,CNN 在准确诊断交直流输电系统故障位置和故障类型的效果上具有明显优势。

该方法需要大量故障样本,在实际中往往难以得到满足。后续将研究在已有模型的基础上进行迁移学习,提高该方法的泛化能力和实用性。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。

猜你喜欢
交直流池化直流
基于高斯函数的池化算法
基于强化学习的直流蒸汽发生器控制策略研究
分布式调相机在特高压交直流混联电网的配置研究
“宁电入湘”直流工程再提速
卷积神经网络中的自适应加权池化
交直流混合微电网多时间尺度协同控制
滁州至南京城际铁路交直流制式比选研究
交直流互联系统中换相失败对交流侧电气量影响
基于卷积神经网络和池化算法的表情识别研究
直流稳压电源实验教学的创新性探索与实践