王 建,吴 昊,张 博,南东亮,欧阳金鑫,熊小伏
(1. 输配电装备及系统安全与新技术国家重点实验室(重庆大学),重庆市 400044;2. 国网新疆电力有限公司电力科学研究院,新疆维吾尔自治区 乌鲁木齐市 830011)
输电线路安全可靠运行是确保电力系统安全稳定运行的重要条件。架空输电线路地域分布广泛,结构更加复杂,运行环境多变,尤其在恶劣天气条件、自然灾害、人为破坏等影响下,输电线路容易发生多种类型故障[1]。及时准确地识别故障类型和原因,对于指导自适应重合闸和恢复线路送电、减少线路停运时间、保障电力系统安全稳定运行具有重要意义[2]。
目前,国内外学者开展输电线路故障辨识的主要方法是利用变电站内互感器采集的电流、电压暂态波形数据来辨识故障。例如,选取相电压与零序电流工频的相角差[3]、故障波形的相似度以及季节特征[4]、故障电流行波模态分量[5]、故障相角与最大电流差[6]、局部电流阈值[7]等作为故障特征量。但上述基于信号处理与特征提取的故障辨识方法,选取的故障特征易受电压电流波形、故障距离以及过渡电阻等因素的影响,且特征选取过程复杂,其分类辨识准确性并不理想。
近年来,计算机视觉算法在图像分类领域快速发展[8],启发了将故障暂态波形信号表示为视觉线索进行故障辨识的思想。无论是时域的暂态波形,还是频域能量谱图像,都是电力系统受到各种故障后的表现,都可充分反映故障特征。使用暂态波形图像识别,可以实现同时学习完整的电压、电流信号,而不依赖使用复杂的信号分析方法来挖掘不同故障的微小区别。因此,基于故障暂态波形深度学习的方法[9-10]也为输电线路故障辨识提供了新的技术路线。
由于图像识别算法是一种大数据驱动方法,训练集的样本规模影响着分类辨识结果的准确性。已有学者使用实际故障录波数据开展故障类型辨识研究[6,11],并且有学者提出运用拓扑结构补充数据的方法来解决故障数据缺失的问题[12]。直接利用故障录波数据开展故障原因辨识虽是一种很好的方法,但由于历史故障样本往往缺少故障原因标签,且同一条线路的故障样本有限,直接使用故障录波数据还存在一定困难。因此,通过故障仿真的方式构造大量故障样本用于暂态波形图像的深度学习,也是一种好的选择。已有学者尝试利用PSCAD/EMTDC[7,13]、ATP/EMTP[14-15]与 MATLAB/Simulink[16]等仿真软件,按照故障位置、类型、起始相角、过渡电阻等参数均匀分布,批量产生典型故障类型样本集。但是,从现场获取的故障跳闸记录看,单相接地、两相短路等故障类型和雷击、山火、异物等故障原因的样本数量存在严重的类不平衡问题[17]。现有的故障仿真方法往往忽视了故障样本的分布规律和类不平衡问题。因此,需要考虑实际故障的特点和概率分布,构建符合实际情况的类不平衡故障样本集,用于故障辨识分类模型的训练和测试。
综上所述,为降低故障录波特征量提取的复杂度,提高输电线路故障辨识的准确率,本文提出了考虑故障样本类不平衡的迁移学习-AlexNet 输电线路故障辨识方法。首先,按照故障样本统计特征及其概率分布,设定MATLAB/Simulink 仿真模型的参数,批量产生符合实际故障位置、初相角、故障类型、故障相别、故障原因及其过渡电阻值分布特征的样本集。然后,以输电线路两端测得的电压、电流数据生成故障暂态波形图作为模型输入,训练得到基于迁移学习-AlexNet 的输电线路故障辨识分类器。最后,通过设计多组算例测试对所提方法的效果进行检验。结果表明,现有按小规模平衡故障样本集开展故障辨识的方法,分类准确率偏于乐观,在实际故障样本集严重类不平衡时,即使采用抽样法等训练方式,得到的分类准确率也有待提高;而本文所提方法可以很好地应对类不平衡故障样本的影响,相比于经典的卷积神经网络(convolutional neural network,CNN),其辨识准确率更高,训练模型用于类似线路的真实故障录波数据也能很好地辨识出故障类型。
从电网公司获取的故障跳闸记录发现,输电线路单相接地、两相短路等故障类型存在类不平衡问题[18]。据统计,某区域电网2014 至2019 年220 kV线路共发生故障1 499 起。其中,单相接地短路(AG、BG、CG)1 359 起,占比为90.66%;两相短路(AB、AC、BC)72 起,占比为4.8%;两相接地短路(ABG、ACG、BCG)57 起,占比为3.8%;三相短路(ABC)11 起,占比为0.73%。
进一步分析发现,除单相接地短路外,其他相间故障的过渡电阻多为电弧,其过渡电阻小;而导致单相接地短路的原因则比较多,同样存在分布不平衡的问题。据统计,中国某省电网较为常见的几种单相接地短路中,雷击故障占44.33%,山火故障占28.08%,异物故障占4.43%,树闪故障占2.96%。不同原因导致的接地故障,其过渡电阻组成往往差别较大[19-20]。例如,雷击故障的过渡电阻是由电弧与杆塔的接地电阻组成,其阻值小,往往不超过10 Ω。异物故障多是因为尼龙、塑料等物品附着在绝缘子上引起的绝缘子闪络,其过渡电阻由电弧、异物、杆塔接地电阻构成,过渡电阻值略高于雷击故障。树闪故障则多为导线对树枝放电,其过渡电阻由树干的电阻组成,表现为高阻性[21]。山火导致的故障,其放电通道是烟尘组成的游离气体通道,其过渡电阻值也较高[22]。
输电线路的故障相别同样表现出类不平衡。因为输电线路多呈三角排列或水平排列,B 相导线通常在A 相与C 相导线之间。因此,在由雷击、树闪、异物、山火引起的单相接地短路中,B 相导线接地故障相对A、C 相要少一些。例如,某省电网对故障相别统计发现,A、C 相接地故障分别约占39.2%、38.5%,而B 相接地故障只占22.3%。
此外,故障位置沿输电线路的地理分布也表现出一定的类不平衡,某些地方由于特殊的地形和微气象,更容易发生故障,但整体来说故障位置还是比较均匀[23]。电力设备因自身老化或局部缺陷而易在电压峰值放电,但对于输电线路而言,故障的发生时间多是由外部因素决定。因此,故障相角的分布也比较均匀。
由此可见,输电线路故障样本集是类不平衡的,如何构造和训练故障分类器以提高应对类不平衡问题的能力,是需要解决的关键问题之一。而深度学习与机器学习等大数据驱动模型高度依赖准确的样本集,确保故障样本集的代表性和准确性是故障分类识别的基础,不准确的样本集训练出的分类器与结果都不具备参考意义。因此,在输电线路故障仿真模型中,需要充分考虑故障样本不平衡的问题,使故障样本集更接近实际情况。
自从CNN 被提出,图像识别的深度学习得到了迅猛发展,不断有准确率更高、学习能力更强的网络被提出。但随着深度学习网络的层数变大,深度学习的过拟合与梯度消失问题也愈发严重。为解决以上问题,文献[24]提出深层卷积神经网络AlexNet。近年来,随着计算机算力的增加,各种改进AlexNet也逐渐被用于不同领域的故障诊断研究[25]。
AlexNet 包括了8 层神经网络,前5 层为卷积运算层,最后3 层为全连接神经网络。最后一层全连接神经网络与Softmax 层相连,该层包含了1 000 维的分类层,可以得到输入样本的1 000 种概率分布。
卷积运算层之间包括激活函数、局部响应归一化(LRN)层和最大池化层,各卷积运算层神经网络的具体参数如表1 所示。
表1 AlexNet 卷积层具体参数Table 1 Specific parameters of AlexNet convolution layer
激活函数是触发神经元的重要依据,AlexNet使用了ReLU 作为激活函数f(x),如式(1)所示。
式中:max(a,b)表示取a、b中的最大值。
ReLU 函数的导数恒为1(x>0)的特性,使其能够解决部分梯度爆炸的问题,也能够不同程度地缓解梯度消失。
同时,为解决深度学习中过拟合的问题,AlexNet 在全连接层中加入了Dropout 层,以用于随机断开一些神经元的连接或不激活这些神经元,这不仅解决了深度学习过拟合的问题,还可以训练出拟合能力更强的深度学习网络。
深度学习网络的性能取决于网络结构与网络参数,本文使用了基于网络参数的迁移学习方法,以ImagNet 图像数据库为源领域,以故障录波图像为目标领域,将源领域AlexNet 的卷积计算层网络参数迁移到目标领域AlexNet 中,以提高目标领域AlexNet 的图像特征提取能力。构造迁移学习-AlexNet 的主要步骤如下。
1)数据归一化处理
对比实验研究发现,相比于使用单端母线处的电压电流暂态波形,使用双端的暂态波形将提高故障辨识的准确性,这和使用双端故障量更有利于故障定位有异曲同工之处。因此,本文将首端电压、电流信号与末端电压、电流信号以及首末端的零序分量融合在同一张图片上,作为一个故障样本。
输入故障录波样本集后,还要对故障录波作归一化处理,生成迁移学习-AlexNet 的输入集。本文采用归一化图像,其横坐标为采样时间,采用时间范围为故障前一周期与故障发生后一周期,总长为0.04 s;纵坐标的取值则需要兼顾不同故障下波形的细节与波形的最大值。由于拟研究对象为一条220 kV 输电线路,按照其电压等级和短路容量特征,本文取三相电压、三相电流、零序电压、零序电流的尺度分别为400 kV、10 kA、20 kV、10 kA。整个数据归一化处理结果如图1 所示。
图1 暂态波形图生产及其归一化处理示例Fig.1 Example of production and normalization processing of transient waveform graphs
2)迁移学习-AlexNet 的构造与训练
首先,导入预训练AlexNet,其已在ImagNet 图像识别竞赛中使用大数据进行训练,具备较好的图像特征提取能力;然后,将预训练AlexNet 的卷积运算层网络参数与新的全连接层(网络参数服从高斯分布)组合,生成迁移学习-AlexNet,由此组成的迁移学习-AlexNet 网络可实现对预训练AlexNet 特征提取能力的迁移;最后,采用留出法进行训练和测试。设置每轮最小训练样本为128 个,共迭代30 次,并使用自适用力矩估计求解器训练网络的权重、偏移等参数。
本文在MATLAB/Simulink 仿真软件中建立如图2 所示的220 kV 输电线路系统仿真模型,模拟了不同故障位置、故障类型、故障相角、过渡电阻下所测得的首末两端故障电流、电压。其中,EM和EN分别 表 示M端和N端电源,ZM和ZN分别表示M端和N端电源的内阻抗。电源采用含内阻抗的无穷大电势模型[26],两端电源的初相角分别为0°、10°,模拟输电线路传输额定容量为300 MW 时的情形。输电线路采用分布式参数,数值参考中国典型220 kV 线路参数,具体参数如表2 所示。
表2 系统参数Table 2 System parameters
图2 220 kV 输电线路系统结构Fig.2 System structure of 220 kV transmission line
1)类平衡故障样本集生成
输电线路故障辨识方法训练与验证时普遍忽略了输电线路故障的统计特征。例如,文献[9,16]在输电线故障相仿真时均采用了不同故障相样本数量均衡的仿真方法。本文参照文献[9,16]中的输电线路故障仿真方法生成了10×6×8×11=5 280 组平衡仿真数据,具体参数如表3 所示。5 280 组平衡仿真数据中,A 相和B 相接地短路故障等10 类故障类型各有528 组数据。
表3 类平衡样本参数设置Table 3 Parameter setting of class balance samples
2)类不平衡故障样本集生成
为了分析类不平衡故障样本集对故障辨识分类效果的影响,本文结合故障统计特征,仿真构造类不平衡故障样本集。考虑到故障位置与故障初始相角具有随机性,将故障位置沿线路均匀分布产生,故障初始相角按0°~90°均匀分布产生。
在设定过渡电阻时,目前有关雷击等金属性故障的报道较多,文献[27]统计出低阻性故障过渡电阻服从威布尔或指数分布,而对于中高阻值过渡电阻的统计较少,仅有少量案例报道山火、异物、树闪故障的典型过渡电阻值[21-22]。考虑到存在离群点的问题,本文在这些典型高阻性故障的过渡电阻基础上,采用正态分布的方式适当扩展了不同故障过渡电阻值的范围。因此,本算例中低阻接地故障样本的过渡电阻阻值设置参照指数分布[27],其余故障样本的过渡电阻设置参照正态分布,其具体参数如表4 所示。考虑在单相接地短路中边相故障率较高,设 定AG、BG 和CG 故 障 的 占 比 分 别 为0.4、0.2 和0.4。整个仿真产生不平衡样本集的流程图如图3 所示。
本文分别对暂态波形图像作为输入集的有效性、类不平衡故障集的影响以及解决类不平衡故障集的方法进行了分析与测试,具体对照组如表5 所示,测试结果如表6 和表7 所示。其中,对照组1 至3用于验证基于暂态波形图像的输电线路故障辨识方法的有效性;对照组3 和4 用于分析类不平衡数据对深度学习故障类型辨识的影响;对照组5 至7 用于测试基于类不平衡数据的故障类型辨识方法的效果。
表5 对照组组成Table 5 Composition of control groups
表6 不同方法对输电线路故障类型辨识的准确率Table 6 Accuracy of fault type identification for transmission line with different methods
表7 不同方法对单相接地故障原因辨识的准确率Table 7 Accuracy of fault cause identification for single-phase-to-ground faults with different methods
1)基于暂态波形图像的输电线路故障辨识方法的有效性验证
本文从类平衡故障样本集中随机抽取70%的数据分别对CNN 与迁移学习-AlexNet 进行训练,再利用剩余30%的数据进行测试。在平衡数据的训练与测试下,CNN 对单相接地短路、两相短路、两相接地短路、三相短路故障的辨识准确率都较高,整体准确率为97.09%。迁移学习-AlexNet 的准确率为100%,高于CNN。在小样本集的情况下,CNN 的故障类型辨识能力明显下降,为81.00%。而迁移学习-AlexNet 的准确率为99.54%。CNN 在基于暂态波形图像的输电线路故障辨识上的能力不如迁移学习-AlexNet,但基于暂态波形图像的CNN 与迁移学习-AlexNet 的准确率均高于80%。由此可见,基于暂态波形图像与深度学习的输电线路故障辨识方法是有效的。
2)类不平衡样本集对深度学习故障类型辨识的影响
为说明使用类平衡故障样本集训练并测试故障分类器存在的不足,如对照组3 和4 所示。本文将测试平衡故障样本集训练出的故障辨识分类器在类不平衡与类平衡故障样本测试集下的准确性。
CNN 在类平衡故障样本集的训练与测试下的准确率为97.09%,看似有较高的准确率,但当使用1 500 组类不平衡故障样本集测试时,准确率为84.87%,约下降了12 个百分点。同样,在类不平衡数据测试下,基于迁移学习-AlexNet 的故障辨识方法的准确率为99.80%,下降了0.2 个百分点。因此,使用平衡故障样本集训练深度学习故障辨识分类器并不可靠。根据故障样本统计分析可知,实际情况下故障样本集是类不平衡的,要收集大量均衡样本数据集也相当困难。
3)基于类不平衡数据的故障类型辨识效果
对于类不平衡故障样本集的问题,普遍使用抽样法来平衡数据。本文针对类不平衡数据集,采用欠采样法得到伪平衡故障样本集作为对照组。由对照组5 和6 可见,在伪平衡故障样本集下故障类型的整体分类准确率高达100%,结果看似很好,但将训练好的分类器部署应用时,在更多的测试样本集下(对照组6)故障类型分类的准确率会进一步下降(整体准确率为99.78%)。由于抽样法照顾了样本数少的两相短路、两相接地短路、三相短路故障,其在AB、BC、AC 等故障的辨识上仍有100%的准确率,但对于被抽样的单相接地故障,其准确率有明显的下降,A 相接地故障准确率为99.42%。由此可见,为了照顾机器学习算法对于数据平衡性的需求,使用抽样法得到的平衡数据集丢失了样本数多的类别的数据,造成了其故障辨识能力下降,这种现象在故障原因辨识时尤其明显,在更多的测试样本集下(对照组6),故障原因辨识的准确度下降了3.84 个百分点(对照组5 的整体准确率为93.86%,对照组6的整体准确率为90.02%)。
本文提出使用不平衡故障样本与迁移学习-AlexNet 相结合的方式来解决类不平衡样本的影响。训练结果如附录A 图A1 所示,在训练过程中,迁移学习-AlexNet 迅速收敛,迭代50 次左右训练准确率就已突破90%,并在第250 次迭代时训练结果与测试结果变化趋势均趋近平稳,基本完成了提取暂态波形图像特征并分类的学习。
基于迁移学习-AlexNet 的故障辨识方法能准确区分输电线路故障类型,对单相接地短路、两相短路、两相接地短路、三相短路都能准确地区分故障相,准确率为100%。文献[9]同样针对迁移学习,但没有考虑类不平衡问题,其使用迁移卷积神经网络(transfer-convolutional neural network,T-CNN)在不平衡数据下训练并测试得到故障类型辨识准确率为93.07%,且相间故障的准确率均低于74%(如对照组8 所示)。
本文所提方法在应对类不平衡性更高的故障原因辨识时也有较高的准确性,整体准确率为98.20%,而CNN 在故障原因辨识方面准确率仅为94.87%。图4 为输电线路故障辨识结果的混淆矩阵,蓝框内为辨识正确次数,红框内为辨识错误次数。由图4 可知,本文方法仅对异物与雷击存在误判,其余几种故障原因的辨识准确率均为100%。在实际情况中,异物故障与雷击故障的过渡电阻值相近,仅依靠录波数据往往难以准确辨识,目前已有文献尝试将录波数据与气象参数相结合来提高故障原因辨识的准确性[12]。
图4 输电线路故障辨识结果的混淆矩阵Fig.4 Confusion matrix of transmission line fault identification results
本文从计算速度、仿真中过渡电阻设置的影响以及真实故障的辨识这3 个方面验证了所提方法的实用性,具体情况如下。
1)计算速度
快速识别故障类型和原因,对于指导输电线路重合闸或者强送决策具有重要意义。为验证本文方法的实用性,在附录A 表A1 的测试环境下检测了故障辨识速度。采用本文方法测试集的1 500 组数据进行测试,依次将每个数据代入训练好的迁移-AlexNet 网络中进行分类处理,并记录分类所用时间,如附录A 表A2 所示。本文方法的输电线路故障辨识时间不超过0.3 s,平均耗时0.152 2 s,能够为运维人员制定重合或者强投决策提供支撑。
2)过渡电阻分布与高阻性故障的影响分析
目前对于异物、树闪、山火等故障的过渡电阻的统计较少,因此,本文根据小样本分布规律模拟的故障原因存在一定局限性。为此,本文通过增大异物、树闪、山火等故障过渡电阻标准差,即扩大这些类型过渡电阻的分布范围来检验本文方法的可靠性。附录B 图B1 为异物、树闪、山火故障过渡电阻标准差增加20%后本文方法的辨识结果,可见过渡电阻分布范围增加后,本文方法对于故障相的辨识准确率仍为100%,对于故障原因的辨识准确率为97.53%,仅下降0.67 个百分点。
经分析,上述故障原因准确率下降主要是将异物误判为雷击故障引起的。在实际情况中,异物故障的起因多样,过渡电阻分布相对广泛,容易出现离群的过渡电阻,这会造成本文方法的准确率有所下降,但若能结合雷电定位与气象条件,本文方法的准确率将进一步提高。
此外,为检验本文方法对于山火引起的更高阻值过渡电阻情况下的故障辨识能力,以正态分布的形式建立均值为600 Ω、标准差为20 Ω 的仿真,得到10 组高阻故障样本,代入本文方法中得到检验结果如附录B 表B1 所示。结果显示,对于相对罕见的高阻性故障,本文方法也能准确地辨识出故障,仅出现1 例故障类型辨识错误。
3)真实故障样本的迁移学习验证
本文采用某电网实际故障录波数据进行迁移学习验证[28]。由于输电线路发生故障后部分故障原因无法查明,除了雷击故障结合雷电定位和天气预报使得有故障标签的数据稍多一些,其他如异物、树闪、山火等有确切故障原因标签的数据样本较少。经过梳理,采用7 个有确切标签的样本进行测试,真实的雷击、树闪、异物故障录波数据见附录C 图C1。实际故障样本与辨识结果如表8 所示。
其中,ZX 西线全长135.04 km,线路首端采样频率为3 200 Hz,末端采样频率为5 000 Hz。该线路在2018 年6 月8 日发生了B 相雷击接地短路故障,在2019 年12 月13 日发生了C 相树闪接地短路故障,具体波形图见附录C 图C1(a)和(b)。
由表8 可见,按照本文方法进行仿真训练得到的故障辨识模型在迁移到真实输电线路后,仍能较为准确地辨识出故障类型与故障原因,其中样本7出现了故障原因辨识错误,将异物故障辨识为雷击故障。为探查样本7 辨识错误的原因,本文将其与线路长度相近的WZ 线波形进行对比,对比故障波形如图5 所示。
图5 WZ 线与HP 南线的故障电压和电流波形Fig.5 Waveforms of fault voltage and current of WZ line and HP south line
表8 实际故障样本的测试结果Table 8 Test results of real fault samples
由图5 可见,WZ 线雷击故障的波形与HP 南线异物故障的波形虽然存在相位差,但幅值相近,这是由于雷击故障与异物故障的过渡电阻同样属于低阻故障,容易出现过渡电阻值交叉所导致的,若能结合雷电定位、气象数据等其他多源信息进行故障辨识,则有望有效解决该问题。
本文按照输电线路故障特征和概率分布,采用MATLAB/Simulink 批量仿真产生符合实际情况的不平衡故障样本集,构建了基于迁移学习-AlexNet的故障分类器,实现不平衡故障样本下的输电线路故障辨识。经过研究,得出如下结论:
1)以输电线路双端母线处监测的故障暂态波形图像为输入量的故障辨识方法是可行的,且利用深度学习方法进行暂态波形图像分类识别有助于降低故障特征提取的复杂性。
2)现有按类平衡故障样本集开展故障辨识的方法,分类准确率偏于乐观,在实际故障样本集严重类不平衡时,即使采用抽样法等训练方式,得到的分类准确率也有待提高。
3)本文所提基于迁移学习-AlexNet 的故障分类器可以很好地应对类不平衡故障样本影响,相比于经典的CNN,对故障类型与故障原因的辨识准确率更高,训练模型用于类似线路的真实故障录波数据也能很好地辨识出故障类型。
本文方法虽然在故障类型和故障相辨识方面的准确率为100%,但对于单相接地短路,仅考虑了雷击、异物、山火、树闪4 种常见故障原因,在仿真中未考虑接地故障过渡电阻的时变性,且分类器输入集只有故障暂态波形图像,对于故障原因还无法完全准确辨识。在后续研究中,将选用不同原因导致线路故障的其他特征量,如进一步考虑不同故障的过渡电阻时变性与气象条件差异特征,来提高故障原因辨识的准确率。
附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。