曹璞璘,申忠友,2,束洪春,马御棠,韩一鸣,朱梦梦
(1.昆明理工大学电力工程学院,云南省 昆明市 650500;2.国网四川省电力公司泸州供电局,四川省 泸州市 646000;3.云南电网有限责任公司电力科学研究院,云南省 昆明市 650217)
能源电力安全是新型电力系统的基本前提,尤其是大规模新能源的接入,导致电网故障后的稳定性大幅下降,因此,快速检测与排除故障点尤为重要[1]。输电线路作为电力系统故障率较高的元件,如何在线路出现早期绝缘薄弱点时进行及时排查以降低线路故障率,将会是未来新型电力系统继电保护技术研究的重要方向。在雷暴天气较为频繁的地区,部分线路会在短时间内多次遭受雷击,当雷电流较小时,雷击输电线路不足以引起绝缘子闪络,不会造成继电保护动作,导致雷击线路干扰事件难以检测,仅能通过巡线人员进行现场确认[2-3]。但是,此类雷击事件会对绝缘子、导线造成永久性损伤,降低绝缘性能,导致雷击点成为故障隐患,极易在后续雷击等事件中引起绝缘进一步损坏进而导致故障。而雷击干扰波形的辨识,也有助于超高速行波保护在受到雷击干扰后尽快进行识别,防止保护误动作。
近年来,以行波测距装置为代表的高速采集装置已经基本覆盖220 kV 及以上电压等级电网[4-6]。为提高对高阻故障和小故障起始角等弱暂态信号故障[7]的检测能力,高速暂态采集装置普遍采用低门槛突变量启动,导致大量非故障干扰被记录与存储。由于非故障干扰与行波测距装置的本职任务无关,在过去亦缺乏其他维度的数据进行信息补充与验证,且极易与高频采集数据中易出现的异常离群点混淆,往往作为杂波被舍弃。但是,从雷击线路干扰检测的角度出发,对站端行波数据进行研究,不仅可以实现对雷击线路干扰进行检测与辨识,也可以充分利用因低阈值启动而被记录的大量非故障行波数据。更为重要的是,不形成故障点的雷击干扰包含了完整的雷电流信息,可用于对雷击线路的特点开展进一步研究。
目前,针对雷击输电线路的研究主要集中于雷击故障及其性质辨识[8-15]。随着电网中大量监测系统投入运行,针对海量杂波数据中有效扰动数据的辨识,也有相关研究。文献[16]通过主成分分析等手段减少多维度文本信息,最终采用小波特征提取与决策树进行辨识,但是并未考虑信息坏点问题。文献[17]分析频率数据的典型异常,构造各类频率数据异常特征,提出改进动态时间规整(DTW)法量化异常特征,基于局部离群因子法实现频率数据的异常检测和类型识别,但易受到系统拓扑结构引起的量测量导致的固定差异影响。文献[18]通过多维度监测信息建立融合数据重构模型,有效避免了数据坏点与噪声污染问题,但是该方法需要其他维度与来源的监测信息用于辅助构建。文献[19]针对变压器监测数据中容易出现的采样点缺失问题进行研究,利用异常检测算法与随机森林(RF)对其进行分类,但是采样点缺失问题在行波数据中并不常见。文献[20]同样采用了异常检测算法对整个风机的监测数据进行数据清洗,但是其将监测数据分块处理的方法极易在本文所处理的对象中引起行波波头被划分至两个时窗,进而出现辨识错误。文献[21]虽然提出了针对低质量数据的清洗原则,但是其有效性在扰动与噪声过于相似的情况下会有所下降。机器学习与人工智能是大数据研究的趋势,但是绝大部分的相关算法都要求数据归一化,导致后续新加入数据如果出现超出原训练集界限的特征,会存在重新归一化的问题,严重影响筛选进度。
虽然故障、重合闸等多种电磁暂态波形同样具备显著的波形奇异性,但是由于具有完备的跳闸记录,易于排除。考虑到雷击干扰引起的电磁暂态波形与冲击性电磁噪声或采集异常离群点极为相似,雷击干扰的辨识在实际研究中极难开展。本文通过分析线路正常运行、跳闸后、故障后等多种不同状态下雷击干扰引起的电磁暂态特点,基于中位数绝对离差法对实测数据进行预处理,抑制因采集电路板、背景电磁噪声带来的毛刺干扰,再对实测数据做形态学梯度变换,抑制平稳数据片段波动,放大暂态突变细节,提取行波录波数据突变特征值,基于合成少数类过采样技术(SMOTE)平衡少数类样本,将提取到的特征作为RF 分类器的输入训练模型,充分利用RF 无需数据归一化的特点,实现雷电冲击性特征行波数据筛选。最后,结合故障记录和雷电定位系统对辨识结果进行了验证。
当雷电流较小时,即使雷电击中线路,也无法造成绝缘子闪络,从雷击性质方面,可以将线路遭受的雷击未故障干扰划分为雷击导线未故障与雷击塔顶未故障。发生雷击导线未故障时,由于缺乏入地点,注入导线的雷电流会在导线上多次折反射后衰减殆尽,其等效示意图如图1 所示。图中:Ilight(s)为雷电流;I1(s)、I2(s)为雷电流向线路两侧的分流。雷击导线时,在I1流向侧观测到的初始电流行波浪涌可以表示为:
图1 雷击线路未故障Fig.1 Lightning strikes transmission lines without failure
式中:Iinitial(s)为观测到的初始行波浪涌;Inormal(s)为线路正常运行电流;γ(s)为线路传播参数;β(s)为母线处反射系数;x为雷击点到观测端的距离。
雷击导线未故障情况下,雷电流引起的行波会在线路上向线路两端传播,由于线路上不存在故障引起的波阻抗不连续点,雷电流只会在线路两端出现折反射,导线末端多出线接线方式及导线频变参数色散与衰减都将逐渐削减行波的幅值,经过多次折反射与长距离传播后,行波能量将消耗殆尽。从波形特点上来看,雷击导线未故障的波形是正常工频电流叠加雷电引起的冲击波形,冲击前后工频电流大小基本不变。
如图2 所示,在雷击杆塔或避雷线未形成故障后,雷电流都会由雷击点经避雷线流向当前或相邻杆塔,在流经接地装置瞬间抬高或拉低导线对地电位,在导线上产生感应电压。图中:I3(s)、I4(s)为导线上的感应雷电流。
图2 雷击杆塔或避雷线未故障Fig.2 Lightning strikes tower or lightning conductor without failure
雷击未造成闪络时,线路上的电流行波为正常运行电流和注入导线的雷电流或由反击引起的感应电流的叠加,反击时在线路上I3流向侧观测到的电流行波初始浪涌可以表示为[13]:
式中:k为避雷线与导线耦合系数。
在此情况下,线路两端观测到的暂态电流中既有雷击引起的冲击电流,也包含流过线路的工频正弦波形。由于雷击塔顶或避雷线后,绝大部分雷电流通过杆塔入地,因此感应产生的行波幅值可能略小,并且三相同时受到电磁感应,三相行波极性相同。线路站端通过高速采集装置记录的雷击线路未故障如附录A 图A1 所示,与之相对应的地闪时间记录为:2015-09-10T18:59:38.614,本文中实测行波数据均为二次侧电流。雷击干扰发生后仅在正常正弦波形上形成一次冲击,未能形成闪络点,导线上工频电流幅值在冲击前后未发生明显变化,且由于工频电流幅值不大,现场电磁噪声会较为明显。
绝大部分雷击地闪都具有一次以上的回击放电过程,若雷击造成线路故障后,在线路跳闸前的短时间内后续回击再次击中故障线路,则线路两端能够检测到在工频电流幅值大幅上升后再次出现冲击性特征。线路故障后再次受到雷电冲击的等效电路如图3 所示。图中:Ilight1(s)、Ilight2(s)e-τ2s分别为第1 次雷击和经过时间τ2后产生的后续回击雷电流,τ2一般为十几至数百毫秒;Zf(s)为闪络故障雷电流通道波阻抗;Ifault(s)e-τ1s表示经过时间τ1后形成的短路电流。
图3 故障持续中再次雷击等值电路Fig.3 Equivalent circuit of line with repeated lightning strikes in continuous fault
雷击线路导致绝缘子闪络以后再次遭到后续回击,部分雷电流将通过闪络点入地,仅部分雷电流会通过导线向线路两端传播。在I1流向侧观测到的后续回击电流行波浪涌可以表示为:
式中:Isecond(s)为故障后续回击电流行波浪涌;If(s)e-τ1s为I1流向侧故障后形成的稳态电流;e-τ2s/s为在τ2时刻的阶跃函数拉氏变换。在此情况下,除雷击产生的冲击波形外,线路两端检测到的暂态电流还包含工频故障电流。
发生于雷击故障后的雷击干扰情况,会有部分雷电流通过故障点入地,导致通过导线到达线路两端的行波更为微弱,由于故障点的存在,此类雷击干扰的行波会在故障点发生折反射,形成与雷击故障相似的行波传播过程。由于故障后雷击干扰是雷电后续回击引起,而雷电后续回击间隔能够达到十几甚至数百毫秒,在此过程中工频电流已经基本到达故障稳态。因此,线路末端所测行波波形呈现大幅值工频电流与雷电冲击相叠加的状态。
雷击故障后再次出现雷电回击的实测波形如附录A 图A2 所示,与之相对应的地闪时间为:2018-09-02T01:49:41.093,雷电流幅值为10 kA。能否观测到故障发生期间的雷击干扰和线路保护动作时间与后续回击发生时间间隔有关。
220 kV 以上线路的主保护通常能够在故障后40~80 ms 内完成跳闸动作,而雷电后续回击过程可能持续数百毫秒,因此,部分雷电回击可能发生于输电线路跳闸之后。理论上,线路两端跳闸后线路末端无法形成电流回路,线路末端电流互感器无法检测到电流,但是部分220 kV 以上电压等级的线路断路器会加装均压电容,考虑到电容对行波高频信号的阻碍极小,行波高频分量依然能够通过并联电容形成回路。因此,在线路已经跳闸的部分情况下,行波采集装置依然能够通过电流互感器采集到雷击引起的高频暂态信号。断路器均压电容与线路组成的等效电路如图4 所示。图中:C 为均压电容;D 为断路器断口。
图4 跳闸后雷击等效电路Fig.4 Equivalent circuit of lightning after tripping
均压电容与断路器为并联结构,在连接点处的电流行波折射系数与反射系数如下:
式中:Zl(s)为线路波阻抗;1/(sC)为线路波阻抗;α(s)、ρ(s)分别为均压电容和线路连接点处折射系数和反射系数。而线路电流互感器上仅能观测到雷击冲击中频率较高的部分为:
由式(7)至式(9)可知,电容对各个频率分量的折射作用不同,雷电流行波传变到达线路末端通过电容的分量亦仅有频率分量极高的部分较为显著,导致检测到的雷电冲击幅值极小,难以观测到后续的行波浪涌,与其他噪声的区分也更加困难。现场采集到的跳闸后雷电流冲击干扰如附录A 图A3 所示,与之相对应的地闪时间记录为:2012-08-06T03:29:14.988,雷电流幅值为138 kA。
根据上述3 种雷击干扰发生情况的分析,由于雷击干扰发生时的线路运行工况难以预测,且雷击干扰未改变线路当时工况的等效电路结构,因此,无法通过工频量的变化或其他特征进行辨识,仅能够依靠雷电冲击产生的行波过程进行判别。线路正常运行情况下雷击干扰的发生通常意味着雷电流幅值偏小无法引起闪络,而故障后雷击干扰又面临着故障点分流问题。此外,跳闸后的雷击行波又会受到均压电容阻碍,再加上线路频变参数衰减与色散,线路末端能够观察到的雷击干扰行波特征往往仅包含雷击初瞬形成的冲击波形,而如何将此冲击波形与其他会造成奇异点且难以找到其他事件记录进行佐证的波形干扰进行区分,将是雷击干扰数据辨识的主要难点。
受到早期电子器件工艺水平的限制,高速采集板卡时常会出现异常数据点,此类异常点与周围采集存在明显的差异,大多仅仅为某一个采集点的数值偏离,绝大部分记录的干扰数据都包含此类特征。行波录波装置大多装设至无人值守变电站等,此类坏点数据在早期的录波数据中难以引起注意,对其运行维护的机会较少,造成长时间在个别录波站出现大量的此类冗余数据,尤其是数年长期持续运行后,采集板卡的稳定性下降,异常离群点逐渐增多,甚至导致采集数据中充斥异常点,部分数据完全不可用,成为高速数据采集中最为棘手的问题。
异常离群点会在部分采集通道不定时出现,如附录A 图A4 和图A5 所示,此类异常离群点会造成正常波形中出现不应存在的奇异性,难以与雷电冲击造成的干扰进行区分。长期运行后,部分采集通道会充斥异常离群点,进而导致整个通道的数据损坏,出现成块状突变,掩盖了数据整体正弦性,如附录A 图A6 所示。
单条行波数据中通常包含多个通道,但是损坏通道仅为行波数据中的部分通道,因此,在进行数据筛选时,不能因部分通道损坏而完全放弃整条数据,而应进行数据清洗以保留能够用于数据分析的完好通道。
采集板数字电路因存在高频的数字电平会产生电磁辐射和耦合噪声,而部分变电站内也存在较高的电磁噪声,若高速采集装置前端电磁屏蔽工艺不过关,高速采集装置中会出现周期性、高幅值的短暂局部突变波形,呈现三角形、条形等,增加了行波数据辨识难度。附录A 图A7 所示为电磁噪声较大时高频采集装置捕捉到的现场波形。
由于高速采集装置采样率达到1 MHz 及以上,其A/D 分辨率通常不算太高,主流行波测距装置分辨率仅为8~10 位,导致实测行波数据中单个数据点的记录值有一定极限。附录A 图A8 所示为图A6的局部细节,在通道损坏后,异常离群点会集中于某些特定值。因此,可以采用通道中的采样值是否集中于某些特定值对通道是否损坏进行判别,当不重复值的个数小于适当的阈值时认为此通道全损坏,相应的数据剔除判据和筛选判据分别如式(10)、式(11)所示。
式中:i为行波数据构成的一维数组;t为索引;n为索引偏移量;Nunique(i)为数组i中不重复值的个数;Nmatrix(i)为数组i中每个值出现的次数所形成的数组;Tth1和Tth2为对应的阈值,本文中分别取为10与200。
为消除局部离群点对整体暂态波形的影响,采用中位数绝对离差(MAD)法进行数据预处理。取原始数据分别与数据中位数作差后构成新序列的中位数作为中位数绝对离差值,以原始数据中位数的正负3 倍中位数绝对离差值作为上下限,以适当长度时窗在单通道电流行波数据上滑动以检测片段数据的离群点,若片段中存在离群点,则剔除离群点并采用线性插值求该片段数据对应数据点来替换原始数据的离群点[22]。基于MAD 法的离群值预处理步骤可表示如下:
式中:median(·)为求取中位数;index(·)为求取索引;L为行波数据长度;l为时窗长度;Δt为MAD 值;Tt为数据波动离群值约束范围;r为时窗数据的索引,且t≤r≤t+l;f为离群值处理后的数据。
MAD 法对单一的异常离群点有极为优秀的剔除能力,同时不会影响雷击干扰引起的波形短时连续变化。MAD 法针对异常离群点与扰动的预处理结果如附录A 图A9 和图A10 所示。
本文选取时窗长度为5。由附录A 图A9 和图A10 可知,产生单个奇异点的离群值能够在不影响原始波形特征的前提下被线性插值替代,而对于扰动等突变较大、持续时间长的行波数据并未消去其突变点,其细节特征被完整保留,对后续的特征提取工作并无影响。
为表征雷击扰动产生的数学形态学思想在图像处理上应用广泛,在推广到一维的电力系统信号分析时,常被用于信号突变检测和信号滤波[23]。形态学梯度可表示为:
式中:⊕为膨胀运算;Θ 为腐蚀运算;g为结构元素;G为提取到的形态学梯度数据。
选取值为零的直线型结构元素和适当的半径对附录A 图A1 进行形态学梯度提取,如图A11 所示,能够将突变幅值叠加并保持原有的冲击性特征,并将所有的突变方向转换为一致向上,为后续特征提取过程中的归算提供便利。本文所使用的行波数据为由16 000个点构成的电流行波,采样间隔1 μs,由于形态学梯度提取中采用的结构元素长度为16。
1)峭度
峭度是一种衡量分布异常倾向程度的指标,可以计算峭度值来量化行波数据梯度波形的突变分布情况和突变大小,其数学公式如下:
式中:μ为G的平均值;σ为G的标准差;E为求取期望值。
对于附录A 图A7 所示的噪声干扰,虽然具有规律性突变的特征,但整条数据突变的分布较均匀,突变持续时间较长,导致其峭度值极低。因此,使用峭度即可区分突变行波与规律性噪声干扰。
2)三相行波突变比值
架空线路某条线路故障或干扰时,由于线路之间的耦合作用,三相电流行波在同一位置会有相应程度突变[24],如附录A 图A12 所示。根据三相行波数据梯度在某一位置是否具有相同的突变趋势,可以用于判别行波数据中奇异点是否为遗漏的异常离群点。
假设A 相电流突变值GA最大,计算突变比值:
式中:tA为相最大值对应索引;max 和min 分别为求梯度数据最大和最小幅值;n为索引移动范围;mp为相邻相突变的最大值,p=B,C,对应B 相和C 相;K1为相邻相对应一定时刻范围内电流幅值最大值比值。
3)分段最值夹角比
为保证行波初始浪涌能够被顺利捕捉,高速采集装置通常有数毫秒的预触发时间,通常来说,由于雷击干扰引起的波形振荡在短时间内与工频电流叠加会产生波形的畸变,可以利用这种畸变作为扰动或故障发生的特质之一。将经形态学梯度提取后数据等分为G1和G2,则有
式中:L1和L2为两段数据的长度;K2为前后两段数据的反正切角的较大值与较小值的比值。
对附录A 图A1 进行计算所得结果如图A13 所示。图中:θ1和θ2为前后两段最值比值正切角。当K2值越大时,等分前后两段数据与横轴的夹角越大,分段数据的变化率越大,前后两段波形的差异性越大。
海量的实测行波数据中故障、扰动等高价值数据和杂波数据的样本数量相差至少100 倍,若进行分类器训练将出现样本极度不平衡问题,以总体样本分类准确率为评估效果的分类器难以取得有效效果。针对训练样本不平衡问题,可采用SMOTE 方法解决[25]。该方法针对每个少数类样本xa,计算每个样本到其余样本的欧氏距离确定其k邻近,根据样本不平衡比例确定采样倍率,从k邻近样本中随机选取若干样本xb按照式(21)生成新样本xnew。
式中:rand(0,1)表示0~1 之间的随机数。
对于海量的行波数据来说,具有突变特征的数据占比极小,如何提高筛选正确率是首先应该考虑的因素。RF 基于集成学习从相同的数据集中构建一组存在细微差异的子决策树,分类时所有决策树投票表决,以降低单个模型的随机波动所产生的影响。此外,RF 模型无须对样本进行归一化,避免了后续新加入数据在某些维度超过原始积累数据而导致的归一化重置,还能对特征重要性排序,应对少数类突变数据筛选的效果优良。选取部分变电站近10 年的实测数据作为训练样本,根据上述人工提取到的三维特征值作为分类器的输入搭建RF 分类器模型,训练样本总数为1 152,训练的准确率为99.39%。整体筛选流程如图5 所示。
图5 所提方法流程图Fig.5 Flow chart of proposed method
由于本文是对所有历史存量行波数据进行数据筛选,未对其中的故障数据进行剔除,考虑到后续可以利用线路故障记录对故障数据进行排除,因此,所有包含冲击性特征的故障或合闸数据均会被视为扰动进行初步筛选,测试结果仅分为扰动数据与完全无用的杂波两类,测试所用41 794 条行波数据均为标签未知的数据。
为展示分类器的分类效果,选取1 000 个通道数据做展示,如图6 所示,除极少数的邻近样本出现局部交集外,总体非扰动数据和扰动数据都具有显著的聚集性,能够剔除绝大部分杂波。
图6 可视化筛选效果Fig.6 Visual filtering effect
经过本文所提筛选方法后,根据故障记录对筛选所得数据进行比较,剔除故障、跳闸的暂态数据。然后,根据行波数据对应线路和扰动发生时刻,对雷电定位系统地闪记录进行分析,对于在雷击故障后发生的雷击扰动,波形中有明显的故障点反射波,根据雷击记录与行波数据匹配方法[26]进行比较,而对于不存在故障点反射波的部分雷击扰动,则利用行波装置记录的波到时刻与线路全长推导雷击扰动发生的时间区间,并以此为依据与雷电定位系统进行时间匹配。所得结果如表1 所示。
表1 匹配结果Table 1 Matching results
由表1 可知,需要进行匹配的数据变为原数据量的1.26%,大幅降低了雷击干扰筛选运算量。由于故障、重合闸等波形可以通过跳闸记录直接进行判别,因此剔除故障与断路器动作数据后,实际需要进一步筛查的剩余扰动数据仅为原数据量的0.66%。与雷电定位系统地闪记录能够匹配精确到毫秒级别的扰动数据为36 条,另有27 条数据未能与雷电定位系统精确匹配,但是在其线路周围±5 min 内存在雷电地闪记录,此类扰动大概率也是由雷击造成,可能因高频采集装置的卫星授时系统失步或地闪记录遭系统遗漏等影响导致无法完全匹配。与雷电定位系统不存在匹配可能的不明扰动具有较为明显的冲击性特征或低频波动,可能为站端补偿装置或邻近线路断路器动作导致,需要后续与变电站操作记录进行排查。而在剩余的杂波部分,多为数个异常离群点相邻,造成MAD 法未能实现波形平滑所致。分类结果的典型波形如附录A 图A14 所示。
1)通过分析不同工况下雷击线路干扰的电磁暂态过程,结合现场实测行波数据,发现雷电冲击性特征是雷击线路干扰最为显著的特点,但是该特点极易与高速数据采集装置异常离群点相混淆。
2)采用MAD 法对数据进行预处理能有效减少毛刺等异常干扰,形态学梯度提取可以叠加暂态突变细节,更易于提取突变特征。采用波形峭度、三相电流突变比值、分段最值夹角比等3 个维度对行波数据进行刻画,在未对原始数据进行任何预先筛选的情况下实现扰动数据有效辨识与匹配数据量大幅降低。
3)结合雷电定位系统和故障记录对筛选得到的突变行波数据进行匹配,能够辨识线路各类故障、断路器动作以及雷击干扰等各种工况,为输电线路绝缘薄弱点的寻找提供方向和依据,有效预防线路下一次因绝缘性能降低或损坏造成更严重的雷击危害。
因高频采集受到的干扰因素过多,文中对于异常离群点的消除为考虑雷电干扰特征突变时间过于短暂导致最终匹配结果中含有杂波过多,如何提高筛选后雷击干扰的占比和解决行波数据与地闪记录更好的融合是后续研究的重要方向。
附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。