基于最小二乘支持向量机的小电流接地系统早期故障识别算法研究

2023-11-02 08:16:14朱一民马海军丁继波楚恬歆张文海
电气工程学报 2023年3期
关键词:子集扰动波形

李 华 朱一民 马海军 丁继波 楚恬歆 张文海

(1.国能集团宁夏煤业公司 银川 750004;2.四川大学电气工程学院 成都 610065)

1 引言

电力设备在绝缘逐渐老化过程中会不断发生瞬时性击穿,产生扰动波形,这一系列扰动被称为早期故障。早期故障具有重复性、随机性和瞬时性的特点,前期研究将其刻画成物理本质为电弧故障的瞬时性单相接地[1-3]。早期故障频发使设备的绝缘劣化处遭受进一步损坏,伤害逐渐累积至永久性故障发生,导致停电事故[4-5]。随着配电网信息化建设,置于站端的扰动波形记录装置能实现早期故障波形的捕获,但同时也记录下大量与其波形特征相似的非早期故障扰动。若能基于扰动波形数据实现对早期故障和其他扰动波形的准确区分,则可以及时感知设备运行状态、指导检修工作安排并消除故障隐患,在一定程度上减少永久性故障导致的停电事故发生[6]。因此,准确识别早期故障对于提高系统供电可靠性具有重要意义。

目前,早期故障识别方法可归纳为基于波形特征[7-10]、故障模型[11]和机器学习[12-15]三大类。其中,基于波形特征的早期故障识别方法主要利用扰动波形中各电气量的相关变化规律,如文献[7]基于电压和电流的各次谐波含量及畸变率对早期故障进行识别;文献[8]则将负序电流及故障电流分量的变化规律作为扰动识别判据;文献[9-10]都利用了卡尔曼滤波器计算电压基波分量,并将其与实测值的偏差作为早期故障扰动的特征量。而基于故障模型的早期故障识别方法主要利用早期故障作为电弧故障的物理本质,建立以电弧模型为基础的早期故障仿真模型,通常以扰动波形的电压畸变程度及故障的自清除特性来进行早期故障识别[11]。上述两类方法均基于知识驱动,所选择的扰动特征量通常具有较明确的物理意义且判据简单、具有一定的实际应用意义,但其受系统参数、故障参数或电弧特性等随机因素的影响较大,算法适应性较弱。

基于机器学习的早期故障识别方法通常依赖于信号分析算法对扰动波形进行处理,获取大量时域或频域的特征信息,在此基础上利用庞大的特征数据对分类器进行训练以构建相应的故障识别模型。例如文献[12]利用小波变换算法将扰动波形拆分为不同基元,并基于类人概念学习采用贝叶斯概率学习法挖掘波形基元特征与扰动类型的关联性;文献[13-14]分别采用了小波变换和S 变换算法获取大量的扰动波形特征信息,随后将其输入神经网络进行故障模型的训练;文献[15]基于快速傅里叶算法将每个窗口波形信号对应频域信息表示为相应字母,因此不同类型扰动波形的字母组合存在较大差异。此类方法基于数据驱动,鲁棒性强但对于扰动波形数据样本的依赖性大,且其特征数据集的维度通常较为庞大。另外,我国中压配电网主要采用小电流接地的方式[16],早期故障在该类系统中的表现形式分为单相接地型和异名相两点接地型[17],如图1 所示,而目前的早期故障识别方法主要针对单相接地型。文献[18]结合早期故障特性及其扰动波形变化规律,提出了基于复合判据的小电流接地系统早期故障识别方法,能够准确识别单相接地型和异名相两点接地型早期故障,但该算法易受过渡电阻影响,且涉及阈值较多、要求较高,在实际应用中存在一定的局限性。因此,如何解决基于知识驱动方法的适应性不足和基于数据驱动方法特征数据量大的问题,以及充分考虑小电流接地系统早期故障表现形式的多样性,是当前针对我国中压配电网早期故障识别方法研究需要关注的重点。

图1 小电流接地系统中的早期故障仿真波形

为解决上述问题,本文提出一种基于最小二乘支持向量机(Least squares support vector machine,LS-SVM)的小电流接地系统早期故障识别方法。在扰动特征提取阶段,同时计及了扰动波形的物理特性和统计特性,充分利用扰动数据特征,并采用最大相关最小冗余方法(Maximum relevance and minimum redundancy,mRMR)进行数据降维并保留强相关特征,构建最优扰动特征集,并基于粒子群算法(Particle swarm optimization,PSO)优化支持向量机的关键参数。经过仿真数据验证和与几种传统识别方法的对比,证明了所提方法的有效性和更高的准确率。

2 扰动特征提取及优化

早期故障准确识别的关键在于构建适合的扰动特征集,以此实现早期故障与其他非早期故障波形的可靠区分。考虑到早期故障作为典型小样本事件,具有随机性,实现早期故障与非早期故障波形分类的核心问题在于对扰动特征量的降维选择,以避免数据维数灾难,提高分类模型的适应性。因此,本文分别基于扰动的物理特性和统计特性提取浅层特征集,并进一步采用mRMR 法构建最优特征集,在尽量保留扰动强相关特征的同时降低数据维度。最优扰动特征集的构建及其所包含特征如图2 所示。

图2 最优扰动特征集的构建

2.1 初始扰动特征集提取

2.1.1 基于物理特性的特征提取

经前期研究成果可知,早期故障通常发生在电压峰值时刻附近,这是由于此时电压幅值较高而易导致绝缘薄弱点发生击穿。另外,早期故障具有瞬时性和自清除性,在扰动前后其负荷电流不发生改变。基于早期故障物理特性,将电压故障初相角φU、负荷电流变化量ΔIload及故障相电压和电流的波形形状因数FU和FI作为扰动特征子集1。其中,形状因数(Form factor)可用来表征扰动波形的实际形状的信息(如波形幅值的突变),因此本文采用形状因数表征早期故障发生时的故障相电压和电流幅值变化程度,故障相电压波形的形状因数FU的表达式如下所示

式中,Urms和Umean分别表示在扰动期间电压有效值的最大值和平均值;Nd表示扰动期间的总采样点数;Nhalf为信号的半周期采样点总数;k1和k2分别表示扰动起止时刻对应的采样点序列数;U为电压采样信号瞬时值;m表示采样点序列(m=k1,k1+1,…,k2)。故障相电流的波形形状因数FI同理可得。另外,若故障相不只一相,则以涉及相别对应形状因数的平均值为最终的特征量。

由此构建的扰动特征子集所含特征量与早期故障的物理特性密切相关。然而,由于故障的不确定性,扰动波形中可能存在大量的隐藏特征信息未被发现,且暂未对其进行基于物理特性的定量刻画,因此基于知识驱动的特征提取思路在当前的研究进展下存在一定局限性。此时,基于数据驱动的特征分析方法则为挖掘隐藏特征信息提供了重要的技术手段。

2.1.2 基于统计特性的特征提取

可变的时频分辨率使S 变换具有较好的时频特性和抗噪能力,该类信号处理方式能够提取丰富的时频特征量信息,被广泛应用于电力扰动波形的突变区域分析[19]。对站端扰动电压波形进行S 变换并取模处理后,获得一个M×N的模时频矩阵S,其行向量和列向量可分别对应该段扰动电压信号的频率信息和采样时刻的幅值特性。由此可见,模时频矩阵S蕴含了大量的扰动特征信息,在故障分类研究中得到了广泛应用,但此时S所含的数据量仍然很大。为进一步表征扰动波形隐藏特性,并降低特征集的数据维度,本文采用S 变换获取能量熵A和奇异熵B对扰动电压波形各频段上的能量分布特性和信号复杂程度进行刻画[19]。假设模时频矩阵S中的第i行第j列个元素表示为sij,则矩阵S在对应频率i和采样时刻j的条件下的信号能量Eij可以表示为

在频率为i条件下对应的所有采样时刻的扰动信号能量之和Ei以及信号总能量E可分别表示为

根据矩阵S的行数M将该矩阵分为低、中、高三个频段,电压扰动波形在不同频段下对应的S 变换奇异熵A可表示为

在计算不同频段的奇异熵时,式(5)中的下标f分别取为low、med、high 以对应低、中、高三个频段。在不同频段条件下,M1和M2分别对应式(6)取值,其中MS为S对应频域最大值,MS=采样频率×M÷采样点数。例如,本文所用扰动数据采样频率为10 kHz,其对应的低、中、高三个频段分别取为0~1 667 Hz、1 668~3 334 Hz、3 335~5 000 Hz。

假设低频段的模时频矩阵Slow为一个Mlow×Nlow矩阵,由奇异值分解理论可知,必然存在一个Mlow×r的矩阵D和r×Nlow的矩阵C以及一个r×r的对角线矩阵R,使得模时频矩阵的低频段矩阵Slow可被分解为

对角线矩阵R的主对角线元素ri(ri= 1, 2, 3,…,r)为非负数且按降序排列,这些元素即为Slow的奇异值,可表示对应采样时刻及频率条件下的信息量的大小。因此将模时频矩阵低频段的奇异熵Blow表示为

同理,根据式(8)可分别计算出中频段模时频矩阵Smed和高频段模时频矩阵Shigh对应的奇异熵Bmed和Bhigh。

电压扰动波形低、中、高频段对应的S 变换奇异熵和S 变换能量熵共同组成基于统计特性的扰动波形特征子集2。

2.2 最优扰动特征集构建

基于统计特性构建的扰动波形特征子集2,表征了扰动信号在不同频段上的能量分布情况以及在时频空间中能量分布的复杂程度[19]。对模时频矩阵S进行奇异熵和能量熵的提取,虽然能在一定程度上降低输入分类器的数据维度,但是仍具有较大数据量和信息量,并存在大量与扰动本身相关程度不高的特征量,可能会导致分类模型的训练时间较长,并影响分类结果的准确性。因此,本文基于最大相关最小冗余法对特征子集2 进行处理,保留特征集中与扰动波形具有强关联性的特征并消除冗余特征量,降低数据维度。

最大相关最小冗余法的核心思想是从已知的特征数据集中寻找与其目标类别有最大相关性且相互之间具有最小冗余性的特征子集,评价标签类别与特征之间的相关性[20-21]。最大相关最小冗余法能够将扰动特征子集2 中具备最大分类能力的最优特征量保留,并将子集中所含的高冗余和不相关信息降低至最小程度,深度挖掘与目标标签相关联的特征信息,提高分类能力[22]。

设两个随机变量a和b的概率密度函数p(a)、p(b)和p(a,b),则可将这两个变量之间的互信息表示为

特征集X的最大相关和最小冗余衡量标准分别表示如下

式中,|X|表示特征集X所含的特征数;Y= {y1,y2,y3,…,yn}为类别标签;xi和xj分别表示特征集X中第i和第j个特征。根据式(9)可得,两个特征量xi和xj之间的互信息为I(xi,xj),特征量xi与其对应类别之间的互信息为I(xi,Y)。根据式(10)和式(11),最大相关最小冗余准则可被定义为

在实际应用场景中,通常采用增量搜索法寻找近似最优特征[23]。特征集X中已有v-1 个特征量被确定,该部分特征量组成子集Xv-1,此时最大相关最小冗余法的目的就是从剩余子集{X-Xv-1}中选择第v个特征量,实现式(12)中φ( ·) 最大化,因此又可将最大相关最小冗余准则定义为如下形式

3 支持向量机及其优化

3.1 最小二乘支持向量机理论

支持向量机(Support vector machine,SVM)以核函数理论为基础,基于映射函数将样本投放至高维空间中以获取最优超平面使样本线性可分,随后又将其反映射回低维空间,实现最终分类[24],该过程如图3 所示。

图3 支持向量机分类原理示意

LS-SVM 则将传统支持向量机模型中的不等式约束改为等式约束[25],简化了拉格朗日乘子的求解过程,并将误差平方和损失函数作为训练集的经验损失,将二次规划求解问题转化为求解线性方程组,极大提高了计算速度和收敛精度。

对于训练样本集Q={(xk,yk)|k= 1,2,3,…,n},xk和yk分别表示样本及其对应类别,将不同类别样本分类,其目标函数为

式中,ψ(x)为映射函数;w为权值;h为截距;ξ和γ分别为估计偏差和惩罚因子,上式的拉格朗日函数可表示为

式中,非负数α为拉格朗日乘子。分别对式(16)中w、h、ξ、α求偏导,并令其为零

由Mercer 条件[26],存在映射函数ψ(x)及核函数K(x,xk)使得

式中,k,l= 1, 2, 3,…,n。根据式(16)和式(18)可将基于LS-SVM 的分类决策函数表示为

研究表明,支持向量机在径向基函数条件下能够获得较好性能[27],因此本文选择径向基核函数为LS-SVM 的核函数,其表达式如下所示

式中,σ2为径向基核函数的宽度。

3.2 基于粒子群算法的参数选择

LS-SVM 存在核函数宽度σ2和惩罚系数γ两个变量,当γ的取值越小,则算法适应性越强,但训练误差也随之增大;而当γ的取值较大时,算法适应性降低;σ2主要影响算法的运行效率[24]。因此需要寻求最优参数组合以满足算法适应性和运算效率的约束。网格搜索法(Grid search)是最常用的参数搜索方法,但该方法的运算时间较长且效率不高[28]。本文选用PSO 算法寻找核函数宽度σ2和惩罚系数γ的最优组合。PSO 算法将一群初始化粒子经过多次迭代后获取目标函数最优解,在各次迭代过程中,每个粒子基于个体极值pi(该粒子最优解)和全局极值gd(该种群所得最优解)更新自身的位置及速度[29]。第i个粒子在第k+1 次迭代过程中的位置及其对应速度分别表示如下

式中,c1和c2为学习因子,r1和r2为[0, 1]之间的随机值,η表示加权因子。

根据前期研究经验对PSO 算法中初始参数设置情况如表1 所示[30-31]。

表1 粒子群优化算法的初始参数设置

4 早期故障识别算法流程

本文提出基于最小二乘支持向量机的适用于小电流接地系统的早期故障识别方法,其具体流程如图4 所示。

图4 早期故障识别流程图

算法具体步骤如下所示。

(1) 基于PSCAD/EMTDC 搭建不同扰动模型,构建配电网早期故障及多种常见扰动波形数据库。

(2) 构建基于物理特性的特征子集1 和基于统计特性的特征子集2。其中子集1 包含电压故障初相角、故障相电压和电流的波形形状因数以及扰动前后的负荷电流变化量;子集2 为电压波形经S 变换后不同频段的能量熵和奇异熵。

(3) 利用最大相关最小冗余法对特征子集2 进行处理,保留特征集中与扰动波形具有强关联性的特征并消除冗余特征量,降低数据维度,构建最优特征集。

(4) 基于K 折交叉验证法划分训练样本集和测试样本集,并算取各样本集对应的最优特征集。

(5) 将训练样本集对应特征集输入LS-SVM 以构建扰动分类模型,同时基于粒子群算法进行参数寻优。

(6) 基于训练后得到的分类模型对测试样本集进行验证,利用不同评估指标对算法的性能进行验证,并将该算法与传统扰动识别方法进行对比。

5 算例分析

5.1 样本集构建

基于PSCAD/EMTDC 系统搭建小电流接地配电网仿真模型,其拓扑结构如图5 所示,ZX表示消弧线圈的阻抗。当开关K 闭合时,该系统为中性点经消弧线圈接地,断开时则为中性点不接地。仿真系统中线路模型的参数设置情况如表2 所示。

表2 仿真系统的线路参数

图5 配电网仿真系统

根据表3,采用PSCAD/EMTDC 的Multiple Run元件获取不同类型的扰动波形样本数据,包括早期故障、励磁涌流、电容器组投切和恒定阻抗故障的波形样本各360 例。

表3 样本集的参数设置

5.2 算法性能分析5.2.1 算法评价指标

本文基于 K 折交叉验证法(K-fold cross validation,K-CV)对算法有效性进行分析,即将各类型的扰动波形样本集随机分为K组,各组的样本数量相等,随后依次使用其中一组作为测试样本集,剩余K-1 组则自动归为训练样本集,本文将K取为5。同时,使用基于混淆矩阵的算法性能度量指标对本文算法性能进行评价[32],如式(23)~(26)所示。

(1) 算法识别结果和实际类别一致的样本占总样本的比例,即准确率P1

(2) 算法识别为早期故障且实际类别为早期故障的比例,即精确率P2

(3) 算法识别且实际类别为早期故障的样本占所有实际类别为早期故障样本的比例,即召回率P3

(4) 由于实际中需要识别的扰动类型可能存在样本数不平衡的问题,仅靠准确率评估不合理,因此表示精确率P2和召回率P3的调和均值的指标P4

式中,T1和T2分别表示被正确分类的早期故障和非早期故障样本数,F1为被误识别为早期故障的非早期故障样本数,F2为被误识别为非早期故障的早期故障样本数。

基于K 折交叉验证法将各类扰动样本集随机均分为5 组并编号,各组依次作为测试样本集,在各次测试中的算法性能评价结果如表4 所示。根据表4 可知,本文所提算法在不同样本集条件下的准确率和精确度均能够高于95%,具备较高的稳健性。

表4 本文算法的各项性能评价指标

从理论上讲,在寻求最优参数组合时迭代次数越多,最后得到的误差会更小,即识别准确率越高。本文取迭代次数为100,图6 展示了不同迭代次数下算法的识别准确率。可知,当迭代次数小于20次时,准确率较低,而随着迭代次数的增加,准确率上升。当迭代次数达到100 时,算法的识别准确率已为96.95%,此后继续增大迭代次数,准确率变化非常小,当迭代次数大于120 后,准确率不再上升。

图6 迭代次数对算法结果的影响

5.2.2 特征及参数选择优点

为验证基于mRMR 的特征优化法有效性,分别将扰动样本的原始特征集和经mRMR 法处理后的最优特征数据集作为分类器的输入。表5 记录了在两种特征集条件下的算法性能评估指标均值及相应的数据处理时间,各次测试结果中的算法性能指标如图7 所示。由表5 和图7 可知,本文采用的扰动最优特征集能够有效降低数据维度并减少冗余特征,减少了数据处理时间且提高了算法准确性。

表5 最优特征集与原始数据集条件下的算法性能比较

图7 特征优化前后的算法准确率P1 比较

采用PSO 算法选择核函数宽度σ2和惩罚系数γ的最优组合,将该方法与常用的网格搜索法进行比较。表6 记录了在两种方法下识别算法的平均评估指标及处理时间。图8 记录了各次测试中上述两种方法对识别算法准确率P1的影响。由此可知,在多数的测试案例中,PSO 算法与网格搜索法相比具有更高的识别精度且所需的数据处理时间更少。

表6 不同参数寻优算法比较

图8 不同参数寻优法下的算法准确率P1 比较

5.2.3 与其他分类方法比较

为进一步验证本文算法的有效性,将其与概率神经网络(Probabilistic neural network,PNN)、决策树(Decision tree,DT)和 K 近邻算法(K-nearest neighbor,KNN)进行比较,识别结果如表7 和图9所示。

表7 不同分类器条件下的算法各项性能评价指标

图9 不同分类器下的算法准确率P1 比较

6 结论

本文提出一种基于最小二乘支持向量机的小电流接地系统早期故障识别方法, 根据PSCAD/EMTDC 系统构建了典型扰动波形数据库,在此基础上对算法性能进行分析并得出以下结论。

(1) 本文结合扰动的物理特性和统计特性提取初始特征集,并采用最大相关最小冗余方法构建最优特征集,消除了冗余信息并降低了数据维度,更加利于分类。

(2) 根据交叉验证法的分析结果,本文算法的准确率和精确度均能够高于95%,具备较高准确性。

(3) 通过与其他传统识别方法的比较,本文所提算法的准确率和运算速度均有所提升。基于仿真波形数据验证了所提早期故障识别算法的有效性,未来需要进一步使用大量实测数据进行验证。

猜你喜欢
子集扰动波形
由一道有关集合的子集个数题引发的思考
Bernoulli泛函上典则酉对合的扰动
拓扑空间中紧致子集的性质研究
对《压力容器波形膨胀节》2018版新标准的理解及分析
关于奇数阶二元子集的分离序列
(h)性质及其扰动
基于LFM波形的灵巧干扰效能分析
测控技术(2018年2期)2018-12-09 09:00:46
小噪声扰动的二维扩散的极大似然估计
基于ARM的任意波形电源设计
大连台使用CTS-1记录波形特点