基于不完全S变换和改进SVM的电能质量分类方法

2023-02-03 08:51王鹏飞任丽佳
制造业自动化 2023年1期
关键词:时频步长扰动

王鹏飞,任丽佳,高 燕

(上海工程技术大学 电子电气工程学院,上海 201620)

0 引言

近年来,随着社会的高速发展,分布式电源[1]、电气化铁路[2]、冶金设备[3]等新型负载被大量接入电网。虽然它们给社会带来了便捷与正向收益,但也成为了新型的电能质量扰动发生源。电力系统中电能质量扰动事件[4](Power Quality Disturbance Events,PQDEs)变得越来越多。谐波,电压闪变,暂态震荡等电能质量的增多,对高精度仪器,用电设备的危害极其严重,甚至会影响到整个电网的安全运行。电能质量扰动具有偶发性与瞬发性的特点,检测扰动类型就需要大量的数据,靠人为来观察这些数据就显得很不现实。故此,一款能够准确高效的分辨电能质量扰动类型的分类方法,就显得尤为重要。

电能质量扰动信号分类处理,其本质是数据处理,传统的特征提取方法有:小波变换(WT)[5]、模态分解(EMD)[6]、希尔伯特-黄变换(HHT)[7]、S变换[8~10]等。WT对噪声敏感,且特征提取的优缺与小波基的选择有很大的关系,特征提取效果存在偶然性。EMD主要的问题是模态混叠,这会混淆IMF的时频分布,破坏其物理意义。HHT具有充分的自适应性和对非平稳信号的精确分析能力。它可以同时满足时域和频率轴的精度要求。但是,它需要复杂的递归,处理时间较长。S变换窗函数的窗宽与频率成反比,窗函数具有选择性,时频信号中各频率分量的相位谱与初始信号具有固定的关系。这就使得S变换具有良好的时频分析能力。

在分类器构建阶段,有很多模式识别的分类方法,常见的有:人工神经网络法(ANN)[11],决策树(DT)[12],支持向量机(SVM)[13]等。ANN通过判别函数去计算已知类别的分类样本,对于未知样本不能做出分类,而且ANN是非线性的,需要较长的分类时间,且有较差的分类速度。DT对样本的依赖程度高,训练质量直接影响分类效果,容易局部最优,过拟合也是它常有的问题。SVM通过一个平面或是超平面将两类样本准确无误的划分为两类。特别在处理小样本、非线性以及高维模式时可以有效的分类。SVM的分类效果受惩罚因子C和核函数参数g的影响较大,需要通过参数寻优等方法来提高其分类能力。

为了解决电能质量扰动信号特征提取与分类准确率提升困难的问题,本文提出了一种基于不完全S变换与CBAS优化SVM的特征提取扰动分类方法。首先利用不完全S变换对电能质量特定频率数据处理得到模矩阵,绘制时频信号图,运用递归特征消除[14](Recursive Feature Elimination-RFE)优化特征向量数量以减少计算时间。然后利用改进步长变换方式的BAS算法[15]优化SVM寻找最优参数(c,g)。最后代入训练集与测试集样本,查看分类效果。根据实验结果显示,本文提出的特征提取与分类方法,具有较高的分辨准确率,并且在不同的噪声环境下也有不错的表现,体现了其良好的识别与抗噪能力。

1 不完全S变换提取扰动特征

1.1 S变换

S变换采用了窗宽与频率的倒数成正比的高斯窗函数,窗宽不再固定不变,时频特性更好。

扰动信号x(t)的S变换S(τ,f)定义如下:

其中w(τ-t,f)为高斯窗函数,τ为w(τ-t,f)在t轴某处的参数。式(1)、式(2)是S变换的连续函数形式,离散型式如下:

式中,N为采样点数,j,m=0,1,2,...,N-1;n=0,1,2,...N/2,k为窗宽调节因子[16],k值的变化会改变S变换在不同频率条件下的时频分辨率[17]。k值变小,S变换时间分辨率提高,k值变大,S变换频率分辨率提高。

1.2 不完全S变换提取特征值

对于电能质量数据中的N个离散信号x[j],j=0,1,...,N-0利用式(3)、式(4)进行变换,可以得到一个二维复数结果矩阵,其中行对应频率特性,列对应时间特性。实际频率值为(fs/N)*n,fs是采样频率。复数矩阵不能全面的展示信号的特性,故需对结果矩阵求模得到幅值矩阵(记做STM)。STM可以反映信号的时频特性[18]。

通过对STM矩阵的分析,发现并不是矩阵中所有频率对应的向量都是有用的。特征往往集中在某些特定频率所对应的位置上。故考虑在这些特别的频率点进行S变换,因为对高斯窗的参数m设置了特定值,所以称之为不完全S变换。这样不仅能够针对性的提取有效特征,还能够节省计算时间。

这些特定的频率主要有两种,分别是奈奎斯特(Nyquist)频率[19]及m*fk频率。Nyquist频率可以反映切口和尖峰的周期性[20]。fk为电网电能信号基频,其值为50Hz,随着m值的变化,可以得到不用类型电能质量扰动的特点。当m=1时,m*fk为基频,可以找出电压暂升/暂降/中断/闪变等特性;当m=3,5,7,9时,m*fk所对应的频率为奇次谐波主要存在的频率段,就能反映出扰动信号谐波特性[21];当m=5,7,9,11,15,17,19时,因m*fk所代表的频率段包含了振荡中心频率[22]。所以可以反映暂态振荡特性。图1、图2给出S变换与不完全S变换对随机生成的信噪比在20~50dB间的谐波与暂态振荡信号变换后的STM矩阵三维时频图。

图1 某谐波信号S变换、不完全S变换时频对比

图2 某暂态振荡信号S变换、不完全S变换时频对比

由图1、图2可知:本文提出的不完全S变换对扰动信号处理后的三维时频图的效果明显好于S变换对同一信号处理得到的三维时频图,从而能够更好地反映幅值、谐波频率等各种扰动的特点,证明了该方法的可行性。

利用以上设定的频率值,对电能质量扰动信号进行不完全S变换后得到STM矩阵。分别求出每行每列的最值、均值及方差来分别对应时域,频域特征向量。行的表示为r(max)、r(min)、r(mean)、r(std),列的表示为c(max)、c(min)、c(mean)、c(std)。再引入各最值的和、均、差、方差值组成特征A1-A30。具体如表1所示。

表1 特征提取(A1-A30)

2 改进BAS优化SVM

2.1 天牛须搜索算法

天牛须搜索算法(Beetle Antennae Search-BAS)在不知道函数的具体形式或梯度信息的情况下,可以实现有效的优化。与PSO相比,BAS只有一个个体,大大减少了计算量。其具体形式如下。

第一步:在某n维空间,用xl代表左须,xr代表右须,x代表天牛头中心,d0代表两根触须的间隔。为模拟自然界中天牛头部朝向存在随机性的设定,利用随机向量dir表示两触须的随机朝向。

归一化为:

这样就能得到:

第二步:对函数f,求左须与右须的值:f left=f(xl);fright=f(xr)。

第三步:将第二步的两须值进行比较,若fleft<f right,天牛需要向左边移动step个步长才能寻找最小值,即:

若fleft>f right,天牛就得向着相反的方向移动step个步长,即:

上述情况可以利用符号函数sign写成:

其中,normal是归一化函数。

2.2 改进天牛须搜索算法

BAS算法,寻优快,收敛快,但是步长变换方式不同,对算法的影响较大。关于变步长方式,常见的有两种方式,具体情况如下所示。

变步长方式1:

其中:eta是线性变步长参数,其取值范围为[0.1,1],通常取值为0.95;

变步长方式2:

其中:temp为引入的新变量,step0为初始步长值。

上面两种变步长方法都是线性形式,前期步长缩小快,后期相对缓慢。这就会使得BAS算法全局搜索能力减弱,出现算法早熟现象。针对这一现象,提出一种新的步长改变策略,如式(15)所示:

按照式(15)变换步长,步长变换为非线性,步长会随着迭代次数的增加而减小。式中δstart为初始步长,δend为迭代到最大次数的步长,T是最大迭代次数。

相较于BAS变步长方式,CBAS的步长变化为初始时步长下降速度慢,之后随着迭代次数的增加下降速度逐渐变快。这样就解决了BAS全局寻优较弱的缺点,均衡了BAS的局部和全局寻优能力。

2.3 CBAS优化SVM模型建立

支持向量机(SVM)是一种具有出色学习性能的模式识别方法,在电力系统的故障诊断,负荷预测等领域都有成功的应用。但核函数参数与惩罚因子这两个参量的变化会影响SVM的分类效果。故引用优化后的CBAS算法对SVM进行性能调优,具体步骤如下所示。

步骤一:初始化天牛须搜索算法,设定初始质心及两须坐标、两须间的距离、初始步长、最大迭代次数。

步骤二:设置惩罚因子c及核函数参数g的寻优范围,一般c的范围为[0.1,100],g的范围为[0.01,100]。在给定范围内随机初始化CBAS,并将样本送入诊断模型。

步骤三:算法寻优内行为,自行对比左右须值并选择朝值小的一方运动一个步长。

步骤四:CBAS完成一次运动后,会记录全局气味最大的点,如果本次迭代后,全局气味最大值优于先前的最优值,CBAS就会保留此次的全局气味最优点作为新的最优值,并保存对应的参数值。

步骤五:判断是否达到最大迭代次数,若未达到,就返回步骤三继续寻优。

步骤六:满足条件,结束寻优,SVM最优参数值,对应全局气味最优值取值时的参数,将这两个参数代入SVM中,利用样本集进行训练,并使用测试集验证性能。

CBAS优化SVM流程图如图3所示。

图3 CBAS-SVM模型实现流程

3 电能质量扰动分类实例分析

3.1 扰动生成与参数配置

为了验证本文所提模型的实际分类效果,采用文献[4~8]的数学模型,随机产生包括电压骤升骤降、闪变、中断、谐波、暂态振荡、谐波+暂升暂降、暂态振荡+闪变、谐波+暂态振荡在内的10种,共240组数据,其中训练样本及测试样本分别为200个和40个。

上述扰动信号,随机加入信噪比为40db、30db、20db的白噪声,SVM核函数选择RBF核函数,设置SVM参数值分别为c=0.5216,g=4.3510(此处c,g为CBAS寻找到的最优参数);实验利用不完全S变换后得到的结果矩阵,实验利用表1中的特征量来训练分类器,特征量数目相对较多,且存在一定的重复特征或无用特征,故采用递归特征消除的方法反复的构建SVM模型来不断地减少特征集的规模并选择合适的特征量。排除对分类效果不能产生较大提升的非关键性特征,选取分类效果最优的特征组F={A1,A2,A5,A7,A10,A16,A17,A18,A22,A24,A28}作为训练特征矩阵,输入分类模型中。在训练组对模型多次训练后利用测试组验证分类准确率及分类所耗时长。

3.2 实验结果分析

按照上述参数配置好CBAS-SVM模型,将240组样本随机打乱输入该模型,该模型会自行选择200组数据作为训练组,及40组数据作为测试组,多次实验,利用平均数值来体现模型性能,极大的提升了模型预测的说服力。模型预测十次,记录每次的结果。该模型性能稳定,十次预测结果并无太大偏差,选取30db下第五次的预测结果如图4所示。从图4中可以看出CBAS-SVM模型对电能质量问题的预测值可以做到和实际值完全一致,偶有几次会出现95%的准确率。另外为了体现CBAS-SVM模型的优势,还分别采用了SVM和PSO-SVM在相同条件下对同一数据做了预测分析,同样的记录了各自每次的实验结果,并选取30db下第五次的预测效果如图5所示。

图4 CBAS-SVM对特殊负载的预测结果曲线

图5 不同模型对特殊负载的预测结果曲线

结合图4、图5可看出,SVM模型未对(c,g)参数优化,故其预测效果虽能大体上呈现测试组数据的实际类型,但总体正确率不高;PSO-SVM的预测曲线,大致上和实际值曲线吻合,但是个别数值存在偏差严重的问题。由此,传统SVM及PSO-SVM模型对数据处理后的预测结果准确率明显低于CBAS-SVM的预测效果。

为了更直观地区分这三种模型的性能差异,本文列举了三种预测结果的平均精度及其所耗费的时间,详细记录在表2中。

表2 三种模型的预测准确率及耗时

由表2可看出,在不同的信噪比条件下CBAS-SVM的预测准确率最高,且相较于另外两种分类方式受噪声影响程度更低。其运行时长也是得到了明显的缩短,比耗时相对较短的PSO-SVM的时间还缩短了进57.73%。由此可得出结论:CBAS-SVM模型能够显著提升预测准确率,且针对相同数据分类耗时更短,性能最优,更适合工程应用。

4 结语

本文首先,利用不完全S变换针对性的提取电能质量扰动信号特定频率波形特点,大大减少了特征提取的计算量。其次,提出新的步长改进方式,改善了BAS算法易出现算法早熟,全局寻优能力较弱的问题,均衡了算法的性能。并利用CBAS算法对SVM两个参数进行寻优,提升了CBAS-SVM模型的综合性能。利用不完全S变换提取多特征建立特征矩阵分别输入RF、PSO-SVM、CBAS-SVM模型进行结果对比,实验证明,提出的基于不完全S变换的CBAS-SVM模型不仅具有较高的分辨准确率,而且耗时更短,实时性更佳。

猜你喜欢
时频步长扰动
Bernoulli泛函上典则酉对合的扰动
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
一类四次扰动Liénard系统的极限环分支
带扰动块的细长旋成体背部绕流数值模拟
基于随机森林回归的智能手机用步长估计模型
(h)性质及其扰动
基于Armijo搜索步长的几种共轭梯度法的分析对比
基于稀疏时频分解的空中目标微动特征分析
基于动态步长的无人机三维实时航迹规划
基于时频分析的逆合成孔径雷达成像技术