基于改进的SVM的电能质量复合扰动分类

2016-05-03 11:18赵立权
电工电能新技术 2016年10期
关键词:高斯扰动电能

赵立权, 龙 艳

(东北电力大学信息工程学院,吉林省 吉林市 132012)

基于改进的SVM的电能质量复合扰动分类

赵立权, 龙 艳

(东北电力大学信息工程学院,吉林省 吉林市 132012)

本文利用支持向量机对电能质量复合扰动进行分类,解决其多重分类问题,为了提高其整体分类的准确率,对支持向量机中的核函数进行了改进。考虑到特征向量在核函数中心位置的聚集程度会影响支持向量的数目,本文在核函数中引进一个径向宽度因子和一个幅值调节因子,从而解决传统核函数存在的问题,减少支持向量数目,降低计算复杂度。将改进后的算法应用到电能质量复合扰动分类中,验证所提方法对于电能质量复合扰动分类不仅具有可行性,并且有较高的分类准确率。从仿真实验结果可以看出,改进的方法对常见的7种单一电能质量扰动信号和5种电能质量复合扰动信号能够进行分类,相对原算法提高了分类准确率。

电能质量复合扰动;支持向量机;高斯核函数;分类准确率

1 引言

近些年,大量负荷接入电力系统,使电网产生各种电能质量问题[1],造成了巨大的经济损失和社会影响,电能质量的检测和分析已成为电力系统研究的重点之一。电能质量扰动分类是电能检测的前提,因此其对电能质量检测和提高具有重要作用。

目前对电能质量扰动的研究更多集中在单一扰动检测方面[2],但是实际中电能质量扰动的存在不是只有一种扰动,而是由多种单一扰动组合而成,这种扰动被称为复合扰动[3,4]。目前对电能质量复合扰动进行分类的方法主要有:神经网络[5]、决策树[6]和支持向量机(Support Vector Machine, SVM)[7,8]等。神经网络分类器具有简单的结构和很强的求解能力,但是训练时间长,且容易出现过学习等问题;决策树分类器是模拟人类的思维构建分类规则,虽然分类速度很快,但在分类过程中建立规则比较复杂,会出现错误累积的误差,并且对于多种类分类模型很难处理。

SVM基于统计学习理论,是一种解决样本数量少、非线性及高维样本的模式识别问题的机器学习方法,其克服了人工神经网络易陷入局部最优解和训练时间长的缺点[9]。本文中,采用SVM作为分类器,实现电能质量复合扰动的分类。首先,本文将采用小波变换的方法对各种电能质量复合扰动进行特征提取;然后,采用改进后的支持向量机对各种电能质量复合扰动进行分类。

2 支持向量机分类器

支持向量机是以统计学习理论和构建风险最小化为基础的一种机器学习方法,用于解决小样本数据的分类问题,它能把输入空间中线性不可分的问题经过核函数映射到高维空间,变成线性可分问题。通过建立一个最优超平面,得到最大的分类间隔,使两类样本达到最优化分类。

假设给定特征空间上的训练样本集为(xi,yi),其中,xi为第i个特征向量,yi∈{+1,-1}为分类号,i=1,2,…,N,N为样本数。所谓的线性分类器就是可以找到一个最优分类超平面ωTx+b=0将不同类别的特征量x分开。令分类函数f(x)=ωTx+b,其中,ω为法向量,b为截距,如果f(x)=0,那么x是分类超平面上的点;如果f(x)<0,那么x则属于类别-1;如果f(x)>0,那么x则属于类别1。要确定分类函数,则要确定分类函数中的两个参数ω和b,于是需要寻找最大分类间隔。经求解得到最大分类间隔为1/‖ω‖,即目标函数可以表示为max(1/‖ω‖),约束条件为yi(ωTx+b)≥1,其中,i=1,2,…,N。目标函数max(1/‖ω‖)经过取倒数可转化为求min(‖ω‖2/2),则目标函数为:

(1)

式中,ω为法向量。约束条件为:

yi(ωTx+b)≥1i=1,2,…,N

(2)

为了更好地求解这个函数,可应用拉格朗日对偶性,通过求解对偶问题得到最优解,则有

(3)

分别对ω、b求偏导且结果为0。

对ω求导得:

(4)

对b求导得:

(5)

将式(4)和式(5)代入式(3),对αi求解最大值,即

(6)

约束条件为:

(7)

(8)

综上所述,假设(xi,yi)是其中的一个支持向量,s为所有的支持向量数目,那么分类决策函数的表达式如下:

(9)

式中,K(xi,xj)为引入的核函数,其作用是将低维空间中非线性不可分样本映射到高维空间中,变成线性可分问题。

分类阈值为:

(10)

当样本线性不可分时,通过引入松弛变量ξi和惩罚因子C解决问题,则目标函数变为:

(11)

约束条件为:

yi(ωTx+b)≥1-ξiξi≥0i=1,2,…,N

(12)

SVM只是进行二类分类,当需要进行多分类时不能直接使用。对于解决电能质量复合扰动分类等多分类问题时,需要把多分类问题变换成二分类问题,因此,需要构造多个二分类SVM,把多分类问题变换成多级二分类问题来处理。本文采用一对一(One-against-One)SVM这种多分类方法对电能质量复合扰动进行分类。

3 改进的支持向量机

核函数是实现特征量数据从低维空间的非线性不可分到高维空间线性可分的关键。核函数的形式不一样,则支持向量机对样本的作用形式也不一样。对于所有的样本x,xi∈X,其中X是样本集,若函数K满足:

K(x,xi)=<φ(x),φ(xi)>

(13)

则称函数K为核函数。式中,φ(·)为从原始输入空间到高维特征空间的映射;<,>为内积。常用的核函数主要有高斯核函数、线性核函数、多项式核函数等。

3.1 高斯核函数

在解决实际问题中,高斯核函数因具有可分性,即存在一个超平面能将训练集分开,而被广泛应用。其一般形式为:

(14)

高斯核函数的曲线如图1所示。

图1 高斯核函数曲线图Fig.1 Graph of Gauss kernel function

3.2 核函数的改进

高斯核函数由欧式距离方程K(x,xi)=‖x-xi‖构成,其对样本的作用是局部的。在原空间分布比较密集的特征量经过高斯核函数的作用,映射到高维空间后会变得非常稀疏,这就降低了核函数的局部作用能力,使分类模型建立过程中支持向量的数目增加,计算复杂度变大,计算时间变长。从式(14)中能够得出,带宽σ是高斯核函数中仅有的一个参数,通过调整σ的值可以改变支持向量机的分类性能和样本在高维空间中的聚类能力。但是,只调节σ这一个参数对支持向量机的分类性能影响并不大,并没有解决高斯核函数存在的问题。

要解决该问题,核函数需具有在支持向量附近衰减速度很快的特性[10],所以本文将对高斯核函数进行改进,引入一个幅值调节参数,其表达式如下:

(15)

式(15)能使样本数据在支持向量附近有较快的衰减速度。

为了使特征量在高维空间中的支持向量附近更加聚集,引入径向宽度调节参数c,使得函数有较快衰减速度的同时样本数据在支持向量附近更加聚集,其表达式如下:

(16)

图2为函数幅值固定不变的情况下,通过调节参数c得到的函数曲线图。可以看出,c值越大,所对应的曲线衰减速度越快,数据在支持向量附近更加聚集。所以,通过控制参数c可以改变核函数的衰减速度和数据的聚集程度。

图2 c值不同的函数图Fig.2 Function graph of different c values

3.3 改进的高斯核函数和高斯核函数的性能比较

通过Matlab仿真,对两种核函数进行实验对

比,结果如图3所示。σ都取值为0.595,改进的高斯核函数c取值5.5。

图3 改进高斯核函数和高斯核函数对比图Fig.3 Comparison of improved Gauss kernel function and Gauss kernel function

可以看出,改进的高斯核函数在支持向量附近更加聚集,而且在其附近的衰减速度比高斯核函数的衰减速度快,所以可以通过改变参数c改变核函数衰减速度的快慢,c越大,则衰减的速度越快。

4 电能质量复合扰动分析

本文主要针对电压骤降、电压骤升、电压中断、谐波、暂态脉冲、暂态振荡和电压闪变7种单一扰动和骤升+谐波、骤降+谐波、骤升+闪变、骤降+闪变和闪变+脉冲5种复合扰动进行分类,表1为12种电能质量扰动的数学模型[11-13]。

对电能质量复合扰动进行分类主要分成两步:特征提取和分类。小波变换被广泛应用于电能质量信号处理中[14],为了方便,本文采用小波变化对表1的12种电能质量扰动信号进行处理,采用db10小波进行8尺度小波分解,提取分解后的各层小波系数,根据Parseval定理求取各尺度的能量,然后求其与正常信号的能量之差,对这8个能量差进行归一化处理作为特征量,即共有8个特征量。最后用改进的支持向量机对电能质量复合扰动信号进行分类。分类的步骤如下:

(1)选取归一化处理的数据一部分作为训练样本,给定核函数带宽参数σ。

(2)用改进的支持向量机对训练样本进行训练建模,求得分类模型。

(3)将其余的样本作为测试样本,输入到训练好的分类模型中进行预测分类,求取分类准确率。

表1 电能质量扰动信号的数学模型Tab.1 Mathematical models of power quality disturbance

5 实验仿真与分析

本文对表1给出的12种电能质量扰动信号进行分类,验证所提分类方法的有效性,并与传统高斯核函数的支持向量机分类方法进行比较。其中,c值经过多次取值测试后确定。表2给出了不同c值时,模型的整体分类准确率以及支持向量总数。

表2 不同c值的结果对比Tab.2 Comparison results of different cvalues

从表2可以看出,当c值大于5.5或者小于5.5时,运行程序得出的分类结果虽然也较原来有所提高,但是都低于c值等于5.5时运行得出的结果。这是因为c值越大,改进的高斯核函数在支持向量附近越聚集,衰减的速度越快,但当c值大于5.5时,改进的高斯核函数在支持向量附近过于聚集,模型的整体分类准确率降低,所以本文中c取值为5.5。带宽参数σ和惩罚参数C的值通过交叉验证和网格搜索获取,σ取值0.595,C取值4,加入20dB的噪声。

表3给出了改进前后支持向量总数、运行时间和整体分类准确率的对比结果。表3中每种扰动的训练样本为80个,测试样本为120个,即训练样本总数为960个,测试样本总数为1440个。在这种情况下,由表3可以看出,改进的支持向量机分类过程中支持向量总数有所减少,使得计算变得简单,缩短了分类时间,而且最终整体的分类准确率有所提高。这三个对比结果都表明改进后的支持向量机提高了对电能质量复合扰动的分类准确率。

表3 改进前后对比结果Tab.3 Comparison results before and after improvement

表4为12种电能质量扰动分别在改进后的支持向量机和未改进的支持向量机分类方法中的分类准确率,其中,每种扰动的训练样本为80个,测试样本120个。由表4可以看出,这12种扰动类型在改进后的支持向量机下的分类相比传统的支持向量机分类的分类准确率几乎都有所提高,平均分类准确率也有所提高。因此,该结果能够说明本文提出的分类方法对常见的几种电能质量复合扰动具有较高的分类准确率。

表4 各种扰动信号的分类准确率Tab.4 Classification accuracy of various disturbance signals

6 结论

本文提出一种改进核函数的支持向量机分类方法。采用小波变换提取扰动特征向量,然后用改进的方法对电能质量复合扰动进行分类。改进后的支持向量机的分类准确率相对传统的高斯核函数支持向量机分类方法有所提高,并且分类过程中的支持向量总数减少,分类时间缩短。

[1] 滕志军,王中宝,索大翔,等(Teng Zhijun,Wang Zhongbao, Suo Daxiang, et al.).变电站电能质量在线监测系统(On-line monitoring system for substation power quality)[J].电工电能新技术(Advanced Technology of Electrical Engineering and Energy),2013,32(2):97-101.

[2] 赵立权,谢妮娜(Zhao Liquan, Xie Nina).基于小波变换和改进的RVM的电能质量扰动分类(Classification of power quality disturbances based on wavelet transform and improved RVM)[J]. 电工电能新技术(Advanced Technology of Electrical Engineering and Energy),2013,32(4):74-78.

[3] 刘志刚,张巧革,张扬(Liu Zhigang, Zhang Qiaoge, Zhang Yang). 电能质量复合扰动分类的研究进展(Review of power quality mixed disturbances identification)[J]. 电力系统保护与控制(Power System Protection and Control),2013,41(13):146-153.

[4] R B Godoy, J O P Pinto, L Galotto. Multiple signal processing techniques based power quality disturbance detection, classification, and diagnostic software[A]. 9th International Conference on Electrical Power Quality and Utilisation [C]. 2007. 1-6.

[5] 姚建刚,郭知非,陈锦攀(Yao Jiangang, Guo Zhifei, Chen Jinpan). 基于小波和BP神经网络的电能扰动分类新方法(A New approach to recognize power quality disturbances based on wavelet transform and BP neural network)[J]. 电网技术(Power System Technology),2012,36(5):139-144.

[6] Milan Biswal, P K Dash. Detection and characterization of multiple power quality disturbances with a fast S-transform and decision tree based classifier[J]. Digital Signal Processing, 2013, 23(4): 1071-1083.

[7] 黄南天,徐殿国,刘晓胜(Huang Nantian, Xu Dianguo,Liu Xiaosheng). 基于S变换与SVM的电能质量复合扰动识别(Identification of power quality complex disturbances based on S-transform and SVM)[J]. 电工技术学报(Transactions of China Electrotechnical Society),2011,26(10):23-30.

[8] D De Yong, S Bhowmik, F Magnago. An effective power quality classifier using wavelet transform and support vector machines[J]. Expert Systems with Applications, 2015, 42(15-16): 6075-6081.

[9] 张俊才,张静(Zhang Juncai, Zhang Jing). 使用粒子群算法进行特征选择及对支持向量机参数的优化(Use PSO to perform feature selection and parameter optimization of SVM)[J]. 微电子学与计算机(Microelectronics & Computer),2012,29(7):138-141.

[10] 阎晓娜,赵犁丰(Yan Xiaona, Zhao Lifeng). 基于支持向量机的改进高斯核函数聚类算法研究(Clustering algorithm of improved Gauss kernel function based on SVM)[J]. 现代电子技术(Modern Electronics Technique),2011,34(13):67-73.

[11] Gang Liu, Fanguang Li, Guanglei Wen, et al. Classification of power quality disturbances based on independent component analysis and support vector machine[A]. 2013 International Conference on Wavelet Analysis and Pattern Recognition[C]. Tianjin, China, 2013. 115-123.

[12] 韩刚,张建文,褚鑫,等(Han Gang, Zhang Jianwen, Chu Xin, et al.). 多特征组合及优化SVM的电能质量扰动识别(Power quality disturbance classification based on multi-features combination and optimizing parameters of SVM)[J]. 电力系统及其自动化学报(Proceedings of the CSU-EPSA),2015,27(8):71-76, 81.

[13] 陈华丰,张葛祥(Chen Huafeng, Zhang Gexiang). 基于决策树和支持向量机的电能质量扰动识别(Power quality disturbances identification using decision tree and support vector machine)[J]. 电网技术(Power System Technology),2013,37(5):1272-1278.

[14] 欧阳森,王建华,耿英三,等(Ouyang Sen, Wang Jianhua, Geng Yingsan, et al.).基于小波和神经网络的电能质量辨识方法(Power quality classification based on wavelet transform and neural network)[J].电工电能新技术(Advanced Technology of Electrical Engineering and Energy), 2003,22(3):32-36.

Classification of multiple power quality disturbances based on improved SVM

ZHAO Li-quan, LONG Yan

(College of Information Engineering, Northeast Dianli University, Jilin 132012, China)

In order to solve the problem of mixed disturbances classification, support vector machine is used to classify power quality disturbances in this paper, and an improved support vector machine algorithm is proposed to improve the accuracy of the whole classification. Considering that the aggregation degree of the eigenvector in the central position of the kernel affects the number of support vectors, a radial width factor and an amplitude adjustment factor are introduced to the kernel function to solve the problem of traditional kernel functions. The proposed method can also decrease the number of support vectors and reduces the computational complexity. The improved algorithm is applied to the classification of the multiple power quality disturbances to prove that the proposed method is feasible and has high classification accuracy. From the results of the simulation experiment, we can see that the proposed method can classify seven kinds of single power quality disturbance and five kinds of multiple power quality disturbances. Compared with the original algorithm, the classification accuracy is improved.

multiple power quality disturbances; support vector machine; Gauss kernel function; classification accuracy

2015-12-18

国家自然科学基金项目(61271115)、 吉林省教育厅科研项目(2015235)

赵立权(1982-), 男, 黑龙江籍, 副教授, 博士, 研究方向为电力系统分析和盲信号处理; 龙 艳(1990-), 女, 山东籍, 硕士研究生, 研究方向为电能质量复合扰动识别。

TN911.7

A

1003-3076(2016)10-0063-06

猜你喜欢
高斯扰动电能
Bernoulli泛函上典则酉对合的扰动
一类四次扰动Liénard系统的极限环分支
带扰动块的细长旋成体背部绕流数值模拟
苹果皮可以产生电能
电能的生产和运输
(h)性质及其扰动
数学王子高斯
天才数学家——高斯
海风吹来的电能
澎湃电能 助力“四大攻坚”