何 柳,张 梅
(安徽理工大学 电气与信息工程学院,安徽 淮南 232001)
电力变压器是电力系统重要的组成部分,若变压器发生故障,将给电力系统造成巨大经济损失,所以准确预测变压器故障是至关重要的[1]。油中溶解气分析(dissolved gas analysis, DGA)是目前常用的故障诊断方法之一,可以通过分析这些气体的情况来判断电力变压器的情况[2]。
目前,大批算法应用在电力变压器故障诊断方面,常用的算法包括极限学习机(Extreme Learning Machines, ELM)、随机森林(Random forest, RF)、贝叶斯(Bayesian Neural Networks,BNN)和神经网络BP等,有优点也有一些缺点[3-7]。何宁辉等人先建立核极限学习机模型,再优化混合核函数的参数,提高ELM的学习能力和泛化能力,以提高诊断精度,但ELM学习速度缓慢,并且易陷入局部最小值[8]。徐新等人利用蝗虫优化对BP神经网络的某些参数进行优化,提升它的速度和搜索能力,但它的网络性能较差,学习率不稳定[9]。安国庆等人先提出随机森林的特征优选,然后结合鲸鱼算法优化支持向量机[10]的故障诊断模型。谢国民等人构建了改进SSA优化MDS-SVM的变压器故障诊断方法[11]。这两篇通过对比实验体现出优化后SVM(support vector machine),故障诊断模型较好,可以很好地应用在变压器故障诊断方面。
支持向量机(SVM)是一种机器学习算法,可解决分类或者回归难题。SVM模型有两个非常重要的参数c与g,惩罚参数c和核函数参数g的选择与模型的分类效果密切相关,所以需要选择合适的优化参数是非常的重要。
灰狼优化算法(Grey Wolf Optimizer,GWO)是灰狼算法是根据灰狼群体的捕猎行动而提出的优化算法,其算法流程和步骤非常简单,数学模型也非常的优美,能够在局部寻优与全局搜索之间实现平衡。改进的灰狼算法(Differential evolution Grey Wolf Optimizer,DEGWO)在原本GEO算法基础上增加了差分进化,提高了鲁棒性和全局寻优能力,在电力变压器故障诊断方面,提升了求解精度和收敛速度方面。
本文提出了一种基于DEGWO-SVM的电力变压器故障诊断模型,首先对DGA数据进行特征提取、归一化等处理,归一化处理使其具有相同的度量尺度;然后使用DEGWO算法对SVM模型进行参数寻优,再将处理好的数据输入SVM模型中进行训练,同时得到最优模型,最后用得到的模型进行电力变压器故障诊断,输出故障诊断模型[12]。
SVM模型的核心思想是最大化超平面的间隔,因此建立相应的目标函数与约束条件。
假设有m个样本训练集{xi,yi},xi和yi分别为样本和输出类型,设最优超平面表达式如式(1)所示。
wφ(x)+b=0
(1)
式(1)中,w为权值系数,b为偏值系数。
要求超平面对应于公式满足条件如式(2)所示。
yi[wφ(x)+b]≥1yi∈[-1,1]
(2)
超平面的目标函数和约束条件如式(3)所示。
(3)
式(3)中,C为惩罚因子;εi和ε为松弛变量。
为约束最优化问题的解,引入拉格朗日函数,使之转化成对偶问题[13],α为拉格朗日乘子,表达式如式(4)所示。
(4)
最优超平面函数表达式如式(5)所示。
(5)
式(5)中,K(xi,xj)为核函数。
本文中选径向基核函数RBF,即表达式如式(6)所示。
(6)
式(6)中,∂为径向基函数参数。
灰狼算法的提出是受灰狼在大自然捕食活动的启发的一种优化算法[13]。该种群一般分为四个等级。最高层是第一等级,主要是在狼群中负责决策地位;第二等级主要是负责协助第一等级进行决策;第三等级听从第一等级和第二等级的决策命令,主要是负责侦查、放哨等事务;金字塔底层是第四等级,主要负责种群内部关系的平衡[14]。
灰狼算法主要是以下步骤:
(1)跟踪、追逐和接近猎物;
(2)追捕、包围和骚扰猎物,直到它停止移动;
(3)攻击猎物。
差分进化算法(DE)具有寻优能力强和收敛速度快的优点,DE算法的全局优化搜索能力经常被用来提高算法的优化能力,该算法分为三步进行操作,分别是变异、交叉和选择。
1.3.1 变异
变异操作是DE算法中的核心步骤,对于种群中每个个体,差分进化算法的变异向量为V,表达式如式(7)所示,差分进化算法的变异向量按照下面的方式产生。
Vi(t+1)=Xa(t)+F[Xb(t)-Xc(t)]
(7)
式(7)中,a、b和c为随机数,F为缩放数,t为当前迭代次数。
1.3.2 交叉
交叉操作是为了增强种群多样性,表达式如式(8)所示。
(8)
式(8)中,rand(j)∈[0,1]为第j维分量对应的随机数,j为0,1,…,n,k为随机在[0,n]中选择的索引,CR为交叉算子,取值为[0,1]。
1.3.3 选择
选择操作会选择贪婪操作,是为了判断Xi(t+1)是否是下一代的成员,所以用实验向量和目标向量对比,f为构造的适应函数,表达式如式(9)所示。选择更加优秀的个体进行最新种群。
(9)
融合差分进化算法改进灰狼搜索算法流程如下:
(1)将DGA样本数据用KPCA特征提取和归一化等处理,并且划分为测试集和训练集;
(2)初始化灰狼种群以及各种参数;
(3)计算灰狼种群的适应度;
(4)更新每个狼群位置;
(5)进行差分进化操作,结束后选择优秀的灰狼个体进行后续操作[15];
(6)更新灰狼算法参数;
(7)判断是否达到迭代要求,若是就输出最优c和g参数,否将返回初始化步骤;
(8)将得到的数据输入优化好的SVM模型中测试和训练;
(9)输出故障诊断结果。
为了实现更高精度的变压器故障诊断,以SVM作为基础分类模型,利用DEGWO算法优化SVM模型。如图1所示,文中构建DEGWO-SVM变压器故障诊断模型。
图1 基于DEGWO-SVM的电力变压器故障模型图
基于DEGWO-SVM的电力变压器故障诊断模型主要由数据预处理、DEGWO优化和故障诊断三个部分组成。数据预处理首先利用KPCA将数据映射到高维空间,再进行归一化处理,并将其进行序列划分;优化部分是利用DEGWO算法对SVM模型的参数c和g进行寻优,得到最优参数[17];故障诊断部分是利用构建出的最优模型对测试数据进行故障诊断,且文中准备多组对比实验来论证所提方法的优越性。
数据由国家电网公司某电网提供,选取H2、CH4、C2H6、C2H4、C2H2五种属性进行操作,图2是DGA数据的样本,训练集样本和测试集样本的比例分别为8:2[17],将低温过热、中温过热、高温过热、局部放电、低能放电、高能放电和正常运行七种故障类型作为电力变压器故障诊断的输出特征[18]。
若使用原始数据集里所有特征数据进行故障分类,工作数据量大,势必会影响模型的运行速度,且分类精度低,检测效果不理想。因此在故障模型训练前,需对原始样本进行预处理操作。
图2 DGA数据样本图
由于DGA数据存在冗余特征,一些无关变量会影响实验的效果,本文采取非线性主元分析法(kernel principal component analysis,KPCA)来进行数据降维,从而提高模型的收敛速度及诊断精度。
KPCA的核心思想是将数据投射到更高维的空间,然后在高维空间进行数据处理。如图3所示,当数据维度是四维的时候,它的贡献度已经高于96%,所以将数据维度降至四维,从而可以有效除去冗余特征。
图3 KPCA特征提取累积贡献度图
本文采用区间值化法对数据进行归一化处理,使特征具有相同的度量尺度,数据按照一定比例进行缩放操作,表达式如式(10)所示。
(10)
式(10)中,X是归一化处理之前的数据,Xi是归一化处理之后的数据,maxX是样本中最大的值,minX为样本中最小的值。如图4所示,是进行归一化后的数据图。
图4 归一化后的数据图
本文将样本数据分为训练样本和测试样本,按照8:2的比例,然后利用训练样本对优化后的模型进行训练,然后再将训练好的模型对测试集进行故障诊断分析,得到的基于DEGWO-SVM的变压器故障诊断结果,如图5所示。
图5 基于DEGWO-SVM故障诊断结果图
由图5可知,基于DEGWO-SVM模型的故障诊断准确率为93.3333%,具有较好的变压器故障分类效果,诊断效果优良,在电力变压器故障诊断上具有一定的现实意义[19]。
为了验证本文所提出的变压器故障诊断模型的优越性,文中进行多项实验。
实验一:验证SVM模型故障诊断优越性
分别采用充电桩故障诊断常用的分类模型:极限学习机(Extreme learning machine, ELM)和径向基函数SVM主流分类器对数据进行诊断。对比实验结果,验证模型的优越性。
实验二:验证寻优DEGWO算法优越性
针对SVM模型,分别采用灰狼算法(GWO)、粒子群算法(Particle Swarm Optimization, PSO)、蝙蝠算法(Bat Algorithm, BA)、DEGWO算法进行优化,验证DEGWO优化算法的优越性。
3.5.1 多模型诊断结果对比
本文中先使用KPCA算法对样本数据进行预处理操作,再将处理过的数据作为输入量输入分类模型,这里选取用ELM模型和SVM模型进行训练集和测试集结果对比,对比效果如图6和图7所示。
(a)训练集样本编号图
(a)训练集样本编号图
由图6和图7可知,SVM模型比ELM模型诊断效果好,准确率可高达88.8889%,SVM性能好一点,所以本文中选用SVM分类模型进行操作。
3.5.2 参数寻优
本文中把DEGWO算法和BA算法、PSO算法、GWO优化算法进行比较。
为了验证DEGWO-SVM算法的优越性,设置算法的种群数量为30,迭代次数为100。把数据样本的训练集5折交叉验证的方式,即将数据样本随机分为五份,其中四份为训练样本,一份为验证样本,将训练完的SVM模型对验证样本进行故障诊断,以验证样本的分类结果准确率为适应度函数,如图8所示,比较各优化算法的适应度函数收敛情况。
图8 适应度曲线图
DEGWO算法的适应度最高,寻优效果最好;其次是GWO算法,PSO算法寻优效果最差,收敛速度最慢,即搜索能力较弱。说明DEGWO算法比其他三种寻优算法效果更好,具有更好的全局搜索能力。
3.5.3 各算法寻优对比
为了验证DEGWO-SVM算法的优越性,采用蝙蝠算法(BA)、GWO、PSO与优化过的灰狼算法作对比,用以上算法做故障诊断模型,各优化算法模型的准确率如表1所示。
表1 各算法对比准确率表
本文中使用的DEGWO-SVM的预测准确率93.3333%比GWO-SVM的预测准确率88.8889%、BA-SVM的预测准确率84.4444%和PSO-SVM的预测准确率77.778%都高,效果最好,所以本文中所使用的DEGWO-SVM方法效果最佳。
由于传统电力变压器故障诊断精度低对电力系统造成巨大损失,本文提出一种基于DEGWO-SVM模型的故障诊断方法,对该模型进行训练和测试,结论如下。
(1)在对比ELM分类模型和SVM分类模型中,SVM模型的准确率更高,效果更好,准确率可高达88.8889%。
(2)在优化SVM模型时,DEGWO、GWO、BA和PSO算法的准确率对比,DEGWO算法效果最好,准确率到达93.3333%。
综上所述,本文提出的电力变压器故障诊断方法在准确率有明显优势,具有一定的应用前景和市场。