何宁辉,丁 培,马飞越,王 玮,伍 弘
(国网宁夏电力有限公司电力科学研究院,宁夏 银川 750011)
变压器是电力系统的重要组成部分,其稳定安全运行关系到整个电力系统的安全运行[1-3]。同时,电力变压器的智能故障诊断是推动智能电网发展的主要环节,因此,变压器智能故障诊断一直备受关注[4-7]。
随着人工智能的发展,一些算法如BP 神经网络(BPNN)和向量机等已经在这一领域得到应用[5-7]。这些方法虽然取得了一定的效果,但也存在一些不足。BPNN 的训练速度太慢,结果都是局部优化的结果,支持向量机核函数的选择困难。此外,虽然支持向量机在具有复杂领域和明显分割边界的情况下,表现十分出色。但是,在海量数据集中,表现不好。
混合核极限学习机是近年提出的一种改进算法。由于不需要隐含层节点的数量,具有泛化能力强、学习速度快、不易陷入局部最优等优点,得到了广泛的应用[8]。
在此基础上,提出了一种优化混合核极值学习机的变压器故障诊断方法。该方法将多项式核函数与径向基核函数相结合,结合灰狼优化算法,构造了混合核极限学习机(Kernel Based Extreme Learning Machine,KELM)模型。研究结果发现,所提出方法的诊断精度,较传统方法具有较大优势。
灰狼优化算法是一种实现参数最优搜索的新型优化算法,模拟了自然界中灰狼的领导和狩猎机制。灰狼种群系统可分为领袖灰狼(α),副领袖灰狼(β),次级灰狼(δ),和普通的灰狼(ω),它们分别对应目标函数的最佳解、第二最佳解、第三最佳解和候选解。
图1 灰狼等级制度
灰狼包围猎物的行为描述主要包含:灰狼与猎物的距离,灰狼位置更新及猎物定位。在狼群中领袖灰狼,副领袖灰狼,次级灰狼,三者最靠近猎物,可以据此来判断猎物方向。狼群内个体跟踪猎物方位的原理如图2 所示[9]。
图2 灰狼更新位置机
上述原理的数学描述主要如下:普通的灰狼(ω)与领袖灰狼(α),副领袖灰狼(β),次级灰狼(δ)的距离与当前位置解计算公式如下所示,
进而可通过式(3)判断普通的灰狼向猎物移动的方向,其中参数和迫使算法探测和开采搜索空间。向量包含0~2 之间的随机数,此变量主要为猎物提供随机权重。随机权重可增加或减小灰狼与猎物的距离。
式中:t表示位置更新次数。
核极限学习机是一种新的单隐层前馈神经网络训练算法,核函数方法是一种使得问题变得线性可分的方法,其原理是通过一个特征映射将低维输入样本空间中的线性不可分数据映射至高维特征空间中[8]。
单隐层前馈神经网络训练算法的数学描述公式如下:
式中:f(x)是神经网络的分类输出,h(x)和H是隐层的特征映射矩阵,ν是连接隐藏层和输出层的权向量。在混合核极限学习机算法中,
式中:I为单位矩阵,与HHT维数相同,P为正则项系数,T为预计输出矩阵的训练样本。
符合Mercer 条件的函数可以作为核函数,其主要可分为以下几类:
(1)高斯核函数
式中:K(x,xi)为核函数,σ为常数。
(2)多项式核函数
式中:m,n为常数。
(3)感知器核函数
式中:ρ,b为常数。
(4)线性核函数
核函数的选择是KELM 学习的一个基本步骤,常用的核函数可以分为全局型和局部型。全局核函数可以在远离训练数据集测试点的地方获得全局信息,泛化能力更好。局部核函数可以有效地提取训练数据集测试点附近的局部信息,因此具有较强的学习能力。为了获得较强的学习能力和泛化能力,本文将全局多项式核与局部径向基核进行了线性结合。
根据式(5)~式(8),以xi=0.4 为测试点,取σ为0.1,0.2,0.3,0.4。径向基核函数的特征曲线如图3 所示,从图1 可以看出径向基核函数对测试点附近小范围的数据影响较大,其影响半径与径向基核函数的半径成反比。表明径向基核函数在提取样本局部特征方面具有良好的性能。
同理,取m=1,n=1 为测试点,d分别取1,2,3,4。多项式核函数的特征曲线如图4 所示,结果表明,当输入样本在较大范围内变化时,多项式核函数对样本仍有较大的影响。因此,多项式核函数具有较好的泛化能力。
图4 多项式核函数曲线
此外,将上述二者核函数结合,则可得到混合核函数,如式(1)所示。
式中:λ分别取为0.2、0.3、0.4、0.5,σ取为0.1,d取值为2。从图5 中可以明显看出,混合核函数对测试点附近和远离测试点的点都有一定的影响,说明混合核函数具有较强的学习能力和较好的泛化能力。
图5 混合核函数曲线
实践和实验证明,混合KELM 的参数设置对分类精度有很大的影响,随着参数的变化,分类会陷入局部最小。因此,采用灰狼优化算法(Grey Wolf Optimizer,GWO)算法对混合KELM 的参数进行优化,从而得到最优的网络结构模型。优化目标如下:
以混合KELM 模型作为适应函数,以其结果的准确性作为适应度。经过GWO 优化的混合KELM的计算流程图如图6 所示。
图6 基于优化算法的混合核极限学习实现步骤
判断是否满足迭代停止条件为适应度值小于等于给定值或迭代次数最大。如果不满足这个条件,返回继续迭代,否则,继续下一步。
最终输出领袖灰狼的位置和参数,此最优参数用于基于优化算法的混合核极限学习机的变压器故障诊断模型。
根据IEC 60599,选择变压器油中的5 种故障特征气体(H2、CH4、C2H6、C2H4、C2H2)作为输入数据。分为无故障(N)、中低温过热(T1)、高温过热(T2)、局部放电(PD)、火花放电(D1)和电弧放电(D2)6 种类型。
所提出的算法首先利用Logistic 混沌映射生成灰狼算法的初始种群,然后利用训练样本进行交叉验证,通过适应度曲线确定算法的最大迭代次数。最后,进入训练样本,通过GWO 优化的混合KELM建立变压器故障诊断模型。
通过团队研究结果以及已发表论文,选取能综合反映变压器故障类型的溶解气体分析(dissolved gas analysis,DGA)样本共372 个。将数据随机分配到两个数据集中,选取300 个样本作为训练数据集,其余72 个样本作为测试数据集。表中显示了一些测试数据集样本。
表1 部分样本数据
选择了径向基核函数和多项式核函数线性结合的混合核函数作为KELM 的核函数。GWO 初始种群的生成:采用Logistic 混沌映射生成GWO 初始种群,使GWO 初始种群中的个体分布均匀,具有较高的随机性。
GWO 算法迭代次数的决定:在计算适应度时选择5 倍交叉验证,将300 个训练样本分为5 组,分别由5 个不同的训练组(240 个样本)和测试组(60 个样本)组成。在每一轮迭代中对这5 组进行培训和测试。
最后,以5 个测试组的平均准确率作为平均适应度。如图7 所示,曲线表示每次迭代中5 组测试样本的最大适应度。在GWO 的初始迭代中,由于模型拟合不很好,训练数据没有得到充分的研究,导致适应度较低。显然,故障诊断样本的适应度逐渐增加,当迭代的数量约为130 后,曲线开始稳定。最后,适应度最大值达到93.60%,此时适应度平均值为90.11%,因此迭代的最大值选为180。
图7 适应性进化曲线
为了验证所提方法的正确性和有效性,利用BPNN、ELM、基于粒子群优化的KELM 和本文提出的优化混合KELM 对60 个试验样本(每组10 个样本)进行了计算。
计算结果如图8(a)(b)(c)(d)所示。其中,纵坐标1,2,3,4,5,6 分别对应无故障(N)、中低温过热(T1)、高温过热(T2)、局部放电(PD)、火花放电(D1)和电弧放电(D2)6 种故障类型。
从图8 可以看出,BPNN 的分类错误数为12,ELM 为5,基于粒子群优化的KELM 分类错误数为2,本文算法的分类都是正确的。
图8 4 种方法的诊断结果
为了进一步通过验证模型的可行性,以及比较3 种诊断模型的性能,采用未参与训练的72 个样本测试的结果数据,验证结果如表2。
表2 验证结果
如表2 所示,笔者进一步得到BPNN、ELM、基于粒子群优化的KELM 和提出的灰狼优化混合KELM 的平均正确率分别为:77.8%,83.3%,87.5%和90.2%。
提出了一种电力变压器故障诊断方法:基于优化极限学习机诊断方法。首先将多项式核函数与径向基核函数结合得到混合核函数,然后利用该混合核函数构造混合KELM。
此外,还提出了一种利用灰狼算法对混合KELM 参数进行优化的方法,以获得更好的性能。最后结合实际数据对6 种变压器故障数据进行了诊断,诊断准确率为90.2%。研究结果表明:应用混合核函数可以提高KELM 的学习能力和泛化能力。采用GWO 算法对混合KELM 参数进行优化,使混合KELM 的网络结构得到优化,最终提高了变压器故障诊断的准确性。