基于改进北方苍鹰算法优化混合核极限学习机的变压器故障诊断方法

2023-09-09 09:09:54王士彬李多赵娜谢文龙黄伟季鸿宇
湖南电力 2023年4期
关键词:苍鹰故障诊断准确率

王士彬, 李多, 赵娜, 谢文龙, 黄伟, 季鸿宇

(1. 国网重庆市电力公司市南供电分公司, 重庆 401336;2. 重庆理工大学电气与电子工程学院, 重庆 400054)

0 引言

油浸式电力变压器作为输变电系统中的核心设备之一[1], 发生故障时会导致电网正常供电受影响, 及时发现变压器潜在故障并准确识别故障类型对确保电网稳定可靠供电具有重要意义。 目前, 油中溶解气体分析(dissolved gas analysis, DGA) 技术已被广泛应用于工程实践中[2], 特征气体法将油中溶解气体H2、 CH4、 C2H4、 C2H2、 C2H6等作为特征气体, 通过分析特征气体含量识别故障类型, 国内外学者基于DGA 数据将特征气体比值作为特征量提出Dornenburg 比值法[3]、 IEC 三比值法[4]、 Rogers 四比值法等诊断方法。 由于油中溶解气体含量与变压器故障类型之间复杂的映射关系,特征气体法和比值法无法精确识别变压器故障类型, 已逐渐成为一种辅助方式。

近年来, 将智能算法与DGA 技术相结合已成为提升变压器故障诊断准确率和可靠性的重要方法, 例如神经网络[5-6]、 支持向量机[7-8]、 模糊理论[9]等。 上述方法有效提升了诊断准确率, 但由于算法本身的局限性仍存在不足: 神经网络所需训练样本过大, 收敛速度过慢, 效率较低; 支持向量机分类性能受核参数和惩罚因子的值影响; 模糊理论对于样本数据完整性要求较高, 且存在学习能力不足的问题。 核极限学习机 (kernel extreme learning machine, KELM)[10]在极限学习机(extreme learning machine, ELM) 的基础上引入核函数思想, 有效解决了ELM 因随机生成初始权值和阈值而导致分类效果差的问题, 但单一核函数难以同时保证学习精度和泛化性。

针对上述问题, 提出一种基于改进北方苍鹰算法(improved northern goshawk optimization algorithm,INGO) 优化HKELM 的变压器故障诊断方法。首先利用ReliefF 算法进行特征优选, 然后引入Logistic-tent 混沌映射、 柯西变异和非线性递增权重改进北方苍鹰优化算法, 提高北方苍鹰算法(northern goshawk optimization, NGO) 的寻优能力和收敛精度, 同时将多种核函数加权构成HKELM;再使用改进后的INGO 算法对HKELM 模型参数进行优化; 最后与不同诊断模型的诊断效果进行对比, 验证所提方法的有效性和可靠性。

1 北方苍鹰优化算法及改进

1.1 北方苍鹰优化算法

北方苍鹰优化算法 ( northern goshawk optimization, NGO) 是由Mohammad Dehghani 等人于2021 年提出的一种新型群智能优化算法[11]。 该算法模拟北方苍鹰的狩猎行为, 结构简单、 性能优良。 北方苍鹰的捕猎过程可分为两个阶段: 猎物识别阶段、 追击和逃逸阶段。

1.1.1 猎物识别阶段

北方苍鹰在此阶段会随机选择一个猎物并攻击, 数学表达式如下:

式中,Pi表示第i只北方苍鹰所选猎物的位置;FPi是目标函数值;Fi为第i个解的目标函数值;k为[1,N] 的自然数;Xi,new,P1表示第i只北方苍鹰在此阶段的新状态;xi,j,new,P1表示第i只北方苍鹰在j维的新状态;Fi,new,P1是其对应的目标函数值;r为[0, 1] 的随机数;I的值为1 或2。

1.1.2 追击和逃逸阶段

在对猎物发起攻击后, 猎物会试图逃跑, 北方苍鹰会对猎物发起追击, 此阶段数学表达式如下:

式中,R表示狩猎半径;t为当前迭代次数;T为最大迭代次数;Xi,new,P2是在第二阶段第i只北方苍鹰的新状态;xi,j,new,P2为此阶段第i只北方苍鹰在第j维的新状态;Fi,new,P2为对应的目标函数值。

1.2 北方苍鹰优化算法的改进

标准的NGO 算法虽具有良好的稳定性及较高的收敛精度, 但同大多数传统群智能算法一样, 种群初始化仍采用随机分布的方式, 从而导致初始解分布不均匀。 其次, 在标准NGO 算法的第二阶段,北方苍鹰追捕猎物的速度非常快, 会导致算法搜索速度加快, 易陷入局部最优解的情况。

为进一步提升NGO 算法的性能, 从以下三个方面对NGO 算法进行改进: 引入Logistic-tent 混沌映射初始化种群, 提升求解效率; 引入柯西变异策略对最优苍鹰个体的位置进行扰动, 避免算法陷入局部最优; 引入非线性递增权重, 平衡全局搜索和局部开发的能力。 改进后的INGO 算法流程如图1所示。

图1 INGO 算法流程

1.2.1 Logistic-tent 混沌映射初始化种群

初始种群直接影响算法的收敛速度和寻优效果, 在标准NGO 算法初始化时, 北方苍鹰初始位置分布不均, 造成部分初始解局部聚集, 因此引入Logistic-tent 混沌映射初始化种群, 使初始种群在解空间中分布更加均匀, 提升算法的寻优速度。 其表达式如下:

式中,γ为控制参数, 取值范围 (0, 4) ;Xn∈[0, 1] ;n为迭代次数; modl 表示对该式进行取模运算。

1.2.2 柯西变异策略

标准NGO 算法在寻优时所有苍鹰个体均向最优个体聚集, 在算法后期, 种群多样性会随之降低, 导致算法易陷入局部最优的情况。 为降低局部最优对算法寻优能力的影响, 引入柯西变异策略对当前最优个体进行扰动, 以确保算法能顺利跳出局部极值区。 柯西变异源自于柯西分布, 柯西分布函数表达式如下:

将柯西变异算子引入NGO 算法中, 充分利用其扰动能力调整最优苍鹰个体的目标函数值, 表达式如下:

式中,Cauchy(0, 1) 为标准柯西分布函数;Xbest表示最优苍鹰个体的目标函数值。

1.2.3 引入非线性递增权重

为降低NGO 算法迭代后期最优个体对种群中其他个体的吸引力[12], 引入一种非线性递增权重β, 如式(10) 所示。 在迭代初期, 较小的β能提升算法的全局搜索能力。 而在迭代后期, 较大的β能加快算法的收敛速度。 新的位置更新公式如式(11) 所示:

式中,T为最大迭代次数。

1.3 INGO 性能测试

为验证INGO 算法的有效性, 选取Schwefel 函数和Rastrigin 函数作为测试函数进行性能测试, 并与粒子群优化算法 (particle swarm optimization,PSO)、 灰狼优化算法 (grey wolf optimization,GWO)、 鲸鱼优化算法 ( whale optimization algorithm, WOA) 和标准NGO 算法进行对比。Schwefel 函数为单峰值函数, 有唯一最小值0, 但存在很多局部极小值, 通常用来测试算法跳出局部最优的能力, 表达式为:

Rastrigin 函数为多峰值函数, 同样具有很多局部极小值, 有唯一最小值0, 可用来测试算法的全局开发能力, 表达式如式(13) 所示:

对这两个测试函数进行寻优测试, 最大迭代次数Tmax=1 000, 维数d=30, 测试结果如图2、 图3和表1 所示。

表1 五种优化算法寻优结果比较

图2 f1 (x ) 寻优过程

图3 f2 (x ) 寻优过程

由图2、 图3 和表1 可知, 对于测试函数f1(x) , 改进后的INGO 算法迭代74 次找到最优值0, 其余4 种算法均未达到最优值; 对于测试函数f2(x) , INGO 算法仅用4 次迭代寻找到最优值0,明显快于其余4 种算法。 以上结果表明改进后的INGO 算法相对于其他4 种算法在收敛速度、 收敛精度和寻优能力上表现最佳, 验证了改进策略的有效性。

2 混合核极限学习机

2.1 极限学习机

极限学习机(extreme learning machine, ELM)以单隐层前向神经网络为基础改进而来, 结构相较于传统神经网络更加简易, 有效地提升了算法性能[13]。 ELM 神经网络结构如图4 所示。

图4 ELM 神经网络结构

假设有n个训练样本(xi,yi), 其中xi为输入,yi为输出,i=1, 2, 3, …,n。 对于一个隐含层节点数为K, 激活函数为g(x) 的ELM 神经网络, 其矩阵表述为:

式中,H为ELM 隐含层输出矩阵;T为训练样本真实值所构成的矩阵;β为隐含层节点与输出层之间的权值矩阵;ωi为第i个隐含层节点与输入层节点之间的权值;bi为第i个隐含层节点的阈值。

通过求解式(13) 的最小范数最小二乘解,可得到最优权值β*。 最优权值求解公式为:

式中,H+为矩阵H的Moore-Penrose 广义逆变换。

2.2 混合核极限学习机

为进一步提升ELM 的学习能力和泛化性,Huang 等人将核函数思想引入ELM, 构造出一种新的核极限学习机(KELM)。 核函数由于具有良好的非线性映射能力, 使得KELM 性能更加稳定且泛化能力更加出色[14]。 基于Mercer's 条件定义可得:

式中, 由核函数矩阵ΩELM替代ELM 中的随机矩阵HHT;h(x) 为ELM 神经网络隐含层节点输出函数;K(xi,xj) 为核函数, 合适的核函数对于KELM 的性能有着极大的提升, 常用的核函数有径向基(radial basis function, RBF) 核函数、 多项式核(polynomial, Poly) 函数和线性核函数等。 RBF 作为典型的局部型核函数具有较强的学习能力, 但泛化能力较弱; 多项式核函数为全局型核函数, 学习能力较弱但泛化能力强[15]。 为进一步提升KELM的学习能力和泛化性, 将RBF 和Poly 核函数加权组合成混合核函数[16], 表达式为:

式中,σ为RBF 核函数的宽度参数;c和d为Poly核函数的核参数;μ为两个核函数间的权重系数。

将单位矩阵E和正则化系数C加入ELM 神经网络的随机矩阵HHT的主对角线元素上, 此时ELM 神经网络输出权值β*计算公式为:

基于式 (17)、 (18) 可求得HKELM 的输出为:

由于HKELM 模型中参数较多, 为避免人工设置初始参数误差大, 利用INGO 对HKELM 模型的正则化系数C、 混合核函数参数σ、c、d和μ进行优化。

3 基于INGO 优化HKELM 的变压器故障诊断模型

为提高HKELM 的分类性能, 利用INGO 算法对HKELM 模型的初始参数进行寻优, 以得到更加准确可靠的变压器故障诊断结果。 INGO-HKELM变压器故障诊断模型流程如图5 所示。

图5 基于INGO-HKELM 的变压器故障诊断流程

该流程主要分为以下4 个步骤:

1) 收集以H2、 CH4、 C2H4、 C2H2、 C2H6体积分数作为特征量的变压器故障样本数据集, 根据以上气体之间的相对比值构建候选特征集, 对样本数据进行归一化处理, 划分测试集和训练集。

2) 利用ReliefF 算法计算各候选特征的权重值并排序, 选择出最优输入特征集。

3) 利用改进后的INGO 算法对HKELM 模型的初始参数进行优化。

4) 将步骤2) 中所选特征作为INGO-HKELM模型的输入进行故障诊断。

4 变压器故障诊断实例分析

按照DL/T 722—2014 《变压器油中溶解气体分析和判断导则》, 将变压器运行状态分为低温过热、 中温过热、 高温过热、 局部放电、 低能放电、高能放电和正常这7 种类型, 类别编号为1—7。文中试验所用数据来源于文献[17] 和[18], 共计248 组变压器DGA 数据, 按照7 ∶3 的比例划分为训练集和测试集。 变压器运行状态编号及样本分布见表2。

表2 运行状态编号及样本分布

4.1 输入特征选取

目前, 大部分变压器故障诊断方法都是采用H2、 CH4、 C2H4、 C2H2、 C2H6等主要特征气体或部分气体之间的相对比值作为输入特征量。 由于变压器故障类型与特征气体浓度之间映射关系极其复杂, 为进一步挖掘故障表征与故障类型之间的联系, 本文以上述5 种气体为基础, 参照文献[19]、 [20] 构建变压故障特征集, 见表3, 其中C1 =CH4+C2H4+C2H2+C2H6, C2 =CH4+C2H4+C2H2, ALL=H2+CH4+C2H4+C2H2+C2H6。

表3 变压器故障候选特征及编号

合理的输入特征能极大地提升诊断准确率, 为获取包含信息丰富、 冗余度小和维度低的输入特征集, 选用ReliefF 算法进行输入特征子集的选择。ReliefF 是一种快速高效的过滤式特征选择算法,通过计算每个特征的权重表示特征对于分类的作用, 如图6 所示, 权重值越大, 对于分类作用越大。

图6 特征权重柱状图

将权重值由大到小排序并选取前m个最大特征作为输入特征,m值与分类正确率的关系如图7所示。 由图7 可知, 当m为7 时(输入特征编号为11、 17、 10、 8、 19、 13、 12), 故障诊断率最高为86.34%, 故选取前7 维特征作为输入特征。

图7 不同m 取值的故障诊断模型正确率对比图

4.2 INGO-HKELM 故障诊断模型性能评价

求取INGO-HKELM 模型对测试集诊断结果的准确率, 图8 为诊断结果的混淆矩阵, 表4 给出了INGO-HKELM 故障诊断模型的评价指标。 由图8和表4 可知, 所提INGO-HKELM 模型对变压器7种运行状态的查全率和查准率均在80%以上; 经计算, 故障诊断准确率为93.2%, 表明所提模型具有良好的诊断性能。

表4 INGO-HKELM 模型评价指标%

图8 INGO-KHELM 故障诊断结果

4.3 不同故障诊断模型性能对比

将经过ReliefF 筛选后的特征作为输入特征,以分类准确率为目标函数, 利用INGO、 NGO 和PSO 算法对HKELM 的初始参数进行优化, 得到最优参数。 此外, 为验证INGO-HKELM 故障诊断模型的优越性, 选取GWO-KELM、 SMA-SVM、PSO-DELM 三种优化型诊断模型进行对比, 上述模型诊断结果见表5。 上述所有模型迭代次数均为50 次, 初始种群为30。

表5 不同诊断模型故障诊断结果对比

由表5 可知, 文中所提INGO 优化HKELM 模型相较于PSO 和NGO 优化HKELM 模型具有更高的诊断准确率和更快的收敛速度; 与GWO -KELM、 SMA-SVM、 PSO-DELM 三种优化型诊断模型相比, 文中所提出的INGO-HKELM 模型同样具有更高的诊断准确率和更快的收敛速度, 表明所提出的INGO-HKELM 变压器故障诊断模型收敛速度快、 诊断精度高, 具有一定的优势。

为说明文中所提变压器故障诊断模型的优越性, 与基于DGA 的IEC 三比值法进行诊断结果对比, 对同一测试集进行故障诊断, 诊断结果见表6。 由本文所提方法的故障诊断正确率为93.2%,IEC 三比值法诊断正确率为70%, 但IEC 三比值法对于高温过热状态的识别优于文中所提方法, 其余运行状态的识别文中所提方法均优于IEC 三比值法。 综合来看, 文中所提出的变压器故障诊断模型相较于IEC 三比值法具有更好的诊断性能。

表6 不同方法诊断准确率对比%

4.4 实例分析

对文献[21] 所提供实例进行分析, 某变电站500 kV 主变压器发生故障, 油色谱数据见表7。

表7 某500 kV 主变油色谱数据μL/L

利用文中所提出的INGO-HKELM 变压器故障诊断模型对表7 数据进行故障识别, 得出该主变压器发生高温过热故障的结论, 与实际故障相符, 验证了INGO-HKELM 模型的准确性。

5 结论

本文提出基于INGO-HKELM 的变压器故障诊断方法, 通过对比分析, 得出如下结论:

1) 在标准北方苍鹰算法的基础上引入混沌映射、 柯西变异策略和非线性特征权重三种策略对其进行改进, 结果表明, 改进策略有效提升了算法的收敛速度和精度, 证明改进方法的有效性。

2) 利用ReliefF 算法对变压器故障数据进行特征优选, 去除了冗余信息。 使用改进后的北方苍鹰算法优化HKELM 的参数, 提高了HKELM 的诊断准确率和泛化能力。

3) 通过变压器实际故障数据验证表明, 文中所提出的INGO-HKELM 模型相较于其他故障诊断模型具有更高的诊断准确率和收敛速度。

本文所提出的INGO-HKELM 模型有效提高了故障诊断准确率, 但在输入特征的选择方面仍有改进的空间, 后续可研究CO、 CO2对故障诊断的影响。

猜你喜欢
苍鹰故障诊断准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
高速公路车牌识别标识站准确率验证法
匍匐
红岩(2017年6期)2017-11-28 11:48:23
“苍鹰”和“苍蝇”
因果图定性分析法及其在故障诊断中的应用
小苍鹰游学记
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
机械与电子(2014年1期)2014-02-28 02:07:31