雷家浩, 包永强, 钱玉军, 姜丹琪, 王森林
(南京工程学院 自动化学院, 江苏 南京 211167)
变压器在长期运行过程中,容易受到电、热、机械以及化学因素等影响而导致机械或者绝缘性能出现退化,从而使得其容易出现各类故障事故[1]。变压器作为电力系统中至关重要的部件,其安全稳定是保证电力系统安全稳定运行以及社会生产的重要基础[2]。
油中气体分析(Dissolved Gas Analysis, DGA)是诊断油浸式变压器的有效手段之一[3]。国内外学者依据DGA 的特征提取,提出了众多智能故障诊断方法,例如:支持向量机[3]、神经网络法[4]以及贝叶斯理论等[5]。上述故障诊断方法已在变压器故障诊断中取得了一定的成效。其中文献[3]将神经网络法应用于变压器故障诊断中,该方法主要通过并行处理的方式处理数据,然而其训练样本存在收敛性较慢、网络结构较复杂等缺陷。文献[4]中提出一种基于SVM 的故障诊断方法,该方法能够解决小样本问题,具有泛化能力较好等优势,然而在面对数据不平衡时解决起来较为困难,从而导致故障诊断精度较低。文献[5]中提出一种基于Bayes 的变压器故障诊断方法,该方法具有较好的分类稳定性,并且具有对数据缺失不太敏感等优点;然而该方法各属性之间具有独立特性,且在计算先验概率以及研究分类方法等时,容易出现决策错误等缺陷。
针对上述问题,依据文献[6],本文提出一种基于IGWO-WELM 的故障诊断方法,该方法不仅克服了上述诊断方法在解决不平衡数据故障诊断时的精度较低的缺陷,并进一步修复了WELM 受其隐含偏置层和输入权重的影响,而导致的精度较低的缺陷。
灰狼算法(GWO)是Marjiali 等人受灰狼群合作集体捕杀猎物的行为启发,于2014 年提出的一种随机算法[6-10]。
灰狼群体遵守着社会等级制度,可以分为4 个阶层:第1 层的个体称为α狼,该层级的狼具有较强的领导力,主要对灰狼群体的管理、任务分配等工作进行复合;第2 层的个体称为β狼,该层次的狼服从并协助α狼,并可以对α狼以外的狼群进行支配;第3 层的个体称为δ狼,该层次的狼服从α狼和β狼的同时,对剩余的狼群进行支配;第4 层的个体称为ω狼。狼群整体受α狼的支配,其他狼的任务是围攻。在捕杀过程中,灰狼群体大致可分为三部分:跟踪猎物、包围猎物和攻击猎物。
包围猎物的数学模型为:灰狼在捕食猎物过程中包围猎物。具体包围猎物的数学模型如下所示:
式中:Xα表示α狼的位置;Xβ表示β狼的位置;Xδ表示δ狼的位置。
1.2.1 混沌反向学习算法
GWO 采用随机初始化的方法来确定灰狼的初始位置,保证了初始位置的随机性;然而GWO 算法在求解优化时,随机初始化会导致种群分布不均,导致种群多样性较差。为了提高种群多样性和算法效率,本文首先采用Logistic 混沌算法对种群初始化,然后利用反向学习算法计算反向种群,最后对初始种群和反向学习种群进行合并,并进行排序选择,将最优的N个个体作为初始种群。
假设种群规模为N,采用Logistic 混沌映射在D维欧氏空间中产生混沌序列,Logistic 混沌序列具体表示如下:
1.2.2 自适应惯性权重
在灰狼算法中,惯性权重ω对于局部和全局的收敛是非常重要的。较大的ω值有利于跳出局部最优,但得不到精确的解;较小的ω值有利于局部最优,但不易跳出局部极值点。为了加快算法的全局收敛性,加快收敛速度,本文采用云模型惯性权重对灰狼算法的更新位置进行改进。令x=fmaxf,其中f表示当前灰狼的适应度值,favg为当前所有灰狼的平均适应度值,令drop(x,μ) =drop(favgf,μ),μ具体表达式如下所示:
式中,确定度μ表示为FCG(fmaxf,Ex,En,He),且满足以下三种情况:
1) 当favg≤f,即当前目标函数值优于平均目标函数值 时,w=wmax·FCG(favgf,Ex,En,He),使 得 惯 性 权 重 变小,从而保护灰狼个体;
2) 当favg>f,即当前目标函数值差于平均目标函数值时,ω=ωmax,使惯性权重变大,从而使该灰狼算法个体向较优的搜索区域靠拢。
因此,灰狼更新公式表达式如下:
式中,f(Xi)(i= 1,2,3)分别表示α、β和δ的适应度值。
1.3.1 混沌反向学习算法
为了解决分类样本不平衡问题,文献[11]中提出加权极限学习机(Weighted-Extreme Learning Machine,WELM)。基本ELM 算法的优化目标函数为:
式中β=ti-ξi,i= 1,2,…,N。
WELM 的优化目标函数表示如下:
式中,W表示N×N的对角矩阵。
尽管WELM 算法在不平衡数据应用较广,但是WELM 类似于ELM,隐含偏置层和输入权重的随机选择会导致模型变态的产生,从而导致模型精度不高。为进一步提高WELM 的诊断精度,本文采用1.2 节提出的IGWO 算法对WELM 进行优化。
1.3.2 IGWO-WELM 算法
为了提高WELM 算法故障诊断精度,需要选择合适的适应度函数对WELM 的相关参数进行优化,具体优化表达式[12]如下所示:
式中:L表示分类个数;Fitness 表示适应度函数。
1.3.3 IGWO-WELM 故障诊断模型
IGWO-WELM 算法的具体步骤如下:
1) 设定灰狼算法初始值,最大迭代次数Tmax,以及选取合适的狼群数量N;
2) 按照从大到小的顺序,采用式(17)计算适应度值,选取前3 个适应度值分别代表α、β、δ狼,并对其对应的位置进行标记;
3) 分别采用式(3)和式(4)计算A和C;
4) 依据式(6)分别计算灰狼个体,位置分别定义为X1、X2和X3;
5) 依据式(12)对灰狼位置进行更新;
6) 判断是否达到最大迭代次数,如果满足条件输出,则得到最优输入权重和隐含层偏置,并将其代入WELM 模型中。
本文从IEC TC 10 数据库以及中国行业标准DL/T722—2014 的故障案例[13]中,一共收集了468 条变压器故障数据集,采用文献[13]中的特征量作为本文的特征输入量,将变压器的型号定义为0~6,分为正常、高能放电、中低温过热、局部放电、中温过热、高温过热与低能放电等7 种类型。通过主成分分析去除无效和冗余特征,能够提高模型的收敛速度,具体如图1 所示。
图1 主成分分析结果
为了验证数据对整个模型的影响,分别按照2∶1、3∶1、4∶1 和5∶1 将数据分为训练集和测试集对模型进行训练,其中从正常状态样本随机抽取36 个,其余状态样本数据抽取24 个,构成2∶1 的不平衡数据集,同理分别从正常数据集当中抽取18 个样本,其他状态样本中随机抽取18 个,将剩余的所有样本集组成测试集。每种比例计算50 次,并求取平均值,采用G-mean 和错误率作为指标,计算结果如表1、表2 所示。 数据不平衡比率变化图如图2 所示。
表1 不同算法的G-mean 的分类结果
表2 不同算法将故障样本误识别为正常样本的平均比例
图2 数据不平衡比率变化图
从表1 和图2 中可以看出,IGWO-WELM 算法是所有算法中效果最好的,远好于其他4 种方法,随着不平衡数据的比例逐渐提高,IGWO-WELM 的效果越来越明显,比GWO-WELM、GA-WELM、PSO-WELM 和WELM分别高10.96%、12.92%、1.08%和18.41%。从表2 进一步看出,IGWO-WELM 是所有方法中故障样本误识别为正常样本的平均比例最低的,明显低于其余4 种方法,进一步说明了提出方法的有效性。
本文针对传统变压器故障诊断方法在处理DGA 变压器数据不平衡存在精度不高的问题,提出一种改进的IGWO-WELM 的DGA 变压器故障诊断方法。具体的主要工作和结论如下:
1) 针对GWO 算法收敛性较差、精度不高的问题,提出基于混沌方向学习和云模型惯性权重的GWO算法;
2) 针对WELM 的含偏置层和输入权重的随机选择会导致模型精度不高的问题,提出IGWO-WELM 故障诊断模型;
3) 在DGA 不平衡数据上验证IGWO-WELM 不平衡数据故障诊断方法,结果表明其效果远好于传统的方法。
注:本文通讯作者为雷家浩。