郭 瑜, 童丽娜,倪旭明
(国网金华供电公司,浙江 金华 321000)
近年来,电力系统的安全性及稳定性在行业的关注度逐步提升,在这种背景下,安全可靠的电力通信网应势而生。一般情况下,电力通信网需要挖掘大量有着极高冗余度且支离破碎的信息[1-2],有这些信息作为基础才能进行故障诊断工作,甚至辅助完成网络故障的预测。
现阶段电力通信网所采用的主要方法有以下几种:故障依赖关系[3-4]、贝叶斯网络[5]、模糊逻辑推理[6]、关联规则[7],但是所采用的这些方法基本上都是在原有的经验基础上开展或者依赖于专家丰富的知识储备,往往会浪费大量的资源和时间。就因为如此,找到拥有自学习能力且对先验知识依赖性比较小的方法就显得尤为关键。神经网络很符合以上要求,它具备推理、自学习、记忆等优势,能够高效完成复杂的数据关系推理,因而被广泛应用于电力通信网故障诊断工作[8]。文献[9]建立的是BP神经网络模型,通过对期望及实际输出差值的记录,并进行一定的调整,对各神经元之间的权重进行反向调节,从而完成故障诊断和定位。文献[10]建立的是模糊神经网络故障诊断模型,通过模糊故障报警信息然后再开展神经网络训练的方式开展工作。文献[11]建立的SOM-BP改进模型,经过验证能够有效提升故障诊断的精确性。文献[12]建立的多子域模型,将整体网格划分成细小的子域,然后逐个进行神经网络故障诊断,从而实现最终诊断功能。上述模型都有着比较好的效果,但是传统的神经网络对故障标签数据有着非常大的数量需求,且在网络训练时都是采用的有监督学习方式,而在现实的电力通信网中,想要获取大量的故障标签数据还是有很大的难度,所以,在电力通信网中利用无监督学习方式进行故障诊断是顺势而为、大势所趋[13-16]。
随着人工智能的迅猛发展,深度学习技术实现飞跃式发展,在多个领域得到广泛的应用,并且获得显著的效果。深度学习与上述机器学习算法相比较,能够从数据当中自动提取与组合输入特征,有效规避人工干预造成的主观性;其次,一些学者从数学上证明了其无穷拟合能力的完备性,现阶段已成为各个领域的研究热点[17-18]。目前一些常规的深度学习模拟已经在电力通讯诊断中进行应用,例如堆栈自编码器、长短期记忆网络、卷积神经网络、深度置信网络等,并且取得良好的应用效果。聂晓音等人考虑自编码栈式相关性和稀疏性,提出一种电力通讯网络故障诊断方法;李帅基于卷积神经网络,构建电力通讯故障诊断模型,最终实现故障诊断。虽然已有的研究已经在自建数据集上取得了较高的识别精度,但多数传统深度学习模型主要针对文本语音数据和图像数据进行网络结构设计,较少涉及电力系统测量数据,且上述大部分模型将惩罚权重添加至损失函数当中,虽然使不稳定样本的召回率得到一定程度的改善,但造成稳定样本的查准率降低,并未有效提高模型整体故障诊断的水平[19-20]。
综上所述,基于机器学习算法的自身优势和电力通讯网告警数据的特点,本文提出一种基于改进卷积神经网络的电力通信网故障诊断方法,较好地实现电力通信故障的诊断和定位。
卷积神经网络是机器学习中较为常见的智能算法,具有较强的特征提取能力,广泛应用于视频和音频智能识别领域,其组成结果如图1所示。
图1 卷积神经网络结构图
由图1可知,卷积神经网络主要由卷积层、池化层及全连接层构成。卷积层主要作用是通过不断训练得到损失函数最优的卷积核,进而实现数据特征的自动提取;卷积层内所得到的主要特征被池化层提取,并对其进行时间降维操作。卷积层和池化层不断的堆积叠加从而构成深度网络结构,经过层层抽象得到更高级别的序列特征。
图1中输入模型为:
X=[x1,x2,…,xt,…,xs]T
(1)
式中,X∈Rs×d表示输入参数;d表示特征值的个数;s表示输入参数的长度;Xt为时刻t特征向量的表达式,且维度为d。
卷积层是序列数据通过卷积运算映射形成,其表达式为:
(2)
卷积层中最为有用的序列特征信息通过池化运算进行捕捉,从而形成池化层,其表达式为:
(3)
式中,pool(·)为池化运算,一般情况分为全局最大池化与最大池化,前者可以将最用用的全局时序信息捕获,序列长度缩减至1,如式(4)所示,一般在最后一次出现池化层时运用;后者能够将序列长度减少至原来的一半,如式(5)所示:
global-maxpool(Z)=max(z[:])
(4)
maxpool(z)=max(z[2k-1],z[2k])
(5)
式中,z[:]为取出向量z所包含的所有参数;z[k]表示可取出向量Z第k个参数;z[·]为数组切片。
全连接层的结构和传统神经网络一样,由多层隐含层构。全局时序特征在全连接层得到进一步抽象组合,最终输出:
afc=fr(ap_lastWfc+b)
(6)
式中,Wfc∈Rnfc表示全连接层权值矩阵,其中b表示偏置;nfc表示隐含单元的数量。fr(z)同样为ReLU激活函数。
针对二分类问题,其输出单元的个数为1,通过全连接输出的结果为:
(7)
为了实现参数的更新,本文选用的损失函数为:
τ=L(x,y)=∑iyilog(pi)
(8)
其中:
式中,C表示分类任务的类别数量。
卷积神经网络中激活函数是重要的组成部分之一,由上文介绍可知卷积层与池化层在得到新的特征向量之后,一般情况下会通过一个非线性函数来将输出结果进行映射,从而改善线性操作所带来的表达能力不足现象。
饱和与不饱和非线性激活函数是卷积神经网络两种主要的激活函数类型。Softplus和ReLU激活函数函数是常见的不饱和非线性激活函数,双曲正切函数Tanh和Sigmoid函数是常见的饱和非线性激活函数。在实际应用的过程中,不饱和非线性激活函数呈现出较慢的收敛速度和梯度弥散进而致使网络不收敛的现象。目前ReLU激活函数是卷积神经网络使用最为广泛的激活函数,该函数能够使小于零的数据强制置零,保持大于零的值不变,具有较好的稀疏性,更加符合生物学原理。ReLU函数在实际应用过程中计算简单,可以有效改善卷积神经网络不收敛的现象,并且具有更好的收敛速度和识别效果。Softplus激活函数和ReLU相比不具有稀疏性,是ReLU近似光滑的表示方式。
针对上述对比分析,本文结合ReLU和Softplus两个激活函数的特点,提出一种改进激活函数,使其同时具备光滑性与稀疏性,改进激活函数表达式为:
(9)
改进激活函数的图形如图2所示。由图2可知,激活函数改进之后能够将负数值强制置零,从而使激活函数的稀疏性得到保证;运用Softplus激活函数来对整数部分的数值进行计算,因此改进激活函数在具备稀疏性的同时也具备良好的光滑特性。激活函数改进后卷积神经网络结构如图3所示,其中卷积层与池化层选用ReLU激活函数,全连接层选用改进后的激活函数。
图2 改进激活函数图
图3 改进激活函数卷积神经网络结构图
电力通信网当中的告警信息多数与网络运行状态息息相关,通过对告警信息进行分析,能够找到网络故障的根源。通常情况下告警信息存在缺失、重复、含噪音和时间不同步等问题。因此系统在对告警信息进行故障诊断分析之前必须对其进行进行预处理操作,主要包含数据清洗及及统一、信息时间同步、数据加权编码三部分。
选取和故障诊断相关度较高的告警信息字段,并且去除原始告警数据库中重复的字段。定义告警开始时间、告警的名称、告警的类型、告警的级别和告警源为标准告警格式,对不同专业网管告警信息进行统一化处理。
针对故障时刻所发生的故障信息,采用滑动时间窗口的方法对告警信息时间进行同步,最终形成告警事务表。
2.3.1 告警数据加权
由历史告警和故障数据可以知道不同告警类型和信息对于故障诊断和判定的重要程度是不一样的,故对于所有告警通过告警类型和级别进行加权操作,从而来体现其对故障诊断和判定的影响程度。
本文提出一种基于小波神经网络模型来对告警信息进行加权操作,该模型如图4所示。
图4 小波神经网络结构模型
假设训练样本为P组,输入层和输出层的单元数分别为N、M,则输出为:
(10)
输出值的标误差表达式为:
(11)
通过对模型不断的训练,从而找到合适的位移因子、尺度因子和连接权,使输入层(告警信息)与输出层(告警权值)呈现出更好的对应关系,从而完成对告警信息的加权操作。
为了统一量纲,选取归一化方式对权值进行处理,最终得到各故障所对应的归一化加权值。
2.3.2 告警数据编码
故障点定位和故障类型判断是电力通讯网故障诊断的主要任务,故在实际故障判断过程中各故障状态矩阵所对应的故障标签是二维的,故在上述权值的基础上运用二值化编码的方式对各种告警所对应的告警事务进行编码操作,利用状态故障特征矩阵将电力通讯网络拓扑关系与故障状态之间的关系表征出来。
为了能够有效提取电力通信故障特征,本文运用如图5所示的诊断模型结构。其中Input为输入层;Conv为卷积层;Maxpooling为池化层;FC为全连层,使用改进激活函数(g(x));3Conv·32/ReLU表示卷积核尺寸大小为3,卷积核整体个数为64,激活函数为ReLU函数;Output为输出层sofamax为分类层。整体诊断模型结构自下向上进行,电力通信数据经过预处理后进入输出层,各卷积层后均与池化层相连接,最后经过全连接层输出诊断结果。
图5 故障诊断模型结构图
3.2.1 开发环境搭建
目前Tensorflow、Torch、Caffe和Theano等机器学习框架已经成熟应用于各个领域,并且取得良好的应用效果,运用上述机器学习框架能够快速高效得到卷积神经网络分类结果。本文选用tensorflow1.0框架和pycharm搭建集成开发环境,利用python平台软件来完成基于改进卷积神经网络的电力通信故障诊断。
3.2.2 故障诊断实现流程
在开发环境搭建的基础上,通过图6所示的流程来完成电力通信网络的故障诊断。
图6 基于改进卷积神经网络的电力通信故障诊断图
由图6可知,基于改进卷积神经网络的电力通信故障诊断的主要步骤为:
1)电力通信告警数据采集,并进行标准化、去重和加权编码操作,形成故障状态矩阵集合;
2)将故障矩阵集合进行样本转换处理,形成灰度图片;
3)构建神经网络,对两类标签输入样本进行训练;
4)通过卷积池化提取故障特征,并且将全连接层输出的结果与实际值进行对比,得到两者误差值;
5)判断网络是否收敛,如收敛则进行步骤7),反之进入步骤6);
6)将步骤4)所算的误差值反馈至网络的各层,并修正各层阶段的权值,之后转入步骤5),再次计算网络输出值与真实值的误差,直到模型收敛结束;
7)通过损失函数值对网络是否满足要求进行判定,满足则进入步骤8),反之进入步骤4),对模型参数进行调整修改;
8)故障诊断结果输出。
核心路由器与SDH设备是电力通信网的核心组成部分,本试验仿真在现有资源的基础上搭建电力通信网络故障场景,如图7所示,在Python平台搭建Tensorflow1.0深度学习框架对故障场景采集的数据进行处理和模型训练,从而验证上述故障诊断方法。
图7 电力通信网络测试拓扑图
根据第1节介绍的方法,对告警数据进行数据清洗及及统一、信息时间同步、数据加权编码,从而形成故障状态矩阵。统一的部分告警数据如表1所示。
由表1可以看出,统一告警数据主要包含告警级别、告警名称、告警源、告警事件和告警类别五项,
表1 统一的告警数据部分表
其中告警级别主要分为紧急、重要和次要3个级别,告警数据主要由通讯告警、设备告警和安全告警3种类别。
实际故障判断过程中各故障状态矩阵所对应的故障标签是二维的,由图7可知,本文所搭建的电力通信测试拓扑图中包含12个站点,定义故障站点的标签集合为{A1,A2,…,A12},并对其进行编码,编码结果如表2所示。
本仿真试验选取6中故障类型进行分析研究,其标签集为{C1,C2,…,C6},并对故障类型进行编码,如表3所示。
本文电网通信故障诊断不仅要对故障进行定位还要判定故障的具体类型,故是多标签分类问题。对表1和表2两维标签分别进行独立卷积神经网络训练,训练过程中,学习率设定为0.001,迭代次数设定为30,最小批次大小设定为64,最终得到故障诊断结果。
选用贝叶斯算法、卷积神经网络、改进卷积神经
表2 故障站点编码与标签表
表3 故障类型编码与标签表
网络进行试验仿真模拟,训练过程中贝叶斯算法在迭代17次时达到最大准确率(91.3%),之后保持持平状态;卷积神经网络在迭代22次时达到最大准确率(95.6%)之后保持持平状态;改进卷积神经网络在迭代26次达到最大准确率(99.1%)之后保持持平状态,模拟训练及标准差计算得到诊断准确率和标准差,如表4所示。
表4 不同仿真试验结果
由表4能够看出:在精度方面,改进卷积神经网络最高,平均准确率高达99.1%,贝叶斯算法的平均准确率最低,常规卷积神经网络位于两者之间;在稳定性方面,改进卷积神经网络算法准确率标准差最低,仅为0.915%,稳定性最好,而贝叶斯算法准确率标准差最高,稳定性相对较差,但在仿真过程中改进神经网络算法较其他两种算法迭代次数较高,整体迭代的时间较长。
基于机器学习算法的自身优势和电力通讯网告警数据的特点,本文提出一种基于改进卷积神经网络的电力通信网故障诊断方法,通过研究主要得到以下结论:
1)对卷积神经网络当中的激活函数进行改进,使其同时具备光滑性与稀疏性,提升激活函数的收敛性及收敛速度;
2)提出小波神经网络模型,得到不同告警类型和信息对于故障诊断和判定的重要程度,进一步提升故障诊断的准确率;
3)仿真试验验证表明:改进卷积神经网络具备较高的准确率和稳定性。