张 艺 , 李 万 银, 付 根
(1.华电金沙江上游水电开发有限公司,四川 成都 610041;2.华电金沙江上游水电开发有限公司苏洼龙分公司,四川 成都 610041)
从上个世纪九十年代初开始发展至今,我国变电站系统一直朝着智能化系统发展方向进行不懈的努力,目前,已经进入全面推广阶段。在传统变电站中,为了实现设备信息之间的互通,往往依靠大量的硬开入连线,这一弊端使变电站的二次回路接线复杂,且往往依靠人工才能实现一定程度的信息交互。目前,智能变电站二次系统数字信号传输方式替代了传统变电站依靠电缆传输的物理信号,实现了智能变电站二次设备的网络化[1]。
智能变电站二次状态监测是实现智能电网稳定运行的基础,传统意义上的智能变电站二次状态监测是现场运维人员依据运维经验进行报文信息的读取与翻译。但是,目前智能变电站二次网络最大程度实现了信息网络化,监测数据在规模、结构、种类方面都大幅增长,数据在平台上的存储和吞吐问题也急需解决。简单地依靠人工判断来实现智能变电站的二次状态监测以及基于告警的故障定位是无法形成完整的二次回路预警和决策系统[2]。
本文对智能变电站的网络架构、监测信息、告警信息的预处理方案进行研究,对基于深度学习的智能变电站二次状态监测及故障定位算法进行仿真验证,并分析总结了深度学习在智能变电站二次状态监测及故障定位的应用前景。
早期的智能化变电站是利用IEC 61850协议将变电站设备模型化[3],智能化程度很低,仅仅实现了间隔层和站控层设备的网络化,过程层设备仍为传统模拟信号设备。早期智能变电站网络结构见图1。
图1 早期智能变电站网络结构
理想的智能变电站会采用智能开关和EVCT等智能设备,构成双网冗余结构的独立过程网络,但是,理想的智能变电站目前无法完全实现,只能通过智能终端与传统的二次开关进行结合链接来填补实际的技术缺陷以达到较高的网络数字化程度。实践中,将一路采样值和跳闸信号(不包括过程层组网)采用“直跳直采”方式直接接收保护装置信号来实现过程层信息共享,以加强测控保护装置的可靠性。目前智能变电站实用网络结构见图2。
图2 目前智能变电站实用网络结构
智能告警辅助分析系统数据来源主要是根据合并单元、保护装置、智能终端等所测控装置采集的信息值[4]。断路器的电流值、保护动作出口信息、智能设备状态异常告警等,这些基本信息大多数包含在遥测、遥信数据中。随着智能变电站技术的不断更新换代,采集信息的辅助设备功能也逐渐完善。因此,大多智能设备都具有自检的功能,对于本设备控制系统内的一些故障异常进行自我反馈与处理。这些措施都极大限度提高了数据信息的准确性。该故障系统总体结构见图3。
图3 故障系统总体结构
建立告警信息的逻辑知识库是该预处理方案的重要环节。经过查阅大量文献后进行整理,列出智能变电站二次系统主要故障类型(表1)。
表1 智能变电站二次系统主要故障类型
经过多方文献查证,以及现场实际运维经验总结分析,将智能变电站故障告警分为两类:
(1)将可根据告警信号直接定位的信息类别归为第一大类,这一类数据信息是在长时间、多经验的生产运维基础上,或是基于智能设备的自检反馈得到单一、典型的可直接溯源定位故障告警信号。比如PT、CT检修不一致,零序电流保护,重合闸压板的停用,保护装置的SV、GOOSE链路中断等。
(2)在智能站运维系统中,考虑到现地生产设备在运行过程中导致故障的根本因素综合多样,故将此类无法直接溯源的信息类别划分为第二大类。此类告警信号主要表现在合并单元、保护装置、智能终端三者之间的信号传输或接收过程中[5],常见的GOOSE总告警,保护装置GOOSE数据异常,合并单元SV采样数据异常,智能终端对时异常、就地控制等[6]。
以典型的220 kV的智能变电站220 kV线路间隔为例来进行说明,其智能变电站单间隔线路结构(图4)中的网络报文分析仪通过交换机以数字信号为载体,实现与合并单元、保护装置、智能终端之间的信息交互。由于通信故障较为特殊复杂,在预处理方案中,我们将前面所分的第二大类告警信息中通信链路故障告警信息建立单独的故障定位系统。
图4 智能变电站单间隔线路结构
基于上述优化思路,对220 kV智能变电站220 kV线路间隔进行验证。把图作为数学的一个分支,以若干给定点及两点之间的连接线所构成的图形,该图形常常用来描述一些事物之间的某种特定的关系,用定点描述事物,用连接线描述相应事物之间具有某种关系[7],根据图之间的联系得到相应的邻接矩阵与关联矩阵。
SCD文件经过报文解析得到IEDname,将此间隔内的所有IED设备进行编号,得数集X:
X={x1,x2…xn}
(1)
SCD文件中对每一个设备的输入端子进行关系搜索,并多次节点访问。因此,是可以溯源到IED设备所包含的信息源头,通过对所有IED设备的所有订阅关系进行集结组合,建立起一个关于IED订阅关系的数据集Q:
(2)
该数据集合中的q(x1,xn)表示:编号为x1的装置与编号为xn的装置之间的订阅关系。若x1装置对xn装置之间产生了订阅关系,那么置q(x1,xn)值为1,反之,q(x1,xn)的值为0。通过以上规则逻辑我们可以得到该装置xn的订阅关系数据集合Qn为:
Qn=[q(xn,x1)q(xn,x2) …q(xn,xn)]
(3)
在继电保护测试过程中出现光纤链路异常的情况时,各个装置的告警信息数据集合用集合P表示:
P=[p1p2…pn]T
(4)
若保护装置xn告警,pn取值为1,反之,pn取值为0。
定义完成相关数据集合后,则IED设备xn出现故障的可能性Fn就可以通过如下的公式进行计算:
Fn=Qn·P
(5)
通过对数据集合pn进行由大到小的排序,就可以得到故障可能性较大的几个IED设备,给出诊断的结果。
循环神经网络本质是通过大量数据学习进而得到记忆能力,RNN循环神经网络结构见图5,是一种节点定向连接成环的网络结构。
图5 RNN循环神经网络结构
按时间序列展开,图5中的右侧每个圆环都可以看作是一个单元,每行的每个单元所做的工作相同,因此,可以折叠成左侧的样子。其中,x(t)为t时刻的训练样本输入,h(t)表示t时刻模型的隐藏状态,由x(t)和h(t-1)共同决定,o(t)表示t时刻模型的输出,L(t)表示t时刻模型的损失函数,y(t)表示t时刻训练样本的真实输出,U,W,V是模型的线性关系参数,由整个RNN网络共享[8-10]。
对于任意一个时刻t,隐藏状态h(t)由x(t)和h(t-1)得到:
h(t)=σ(z(t))=σ(Ux(t)+Wh(t-1)+b)
(6)
其中σ为激活函数,用来完成对信息的过滤,一般为tanh;b为现线性关系的偏倚。
t时刻模型输出o(t)的表达式为:
o(t)=Vh(t)+c
(7)
最终t时刻所预测的输出为:
(8)
RNN网络的参数W,U,V,b,c由反向传播进行更新。根据RNN在数据平台仿真的数据合理性,我们将损失函数取为对数损失函数,softmax函数为输出函数,tanh函数为隐藏层激活函数。
考虑倒时间序列的每个位置都存在损失函数,因此,最终的损失L定义为:
(9)
RNN反向传播算法采用梯度下降法进行迭代,其中V和c的梯度计算相对简单:
(10)
(11)
但是W,U,b的梯度计算较上者就比较复杂,通过RNN模型可以得出,网络在进行反向传播时,某一时间序列位置t的损失不仅与t时刻输出的梯度损失有关还和t+1时刻输出的梯度损失有关,因此,对于W在某一时间序列位置t的梯度损失需要一步步进行计算。
定义某一时间序列位置t的隐藏状态梯度为:
(12)
从δ(t+1)递推到δ(t):
(13)
对于δ(t)而言,由于其为时间序列的最后一个位置,因此:
(14)
此时,W,U,b的梯度计算为:
(15)
(16)
(17)
算法主要分为模型建立、训练模块、故障预测定位模块三大模块。
模型建立中数据归一化处理,目的是为了尽量缩减进行深度学习时的训练量,同时将训练数据按比例缩小到[0,1]的范围内,使循环神经网络的参数值得到优化,提升模型的收敛速度和模型的精度。训练模块中我们将确定的数据长度L_len为1300;batch为13,最后输出五位0或1数字集合来实现故障定位。
在最终获得的循环神经网络权值进行验证,即对单间隔内二次故障定位模型进行验证。对仿真实验共三十二组测试集数据进行验证,分别是25组交叉验证集、3组新的故障数据集,考虑到在进行单间隔继电保护测试过程中可能出现的告警信息不完备的情况,还设置了4组告警信息不完备的故障数据集,其中3组仅考虑单个告警信息缺省的情况,剩余1组为多个告警信息缺省的情况。其中故障模式数字标识见表2。
表2 故障模式数字标识
利用上述所获得的前100组故障数据进行深度学习,阀值选择为0.63其最终得到的三层网络的权值存入t3中,总体训练时间为13 min,迭代次数为58 000次,最终误差(MSE)Loss= 0.000 073。
采用10折交叉验证(交叉验证一般选用十折交叉),训练集为100组,验证集为3组,分别进行了十次交叉验证,共25组,这里仅给出一组交叉验证的结果,交叉数据集验证数字标识结果见表3。
表3 交叉数据集验证数字标识结果
采用新的故障数据集进行验证就是模拟实际智能变电站在进行单间隔保护测试过程中出现故障时,整个故障定位模型对故障模式定位的能力。新数据集验证数字标识结果见表4。
表4 新数据集验证数字标识结果
其次考虑到现场可能出现告警信息缺省的情况,故设置了三组出现一个告警信息缺省的故障数据集进行模型验证。单缺省数据集验证数字标识结果见表5。
表5 单缺省数据集验证数字标识结果
为了进一步验证模型的适用性设置了一组多个告警信息缺省的故障数据集,见表6。
表6 多个告警信息缺省的故障数据集
为了计算该模型预测的准确性,我们对在此模型下的交叉数据集、新数据集、单项缺省数据集与多项缺省数据集的准确率进行计算,见表7。
表7 交叉数据集、新数据集、单项缺省数据集与多项缺省数据集的准确率
4.2.1 交叉数据集验证
随机取三组交叉验证结果与表2中故障模式数字标识进行比对,我们可以得到该故障定位方法是可以正确识别智能变电站二次状态监测中80种告警信号下13种故障。准确率接近100%。具有较高的适用性和可操作性。
4.2.2 新数据集验证
新数据集的验证具有较高的准确率。说明该数据模型具有良好的适用性。
4.2.3 单项告警缺失数据集验证
在单项告警信息缺失的情况下,即在测试过程中出现了故障且告警信息存在不完备的情况,该模型仍然具有较高的准确率。通过深入研究,发现三组缺省数据集的准确率不一致的原因,可以归结于缺省的告警信息不同,当缺省的告警信息是由故障设备发出时,具有较大概率会定位错故障模式,反之当缺省的告警信息是由非故障设备发出时,定位错故障模式的概率就较小。
4.2.4 多项告警缺失数据集验证
该组测试集数据的准确率为61.54%,则表明该模型对多告警信息缺省的情况仍具有一定的故障定位能力。
通过测试,总体故障定位的准确率为82.02%,说明基于循环神经网络的单间隔保护测试故障定位模型达到了比较高的准确度,能够较好地满足现场实际测试过程中确定故障位置和类型的要求,有效地提高了测试过程中故障排查的效率,提高了整个智能变电站故障定位的效率,具有一定的实用性。
智能变电站二次系统实时的状态监测与故障定位是智能电网稳定运行的基础,RNN循环神经网络算法在智能变电站二次状态监测与故障定位系统中经过模型的建立、参数的优化以及数据的深度训练学习,实现了智能变电站二次系统的故障定位与溯源。另一方面,本次仿真实验还存在着一定缺陷,比如本文所获得的数据全部来自于历史数据,无法真正做到实时状态监测与故障定位,具有一定的延时性。为了最大程度实现智能变电站实时状态监测与故障溯源,需要进一步将深度学习理论应用到实践当中,是后续的学习研究方向。