格拉米角场和图卷积神经网络识别复杂电能质量扰动

2022-08-19 14:03郭祥富胡军星袁林峰徐勇明史建勋张志友
中国测试 2022年7期
关键词:识别率扰动电能

牛 罡,张 凯,郭祥富,胡军星,袁林峰,徐勇明,史建勋,张志友

(1. 河南九域腾龙信息工程有限公司,河南 郑州 450052; 2. 国网河南省电力公司,河南 郑州 450000;3. 国网浙江嘉善县供电有限公司,浙江 嘉善 314100; 4. 东南大学电气工程学院,江苏 南京 210096)

0 引 言

由于环境友好的需求,近年来可再生能源发电规模不断扩大,特别是风能和光伏。然而可再生能源在电力系统中的日益普及使得电能质量问题更加严重,这主要体现在两个方面:1)在传统扰动标签之外又引入了新的干扰类型,如振荡和尖峰[1];2)各种干扰源间的相互作用产生了更复杂的电能质量扰动。这些干扰会导致严重的危害,如继电保护装置失灵和敏感设备损坏。为了提高可再生能源并网的电能质量,首要任务是对电能质量进行准确分类[2-3],进而有利于后续的治理策略和评价。

电能质量扰动识别的关键是如何从原始信号中提取出有用的特征,目前最常用的特征算法有傅立叶变换、小波变换、Stockwell变换、经验模态分解等,如文献[4]针对分布式能源接入条件下的复杂电能质量扰动问题,提出了一种基于VMD初始化S变换的数据处理方法;文献[5]针对微电网电能质量扰动信号分类,提出了一种改进LMD的信号处理方法;文献[6]针对各类分布式设备和智能设备接入电力系统后引发的复杂电能质量扰动问题,提出了一种基于分段改进S变换和随机森林的识别方法。

虽然上述方法取得了一定进展,但各方法的使用仍有很大的限制,如基于傅立叶变换的方法的性能受到固定窗口大小的限制;基于小波变换的方法对高频噪声比较敏感,计算复杂;基于Stockwell变换对信号奇异点的检测不敏感,且计算量较大;同时这类方法也过于依赖专家经验及先验知识,在缺乏理论知识背景下很难推广应用。同时由于原始信号的低维性、信息匮乏性等,限制了识别准确度与效率的提升。而由于实际故障诊断中时间紧、任务重,如何快速、准确、高效地进行电能质量故障诊断成为了工程人员最为关心的问题。

近年来,随着深度学习在图像识别、语音识别、语义分析等领域的成功应用,基于深度学习实现端到端的故障智能化诊断逐渐成为研究热点。其中图卷积神经网络(graph convolution neural network,GCNN)作为一种无监督的深度神经网络,可以对无标签数据进行特征学习和提取,从高维的原始数据中获得低维的特征表达,简化了分类工作,并且克服了传统神经网络中的权重系数初始化存在随机性的缺点。尽管上述基于深度学习的智能诊断方法与传统方法相比在特征提取方面具有突出的优势,但扰动信号到图像的可视化分析仍是采用时频方法,这样增加了时间消耗,不利于故障的在线诊断,而且基于笛卡尔坐标系的时频图对故障特征也不够直观。与上述转换方式不同的是,格拉米角场可以很容易地将一维时间序列转换为二维图像,不同图像差异可直接反映信号幅度和频率的变化。

据此,本文提出了一种基于格拉米角场和图卷积神经网络的复杂电能质量扰动识别,通过一系列的仿真和硬件实验表明,对于复杂电能质量的扰动类型识别,文中方法具有很强的鲁棒性和较高的准确度,能够快速、准确、高效地对供电系统电能质量扰动进行分类,且优于传统分类方法。

1 算法原理分析

1.1 格拉米角场原理

格拉米角场(Gramian angular field, GAF)变换可将一维时间序列数据以极坐标形式进行转换,生成二维图像纹理[7]。从图像的纹理中,进一步地做出分析。在将一维数据映射到极坐标系之前,需要对数据进行规范化处理。因此,对于一维时间序列Xt=x1,x2, ···,xn,可以通过下式完成其规范化:

在映射到极坐标系时,极坐标值为角余弦的标准化时间序列值,时间值为极坐标系中的半径。角度θi和半径ri可通过下式进行计算:

其中ti和N分别是将极坐标的时间跨度等分的时间点和常数值。

数据映射到极坐标系中,而不是笛卡尔坐标系,它有两个优点:1)极坐标系保持笛卡尔坐标系不存在的绝对时间关系;2)该方程能够产生唯一的映射,因此当数据反演时,它产生的变换是无损的[8]。在将数据映射到极坐标后,可以使用两点间的三角和或差获得时间关系,这样就产生两种GAF,即Gramian和角场 (Gramian summation angular field, GASF)和Gramian差角场(Gramian difference angular field, GADF),分别由下式表示:

从式(4)和(5)中可以看出,GAF矩阵是时间序列数据的三角函数表示,矩阵中每个元素都是两个时间点数据的三角和或差的输出。GAF图像主要显示数据点对之间的时间相关性,同时保留了空间位置信息。

相比较其他的转换方法,GAF表示方法优点如下:在GAF矩阵中的右下元素包含时间序列中的最后一个信息,左上角元素包含时间序列的第一个信息,此属性意味着生成的可视化图可以保留时间依赖性,从而使转换后生成的图像不丢失原始数据的属性。此外,由于GAF矩阵考虑了任意两个时间点的内积,因此GAF还包含了时间序列数据的相关性。

1.2 图卷积神经网络原理

在CNN中,图像的处理方式是通过将图像像素点整齐排列为矩阵,进一步地对矩阵数据进行卷积、池化操作;而GCNN中,是通过顶点和边建立相应关系的拓扑图来处理图像,进而提取拓扑图上的空间特征[9],其与CNN的关系如图1。

图1 CNN与GCNN关系图

GCNN的结构如图2所示,与CNN结构最大的不同是:GCNN是多层堆叠的,各层间参数不同,通过迭代求解使每一层参数共享。GCNN最大的优势就是引入可以优化的卷积参数来实现对图结构数据特征的获取,在GCNN中通过拉普拉斯矩阵实现这一功能[10]。

图2 GCNN结构图

基于图论将得到的系数矩阵定义为一个带节点和边的图,任何由多个节点和边组成的图都可以表示为G=(V,E,W),用于描述不同节点之间的关系,其中V是一个节点,E是两个节点之间的边,W是两个顶点间连接权重的加权邻接矩阵。通常由定义为L=D-A的拉普拉斯矩阵表示,其中D和A分别表示度矩阵和邻接矩阵。度矩阵和邻接矩阵的具体计算方法如图3所示。

图3 拉普拉斯矩阵计算

图3中,度矩阵为对角矩阵,表示连接节点的数量,例如节点1和节点2分别有2个和4个数量的连接,因此在度矩阵中的值分别为2和4。邻接矩阵表示节点之间的关系,用1和0来表示节点的连接,有连接的节点取值为1,无连接的节点取值为0,例如连接到节点1的节点是节点2和3,因此在矩阵第2列和第3列的第一行中元素为1,而其余元素为0。

GCNN主要分为空间域和谱域两种形式,空间域GCNN类似于卷积在深度学习中的应用,其核心在于从相邻节点收集信息,虽然这种网络直观地借用了图像的卷积运算,但缺乏具体的理论基础[10]。相比之下,谱域GCNN可以更容易从非线性数据中提取特征,主要包括3个步骤:

1)对输入数据进行图形傅里叶变换处理。

2)对变换结果进行谱域卷积。

3)对卷积结果进行图形逆傅里叶变换处理。

拉普拉斯矩阵的公式表示如下:

式中:U——由单位特征向量组成的矩阵;

A——由拉普拉斯矩阵特征值组成的对角矩阵。

对拉普拉斯矩阵矩阵进行图形傅里叶变换,如下式所示:

式中:f——图形的N维分量;

f(i)——图中节点之间的对应关系;

ul(i)——第i个特征向量的第i个分量;

u*l(i)——ul(i)的共轭。

在此基础上,图形傅里叶逆变换矩阵为f=UT,谱域卷积过程如图4所示。

图4 谱域GCNN的卷积过程

2 实验平台及数据库搭建

2.1 实验平台介绍

目前大多数电能质量扰动信号识别研究都是基于Matlab仿真进行的,由于实际新能源并网现场设备环境复杂,仿真信号往往无法完全反映现场采集真实信号的实际情况,具有一定的局限性,不足以说明算法的实际有效性。因此为模拟真实采样信号,文中基于图5所示的直驱型风力发电动态模拟实验平台进行信号采集。

图5 实验平台

实验平台由主控系统、拖动装置、并网发电装置组成。主控系统由上位机和PLC组成,PLC负责各项数据的采集、变频器和隔离开关的调控,上位机负责数据的存储及可视化;拖动装置由变频器和三相交流变频调速异步电机组成;并网发电装置组成由三相永磁同步电机及整流、逆变模块组成。通过异步电机带动永磁同步发电机按不同转速转动及不同系统参数来模拟不同的电能质量扰动,其中振荡和尖峰的产生是以实验过程中采集的电压信号为基础,在系统PLC编码中实现。

2.2 数据库搭建

文中以示波器采集到的A、B相间电压波形为分析对象,进行多次随机实验生成15种扰动信号,如表1所示,每种扰动包含500条随机信号,每条随机信号包含2 000个采样点。

表1 电能质量扰动信号类别

由于电能质量扰动信号为基于时间序列的一维向量,特别是新能源并网后引发的多种类型扰动信号间相互叠加产生的复杂扰动信号,改变了原有信号的时频域特征,增大了信号的复杂度。若直接将一维向量组导入深度学习算法,不仅增加了时间消耗,也不利于故障的在线诊断,同时上述基于笛卡尔坐标系的时频图对故障特征也不够直观。

文中基于Python 3.6对原始一维扰动信号进行处理,生成格拉米角场密度图,图6为基于Gramian和角场和Gramian差角场的14种电能质量扰动信号场密度分布图,将一维扰动信号转变为格拉米角场密度图实现了扰动信号的可视化,更有利于深度学习算法的特征提取,同时图像间差异更直接地反映信号幅度和频率的变化。

图6 格拉米角场密度图

3 结果分析

文中通过十折交叉验证对实验数据进行识别,即将实验数据均分为10份,依次取出9份作为训练集,其余1份作为测试集。讨论了将原始数据和GAF图像分别作为GCNN输入时的网络性能曲线和识别准确率。

3.1 模型输入对比分析

图7和图8分别为不同网络输入时的训练损失值和训练识别率曲线。从图7可以看出,将GAF图像作为网络输入时,网络损失函数值在前200步内快速下降,200~600步间有微小震荡,损失函数值在训练600后逐步趋于0.05左右;而将原始数据作为网络输入时,损失函数值在前400步逐步下降,400步后趋于稳定,稳定值在0.2左右。说明将GAF图像作为网络输入提高了网络对信号的处理能力,也增加了网络的稳定性。从图8可以看出,将GAF图像作为网络输入能够更快地完成网络训练,同时也能保证更高的训练识别率。

图7 不同网络输入时的训练损失函数值

图8 不同网络输入时的训练识别率

图9为采用十折交叉验证得到的测试准确率。基于同一测试集和识别算法,将GAF图像作为网络输入的平均准确率为94.87%,远高于将原始信号作为网络输入的平均准确率79.77%。说明将原始信号进行GAF变换后,提高了网络对信号的深层特征提取能力。

图9 不同网络输入时的测试识别率

3.2 不同深度学习算法对比分析

在同一数据集下,将GAF图像作为网络输入,比较了常见的几类深度学习方法[11-13]与文中GCNN方法的优劣。图10和图11为不同深度学习算法的训练损失函数值和训练识别率,随着迭代的进行,各算法的损失函数值都能趋于稳定,且识别率都能收敛至95%左右,说明算法训练稳定性在不断增加,但采用GCNN算法能够在更短时间内完成收敛,且保证较为稳定的识别率。

图10 不同深度学习算法时的训练损失函数值

图11 不同深度学习算法时的训练识别率

图12为采用不同深度学习算法时的测试识别率,可以看出采用CNN方法和SAE方法的平均测试准确率为91.2%和87.47%,而采用GCNN方法的平均测试准确率为94.87%,高于传统深度学习10%左右。说明采用GCNN算法不仅能在较短的训练步数内完成训练,而且还能保证较高的测试识别率。与SAE和CNN相比,GCNN在处理输入图像时,是根据图像中的节点、线等拓扑信息进行特性学习。相较于SAE和CNN只考虑数据点间数值关系,图数据既考虑了节点信息,也考虑了结构信息,能够更加全面、系统地描述图像特征。

图12 不同深度学习算法时的测试识别率

3.3 不同扰动方法对比分析

在同一数据集下,与现有文献发表的复杂电能质量扰动方法[14-16]进行对比,分别为递归图+循环神经网络(RP+RCNN)、小波变换+S变换+概率神经网络(PNN)、S变换+遗传优化支持向量机(S变换+GA-SVM)。表2为不同方法的结果对比,相较于其他方法,文中方法由于将一维时序信息转变为具有时间关联特性的二维谱图,同时采用GCNN对二维谱图的节点、线等结构拓扑信息特征进行挖掘,因此具有较高的识别准确率。但是文中方法的训练时间达到了200 s左右,与其他机器算法相比,还需在算法训练速度方面提出一定的改进。

表2 结果对比

4 结束语

针对可再生能源并网引起的复杂电能质量扰动识别问题,本文提出了一种基于格拉米角场和图卷积神经网络的复杂电能质量扰动识别方法,结论如下:

1)将原始信号进行格拉米角场密度表示,可以将抽象信号转变为具体图像,丰富了特征可视化能力,能够增强深度学习算法从信号中获取深层特征的能力,进而提高识别准确率。

2)文中所提GCNN算法能够达到94.87%的故障识别率,高于传统深度学习方法10%左右,同时算法训练速度和识别准确度方面均优于传统深度学习方法。

猜你喜欢
识别率扰动电能
一类受随机扰动的动态优化问题的环境检测与响应
一类五次哈密顿系统在四次扰动下的极限环分支(英文)
基于增强型去噪自编码器与随机森林的电力系统扰动分类方法
带扰动块的细长旋成体背部绕流数值模拟
苹果皮可以产生电能
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
澎湃电能 助力“四大攻坚”
档案数字化过程中OCR技术的应用分析
科技文档中数学表达式的结构分析与识别
农村电能计量自动化管理探索与实践