王 渭,马梦轩,王圣杰,温兴贤,陈 峥
(国网宁夏电力有限公司信息通信公司,宁夏 银川750001)
在现代电力信息通讯系统中,历史负荷数据的质量变得越来越重要[1]。我国的电力信息通信过程是指电力信息通讯系统将来源于SCADA(Supervisory Control And Data Acquisition,监控和数据采集系统)数据库的历史负荷数据以微波或电力线载波的形式进行数据传输。在数据的传输过程中不可避免会受到不同程度的随机干扰,在各种影响因素的共同作用下可能造成SCADA数据库的污染,导致传输数据的失真,使某些高级软件无法识别和使用[2]。具体地说,电力信息通信过程不良数据包括远程终端单元(Remote Terminal Unit,RTU)数据传输错误、RTU数据丢失两种。传统的不良数据辨识方法,如基于多视角低秩分析的电力不良数据辨识方法[3]、基于长短期记忆网络的不良数据辨识检测方法[4],由于准确度较低、辨识速度较慢,难以满足电力信息通信的需求。
小波变换是时频分析的一种工具,通过物理的直观和信号处理的实际经验建立反演公式。为此,针对传统方法存在的不足,本文基于小波分析研究了一种新的电力信息通信过程不良数据辨识方法。通过对电力信息通信局部奇异性检测,从而检测出不良数据并进行数据去噪处理。最后设计对比实验,将本文研究的不良数据辨识方法与两种传统形式的方法进行对比,进一步证明本文研究的方法具有较高的辨识效率和准确性,并促进电力信息通讯技术的进一步发展和完善。
负荷曲线是分析和预测电力信息通讯系统现状和未来状况的依据和基础,实际上,电力信息通信所传输的历史负荷数据可以看作是构成负荷曲线的点,而电力信息通讯不良数据可以看成是负荷曲线中的不规则点即奇异点。通常情况下,不良数据的奇异性有两种表现形式:一种是在某一时刻,历史负荷数据的传输信号的幅值发生突变,造成整体信号的不连续,而幅值突变点为传输信号的断点,成为第一种情况的间断点;另一种情况是,整体信号连续无突变幅值,但信号的一阶微分出现间断点呈现出不连续状态,该断点成为第二种情况的间断点。若采集的历史负荷数据传输信号具有这两种间断点,则称该信号在间断点处具有奇异性[5]。
设定具有有紧支集的二次样条小波,通过样条平滑函数一阶导数。小波变化的变化结果在细微尺度上展现了原函数的局部性质,因此适用于对数据的局部特异性检测,在小波变换中,局部特异性可以定义为:
定义1 设f(x)L2(R)(平方可积空间),若f(x)对于任意x属于δx0,小波G(x)是满足连续且可微分的集小波函数,并具有n阶数据消失矩阵,采用李普西兹指数计算奇异点指数,其具体计算方法如下公式(1)所示:
其中,s=2j,若在某一点x处满足上式,则a 成为点x的奇异点指数[6]。
奇异性检测流程如图1所示。
根据图1可知,信号的奇异点检测可以看做为小波变化值的检测,基于小波变换的电力信息通信局部奇异性检测步骤如下:
(1) 采用离散二进小波的迭代公式对检测信号作多尺度下的离散二进小波变换,且最大选取尺度小于j=4;
(2) 获取尺度为1时信号的阈值,保留在该尺度上绝对值大于阈值的小波变换系数,将绝对值小于阈值的小波变换系数赋值为0,从而获取奇异点的模的极大值点;
(3) 在每级尺度上,重复步骤(3)的计算方式,计算每级尺度上对应的奇异点的模的极大值点;
(4) 从第一个尺度开始,对该尺度上的奇异点的模的极大值点,采用即兴算法探寻该点的极大值线,寻找该奇异点的模的极大值点对应的传播点,并将不在极大值线的小波变换系数去掉,计算各点的位置,生成极大值线的函数表达式,利用公式(1)计算第2尺度上的奇异点指数;
(5) 去掉第一个尺度上所有小波变换系数大小,根据步骤(4)重新计算出第一个尺度的奇异点的模的极大值点,保持其位置的不变。
不良数据的检测是区分正常数据和不良数据的关键性技术,其检测的原理是通过神经网络算法将检测的数据与参考数据的数学期望进行比较,若在某一点,检测数据的期望曲线较参考期望曲线相比下降幅度较大,即同一位置二者之间的期望差较大,则该数据则可被认为不良数据[7]。
对于某组含有正常数据和不良数据的待检测数据集,可以将其看作是一个n×p的矩阵,其中包括扰动序列和非扰动序列。通过奇异值检测初步对局部数据进行分解。首先进行矩阵变换,在观察值的范围内以均匀分布的方式产生参考数据,最后通过矩阵变化得到参考数据集Z。
通信的电力数据序列如图2所示。
生成参考数据集后,采用神经网络算法,在输入模块中输入待检测数据与参考数据之间的期望差值ek,经过神经网络计算后生成输出结果Ok,同时计算各点期望差值与数据结果间的平方值(ek-Ok)2,将这组数据生成数据集作为聚类分析模块的待检测数据输入,并在聚类模块中采用GSA 算法判定,确定每个数据的最佳聚类值h。当聚类值为1 使,则可认为待检测为正常数据,而当聚类值为0 时,则表示待检测数据为不良数据。除此之外,还需计算(ek-Ok)2的平均值,将具有最小(ek-Ok)2平均值的数据集视为正常数据所在的类,而其他数据均可视为不良数据[8]。通过上述计算步骤,可以将正常数据归到一个类中,并与不良数据准确分离,便于后期的数据处理。
噪声污染是一种难以控制、难以确定的随机现象,不良数据对历史负荷数据的随机干扰可视为白噪声,白噪声的干扰会降低对历史负荷预测的精度,因此需对电力通讯信息数据进行除噪处理。在小波变换的分解过程中可以根据信号频率删除噪声信号,但易造成其他信号的丢失,难以保留初始信号的瞬时特征,因此本文采用优化后的软阈值和硬阈值去噪方法消除某一设定值的细节部分,最大限度保证初始数据的完整。
其中,软阈值是在信号小波变换后,将小波变化系数绝对值大于或等于阈值的点赋值为0,绝对值大于阈值的点赋值为该点与阈值之间的差值。硬阈值与软阈值相同的是将小波变化系数绝对值大于或等于阈值的点赋值为0,不同的是硬阈值将绝对值大于阈值保持不变,一般来说,采用硬阈值处理过的数据信号相较于软阈值更加粗糙。
电力通信数据去噪过程如图3所示。
无论采用硬阈值还是软阈值进行阈值确定,其步骤大体相似,首先第一步要对需处理数据进行噪声强度的计算,其计算公式如公式(2)所示:
去噪后的数据如图4所示。
为验证基于小波分析的电力信息通信过程不良数据辨识方法的有效性,将基于多视角低秩分析的电力不良数据辨识方法、基于长短期记忆网络的不良数据辨识检测方法作为对照,设计如下实验。
设定实验参数如表1所示。
表1 实验参数
针对电力信息通信过程不良数据辨识的困难性,需对实验环境进行不断调整,使其满足电力信息通讯系统的运行需求,并按照实验参数确保实验环境的统一性。实验的操作步骤如下:
(1) 准备一组已知的含有不良数据的历史负荷数据,按照电力信息通信对历史负荷数据的传输准则,将所需传输的历史负荷数据通过本文的传输通道进行传输,确保系统对数据的辨识过程处于本文的监视范围内,并确保实验环境不受其他因素的干扰,避免出现实验误差;
(2) 收集系统的运行信息,并将这些信息录入控制系统,排查系统是否存在运行异常。对运行异常的系统及时调整运行状态;
(3) 对系统的运行数据进行分析,计算各个算法对电力信息通信过程不良数据辨识的时间、数量,对照准确标准,从而生成辨识效率和准确率对比结果。
将上述实验步骤重复10 次,为保证实验更接近真实环境,每次选用的历史负荷数据并不相同。对比不同方法的噪声消除准确率,实验结果如图5所示。
根据图5所示结果可知,本文方法的噪声消除准确率更高,证明其消噪能力优于传统方法,使得消噪效果更加明显。
在此基础上,对比通信过程中不良数据的辨识时间,结果如表2所示。
根据表2所示结果可知,两种传统方法对不良数据的辨识时间均高于本文方法,证明本文方法的辨识效率更高。
表2 通信数据辨识时间
由此可见,本文研究的基于小波分析的电力信息通信过程不良数据辨识方法的辨识效率以及准确率均优于其他传统辨识方法。造成这种差异的原因在于:本文方法采用小波变换对历史负荷数据的传输信号进行分析,能够将交织在一起的由不同频率组成的混合信号分解成单一的、清晰的不同频率信号,通过对局部奇异点的检测获取奇异性信息辨识在电力信息通讯过程中存在的不良数据,具有较高的辨识准确性。整体上看,该方法的计算方式简单、步骤间接,节约了不必要的计算时间,且适用于大量数据信号分析计算,因此辨识效率较高。而传统的电力信息通信过程不良数据辨识方法,结构复杂,任何一个计算环节的失误都会导致最终计算结果的错误,且过多的计算方式,对于处理大量的数据较为困难,计算速度过慢,导致整体的辨识准确率和效率均不够理想。
综上所述,本文研究的基于小波分析的电力信息通信过程不良数据辨识方法具有较高的辨识效率和准确率。该方法利用小波奇异性检测理论对历史负荷数据中的不良数据进行检测,采用神经网络算法区分正常数据和不良数据,并利用小波除噪原理对数据进行预处理,可以有效检测出不良数据的存储位置,避免由不良数据导致的信息紊乱和软件无法识别问题,且相较于传统的辨识方法更能适应未来电力信息通讯技术的发展。