计及坏数据辨识与修正的配电网状态估计

2022-11-23 02:49吴丽珍
电气技术 2022年11期
关键词:测数据修正配电网

张 铄 吴丽珍

计及坏数据辨识与修正的配电网状态估计

张 铄 吴丽珍

(兰州理工大学电气工程与信息工程学院,兰州 730050)

配电网中多种量测设备所采集的异构异源数据共同构成了用于状态估计的数据源,对量测数据的深度辨识是提升状态估计精度的首要任务。本文提出一种针对量测数据中坏数据的辨识修正方法,首先运用新息序列和基于密度的含噪声空间应用聚类(DBSCAN)算法进行初级辨识,然后根据量测数据的时间惯性进行二次辨识,最后采用改进长短期记忆神经网络(LSTM)算法对异常数据进行修正,并搭建仿真平台分析了所提方法的有效性。

配电网;多级辨识;坏数据;状态估计

0 引言

状态估计的准确性为电力系统的安全稳定提供了重要保障。多种量测设备的技术特性随着配电网智能化水平的发展而不断提高,状态估计的准确性也在一定程度上得到提升。现阶段,电力系统的量测数据主要来自数据采集与监控(supervisory control and data acquisition, SCADA)系统和同步相量量测单元(phasor measurement unit, PMU)。SCADA量测主要用于支路功率和电压幅值等信息的测量,其优点是在配电网中装设较多,数据资源丰富,主要缺陷是数据精度低、无时标,数据质量欠佳。PMU量测数据较SCADA量测具有精度高、时标准、延时低、刷新快等特点,还能直接测量电压相量等信息。PMU是目前较为理想的数据量测装置,但其装设受经济和技术等原因限制,仅靠配电网中已配置的PMU很难满足可观测性要求。在相当长的一段时间内,配电网中的SCADA/PMU两套数据仍会作为状态估计的数据源持续并存[1]。

两种量测设备为状态估计提供了海量数据,但与此同时这些数据中也包含着大量的坏数据,若不对其进行处理,会对配电网状态估计精度造成巨大的影响。如何有效地对坏数据进行辨识并修正是亟需解决的问题。

目前针对坏数据辨识,相关学者进行了大量研究:文献[2-3]借助PMU和SCADA的差异性和相似性对同一数据进行校验来保证数据的可靠性,进行坏数据的辨识;文献[4]根据量测设备自身的精度设置数据检测标准,检测不同场景下的坏数据,但检测指标过于单一,容易对数据造成非坏即好的判断;文献[5]运用多级辨识技术准确分离出波动数据和伪波动数据,验证了多级辨识的有效性。坏数据辨识方法[6]如图1所示。

图1 坏数据辨识方法

本文就量测数据中存在的坏数据问题提出一种辨识与修正方法。该方法运用多级辨识和多方法检验技术,流程如图2所示。首先通过新息序列和基于密度的含噪声空间应用聚类(density-based spatial clustering of applications with noise, DBSCAN)算法进行初级辨识,将两种检验结果的交集数据作为异常数据、非交集数据作为可疑数据;然后将可疑数据通过基于时间惯性的检验进行二次辨识,若可疑数据与前后时刻呈现强相关性,则为正常数据,否则为异常数据;最后对挖掘的异常数据通过改进长短期记忆神经网络(long-short term memory, LSTM)算法进行预测修正。搭建IEEE-33节点系统用于验证所提方法的有效性。

图2 本文方法坏数据辨识流程

1 坏数据辨识

1.1 基于新息序列的异常值辨识

求解式(3),可得

1.2 DBSCAN算法

DBSCAN算法是一种基于密度的聚类算法,该方法能成功处理不规则形状的聚类问题,同时对包含噪声的数据也有良好的处理效果,即该算法在识别数据集中不规则形状聚类的同时,也可以识别噪声。

DBSCAN算法流程[7-8]如图3所示。

图3 DBSCAN算法流程

DBSCAN示意图如图4所示,为能更大程度地识别异常值,本文将两个连续的边界点也纳入可疑数据集中,后续再进行可疑数据的筛选。

图4 DBSACN示意图

1.3 基于时间惯性的二次辨识

2 改进LSTM算法修正异常值

当时间序列在时刻的数据发生异常时,可利用在时刻之前序列的历史数据对时刻的数据进行预测修正,即利用序列本身的历史数据周期特征进行修正,从而建立历史时间序列预测模型对异常值进行修正。

LSTM是循环神经网络(recurrent neural network, RNN)的一种衍生形态,解决了RNN梯度消失和爆炸的问题[9],可以很好地从时序数据中学习经验、对数据进行信息处理和预测。其与RNN最大的区别是隐藏层增加了单元状态,通过引入不同的门结构来对单元状态进行控制,门结构分别为:遗忘门、输入门、输出门。LSTM的单元结构如图5所示[10]。xy分别为神经元的输入和输出,hC分别为神经元的短期状态和长期状态。在每个时间步,C-1首先经过一个遗忘门消除一些储存信息,然后通过加法器添加一些新储存信息,得到CC经过由O控制的输出门滤波产生短期状态h和输出y

图5 LSTM单元结构

式中:为与输入连接的权重矩阵;为与先前短期状态-1连接的权重矩阵;为偏置项。

LSTM对于时序数据的处理依靠激活函数,若去掉激活函数,无论有多少个单元状态和神经元,对数据的处理效果都会降低。为此,对激活函数进行改进以提高算法的数据处理能力。原始LSTM输出门的激活函数是单一的tanh函数,改进后将tanh改为ReLU、sigmoid、tanh激活函数的加权。改进LSTM单元结构如图6所示。

图6 改进LSTM单元结构

改进后LSTM输出值为

3 算例分析

本文选取IEEE-33节点系统,搭建仿真平台分析所提方法的有效性。IEEE-33节点测试系统如图7所示。通过模拟系统负荷的持续变化,获得动态潮流数据作为状态估计的真实值,并在真实值的基础上随机加入最高±0.75%误差。仿真时段内系统负荷变化曲线如图8所示。

图7 IEEE-33节点测试系统

图8 系统负荷变化曲线

3.1 异常数据辨识与修正

为能更深层次地挖掘可疑数据,本文将DBSCAN的边界节点也纳入可疑数据的范围。对仿真算例中某时段SCADA电压量测量的数据点进行DBSCAN之后的结果如图9所示。在算法操作过程中需通过对Eps和MinPts参数联合调整以获得最优结果,本文最终选取Eps和MinPts分别为3.7和3.0。

图9 DBSCAN结果

根据试验结果可得:1、17、22、53、54、55、102、103、104、141、143为可疑数据点,这其中包含边界点和异常点,其余点为正常数据点。

对DBSCAN算法运行得出的可疑数据集与基于新息序列辨识出的异常数据集取交集作为最终异常数据集。将其余的可疑数据点根据量测数据的时间惯性进行二次辨识,分离异常点与正常点。

运用改进LSTM算法对辨识出的异常点进行预测修正,部分坏数据修正见表1。

为凸显本文所提坏数据辨识方法的优越性,将不同辨识算法与本文多级辨识算法进行对比。为直观判断不同数据辨识算法对量测数据的辨识能力,定义数据辨识错误率为

表1 部分坏数据修正

式中:为k+1时刻将真实数据判断为坏数据的个数;m为量测数据总个数。的高低反映了数据清洗的准确性,越低,准确性越高。将仿真总时段均匀分割成15个时段,计算得到每个时段内的数据辨识错误率如图10所示。

从图10可以看出,仅使用新息序列辨识或仅使用DBSCAN辨识的错误率较高,且整体错误率均高于本文所提的多级辨识方法。对于多级辨识结果,二次辨识整体错误率控制在10%以下,且较初级辨识错误率大大降低,辨识效果优于单一辨识算法。

3.2 状态估计结果分析

为进一步验证坏数据辨识及修正的效果,以三个案例进行对比分析。

案例1:未使用坏数据辨识与修正算法进行状态估计。

案例2:使用坏数据辨识与LSTM算法修正的状态估计。

案例3:使用坏数据辨识与改进LSTM算法修正的状态估计。

为便于对结果进行定量分析,本文采用标准差均值作为准确度指标。

电压幅值和相位估计的标准差均值如图11所示。

图11 电压幅值和相位估计的标准差均值

由图11可知,在0~1 500s,案例3的结果要略优于案例1,三个案例总体的仿真结果差别不大,多级辨识技术及数据修正算法作用不明显,这主要是因为在平稳状态下,数据波动较小,系统各项参数并不发生大幅度的变化,虽然量测数据包含随机误差但数据总体仍保持平稳状态;在1 500~5 000s,三个案例的估计标准差都呈现不同程度的波动,但使用坏数据多级辨识技术及改进LSTM算法修正的案例3的状态估计精度明显更优,未使用改进LSTM算法修正的案例2状态估计精度次优,未使用坏数据辨识及修正的案例1效果最差,这表明多级辨识技术及改进LSTM算法对数据的修正在配电网状态估计中起到了良好作用。

4 结论

本文针对量测数据中存在坏数据的问题,提出了一种用于坏数据辨识与修正的方法。该方法首先通过新息序列和DBSCAN算法进行初级辨识检测出可疑数据,然后基于时间惯性进行二次辨识,最后采用改进LSTM算法对坏数据进行修正。仿真算例证明了该方法的有效性,对坏数据的辨识与修正起到了良好的作用,提升了状态估计的准确度。

[1] 游家训, 黄斌, 郭创新, 等. 混合量测用于电力系统状态估计[J]. 高电压技术, 2009, 35(7): 1765-1769.

[2] 吴星, 刘天琪, 李兴源, 等. 基于WAMS/SCADA数据兼容和改进FCM聚类算法的PMU最优配置[J]. 电网技术, 2014, 38(3): 756-761.

[3] 薛辉, 贾清泉, 王宁, 等. 基于PMU量测数据和SCADA数据融合的电力系统状态估计方法[J]. 电网技术, 2008, 32(14): 44-49.

[4] 刘科研, 张剑, 陶顺, 等. 基于多源多时空信息的配电网SCADA系统电压数据质量检测与评估方法[J]. 电网技术, 2015, 39(11): 3169-3175.

[5] 高正男, 杨帆, 胡姝博, 等. 面向新能源电力系统状态估计的伪波动数据清洗[J]. 高电压技术, 2022, 48(6): 2366-2377.

[6] 刘莉, 翟登辉, 姜新丽. 电力系统不良数据检测与辨识方法的现状与发展[J]. 电力系统保护与控制, 2010, 38(5): 143-147, 152.

[7] 蔡文斌, 程晓磊, 王鹏, 等. 基于DBSCAN二次聚类的配电网负荷缺失数据修补[J]. 电气技术, 2021, 22(12): 27-33.

[8] 胡金磊, 赖俊驹, 黎阳羊, 等. 基于自适应DBSCAN算法的开关柜绝缘状态评价方法[J]. 电工技术学报, 2021, 36(增刊1): 344-352.

[9] 涂彦昭, 高伟, 杨耿杰. 一种基于卷积神经网络和长短期记忆网络的光伏系统故障辨识方法[J]. 电气技术, 2022, 23(2): 48-54.

[10] 李冬辉, 尹海燕, 郑博文, 等. 改进的LSTM方法在冷水机组传感器故障检测中的应用[J]. 电工技术学报, 2019, 34(11): 2324-2332.

Distribution network state estimation considering bad data identification and correction

ZHANG Shuo WU Lizhen

(College of Electrical and Information Engineering, Lanzhou University of Technology, Lanzhou 730050)

Heterogeneous data collected by a variety of measurement devices in the distribution network constitute the data source for state estimation. Depth identification of measurement data is the primary task to improve the accuracy of state estimation. In this paper, an identification and correction method for bad data in measured data is proposed. The method firstly uses primary identification based on new information sequence and density-based spatial clustering of applications with noise (DBSCAN) method, and then performs secondary identification according to the time inertia of measured data. Finally, the modified long-short term memory (LSTM) algorithm is used to correct the abnormal data. A simulation platform is built to verify the effectiveness of the proposed method.

distribution network; multistage identification; bad data; state estimation

国家自然科学基金项目(62063016)

甘肃省科技计划(20JR10RA177)

2022-07-11

2022-08-13

张 铄(1999—),男,硕士研究生,研究方向为配电网状态估计。

猜你喜欢
测数据修正配电网
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
小学学业质量监测数据的分析应用
关于城市10kV配电网自动化实施的探讨
软件修正
初中生体质健康测试分析——以2015年湖州市第四中学教育集团西山漾校区体测数据为例
主动配电网技术研究
基于Zbus隐式高斯法的配电网潮流计算
配电网无功优化与控制研究
基于PID控制的二维弹道修正弹仿真