电力自动化系统中的坏数据分析与处理

2013-08-15 00:43:29超,姚鹏,汤
电子测试 2013年17期
关键词:网络拓扑权值遗传算法

殷 超,姚 鹏,汤 鹏

((1.河海大学能源与电气工程学院,江苏 南京 210098;2.东南大学电气工程学院,江苏 南京 210096;3.江苏省电力检修分公司本部,江苏 南京 211102)

0 引言

目前的电力系统状态估计仅利用了数据的冗余度,而电力系统是一个稳定的,具有很强规律性的系统,并且数据库中储存着大量的经过处理的历史数据,对它们的有效利用,可以大大改善电力系统状态估计程序的执行效率与精度。

人工神经网络[1]具有模式识别和联想的功能,即对于存在一定的规律但规律又不容易被发现的一组数据,可以通过若干组同样满足该规律的数据对神经网络进行训练,这样,在不需要知道具体规律的情况下,对于一定的输入,经训练的神经网络即可输出满足规律的输出。电力系统中的量测量之间受电路定律的束缚,但是在存在坏数据的情况下这些定律变得难以合理应用,人工神经网络具有的高度的容错性能很好解决这一矛盾。

本论文研究的主要内容是:依据量测量的冗余度以及历史数据的规律性,提出一种基于人工神经网络的状态估计算法。利用面向对象的程序设计方法,采用数据挖掘技术将SCADA大数据库分成若干子数据库,相对应各子数据库分别训练神经网络,对应于总数据库,训练拓扑辨识神经网络,依据量测量和训练好的神经网络进行状态估计并采用图形学技术在界面显示网络拓扑。

1 遗传算法优化的BP神经网络(GA-BP)

传统的BP神经网络存在收敛速度慢,容易陷入局部极小点而无法得到全局最优解[2][3],并且对初试权值矩阵很敏感等缺点。而遗传算法自始至终是在全局解空间中搜索最优解,使用遗传算法优化BP神经网络可以有效地解决上述问题。具体步骤如下:

1.初始化;

2.根据权值矩阵维数与阈值维数进行二进制编码;

3.随机初始化产生规模为设定值的种群;

4.选择,交叉,变异生成子代种群;

5.解码种群中的每个染色体形成BP神经网络的初试权值矩阵即阈值矩阵,进行BP训练,训练完成进行校验,以校验结果的均方根差的倒数作为适应度;

6.评价新生子代种群;

7.进行子代进化;

8.判断是否满足结束条件,若满足,遗传优化结束,若不满足,返回步骤4;

9.解码遗传算法输出的最优染色体,初始化BP神经网络的初试权值矩阵与阈值矩阵;

10.训练BP神经网络;

11.判断是否达到训练结束条件(一般以训练次数和输出误差作为该条件),若满足,训练结束,若不满足,返回步骤10;

12.输入计算参数,获得神经网络计算结果;

13.算法结束。

2 电力系统状态估计程序实现

尽管采用遗传算法优化的BP神经网络能够缩短训练时间,但是对于对实时性要求较高的状态估计来说,这是远远不能满足的,而在状态估计中真正实现功能的神经网络计算用时确非常短,相比于传统的状态估计需要进行大规模的矩阵运算与大量的迭代计算在效率上有很大提高,因此可以将神经网络的训练放在离线模式下进行,将训练好的神经网络取代传统状态估计在电力系统软件中的位置。电力系统状态估计的基本功能有两点:1.由遥信信息,确定系统网络拓扑;2.由遥测信息,计算系统潮流,其结果应满足电路定律。在此,定义两种神经网络实例,分别实现上述功能。

2.1 离线模式

该模式下主要完成GA-BP神经网络的训练,训练过程包括两个步骤,一是采用遗传算法优化,导出权值矩阵与阈值矩阵,二是BP神经网络获取这些矩阵进行初始化,进行常规神经网络的训练。由于训练数据对于神经网络的影响较大,对于确定网络拓扑的神经网络A在从系统历史数据库选择数据时必须符合以下要求:

1.数据要能够反映系统的运行状态, 要有高峰、低谷和一般情况下的负荷状态;

2.数据要能够反映系统结构的变化;

3.为加快训练速度,尽量减少输入与输出变量。

对于处理遥测量的神经网络群B(个数对应于字数库个数)从子数据库获取训练数据,数据应满足以下要求:

1.数据要能够反映系统的运行状态, 要有高峰、低谷和一般情况下的负荷状态;

2.数据要紧凑,不能过于分散;

将训练好的神经网络A保存于内存中,免去调用时读取硬盘的开销,过大的神经网络群B占用大量的内存,将其以串行化方式存入各子数据库对应表中。

2.2 在线模式

该模式即为电力系统状态估计主程序,分为拓扑辨识与遥测坏数据辨识。

2.2.1 拓扑辨识

开关位置(包括变压器档位等遥信量)与量测值间并不存在直接的满足电路定律的规律,但是开关量直接影响网络拓扑,网络拓扑直接影响潮流分布,而潮流分布与量测值息息相关,因此开关位置与量测值间存在一定复杂的规律。对于训练的足够好的神经网络A,以采集到的遥测量为输入变量,开关位置为输出量,输出结果与遥信量对比,与之不同的遥信量即为坏数据。

2.2.2 遥测坏数据辨识

根据神经网络A的输出形成分类字符串,寻找对应子数据库,读取子数据表中存入的串行化神经网络 ,以采集到的遥测量为输入变量,各有功功率,无功功率,电压幅值,电压相角等传统状态估计计算输出为输出量,输出量中与量测对应的部分如果误差大于±3 ( 为正常量测范围的0.5% ~2% ),则为坏数据。

无论是否含有坏数据,将神经网络的输出量存入总数据库与子数据库。值得注意的是,尽管神经网络具有很强的容错能力,但也是有限的,对于坏数据过多的情况,可能会存在误判,这种情况在传统状态估计中称之为不可辨识,将误判数据存入数据库会导致以后的训练数据畸变,同时也影响系统其它软件的运行,因此,对于判定下来坏数据超过总数据50%的情况,则认为是误判,不予以入库,并发出警报。

3 结论

在EMS中,电力系统状态估计是不可或缺的重要组成部分,本文在广泛总结了前人研究的基础上,提出了利用被忽视确又很有价值的大量历史数据进行状态估计的方法,采用了数据挖掘技术对数据进行分类处理,并提出了分类子数据库的命名方式;采用了遗传算法优化的BP神经网络算法,克服了传统BP神经网络算法的不足,并且将神经网络的训练与使用进行分离,大大减少了实时运行的时间开销,满足实时性要求,使用两类神经网络分别进行拓扑辨识与遥测分析,对两类神经网络采取不同的存储方式,节省了内存开销,提高了运行速率。

[1]袁曾任.人工神经元网络及其应用[M ].北京: 清华大学出版社,1999.

[2]Zhu YL,Sidhu TS,Yang M Y'etal.An AI-based automatic network topology processor[J].Electric Power Systems Research,2002,61(1):57~65.

[3]P.J.Deitel,H.M.Deitel.C++ How To Program,Seventh Edition[M].北京:电子工业出版社,2010.

猜你喜欢
网络拓扑权值遗传算法
一种融合时间权值和用户行为序列的电影推荐模型
基于通联关系的通信网络拓扑发现方法
CONTENTS
CONTENTS
能量高效的无线传感器网络拓扑控制
电子制作(2018年23期)2018-12-26 01:01:16
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于权值动量的RBM加速学习算法研究
自动化学报(2017年7期)2017-04-18 13:41:02
基于遗传算法和LS-SVM的财务危机预测
统计与决策(2017年2期)2017-03-20 15:25:24
劳斯莱斯古斯特与魅影网络拓扑图