任关友 王昕 李英娜 李川
摘要:电能的准确计量是电力企业生产经营管理及电网经济稳定运行的重要环节,计量准确性及质量可靠性直接影响用户的经济利益和社会能源利用率。如何准确分辨因用户行为导致的计量异常是一个有待解决的技术难题。近年来,因智能电能表的推广及用电信息采集系统建设的全面完善,电网公司积累了海量用户用电数据,基于此,本文提出一种基于粒子群优化的神经网络算法对用户用电行为进行检测,实验表明该方法具有较高的可行性和可靠性,可以进行推广。
关键字:防窃电;数据挖掘;粒子群算法;神经网络
中图分类号:TP393 文献标识码:A DOI:10.3969/j.issn.1003-6970.2017.08.043
引言
电能计量异常主要是指电能计量设备不能准确记录和反映出用户的真实用电情况,从而造成电网公司或者用户经济损失。电能计量设备故障又可以分为设备本身故障和人为导致的设备故障。设备本身故障即设备内部某个或某些元件发生故障从而导致电能不能准确计量,人为导致的故障即以人的意志通过更改电能表内部的某些元件导致设备计量误差增大。后者以人的意志对设备的更改即是电力行业所说的窃电。窃电从电力计量开始就一直存在,并且随着计量器具的发展而改进,窃电对电网公司每年造成巨大的经济损失。由于窃电导致计量设备发生损坏,给用户用电造成巨大的安全隐患,并且由于用户窃电导致的电力安全事故严重影响了社会稳定性。如何对窃电行为有效的回应,成为电网公司不得不面对的问题。
现在常有的窃电方式有(1)欠压法(2)欠流法(3)扩差法(4)无表法(5)移相法,针对这五种窃电方法,现有的防窃电方式有(1)改进电表和使用带防窃电功能的表箱(2)—次侧、二次侧计量数据比对(3)基于网络守恒发现存在可疑的用户(4)用户举报及稽查人员检查。在实际的生产工作中,我们发现用户窃电方式存在趋向于高科技化,上述的几种方法都不能有效的发现存在可疑的用户。其中,带防窃电功能的表箱由于安装电表需要进线到表箱内部,所以使得表箱并不能完全密封,在面对强磁、高频等窃电行为并不能完全保护电表;一二侧对比需要我們单独开发新的设备,并且这种设备一次只能针对一户用户进行检查,效率低且花费大,并且如果窃电用户发现一次侧加装了设备,很可能在安装设备的这段时间不会发生窃电行为,从而导致这种方法无效。
无论是哪种窃电方法,最终都会反映在计量数据上,而数据是真实的。基于电网公司积累的大量用户用电数据,本文提出一种基于粒子群算法改进的神经网络算法,运用粒子群算法对神经网络权值进行优化,通过分析用户的用电数据,综合考虑用户用电行为特征,从而发现异常用户,并对这些用户做重点的检查和防范。
1 基于粒子群算法优化的BP神经网络建立窃电检测模型
1.1 粒子群算法
粒子群算法(Particle Swarm Optimization,PSO)来源于鸟类觅食过程的模拟和研究。它的基本思想是通过群体之间的协作和信息共享来寻找最优解。
粒子群算法具有记忆特点,可以动态跟踪当前的搜索状态,调整搜索策略。
设有n个粒子组成的群体,在维度为q的空间内搜索,每个粒子表示为,每个粒子所处的位置为,每个粒子的速度为在搜索过程中,需要记录每个粒子的搜索到的历史最优值pfst=和全局最优值。每个粒子的速度和位置更新如下:
其中,为第次迭代时,粒子i在d维上的速度,为次迭代时,粒子在维上的位置,为保持原来速度的系数,即惯性权重,q是粒子跟踪自己最优的权重系数,通常设置为2,是跟踪全局最优的权重系数,通常设置为2。和是间的随机数,是对位置更新的时候,在速度前面加的一个系数,即为约束因子,通常设置为。
1.2 神经网络
人工神经网络(ANN)是对生物机理的抽象合成,其基本成分是神经元。在生物神经网络中,每个神经元与其他神经元相连接,当它兴奋时,便会向其他神经元发送化学物质,从而改变其他神经元的状态,人工神经网络便是基于此构成。众多神经元组成的单元经过带有权值的连接弧相连便构成了神经网络。一个实例通过神经网络进行训练后,该网络能够以某种方式表达输入与输出之间的关系,我们就认为这个神经网络是对该实例的抽象表达m。
误差反向传播(BP)神经网络是近些年运用的最普遍的,学习机制分为正向传播和反向误差回馈。BP神经网络由输入层、隐含层、输出层组成,三层之间的神经元由带权值的连接弧构成,层与层之间相互关联,神经网络正向传播后计算学习误差,根据学习误差对神经网络进行反向误差调整,整个过程循环迭代,直到误差达到相应要求。BP神经网络由于强大的非线性映射能力和强大的泛化、容错能力而被广泛使用,但是由于误差回馈过程基于梯度下降的搜索算法,使得神经网络可能会陷人局部极小值从而得到的不是全局最小值,并且,如果神经算法学习速率等参数如果选择过大的话,容易让神经网络发生震荡,不能收敛,过小则会让神经网络收敛速度过慢。
2 基于粒子群算法优化的BP神经网络建立窃电检测模型
人工神经网络算法(ANN)和粒子群算法各有其特点和长处,近年来,越来越多的学者尝试将两者的优点相结合,使得系统既具有粒子群算法全局搜索能力,又具有神经网络强大的学习能力及逼近任意非线性函数能力。目前常有的做法包括融合算法、PSO-ANN算法、ANN-PSO算法等。本文采取的做法为先建立BP神经网络,在误差回馈过程中采用PSO算法对权值进行优化,使得神经网络收敛的更快并且是全局最优解。POS-BP算法流程如图1所示:
2.1 反窃电指标确定
对所使用特征个数的讨论,可以采用偏差-方差困境来考虑,S卩:模型如果特征个数过少,模型不够复杂会导致不能捕捉特征的基本关系从而训练出来的模型有较大的偏差,如果特征过多,但没有足够的数据支撑模型,可能会导致模型过度依赖训练样本而无法将模型泛化到更多数据以至于具有较高的方差。并且随着特征的增加,我们为了准确泛化模型所需要的数据量也需要呈指数的增加。所以,在拟合优度与简单性之间,需要某种折中,即要考虑好为实现拟合优度所需的特征个数。本次研究只针对10KV高压专变用户进行,不针对其他电压等级用户。综合分析云南某地计量中心提供的用户用电数据并考虑10KV高压专变用户用电特征、窃电情况等特点,我们将数据分成峰时、平时、谷时三个时间段,拟从峰值有功功率、平值有功功率、谷值有功功率、功率因数、三相电压不平衡率、三相电流不平衡率、是否为节假日等七个方面对目标嫌疑用户窃电嫌疑开展评估预测,如果评估的窃电嫌疑愈大,就表明用户窃电的可能性越高。图2为反窃电评价指标体系:
其中,三相电压不平衡率和三相电流不平衡率分别是反映用电过程中电压和电流的波动情况,在三相供电系统中,电压和电流基本保持平衡。当电压(流)不为0时,三相电压(流)不平衡率的计算方式为三相电压(流)的最大值与最小值之差比上最小值。对于一家正常用户来说,功率因数会是一个相对稳定值,因此其平均功率因数相应也应该是一个相对稳定值,而且与电量使用时间无关。所以我们也将功率因数作为一个主要的参考依据。
2.2 数据预处理
数据预处理一般包括三个过程,分别是:数据筛选、数据变换和特征缩放[1()]。数据筛选即筛选出我们需要的某一列或者多列数据;数据变化即当某个变量不是直接存在需要经过某种变换才能得到;特征缩放即数据标准化,数据标准化在模型训练中极为重要,比如说电压的值一般在220V,电流有时候可能才为2A,当我们计算电流和电压的合计时,结果就是电压几乎会完全主导答案,但是我们计算初衷可能是希望两个特征能够得到同等的重视,数据标准化使得这些特征跨越的范围具有可比性而且特征能包含相同的信息,只是所使用的单位不同。标准化后的值通常为(M之间。数据标准化采用公式3:
其中,Xmax为本指标数值中的最大值,为本指标数值中的最小值,为第个输入数据。
2.3 BP网络模型设计
三层BP网络能够模拟复杂非线性的输入输出关系。所以采用三层BP网络作为防窃电模型预测用户窃电嫌疑。在模型的设计中,输入层我们采用3.1节介绍的特征值;隐含层节点的选择对神经网络很关键,如果节点数过少,模型可能不能完全表达出数据的含义,节点数过多的话,神经网络会过分依赖数据而变得具有较高的方差、容错性能降低,并且收敛速度也很慢,本次研究采取神经网络隐含层节点经验公式4:
其中,n为输入层节点数,a为1?10中间的某一常数。输出层的设计中,我们采用直接用神经网络进行分类预测,即:直接将用户历史用电数据作为输入,将实际窃电结果是否窃电或作
3.2 神经网络结构选择
因为数据量较少,所以单隐含层神经网络已经能满足我们的需求,所以在本次试验中我们只使用单隐含层。隐含层节点数量的选择对神经网络很关键,如果节点数过少,模型可能不能完全表達出数据的含义,节点数过多的话,神经网络会过分依赖数据而变得具有较高的方差、容错性能降低,并且收敛速度也很慢,综合考虑输入输出节点数以及样本数目,经反复试验实测比较,确定当隐含层节点为10的时候效果最好。由此,确定神经网络拓扑结构为8-10-1。所以一共有个权值,即粒子的维度为90维,适应度函数为输出均方误差,其表达如下:
为期望目标输出,对BP网络进行不断训练,当模型训练到满足精度要求时,将需要检验的数据输入到训练好的网络,直接输出判断值(窃电嫌疑)。
3 案例分析
本次试验数据选自云南某用户2015年1月到2016年6月共计18个月的完整用电数据,其中该用户在2015年1月、2015年5月发生过窃电事件,通过分析窃电数据,发现在窃电时间段用户数据存在较大异常,二相电压、电流不平衡率也存在异常。3.1数据准备将选定的8个输入向量进行数据变化、数据标准化处理,结果如表1所示。其中,功率因数是取用户该天功率因数平均值,在窃电和节假日栏中,0表示否,1表示是。在本次试验中,共有样本544条。标准化后的数据如下表1所示:
其中,为训练集样本数,为实际的值,为网络预测得到的值。
3.3 实验结果
为了作对比分析,本次试验将普通BP神经网络和基于PSO优化的神经网络进行了对比分析。两种算法的准确率收敛速度见图3,从图中可以发现,PSO优化的神经网络经过140次训练后准确率已经稳定,普通BP神经网络经过190次训练后才稳定下来。经过PSO优化的神经网络效率要高于普通的BP神经网络。
测试数据集测试后得到的结果如表2所示。
通过建立PSO-BP神经网络,该模型的仿真预测结果与实际值和BP神经网络相比,不仅具有比较高的正确率,而且绝对误差要比BP神经网络略小,可以直接说明利用神经网络预测窃电嫌疑具有很高的可行性及可靠性。
4 结论
在用电信息采集系统功能尚不完善之前,电力公司不能及时、准确的掌握用户的用电情况,用电检查工作也只是停留在人工抽检,这种方式实行起来效率低、难度大并且很难准确的发现存在用电异常的用户。本文提出一种基于粒子群算法优化的神经网络算法,从实验比对和验证结果看,基于优化的神经网络能更快的收敛并且准确性也相对精准。该方法为防窃电工作提供了新的思路。