李秋红
基于改进粒子群算法的前馈神经网络识别用户窃电行为
李秋红
(山东农业工程学院,济南 250100)
为减小用户窃电行为对电网运营造成的负面影响、提高窃电巡检能力和识别窃电用户的准确率,提出基于改进粒子群算法(BFO-PSO)的前馈神经网络模型用于识别用户窃电行为。以某市近四年的用电数据为基础,通过特征提取,得到四个对窃电行为影响较大的特征作为输入样本,构建基于BFO-PSO算法的前馈神经网络识别模型,利用BFO-PSO计算BP神经网络模型的最优权重值。对比BP神经网络模型、基于遗传算法的BP神经网络模型及基于BFO-PSO的BP神经网络模型识别结果发现,基于BFO-PSO的BP神经网络模型能够更好地识别出窃电用户,识别准确率高达94%,训练速度提升了5%,有望广泛应用于窃电用户识别中。
窃电;改进粒子群算法;前馈神经网络;用户识别
随着经济飞速发展,人们的用电需求越来越高,出现一些不法分子实施窃电行为。全国每年因窃电造成的损失逾百亿元,给电力系统的安全与稳定带来极大隐患[1-2]。由于窃电手段繁多,且多发生在偏远地区,人为排查耗时耗力,难以获取确凿证据。因此,当出现窃电行为时,能在复杂环境中进行准确定位获得有力证据,对维护电力系统的稳定有重要意义。
借助电力计量设备获取各相电流、电压、功率因数等数据和一些异常警报信息,通过分析处理这些数据,提取窃电用户的关键特征,构建窃电用户识别模型,可判断用户是否有窃电行为[3]。文献[4]通过用户负荷曲线与特征曲线之间的相似度,筛选具有窃电嫌疑的用户;文献[5]基于传递熵密度聚类的方法,构建与线损电量的传递熵模型,再结合密度聚类算法,达到识别用户窃电行为的目的。
窃电用户识别模型的建立方法有多种,BP(back propagation)神经网络模型因具有较好的非线性映射能力及容错性,在建模及图像识别领域得到了广泛关注。但该模型所需训练数据多,易陷入局部最优解,最终导致预测结果与实际值偏差较大[6]。为了提高BP神经网络模型的收敛速度,引入粒子群优化算法(particle swarm optimization, PSO),但传统粒子群算法与神经网络模型结合时易出现局部最优解、计算精度不高等问题。细菌觅食优化算法(bacterial foraging optimization, BFO)除了具有与PSO相同的优点外,还具有较强的局部搜索能力。因此,将BFO与PSO相结合[7],建立基于改进粒子群算法(BFO-PSO)的前馈神经网络模型,通过数据处理确定模型训练样本,并合理设定模型初始化参数,可有效解决粒子群算法与神经网络模型相结合时的局部收敛和收敛速度慢等问题。将该模型用于窃电用户行为识别,可实现快速准确识别。
BP神经网络模型是一种按误差反向传播训练的前馈神经网络模型,其以梯度下降法为思想,通过梯度搜索使模型的实际输出值与期望输出值的误差方均差为最小。目前使用最多且最简单的神经网络模型由三层结构组成,即输入层、输出层和隐含层[8-9]。神经网络模型拓扑结构如图1所示,训练过程如图2所示。
图1 神经网络模型的拓扑结构
图2 训练过程
假设搜索空间维度为,个不同的粒子构成种群,粒子在每次搜索过程中,按照式(1)和式(2)来自动更新速度和位置。
为解决PSO易陷入局部最优和收敛速度慢等问题,将标准PSO作为变异算子引入BFO中,去掉式(1)中第二部分,得到改进后的粒子速度和位置更新公式为
按式(3)和式(4)更新粒子菌群位置,计算出新的适应值。
由于用电负荷不能直接表征用户的窃电行为,终端报警信息也存在不准确性。因此,在识别模型建立之前需要对采集到的原始数据进行处理。
对用户用电量进行周期性分析后不难发现,正常用户的用电量趋势没有太大波动,基本趋于平稳;而窃电用户的用电量趋势下降明显。因此,可根据用户电量趋势变化来判断正常用户和窃电用户。由于窃电用户在全国用电用户中居于少数,并且像医院、学校、银行等非居民类别的用户不可能存在窃电行为,为获取更为有效的窃电行为数据,在采集到的原始数据中需将不可能出现窃电行为的用户用电量数据滤除。由于正常情况下节假日的用电量比工作日低,因此节假日的用电数据也需要滤除。
在提取用户用电量数据时,会存在部分数据缺失。为更好地建立模型,通过拉格朗日插值法插补缺失的数据[12],用户电量补全部分数据见表1。
表1 用户电量补全部分数据
通过计量仪表采集的数据,虽能表征窃电行为的某些规律,但作为模型的训练样本,其特征不清晰,需进行特征提取。利用逐步回归法进行特征筛选,筛选出与窃电关联度较高的指标因子,将这些因子构成数据集作为输入样本来反映窃电行为。窃电评价指标体系如图3所示。
图3 窃电评价指标体系
本文给出一种改进粒子群算法(BFO-PSO),基于该算法建立窃电用户识别模型。在样本准备完成后,需要划分测试样本和训练样本,随机选取20%的数据作为测试样本,剩下的作为训练样本。模型输入包括用电量下降趋势、线损增长率、终端告警数和欠费次数。识别模型算法流程如图4所示。
图4 识别模型算法流程
1)初始化不变参数。
2)用随机函数随机确定每个粒子的速度和位置。
3)确定解空间,进行迁徙操作。
4)执行复制操作。
5)按式(5)执行趋向操作。
7)菌群寻找最优位置,并按式(3)和式(4)更新菌群位置,按式(6)计算菌群的适应值,与last比较,更新last。
8)判断迭代次数是否满足条件,满足则将最优解输入BP神经网络模型进行训练,不满足则返回第3)步进行下一代集群处理。
由于窃电识别结果有窃电和正常两种情况,属于二分类问题,因此采用ROC(receiver operating characteristic)曲线和AUC(area under curve)作为窃电识别模型的评价指标。ROC曲线的横轴为假正率(false positive rate, FPR),表示识别模型识别的正常样本中含有窃电样本数据的比例;纵轴为真正率(true positive rate, TPR),表示识别模型识别的正常样本中实际正常样本占所有正常样本数据的比 例[13]。因此,TPR值越大,表示识别为正常数据中真正为正常数据的样本越多;而FPR值越小,表示识别为正常样本的数据中真正为窃电数据的样本越少。所以,ROC曲线越趋于左上角,表示模型对用户窃电行为识别的准确率就越高。
将ROC曲线与横轴包围的面积值定义为AUC,利用AUC的值能有效衡量模型的分类性能。对于窃电识别这一二分类问题,由于识别模型的预测能力必须要高于随机猜测,通常AUC>0.5,当AUC>0.9时,表示识别模型具有非常高的预测能力。
为了验证基于改进粒子群算法的前馈神经网络识别模型的识别能力,选取某市近四年用电数据中2 242个数据为算例样本,与BP神经网络模型和基于遗传算法的BP神经网络模型进行仿真对比。仿真时,BP神经网络模型的隐含层设定9个节点,通过tansig和purelin函数分别激活隐含层和输出层,设定迭代200次,最小误差设为0.000 1,学习率为0.01;遗传算法进化设为30代,种群规模为20,交叉选择概率设为0.25,变异选择概率设为0.15;粒子群算法进化设为30代,种群规模为20,学习因子1=2=1.5。
通过仿真建立BP神经网络模型、基于遗传算法的BP神经网络模型和基于改进粒子群算法的BP神经网络模型,得到训练时间见表2。
从表2可以看出,基于改进粒子群算法的BP神经网络模型训练时间最短;与BP神经网络模型相比,基于改进粒子群算法的BP神经网络模型的训练速度提升了5%。仿真得到三种模型的ROC曲线分别如图5~图7所示,识别结果对比见表3。
图5 BP神经网络模型ROC曲线
图6 基于遗传算法的BP神经网络模型ROC曲线
图7 基于改进粒子群算法的BP神经网络模型ROC曲线
表3 识别结果对比
表3中,TP为正常用户识别正确的数量,FP为正常用户识别错误的数量,FN为窃电用户识别错误的数量,TN为窃电用户识别正确的数量。将表3中的识别结果代入式(7)~式(9)计算出识别率对比见表4。
表4 识别率对比
通过对比分析三种模型的ROC曲线可得,基于改进粒子群算法的BP神经网络模型的ROC曲线更趋向于左上角,AUC值最大,分类识别性能优于其他两种模型。三种模型均能识别出窃电用户,但识别率不同。BP神经网络模型的识别准确率为83%,误判率为10.28%,漏判率为23.45%;基于遗传算法的BP神经网络模型的识别准确率仅为71%,低于另外两种模型,误判率为27.21%,漏判率为30.71%;基于改进粒子群算法的BP神经网络模型的识别准确率为94%,误判率为6.19%,漏判率为5.77%。仿真结果表明,基于改进粒子群算法的BP神经网络模型识别准确率最高,漏判、误判率最低,训练时间最短,能更好地识别出窃电用户。
针对识别用户窃电行为的问题,本文提出了一种基于改进粒子群算法的BP神经网络模型。以某市近四年用电数据中2 242个样本数据为例,仿真分析所提出模型的可行性及有效性。通过与BP神经网络模型和基于遗传算法的BP神经网络模型进行对比,得出本文所提基于改进粒子群算法的BP神经网络模型的识别准确率最高、误判率和漏判率最低、训练时间最短的结论。该模型可用于识别窃电用户,为保障电力系统安全运行提供理论支撑。
[1] 张宇帆, 艾芊, 李昭昱, 等. 基于特征提取的面向边缘数据中心的窃电监测[J]. 电力系统自动化, 2020, 44(9): 128-134.
[2] 雷怡琴, 孙兆龙, 叶志浩, 等. 电力系统负荷非侵入式监测方法研究[J]. 电工技术学报, 2021, 36(11): 2288-2297.
[3] 唐冬来, 刘友波, 熊智临, 等. 基于时空关联矩阵的配电台区反窃电预警方法[J]. 电力系统自动化, 2020, 44(19): 168-176.
[4] 宋少杰, 张长胜, 李英娜, 等. 基于曲线相似度和集成学习的窃电识别[J]. 数据通信, 2022(3): 39-44.
[5] 刘康, 李彬, 薛阳, 等. 基于传递熵密度聚类的用户窃电识别方法[J/OL]. 中国电机工程学报, 2022, https://kns.cnki.net/kcms/detail/11.2107.TM.20211203. 0323.003.html.
[6] 金晟, 苏盛, 曹一家, 等. 基于格兰杰归因分析的高损台区窃电检测[J]. 电力系统自动化, 2020, 44(23): 78-86.
[7] 杨萍, 孙延明, 刘小龙, 等. 基于细菌觅食趋化算子的PSO算法[J]. 计算机应用研究, 2011, 28(10): 3640-3642.
[8] 徐扬, 张紫涛. 基于遗传模拟退火算法改进BP神经网络的中长期电力负荷预测[J]. 电气技术, 2021, 22(9): 70-76.
[9] 闻枫, 荆凡胜, 李强, 等. 基于改进BP神经网络的无线电能传输系统接收线圈参数优化[J]. 电工技术学报, 2021, 36(增刊2): 412-422.
[10] 杨尚君, 王社伟, 陶军, 等. 基于混合细菌觅食算法的多目标优化方法[J]. 计算机仿真, 2012, 29(6): 218-222.
[11] 李涛, 方文田. 基于粒子群优化算法的金属氧化物避雷器阻性电流计算方法研究[J]. 电气技术, 2021, 22(11): 104-108.
[12] 赵莉, 孙娜, 李丽萍, 等. 拉格朗日插值法在数据清洗中的应用[J]. 辽宁工业大学学报(自然科学版), 2022, 42(2): 102-105, 117.
[13] 巢政, 温蜜. 一种基于SMOTE和XGBoost的窃电检测方案[J]. 智慧电力, 2020, 48(11): 97-102.
Feedforward neural network based on improved particle swarm optimization algorithm for identification of user electricity stealing behavior
LI Qiuhong
(Shandong Agriculture and Engineering University, Ji’nan 250100)
In order to reduce the negative impact of electricity theft on power grid operation, improve the ability of electricity theft inspection and the accuracy of identifying electricity theft users, a feedforward neural network model based on improved particle swarm optimization algorithm (BFO-PSO) is proposed. Based on the electricity consumption data of a city in recent four years, through feature extraction, four features that have a greater impact on electricity stealing behavior are obtained as input samples. A feedforward neural network recognition model based on BFO-PSO algorithm is constructed, and the optimal weight value of BP neural network model are calculated by using algorithm BFO-PSO. By comparing the recognition results of BP neural network model, the genetic algorithm based BP neural network model and the BFO-PSO based BP neural network model, it is found that the BP network model based on BFO-PSO can better identify the power stealing users. The recognition accuracy is as high as 94%, and the training speed is increased by 5%. It is expected to be widely used in the power stealing user recognition.
stealing electricity; improved particle swarm optimization; feedforward neural network; user identification
2022-07-04
2022-07-26
李秋红(1990—),女,山东省临清市人,硕士,助教,主要从事智能电器、电气设备智能化方面的研究工作。