国网郑州供电公司 燕跃豪 鲍 薇
针对目前电力系统窃电趋势不容乐观的现象,急需提升大数据反窃电水准,构建反窃电的智能识别模型,进而实现对不同窃电事件的精准分类与预测。面对如此严峻的形势,本文采用基于双向长短时记忆神经网络(BiLSTM)的滑动窗方法对用户日电量的变化特征进行提取分析,识别异常用电行为。将用户用电信息导入训练好的模型进行分析,实现基于用电信息采集大数据分析的反窃电智能识别。
随着科技的不断发展,窃电手段愈发隐蔽,窃电量也越来越大,对我国电力行业造成了严重不利影响。根据相关调查数据,每年我国由窃电而损失的经济已经超过200亿元人民币,对我国经济的发展产生了难以估计的不良影响,急需相应有效的反窃电方法。
本项目采用基于双向长短时记忆神经网络(BiLSTM)的滑动窗方法对用户日电量的变化特征进行提取分析,智能识别异常用电行为。只需将用户用电信息导入训练好的模型进行分析,电网工作人员就可以有针对性的对疑似窃电用户进行排查,提高反窃电工作效率。
长短时记忆网络(Long Short Term Memory Network,LSTM),是一种改进之后的循环神经网络(RNN),在解决和预测长时间序列的问题中都有很好的运用,如图1、图2所示。
图1 RNN网络模块形式
LSTM是一种类RNN结构,但与其又有些不同,LSTM有四个以非常特殊方式进行交互的网络层。
图2 LSTM网络模块形式
在每个记忆单元(图中A)中包括细胞状态(Ct),遗忘门,输入门和输出门。这些门结构能让信息选择性通过,用来去除或者增加信息到细胞状态。遗忘门控制遗忘上一层细胞状态的内容,根据上一序列的ht-1和本序列的Xt为输入,通过Sigmoid激活函数,得到上一层细胞状态内容哪些需要去除,哪些需要保留;输入门处理当前序列位置的输入,确定需要更新的信息,去更新神经元状态;输出门要基于神经元状态保存的内容来确定输出什么内容,即选择性的输出神经元状态保存的内容。
若要判断用户某天的用电行为是否存在异常,对该日前后各一周的电量趋势进行分析,得出的结果会更加准确。因此本项目采用双向长短时记忆网络作为反窃电判断的基本分类模型,采用滑动窗口的方式输入数据,输入的窗口长度设置为13(连续13天的日电量数据),网络结构如图3所示。可以看到前向层和反向层共同连接着输出层,其中包含了6个共享权值w1-w6。
图3 BiLSTM网络结构
使用神经网络训练模型需要大量的带标签数据,给数据添加准确的标签是本项目的一个重点;另外神经网络的超参数对结果的影响较大,因此神经网络的搭建与超参数的设置是本项目的另一个重点。
从营销系统和计量自动化系统中抽取以下数据:
(1)从营销系统抽取用户基本信息数据;
(2)从计量自动化系统采集实时负荷数据和终端报警信息。
(1)基于历史窃电用户相关信息,研究窃电识别模型的专家样本数据集构建方法;
(2)结合低压用户用电信息采集数据特征,研究基于双向长短时记忆神经网络(BiLSTM)的滑动窗数据处理算法,研究窃电识别模型的参数优化方法,构建低压用户窃电诊断分类模型。
(1)从系统中提取历史窃电低压用户相关信息,对数据进行清洗,构建窃电识别模型的专家样本数据集,提取数据特征。
(2)结合低压用户用电信息采集数据特征,基于双向长短时记忆神经网络与输入数据窗口化提取方法,使用Matlab创建双向长短时记忆网络,网络的隐含单元个数设置为100,求解器设置为adam,训练轮数设置为250轮,梯度阈值设置为1,初始学习率设置为0.01,在训练125轮后通过乘以因子0.2来降低学习率。
表1 某企业大用户的三项有功功率数据
表2 专家样本数据
(3)将窃电用户原始用电数据导入Matlab中,提取用户编号、数据日期与总电量信息,然后计算出用户日电量,对于缺失值及采集的首日电量填充为0。数据预处理完成后对数据进行窗口划分,将连续13天[T-6,T+6]的电量数据作为神经网络的一个输入,第T天的窃电状态(0或1)作为输出。对于信息采集的首尾日,使用0对首尾日的窗口进行填充。
(4)使用经过预处理的数据对模型进行训练并对模型超参数进行调整,以提高模型精度。
(5)对模型进行测试,并采用采用贝叶斯优化算法对超参数进行优化,完善模型,提高识别精度。
本案例输入文件为某中心城市某低压用户的用电数据,时间为2018年1月1日-2019年7月16日,同时包含每天是否有窃电情况的标志。20180101天的数据形式如表1所示。
首先对网络样本输入数据进行数据处理,并将处理后的数据作为输入数据,其中选择窃电嫌疑系数作为输出数据。基于Matlb建立基于双向长短时记忆神经网络(BiLSTM)的滑动窗模型,选定Sigmoid函数作为激活函数。
基于数据变换,得到新的评价指标来表征窃电行为所具有的规律,经过数据处理后的专家样本数据如表2所示。
对专家样本随机选取25%作为测试样本,剩下的75%作为训练样本。结合低压用户用电信息采集数据特征,基于双向长短时记忆神经网络与输入数据窗口化提取方法,使用Matlab创建双向长短时记忆网络,网络的隐含单元个数设置为100,求解器设置为adam,训练轮数设置为250轮,梯度阈值设置为1,初始学习率设置为0.01,在训练125轮后通过乘以因子0.2来降低学习率。训练样本建模的混淆矩阵,如图4所示。
图4 训练样本构建BiLSTM的混淆矩阵
分类准确率为97.9%,正常用电日被误判为窃电日的占正常用电日的0.5%,窃电日被误判为正常用电日的占窃电日的1.6%。
结束语:本文基于用电信息采集系统的用户用电数据,采用基于双向长短时记忆神经网络(BiLSTM)的滑动窗方法对用户日电量的变化特征进行提取分析,实现反窃电的智能识别。通过实例分析,利用历史用户用电数据,将用户用电信息导入训练好的模型进行分析,实现基于用电信息采集大数据分析的反窃电智能识别,验证了本文反窃电模型的有效性,为解决大数据时代下的反窃电智能识别问题提供了参考。