一种基于CAEs-LSTM融合模型的窃电检测方法

2022-11-22 01:31董立红肖纯朗于振华
电力系统保护与控制 2022年21期
关键词:编码器用电卷积

董立红,肖纯朗,叶 鸥,于振华

一种基于CAEs-LSTM融合模型的窃电检测方法

董立红1,肖纯朗1,叶 鸥1,于振华1

(西安科技大学计算机科学与技术学院,陕西 西安 710000)

为解决现有的智能电网电力盗窃行为检测方法中准确性不足、检测效率低下等问题,提出了一种由卷积自编码器网络(convolutional auto-encoders, CAEs)和长短期记忆网络(long short term memory, LSTM)相结合的CAEs-LSTM检测模型。该模型通过分析数据集的特点对电力数据进行二维转换,设计卷积自编码器结构,采用池化、下采样和上采样重构电力数据的二维空间特征,加入高斯噪声提高模型鲁棒性,并构建长短期记忆网络以学习全局时序特征。最后,对提取的时空特征进行融合从而检测能源窃贼,并进行了参数调优。在由国家电网公布的真实数据集上,通过将CAEs-LSTM模型与支持向量机、LSTM以及宽深度卷积神经网络进行对比,CAEs-LSTM模型的平均精度均值和曲线下面积值均最优。仿真实验表明,基于CAEs-LSTM模型的窃电检测方法具有更高的窃电检测效率和精度。

窃电检测;长短期记忆网络;卷积自编码器;深度学习;缺失值填补

0 引言

近年来,随着智能电网的发展,用电居民在享受其带来的便利的同时,供电企业的线路损失率居高不下,这导致了供电运营成本的提升。在电力系统中,电力损耗有两种类型:技术性损失(technical losses, TLs)和非技术性损失(non-technical losses, NTLs)[1]。技术性损失是电能在传输过程中无法避免的固有损耗,主要由电力系统中组件自身的功率损耗组成。导致非技术性损失的原因有很多种[2],主要包括:篡改仪表、从电源上安装线路绕过仪表、贿赂抄表员、仪表故障或损坏[3]、数据处理以及计费中的技术和人为错误。在实际场景中,非法篡改导致的损耗是非技术性损失的主要原因,也被称为电力盗窃。

电力盗窃正在不断削弱世界各地的公用事业供应商,它不仅影响了电力系统的稳定运行,甚至产生危及生命的公共安全问题。根据东北集团的数据显示,NTLs每年在全球造成960亿美元的损失[4],中国福建省的年窃电损失高达1亿美元[5]。据报告,在东南亚国家联盟的大多数发展中国家中,NTLs活动的发生率很高。世界银行还报告说,由电力盗窃而产生的损失是发展中国家近一半的发电量[6]。

对于电力盗窃问题,执行定期检查的费用非常高,因此很难计算或衡量实际损失[7]。随着智能电网技术的不断发展,用电信息采集异常几率逐渐增大,累计的终端用户异常用电数据也越来越多,异常的用电模式蕴藏着电网的重要信息。因此,对用电数据进行深层次挖掘,通过其隐藏的规律可以有效检测出异常的用电模式。

用电异常检测是指利用电力系统中的历史数据和实时数据,检测电力系统中存在的异常用电用户或异常用电行为[8]。聚类[9]和支持向量机(support vector machines, SVM)等在电力盗窃检测中应用广泛[10-14],文献[15]利用历史消费数据,使用数据挖掘方法和SVM分类器检测异常行为,利用能源消费的长期趋势来检测欺诈客户。然而,基于SVM的电力窃取检测通常需要大量的训练数据并且依赖从历史数据中提取的特征,不适用于处理高维数据中的类别不平衡问题。集成学习也被用于电力盗窃检测,文献[16]通过改进 XGBoost 模型,通过实际电力用户数据实现了低误报率的检测。

近年来,深度学习在用电异常检测中的应用越来越广泛。文献[17]通过对数据集进行特殊的缩减,提取数据集中有意义的信息,然后构建长短期记忆网络(long short term memory, LSTM)模型识别异常用户。文献[18]采用归一化和插值方法对电力数据进行预处理,然后将预处理后的数据送入LSTM模块进行特征提取,最后将选定的特性传递给提出的RUSBoost模块进行分类。混合深度学习技术能结合不同模型的优点,近年来常被用于负荷预测等研究[19]。文献[20]使用6个盗窃案例来合成盗窃数据,以模拟真实世界的场景。文献[21]将卷积神经网络(convolutional neural network, CNN)与随机森林算法相结合,在超过5000名住宅和商业消费者的真实数据集上验证了模型的有效性。受宽深度推荐系统的启发,文献[22]提出了一种宽深度混合模型,在由国家电网公布的真实数据集上通过监督训练验证了窃电检测的效率。在此基础上,文献[23]通过串行将CNN和LSTM结合起来,研究电力数据的时间特性,并合成恶意数据进行注入来解决异常检测中的样本失衡问题。然而,混合模型的应用需要考虑到数据集的特性,这些检测方法没有从大量高维度数据中充分提取出数据的特征,检测精度仍有待提升。

本文提出了一种新的深度学习模型,用以解决上述问题。首先对数据集中的缺失值及异常值进行处理,然后构建LSTM学习数据的全局时序特征,通过卷积自编码器网络(convolutional auto-encoders, CAEs)学习数据的空间特征,并将两者学习到的特征进行融合,用于训练监督模型。本文考虑了所使用数据集的时空特性,并在卷积自编码器的输入中加入了高斯噪声,提高了模型的鲁棒性。最后,通过42 373个用户的日负荷数据来训练和评估提出的模型,验证其优越性。

1 相关技术说明

Keras是一款用Python 编写且可兼容 Tensorflow的神经网络高级包,支持快速实验。本文通过 Keras 建立基于 CAEs-LSTM的电力盗窃行为检测模型,实现电力盗窃用户的检测。

1.1 卷积自编码器

作为深度学习的流行算法之一,自动编码器已经被广泛应用于医学、图像、生物工程、信息物理融合系统等各个领域进行降维或特征学习[24]。自动编码器有一个输入层,一个隐含层和一个输出层。典型的自编码器结构如图1所示。

图1 卷积自编码器结构

对自动编码器结构进行改进,可以得到其他类型的自动编码器,如卷积自编码器。其主要思想就是加入一些卷积操作,将基本的自编码器全连接层替换为卷积层、池化层以及采样层。

池化层作为紧邻卷积层的步骤,是一个下采样过程,通常被置于两个卷积层之间。池化层的作用是进行特征选择,减少特征数量,进而减少网络参数量,实现降维,并在一定程度上达到防止过拟合的效果。

重构误差可表示为

1.2 长短期记忆网络

为了解决循环神经网络的短期记忆问题,提出长短期记忆网络。长短期记忆网络具有额外的特征来记忆数据序列,能克服循环神经网络中的消失梯度问题。LSTM能够从网络的初始阶段到最后阶段记忆和传播重要信息,在处理时序数据的特征提取上有非常显著的效果,因此常被用于时间序列数据预测及分类[25-26]。

每个LSTM是一组单元或系统模块,在每个单元中使用了一些门,单元中的数据流可以被捕获并存取,然后处理、过滤或添加到下一个单元中,因此单元可以有选择地让信息通过或者删除,其结构如图2所示。

图2 LSTM单元结构

它通过3个门(称为遗忘门、输入门和输出门),来控制信息的传递,可以通过以下公式进行概括。

遗忘门:

输入门:

输出门:

2 异常用电模型

为了更好地完成异常用电模式检测,本文提出一种基于CAEs-LSTM的用户异常用电模式检测模型,如图3所示。该模型通过混合深度学习模型找出电力数据中潜藏的用电模式,以检测异常用电数据。

2.1 数据集

为了监测消费者的用电行为,配电公司每天定期记录实际日负荷数据。电力盗窃数据属于敏感数据,本文所使用的数据集是来自国家电网(SGCC)发布的数据集,数据的采集频率为1天1次,这些数据已经由国家电网专业人员处理过,包含标记的正常用户和电力窃贼。数据集包含了42 372个用户从2014年1月1日至2016年10月31日共1036天每天的能耗统计数据,其中正常用户数量为38 767,电力窃贼数量为3615,表1给出了数据的元信息。

图3 用户异常用电模式检测流程

表1 数据集元信息

通过对数据集进行初步观察,发现正常用户和电力窃贼在日负荷趋势上存在差别,日负荷数据处于不间断的波动中,而正常用户的日负荷数据相对平缓,电力窃贼的日负荷数据波动性比较强,且电力窃贼的能耗值一般比正常用户高出很多,如图4所示。

2.2 数据预处理

2.2.1缺失值处理

由于电表故障、系统不稳定、存储异常及自然因素等原因,数据在采集的过程中往往会丢失,导致数据集中出现大量缺失值。本文所使用的数据中,发现了大量的缺失值以及0值,如表2所示,缺失率为当前列中所缺失的行数占总行数的比率。经统计,缺失主要集中在列缺失率为30%~40%,而0值主要集中在0值占整列行数为10%~20%的列中。这表明数据缺失程度比较大,因此首先对缺失数据进行处理。

图4 正常用户和电力窃贼的日负荷数据

表2 数据集缺失值和0值比例

对于要进行填补的某一列,首先去除当前列中带缺失值的行,去掉缺失行后,将剩余行中对应的当前列的列值作为标签,统计当前列相邻前后各5列的数据,如果这5列数据中仍存在缺失值,则以这些列的列均值取代。实验中存在一种情况:选取的某列全部都为缺失值,此时通过原始未处理数据的列均值来取代这些缺失值。

对提取的10列数据进行灰色关联分析,得到灰色关联矩阵,对关联矩阵中的关联系数由大到小排序,并记录列索引。排序的前5列为与填补列相关性最高的特征,将这5列作为K近邻模型的输入。训练好的模型用来预测缺失值,通过预测的缺失值进行填补,处理流程如图5所示。

图5 缺失值填补流程

2.2.2异常值处理

对于电力能耗数据,在部分情况下会出现偏离正常趋势的较大或较小值,这些对应于实际生活中的特定假日,比如在春节等节日,用电量会迅速提高,形成远离序列一般水平的极端大值和极端小值,即离群点。离群点会降低模型的泛化性能,对于这类值,本文采用三西格玛经验法则进行调整,可表示为

2.2.3数据归一化

由于神经网络对不同的数据比较敏感,需要对数据进行归一化。常用的归一化方法是最小-最大归一化,可表示为

归一化后,随机取部分正常用户和电力窃贼35天的数据进行分析,如图6所示,可以明显的看到,电力窃贼的负荷数据波动性非常突出。

图6 归一化后正常用户和电力窃贼的用电趋势图

2.3 基于CAEs-LSTM的混合模型

在本文中,卷积自编码器和长短期记忆网络被组合起来进行分类检测,模型结构图如图7所示。

图7 CAEs-LSTM混合模型结构

用户用电数据隐藏着周期性的规律,为了更好地探索和利用用户日负荷数据的周期性和空间特性,本文采用卷积形式的自动编码器。将原始一维电力负荷数据进行二维转换,作为卷积自编码器的输入。为了提高卷积自编码器的泛化性能和鲁棒性,在输入的数据中加入高斯白噪声。

水利现代化绘河清湖晏蓝图——访江苏省淮安市水利局局长、党委书记黄克清……………………………… 韦凤年,江 芳,郭 纯等(16.59)

图8 卷积自编码器编码结构

在解码阶段,通过与之对称的卷积层和上采样层完成。通过卷积自编码器获取从二维用电数据重构的空间特征。最后,分别将获取的空间和时间特征进行融合。为了均衡融合提取的时序特征和空间特征,本文将卷积自编码器重构的特征连接到一个可变数神经元的全连接层上,神经元的数量和LSTM的隐藏单元数保持一致。由此得到数据深层次的隐含特征,用于分类检测。本文使用二进制交叉熵损失函数计算当前模型的损失偏差程度,可表示为

2.4 评价指标

2.4.1 AUC

AUC在机器学习领域中是一种模型评估指标,常用于评价分类的准确性。AUC被定义为ROC曲线下与坐标轴围成的面积,而ROC曲线有一个很好的特性:当测试集中的正负样本分布发生变化,ROC曲线可以保持不变。在实际应用中,经常会出现数据集类别不平衡现象,而ROC曲线基本可以保持在类别均衡时绘制的曲线原貌。因此,AUC非常适用于本实验的性能指标。

AUC值等于随机选择的阳性样本排名高于随机选择的阴性样本的概率,其值越大表示性能越好。其计算公式为

2.4.2 MAP

3 实验与结果分析

本节通过实验仿真,验证本文所提出的CAEs- LSTM模型的有效性。实验是在小型服务器上使用Python 3.7实现的,基于Keras实现了卷积自编码器和长短期记忆网络融合的结构。

3.1 性能验证

为了验证本文提出方法的性能,将其与支持向量机、LSTM和宽深度卷积模型[22]进行比较。

支持向量机:SVM通过找到最优的分离超平面,将非线性分离问题转化为线性分离问题。它常被作为一个后续处理方案,应用于基于人类知识和专业知识的欺诈行为检测。

LSTM:基于在处理时间序列数据上的优秀能力及其可记忆的特点,LSTM常被用于作为入侵检测系统的基础架构。

宽深度卷积模型(wide_deep_ CNN):基于文献[24]所提出的宽深度卷积模型,在处理电力数据集上有非常好的效果。

表3为本文仿真实验的参数设置情况。

表3 对比实验参数设置

本文划分了不同的训练比来进行实验,表4为提出的CAEs-LSTM模型与其他检测方案的性能比较。本文分别进行了训练数据比例为50%、60%、70%和80%的4组实验,并记录了AUC以及MAP@100和MAP@200的值。

表4 CAEs-LSTM模型与其他方案的性能比较

从表4可以看出,本文提出的模型在3组指标中均优于SVM、LSTM以及宽深度卷积模型。特别需要指出,当训练比为60%时,AUC指标达到78%,MAP指标达到98%,这表明CAEs-LSTM模型的稳定性更好。

MAP指标的迭代结果如图9所示,结果表明,相比于其他模型,本文提出的模型达到峰值所需要的迭代次数更少。

图9 60%训练比下MAP测试结果对比

当训练比为60%时,本文模型相较于LSTM,AUC值提高近2.5%,MAP@100和MAP@200值分别提高将近11.5%和10%;相较于宽深度卷积模型,AUC值提高1%左右,MAP@100和MAP@200值分别提高将近6%和5%。因此,该模型具有更高的检测精度。本文还在多个训练比下进行了实验,如图10所示。

结果表明,在不同的训练比下,本文提出的模型都有稳定的结果。

3.2 参数调优

为了使本文提出模型达到更好的效果,对模型中的部分参数进行了优化,并在此节给出了调参的结果。

3.2.1 LSTM节点数

LSTM的节点数代表隐藏层的神经元个数,也代表输出层的维度,它决定参数量的大小。网格搜索对于大批次数据训练往往会存在训练时间长、延时以及误差等问题,本文应用常规的节点个数设置,分别测试了单元数为32、64和128的情形,如图11所示。

在训练比为60%的情形下进行实验,结果表明,隐藏层神经元数为64时达到较优的结果。

3.2.2 LSTM层数

LSTM的层数对实验性能有较大的影响,对时序数据额外的处理是非常耗时的。实验中使用了常用的LSTM参数设置,得到结果的如图12所示。

结果表明,过量的叠加层数反而会弱化模型效果,导致拟合性能变差。造成上述结果的原因是层数叠加致使参数冗余,导致过拟合,此时性能也会降低。因此,选择单层的LSTM能取得最好的效果。

4 结语

本文提出了一种CAEs-LSTM模型来检测智能电网中的窃电行为,并在国家电网公布的真实数据集上进行了实验。在缺失值处理阶段,本文引入了基于灰色关联分析的K近邻模型拟合方法,寻求最优的拟合值作为填补。真实数据集中通常带有一些不可避免的噪声,本文在训练阶段加入了高斯白噪声,以提高模型泛化、抗噪能力以及鲁棒性。所提出的CAEs-LSTM模型在窃电检测领域中是一项比较先进的方法,它具有以下两个特性:一是混合模型可以自动提取特征,而其他大多数传统分类器的成功很大程度上依赖于手工设计的特征;二是混合模型结合了CAEs和LSTM的优点,融合的特征能较好地表征数据集的特点,因此在窃电检测的数据集上能表现出非常好的效果,本文的模型还可用于计算机视觉领域。

[1] BISWAL M, DASH P K. Measurement and classification of simultaneous power signal patterns with an S-transform variant and fuzzy decision tree[J]. IEEE Transactions on Industrial Informatics, 2012, 9(4): 1819-1827.

[2] GLAUNER P, MEIRA J A, VALTCHEV P, et al. The challenge of non-technical loss detection using artificial intelligence: a survey[J]. arXiv preprint arXiv: 1606. 00626, 2016.

[3] MISHRA S K, TRIPATHY L N. A critical fault detection analysis & fault time in a UPFC transmission line[J]. Protection and Control of Modern Power Systems, 2019, 4(1): 24-33.

[4] ANGELOS E W S, SAAVEDRA O R, CORTÉS O A C, et al. Detection and identification of abnormalities in customer consumptions in power distribution systems[J]. IEEE Transactions on Power Delivery, 2011, 26(4): 2436-2442.

[5] 陈启鑫, 郑可迪, 康重庆, 等. 异常用电的检测方法: 评述与展望[J]. 电力系统自动化, 2018, 42(17): 189-199.

CHEN Qixin, ZHENG Kedi, KANG Chongqing, et al. Detection methods of abnormal electricity consumption behaviors: review and prospect[J]. Automation of Electric Power Systems, 2018, 42(17): 189-199.

[6] KOSEK A M. Contextual anomaly detection for cyber- physical security in smart grids based on an artificial neural network model[C] // 2016 Joint Workshop on Cyber-Physical Security and Resilience in Smart Grids (CPSR-SG), April 12-13, 2016, Vienna, Austria: 1-6.

[7] JIANG R, LU R, WANG Y, et al. Energy-theft detection issues for advanced metering infrastructure in smart grid[J]. Tsinghua Science and Technology, 2014, 19(2): 105-120.

[8] 游文霞, 申坤, 杨楠, 等. 基于AdaBoost集成学习的窃电检测研究[J]. 电力系统保护与控制, 2020, 48(19): 151-159.

YOU Wenxia, SHEN Kun, YANG Nan, et al. Research on electricity theft detection based on AdaBoost ensemble learning[J]. Power System Protection and Control, 2020, 48(19): 151-159.

[9] 李清. 基于改进PSO-PFCM聚类算法的电力大数据异常检测方法[J]. 电力系统保护与控制, 2021, 49(18): 161-166.

LI Qing. Power big data anomaly detection method based on an improved PSO-PFCM clustering algorithm[J]. Power System Protection and Control, 2021, 49(18): 161-166.

[10] NAGI J, YAP K S, TIONG S K, et al. Nontechnical loss detection for metered customers in power utility using support vector machines[J]. IEEE Transactions on Power Delivery, 2009, 25(2): 1162-1171.

[11] DEPURU S S S R, WANG L, DEVABHAKTUNI V. Support vector machine based data classification for detection of electricity theft[C] // 2011 IEEE/PES Power Systems Conference and Exposition, March 20-23, 2011, Phoenix, AZ, USA: 1-8.

[12] NAGI J, YAP K S, TIONG S K, et al. Improving SVM-based nontechnical loss detection in power utility using the fuzzy inference system[J]. IEEE Transactions on Power Delivery, 2011, 26(2): 1284-1285.

[13] ESMALIFALAK M, LIU L, NGUYEN N, et al. Detecting stealthy false data injection using machine learning in smart grid[J]. IEEE Systems Journal, 2014, 11(3): 1644-1652.

[14] ALVES H, BRETAS A S, BRETAS N G. Smart grids cyber-attack defense: a solution based on an incremental learning support vector machine[C] // 2019 North American Power Symposium (NAPS), October 13-15, 2019, Wichita, KS, USA.

[15] JOKAR P, ARIANPOO N, LEUNG V C M. Electricity theft detection in AMI using customers’ consumption patterns[J]. IEEE Transactions on Smart Grid, 2015, 7(1): 216-226.

[16] 陈刚, 李德英, 陈希祥. 基于改进 XGBoost 模型的低误报率窃电检测方法[J]. 电力系统保护与控制, 2021, 49(23): 178-186.

CHEN Gang, LI Deying, CHEN Xixiang. Detection method of electricity theft with low false alarm rate based on an XGBoost model[J]. Power System Protection and Control, 2021, 49(23): 178-186.

[17] KOCAMAN B, TÜMEN V. Detection of electricity theft using data processing and LSTM method in distribution systems[J]. Sādhanā, 2020, 45(1): 1-10.

[18] ADIL M, JAVAID N, QASIM U, et al. LSTM and bat-based RUSBoost approach for electricity theft detection[J]. Applied Sciences, 2020, 10(12).

[19] TIAN C, MA J, ZHANG C, et al. A deep neural network model for short-term load forecast based on long short-term memory network and convolutional neural network[J]. Energies, 2018, 11(12).

[20] MUNAWAR S, ASIF M, KABIR B, et al. Electricity theft detection in smart meters using a hybrid bi-directional GRU bi-directional LSTM model[C] // Conference on Complex, Intelligent, and Software Intensive Systems, 2021, Springer, Cham: 297-308.

[21] LI S, HAN Y, YAO X, et al. Electricity theft detection in power grids with deep learning and random forests[J]. Journal of Electrical and Computer Engineering, 2019, 2019.

[22] ZHENG Z, YANG Y, NIU X, et al. Wide and deep convolutional neural networks for electricity-theft detection to secure smart grids[J]. IEEE Transactions on Industrial Informatics, 2017, 14(4): 1606-1615.

[23] HASAN M, TOMA R N, NAHID A A, et al. Electricity theft detection in smart grid systems: a CNN-LSTM based approach[J]. Energies, 2019, 12(17).

[24] COLAK I, SAGIROGLU S, FULLI G, et al. A survey on the critical issues in smart grid technologies[J]. Renewable and Sustainable Energy Reviews, 2016, 54: 396-405.

[25] CHANG Z, ZHANG Y, CHEN W. Electricity price prediction based on hybrid model of Adam optimized LSTM neural network and wavelet transform[J]. Energy, 2019, 187.

[26] LE T, VO M T, VO B, et al. Improving electric energy consumption prediction using CNN and Bi-LSTM[J]. Applied Sciences, 2019, 9(20).

Electricity theft detection method based on a CAEs-LSTM fusion model

DONG Lihong1, XIAO Chunlang1, YE Ou1, YU Zhenhua1

(School of Computer Science and Technology, Xi’an University of Science and Technology, Xi’an 710000, China)

To solve the problems of insufficient accuracy and low detection efficiency in existing detection methods of electricity theft in smart grids, a CAEs-LSTM detection model combining convolutional auto-encoders (CAEs) with long short-term memory networks (LSTM) is proposed. The model conducts two-dimensional conversion to power data, designs the encoder structure by analyzing the characteristics of data set, and reconstructs the two-dimensional space characteristics of the electricity data using pooling layers, down and up sampling layers. It adds Gaussian noise to improve its robustness, and builds long short-term memory networks to learn the global characteristics. Finally, spatial-temporal characteristics are fused to detect energy thieves, and parameter tuning is performed. Based on the public available real data set of the State Grid, the CAEs-LSTM model is optimal in the value of mean average prediction and area under curve, by comparing the CAEs-LSTM model with support vector machines, the LSTM model, and wide and deep convolutional neural networks. Simulation experiments show that the theft detection method based on the CAEs-LSTM model has higher detection efficiency and accuracy.

electricity theft detection; long short-term memory network; convolutional auto-encoders; deep learning; missing value imputation

10.19783/j.cnki.pspc.211653

国家自然科学基金项目资助(61873277);中国博士后科学基金项目资助(2020M673446)

This work is supported by the National Natural Science Foundation of China (No. 61873277).

2021-12-04;

2022-02-27

董立红(1968—),女,博士,教授,主要研究方向为智慧矿山建设顶层设计及大数据、工业互联网等新技术在煤矿电力中的应用;E-mail: 1430315357@qq.com

肖纯朗(1997—),男,通信作者,硕士,主要研究方向为电力系统安全,深度学习和异常检测。E-mail: 2867836467@qq.com

(编辑 许 威)

猜你喜欢
编码器用电卷积
融合CNN和Transformer编码器的变声语音鉴别与还原
设定多圈绝对值编码器当前圈数的方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
转炉系统常用编码器选型及调试
舞台机械技术与设备系列谈(二)
——编码器
卷积神经网络的分析与设计
对输配电及用电工程的自动化运行的几点思考
从滤波器理解卷积
用电安全要注意
用电监察面临的问题及反窃电对策