基于关联潮流感知与高斯混合模型的异常用电检测

2023-11-01 01:14潘骏夏祥武李梁刘非文
电力建设 2023年11期
关键词:潮流用电关联

潘骏,夏祥武,2,李梁,刘非文

(1. 上海电力大学电气工程学院,上海市 200090;2. 中煤科工集团上海有限公司,上海市 200030;3. 国网上海市电力公司超高压分公司,上海市 200063)

0 引 言

异常用电是指电力用户通过对用电数据进行非法篡改引起的电力欺诈与能源盗窃行为,异常用电行为是配电网中非技术性损耗(non-technical loss, NTL)的主要原因,直接造成电网巨额的经济损失,危害电网的平稳运行[1-6]。电力企业对异常用电检测业务重视程度不断加大,促使部分非法用电方法从对电能表的物理破坏转变为篡改存储数据的数据攻击[7-10],使得传统的用电稽查手段面临新的难题。随着智能电网的发展,广泛部署的高级量测架构(advanced metering infrastructure, AMI)提供了海量的多维耦合用电数据[11-13],如何从信息耦合的电力数据中挖掘出潜在的异常用电用户,提高现场稽查异常用电的准确性,是目前异常用电检测的研究重点。

目前,异常用电检测的技术可大致划分为3类:基于线损分析、基于用电模式特征和基于潮流约束[14]。第一类方法将异常用电检测问题描述成用电量与台区线损间的关联性分析[15-16]。此类方法理论研究较为完善,但缺乏对多元用电信息的运用,应用场景较为狭窄。

第二类方法基于数据驱动的方法,将不同于正常用户用电模式特征的异常用户区分出来。根据有无数据标签,划为有监督和无监督方法。有监督学习是通过学习用电特征信息的分类器模型[17-19],以此区分正负样本。同时为解决数据正负样本不平衡问题,提出了基于Wasserstein生成对抗网络的异常样本过采样方法[20]等异常检测模型。这类方法检测准确率较高,但依赖足量的标记样本数据,而完整的异常样本标签获取成本较高。无监督算法能从未标记的用电数据中学习潜在样本分布对数据进行划分,如文献[21]提出了对用户电量进行分簇计算离群度识别异常用电模式的方法,文献[22]提出了对用户电量进行编码重构的方法来校验异常用电。这类方法通常从用户历史用电量角度制定电量的差异性指标来区分异常用户,但受到用户负荷随机性和独立性的影响。

第三类是考虑到电力网络的状态变量受潮流约束的影响,异常用电行为将导致系统状态的不一致性[23-24]。大部分研究都是基于状态估计的异常检测方法[25-27],通过分析异常用电行为导致系统状态的异常特征,比较电压、功率的量测值与估计值的残差进行异常检测。这类方法有着较高的检测精度,但依赖于精确的配网拓扑参数以及额外的仪表量测,限制了此类方法的使用范围,仅适用于网络拓扑参数完善的用电稽查场景。

针对状态估计方法受限于拓扑参数的问题,本文通过构建神经网络等值潮流模型与潮流回溯机制,实现不依赖线路参数的关联潮流感知,挖掘异常用电的残差特征。提出的基于关联潮流感知与高斯混合模型(associative power flow sensing and Gaussian mixture model, APFS-GMM)由2个部分组成:关联潮流感知网络和估计网络。首先,基于潮流计算方程的配网电压功率特征存在着相互关联相互约束的物理联系,挖掘出潮流方程两端关联约束的电压与功率残差特征。其中,在正向潮流映射中,将图注意力(graph attention network, GAT)机制用于聚合目标节点与邻居节点间的功率数据,学习关联潮流函数关系,实现不依赖于网络参数的等值潮流计算;同时在潮流感知网络中引入潮流回溯机制,通过动量迭代思想,不断攻击注入功率,使之回溯至与量测电压相对应的回溯功率。然后,提取出映射电压和回溯功率的残差特征作为异常用电特征向量,设计基于高斯混合模型的估计网络对构造的异常用电特征向量计算异常概率能量,将处于低密度区域的用户视为异常用电用户。最后,与多种异常用电检测模型对比表明,该模型在异常用电检测问题上具有更优的性能。

1 异常用电行为的建模分析

1.1 异常用电的电气状态量分析

异常用电行为将产生异常的电表量测数据,传统的数据驱动异常用电检测方法是以用电量数据为基础,分析用电曲线的异常波动特征进行检测。

各场景下的用户用电曲线如图1所示,当用户处于低谷用电量时,用户的正常用电波动与异常用电行为将难以区分。

图1 各场景下的用户用电曲线

配电网是由电源节点、负荷节点和功率传输网络构成的物理拓扑。在同一个时间断面上,由于电网的物理模型及潮流方程约束,各节点系统状态具有一致性,状态量间具有较强的非线性关联[28]。

当系统正常运行时,任意节点i的节点电压Vi和功率Si表达式为:

(1)

(2)

当系统中k点发生异常用电行为时,将异常负荷等效导纳设为ΔYc,则任意节点i的异常用电后的节点电压Vi′和异常用电后的功率S′i可以表示为:

(3)

(4)

由式(3)、(4)可知,系统发生异常未量测的功率分流时,该用户节点的电压和功率都会增加一个与异常用电负荷相关的变量,变量的变化特性与异常用电负荷性质相关联。

正常的用电负荷波动满足系统的潮流约束,不会产生异常注入量,而异常用电行为产生的异常注入量即为量测值与状态量之间的误差。

1.2 异常用电行为分析

居民智能电表的电量计量是对电压、电流的实时采样计算,计量公式为:

W=∑Pmea,tΔtt=∑Vmea,tImea,tcosθmea,tΔtt

(5)

式中:Pmea,t、Vmea,t、Imea,t、θmea,t分别为t时刻电表量测的有功功率、相电压、相电流和相角。

针对上述电能计量原理,用户只需更改任意参量均能导致电能表慢转、停转乃至反转[29]。实际营销业务中的异常用电手法类型众多,除了传统的用电窃电,还包括新型光伏窃电,如用户通过篡改光伏计量表来骗取新能源补贴。但究其原理大多可归为针对智能电表的电流、电压和功率因数等电气状态参量进行篡改,以达到变更计量电量的目的。

根据针对的电气状态量的区别,异常用电行为可分为如下3类[30]:

1)针对电压参数的异常用电方法,如:欠压法、光伏升压法。其特征在于更改计量电能表的测量电压,VmeaVrea。

2)针对功率参数的异常用电方法,如:欠流法、移相法、无表法和光伏升流法。其特征在于通过改变流经电流、改变相位或绕表用电的方法,更改计量功率数值,PmeaPrea。

3)针对电压、功率参数的异常用电方法,如:扩差法和市电改接法。其特征在于外力破坏、干扰和更改电表读数,电压和功率电气参数变化规律更为复杂。

综上所述,当用户侧出现异常用电行为时,电表的量测功率和电压将无法满足基本的潮流约束。针对电表数据的感知校验,能够充分发现发生异常负荷分流后系统状态产生的变化特征,适用于检测上述多类型的异常用电行为。

考虑到用户异常功率作为等值潮流方程的输入量时,会引起关联用户的潮流计算电压与量测电压间的误差,导致出现残差污染的情况。对此,本文提出了基于GAT的潮流感知网络,以注意力机制拟合关联用户的功率注入,提高用户电压拟合精度,同时在不改变感知网络参数的条件下,通过动量攻击法反向回溯与量测电压对应的回溯功率,最终以相互关联的正向映射电压和反向回溯功率2个特征构建异常用电的残差特征。

2 基于关联感知网络的残差特征提取

2.1 配电网潮流计算的局限性

电力系统中的节点电压和注入功率需要满足物理潮流约束,对于拓扑参数完整、导纳矩阵完备的系统,可建立如下的潮流物理方程:

F(P,Q,θ,V)=0

(6)

式中:P、Q分别为节点的注入有功和无功功率;θ、V分别为节点的电压相角和幅值。

然而,我国中低压配电网线路存在着长期运行与维护等情况,导致网架结构脆弱、网架参数实际值与标记值存在偏差、台区线路参数缺失等问题,难以构建精确数学建模的物理潮流模型进行计算。

2.2 潮流映射可行性分析

我国中低压配电网大多呈辐射状结构,线路电阻较大,潮流非线性关系强,辐射状配电网中的节点电压分布情况与各节点功率分布相关联,其计算公式为:

(7)

式中:ΔVm为节点m的电压变化量;N为节点注入功率发生变化的节点集合;ki,PV和ki,QV分别为第i个节点的有功功率变化量ΔPi和无功功率变化量ΔQi对第m个节点的电压灵敏度系数。

由式(7)可知,P、Q对θ、V的偏导雅可比矩阵J=∂F/∂[θ,V],且系统正常运行状态下J是可逆的,由隐函数存在定理可知,存在从P、Q到V的唯一函数映射[31]。同时,深度神经网络具有强大的非线性拟合能力,通过构建神经网络等值潮流模型,利用大量的历史量测数据拟合P、Q与V之间存在的潮流映射关系在理论上是可行的。

2.3 基于图注意力网络的映射电压特征

电力系统本质上是图结构的系统,用电数据实质是物理信息的耦合[32]。基于图结构的图注意力网络能利用邻接矩阵的节点关联信息,从空间上提取配电网结构的关联特征,通过注意力机制定义聚合函数,为节点间的聚合信息重新设置权重,实现自适应地聚合邻接节点的信息[33]。

图注意力网络通过构建注入功率与电压的潮流映射关系,绕过潮流计算对线路导纳矩阵的需求,拟合潮流约束中功率、电压变量间的函数关系,实现了不依赖于线路参数的等值潮流计算,其函数关系表示为:

V=gGAT(P,Q)

(8)

关联信息聚合过程如图2所示。具体而言,将配网中包含拓扑关联信息的G(X,A)进行信息聚合,获得具有数据关联信息的嵌入特征向量X′。

图2 电力系统关联信息聚合过程示意图

(9)

注意力系数aij经过softmax归一化的计算过程为:

(10)

式中:eij表示邻居节点vj对目标节点vi的重要程度权重系数。

(11)

如式(11)将特征向量通过“‖”进行连接操作,然后输入到单层前馈神经网络中,计算两节点相关度,最后通过非线性激活函数LeakyReLU得到eij。如图3所示,说明了图注意力层中注意力运算的机制。

图3 图注意力运算原理

2.4 基于动量攻击法的潮流回溯功率特征

基本迭代法(basic iterative method, BIM)作为一种基础地迭代攻击算法,通过多步迭代得到扰动,沿最优方向修改输入值,将多次迭代的样本裁剪(Clip)到规定范围内,获取目标输出值:

(12)

对抗攻击算法常用于修改输入图像以影响目标分类能力,相应裁剪迭代值为整型。而功率回溯机制基于对抗攻击以获取目标输出值的思想。

对此本文对基本迭代法的对抗攻击过程进行了相应的改进,提出了一种基于动量攻击法(momentum iterative method, MIM)的潮流回溯机制:

1)梯度更新引入动量迭代思想,在计算每次扰动过程中,将动量项整合到迭代攻击中,通过梯度累加,确保了梯度更新方向的稳定性,并删除了符号函数,来获取潮流回溯功率:

(13)

(14)

式中:gt表示累计梯度;μ表示衰减因子。

2)由于功率回溯过程中仅在电压幅值下引导学习,而缺乏电压相角,潮流回溯功率P、Q可能不是唯一解。因此将注入功率解耦,仅考虑与用户异常用电行为更相关的有功功率回溯,保持系统无功不变的情况下,使之回溯变化量累加至有功变化量上,具体如下:

(15)

3 基于APFS-GMM的异常用电检测模型

APFS-GMM是一个用于异常用电检测的深度学习模型,其模型框架的具体结构如图4所示。

图4 APFS-GMM模型结构

主要由关联潮流感知网络和估计网络2个模块组成。具体而言,利用低压配电网末端用户侧智能电表所采集的功率与电压数据和包含台区拓扑信息的邻接矩阵作为整个模型的输入;在关联潮流感知网络中引入图注意力机制聚合网络节点的关联特征,将功率特征映射到电压上,实现功率-电压的潮流映射;然后引入潮流回溯机制,通过对抗攻击方式回溯潮流功率,构成输入输出关联的潮流感知模型;最后在基于高斯混合模型的估计网络中,将提取出的关联潮流约束误差特征作为异常用电特征,计算概率密度矩阵作为网络输出,相对于给定阈值来检测异常用电。

3.1 关联潮流感知网络

本文为获得具有代表性的异常用电差异性特征,根据异常用电行为引起的电表数据变化的特点,以关联聚合的潮流映射网络和动量迭代攻击的潮流回溯网络的相互作用,共同构建了关联潮流感知网络,生成符合异常用电行为特点的误差特征。

1)潮流映射网络。

将拓扑连接信息编入潮流映射网络中,通过在每个节点上执行注意力机制,实现节点关联电气信息聚合,减小了潮流拟合的信息差,进一步提升了潮流拟合精度,引导网络学习输入功率与电压间的非线性函数映射。

2)潮流回溯网络。

为了更好地应对复杂多样的异常用电手法引起的电气量异常值,本文采用了一种动量迭代攻击算法回溯功率,将用户量测电压Vmea定为输出目标,通过不断迭代对抗攻击网络的输入功率,使网络输出的潮流映射电压Vmap有效地逼近于用户量测电压Vmea。

在迭代对抗攻击过程中,正常用户的有功回溯在合理误差范围内,而使得异常用电用户的潮流回溯有功差异不断增大,从而提取出了与异常负荷相关的功率变化特征。

3.2 估计网络

异常用电数据引起的电气状态量异变不符合潮流约束,难以完整进行潮流映射和潮流回溯的过程,产生的残差特征将明显偏离于正常用户。本文基于GMM架构设计了估计网络,对异常用电残差特征计算在高斯混合模型中的权重概率,从而完成异常用电检测。

为了让估计网络同时学习到两类关联特征,对感知数据的电压映射误差ΔV和功率回溯误差ΔP进行拼接(concatenate)生成残差特征Z。将Z输入估计网络估计样本的混合概率系数P∈RN×M。最后,根据模型的概率密度来计算窃电用户的异常用电概率能量。具体计算步骤如下:

1)残差特征Z的构建:为了考虑每个样本的映射误差和回溯误差,采用Euclidean距离和余弦距离计算误差函数,计算公式为:

(16)

(17)

式中:ZV、ZP分别为映射电压误差和回溯功率误差;Cos(·)表示采用余弦距离计算误差函数;Euc(·)表示采用Euclidean距离计算误差函数。

将2种计算误差作为2个不同的特征分别级联拼接构造成最终的残差特征Z:

Z=[ZV‖ZP]

(18)

2)混合概率系数P的计算:

P=softmax[MLP(Z,θm)]

(19)

式中:θm为估计网络的参数;MLP(Z,θm)为估计网络的输出特征;softmax为激活函数。

3)利用P计算估计网络的参数,计算公式为:

(20)

(21)

(22)

式中:φm、μm和Σm分别代表估计网络的第m个分布的混合概率、均值和协方差。

4)样本能量E(z)计算公式为:

(23)

估计网络的输出结果表示每个样本服从于整体近似样本分布的概率分布,它也是系统状态量理论值和量测值的偏差与系统总体量测精度的偏离程度,可认为是异常用电的可能性。

综上,APFS-GMM模型的损失函数为:

(24)

式中:第一项是关联潮流感知网络的残差;第二项是估计网络的预测能量;第三项是防止协方差矩阵不可逆的惩罚项。

4 算例分析

为了验证APFS-GMM模型用于异常用电检测的有效性,本节采用浙江省某典型示范区数据作为原始数据,分析了包含20个台账明确的配电台区,用户3 000余户的用电数据,其中包括3个商业用户台区、5个农村用户台区和12个城镇居民用户台区。该数据集包含了从2019年3月至2019年4月共50天,用电数据采集频率为15 min,总计4 800组功率与电压的样本数据。为提供足够的异常用电数据,在上述用电数据中,根据文献[14]模拟了异常用电行为篡改智能电表数据的特征,生成异常用电数据,来验证模型的有效性。本文提出的APFS-GMM模型在Pytorch-Geometric框架下实现。

4.1 评价指标选择

异常用电检测作为一个正负样本不平衡的二分类问题,同时存在着严重的正负样本不平衡问题,不能简单地用准确率来评判模型的性能。为了评价模型的性能,本文参考异常检测领域相关成果,本文采用准确率σACC、召回率Fr、F1指数F1-score和误报率(false positive rate, FPR)kFPR作为评价指标以衡量模型的性能,上述评估指标(不包含误报率)的值越大表示模型检测性能越好。计算上述指标的依据来源为异常用电检测的混淆矩阵,如表1所示。

表1 异常用电检测混淆矩阵

将上述4种情况对应的用户样本数量设置为MTP、MTN、MFN和MFP。

采用准确率σACC、召回率Fr、F1指数F1-score和误报率kFPR作为检测性能指标:

(25)

(26)

(27)

(28)

4.2 网络结构和参数设置

对于关联特征聚合的图神经网络层数的选择,注意力层太少面临特征聚合效果不明显,太大则面临特征退化的问题。具体的层数选择通过对比1—4层模型的训练效果选择最优层数。注意力头数的取值范围为1~8,同样根据训练结果进行比选。

对于关联感知的潮流映射任务,本文选择均方差(mean squared error, MSE)YMSE作为衡量模型的性能。

(29)

本文固定其他网络层的结构,通过比较图注意力网络电压映射能力与异常检测性能指标来确定GAT层的超参数,实验结果如图5所示。

图5 GAT层的实验结果

由图5(a)可知,仅单层的GAT网络聚合关联信息的能力较差,各项指标上检测效果不佳,两层的GAT网络可以有效地聚合各邻接节点间的关联,但随着更多GAT层的加入,准确率、召回率、F1指数和FPR的性能指标随之逐步下降,同时在电压均方差上也是两层的GAT网络损失最小,性能最优,因此本模型采用两层的GAT网络层。根据图5(b)可知,注意力头数为4时,模型关联感知性能最优,相应的电压映射均方差最小,与此同时的异常检测F1指数最优。关联感知网络中图注意力参数设置如表2所示。

表2 关联潮流感知网络参数

估计网络学习输入残差特征Z的分布特性,通过softmax激活函数输出样本的混合概率系数矩阵P。同时在网络中添加Dropout层防止估计网络发生过拟合[34]。最后,在CA-GMM中采用Adam优化,批处理量为20,学习率为0.001,λ1=0.1,λ2=0.005,迭代次数为5 000,估计网络结构与参数如表3所示。

表3 估计网络参数设置

4.3 异常用电检测性能评估

4.3.1 GAT网络潮流映射能力

为了验证模型中图注意力网络的电压映射能力的有效性,本文还尝试了卷积神经网络(convolutional neural networks, CNN)和多层感知机(multilayer perceptron,MLP)这2种网络作为潮流映射的神经网络,并与GAT模型进行对照,关联感知网络和估计网络的其他模块保持相同。CNN网络采用文献[31]的输入构成方式进行对比。

各模型经过充分训练后,采用城镇居民用户台区4月1日到10日的960组数据作为验证集,各模型的电压拟合结果如图6所示。

图6 不同模型下电压拟合误差曲线

在潮流映射电压拟合效果上,MLP网络并不完全收敛,电压映射误差较大;CNN网络通过提取邻近节点的局部特征,具有相对有效的电压映射能力;GAT网络通过嵌入邻接矩阵信息,提升了模型的感知视野,进一步聚合关联节点的信息,提高了电压映射能力,测试集上电压映射误差小于0.005,可以满足异常用电检测任务的性能要求。

4.3.2 残差特征可视化

为了体现模型学习过程中残差特征的嵌入质量,本文选用tSNE工具对估计网络的误差特征输入量进行可视化展示,结果如图7所示。

图7 基于tSNE的误差特征可视化

APFS-GMM模型由于借助于邻接矩阵提供的全局视野,进行了关联特征聚合过程,提取到有效的电压残差特征,同时增加了回溯功率的残差特征,将用电数据进行更有效地区分,从可视化图中,异常样本聚集明显且能够与正常样本分离,为后续的异常检测提供了有效的输入特征。

4.3.3 与其他算法的对比

为了验证APFS-GMM模型的异常用电检测性能,选取浙江省某区域50个有异常用电记录的台区历史用电数据,根据异常用电方法(分压法、分流法、移相法等)[14]和电力公司稽查确认的异常用电用户案例为依据,构建相应的异常用电用户数据作为验证数据集,给予相应的异常用电用户标签,标签只用于验证模型结果,不参与模型训练。将各种检测方法按不同异常用电方法进行分类检测,其异常用电检测结果如表4所示。

表4 不同模型的异常用电行为检测结果

由表4可知,与传统的利用日用电量曲线等负荷时间序列的辨识方法相比,本文所提AFPS-GMM异常用电检测模型的准确率σACC接近1,有很好的辨识效果,且误报率kFPR十分接近0,较低的误报率更有利于电力公司稽查效率的提高。相应的F1指数F1-score和召回率Fr都接近1,异常检测性能表现具有一定的优势。APFS-GMM模型不会受到用户负荷随机波动与特殊用户不寻常用电习惯的影响,所提出的差异性指标更符合异常用电行为特征。

4.3.4 多目标异常用电检测能力分析

为了验证APFS-GMM模型在同时段出现多个异常用电用户时的检测性能。本文设置在不同用户规模下,同时出现3、4、5、6和7个异常用电用户时进行异常用电检测,检测结果如图8所示。

图8 多目标异常用电检测结果

由图8可知,当台区内同时段异常用电用户数维持在3~4户时,APFS-GMM模型以较高F1指数和较低误报率检测出相应的异常用户;当用户数攀升至5户往上时,在小规模台区的检测性能相对可靠,但随着检测规模的扩大,相应检测性能也有明显下降。

为验证在各类型台区下的多目标检测能力,选择了3种不同类别用户的台区进行试验,试验结果如表5所示。

表5 不同类型台区多目标检测能力

其中最小F1-score与最大kFPR皆为异常用户增多至9个时所对应的值,可以发现APFS-GMM的多目标检测能力约为3个。同时异常用电行为用户只占极少一部分,单个台区同时段内发生3个以上异常用户的概率几乎为0。在不同台区下,APFS-GMM的多目标检测能力的鲁棒性均较为显著。

4.3.5 APFS-GMM的拓扑变动适应性校验

为了测试APFS-GMM在台区拓扑变动情况的适应性,本文与文献[31]的电压拟合卷积模型从网络拓扑变动方面进行对比验证。

在台账明确的配电台区中选用3号农村用户台区,APFS-GMM与拟合CNN模型在拓扑变动前进行充分训练,学习相应的潮流映射过程,在仿真环境下将10、18号用户改接入6号用户所处支路重新计算潮流,同时15、25号用户属于异常用电用户,测试结果如图9所示。

图9 拓扑变动下的异常用电检测能力对比

在3号台区中,将异常概率能量大于0.5的用户视为异常用电用户。拓扑变动前后,APFS-GMM通过更新邻接矩阵,与拟合CNN依赖于相邻用户顺序编号的输入量对比,掌握了一定的拓扑变动信息,仍能准确地进行关联潮流感知,具有较好的拓扑变动适应性。

5 结 论

为了从信息耦合的电力数据中挖掘出潜在的异常用电用户,提高现场稽查异常用电的准确性,提出了针对智能电表数据感知校验的异常用电检测方法,得到如下结论:

1)分析了异常用电行为后系统状态产生的变化特征,建立起异常用电与智能电表量测数据异常间关联性,提高了方法的异常预警能力。

2)由于配电网异常用电行为产生的异常电气数据存在耦合关联性,本文提出了APFS-GMM模型进行异常用电检测,重点研究了神经网络等值潮流模型与潮流回溯机制,实现了对用户侧潮流数据的关联感知,挖掘了受潮流约束的异常用电关联残差特征进行异常检测。

3)与其他方法相比较,APFS-GMM对电压功率的异常用电特征进行关联建模,提取出受潮流约束的关联残差特征,最大化保留了原始数据信息,在实际应用中适用于多种类型用户台区检测,具有更好的准确率,对异常用电用户可准确辨识,为配网异常用电检测与分析提供了全新有效的方案。

猜你喜欢
潮流用电关联
用电安全
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
用煤用电用气保障工作的通知
安全用电知识多
“一带一路”递进,关联民生更紧
用电安全要注意
奇趣搭配
智趣
潮流
潮流