基于用电特征分析的异常用电检测方法

2021-02-03 01:49黄悦华郭思涵程江洲王艺洁
三峡大学学报(自然科学版) 2021年1期
关键词:离群用电电流

黄悦华 郭思涵 鲍 刚 程江洲 谌 桥 王艺洁

(三峡大学 电气与新能源学院, 湖北 宜昌 443002)

随着用电用户的迅速增加和智能电表的普及,供电企业能够从配电网中收集到海量的运行数据[1],因此电力企业需要对用户用电信息采集系统收集到的数据进行整理与挖掘,获取隐藏其中的信息[2].用电数据信息来源广,结构复杂,对企业进行数据分析造成了困难[3].数据挖掘技术能实现数据整理、数据分类、异常数据查找等功能[4],以此推动泛在电力物联网的建设,提升电网的全息感知能力[5].

目前按照对用电行为的定义方式分类,基于用电信息采集系统的研究主要有两类:第一类是抽取、提炼用电负荷曲线,从中提取用电特征再对其进行分析.文献[6]提出了一种融合K-means聚类算法和异常点查找算法的窃电识别方法;文献[7]提出了基于无监督学习的异常用电模型检测方法,将网格分析的方法引入异常点查找算法.以上文献聚焦于异常数据点的查找,通过结合不同的聚类方法减少异常点检测算法所计算的数据点,能显著提高检测效率.文献[8]基于改进的K-means聚类算法对用户负荷数据进行日负荷曲线的特性分类,但文中并未针对窃电情形对分类中出现的异常情况进行挖掘.第二类是基于用户用电过程中产生的电参量记录,从与其有关的时间序列中选取特征,将其描述为样本点后再进行分析.文献[9]提出一种基于深度学习的用户异常用电模式检测模型,构建了特征提取网络和多层特征匹配网络,具有较高的准确性,但在实际应用的过程中,需要大量带有标记的训练集才能获得模型的较高准确性.文献[10]使用基于距离的离群点查找方法,绘出窃电方法鱼骨图对所研究用户电流电压曲线进行研究,通过观测对象与质心的欧几里得距离甄别窃电用户,但文中并未考虑供电及测量装置故障等因素导致的异常观测点.文献[11]利用大数据针对多种类型窃电手段,建立窃电特征模型,但并未将高级测量体系(advanced metering infrastruc-ture,AMI)下对智能电表的攻击纳入考虑.

本文提出针对专变用户基于用电模式特征的无监督方式异常用电检测方法.首先引入LOF(local outlier factor)离群点检测算法,基于电参量的时间序列考虑攻击者行为特点,构建异常用电特征;然后设计异常用电评价流程量化用户用电的异常程度,得到用户异常行为的发生时刻;最后综合考虑异常用电评价指标与异常用电持续时间减小技术性因素带来的误差.

1 异常用电检测原理

1.1 用电信息采集系统

目前用户用电采集系统能进行一定程度的异常用电分析并记录,通过接口上报到相关部门[12-14].对这些数据的技术分析能探查到一定数量的异常用电用户,跟踪重点用户用电情况,但随着AMI体系下异常用电模式的多样化,窃电行为越来越隐蔽,异常用电行为与正常用电行为的区分度越来越小,造成了管理难度的加大[15].

专变用户的电能计量采取高供高计、高供低计的方式.根据用户接线方式的不同,采集样本中存在不同类型的数据.高供高计采用三相三线的计量方式,高供低计采用三相四线的计量方式.在数据收集与分析的过程中,将高供低计三元件计量方式产生的三相数据记为A、B、C三相,高供高计二元件计量方式产生的两项数据记为A、C两相.

1.2 异常用电原因

电网运行中的输配电损失可分为技术性损失和非技术性损失.常见技术性损失有计量装置的故障以及线路故障.智能电表在使用过程中产生故障和失误造成计量异常,这些情况会使用电信息数据呈现出异常的波动,甚至超出计量范围,另一个因素线路故障即供电异常也会导致用电数据的异常,这些故障导致的用电数据的异常容易从用电信息采集数据所返回的数据判断出来.非技术损失以窃电形成的异常用电行为为首,是造成供电企业经济损失的主要原因.窃电行为不仅严重影响了企业的收益,对配电网的安全运行和发展造成阻碍,而且由于窃电行为一般通过对计量装置和供电回路的私自改装实施,极易发生安全事故,使用高电压、高用电量的专变用户更是如此.因互感器变比较大,仅需电表较少的走字误差即能获得较大的非法收益[16].因此在异常用电行为的挖掘过程中,对于高压专变用户的窃电行为的防范应是重中之重.除传统的欠流法、欠压法之外,AMI下又催生恶意攻击通信系统,篡改数据管理系统中电表测量值的情形,加大了窃电行为发掘的难度[17].

2 特征提取

用户用电采集系统采集的主要数据项有电能量数据,交流模拟量、工况数据、电能质量越限统计数据、事件记录数据以及费控信息等数据[18],目前供电企业对以上数据的分析限于统计,大量数据隐含的信息被浪费.因此需要提出AMI下针对专变用户的更精细的特征提取方法.用户用电采集系统所获取的数据在时间序列上呈现出高维度的特点.首先对96点电参量数据采取降维处理后,构建异常用电特征集合U.集合U由用电不平衡特征、电压异常特征、电流异常特征3个子集构成.

2.1 用电不平衡特征

用户在正常用电行为时呈现出三相用电平衡的特征,电表读取的电压数据在额定值的上下有轻微的浮动,电流的不平衡也在数值0附近波动.三相用电的专变用户出现的窃电行为能够从电压和电流不平衡率的偏移中体现出来.按照下式分别定义高供高计、高供低计专变用户电压、电流不平衡:

其中:Ui.n表示i相在时刻n的电压采集数值,xV.n表示时刻n的电压不平衡度,Ii.n为i相在时刻n的电流采集数值,xI.n表示时刻n的电流不平衡度.

建立用电不平衡特征矩阵Xn表征用户在时刻n的用电不平衡度.

其中,XV=(xV.1,xV.2,…,xV.n),XI=(xI.1,xI.2,…,xI.n).

对二维空间中用电不平衡特征矩阵Xn所构成的样本点进行离群点分析.局部离群因子(local outlier factor,LOF)检测算法是一种基于密度的无监督离群点检测算法,对离群点有较高的灵敏性.离群点指的是在样本空间中与其他数据特征显著不一致的数据.虽然这些数据总量较少,但包含着大量研究者需要重点研究的信息.离群点挖掘将有效地识别出数据集中的异常数据并从中挖掘出有意义的潜在信息作为目标,使它适用于用户用电行为分析[19].若用户的用电行为正常,则用电不平衡特征矩阵每一行所对应的二维观测点在样本空间中应是密集的簇,不应存在显著偏离簇的观测点,此时的局部离群因子即LOF值接近1;当异常用电发生时电压和电流的不平衡度会产生较大偏移,LOF值非常大,进而形成离群点.

离群点检测步骤如下[20]:

Step1:定义各观测点与距其第k个最近的观测点的距离为第K距离Kdist(p);

Step2:计算各观测点的第k距离邻域Nk(p)={q∈N/{p}|dist(p,q)≤Kdist(p)|},其中,dist(p,q)表示数据中第p个观测点与第q个观测点之间的距离;

Step3:计算各观测点的局部可达距离Dreach(p,q)=max{Kdist(p)dist(p,q)};

Step4:计算各观测点的局部可达密度lrdk(p):

其中:o表示被计算的第k距离邻域Nk(p)中任意观测点;

Step5:定义各对象的局部异常因子LOFk(p)

经过离群点分析后,n时刻数据计算所得局部异常因子LOFk(p)记为xn,形成关于时间的用电不平衡特征序列X=(x1,x2,…,xn).

2.2 电压异常特征

电压异常表现为在某时刻电压记录值偏移额定值或趋于零,电压数值异常降低通常能够判断存在窃电行为发生.定义电压异常特征序列反映用户用电过程中的电压偏移额定值的用电行为.

用户电能计量装置的失压记录可能存在两种情况,计量回路断开或供电异常.目前国内各地供电可靠性逐步提高,用户平均停电时间4~5 h[21],因此设置失压持续时间剔除无计划停电所造成的失压记录,避免因短时停电事故造成的技术性损失重复报警.采取4 h作为失压持续时间的评判标准.失压持续时间在4 h以内记为暂时的供电异常,不记录为电压异常.电压异常特征序列生成过程如图1所示.

其中电压异常特征序列表示为n维向量Y=(y1,y2,y3,…,yn).未失压时由式(6)分别定义高供低计、高供高计用户用电压采集数值与额定电压的偏移程度.

图1 电压异常特征序列生成流程

2.3 电流异常特征

由电能计算公式W=U·I·cosφ·t可知,在功率因数cosφ和电压U较为恒定的情况下,改变电流I的计量能够达到用户窃电的目的,即减少电费的计量.非法用户可能会将某时段内的电流计量修改为0,或将电流曲线进行移峰,使用电曲线的峰值转移到低电价时段[15].而对专变用户来说,每日电力负荷曲线是相似的,这就决定了正常用电用户的每日电流曲线也同样具有相似性.如图2所示的某专变用户的日电流曲线集合,能够看出每日A相电流曲线的波动有较大的相似性.

图2 某专变用户电流曲线

若电流曲线相较于前几日电流曲线的聚类中心有较大波动,则可能发生异常用电行为.

计算电流异常特征序列步骤如下:

Step1:选取A相电流作为参考,计算前10日电流记录值聚类中心(本文中按照均值计算),得到聚类中心曲线.其中时刻t对应的聚类中心取值mean(IA.t)=∑d=(0,1,2,…,10)IA.d.t.其中IA.d.t表示前d日t时刻的A相电流记录值;

Step2:计算每日时刻t的电流记录值与前10日电流聚类中心曲线时刻t的距离zD.t=|mean(IA.t)-IA.D.t|;

Step3:生成电流异常特征序列Z=(zD.t)=(z1,z2,…,zn).其中,n=24D+t,序列Z表示将每日zD.t按照时刻排序所得到的序列.

3 异常用电检测方法

3.1 总体设计

本文采用专变用户电流电压曲线数据作为挖掘样本.根据专变用户的用电特征和常见的窃电手法提出了一种基于用电特征分析的无监督异常用电检测方法.引入离群点分析算法,将采集数据进行特征提取,凝练出用电特征序列,随后对其进行特征分析,得到异常指数序列,将用电行为的异常程度进行量化并通过所提出的异常用电评价流程在持续时间上作出划分以减少误报的可能性.异常用电检测方法总体设计如图3所示.

图3 异常用电检测方法总体设计

3.2 异常用电评价流程

第2节基于电参量构建了用电特征以表征用电异常程度,但无法从某个单一的特征做出判别.因此本文建立异常用电评价指标综合量化用户在时间序列上的用电异常程度,为异常用电的判别提供依据.

对原始数据进行归一化处理,以消除量纲对计算结果的影响.由公式(6)容易看出yn∈[0,1],因此电压异常特征序列Y=(y1,y2,y3,…,yn)所有取值都在[0,1]之间,不需要采取归一化这一步骤.将用电不平衡特征序列X=(x1,x2,x3,…,xn)、电流异常特征序列Z=(z1,z2,z3,…,zn)进行归一化处理.转换结果如下:

转换函数为

定义异常用电评价指标

得到异常指数序列

以10日作为一个检测周期进行计算,将序列T=(t1,t2,…,t240)中的成分进行排序,输出序列T中的前p%数值作为阈值T1,排序中前q%数值作为阈值T2,返回数据集查找用户的异常用电时刻.此处p、q取值可参考台区以往窃电率.查找异常用电时刻流程如图4所示.

图4 异常用电评价流程

由于窃电行为通常持续数小时[22],因此检测过程中将异常用电评价指标持续5 h超过阈值T1判断为持续异常用电行为,此时的用电行为容易指向窃电的发生.异常用电评价指标超过阈值T2,判断为暂时异常用电行为,有较大的可能为采集异常或是供电异常.此方法能够剔除因阈值设置造成评价指标靠前的正常用电用户和技术性损失造成的异常用电记录,减少误报发生的可能性.

3.3 检测方法评价

根据电力公司实际采集的数据,基于高斯分布生成大规模模拟数据,验证所提出检测方法的可行性.模拟数据集中添加异常数据,共446400条.其中异常数据占比2.68%.根据模拟数据集规模对参数k、p、q进行选取.此次实验中选取k=20,p=5,q=2时能达到较好的分类效果.根据典型窃电电参量曲线构建异常样本,其中包括:(a)电压不平衡;(b)电流不平衡;(c)电流异常降低;(d)电流曲线移峰;(e)电压异常降低及供电异常.各类异常数据部分电参量曲线如图5所示.

图5 各类异常数据曲线

异常用电检测过程的实质是二元分类问题,所有样本将被划分为正类(异常数据)或负类(正常数据),当检测样本中的正、负类样本分布极端不均衡时,直接使用检测结果的正确率衡量其检测效果将失去意义.因此为了检验检测方法的可行性,用二元分类问题评判标准混淆矩阵及相关参数评判检测方法的可行性.异常用电检测结果组成的混淆矩阵见表1.

表1 异常用电检测结果

从表中能够得到本文所提出的异常用电检测方法针对大规模数据的查准率达到0.80,召回率为0.81.其中,查准率为被正确分类的样本与总样本的比值,召回率为被正确分类样本与真实正类样本的比值.查准率和召回率的调和平均值F1值达到0.81,检测方法的分类效果良好.

4 案例分析

本文采用的数据集为某市级供电公司智能电表采集的经脱敏处理含有窃电用户的50户专变用户电压、电流数据.将正常用电时刻标记为0,暂时异常时刻标记为1,持续异常标记为2.部分验证结果见表2.

表2 异常用电指数及判别结果

计算结果与真实情况基本相符.值得注意的是在挖掘过程中,异常用电行为首先会被判定为暂时异常用电行为,当异常用电时间超过设定的持续时间阈值后将被判定为持续异常用电行为.稽查人员能够通过异常种类和发生频率判断异常用电发生时刻.当异常用电行为经常发生时,可以判断用户发生了窃电行为,需要工作人员实施现场勘查.在实际应用中,此检测方法能够为监控人员追踪窃电行为提供有力参考.

5 结 语

本文提出了基于用电特征分析的无监督方式异常用电检测方法,解决了窃电检测需要大规模训练集的问题.通过用户用电信息采集系统采集的电参量曲线,引入离群点检测算法设计用电特征提取手段,量化用电异常.建立异常用电评价指标,对用电过程中的用电异常情况进行分类,以异常持续时间进行划分,得出更加精准的分析结果.该方法不存在迭代的过程,计算量较小,能有效检测出高用电量专变用户持续性的异常用电行为.通过模拟数据的分析和算例的验证,证明了本方法对于异常用电行为检测的有效性.检测方法仍需要进行完善,后续将研究应对电力公司多渠道来源、多数据种类海量数据,将异常用电检测方法运用到反窃电系统研究中,进一步提高对异常用电检测的准确性以满足企业及时精准探查窃电行为的需求.

猜你喜欢
离群用电电流
基于相关子空间的高维离群数据检测算法
随感
用电安全要注意
近荷独坐
标定电流与额定最大电流的探讨
候鸟
学习用电小知识
交变电流基本知识汇总
交变电流高考真题赏析
挑战眼力