陈焱彬 黄 腾 牛继伟 李腾腾 刘凯仑
(深圳供电局有限公司,广东 深圳 430223)
窃电是影响线损的重要因素,不法分子的手段也变得隐蔽化与智能化[1]。本研究的重点在于利用大量的台区用电数据,通过多组数据关联分析,提取线损异常数据并分析可能存在窃电行为的概率。台区线损率是反窃电工作的重要依据,也是低压配电台区线损管控的重要指标[2-3]。南网供电公司大力开展基于线损的反窃电研究,文献[1]基于高速电力载波通信技术和用电信息采集系统,辨别线损指标超差的台区,并针对线损超标的台区进行计量装置检测,从而发现窃电行为。文献[2]基于现场排查低压用户窃电的分析与治理过程,套路台区降损的治理。文献[3]针对窃电的主要方法进行介绍,并通过对比采集的实时数据与理论数据,划定窃电发生范围。由此可见,台区线损率与窃电行为有密切的联系,采用传统统计分析方法难以分辨大量数据之间的隐形关系。本文旨在使用FP-Growth算法对台区线损数据进行分析,并利用FP-Growth算法对窃电数据进行挖掘和分析。通过挖掘,分析对应的关联规则。最后,针对窃电挖掘结果进行分析。
目前,供电公司线损一直居高不下,线损的原因包括在供电系统中各电器元件引起的损耗,以及窃电行为猖獗。据有关部门统计,每年因窃电造成的损失高达200亿元[2]。因此,本文以窃电为例进行研究,并对现场线损异常台区、用电异常数据进行分析,提取故障特征,针对窃电行为进行建模,具体内容如下。
排查线损高台区,现场稽查通过打开表盖,用户私自采用控制微型继电器闭合短接表内线路,达到控制用电时间进行窃电的目的。现场检查拆开表计进行检查,发现表计内部三相电加装电子设备、用铜丝相连,证实窃电情况。此类异常可通过上报的开盖记录异常事件进行排查。开盖记录异常事件模型:读取电能表开盖事件记录,并判断电能表开盖时间与电能表安装时间阈值,电能表开盖时间或开表箱时间大于电能表安装时间即为异常事件记录。
现场稽查用户计量情况,发现用户私自接线,绕越电能表直接接入家中。通过钳形电流表测量,该私接线电流约6.79A,确认该户窃电。针对此类窃电行为建立窃电模型:目前,国网招标的电能表均为火线计量,即电流必须经过1、2端子才能正常计量。正常情况下,非共零线接线的单相表用户,火线电流等于零线电流。用采系统获取HPLC电表采集的零火线电流96点数据,将96点数据累计并比对,若火线电流与零线电流不相等(二者差异达到0.1A以上),则判断存在窃电嫌疑。
案例一台区线损突然升至10%~15%,据排查,发现用户失自松动A、B相电压线,导致表计失压;断开电压连接片,使电压采样电路失压导致该相不走字表计从而进行窃电。电能表失压模型:电能表电压小于(额定电压×80%)且持续时间大于12h。
某台区线损波动大,系统告警用户失流。现场排查接线无异常,用钳形电流表测量二次回路中的接线端子盒,发现A相电流线回路为断路状态。拆开接线端子盒发现,表计内部加有绝缘体,导致A相不计电量,达到窃电目的。经排查台区线损仍未降至合理范围,排查可疑用户,系统报某用户电能表失流,到现场排查打开计量箱检查发现接线无异常,但箱内布线凌乱,排查接线发现A、C两相电流线紧紧贴在一起,将其2根线拨开后,一细小的铅锡块掉了下来。该铅锡块为焊锡在A、C两相电流线之间的连接物 (导体),使A、C两相电流线短接,以达到少计电量的目的。表计失流模型:通过HPLC模块采集智能电能表电压、电流数据,连续监测96个点,发现电能表某一相电流低于额定电流的5%,即可判断为失流。
某台区某段时间日用电量波动巨大,且穿透用户电能表发现用户在线损异常的周期内存在停电记录,台区日线损率波动的时间节点与日用电量波动现象相吻合,因此,针对该用户进行窃电排查。经分析该用户在停电维修时通过私自调换AC相电压接线方式的方法进行窃电。通过对调A、C相电压接线的窃电方式可用下列公式说明。
假设该用户的三相负载平衡,令三相电压、电流的有效值分别为U、I,各相的功率因数角为φ,那么正确接线方式下,三相四线电能表的有功功率如公式(1)所示。
对调A相、C相的电压接线,则三相四线电能表的有功功率如公式(2)所示。
由公式(2)可知,当三相负载平衡且负荷为感性时,通过调换A相、C相的电压接线会导致电能表反向计量有功,从而使用户用电量少计。
根据以上异常情况,归纳故障模型为抄读反向电量以及反向电量事件;在排查现场用相位伏安表进行接线分析后排查。
同期线损监测10kV线路日线损率异常,根据用采数据进行计算,该线路在某一时间段的线损率较高,分析该条线路高损出现的时段,进一步缩小排查范围,并排查对象。现场排查采用钳形电流表及计量故障识别模块测量电表电流、电压以及误差等各项数值,与电表显示的读数进行比对,误差较大,进一步对可疑电能表进行开盖检测,发现电表内部非法加装了遥控装置。通过遥控器,随时调节电表的电流值,从而达到少计电量的目的。电能表误差超差模型:电能表误差>20%。
现场排查某阶段线损高台区,排查可疑用户,排查线路电压、电流,并抄读表计上三日冻结数据与当前数据比对,发现表计停走。经排查分析利用高电压放电装置,对电子式电能表进行高电压放电,使其黑屏(死机)无法正常计量。该高电压放电装置体积较小,通过前端放电探头,深入至表箱针对电能表显示窗口或者缝隙处进行放电,使智能电能表黑屏,从而无法正常计量,一段时间后进行掉电恢复,或者用别的装置将电能表激活,恢复正常,达到窃电目的。电能表停走模型:连续抄读电能表上7日电量,例如本日零点表码-上日零点表码为0,则判断为电能表停走。
采集系统发现某高供高计用户存在很大反向电量,现场检查发现电能表显示-Ia、-Ic,现场校验仪测试后发现确实存在进出线反接的情况,电能表不能正确计量,疑似窃电。潮流反向模型如下:非发电用户电能表反向有功总示值>0,且每日反向有功总示值>1kWh。
某线路持续高损,稽查发现,该户用电量长期与变压器容量明显不符。现场异常现象有以下2种。1)变压器体积>250kVA(合同容量)变压器的体积。2)铭牌4个角的钉柱有撬动痕迹。后续检测容量,发现用户私自更换大容量变压器,按私增容违约用电处理。互感器倍率错误模型:系统中设置的CT变比小于现场排查发现的CT变比。
将强磁铁放置在电能表对应的位置上,对电能表进行强磁干扰,或者对电能表注入谐波,使其工作混乱,无法正常计量。现象如下:电能表电量比上一日电量少。电能表倒走模型:电能表后一时间点的任一计度器示度小于电能表前一时间点该计度器的示度。
Apriori算法需要不断扫描数据集,梳理关联规则,效率较低,占用系统内存较大。FP-Growth算法在Apriori基础上通过扫描及针对数据集的数据处理,构建FP树,查找对应的条件模式基以及构建条件数来挖掘关联关系,确认频繁项集。
FP-Growth算法基本算法思路如下。1)首先,将数据集进行扫描,梳理各频繁项集,然后根据定义的最小支持度,剔除不满足要求的项集。其次,将原始数据集根据频繁度进行降序排列。2)针对排序后的项集,再次进行扫描,先创建项头,然后按从上往下的顺序构造FP树。3)根据创建的FP树按照从下往上的顺序,寻找条件模式基,根据定义的最小支持度,剔除不满足要求的项集,递归调用至单一路径结构,将生产组合排列则生成相关关联规则。
本文选取台区线损现场运维数据3843条,根据线损窃电故障分类模型,建立窃电故障信息库,通过筛选数据,剔除明显异常数据以及空值,筛选249条与窃电异常相关,其余数据为不确定是否与窃电相关数据。基于该线损窃电故障分类模型,选取与窃电相关的故障类型与事件编码见表1。
表1 窃电相关的故障类型事件编码
FP-tree是一种用于压缩表示输入数据的数据结构,它通过逐个读入事务,并将事务映射到FP-tree中的一个路径来进行构建。当不同的事务拥有共同的项时,它们的路径可能会部分重叠。当路径之间的重叠越多时,使用FP树结构进行数据压缩的效果就越好。要构建FP-tree,需要对原始数据集进行两次扫描。
根据表1窃电相关的故障类型事件编码,结合台区窃电相关事件数据,获得台区窃电相关数据集,见表2。
表2 台区窃电相关数据集
构建FP-tree第一遍须对对所有元素项的出现次数进行计数,见下述集合:{ A1:4; A2:5; A3:3; A4:3; A5:3;A6:1; A7:1; A8:2; A9:2; A10:1}
设置最小支持度为3,丢弃支持度小于阈值的非频繁项,得到频繁项集。根据设置的支持度,针对频繁项集进行递减排序,见表3。
表3 台区线损窃电频繁项集
然后将原项集中大于最小支持度的项按降序排列,见表4。
表4 降序排列后的数据集
再次读取原始数据集中的每个事务,并按照次序将事务中的项插入FP树中。如果树的当前节点已经包括待插入的项,那么增加该节点的计数值;否则,创建一个新的节点,并将其添加到树中。这样,通过两次扫描,就可以构建一个包括所有事务的FP树。根据表4的台区线损窃电数据集构建FP-tree(如图1所示)。
图1 台区线损窃电数据FP-tree
根据FP-tree对每个元素项获取其对应的条件模式基。条件模式基是以所查找元素项为结尾的路径集合。每条路径其实都是1条前缀路径。按照从下往上的顺序得到条件模式基,见表5。
表5 条件模式基表
根据条件模式基挖掘频繁项集,产生的频繁项集如下。
{A2,A1:4}
{A2,A5:3}
{A2,A4:3}{A1,A4:3}{A2,A1,A4:3}
{A2,A3:3}
根据以上FP-tree产生的频繁项集以及对应的频繁项集计算支持度和置信度,细化强关联结果。设定最小支持度为30%,最小置信度为60%,生成的规则见表6。
表6 窃电故障诊断显著关联规则模式分析
由产生的频繁项集可知,规则1出现电能表开盖记录或者开表箱记录以及电能表零火线电流不一致支持度为40%,置信度为80%,表明出现以上2项事件与台区线损窃电情况关联度高。规则2出现电能表开盖记录或者开表箱记录,互感器倍率错误的支持度为30%,置信度为60%,说明以上情况与台区线损窃电事件关联度较高。规则3出现电能表开盖记录或者开表盖记录、电能表零火线电流不一致、失压支持度为30%,置信度为60%;表明以上事件同时出现窃电的概率较高。规则4电能表开盖记录或者开表箱记录和潮流反向事件,支持度为30%,置信度为100%,表明出现电能表开盖记录和潮流反向事件时与出现台区窃电的情况强相关。由此可知,台区线损窃电中可能存在各种复杂的工况,经FPGrowth分析可知,如果遇到电能表开盖记录或开表箱记录、电能表零火线不一致、失压等情况,就需要到现场进行故障排查,分析是否存在窃电的情况。
本文针对台区线损治理过程中窃电方式升级、窃电时段较灵活等因素导致难以排查的问题,利用现场线损治理过程中和窃电相关的异常用电数据提取线损窃电故障分类模型,通过模型针对数据进行预处理,甄别窃电相关的故障类型,选择FP-group算法,分析对应的关联规则,如果对应系统检测到此类关联事件,则发出工单,至现场进行排查。