基于灰色分析的集抄数据异常判定

2016-06-08 07:11王卫公牟婷婷王兰君辛洁晴国网上海市电力公司市北供电公司上海0007上海交通大学电气工程系上海0040
电网与清洁能源 2016年4期
关键词:灰色关联度分析

王卫公,,牟婷婷,王兰君,辛洁晴(.国网上海市电力公司市北供电公司,上海 0007;.上海交通大学电气工程系,上海 0040)



基于灰色分析的集抄数据异常判定

王卫公1,2,牟婷婷2,王兰君1,辛洁晴2
(1.国网上海市电力公司市北供电公司,上海200072;2.上海交通大学电气工程系,上海200240)

摘要:提出综合缺陷分析和失真分析的集抄数据异常判定流程,着重针对目前用电量环比波动率判据的不合理性,运用灰色分析理论构建集抄数据失真判定的两阶段法:第一阶段通过电量折算削弱季节变迁对用电环比波动率的影响;第二阶段实施灰色关联度分析判定用电模式稳定性,对用电模式稳定的用户采用灰色距离测度法估计月用电量合理区间,以此作为集抄电量异常判据。对上海市北地区8 643个计量点2015年7月的集抄数据分析,结果表明所提方法能降低气候变化或特殊用电模式造成的集抄数据异常误判,合理降低复核工作量、提高出账率;所提方法还可同时找出窃电可疑用户、一定程度上克服集抄环境下的窃电隐蔽问题。

关键词:集中抄表;数据异常;用电模式分析;灰色关联度分析;灰色距离测度法

Project SuPPorted bY the Nationa1 Natura1 Science Foundation of China(51337005);

KEY W0RDS:centra1ized metering;data anoma1Y;consumP-tion mode ana1Ysis;greY re1ationa1 ana1Ysis;greY distance measure

我国对低压用户已基本实现集中抄表全覆盖。集抄系统定期回传每日总电量和分费率电量冻结值,可提高抄表质量、减轻抄表工作的人力物力[1-2]。不过,实际应用中发现回传数据常有异常,若不加剔除并对相应用户进行人工核抄,易激发供需矛盾、或导致供电企业营销收益损失。因此,建立有效的集抄数据异常判定方法对集抄真正起到减员增益的作用关系重大。

集抄异常判定包括2个层面的问题[3]:一是数据审核(或称集抄消缺),旨在发现表计故障、信道质量差等原因导致的数据缺陷(缺失/奇异值/总分不匹配);二是数据失真判定,供售环节其他原因造成的集抄电量相对实际用电情况的偏离均属此范畴。

相关文献多数探讨的是引起集抄数据异常的原因,如天气原因[4-5]、设备(电能表、采集终端、主站)硬件故障[6-7]、人为改动计量表计或分流计量回路导致[8]等等。此外,也有少量文献探讨了判定集抄数据异常的方法,如文献[3]对电能冻结值突降/突增给出了经验性判据,但该文针对的仅是消缺意义上的数据审核问题。

供电公司实际运用中,目前是将用电量环比波动率超50%、集抄数据缺失、总分电量不匹配、首次出账、零电量作为5种需人工核抄的情况。上述原则存在如下不合理性:1)没有考虑气候变迁的影响,季节交替时若气温变化很大,高气温敏感性用户的月电量环比波动率超50%可能是正常的;2)没有考虑用户特有用电模式的影响,短租房、用户回乡或度假等情况下月用电量会大幅变化,而城市外来人口增加和生活水平提高使得上述用电模式所占比例不容小觑;3)无法发现窃电导致的电量失真,窃电户月用电量处于低水平、波动不大,由于零电量用户数众多,供电公司一般并不马上对零电量进行用电检查,而自动抄表又减少了供电方及时了解用电现场的机会,使窃电更隐蔽。

对上述几种情况,目前的集抄异常判定原则都会造成误判或漏判。为此,本文提出集抄异常判定流程,并着重对集抄数据失真提出一种基于灰色分析的二阶段判定方法,使数据异常判据能计入用电模式的差异。

1 集抄异常判定流程

为方便实施后续处理,所提流程不是将用户划分为数据正常/异常2类,而是划分为待消缺、待稽查(可辅助方法进一步分析窃电嫌疑性后稽查)、待核抄、可直接出账4类。为此,提出集抄数据异常判定流程如图1,包括如下5步:

1)数据预处理。删除日期重复的记录;对日冻结电量进行差、和运算,求得逐日总/分费率有功用电量及当月总/分费率有功用电量。若用户某日总/分费率电量冻结值缺失,则其当日及前一日总/分费率用电量也缺失;若某用户当期(指出账月份)首日和/或下期首日总/分费率电量冻结值缺失,则其当期总/分费率用电量缺失。

图1 集抄数据异常判定流程Fig. 1 Flowchart of data anomaly determination for centralized metering systems

2)集抄缺陷分析。找出当月总/分费率用电量缺失或为负、总分电量不匹配、部分日用电量缺失或奇异的用户。上述情况暗示了集抄系统存在设备、安装或信道问题,相应用户纳为待消缺用户;但部分日数据缺失或奇异并不一定影响出账电量的准确性,这部分用户仍参与后续数据失真判定。

3)新装用户判定。将首次出账用户纳入待核抄用户清单,其余用户执行下一步。

4)集抄失真初判。削弱季节性气温变迁的影响,进而将零电量和用电量环比波动率超50%的用户初判为失真可疑,执行后续步骤;其余归为可直接出账用户。

5)集抄失真二次判定。对零电量用户建立选择性复核机制;对因用电量环比波动率超50%而初判为失真的用户实施用电模式分析,估算其合理用电范围,据此进一步判定有否失真;并综合用户历史用电情况、当期用电变化特征,从集抄数据失真用户中区分出待稽查(窃电可疑)和待核抄用户。

上述步骤中,第4)和第5)步属于集抄失真判定问题,下文细化其方法。

2 基于灰色分析的集抄失真判定法

2.1初判方法

为削弱气候变迁对月用电量环比波动率的影响,将当期月用电量折算到上期月均气温下。鉴于初判时面对的低压用户数巨大,折算采用按用电性质(居民/小商业/小工业/非工非经营性)分类估算的气温灵敏度系数。该套气温灵敏度系数对夏、冬季分别估算,通过随机采样和平均后求得。若记当期和上期月均气温分别为,用户k当期月总用电量为(上标R表征集抄值),其当期月总用电量折算值式中用户k当期月用电量关于月均气温的灵敏度系数εk,0根据该用户用电性质和当期月所属季节取值,当期和上期均处春/秋季时取零值。对夏季、春夏或夏秋交替季节,气温越高用电量越高(εk,0>0),时月用电量折算后有所降低,时则反之;对冬季、秋冬或冬春交替季节,气温月底用电量越高(εk,0<0),时月用电量折算后有所增加,时则反之。

进而,将如下2类判为集抄失真可疑:

1)当期总有功电量为零。

2)当期总有功电量折算值相对于上期月总有功出账电量的环比波动率≥50%。

2.2二次判定方法

二次判定流程如图2所示,基本思想是:

图2 集抄数据失真的二次判定流程Fig. 2 Flowchart of the secondary anomaly judgment for centralized metering data

1)建立零电量选择性复核机制:若用户近2年内有窃电记录,出现零电量即判定为窃电可疑;否则实施零电量用电模式判定(见2.2.1节),对属于零电量用电模式的用户保持每半年一次的人工复核,不属零电量用电模式则出现零电量也作为窃电可疑。

2)对月用电量折算值环比波动率超50%的用户:近两年有窃电记录且月用电量突降时判为待稽查用户;对装接满两年且近两年无窃电记录的用户实施用电模式稳定性分析(见2.2.2节),对判定为用电模式稳定的用户估计当期月用电量合理区间(见2.2.3节),月用电量高于合理区间时核抄、低于合理区间时派单稽查、在合理区间内仍作为可出账用户;用电模式不稳定或历史出账数据不足2年,不具备用电量合理区间估算的条件,均归为待核抄用户。

2.2.1零电量用电模式的定义和判定

若历史月用电量满足如下3种情况之一,就定义相应用户为零电量用电模式:

1)月用电量长期(如6个月)为零值,代表了空置屋的情况。

2)反复波动并出现过零电量,对应流动性住户(如短租房、度假型住屋、住户经常出差等情况)。对此,以用户前12个月用电量标幺值(以期间最大月用电量为基准)的方差描述用电波动率,按如下判据判定

3)去年同期电量为零值,对应固定时间回乡、度假等情况。

在每半年一次的人工复核机制下,按上述原则判定的零电量用电模式可与窃电、计量装置缺陷引起的零电量区别开来。

2.2.2用电模式稳定性判定方法

用电模式稳定性判定针对当期用电量非零且历史用电数据满24个月的用户。对用电模式稳定的用户,按历史数据预测而得的用电量合理区间才具有集抄电量异常判据的意义。针对上述目的,以12个月月份系数(月总有功电量占12个月平均月总有功电量的比值)定义用电模式时间序列,采用灰色关联度分析法判定用电模式稳定性。

以下记用户过去第1~12个月为第I年,过去第13~24个月为第II年。用电模式稳定性分析按如下流程进行:

1)将历史月用电量折算到基准气温下

首先利用最近一次夏季(6~9月)、冬季(12月~次年2月)的日用电量数据,计算用户k夏季、冬季日有功电量关于日平均气温的灵敏度系数,分别记为和。若第y年(y=I,II)第m月实际的月平均气温均值为,则该月用电量折算公式为

式中:ny,m为第y年第m月的天数;εk,m为气温灵敏度系数,第m月为夏(冬)季月时取,春秋季月份时可取0。

2)计算月份系数

据基准温度下的折算值得到过去24个月的月份系数(y= I,II;m=1,…,12)

3)求两年月份系数序列的关联度

用第I、II年月份系数定义用户k的两个用电模式时间序列χk,I={xk,I(1),…,xk,I(12)}和χk,II={xk,II(1),…,xk,II(12)},它们构成关联度分析的两个因素序列。为判定两者的关联度,先计算两极最大差和最小差[9]。

其次,对因素序列中每一因素计算关联系数

式中:ρ∈[0,1]为分辨系数,一般取0.5。

对用户k计算关联系数的均值

将Δk大于阈值的用户判定为模式稳定。

2.2.3月用电量合理区间的预测方法

对用电模式判定为稳定的用户预测当期月用电量合理区间。包括如下两步:

1)预测用户当期月用电量灰色估计值首先按月份系数法预测当期月用电量

式(11)所得预测值可视作当期月均气温为上两年同期月均气温加权均值时的月用电量。故据当期实际月均气温,按下式对当期月用电量灰色估计值修正

2)估计当期月用电量合理区间

采用灰色距离测度法估计用户当期月总用电量合理区间,该方法尤其适用于小样本实验数据情况下变量概率分布特征难以有效估计的场合[10-12]。

式中:α为置信度,灰色距离测度计算为

其中ξ∈[0,1]为分辨系数,本文取0.5。

3 算例分析

本文所提方法已在上海市北供电公司应用。算例以该供电公司辖区内54台集中器下低压用户2015年7月的集抄数据为例进行分析。剔除新装用户后共有表数8 643台;数据缺陷分析发现其中当月全部日用电量缺失的有96台;另有3户新装用户,归为待核抄用户;其余8 544台参与数据失真判定。

按目前做法,8 544台中当期用电量为零的有217台,用电量环比波动率超50%的多达5 848台,合计6 068台(70.17%)需人工核抄,集抄出账率仅28.68%(2 479台)。

3.1初判结果

运用本文的二阶段失真判定方法,首先在初判环节削弱季节性气温变迁的影响。2015年6月该市月均气温为24.53℃,而7月的月均气温为27.45℃,气温上升明显。将各计量点7月电量折算到6月同等平均气温水平下后,用电量环比波动率超50%的表数下降为2 625台,较常规方法减少了3 223台。这说明气温变迁时月用电量影响较大,用电量环比波动率超50%作为集抄异常判据很可能导致误判而白白增加复核工作量。

3.2二次判定结果

据初判结果,需执行二次判定的计量点共217+ 2 625=2 842个。对其集抄数据按图2流程进行判定,其中取阈值为0.67。判定结果见表1。可见:

表1 二次判定结果Tab. 1 Results of the secondary judgment

1)无窃电记录的零电量用户中,属零电量用电模式的141户、非零电量模式64户。这些用户均无近半年内的零电量复核记录,故均归为待核抄用户。

2)通过用电模式稳定性分析和用电量区间预测,增加可出账计量点854个。这些用户虽折算后的用电量环比波动率超50%,但仍属其用电模式对应的合理区间中。

3)二次判定中还发现窃电可疑计量点166个。其中,当期零电量且有窃电记录的12个,当期折算后用电环比降幅超50%且有窃电记录的5个,用电模式稳定而当期折算后用电环比降幅超合理区间的149个。

3.3与常规方法对比

表2将本文所提方法与常规方法的判定结果进行了对比。可见前者主要变化有如下两点。

表2 2阶段判定法与常规方法判定结果对比Tab. 2 Comparison of the judgment results of the proposed two-stage judgement method and the conventional method

1)核抄计量点数由6 068降为1 822。该特性主要来源于用电量环比波动率分析时削弱了气温变迁的影响,以及月用电量合理区间预测时考虑了用户自身用电模式的波动特点。由此将集抄直接出账率由28.68%提升至75.85%。若对零电量用户建立半年一次的复核机制,则可进一步提高出账率。

2)不仅区分消缺/核抄/可出账用户,还能找出窃电可疑用户。

4 结论

本文对集抄数据审核和失真判定提出了算法流程,着重针对现有判据的不足,提出了一种基于灰色分析的2阶段判定方法。算例分析表明所提方法具如下优点:

1)通过用电量折算和基于灰色分析的用电模式稳定性分析、用电量合理区间预测,可减少季节性气温明显变化、用户特殊用电模式(零用电模式、大波动率)下集抄异常的误判率,降低人工复核工作量,提升集抄直接出账率。

2)从数据异常用户中区分出窃电可疑用户,一定程度上克服集抄环境下窃电隐蔽的问题。

参考文献

[1]胡江溢,祝恩国,杜新纲,等.用电信息采集系统应用现状及发展趋势[J].电力系统自动化,2014,38(2):131-135. HU JiangYi,ZHU Enguo,DU Xingang,et a1. APP1ication status and deve1oPment trend of Power consumPtion information co11ection sYstem[J]. Automatic of E1ectric Power SYstems,2014,38(2):131-135(in Chinese).

[2]徐伟,王斌,姜元建.低压电力线载波通信技术在用电信息采集系统中的应用[J].电测与仪表,2010,47(7A):44-47. XU Wei,WANG Bin,JIANG Yuanjian. Power 1ine carrier communication techno1ogY and its aPP1ications in e1ectric energY data acquisition sYstem[J]. E1ectrica1 Measurement & Instrumentation,2010,47(7A):44-47(in Chinese).

[3]钱立军,李新家.用电信息采集系统中数据审查策略与异常原因分析[J].电力需求侧管理,2013,15(1):45-47. QIAN Lijun,LI Xinjia. StrategY of the data checking and the excePtion reason ana1Ysis in the information co11ection sYstem[J]. Power Demand Side Management,2013,15(1):45-47(in Chinese).

[4]张立忠,秦立刚,陈文金.低压智能集抄系统[J].农村电气化,2013(10):10-11. ZHANG Lizhong,QIN Ligang,CHEN Wenjin. Low-vo1tage inte11igent centra1ized metering sYstems[J]. Rura1 E1ectrification,2013(10):10-11(in Chinese).

[5]王艳芹,康强.远程抄表系统的功能及应用[J].华北电力技术,2003(4):28-33. WANG Yanqin,KANG Qiang. Functions and aPP1ication of remote metering software sYstem[J]. North China E1ectric Power,2003(4):28-33(in Chinese).

[6]袁建英.用电信息采集系统高级应用构想[J].电力需求侧管理,2011,13(6):58-59. YUAN JianYing. The concePt of Power information co11ecting sYstem advanced aPP1ication[J]. Power Demand Side Management,2011,13(6):58-59(in Chinese).

[7]范洁,陈霄,周玉.基于用电信息采集系统的电能计量装置异常智能分析方法研究[J].电测与仪表,2013,50(11):4-9. FAN Jie,CHEN Xiao,ZHOU Yu. An inte11igent ana1Y-tica1 method of abnorma1 metering device based on Power consumPtion information co11ection sYstem[J]. E1ectrica1 Measurement & Instrumentation,2013,50(11):4-9(in Chinese).

[8]王珏昕,孟宇,殷树刚,等.用电信息采集系统反窃电功能现状及发展趋势[J].电网技术,2008,32(S2):177-178. WANG Juexin,MENG Yu,YIN Shugang,et a1. The Present situation and deve1oPment trend of anti e1ectric sto1en function of Power demand information acquisition sYstem[J]. Power SYstem Techno1ogY,2008,32(S2):177-178(in Chinese).

[9]邓聚龙.灰色理论基础[M].武汉:华中科技大学出版社,2002:35-76.

[10]刘义,王国玉,柯宏发.一种基于灰色距离测度的小样本数据区间估计方法[J].系统工程与电子技术,2008,30(1):116-119. LIU Yi,WANG GuoYu,KE Hongfa. APProach of Parameter estimation for sma11 samP1es based on greY distance measure[J]. SYstems Engineering and E1ectronics,2008,30(1):116-119(in Chinese).

[11]KE Hongfa,CHEN Yongguang. An interPo1ation technique based on greY re1ationa1 theorY[J]. The Journa1 of GreY SYstems,2006,18(1):79-83.

[12]KE Hongfa,CHEN Yongguang,LIU Yi. Data Processing of sma11 samP1es based on greY distance information aPP-roach[J]. Journa1 of SYstems Engineering and E1ectronics,2007,18(2):281-289.

[13]黄永高,卢毅.基于小波分析和灰色模型的用电量预测[J].电网与清洁能源,2011,27(3):34-37. HUANG Yonggao,LU Yi. E1ectricitY consumPtion forecasting based on wave1et ana1Ysis and graY mode1[J]. Power SYstemandC1eanEnergY,2011,27(3):34-37(in Chinese).

[14]孙红革,张娟.电能计量远程抄表系统的应用及改进措施[J].陕西电力,2007,35(4):81-82. SUN Hongge,ZHANG Juan. APP1ication and imProvement measures of remote e1ectricitY meter reading sYstem[J]. Shaanxi E1ectric Power,2007,35(4):81-82(in Chinese).

[15]朱玉泉,李振林.联合站能耗灰色关联分析[J].节能技术,2008,26(152):560-563. ZHU Yuquan,LI Zhen1in. GreY re1ationa1 ana1Ysis on the energY consumPtion of oi1fie1d combination station[J]. EnergY Conservation Techno1ogY,2008,26(152):560-563(in Chinese).

王卫公(1968—),男,高级工程师,研究方向为电力营销和电能计量管理;

牟婷婷(1992—),女,硕士研究生,研究方向为数据挖掘技术在集抄数据分析中的应用;

王兰君(1983—),女,经济师,研究方向为电力营销和营业管理;

辛洁晴(1973—),女,副教授,研究方向为电力营销和电力市场。

(编辑徐花荣)

Data Anomaly Determination for Centralized Metering Systems Based on the Grey Analysis Methods

WANG Weigong1,2,MOU Tingting2,WANG Lanjun1,XIN Jieqing2
(1. Shibei E1ectric Power SuPP1Y ComPanY,SMEPC,Shanghai 200240,China;2. DePartment of EE,Shanghai Jiaotong UniversitY,Shanghai 200072,China)

ABSTRACT:A f1owchart for data anoma1Y determination is Presented in this PaPer,which is ab1e to identifY both defects and distortions in the centra1ized metering data. In the 1ight of the irrationa1ities of the current1Y used consumPtion chain vo1ati1itY criteria,a two-stage method is esPecia11Y ProPosed based on the greY ana1Ysis theorY for metering data distortion determination. In the first stage,imPact of seasona1 temPerature changes on the consumPtion chain vo1ati1ities is weakened bY converting consumPtion to a unified temPerature condition. In the secondarY stage,consumPtion mode stabi1itY is ana1Yzed bY the greY re1ationa1 ana1Ysis method. For customers with stab1e consumPtion modes,rationa1 month1Y consumPtion ranges are eva1uated bY the greY distance measure method and used as refined criteria of data anoma1Y. I11ustrative examP1e is Presented based on the metering data of 8643 1ow-vo1tage customers in the north area of Shanghai in Ju1Y 2015. Resu1ts show that the ProPosed method can reduce misjudgment in metering data anoma1Y ana1Ysis caused bY temPerature variation or sPecia1 consumPtion modes,reducing the burden of artificia1 metering review and increasing accounting rate of the centra1ized metering sYstem. APart from this,the ProPosed method can a1so identifY e1ectricitY stea1ing susPects so as to a11eviate to a certain extent the concea1ment of e1ectricitY stea1ing in the environment of centra1ized metering.

文章编号:1674-3814(2016)04-0006-06中图分类号:TM93

文献标志码:A

基金项目:国家自然科学基金重点项目(51337005);国家电网公司科技项目资助(52091414007Y)。

收稿日期:2016-03-01。

作者简介:

猜你喜欢
灰色关联度分析
不同施肥管理措施下土壤生物环境的灰色关联度分析
藤本月季品种适生性评价
浅析上海住房价格的主要影响因素
浅析上海住房价格的主要影响因素
上海国际航运中心影响因素实证分析
播期影响下杂交早稻主要农艺性状与产量的多重分析
语文考试成绩与主要知识模块的灰色关联度分析
转让环节税费改革对抑制深圳房价作用度研究
灰色关联度分析在玉米生产试验中的应用
中国OFDI反向产业结构调整关联效应研究