宋树宏,王炜,王伟恒,于雷,王超,潘子毅,付博
(国网沈阳供电公司,辽宁 沈阳 110003)
目前我国电力供应过程中,各种窃电手段层出不穷,部分窃电分子采用欠压法、扩差法、欠流法等手段实施电能偷窃,影响到供电企业的正常运行。为实现对反窃电工作的优化,供电企业需正视大数据技术应用的重要性,在原有电力信息系统中进行大数据技术的融合,进一步优化反窃电技术,实现对窃电行为的有效打击与抑制。
尽管现阶段供电企业对反窃电管理工作的开展逐渐加大力度,但是仍尚存些许不足之处,具体表现为:(1)难以做到对窃电量的精准统计。不同于现实产品,虚拟化的电能商品管理难度相对较大。常规统计记录手段的应用无法满足电能统计的实际需求,再加上基础监测设备技术陈旧,无法做到在供电监测过程中进行窃电量的精准统计,为窃电分子提供可乘之机。此外,因供电企业无法做到对线损情况的全面掌握,部分用户会以线损过大为理由进行窃电,对供电企业造成严重经济损失。(2)在反窃电工作的实施过程中,存在工作人员难以准确把握窃电问题的情况,尤其是针对临时性窃电而言,即使工作人员发现用户的窃电行为,但是因证据不足无法开展工作。(3)随着我国科学技术的发展,部分窃电分子采用的手段更为先进,导致反窃电工作开展难度增大。(4)供电企业用户广泛,涉及商业、工业以及居民用电等多种性质类别,再加上窃电手段的隐秘性,导致反窃电难上加难。正因此,借助大数据技术进行反窃电的优化,已然成为供电企业的主要研究课题。
借助大数据技术可以帮助工作人员进行用电数据信息的搜集与挖掘,通过深度挖掘与分析,进行线路线损实际情况的分析与判断,实现对线损基本规律的掌握与明确。同时,依托于大数据技术强大的分析功能,能够帮助工作人员掌握不同时段线损情况。以不同季节为例,冬季、夏季为线损率最高的季节,依托于对供电区用电信息、天气与季节数据的采集和分析,生成不同季节线损动态图,实现通过大数据分析来保证线损分析的准确性。
供电企业通过在用电信息系统中融合大数据技术,可实现对用户信息的实时采集,并以平台为基础进行海量数据的传输,而终端可依托于数据分析来判断用户用电情况。在智能信息采集系统运行过程中,若用户用电数据存在异常,平台会自主进行智能诊断与分析,判断其是否为窃电行为并第一时间提示预警。如在白天时段监控图显示三相电流数值呈现为均衡态势,但是在夜间时段出现一相电流值异常,系统可自行诊断并预警。当然,为确保相关工作人员能够直观掌握数据信息,平台可以以图形化、图表化的形式呈现数据,进而实现对反窃电工作的智能化开展。
此数据处理平台采用三层架构,用户数据信息通过现场终端完成采集,数据采集单元通过专网或公网信道进行数据信息接收,而终端采集命令与任务的下达,由采集单元负责。数据处理平台分别由内层、中层、外层组成,其中外层囊括预处理模块,中层则集成Map Rdeuce、Eclipse、融合引擎、监控等模块,内层则是云计算服务集群与数据库,该平台的构建实现指令下达、数据采集以及数据共享等。
本系统中的数据计算服务集群主要以Hadoop框架为载体,起到主节点活跃、备用主节点预热的作用,功能体现为信息系统数据计算,以分布式文件系统为载体进行数据库中相关数据的存放,针对数据计算主要采用Map Reduce作业,完成计算后数据录入数据库。
本系统中涉及对云实时数据库的构建,调度层囊括主节点与从节点,数据库中实时数据库数量依据需求合理设定。利用高速交换机连接数据库中主节点与从节点服务器,并以集群架构Hadoop构成软件层面,数据库的构建有助于提升系统中实时、历史数据的存储、利用效率。
3.4.1 二阶聚类
二阶聚类算法应用较为常见,作为BIRCH算法的改进,其步骤具体分为预聚类、正式聚类。预聚类过程涉及到对聚类特征树的构建,囊括诸多子类;正式聚类过程则是输入预聚类结果,依托于分层聚类达到再聚类的目的。聚类期间以集群距离为依据进行小集群合并,直至所有集群合并完成后方可结束。
3.4.2 深度学习
深度学习主要是以非线性模块来进行多层描述学习,其中各模块的描述,均含有三个转化过程,体现为简单描述→高层描述→抽象描述。通过对上述转化过程的大量积累,实现对复杂函数的深度学习。针对深度学习算法而言,是对建模数据的隐含分布进行自动学习,本系统采用以GRBM-DBN为框架的深度学习算法。首先,RBM训练采用相关对比发散数据。其次,进行RBM数据生成隐藏值的模拟,在此基础上开展其他RBM的训练。最后,进行分类操作。依据唤醒-休眠算法,结合对分类标志与隐藏单元的设置来达到权重变化的目的。针对唤醒-休眠算法而言,可以将唤醒体现为认知过程,以向上权重为根据,结合对外界特征的描述来进行各层抽象表示,针对下行权重,则需利用梯度下降来实现有效转变;休眠则可以以生成过程来体现,运行期间底层状态依托于向下权重与顶层表示来生成,可作用于层间向上权重的转变与调整。
3.4.3 CHAID决策树
本系统建模除采用聚类建模之外,还涉及对决策树建模的应用,其原理为在分类自变量时,以根结点来体现因变量,从而得到分类卡方值。若变量分类程度存在显著差异,则需进行分类P值大小的比对。然后在子节点设置过程选择存在显著差异的分类,达到最优分割的目的。
3.4.4 异常值检测
本系统针对异常值的检测采用箱线图,分别通过5个统计量来描述数据。该方法的应用,不仅可以应用于离散数据的粗略估量,亦可以进行异常值的精准判断。在实际应用过程中,无须借助假定数据形式进行分析,可以利用实际数据特征判断异常值。本系统中异常值判断标准定位为:QR(四分位距)、Q3(下四分位数)、Q1(上四分位数)。
国网沈阳供电公司根据用电信息系统大数据分析发现,XX公司存在疑似窃电的情况,利用大数据平台进行窃电用户特征分析,借助二阶聚类进行客户类别的形成,从指标、样例等维度分类用户,并采纳用户基本属性构建聚类模型,由此确定该企业用电特点。在确定怀疑对象后,进行用户锁定。采用深度学习和决策树,将该企业当月用电量、功率因数等关键性指标输入,结果发现该企业满足决策树规则模型,利用以DBN模型的深度学习方法进行准确率预测,依托于系统数据分析与采集,发现该公司进线电缆电流最高为50A左右,最低为30A,其结果与采集系统中显示的电流存在较大差异,确定该企业存在窃电行为。随后国网沈阳供电公司组织队伍开展现场检查。发现厂区内计量柜处于无封印状态,电表尾封有人为破坏痕迹。通过深入稽核发现,该企业用电性质不同于档案统计,表示该企业存在私自窃电、躲避电费的情况。最后,进行窃电行为取证。借助箱线图方法进行用户用电量和负荷的分析,得出精准的离群值和异常值。国网沈阳供电企业通过合理应用大数据反窃电平台,成功挽回该企业窃电造成的经济损失,同样论证了在实际反窃电工作中应用该平台的可行性。
上述案例证明,基于大数据的反窃电平台设计,一方面可以为供电企业用电违约行为的查处提供参考依据,另一方面则可以帮助供电企业维持电网的正常运行。
综上,随着窃电手段的愈发复杂和多元化,供电企业要想提高反窃电工作成效,应结合自身实际情况,构建完善的智能反窃电系统,精准定位用户窃电行为,采集充分的窃电行为证据,在进一步规范企业反窃电工作开展的同时,帮助供电企业减少损失、控制成本。