基于停电图纹识别线变关系的实现

2018-11-08 03:27湖南国网永州供电公司汤新华
大众用电 2018年10期
关键词:图纹归类台区

● 湖南·国网永州供电公司 蒋 涛 汤新华 李 娟

线变关系是指供电企业线路与变压器之间的对应关系,通常每台变压器都连接到固定的线路上,线变关系正确与否将直接影响到配电抢修效率和优质服务质量的好坏,同时也决定着线损计算正确与否。目前核对线变关系的主要方法是现场核对,通过现场与图纸、系统对比,发现差异并整改问题,实现三者的统一。对配电变压器新增、改接、销户引起的线变关系变动要加强管理,确保系统档案与现场一致,避免前清后乱。实际工作中,受多种因素影响,线变关系在系统档案中会出现与现场不一致的情况,管理人员难以及时发现档案中存在的问题。

基于“同一线路终端停电时间一致”原理,永州供电公司利用数据挖掘技术建立识别模型,为识别档案中线变关系正确与否提供一种新的手段,可以极大地提高线变关系核对效率,减少大量的人工操作。

1 数据概要

随着电力采集终端在现场安装率和运行稳定性的不断提高,利用其对现场台区运行状况进行监测已成为现实。现场运行的终端根据自身供电情况产生对停/上电的判断,并将判断结果主动上报形成停/上电记录,记录仅局限于对单个终端的运行工况。

1.1 停电数据的生成

停电事件的生成包括终端停/上电和电能表掉电事件的生成。本文仅分析与线路有关的台区停电数据,因此重点研究终端停/上电数据的生成。

根据《智能电能表及采集终端事件记录采集规则》,终端停/上电事件为1级紧急事件,终端生成事件后,采集终端采用光纤、手机网络等方式主动上报事件数据到主站,而后主站向终端下发确认命令。

1.2 停电数据的干扰因素

由于用电现场环境复杂、情况多变,采集终端可能由于供电回路异常、软件设计差异、通道通信、终端时钟等原因,出现现场未停电情况下生成停电事件并主动上报主站,或是发生了一次停电却多次上报停电事件等情况。因此,在利用停电数据进行数据分析时,要充分研究停电事件生成原理,掌握终端停/上电数据质量的影响因素,对误报干扰信息进行清理,保留有价值的数据。

2 实现过程

终端停/上电数据来源为“电力用户用电信息采集系统”中的主站停/上电事件查询,由县供电公司分月导出。整个实现过程分成5个步骤,分别是数据可视化、数据清洗、数图转换、聚类分析和结果可视化,其中数据清洗、数图转换、聚类分析3个步骤重点在于对数据进行处理,由于涉及到大数据量的计算,可以通过Python编程形成一个可执行文件自动完成;数据可视化和结果可视化使用Tableau工具完成,最终结果是形成停电图纹PDF文件和异动台区Excel文件。

2.1 数据可视化

根据电力用户用电信息采集系统主站停/上电查询界面,其数据是以停电事件为记录,即每一个记录代表每一个终端上报的停/上电事件,对终端一次完整的停/上电事件进行记录,数据包括用户编号、线路名称、停电发生时间和停电结束时间。

停电数据可视化有助于了解、发现数据的特点。利用Tableau工具可以对终端停/上电数据进行可视化分析并得到结果。可视化结果以单个台区为记录,反映单个台区在一段时间(本文取1个月)内的停电时间和停电时长,每一个条纹代表一次停电,每个条纹位置对应停电时间点,条纹的宽度代表停电时长。由此可以发现每个台区的停电图形有其自身的独特性,类似于人类的“指纹”,为此,笔者提出了“停电图纹”的概念,通过特定停电图纹可以快速地识别一个台区。据此可以利用停电图纹的相似性来聚类台区,将停电图纹相似度极高(即多次停电相同)的台区归成一类,然后将聚类结果与档案数据比对,把有差异的情况视为异动。

2.2 数据清洗

通过对业务数据形成的理解和停电数据的分析,发现停/上电数据质量上存在问题,主要表现在:停电时间不规范,标准停电时间格式为yyyy/m/d h:mm,不规范停电缺失时间格式为yyyy/m/d,经过分析,缺失时间以0点0分为主,解决办法是按标准格式补齐数据。

另外,为提高聚类分析的准确度,聚类分析使用的停电图纹要基于多次停/上电的数据,因此要清洗掉分析数据中停电次数仅为一次的台区数据。

2.3 数图转换

通过数据分析,发现即使是同一时间同一线路的台区数据中的停电时间也存在不一致的情况,时间偏差集中在1~5分钟,最大偏差可达30分钟,存在这种现象的原因是终端时钟不一致所致。鉴于停电偏差的问题,直接使用时间点来聚类的效果会很差,通过使用停电图纹可以有效避免时间偏差的问题,提高数据分析成效。

以2月份国网道县供电公司道万线三角街台区(采集点)为例,该台区共停电4次,总停电时长598分钟。经过数据可视化,转换成4个条纹,对应相应的时间点、时长等停电特征,形成了该台区2月份的停电图纹,如图1所示。

图1 停电图纹数图转换过程

把可视化的停电图纹以数字的方法存储,首先建立以分钟为颗粒度的时间序列,以一个月30天计算,时间序列长度为30×24×60=43200个单元,每一个单元表示该台区在这一分钟是否停电,未停电为0,停电为1,最终形成该台区停电图纹序列。将当月所有台区停电序列放在一起,就形成了当月的停电图纹矩阵,在此数据基础上再开展图纹相似度的计算。

2.4 聚类分析

2.4.1 聚类算法选择

聚类是将物理对象或抽象对象的集合分成由类似的对象组成的多个类的过程,聚类是一种无监督学习。本文使用的聚类算法是DBSCAN算法,它是一个有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。DBSCAN算法不需要事先知道要形成的簇类的数量,可以发现任意形状的簇类,并能够识别出噪声点,且对于数据库中样本的顺序不敏感。正是基于以上特点,本文选择了DBSCAN算法作为实现过程中的聚类算法。

2.4.2 聚类算法实现

利用Python编程对停电图纹进行聚类,在结果数据中增加3个字段:归类、问题归类、异常点。归类是聚类算法计算的直接结果,算法以图纹相似大于90%为条件,将台区自动聚类,聚类结果以自然数(0、1、2 ...)标记归类,每一个归类将停电特征相近的台区进行统一标记编号。

问题归类是指同一归类中,当出现多个不唯一的线路名称时视为问题,将同一归类中线路名称种类不为1的归类标记为问题归类。

异常点是在问题归类中查找线变关系有可能出错的台区,按同线路台区出现数量的多少为判断,数量少的线路名称上的台区为异常点,算法默认线变关系中多数台区的线变关系是正确的。

2.5 结果可视化

聚类算法的结果利用Tableau工具进行可视化处理成停电图纹。通过停电图纹,可以发现档案在道万线上的三角街台区与道上线的其它台区停电图纹非常相似。对于停电时间和时长如此相似的台区,笔者初步判定道万线三角街台区、道县上关乡石门村油茶基地台区位于道上线上,这2个台区档案可能存在问题,将此异动下发到基层单位进行核对,结果证明判断正确。

3 模型应用

整个实现过程将数据可视化技术和数据挖掘技术紧密结合,通过编程方法进行封装,操作人员只需要按要求提供有效的终端停/上电数据,一个程序、一张图即可通过停电图纹识别线变关系。

在实现工作中,模型能发现和解决很多问题,但同时仍存在一些问题,比如单个母线多次停电导致多条不同线路停电图纹一致,台区单次停电较长会影响相似度的对比,程序界面不友好,分析数据基于离线数据,这些都是下一步需要改进的地方。

4 结束语

停电图纹识别线变关系是对停电数据的挖掘和应用,充分挖掘停电数据的价值。通过数据分析,可以大大降低业务部门现场核查的工作量,同时形成有效的监督手段,充分利用数据来督办现场工作。

猜你喜欢
图纹归类台区
青铜绘画·兽面图纹、水陆攻战图纹
电表“对”与“错”归类巧掌握
“古币”会挖沙
Happiness through honorable actions
降低台区实时线损整治工作方法
分式方程应用题归类解说
凌絮裙摆
凌絮裙摆
三合一集中器作为台区线损考核表计的探讨
多功能低压台区识别设备的研制