周 苏,王良之,宋 凯,曹 鑫,柯行思
(国网四川省电力公司供电服务中心,四川 成都 610041)
电网规模日益扩大,结构也随之日渐复杂化,确保电网运行安全性势必是非常艰难的任务。传统的图表显示在分析内在规律时并没有什么优势,因此,高效管理与大量电网数据分析俨然变为重要课题。传统的电力设备状态监测的重心是运行故障的实时精确定位与分析,在大数据背景下,逐渐转向对运行状态的全景展现与趋势预测,电力设备在线监测数据与运行状态变化情况可通过大数据可视化这一有效信息传递方式更直观展现设备的运行情况,所以通过大数据可视化对电力装备运行状况进行监控有重大意义。
传统的电网营销数据监测可视化技术使用受限,通常只在局域网亦或是专用的网络中使用,外业人员在电网建造、维修护理以及检修问题的操作中,没有办法得到所需要的具有实时性的电网运行情况,在很大程度上降低了工作效率[1-3]。传统大数据处理技术需要对海量数据进行批量批量处理,一般使用MapReduce编程框架,实现并行计算[4]。具有数据规模大、吞吐量高、实时性差的特点,因此无法完成时效性要求较高的计算任务。因此,目的为消解电力设备监测数据的实施展示以及在线计算问题,则拓展针对空间信息的获取渠道就尤为必要,基于此,提出了基于分布式架构的电网营销数据自动监测可视化研究。无法用文字或者列表表示的数据信息,可以运用可视化技术将其以多样化的图形、图像方式进行展示,数据信息之间的内在联系也能够更直观的展现出来[5]。
电网营销综合数据分析与展示架构主要分为六个模块,分别是数据应用模块、数据存储模块、数据分析模块、数据处理模块、数据传输模块和多源数据模块。其架构如图1所示。
图1 电网营销综合数据分析与展示数据架构
(1)多源数据模块包括电网营销业务应用系统、采集系统与用户一体化缴费平台。为了减少对多源数据生产库的负载压力,需利用查询库获取相关数据[5-6]。
(2)数据传输模块主要是对分布式消息队列中的信息进行传输,从电网营销各业务系统中采集相关数据。
(3)数据处理、分析与存储模块针对分析及结果数据进行分类处理,在整个电网营销综合数据分析与展示数据架构中,因为处理的数据非常巨大,采用就近处理、并行处理策略,所以数据存储和处理往往是紧密结合的[7]。
(4)数据应用模块包括客户行为习惯分析、客户消费习惯分析和综合数据分析,从这三种分析结果中提取出相关数据存储到关系数据库之中,以此进行数据展现与外部查询[8]。
“营销综合数据分析与展示”利用现有软、硬件资源,完成综合数据展现的开发、集成、部署、软件测试、系统割接上线、营销综合数据分析、客户行为习惯分析、客户电力消费习惯分析、等工作。
根据上述架构,对系统的“一个平台,三个应用”功能进行分析,结果如图2所示。
图2 电网营销综合数据分析与展示数据功能
(1)营销综合数据分析平台,具备一下基本功能:数据加载功能、应用装配功能、分析结果展现、应用管理控制功能等。
(2)分析客户行为习惯,对多样化的营销综合数据进行分析,通过客户缴费等数据,多维度立体分析对客户行为习惯进行,挖掘客户行为习惯、地域差别,并通过可视化信息技术为业务系统数据应用提供服务能力[13]。
(3)分析客户电力消费习惯,对客户用电量情况,按照不同用户类别、不同阶梯、不同时段、等进行多维度立体分析,挖掘不同地域、不同客户群电力消费习惯,发现客户电力消费的峰谷差异和阶梯差异,为电价调整提供准确的数据依据。
(4)综合数据展现,获取营销、采集等相关业务应用系统的实时监控和分析数据,并由客服中心来进行综合展现导航、主题数据进行综合数据展现。
针对同一类设备运行所产生的不同数据信息,需采用FCM 聚类算法对其进行柔性划分,并将划分结果进行归类处理,并利用已有评估指标体系对设备运行状态进行评估,从而确定每个聚类所反映的设备状态[15]。根据最大隶属度原则,去模糊化处理上述数据集柔性规划结果,并对数据集中所有数据元素进行提取,进而获取设备状态整体信息。
电网营销数据提取流程如图3所示。
图3 电网营销数据提取流程
电力电缆状态可视化管理系统连接着底层的状态数据采集子系统,是整个系统的关键部分,借助分布式发布方式,虚拟化来源于分布式光纤采集子系统的大数据,同时将其直观显现在管理平台上,对目前被监测电缆的健康状态和相对应的历史记录信息进行反馈。
在分布式集群上构建分布式架构,多源监测数据通过DataHub高速通道进入流计算,在内存中即可完成分析数据操作,延迟时间短是其特点,可以在S 级甚至ms 级完成计算,而批量计算以Hadoop MapReduce为代表,与数据信息可视化相比有很大差别。基于分布式架构的电网营销数据自动监测可视化展示流程如图4所示。
图4 电网营销数据自动监测可视化展示流程
在电网营销大数据计算平台上,通过电网营销数据可视化类库,可以实现电网营销数据自动监测可视化展示显现如下所示是可视化展示具体实现步骤。
(1)借助弹性分布式数据集类的采集方法,对电力设备在线监测数据信息进行获取,得到状态信息元素列表Lasts,主要包括聚类编号、时间点、监测量。
(2)分解电网营销清单中的每个Vector 类型的数据元素,根据聚类编号,数据点集构建相应列表。
(3)指定聚类编号列表中每一个聚类编号对应颜色,构成着色列表。
(4)输入着色列表、数据点集列表数据,建立三维平行散点图。
为了验证基于分布式架构的电网营销数据自动监测可视化研究合理性,进行了实验验证分析。
在客户档案信息、应收/实收电费信息、缴费网点档案/缴费渠道档案等数据基础上,各营业厅每日24 点缴费笔数及阀值预警,各单位互联网缴费变化情况,各ATM缴费终端应用情况,各代收点近三年代收笔数曲线,等数据分析,对缴费行为以及缴费渠道的建设情况进行分析,指导缴费渠道的建设。在整体设计上,包括:渠道偏好、缴费渠道、代收点、ATM缴费、营业厅服务范围分布、互联网缴费共6个分析项目,以下分别进行描述。
(1)缴费渠道
分析营业厅、ATM、第三方代收等渠道、第三方代收等渠道互联网,X轴为时间坐标,以小时为单位展示每日24个点。以曲线图的形式进行展示。
图5 曲线展示图
选择四川省,显示24小时,全省各缴费渠道(营业厅、互联网、ATM、第三方代收)的交易量,在曲线图上用不同图形显示不同缴费渠道。选择22个地市供电单位,显示24小时,所选地市供电单位各缴费渠道(营业厅、互联网、ATM、第三方代收)的交易量,在曲线图上用不同颜色进行显示不同缴费渠道。
(2)渠道偏好
将各供电单位,互联网、营业厅、ATM、第三方代收共四渠道缴费的同期占比、渠道同比信息进行分析。采用玫瑰花图进行展示。
图6 玫瑰花图展示结果
选择四川省时,显示22 个地市供电单位不同缴费渠道(营业厅、互联网、ATM、第三方代收),根据选择的本月(上月)显示各渠道交易量占比。选择22个地市供电单位时,显示地市供电单位下属区县不同缴费渠道(营业厅、互联网、ATM、第三方代收),根据选择的本月(上月)显示各渠道交易量占比。
实验环境配置如表1所示。
表1 实验环境配置
根据上述参数,分别在缴费渠道和渠道偏好两种情况下,采用文献[1]方法、文献[2]方法、文献[3]方法以及本文方法进行监测可视化效果进行验证。
5.3.1 数据监测准确率
以缴费渠道下获得的电网营销数据为基础,将两种方法监测数据准确性结果进行对比分析,结果如图7所示。
图7 缴费渠道下不同方法监测效果
由图7可知:当实验次数为5次时,文献[1]方法的数据监测准确率为68%,文献[2]方法的数据监测准确率为73%,文献[3]方法的数据监测准确率为66%,而本文方法的监测准确率为82%;当实验次数为40次时,文献[1]方法的数据监测准确率为69%,文献[2]方法的数据监测准确率为73%,文献[3]方法的数据监测准确率为75%,而本文方法的监测准确率为91%。由此可知,在缴费渠道下,本文方法的数据监测准确率高。
5.3.2 监测数据透明度
以渠道偏好下获得的电网营销数据为基础,将四种方法的监测数据透明度进行对比分析,结果如图8所示。
图8 渠道偏好下不同方法监测数据透明度
由图8 可知:当实验次数为10 次时,文献[1]方法的监测数据透明度为82%,文献[2]方法的监测数据透明度为75%,文献[3]方法的监测数据透明度为56%,而本文方法的监测数据透明度为93%;当实验次数为60次时,文献[1]方法的监测数据透明度为75%,文献[2]方法的监测数据透明度为68%,文献[3]方法的监测数据透明度为83%,而本文方法的监测数据透明度为96%,本文方法的监测数据透明度一直较高,也就是可视化效果较好。由此可知,在渠道偏好下,基于分布式架构方法可视化效果更好。
基于分布式架构的电网营销数据自动监测可视化研究中蕴含的可视化展示技术十分强大,通过更直观的、形象化的可视化图形,能够使电网的运行管理和调度人员更加高效便利,电网运行中枯燥的数据进行展示的灵活性和生动性更强,可以让管理人员对电网目前运行状态更加了解,并针对电网的不同情况采取更加高效的运行控制策略。
虽然该研究方法具有良好可视化效果,但是还存在以下不足:
(1)在电网数据的可视化展示中,对数据之间的内在关联和规律的挖掘不能完全实现,目前只停留在于对数据的展示阶段。
(2)系统性能低下,在分析超大量信息时耗费了大量系统资源,从而影响了展示效果。
(3)系统的响应速率未达到理想状态,当需要将众多图形、图像进行加载时,加载显示速率较低
(4)缺乏多样化的展现方式,系统中对于电网数据的可视化展示形式不够丰富。