保富,高宇豆
(云南电网有限责任公司信息中心,昆明 650217)
电压质量问题是影响电网公司运营的重要因素,也是电力公司重点监测的对象[1]。传统的电压质量异常识别方法,大多是通过客户话务、现场抽检等人工方式发现,不仅识别效率低下,而且难以做到全面的识别与监控。近年来智能电能表和用电管理终端[2-3]的大力推广,逐步达成了用电信息采集系统的全覆盖,使得通过大数据分析的手段识别电压异常成为可能。
目前,问题主要集中在以下两方面:(1)电压监测技术方面。目前对于用户的电压监测是采用通过用户的智能电能表采集电压数据,通过变压器附近的终端收集回传数据的方式采集数据。但此方案造成终端数据传输量过大,使得电压数据呈现数据质量差,价值密度低。(2)电压质量检测时效性方面。运维人员到现场进行电质量核查,只能发现目前的电压情况,不能掌握电压情况随时间变化的细节信息,也影响业务人家对电压质量异常情况严重性的评估。
针对上述问题已有部分研究。文献[4]探讨了大数据技术以及数据挖掘方法在设备评价、故障诊断和智能诊断等场景中的作用,但仅从理论方向进行了分析,没有实际的应用;文献[5]分析了重要用户安全大数据存储处理技术和分析诊断技术,但存在存在数据交互安全性难以保证、分析能力有限导致决策错误的问题;文献[6]在大数据技术的基础上,实现对电压的监控,但不能对故障进行研判。
因此,文中在大数据平台基础上,分析智能电能表和终端采集的海量电压电流的历史数据,结合电压质量相关的标准,对电压电流数据进行主成分分析提取影响电压质量应用的相关值,并通过模糊聚类筛选出异常数据,储存出现异常的当天的全部数据和当天的统计特征做可视化展示,为现场核查提供依据。
基于阿里的技术体系,构建电网的“1+1+1”电力大数据中心,即1个大数据平台(含数据中心),1套大数据资产运营体系(含大数据运营中心),1套大数据治理体系(含以元数据、数据标准、数据治理、数据安全为核心的数据资产管理工具);对内使公司的电网管制业务提质、增效;对外开展竞争性业务,数据变现、创造价值。总体架构如图1所示。
图1 基于阿里技术的电压质量诊断与分析平台模型
从数据“采、存、通、用”流程角度,分为数据采集层、数据存储层、数据计算层、数据分析层、平台服务层[7-8]。平台整体部署在公司云平台之上,使用云平台提供的计算和存储服务,本身天然拥有弹性伸缩能力。平台是公司数据汇聚中心、统一数据及数据服务唯一来源,是公司大数据应用的开发支撑平台,同时也是公司元数据管理、数据质量管理、数据标准管理的载体。
系统采用的J2EE架构[9],如图2所示。
在软件体系方面,遵循JAVA EE规范,并兼容流行的系统软件,为功能拓展和系统迁移提供了平台无关性支持。系统基于HTML5、XML等通用技术标准,集成通用的权限、用户、工作流等基本功能,有效保证系统的稳定和可靠运行;通过对J2EE的标准应用的扩展和补充,利用组件封装技术,降低耦合度,实现业务逻辑的纵横贯通,并提供根据需要提供接口,保证业务和数据的交互能力。通过对功能框架和系统架构分析,采用如下软件架构进行实现,共分为:数据层、持久层、支撑层和展现层四个层次。数据层和持久层完成数据的持久化存储;支撑层通过服务的方式实现电费计算、数据采集、信息集成、任务调度、报表查询等业务过程;展现层对应系统架构的应用层,通过PC或移动终端的方式,访问核心业务系统进行业务处理。
针对目前电压质量识别效率低下、实时性不强、准确度不高的问题,本文通过输入终端回传的用户电压的采集数据,首先采用主成分分析得到电力质量中影响末端用户电压监测分析、配网低压台区运行状态分析、配网线路故障判断分析、户变相关系异常核对分析、低压配网运行状态分析应用、低压配网运行状态分析数据服务等的主成分,对采集到的实时数23降维简化处理;然后采用聚类分析[10]筛选异常电圧数据,基本思想为,利用经主成分分析后的样本特征到分布中心的距离表征样本数据的异常程度,距离越远,出现的概率越低,异常度越高。给出识别电压异常的模型用以确定电压异常分界。整体思路如图3所示。
图3 数据处理分析流程图
主成分分析[11-13]通过分析处理特征量得到对结果起作用的关键因素。分为以下五个步骤:(1)将样本数据进行标准化处理;(2)在数据样本基础下计算协方差矩阵;(3)得到特征值和特征向量;(4)确定主成分;(5)通过载荷因子矩阵确定各元素对主成分影响程度[14-15]。
在对用户或者配网实时运行数据的监测中会出现很多异常数据影响观测的准确性,为减少对电网的影响通常被当做噪点处理,但在用户电压异常监测中,异常数据相较其他常见数据对配网监测更有意义。电网规模的不断扩大和智能电网的发展催生了新的大数据处理方法,关键数据处理的方法主要包括神经网络、聚类分析[16-18]、模糊数学理论等。配网实时数据量过大,对数据实时处理给台区终端带来很大压力,因此,文中采用模糊聚类方法降低数据维度以减小终端数据处理压力。
聚类分析可以将整体数据根据不同特征分成多维数据,大大简化了计算的复杂性,且不需要预先对初始数据进行特殊处理,能较好地实现关键数据的分离。模糊聚类作为聚类分析的改进优化的方式,将数学中模糊的概念应用其中,原来不变的分组改进成模糊分组,对于现实问题的处理能力增强[19-21]。
数据分析和处理公式如下:
(1)
(2)
|λE-R|=0
(3)
(4)
(5)
(6)
(7)
(8)
(9)
结合目前计量中心已有的判别经验,通过对电压质量数据特征值的跟踪分析,制定电压质量识别的判别标准,电压质量异常识别模型如表1所示。
表1 电压质量判别模型
计量自动化系统采集的用户电压数据包括台区考核表数据、大用户数据,普通用户数。有数据量大、数据质量差、价值密度低、实效性低等特点,符合离线大数据的特征,可以用离线大数据处理方案来处理数据。采用大数据平台提供的离线计算功能,按天计算最近7天电能表的电压数据特征,并和电压质量异常识别模型的数据特征对比,筛选出电压异常的电能表,并储存该电能表该天的电压明细数据以备展示。并记录异常电能表的相关的电压数据特征,通过基础档案数据完善电能表关联的用户等信息,以实现按供电单位等维度评估电压质量。
由于在电压异常识别的时候按天对数据计算了数据的特征值,并用特征值和电压质量异常模型比较来确定电压异常情况,使得最终得到的结果只是异常用户的电压特征,有时候只从数据特征来分析会存在偏差,而且业务人员想了解异常发生时候的更多细节信息,所以本文在筛选出异常数据的同时也保留了异常发现当天的原始数据,提供给业务人员做分析。异常电圧数据应用如图4所示。
图4 异常电圧数据应用
在筛选出异常数据以后,支持业务人员通过不同的维度(如供电单位、台区等)对数据开展分析评估,以指导电压质量的改进工作。值得主要的是,对电压质量的评估如果要进行横向比较需要考虑数据质量引起的偏差,好在通过大数据离线技术可以容易计算出表征数据质量的数据采集成功率,在一定的时间内,该数值为成功采集到数据电能表数量除以总电能表数量。
异常电压数据分析可应用于末端用户电压监测分析、配网低压台区运行状态分析、配网线路故障判断分析[22-23]、户变相关系异常核对分析、低压配网运行状态分析应用、低压配网运行状态分析数据服务等。电压数据可视化展示如图5所示。
图5 电压数据可视化展示
(1)用户停电感知分析
用户停电感知分析,开发并启用用于用户停电感知数据分析的定时任务和微服务,针对云电智云大数据平台上抽取的各类业务数据,查询营销停电话务工单信息(来电号码、来电内容、来电时长等)、终端停电事件(终端位置、终端型号、事件日期等)、计量断相事件(计量位置、终端型号、事件日期等),依据停电区域用户识别网络,进行对比计算、分析判断,形成停电事件区域(全台区停电、相位停电、局部停电等)及实际停电用户明细数据。针对用户停电感知分析并实时验证后形成的停电事件区域信息,按照树形结构用醒目的颜色展示实际停电的站、线路、变、户,以及清晰显示实际停电的台区及相位。用户停电感知分析展示。
(2)末端用户电压监测分析
低电压客户问题记录维护,建立本项目数据分析应用主题对应的低电压客户问题记录库,针对云电智云大数据平台抽取存放的业务系统低电压历史事件记录,以及本项目计算分析并实时验证后推送输出的低电压客户问题结果数据,进行维护管理。末端用户电压数据计算分析,开发并启用用于末端用户电压监测数据分析的定时任务和微服务,当云电智云大数据平台上抽取并校验修正的低压用户末端电压数据及营销客户信息输入时,依据低电压客户识别规则,进行对比计算、分析判断,形成低压用户末端电压监测和低电压客户数据。
(3)用户停电准确性分析
停电准确性判断方法制定,根据停电事件指标项,梳理、分析及提炼调度、生产、营销各类各类停上电事件相关指标项内容,总结设置停电事件相关指标具体阈值(如:停电时长超过24 h为高时长),通过后期不断实践完善、灵活配置的方式建立停电准确性判断方法,供停电事件准确性分析时使用。开发并启用用于停电事件准确性数据分析的定时任务和微服务,针对云电智云大数据平台上抽取的各类业务数据,查询营销停电事件、计量停电事件、用户上报停电事件,依据停电准确性判断方法,进行对比分析、综合研判,形成准确停电事件、准确复电事件及准确停上电信息(停电区域、停电用户、停电时间、复电时间等)数据。
(4)低压配网运行状态分析
低压配网运行状态分析包括低压用户末端电压监测、配网低压台区运行状态监测、400 V线路故障信息展示、户变相关系异常分布展示、末端用户供电质量报告生成、配网低压台区运行报告生成、400 V线路故障运维报告生成。
(5)户变相关系异常核对分析
户变相关系异常核对方法制定,根据户变相关系异常记录库(云电智云大数据平台抽取的户变相关系异常历史记录及现行数据分析结果),通过机器学习的方式,将“户-变-相”相关的对应规则进行固化,选取地址等三者共性的数据字段作为关联标识,梳理出关联规则库,并固化为核对和检查项,通过后期不断实践总结、修复完善的方式建立户变相关系异常核对方法,供户变相关系异常梳理核对时使用。
(6)配网线路故障判断分析
线路故障判断分析策略制定,根据400 V线路故障问题记录库(云电智云大数据平台抽取的400 V线路故障运维历史记录及现行汇集数据分析结果),梳理400 V线路故障问题发生规律和判断规则,并固化为监测和检查项,通过后期不断自学习、修复完善的方式建立线路故障判断分析策略,供配网线路故障综合判断分析时使用。
(7)配网低压台区运行状态分析
配网低压台区运行数据分析,开发并启用用于配网低压台区运行状态分析的定时任务和微服务,当云电智云大数据平台上抽取并校验修正的配网低压台区运行数据(电压、电流、功率因数、电量、谐波等)及生产设备运行信息输入时,依据配变问题故障预警规则,进行对比计算、综合研判,形成配变故障报警和预警数据(重过载、三相不平衡、断相、失压、失流等问题)。低压配网运行状态进行了分析展示。
基于电压异常数值特征主成分分析和聚类分析方法可以显著地提高电压异常情况现场核查的效率。相比于基于抽检和客服话务的电压异常核查有明显的优势,代表业界未来技术发展的方向。该方法充分体现大数据技术在电力系统电压异常检测方面有明显的优势和广阔的前景,在此基础上,未来还可以基于大数据技术,发现更多电压质量异常时候的电压数据特征,以及电压异常和其他指标之间的关联等分析电网运行健康情况,有助于加深对电网的理解。