姜楠
国网哈尔滨供电公司 黑龙江哈尔滨 150046
随着电网规模的不断扩大,用电信息数据规模增大,用电信息采集以及计量业务的工作量不断增多,用电信息采集和管理涉及到对电网的故障诊断、用电调度、电力稽查、智能电能表设计以及通信、计量、远程费控等诸多业务,对用电信息采集的运维监测就是实现对用电数据的供电电压监测、电能质量管理的数据分析过程,采用大数据分析技术进行用电信息采集运维监测,通过终端厂商协助运维监测,实现对用电网络的故障定位、故障处理以及用电监测等。
(1)基础设施监控系统获取的如动力、环境、网络等指标信息;(2)安防系统的人员设备出入管理数据;(3)管理流程数据如工单、服务申请记录、设备部署信息等;(4)CMDB库中的设备资产信息。
(1)基础设施的监控数据大多是以秒级时间间隔来采集,数据体量非常大。(2)视频监控、告警信息以及服务申请记录等数据的非结构化导致运维数据具有多样性。(3)数据中心的高可用性和连续性要求数据处理速度快,以便于快速响应并处理故障。(4)现阶段数据中心运维数据利用率较低,多停留于简单报表呈现。
在上述构建了基于大数据的用电信息采集运维监测系统的总体构架模式和进行用电信息采集后的信息融合的基础上,进行用电信息采集运维监测系统的优化设计,本文提出设计一种基于大数据的用电信息采集运维监测系统,采用关联规则挖掘算法进行用电信息的特征挖掘,对用电信息采集的异常数据进行谱分析,通过对异常数据的关联规则挖掘,进行用电网络的故障判断和定位。
通过对原始数据进行加工处理,生成数据宽表,同时,确定需要解决的业务问题,其中业务目标即为模型因变量(Y),选取数据宽表中的数据作为模型自变量(X)。然后再进行模型设计,如选线性或非线性算法。再进行模型训练、校验和预测,并通过调整模型自变量X来优化模型算法,最后输出模型预测结果。
设计和执行一个以监控数据分析模型为核心的DCIM监控数据应用机制,对采集数据进行快速和有效的处理。分析结果与现有的监控系统进行有效集成,为用户提供实时的数据分析服务。
通过运用大数据挖掘和分析技术,发现大数据技术可以提高运维的可靠性。数据中心运营的第一要务就是保证全天不间断可靠运行。如果出现故障需即时处理,以减少事故处理时间,降低故障带来的损失和风险,因此,数据中心运维需要重点关注设备故障。
大多数据中心都建设有自己的基础设施监控系统(DCIM系统),但是目前大多DCIM系统仍然停留在简单的监控和数据统计展示上,并未对监控数据进行深层次的分析,难以发现故障的诱因和共性。在基础设施管理系统的基础上加入大数据分析技术,探索缩短故障历时的途径:如通过基础设施管理系统获取关键设备如蓄电池的历史运行参数及其基本属性信息、历史故障信息、机房环境参数等,对这些数据进行挖掘分析,构建一个预测模型,那么通过预测模型,结合相应的风险预警规则,就可以提前预测和识别一部分存在高风险故障可能性的电池组,并且将预警信息与前台的运维系统进行集成,定期实时更新风险标签,从而提醒运维人员提前维护和更换该组电池,以避免故障的发生,减少宕机的可能。
通过对机房各级配电设备的监测,可以实时动态了解机房各设备的能耗情况,如空调能耗、IT设备能耗、照明能耗等,可以通过对单元能耗数据的挖掘和分析可以获取机房内整体能耗利用率,建立健全相应的能耗智能调度系统,从而帮助管理人员清晰了解机房能耗消耗和分布情况,为后期机房节能措施的应用提供数据依据。
为了验证基于大数据的用电信息采集运维监测系统的应用性能,进行仿真实验,实验依据2016年1月1日至2016年5月31日某省24907294户低压用户每日采集的用电信息作为运维监测数据的原始样本,以2016年3月1日至2016年5月31日采集的用户抄表数据作为测试样本,进行大数据集成分析和运维监测,采集的数据样本数共计1417869条数据、42536070个数据项,采用改进系统中用电信息关联规则挖掘算法以及信息融合方法进行数据加工和信息处理,在用电信息运维监测系统中进行实际用电情况分析,其中,用电信息采集的停滞时间为120-200s,采集的用电信息为用电功率,时间间隔为120s,信息采样的时长10000s,根据上述实验环境和参数设定,得到用电信息采集的时域波形如图1所示。
图1 用电信息大数据信息采样时域波形
为了提高电能信息采集和监测的工作效率,提出设计一种基于大数据的用电信息采集运维监测系统。应加强大数据分析,可以说大数据分析可增强数据中心运营的核心竞争力