谷向丽 温艳磊
(国网河南省电力公司汝阳县供电公司,河南 汝阳 471200)
电力通信网是承载智能电网信息交互业务的通信专网,承载着电网运行和经营管理的核心业务,是智能电网发展的重要基础设施,是电网安全、稳定、经济运行的重要保障。电力通信网承载的业务与公司生产经营密切相关,例如继电保护、稳定控制、配电自动化、用户电量采集等,一旦发生故障将对电网的安全稳定运行造成严重威胁。
现阶段电力通信网监管多采用事后报警的方式进行网络维护,无法有效保证电力通信网络的高效稳定运行,制约了电力系统的业务的开展。随着电力通信网信息化程度的不断加深,资源管理、设备运行、实时监控等方面的海量数据已经逐步积累下来,其中蕴藏了巨大的价值亟待挖掘。开发电力通信网大数据应用场景,将大数据技术应用于电力通信网精益化管理迫在眉睫。
大数据在其定义中有着一定的分歧,至今并为有一个统一的解释。麦肯锡认为“大数据是指其大小超出典型数据软件抓取、储存、管理和分析范围的数据集合”;Gartner认为“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产”。在大数据中,4个主要特征(即4v特征):(1)大量,主要是扩大了数据的规模,把数据从TB升级到pb,其换算的单位为1PB=1024TB=1048576GB,其中数据量越大所包含的信息就越多。(2)多样性,数据的种类以及来源都很多,其中主要包含了结构的多样化,非结构的多样化,语音以及文本的多样化等。(3)速度指的是获取数据的速度,并且提高数据处理的时序,实现2级简单的查询和时间水平的复杂分析。(4)价值。数据的价值密度低。在大量的数据中,只有小的部分很有用。因此,数据的质量也是价值的关键。
电力通信中使用的大数据主要分为两个部分:内部和外部,在内部的使用主要是对电力设备的以及系统中的信息以及运行的状态进行记录,同时对数据进行分析发现在系统运行过程中所遇到的问题。大数据的数据解析过程从数据的采集中集成,提取数据的安全检查和分析的完整链条。在该链轮中,可能发生在各个链接中丢失的数据、被泄漏、篡改、不被许可的接入的可能性。
(一)通信网可靠性分析
通过对影响电力通信网可靠性的因素进行分类和整理,并运用特征筛选、数据挖掘等算法,得到影响因素的集合;运用相关性分析算法对该集合进行一步过滤和整理,并结合不确定性层次分析法,确定指标权重,得到最终的可靠性指标评价模型,指导电力通信网可靠性分析评价。
(二)设备全寿命周期分析
基于通信设备台账、缺陷单、缺陷报告等数据,运用文本挖掘技术,提取设备缺陷记录关键信息,挖掘设备缺陷与厂商、投运年限、运行工况以及环境等因素之间的关联关系和发展规律,对设备总体缺陷率变化趋势进行分析和预测,并通过厂家设备缺陷率及质量因素分析,构建厂家产品质量评价模型,为设备运维策略优化、设备选型/采购、设备退役报废策略制订等工作提供参考依据。
(一)数据存储技术
数据存储技术是指采用多种存储方式并存,根据数据类型以及数据处理的要求选择不同的数据存储方式。结构化数据采用传统关系型数据库来存储,对于半结构化和非结构化数据采用HDFS存储,同时结合Hive和HBase来实现。
对引入的外部数据源,如传输网性能数据、数据网流量数据,由于其年存储量在TB级别,需要通过分布式存储技术完成。
(二)离群点分析技术
离群点(Outlier)是指数据集中可能包含一些数据对象,它们与数据的一般行为或模型不一致,这些数据就是离群点。在对传输网设备性能与数据网流量进行监测时需要进行离群点分析。例如,对于传输网设备的误码率进行分析,可以通过基于密度的聚类,找出偏离其他正常值的异常数据,对明显不合理的数据,可以判断为错误数据,在统计计算中需要剔除其影响,对于其中异常但属于合理范围内的数据,需要及时进行预警。
(一)通信光缆性能监测及预警分析。通过光缆性能数据、气象数据的采集,实现对光缆衰耗情况的实时监视,分析光缆衰耗的原因和趋势,为光缆状态检修提供参考;对光缆气象灾害故障进行预警,预防光缆气象灾害导致的故障风险。主要功能包括:光缆性能动态监测,光缆性能劣化分析预警及状态检修策略,光缆覆冰、舞动、雷击、结冰监测预警。
(二)通信传输网性能监测及预警分析。通过光设备性能的采集,实现对传输网性能变化情况的实时监视,分析光路与光设备性能数据变化趋势,为光设备故障或告警提供分析参考依据。主要功能包括:传输设备与光路性能动态监测、传输设备与光路预警分析、设备运行环境评价。
综上所述,本文首先对大数据做了简单的概述,其次分析了电力通信大数据及其所面临的问题以及电力同行的特征,最后对大数据在电力同行中的运用做了简单的探析。从中发现电力通信大数据容易透露客户的隐私以及数据的保存存在着不安全性。