李 远
(国网山西省电力公司,山西 太原 030021)
应用大数据电力设备的运行分析系统,能够对网络信息进行实时分析,针对电力设备的运行数据展开处理,综合分析管理。系统实质是利用设计软件,将设备的运行数据进行集成化管理,按照电力数据的管理需求,设定各项模块。同时,利用该系统还能完成电力数据信息的录入和修改,或者删除和查看,进而分析设备是否处于正常状态,保证管理的高效性。
系统设计将Hadoop 作为云计算框架,使用HDFS技术存储系统监测的电力数据,还可借助MapReduce 技术辅助并行计算,不断提高数据质量。使用HBase 作为数据库,存储无结构电力数据,以Sqoop 作为接入数据的工具,传递数据库之间数据,利用开源服务软件支持Hadoop 集群运行[1]。
该系统为B/S 结构,在Hadoop(云计算平台)之上部署服务器,可将网站中的内容向tomcat 中发布,以RESTful 架构辅助服务器、浏览器二者之间通信。使用阶段可通过浏览器点击页面后,即可申请获取服务器内部服务及资源,Hadoop 平台内,以MapReduce 编程模型,借助聚类算法、AR 模型等挖掘HBase 内部状态数据,之后即可回到设备状态的评估页面。远程调用主要使用RESTful 技术进行,将数据封装为JSON 格式,向分析层发送,通过数据挖掘,将结果以同样格式向业务平台当中传输,经过落实处理之后,用JSON 格式进行封装,之后向客户浏览器中返回,此时浏览器即可按照图表的方式在页面上显示相关数据。
该系统设计模块有五部分:第一,用户管理,能够对使用者和管理部门展开统一化管理,通过设置密码或者更新信息的方式完成;第二,电池性能检测,按照变电站的备用电源当中电池数据指标,自动出示重组方案,将其使用时间延长;第三,检测模块,可实时收集设备运行信息,为其运维检修提供依据;第四,监测模块,针对输电系统内部设备展开监测,及时发现运行问题;第五,信息管理,针对设备维护和管理信息进行录入、查询、修改和删除操作。
系统设计过程,需要寻求同步传输和采集多个黑匣子内部数据方式,并利用网络完成数据传输。由于B/S架构数据采集具有如下特点:第一,由于单片机电力系统只能对特定客户黑匣子数据进行采集,导致该架构面临的电力现场采集对象相对较多,因此数据量相对较大;第二,功能完善,B/S 架构在数据采集的设计方面应该确保不同数据的独立性,提高数据采集难度。针对上述设计要点,可利用多线程数据采集、处理技术,用软件支持,采集动态化网络地址和多个设备中的数据信息。
电力设备在运行阶段,需要借助系统对于电力设备展开检测,并记录检测、运行数据,针对上述数据深入分析。传统形式结构化数据,包括设备台账信息、权限分配、用户信息、抢修记录等,由于上述信息数据随着设备运行产生的增量相对较小,因此,可利用Oracle 数据库对于信息的记录速度更快。使用电气设备完成信息的在线检测,评价其运行状态,能够将半结构化数据量有效增加,并用HBase 数据库(分布式)进行存储[2]。
该系统利用Spring 框架,可提供抽象方式展开事务控制和管理。此框架使用优势为,可提供统一化的编程模型,为各事务提供API 服务,且JTA、Hibernate、JDBC 等也可通过此方法,展开事务管理。
如果不遵守数据库中的约束规则,或者违反程序约束,系统使用阶段就会出现异常的用户界面。因此,在系统应用阶段需要关注异常数据的处理:一方面,系统可将JDBC 和Spring 等封住,因此,可能产生异常现象;另一方面,如果底层数据库存在异常,那么该层事物就会自动向使用层当中滚动,转移至其他页面当中。
利用大数据进行数据挖掘之前,需要对数据展开预处理,由于电力设备数据信息庞大,其中存在冗余数据,对于大数据分析可产生影响,因此可利用系统对于上述数据展开预处理,保留价值数据,提高数据获取质量。数据类型包括电压、电流、温度、设备检测等数据,清洗之后,将价值数据筛选出来,并将其存储于数据库内,和原始数据同时存在,不会对原始数据造成覆盖,还可对比新旧数据,为数据分析顺利进行奠定基础。
采集模块能够为上层应用提供数据采集功能,采集工具分为三个层次,分别为物理层、访问层和采集层,其中物理层主要用于电力黑匣子数据的采集;访问层则利用串口协议连接上位机、黑匣子通信,同时传输协议还能为上层数据的采集提供服务。
随着电力设备运行时间的积累,系统当中可产生大量数据信息,大数据分析需要对历史数据展开快速评估和分析,用户可按照需求将数据信息存储在数据库内,此时系统即可按照特定算法对于数据进行分析,流程如下:第一,准备数据,将电力设备信号数据存储在Hbase 中,并准备样本数据在本地储存;第二,提取信号特征,对于电力设备信号数据特点进行提取,并存储;第三,求出聚类中心,通过迭代法将聚类中心提取出来,在Sequence File 当中存储;第四,给定K-Means 聚类算法和停止条件,将特征信号和聚类中心Sequence File 路径提取出来,执行聚类的过程,并将结果向HDFS 当中输出。第五,分析设备状态,应用K-Means 模型展开设备状态评估,运行到特定阶段,可积累大量运行数据,新数据可调整模型,利用最新数据重新训练模型,使设备状态分析更加精准。
系统具备电池信息分析功能,辅助用户掌握电池性能,为数据挖掘与分析提供参考。电池性能相关数据的统计具体包括交流充电量、交流放电量、充电功率、放电功率、放电时间、运行时间、放电量等。利用系统对于上述数据展开分析和计算,获得电池信息报表,向用户传达,上述过程主要利用Hadoop 与MapReduce 模型完成数据统计,数据分析效率更高。
电力设备的状态监测能够为设备的运行状态判断和维修管理提供依据。比如:可利用管理系统展开油色谱分析,对于电压等级进行分析,统计数据,使用大数据分析方法对于溶解气体产生率进行分析,利用GIS 地图呈现检测装置,还能自动提示和预警,为设备运维提供支持。根据预警装置,对于故障点准确判断,快速查找原因,制定检修策略。还可利用系统点击图表,对于设备的历史监测数据进行查询,横向对比,判断关联设备运行状态,使用台账管理设备。
用户管理能够对业务流程进行协调,该系统主要为电力公司的内部人员进行设计,所以登录界面需要将安全问题考虑其中,用户需要输入用户名和密码,才可顺利登录。同时,还考虑用户隐私,对于用户信息采取加密处理措施,系统读取用户密码前,可自动进行加密操作,数据库内的密码是密码文形式,其他使用者不可看到密码。除此之外,系统还具备查找权限,如果用户顺利登录以后,系统就能记录相关信息,利用信息对于用户权限进行查询,快速找到客户使用板块,为其操作提供便利。按照用户权限将板块内容向用户前端的页面加载,保证电力设备数据查看的便捷性[3]。
总之,结合电力设备的数据管理要求,建设大数据运行分析系统,对于电力数据展开系统化分析,找出系统存在的不足问题,检测变电设备、输电设备和电池性能。在智能电网快速发展之下,更多新型技术逐渐被应用在电力设备的监测和数据分析领域,为大数据的应用提供更多支持,因此,加大力度研究电力设备数据分析系统能够高效处理电力运行数据,使设备管理更加高效。