林士明 赵雪婷 张光亚 侯红丽 刘少华 姚 岚 程 曦 吴 周 王红梅 张东平
智能诊断技术在能源互联网中的研究
林士明 赵雪婷 张光亚 侯红丽 刘少华 姚 岚 程 曦 吴 周 王红梅 张东平
随着全球能源结构的变化,智能化正逐渐主导未来的电网发展方向和技术发展方向,能源互联网的发展将改变电力网固有运营模式。智能电网给电力企业带来的是技术革新,给用户带来的是新的体验和高效快捷的服务满意度。研究与设计基于智能诊断技术的高级数据诊断与分析挖掘系统将有助于为未来构建能源互联网提供技术支撑。本文基于SOA系统研究开发数据分析平台,并采用k-means聚类均值算法,将聚类算法与朴素贝叶斯网络基础融合,实现能源数据流的深度挖掘。
智能诊断技术源于欧美,其最早是采用单信号处理、多信号处理以及滤波技术的简单应用,这类传统的诊断技术最初应用与机械及电子类设备的诊断,在航空、汽车等领域均有应用。美国宇航局等国际知名研究机构及公司均有相关技术和产品在应用,国内高校和科研机构在电厂汽轮机的智能诊断上面也成功研制出具有国际水平的智能故障诊断系统。随着各类智能知识算法技术、大数据云计算、传感器、神经网络、模糊控制等技术的发展进步,智能诊断技术越来越在诸多复杂设备故障处理应用中发挥其不可替代的优势。
智能诊断系统开发主要在现有各类电力网数据平台上进行,基于SOA的架构设计,通过服务总线约定与外部系统信息交互规则。基于智能诊断分析的电力分析系统物理架构图见图1。
系统在线监测各类终端电能计量数据、电力信息系统统计数据等通过请求ESB服务总线传递至其他电力信息系统,在“私有云”平台将调度过来的数据分析处理后将数据或查询结果反馈给ESB服务总线或实时在线传输给系统。该架构实现业务流程易操作,可随时新增或删减新老业务类型,且不影响系统整体运行,实现了电力数据业务流之间的数据任务调配。
系统开发基于SOA的架构体系,面向电网及电力客户服务的设计采用WebService技术和规范来实现SOA架构的应用接口,结构如图2所示。
图1 基于智能诊断分析的电力分析系统物理架构图
图2 多层分布式体系结构图
客户层用于访问实际业务系统和处理人机交互的客户端,包括外部网页客户端、Flash Player等。表示层由界面控制器组件负责统一调用不同的界面操作组件,采用J2EE技术体系下的MVC应用框架。业务逻辑层用于部署业务逻辑组件。数据持久层由数据映射层和数据源构成,数据映射层完成对数据源的访问封装,并使得业务逻辑层的设计和实现更集中于系统本身的功能。数据库层配置Oracle数据库。
电力网内各类设备数量巨大,因此,系统在开发数据分析时需考虑数据库面临海量数据的承压能力以及运算处理能力。为适应大规模的存储应用需要,系统采用分布式数据存储系统,通过网络将存储任务分散到多个节点,再通过应用集群将各节点的存储能力汇流在一起。系统通过多台设备的独立运算,极大减轻了数据库的频繁操作,并能实现数据的离线处理与统计分析。
系统采用基于Hadoop的分布式系统基础架构实现HDFS分布式多文件系统存储以及MapReduce大数据计算功能,具有高容错、高吞吐量、扩展性强等特点。利用Hive数据仓库工具为计量装置在线监测与智能诊断系统提供数据挖掘提取与查询,且免开发MapReduce应用即可进行分析处理功能的事项。
系统框架设计实现:
(1) 数据量和计算量的规模缩小;
(2) 就近计算原则,即任务会分配到存放着所需数据的节点上进行计算;
(3) 各任务并行计算,彼此间基本无依赖关系。
通过整合共享现行电网信息数据网,将现行的调度自动化系统、营销业务系统、配网自动化系统、用电信息采集系统等数据源汇合形成电力“私有云”大数据平台,智能诊断是基于对各类数据源的资源整合后实现的数据调度与挖掘。系统开发设计中对各类系统的任务调度是系统的核心开发内容,对实现多数据源并行的科学工作流效率尤为关键。
任务调度服务的设计目标:实现智能在线监测与诊断系统与采集平台的解耦。方便实现灵活的任务调度策略,实现统一的任务管理平台。
智能诊断分析流程采用k-means聚类均值算法进行异常计量数据挖掘,将聚类算法与朴素贝叶斯网络基础融合提高分类算法的准确性。数值聚类是同时选取 N 种特征,将它们放在组合在一起形成N维向量,从而得到一个从原始数据集合到 N 维向量空间的映射,然后基于某种规则进行分类,在该规则下,同组分类具有最大的相似性。算法的基本核心思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。具体编程算法描述如下
步骤1:从待聚类数据集合D{x1,x2,…xD}中随机选择K个数值为初始聚类簇中心t1, t2, …tk。
步骤2:分别计算剩余D-K个数值到k个聚类簇中心对象的差异度,再将值分配对应到差值最低的簇:
步骤3:根据聚类结果重新计算K个聚类数值簇的均
步骤4:反复执行上述步骤直至聚类结果不变化或聚类中心无大范围转移时算法结束,否则返回至公式2重新计算。
智能诊断技术未来在大数据和云计算等新型信息技术的推动下将会实现电网的全覆盖和实用化,可以预见,随着售电侧市场的放开,智能诊断与在线监测可能将融合互联网+技术、物联网技术等给用户带来不同的体验和更好的服务价值。智能计量技术的应用有利于建立新的电力需求侧响应体系,构建新型电力服务体系,打造基于电力数据源的能源互联网。
10.3969/j.issn.1001-8972.2015.24.027