汤丹莉
(国网谷城县供电公司,湖北 襄阳 441700)
配电网用电信息采集工作能够帮助电力企业及时掌握电力用户的用电波动、变化情况,提升自身的营销服务水平。随着我国电力工程建设的不断推进,配电网规模逐渐增大,配电网用电信息采集工作的难度也逐渐增加。通过云计算技术与配电网用电信息采集平台的有机结合,可以提升配电网用电信息采集质量,为配电网的智能化建设提供一定的理论基础与技术支持。
配电网用电信息采集系统是智能配电网的重要组成部分之一,也是智能配电网系统信息的主要来源,贯穿智能配电网的所有工作环节,是开展智能用电、智能配电、智能发电、智能输电以及智能调度等工作的基础。基于云计算的配电网用电信息采集平台的设计是在传统配电网用电信息采集平台无法满足实际工作需求的基础上进行的,因此必须解决传统配电网用电信息采集平台在现实工作中的难点。
目前,配电网用电信息采集平台在工作过程中,其数据核查只能在采集数据入库后进行,不支持实时核查数据,也无法完成对实时性要求较高的工作,如计量设备异常监控、变压器设备异常监控等,无法为配电网持续运行提供必要支持[1]。
配电网用电信息采集平台在工作过程中需要处理的数据逐渐增多,但是当前的采集系统数据处理能力相对有限,很难在规定时间内完成规定的统一分析工作,降低配电网用电信息采集工作质量。例如,台区同期线损功能后台统计时间过长[2]。
目前,配电网用电信息采集平台只能通过系统应用进行整体扩容,以满足业务并发要求,但无法满足未来业务的并发线性扩容要求。文章引进分布式架构,提高存储扩展性。
在现有的配电网用电信息采集平台工作过程中,每次系统发布都需要消耗较长的时间,且需要进行停机处理,在系统部署过程中,无法为配电网正常工作提供必要的技术支持[3]。
云计算技术的核心在于分布式计算和虚拟化技术,能够将物力资源抽象化为通用逻辑资源,提升资源使用效率。云计算服务模式分为3个层次,即基础设施即服务(Infrastructure as a Service,IaaS)层、平台即服务(Platform as a Service,PaaS)层、软件即服务(Software as a Service,SaaS)层。
2.1.1 基础设施即服务层
IaaS层包含数据中心物理设备和虚拟化服务。其中,数据中心物理设备包括网络资源和计算节点,提供基础的数据处理服务。即基于OpenStack云平台管理系统,为用户提供弹性计算、虚拟网络、开放存储等服务[4]。
2.1.2 平台即服务层
PaaS层包括数据处理模型、海量数据存储、Docker技术。这些技术是云平台的核心应用技术,能够为用户提供全生命周期管理和相关的资源服务。第一,Hadoop分布式文件系统(Hadoop Distributed File System,HDFS),为客户提供更加安全的数据存储服务;第二,非关系型数据库(Not Only SQL,NoSQL),为客户提供云计算环境下的数据读写服务。与传统关系型数据库相比,该数据库满足高并发读写需求;第三,Docker技术,在Docker容器的基础上,为微服务等场景提供一站式开发运行服务;第四,Hadoop和Spark集群,为相关用户提供海量的数据存储和计算能力服务;第五,集群资源调度管理系统,实现动态的中央处理器(Central Processing Unit,CPU)、内存分配,提升系统资源的使用效率与可靠性;第六,核心服务,提供分布式集中总线服务[5]。
2.1.3 软件即服务层
SaaS层包括各种应用服务,可以根据自身需求进行选择,具有较强的灵活性。其中,数据中台是提供数据共享、数据分析应用服务、沉淀共性数据服务能力的数据综合处理平台,满足跨专业、跨层级数据共享等需求。在业务系统中,数据中台能够有效提升数据整合接入能力、数据资产管理能力、数据分析能力以及数据基础组件支撑能力,可以根据需求进行自由组合。
2.2.1 用电信息采集系统元数据
用电信息采集系统元数据主要包括电能数据、交流模拟量、工况数据,利用物联网的解析功能处理数据的格式,并采用Kafka消息队列实现数据缓存和相关功能,最终实现数据集成。
2.2.2 实时分析平台
平台采用分布式数据流完成Flink的计算,实现数据异步交互。在实际工作中,扫码用电等功能的实现均需要数据异步交互提供支持。HBase属于分布式数据库,是整个平台的重要结构之一,主要用于对计算后数据的存储、计算与展示。例如,技术人员可以通过HBase获取1 d内的电压数据,并根据自身实际需求决定输出格式。
2.2.3 海量数据分析平台
海量数据分析平台主要处理包括HDFS、Hive On sPARK、码分复用(Code Division Multiplexing,CDM)。其中,HDFS用于存放全部用电信息采集数据;Hive On sPARK是计算分析软件,能够根据上层传递的用电信息数据进行相关计算,以满足特定场景下的数据分析需求,如线损数据分析等;CDM主要承担近期数据存储和同步功能,为系统提供基础的数据供应服务。
云服务技术在配电网用电信息采集系统中应用的核心内容是云服务中心,主要由分布式应用集成、部署配置、监控调度等内容组成。
2.3.1 分布式应用集成
包括分布式服务总线、统一权限、统一流程。其中,分布式服务总线提供“去中心化”的统一管理,并支持微服务架构下不同服务之间的高效调用;统一权限、统一流程用于提升系统本身的流程编排能力,以满足系统内部与系统外部之间的交互需求。
2.3.2 部署配置
部署配置的核心在于脚本引擎技术,实现对配电网用电信息采集系统的自动化部署和管理,提高系统的可靠性和灵活性。同时,提供部署编排功能,是配电网用电信息采集系统自动化的核心支持。
2.3.3 监控调度
监控调度是结合调度策略全方位监控整个系统的数据传递路径,有助于提升资源分配质量与回收质量,提升系统性能与应用价值。同时,能够帮助相关技术人员快速定位故障节点,保障数据的完整性与一致性。
云计算技术的加入会提升平台的安全风险,为了保证系统的正常运行,需要进行安全系统建设。第一,安全通信网络。引进虚拟专用网络(Virtual Private Network,VPN)系统,按照不同业务需求选择不同的接入方式,并设置身份认证、授权管理等多项安全举措。第二,安全计算环境。加装Web应用防火墙,实现基于角色的细粒度访问控制,同时能够根据业务特点实现指定条件脱敏,强化信息资产统一管理质量[10]。第三,部署双因素认证系统。引进强口令密码和其他强认证措施,防止技术人员冒充合法用户进行暴力破解。第四,强化安全数据管理。平台需要进行全流程监督,全方位管理组织、流程、账号以及权限,同时加入敏感数据策略、扫描、控制、统计等功能,以实现运用级别的安全管理。
为测试提出的基于云计算的配电网用电信息采集平台的应用效果,需要结合实际情况进行应用测试,以确定该平台的可行性与安全性。
为了满足用电智能化建设需求,配电网通常需要实现区域内部15 min的采集、计算、存储以及查询功能。实际工作场景中,一个配电网用电信息采集平台通常需要负责千万户的用电数据采集工作。传统的配电网用电信息采集平台的工作效率相对较低,一次区域内全量数据采集入库时长基本在2 h左右,导致居民用电数据或数据采集频率存在比较明显的差异,无法满足15 min频度全量用户电表的数据采集需求。
在正式开始测试之前,需要确定具体的测试流程,主要包括云平台与数据中台环境的搭建、云平台与数据中台基本功能验证、部门间对接、测试场景确认、测试方案编制、测试用例编制、业务逻辑开发、测试用例执行、测试结果对比以及测试报告编制等。具体的实验测试项目和相关指标如表1所示。
表1 应用测试项目和相关指标
模拟2 600万用户用电数据采集工作,利用文章提出的基于云计算的配电网信息采集系统,确定系统的基本功能及其可行性。需要判定电表模拟器的数据模拟、并发测试能力;测试报文解析系统的解析能力;测试Kafka的数据推送与缓冲能力;测试Flink的数据流处理能力与计算能力;测试HDFS的数据存储能力。
为保证实验的完整性与有效性,观察数据完整统计、数据采集入库时间、数据存储空间以及用户负荷查询4个指标的变化情况,并比较分析改造前后的特定数值进行比较分析。具体内容如表2所示。
表2 应用测试结果
由表2可知,利用文章所研究的基于云计算的配电网信息采集系统平台之后,4个测试指标均得到明显优化。如数据采集入库时间从95 min降低至3 min,极大地提高了入库效率,验证了该平台的可行性与有效性。
此外,技术人员对基于云计算的配电网信息采集系统的安全性进行了分析验证。结果证明,该安全保障体系具有相当强的完整性,不存在安全漏洞,满足实际工作场景的信息安全保护需求。
通过设计基于云计算的配电网信息采集系统,并对其可行性与安全性进行了验证,测试结果表明该系统能够提高用电信息处理质量,满足实际工作场景的信息安全保护需求。相关单位在实践中可以根据自身实际情况与需求,将云计算技术和传统配电网信息采集系统进行有机结合,以提升配电网信息采集质量,确保电力系统能够正常稳定运行。