李 磊,靳 武
(国网宁夏电力有限公司超高压公司,宁夏 银川 750001)
随着电力系统的不断发展,变电站设备的运行状态与故障预测维护工作日益重要。文章通过构建云计算平台,实现对变电站设备运行数据的采集、传输与存储。同时,开发故障智能诊断与预测模型,建立设备健康评估与预警体系,从而实现对变电站设备的智能化监测与维护。基于云计算的变电站设备故障智能维护系统的建立对于提高电网设备利用率与电力供应可靠性具有重要意义。
云计算利用互联网提供按需、弹性扩展的计算资源和服务,用户可根据自身需求自主申请相关服务,无须自行构建基础设施,能够最大限度地降低使用门槛,使企业和个人更便捷地使用各类计算资源。云计算平台作为一种新型的基础设施服务形态可为客户提供基于虚拟化技术的服务器、存储、网络、数据库以及分析等服务[1]。例如,亚马逊云计算服务(Amazon Web Services,AWS)提供了70 多个云计算服务,用户可根据实际业务需求选择合适的服务。从技术上看,云计算平台具有资源虚拟化、高扩展性等特点。其中,资源虚拟化技术通过抽象和封装服务器、存储物理资源,将其转换为可程序化调配的逻辑资源池。这些逻辑资源池可根据需求进行分配,从而有效提高资源利用率。一台物理服务器可为多个用户同时提供服务。高扩展性方面,云计算平台可根据业务增长情况增加计算资源。当单台服务器性能不足时,可无缝添加更多服务器来承载业务,用户无须关心基础设施扩容问题,从而降低了管理成本。
基于云计算的变电站设备故障智能维护系统采用基于云计算的3 层架构,由数据采集层、网络传输层和云计算层组成[2-3]。
数据采集层部署在变电站内,通过智能传感器网络采集设备的实时状态数据,如电压、电流、温度以及振动等参数。考虑到变电站环境复杂,选择自组网的无线传感器网络(Wireless Sensor Network,WSN)收集数据,节点采用低功耗且抗干扰能力强的CC2530 芯片,支持ZigBee、Bluetooth 等短距离无线通信协议。
网络传输层将变电站内部采集到的设备数据经由工业以太网或4G 专线等方式传输至云计算中心,并综合考虑数据安全机制,如虚拟专用网络(Virtual Private Network,VPN)隧道加密、访问控制等。
云计算层架构在公有云服务商AWS 平台上,具有核心的云数据库和云分析模块。其中,云数据库采用非关系型数据库(Not Only SQL,NoSQL),支持海量设备数据的存储;云分析模块基于Spark Streaming 实时流式处理设备数据,并使用机器学习算法完成模型训练和故障预测分析。同时,将预测结果反馈至变电站相关系统,指导设备进行维护与管理。
考虑到变电站环境的复杂性,数据采集系统需具备抗干扰能力强、功耗低等特点。因此,本系统构建了一套智能无线传感器网络收集数据[4]。网络包含数据采集节点、通信节点和协调节点,节点之间通过自组网的网状拓扑连接,无须人工规划,安装简单方便。其中,数据采集节点负责接入传感器,实时监测设备运行状态;通信节点转发数据包;协调节点制定通信策略,管理网络。传感器包括电压互感器、电流互感器、温湿度传感器以及振动传感器等。此外,考虑到数据安全性,需要在通信节点和协调节点间建立数据包传输层安全性协议(Datagram Transport Layer Security,DTLS)与安全通道。
完成数据采集后,需要将海量设备状态数据安全可靠地传输至云平台。本系统基于工业级无线以太网技术构建站内局域网,采用IRF 系列工业路由器,可适应复杂电磁环境,实现高可靠性数据传输。同时,系统内置VPN 客户端,通过加密隧道将设备数据安全地传送至云数据中心。如果变电站使用的网络为4G网络,也可以直接采用4G专线的方式连接云平台,云平台具备弹性扩容能力,可根据业务需求扩大网络带宽[5]。
云计算平台部署于AWS 云服务上,采用服务器LESS 架构,无须管理服务器,可弹性扩展,按需付费。平台包含云数据库、流计算和机器学习模块。其中,云数据库选用时序数据库InfluxDB,用于存储和管理海量时序数据,支持结构化查询语言(Structured Query Language,SQL),可自定义数据保留策略。数据库架构采用一主多从的方式,实现了高可用,并启用了企业级权限管理机制。流计算由Kafka 和Spark Streaming 模块组成,Kafka 负责收集、缓存与分发数据,而Spark Streaming 则通过并行流式处理驱动机器学习算法,实现实时预测。预测所用的机器学习模型采用长短期记忆网络(Long Short-Term Memory,LSTM),可处理时间序列,且具有较好感知设备状态变化规律的能力。
云平台计算资源可根据业务需要进行弹性扩缩容,当系统负载超过预置阈值时,平台会自动增加计算节点;当负载降低时,会回收部分节点以节省成本。该自动扩缩容过程不会影响对外业务,保证系统在业务高峰期能够获取足够计算能力,以确保预测效果;在非高峰期减少资源占用,以降低系统运营成本。流式计算模块采用了复杂事件处理(Complex Event Processing,CEP)技术检测设备。通过实时分析和匹配设备数据与故障模式,可快速定位设备异常位置,以便系统进行故障预测。
故障诊断模块基于Spark Streaming处理流式数据,以获取设备实时状态。系统构建了标准状态模型库,以记录各类关键设备的正常工作参数区间,如电压、湿度范围等。同时,利用流式计算框架实时对比设备状态与标准模型,判断是否存在偏差超标现象。如果测点数据多次低于或高于正常区间,即认为可能发生故障,采用CEP 技术触发故障警报,并指导现场人员进行故障检修。
故障预测则使用LSTM 神经网络实现。该算法能够感知时间序列数据的长期依赖关系,预测效果更优。首先,需要选择包括设备运行温度、电压波动指标、气体浓度等多维时序数据。其次,构建模块化LSTM网络,依次进行训练与调优。最后,集成各LSTM子模块,以完成模型集成。该模型可预测系统中不同类型设备的故障概率,且验证集准确率在81%以上。预测系统采用增量学习方法持续在线学习,以自动适应设备状态变化。
云平台信息汇集组件可汇总所有关键设备的实时健康状况打分情况,以评估变电站总体运行安全级别。同时,根据预测结果,提前30 ~60 d 左右进行预警,并输出设备优先级与威胁度量,以便站方制定设备维护计划表,指导现场进行管理与维护工作,最大限度地降低突发故障对电网稳定运行的影响。
系统安全主要考虑数据采集、网络传输和云平台3 个环节。首先,在数据采集环节,节点间使用硬件AES 加密芯片,并在传输数据前生成动态AES 128 位组密码;其次,网络层通过IPSec VPN 隧道将设备数据安全地传输至云端,同时云数据库启用透明数据加密(Transparent Data Encryption,TDE)功能,对所有数据磁盘进行加密;最后,云计算节点开启防火墙,禁用远程根登录,并启用CA 证书及身份识别与访问管理(Identity and Access Management,IAM)等安全措施。
系统可靠性设计包括硬件冗余与软件高可用(High Availability,HA)集群。第一,核心网络设备(如工业路由器、交换机等)都具有1+1 冗余机制,主用设备发生故障时可快速切换至备用设备,以确保数据流无中断;第二,云数据库主从架构实现同步复制,若主节点异常可快速选举新主数据库,确保服务的可用性;第三,流计算和机器学习平台基于Kubernetes 容器管理,实时监控容器的健康状态。当容器出现异常时,会替换为新容器,确保系统高可用。云上基础资源采用了多可用区(Availability Zone,AZ)部署策略,跨可用区复制数据。如果一个AZ出现问题,可以快速切换至另一个AZ,避免单点故障,增强了系统的容灾能力。
为评估文章设计系统的性能,需要搭建实验平台进行测试验证。实验场景为安装有分布式传感器网络的220 kV 变电站,并包含机房温湿度、电气部件温度、气体浓度以及铁芯振动等参数的无线采集单元。温度传感器的计量范围为-40 ~125℃,精度为0.1℃;湿度传感器的范围0 ~100%,精度为0.8%;气体传感器检测煤气、一氧化碳等参数;振动传感器的频率范围为10 ~1 000 Hz 等。采集节点自行组网构建无线MESH 网络,采用CC2530 芯片,发送周期为60 s。
在站内交换机与工业路由器之间建立IPsec VPN隧道,并接入4G 专线,确保数据平稳发送至公有云AWS。在AWS 云服务器EC2 上搭建时序数据库、流计算和机器学习平台。其中,数据库类型为InfluxDB,流计算框架为Spark Streaming,使用LSTM 模型预测设备状态。通过模拟正常运行状态,以验证系统的智能分析与预测效果。评估维度包括实时数据采集成功率、VPN 网络传输时延、数据处理延迟、故障检测精确度以及预测准确率等指标,以评估系统在变电站设备健康评估与故障预测中的应用效果。
实验测试结果如表1 所示。
表1 实验测试结果
由表1 可知,数据采集节点平均成功率为99.3%,说明构建的无线传感器网络稳定可靠;VPN网络的平均传输时延为68 ms,满足工业互联网对网络时延的要求;从采集设备数据到云平台分析的平均端到端延迟为187 ms,满足阈值要求;在注入多类设备故障场景下,基于流式计算和机器学习的智能诊断与预测模块响应迅速,故障检出率达到94.2%;经过迭代优化,LSTM 预测模型在变电站关键设备的故障概率预测准确率达到了87.3%。因此,该系统满足工业级智能维护与管理需求,能够大幅提高变电站设备的健康管理水平与运维效率。
将该系统应用于某变电站,对站内15 台主变压器和27 台开关柜的温度、湿度、气体浓度等信息进行实时监测,并构建设备数字孪生模型,实现对变电站内关键设备的全面智能化管控。相比于传统的人工巡检模式,该系统显著提升了变电站设备的健康状况评估与故障预警能力。应用效果评估对比如表2 所示。
表2 应用效果评估对比
由表2 可知,应用文章提出的变电站设备故障智能维护系统的故障预警效果显著。这主要归功于云融合智能的运维模式,历史数据与模型积累的加入使故障预测结果更准确。该本系统运用了先进的物联网、工业互联网和云计算技术,可应用于电力系统的风电场、电力电容器、开关柜以及电站蓄电池等设备的故障预测与状态维护,实现电力行业的智慧运维。
基于物联网与云计算技术的智能化预测维护系统在提升变电站设备可靠性与运维效率方面展现出巨大潜力。文章对该系统框架进行了测试,结果表明该系统能够实时智能地评估设备健康状态,还可以进行故障预测,提出维护建议。由此可知,利用云端强大的计算与分析能力构建智慧变电站,并对设备运维进行优化,将大幅提升电网安全性、经济性与环保性。