王宇庭
(中国长江三峡集团有限公司中国三峡武汉科创园,湖北 武汉 430015)
中国拥有的大量水能资源为实现“双碳目标”提供了有力支撑。当前,风电、水电、光伏发电互补已成为新能源的发展趋势。水风光一体化发电的新模式对水电站设备管理提出了挑战。水电站需要更加频繁的启停机组,增加或减少负荷以满足电网调频的需求。水电站运管能力,尤其是在线状态监测和故障诊断能力是保证设备安全可控运行,实现水风光一体化发电的重要条件。目前,我国的中大型水电站已经基本实现了设备状态监测、故障诊断功能。
进一步提升水电站的运管能力,有效提升水电站设备在线监测和故障诊断的能力,是当前重要的研究内容。陈辉 等[1]采用大数据和神经网络算法构建了流域梯级水电站集中诊断平台,提升了机组故障诊断的效率。张俊岭[2]采用运筹学和动态规划技术构建水电站信息系统,扩展了水电站监测系统的功能。蒋致乐[3]从硬件和软件两个维度研究了静态和动态检验的方法,提升了现场检测技术的覆盖度。孙小江 等[4]从感知层、网络层、应用层3个层面设计了基于物联网技术的水电站在线监测平台。姜小艳[5]设计了针对压缩机的监测与故障诊断系统。
对已有研究成果分析可知,国内在水电站设备状态监测和检修管理系统研究和应用方向上已经具备了厂站级设备在线监测与故障诊断系统、大规模设备状态分析系统建设与运维的能力。但是当前大型流域水电集团下辖的水电站分布范围比较广,设备类型和设备数量比较多,大量实时设备状态分析数据挤占网络带宽,数据的集中存储和实时分析占用大量的服务器资源,导致已有的集中式在线监测和故障诊断系统性能较低。为解决此问题,提出了一种分布式水电站在线监测与故障诊断平台建设思路,在该平台基础上提出了基于区块链的分布式监测机制和基于联邦学习的故障诊断机制。
本文提出的分布式水电站在线监测与故障诊断平台的体系结构如图1 所示,该平台包括前端智能采集层、数据边缘存储与计算层、智能控制中心层。
图1 分布式水电站在线监测与故障诊断平台的体系结构
前端智能采集层由多个独立的水电站数据采集节点构成。每个水电站数据采集节点包括设备状态数据采集节点、环境参数采集节点、网络参数采集节点。通过这3 种类型节点的数据采集,每个水电站可以对水电站设备、环境以及通信网络进行实时的数据采集,为水电站在线监测和故障诊断提供详细、实时的运行数据。
数据边缘存储与计算层主要包括边缘存储节点和边缘计算节点。边缘存储节点可以实现设备与环境基础数据存储、水电站运营结构化数据存储、水电站运营非结构化数据存储。设备与环境基础数据包含水电厂的位置、规模、设备类型、环境等基础数据。边缘计算节点主要包括权限管理服务、数据管理服务、实时计算服务、在线监测服务、故障诊断服务、优化与检修服务。权限管理服务模块主要功能是对边缘计算和数据的访问进行权限管理,保证数据和节点的安全。数据管理服务主要是对前端采集层的数据进行管理,并为在线监测、实时计算和故障诊断模块提供数据支撑。实时计算服务模块主要功能是快速完成水电厂管理中心下发的临时计算任务。在线监测模块主要功能是对水电厂的设备、环境、网络等状态数据进行实时获取和分析,并将异常信息以告警的形式上报给水电站的故障诊断服务模块。故障诊断服务模块主要功能是根据在线检测提供的告警数据以及数据管理服务模块提供的基础数据,采用基于规则、人工智能等算法快速实现故障定位。优化与检修模块主要功能是根据故障处理结果、或者是一线运维人员的指令,对水电厂的设备环境以及网络状态进行优化调节,提升水电站运营的可靠性和稳定性。
智能控制中心层包括云计算节点和区块链节点。云计算节点主要包括计算权限管理、在线监测管理、故障诊断管理、优化与检修管理、诚信管理、实时计算服务模块。云计算节点的部分功能模块与边缘计算节点的功能模块类似,主要区别是云计算节点的功能是从全局多个水电站的视角进行全方位的全局管理。与边缘计算节点不同,在云计算节点增加了诚信管理模块,该模块主要是为了防止部分水电站在分布式水电站监测与故障诊断协作过程中,出现上报数据延迟、数据不准确、检修拖沓等问题。诚信管理服务模块的目标是调动各个水电站的积极性和责任心,从而提升智能控制中心的决策与运维效率。
区块链节点主要包括数据权限管理、数据服务管理、共识机制、智能合约4 个模块。数据权限管理模块主要是对全局数据访问的权限进行认证和管理,从而保证数据的安全性。数据管理服务模块主要功能是与边缘计算节点进行协作,获取云计算节点中需要使用的数据,并对数据进行临时存储。共识机制是在多个分布式的水电站之间建立一种公平公正的选举制度,从而保证参与到分布式水电站平台的水电站具有公平的竞争机制。智能合约是将分布式水电站的数据管理、权限管理等功能模块,实现程序化运营,从而提升分布式水电站在线监测与故障管理平台的运营效率。
由于区块链技术在数据溯源、防篡改方面具有较好的应用价值[6,7],本文将区块链技术应用到分布式监测机制中,提出基于区块链的分布式监测机制。该机制包括数据采集、数据清洗和存储、数据使用、数据上链4 个步骤。
①在数据采集阶段,由数据采集节点对设备、环境数据进行采集。包括主动数据采集和被动数据采集两种方式。被动数据采集是采集节点向设备、环境等物联网传感器和监测设备发送数据采集请求,由被采集设备向数据采集节点回传相关的数据。主动数据采集是指物联网传感器和监测节点将突发事件或数据指标超过阈值的数据主动上报给数据采集节点。②在数据清洗和存储阶段,由边缘存储节点对本区域内采集进来的数据进行清洗和存储。数据清洗之后可以包含结构化数据和非结构化数据两类。在数据存储阶段,为了提升数据的可靠性和可用性,将数据存储到本区域的边缘存储节点,可以有效解决数据丢失的问题。③在数据使用阶段,主要是边缘计算节点对本区域内的数据进行使用。边缘计算节点在使用本区域数据时包括下面两个维度。首先,对于一些紧急的事件或者通过专家系统规则可以识别出的异常数据,通过本地的边缘计算节点能够快速的进行响应,提升数据的使用效率。另一个维度,边缘计算节点与智能控制中心的设备进行协作,采用基于联邦学习的故障定位机制对故障进行管理。④在基于区块链的数据上链过程中,由于每个水电站都可能受到病毒攻击或者出于恶意竞争的原因而做出错误的决策。所以,在基于区块链的分布式监测机制中,将下面两类数据上传到区块链进行存储。第一类数据是没有或者是很少涉及隐私的数据,以及关键指标数据。另一方面的数据是联邦学习中训练模型中得到的模型数据。关键指标数据可用于分布式监测系统判断各个区域内水电站是否遭受病毒攻击,以及被监测重要节点的数据。
由于联邦学习在分布式场景中具有模型训练效率较高的特点[8],本文设计了一种基于联邦学习的分布式故障定位机制。该机制包括启动故障定位模型训练任务、边缘计算节点执行本地训练、云计算节点对模型进行评价、模型应用4 个过程。
①在启动故障定位模型训练任务步骤中,云计算节点根据各个边缘计算节点的计算请求,启动故障定位模型训练任务。由于边缘计算节点的覆盖范围小、设备故障处理经验不足,当边缘计算节点不能有效解决故障定位问题时,需要由云计算节点进行决策。②在边缘计算节点执行本地训练步骤中,云计算节点将模型训练任务下发给各个边缘计算节点时,边缘计算节点需要从本区域内的边缘存储节点获取模型训练数据并在本地进行训练。根据训练的要求,各个边缘计算节点可以对模型的参数进行优化,并将优化的结果返回给云计算节点。③在云计算节点对模型进行评价步骤中,云计算节点在得到各个边缘计算节点的训练模型参数后,将这些参数和关键的数据进行聚合,并根据模型的应用效果要求边缘计算节点再次训练。关于模型聚合的方式,可以使用函数获取,也可以使用简单的均值计算方法获取。④在模型应用步骤中,当模型训练的结果收敛到一定阈值内时,模型训练结束。云计算节点将训练好的模型下发给任务请求节点,由任务请求节点对模型进行实施和优化。可以采用的优化方法包括设定目标函数值来判断或者设定训练次数值来判断。最后,相关边缘计算节点将模型执行结果返回给云计算节点,由云计算节点对模型及应用效果进行保存。
在性能分析方面,从平台的可用性、安全性、可靠性3 个维度,验证了本文提出的在线监测与故障诊断平台和机制具有较好的应用价值。
(1)在平台的可用性分析方面,从平台的3 个层次分别分析该平台的可用性。在前端智能采集层,该平台的体系架构通过在各个水电站采用物联网技术去采集设备、环境和网络状态的参数。当前物联网技术已经比较成熟,所以前端采集具有可用性。在数据边缘存储和计算层,本文将各个水电站的数据存储到边缘存储节点,在网络带宽保留和数据存储效率方面都具有较好的可用性。对于一些常见的故障或者采用本地计算节点可以快速处理的紧急事件,采用边缘计算节点进行执行。在智能控制中心,平台采用云计算节点对各个边缘存储和计算节点不能解决的疑难问题,或者是需要多个水电站相互协作才能解决的问题进行处理,可以从全局的视角提升处理问题的准确率和性能。
(2)在平台的安全性分析方面,从数据的安全性、计算节点的安全性两个维度进行分析。在数据的安全性方面,从下面两个维度对数据进行管理。第一个维度是水电站自身范围内的边缘存储节点对数据进行管理。另一个维度是全局的区块链节点的数据管理。采用边缘存储节点对数据管理可以提升数据的使用效率,而且可以避免因为数据传输导致的数据丢失或者数据被篡改、数据泄密的问题。采用区块链节点对数据进行管理,可以将关键数据或者是模型数据保留在一个更加安全的区块链节点存储平台中,避免部分水电站因为安全配置能力弱而遭受黑客攻击,导致整个或者是多个水电站受到攻击。所以本文的平台可以从数据的存储安全和使用安全两个维度,保证平台的安全性。
(3)在平台的可靠性分析方面,从节点的可靠性和模型可靠性两个维度进行分析。本文采用分布式的水电站数据监测、分布式的故障诊断技术,可以有效避免单个节点故障导致系统不可用现象的发生。尤其是本文对需要传输的全局数据,采用区块链节点进行存储,有效提升数据的可靠性,为训练模型提供重要支撑。在训练模型的可靠性方面,采用联邦学习的机制,充分调动各个水电站训练模型的积极性。所以本文的平台具有较高的可靠性。
水电作为一种重要的清洁能源,得到越来越多国家的高度重视。随着水电站数量的增加,以及水电站对风电、光电的接入,水电站的稳定性和可靠性越来越重要。为了提升水电站的稳定性和可靠性,本文设计了一种分布式的水电站在线监测和故障定位平台和运行机制。为了进一步提升本文在线监测和故障诊断平台的应用价值,下一步工作中将基于本文的研究成果,对具体的故障监测和故障诊断模块进行优化,提升本文成果的应用价值。