钟 华
(广东电网有限责任公司广州供电局,广东 广州 510200)
建设智能远动机对电网调控一体化的推进有着极为重要的作用。作为厂站端的核心功能模块,智能远动机能够采集电网终端数据并支撑电网运维体系架构。智能远动机集变电站端远动、保护信息子站、电源管理单元(Power Management Unit,PMU)集中器、在线监测以及电能计量采集5 大功能于一体,并逐步推广至告警直传、远程浏览、源端维护以及程序化控制等高级运用,实现数据统一建模和统一采集,形成统一的数据出口与调度主站通信。智能远动机是实现变电站无人值守的基石,能够为推进二次设备远程运维管控平台建设提供支撑数据。此外,变电站与调控主站的通信采用变电站双远动、通信通道双配置、调度数据网二次安防双平面以及调度主站双前置等冗余机制来提升其通信可靠性,因此研究基于调控一体化的智能远动机对站控层设备监测方案的设计十分重要[1-3]。
500 kV 变电站二次保护、测控以及安全稳定控制装置的数量较多,站控层网络结构复杂,尤其是在扩建和改造过程中会调整或扩展站控层网络架构,而不合理的调整可能影响整个网络的通信质量,增加网络数据流量的内循环,降低网络通信的效率。
2022 年,工作人员处理某500 kV 变电站上送总调主站的遥测和遥信品质数据时,数据显示为无效,但当地监控后台、中地调主站显示数据刷新正常[4,5]。打印测控装置内部信息,发现测控装置与总调智能远动机连接使能失败,通信处于停运状态,但测控装置与智能远动机的物理连接正常。使用ping 命令测试正常,但测控装置拒绝智能远动机的连接请求。使用调试计算机接入站控层交换机,并用调试工具连接该测控装置,连接使能失败。使用telnet 命令连接该测控装置,装置频繁打印“发送错误”信息。监控后台断开与该测控装置的A、B 网物理连接后再恢复其物理连接,通信不能恢复正常。故障定位可以确定测控装置网口通信异常,但不确认智能远动机是否存在异常。重启测控装置后能够恢复同智能远动机的正常连接和数据交互,需深入检查引起故障的原因。
通过站控层网络抓包发现,该测控装置与总调智能远动机的网络链路存在丢失数据包、链路延时以及数据包重传的现象,而与监控后台和中地调远动之间的链路不存在该现象。通过telnet 端口调试打印信息发现,测控装置存在大量报文发送失败的情况,造成报文挤压,但不同连接的报文缓冲区相对独立,与总调智能远动机通信中断后出现大量报文积压且缓冲区溢出的现象,导致装置不再接收智能远动机的使能请求。智能远动机、中地调远动机以及监控后台同为客户端设备,但其通信网络结构存在差异,造成人为增加了第三级交换机的报文数据流量,同时降低了通信链路的可靠性,增加了网络延时和丢失数据包等问题的发生概率[6]。总调远动机改造前与改造后的网络结构差异如图1 所示。
图1 总调远动机改造前与后的网络结构差异
分析网络报文数据量可知,对于主控室235P 子交换机(235P-4n)而言,其处理的直接接入该交换机的二次设备的报文流量未发生变化,但通过其与中心交换机(235P-1n)的级联线采集智能远动机与站内其他子交换机的数据,大大增加了子交换机需要处理的报文量。总调智能远动机改造后的网络数据流量异常,如图2 所示。
假设站内每台子交换机对单个客户端的平均流量为X,则在智能远动机部署前,每个子交换机处理的数据流量为6X(单网共6 个客户端)。智能远动机部署后,各个子交换机处理的数据流量稍有不同。一方面,对于除子交换机(235P-4n)外的其他子交换机而言,其处理的数据流量不变,仍为6X;另一方面,对于子交换机(235P-4n)而言,其不仅需要处理直接采集的二次设备的数据(流量为6X),还要处理中心交换机通过级联线转发的其他15 台子交换机的数据,流量为30X(智能远动机为2 台,共2个客户端),共36X。
虽然智能远动机接入了子交换机,但是没有正确接入中心交换机,而子交换机因设备老化和数据流量过大等导致网络不稳定,出现丢包或报文乱序等异常情况,最终导致智能远动机重新连接测控装置时无法建立连接出现通信中断问题,引起智能远动上送总调数据异常。调整现场网络结构并重启测控装置使其恢复初始运行状态,将智能远动机由接入子交换机更改为接入站控层中心交换机。调整前后均进行抓包比对数据流量差异,发现此后通信未出现异常[7,8]。
基于总线机制的智能电子设备(Intelligent Electronic Device,IED)状态监测感知的重点是将变电站监控机、远动机与站控层网络之间的3 大问题可视化。一是监视站控层网络交换机的状态和网络流量,比对中心交换机和子交换机数据流量;二是实现监控后台机对远动双机实现监测,并将故障状态以软报文的形式通过运行正常的远动机上送调度主站;三是实现远动双机相互监测感知,解决远动备机因软硬件故障无法被监视和感知的问题。实施方案后,监控后台能够通过总线机制实时监测远动机内部状态。远动机无论在双主还是主备运行模式下,都能通过心跳报文机制被监控后台与正常远动机及时发现任何一台远动机的死机状态。
站控层网络交换机是变电站的核心设备,负责全站数据的传输和分配。网络架构搭建是否合理是变电站信息传输速率达标的关键因素。通过监视交换机运行的实时状况,包括中央处理器(Central Processing Unit,CPU)/内存长期使用率、核心进程是否频繁重启、数据丢包率、通信速率以及CPU 运行温度等,并比对中心交换机和子交换机数据流量的差异,可以监视和感知站控层网络的异常现象,消除网络故障隐患。
远动机内部监测告警主要内容包括核心进程退出且无法恢复、主远动机和备远动机切主机过程导致双主影响对上通信、CPU/内存长期使用率越限以及硬盘分区空间不足预警等。核心进程包括实时数据服务程序、101 规约通道或104 规约通道进程通信服务程序等。这些进程一旦退出,会影响装置的主要功能。考虑远动软件的看门狗自恢复机制,设定持续检测时间为5~10 min(可整定)。若检测到核心进程未运行,则发出提示告警信息;若装置CPU 或内存使用率长期过高,则软件程序可能出现异常,如程序进程死循环、病毒或木马感染、系统文件错误或内存泄漏等,需要提示告警。硬盘剩余空间不足时,可能导致运动机的实时数据库出现无法写入保存的情况,此时需要进行监测,并根据现场需求设置预警值。调度主站是主备模式,即远动机的主机处于通信状态,备机处于热备状态,但间隔层设备是双主模式。若间隔层设备与远动备机通信中断,而与远动主机通信正常,则会出现2 台远动机实时数据库不一致的情况。一旦远动主备机进行切换,就会导致调度主站的数据跳变或数据无效,从而影响调度监盘和系统的潮流。因此,2 台远动机实时数据库出现不一致时应当提示高风险运行状态,根据实际情况采取相应措施,消除故障隐患。
远动机的硬件或软件死机可能导致信号出现无法输出的情况。若装置运行指示灯和其他功能灯均处于正常状态,则巡视人员不会对远动机进行操作或远程登录检查,此时将难以发现远动死机。主备模式的远动机正常运行时,调度主站和远动主机建立连接,备机处于热备状态。若主机因故障退出运行,则备机切换成为主机后才与调度主站建立通信连接,因此备机对上通信的准备状态处于盲区。设计的方案采用外部定时监测报文方式,将总线上长期无法监听远动机装置的心跳报文作为装置死机标志。状态监测感知模块拓扑如图3 所示。
图3 状态监测感知模块拓扑及流程
建立设备表,包括站控层和间隔层需要监测的设备。一个设备节点对应一条记录,每条记录包括设备名、设备网际互连协议(Internet Protocol,IP)地址、设备故障状态、设备告警状态、网口丢包率、CPU使用率、内存使用率以及磁盘剩余空间等信息域。状态监测程序获取本机的运行状态数据,写入设备表的对应记录域,同时将本设备的状态数据包发送到数据总线。数据包中包括设备名和监测数据等,结构定义如下。
站控层其他设备收到数据包后进行解析,按设备名将监测设备的状态数据填写到对应的记录表中。为防止无法监测出死机现象,针对连续长时间(设置时间大于10 min)未收到某个设备状态报文的情况,应将该设备在本地数据库的对应设备状态信息设为告警。设置时间大于10 min,是考虑二次设备较多的变电站的常见选择。远动机重启后,建立通信一般需要的时间比较长,从而避免正常重启时的误告警。
监测感知模块程序流程如图4 所示。启用2 个定时器,一个用于监听站控层其他节点的报文,一个用于监测本机状态并将自诊断数据包发送到总线上。设置发送定时器周期大于监听定时器周期乘以设备数量,以免接收缓存区溢出。
图4 监测感知模块程序流程
监控后台实现监测站控层交换机和远动机的运行状态。远动机主备模式和双主模式均能实现双机互相监测。设备故障信号表示主要功能受到影响不能正常工作,即设备退出运行,包括设备死机、设备运行灯不亮、核心进程退出等信号。状态告警信号表示装置存在运行风险但尚能正常工作,包括CPU 或内存长期资源不足和硬盘空间不足等信息。当远动机发生告警状态变化时,实时形成自诊断数据包,并推送至另一台正常运行的远动机和监控后台机,同时驱动预警音响。程序具备日志记录功能,存盘后便于故障查阅分析[9,10]。
调控一体化是新型电力系统的最佳承载形式。电网运行可知和设备状态可感,是智能电网的基本特征。这些功能的实现需要与智能远动机同步推进,实现深度融合。按照南方电网一体化电网运行智能系统建设方案,全区域电网500 kV 及以上电压等级的变电站需要建设投入智能远动机。存量运行中,变电站需逐步完成加装智能远动机的要求。目前,智能远动机集变电站端远动、保护信息子站、PMU 集中器、在线监测以及电能计量采集等功能于一体的改进正处于试点阶段,自动电压控制(Automatic Voltage Control,AVC)防误闭锁操作和程序化控制等高级应用功能也将逐步在智能远动机上实现。作为厂站端核心功能模块,智能远动机既要实现对间隔层设备数据采集的正确性和稳定性,又要实现对调度主站通信的实时性和可靠性,从而提升监测感知功能,加强设备自身的运行稳定性,提高冗余通信的可靠性,降低建设成本,体现出较高的应用推广价值。