直流控制保护系统总线故障诊断研究

2018-04-03 07:11三峡电力职业学院王丽丽
电子世界 2018年5期
关键词:水冷换流站板卡

三峡电力职业学院 王丽丽

0 引言

目前国内在运的换流站中,采用MACH2系统的现场通信总线主要有CAN总线和TDM总线两种,其中CAN总线用于实现数字量信号的传输,是MACH2系统中设备数据交换的基础之一[1]。在这些直流工程中,CAN总线故障通常表现为主机误发信号、板卡不明原因stall、瞬发性CAN总线通信故障等,极易造成单套控制保护系统退出运行,严重时甚至造成开关偷跳、直流闭锁等后果,严重威胁跨区电网[2]安全稳定运行。CAN总线故障通常不易确定故障原因,长期以来困扰着一线直流控制保护系统运维人员。

1 应用背景

某公司2015年以来,所辖A换流站(整流站)和B换流站(整流站)换流变接口屏TFT频繁出现PS860板卡stall现象。每次出现故障时,后台事件记录均报“紧急故障”、“CAN TFT故障”、“DSP/TDM PCI板故障”等告警,现场TFT屏内PS860板卡stall红灯亮。表1是2017年A换流站与B换流站TFT屏内PS860板卡stall情况的统计。

表1 A换流站、B换流站TFT屏内PS860板卡stall故障情况统计表Tab.1 The statistics table of PS860 board stall failure in TFT cabinet at A converter station and B converter station

从表1中看出,TFT屏内的B4/H5.13位置的PS860板反复出现stall故障,且更换新板卡后依然无法解决问题。2017年以来两站TFT屏B4/H5.13位置的PS860板卡共发生了18次故障,每次故障均会导致直流极控单系统退出,若此时另一系统发生紧急故障,会造成直流单极闭锁,给电网造成巨大影响,对此急需找到故障原因来消除该重大隐患。

2 常规故障诊断手段存在的问题

为了消除A换流站、B换流站TFT屏内B4/H5.13位置的PS860板反复stall故障,该公司组织运维人员对PS860故障问题进行了长期跟踪分析。前期主要采取的方法为对板卡程序源代码进行分析和外接超级终端捕捉故障信息,这两种方法缩小了故障范围,但对故障处理方法并未有实质性指导意义,仍然采用的是重启或者更换板卡的方法来临时解决问题。

2.1 板卡程序源代码分析

运维人员依据现场报警报文和故障情况,在对PS860板卡DSP程序的C语言源代码进行研究后,判断导致PS860出现DSP/TDM故障的可能原因共有4种,分别为:板卡硬件故障、C167要求DSP停运、DSP过载、DSP自停止。对板卡程序源代码分析仅将故障可能的原因缩小范围,无法明确具体故障原因。

2.2 外接笔记本电脑捕捉故障信息

2017年2月28日,B换流站再次发生PS860故障,运维人员在现场通过外接笔记本电脑,捕捉到了PS860板卡故障瞬间的串口打印信息。如图1所示。

图1 2017年2月28日B换流站PS860板故障信息Fig.1 The fault information of PS860 board in B converter station on February 28,2017

由以上信息可判断PS860板卡故障原因为程序出现过载。正常运行时PS860板卡负载维持在较低水平,但仍然出现程序过载,极可能由于PS860板负载出现突变而导致程序过载,板卡程序停止运行,发出过载报警。

通过外接笔记本电脑捕捉到了PS860板的故障信息,初步分析认为PS860板卡负载出现突变,但对于负载突变的原因仍不能明确,无法彻底解决PS860板频繁故障的隐患。

3 CAN总线分析仪的故障诊断应用

该公司经过多方研究探讨,首次尝试在换流站引入CAN总线分析仪进行故障诊断。经过不懈努力,终于找到了PS860板负载突变的原因,彻底解决了TFT屏PS860板频繁stall的重大隐患。

3.1 故障诊断原理

使用CAN总线分析仪进行故障诊断的原理是将其接入控制保护系统CAN网中,通过捕捉CAN总线报文并对报文进行解析,用于故障原因分析。[3]由于现场TFT屏I/O机箱内已无端口用于直接接入CAN总线分析仪,因此可采用在原有I/O机箱备用插槽位置新增PS8761板卡后与CAN总线分析仪连接的方式,不影响现有控制保护系统设备正常运行,不改变其运行方式。以本文案例为例,可按如图2所示方法将CAN总线分析仪接入控制保护系统。(1)在控制保护系统I/O机箱内备用插槽上安装一块PS8761板卡;(2)将CAN总线分析仪与笔记本电脑通过USB电缆连接;(3)启动笔记本电脑上的CAN总线分析软件,设置其为只听状态(不会向CAN网发送报文);

图2 CAN总线分析仪接入控制保护系统方法Fig.2 The method of CAN bus analyzer accessing control and protection system

(4)将CAN总线分析仪与PS8761板卡通过CAN总线电缆测试夹头连接。

3.2 监视报文流量

2017年7月29日,运维人员在B换流站现场通过CAN总线分析仪监视TFT柜内CAN总线报文,发现CAN总线报文流量不均匀,存在尖峰。若尖峰持续时间较长,足以导致PS860出现过载故障。如图3所示。

图3 CAN报文流量统计Fig.3 The traffic statistics of CAN message

2017年8月3日12点,B换流站极1TFT屏B系统的PS860板再次发生故障,由CAN总线分析仪捕捉到的报文可以看出,PS860板最后一帧心跳报文(08100083)发出时间为12:22:44,此后经过一个持续时间较长的CAN流量报文尖峰后,再未发出心跳报文,由此判断PS860故障是由CAN总线流量突然增大导致过载引起。如图4所示。

图4 PS860板卡经过CAN报文流量尖峰后过载故障Fig.4 The overload fault ofPS860 board after CAN packet traffic spikes

3.3 报文解析

2017年8月4日,运维人员对流量尖峰处的报文进行解析,发现导致CAN报文流量出现尖峰的原因是由于水冷系统PS830板卡报文重复发送所致。如图5所示。

图5 CAN报文流量尖峰处放大后的情况Fig.5 The enlarging of CAN message fl ow spikes

在整个报文捕捉过程中,所有导致CAN总线利用率[4]大于10%的尖峰都是由帧ID为 0x06017404的报文造成。这类报文是极控制保护主机内PCIB板卡应答水冷系统PS830板卡事件的报文。如图6所示。

图6 来自PCIB板卡的水冷系统事件应答报文Fig.6 The responsive message from PCIB board of cooling system

检查应答报文内容,发现水冷系统的事件均被重复应答两次,由此推断站内水冷系统报文存在重复发送的异常现象。由于MACH2系统事件报文的背景更新机制,无论是否有报文产生,均会周期性发送背景更新事件。B换流站水冷系统两块PS830板卡共有120多个事件,若同时发送且重复发送两遍,会在CAN总线上集中产生240帧报文,诱发PS860过载故障。

2017年8月4日,现场临时修改水冷系统程序,消除水冷系统事件重发异常。程序修改完成后,B换流站TFT屏内最高CAN总线利用率从12%下降到6%,效果明显。如图7和图8所示。

图7 水冷系统程序修改前B换流站CAN总线报文流量Fig.7 The CAN bus message fl ow of B converter station before modifing the cooling system program

图8 水冷系统程序修改后B换流站CAN总线报文流量Fig.8 The CAN bus message fl ow of B converter station after modifing the cooling system program

4 结论

在经过长期的跟踪检查并引入CAN总线分析仪进行故障诊断后,A换流站、B换流站TFT屏PS860板卡频繁故障的问题得以彻底解决。故障原因为水冷系统事件报文重复发送,导致极控主机PCIB板卡重复应答,大幅增加CAN总线报文流量,造成报文分布不均,出现大量高流量尖峰,一旦PS860板卡自身负载短时增加或CAN网上其他报文同时发送,就会引起PS860板卡过载故障。

(1)通过板卡程序源代码分析、外接笔记本电脑捕捉故障信息等方法仅能作为一般故障诊断手段,对故障处理无实质性指导意义,不能准确定位故障点,无法深入分析故障原因。

(2)使用CAN总线分析仪可以迅速定位故障原因,极大地缩短故障诊断时间,尤其是对频繁出现的、原因不明的控制保护设备故障,故障处理方案明确,优势明显。

[1]张尊扬,李学生,哈文森. 总线技术及CAN总线技术简介[J].电子世界,2013,(12):98.

[2]曾南超. 高压直流输电在我国电网发展中的作用[J].高电压技术,2004,(11):11-12.

[3]韩成浩,高晓红. CAN总线技术及其应用[J].制造业自动化,2010,32(02):146-149.

[4]史久根,刘蓬,张培仁.CAN数据传送的实时性研究及其应用[J].信息与控制,2004,(03):342-346.

猜你喜欢
水冷换流站板卡
空调冷冻水冷回收技术可行性研究
增压汽油机集成水冷进气歧管三维流场分析
计算机机箱智能水冷系统
基于PCI9054的多总线通信板卡的研制
基于FPGA的多通道模拟量采集/输出PCI板卡的研制
直流输电换流站阀冷却水系统故障实例统计分析
秦淮河水冷,战事几回伤
换流站电阻冷却面板鼓包分析
换流站阀厅避雷器停电例行试验研究
一种基于光纤数据传输的多板卡软件程序烧写技术