郑培文
(广东电科院能源技术有限责任公司,广东 广州 510080)
随着电网规模的增大以及电网自动化水平的提升,电力调度自动化系统采集的信息量向海量化方向发展,给调度员的监控工作带来更大的压力。在台风等恶劣天气下,厂站上送信息成倍增加,导致调度监控人员对电网信息的监控难度大幅提高[1]。
在调度主站现有的告警方式下,告警信息虽有分级,但大电网众多设备产生的一级告警在突发事件时的并发数量非常大,且同时间不同信息容易相互交叉排序,直接影响了调度对告警事件的判断速度及精准度。当电网面临恶劣天气例如强台风时,告警信息流转非常快,告警流水信息将直接溢出事件窗口,调度员不得不调阅历史事项进行被动监控,严重影响了电网事故分析处理的速度。由此可见,旧有的告警功能已经难以适应高效监控的需求,需对海量告警信息进行更加快速、深入、智能筛选、分析、处理和总结,进而提高对电网整体运行状态的感知能力和对故障或异常的处理速度。
在此背景下,智能告警技术应运而生[2-4]。调度主站智能告警模块对海量监控告警信息进行甄别和处理,通过原始告警信号的隐藏关联性分析判断电网故障或异常,形成简洁明了的智能告警信息,将重要信息从海量告警信息中提取出来,为设备运维人员提供高效、直观的告警信息和辅助决策依据,提高了电网事故分析的准确度,加快了电网事故判断处理的速度,为检修复电节约了宝贵时间。
调度主站智能告警采用基于专家知识库(规则库)的逻辑推理方式进行故障的综合研判。智能告警逻辑推理的UML 模型如图1所示。
按逻辑推理元素数量的不同,逻辑推理分为单一推理、关联推理两类。其中,单一推理可以用于突出展示某类重要 的告警信号,将重要的告警信号从告警信息流中剥离出来,并可以结合运行经验在推理结果中加入告警产生的原因及辅助决策,为调度运行人员分析处理提供参考。关联推理可以将具有关联关系的多个信息合并成一个综合的告警信息,用于直观展示电网故障或异常。
图1 智能告警逻辑推理UML 图
单一推理规则的简要表达式如下:
式(1)中:X1为1 个逻辑推理元素,可以是原始告警信息、远动量测信息等;R为逻辑推理结果。
关联推理规则的简要表达式如下:
式(2)中:f(x)为逻辑关系,可以包含与(&&)、或(|)、非(!)等逻辑关系,也可以包含大于(>)、小于(<)、等于(=)等比较关系;X1,…,Xn为n个逻辑推理元素。
示例1 推理规则表达式:
规则名称:10 kV 线路事故跳闸,无重合闸信息。
逻辑推理元素:X1表示10 kV 零序保护动作;X2表示开关分位;X3表示重合闸动作。
逻辑推理结果:日期××时间××,××站10 kV××线事故跳闸,无重合闸信息。线路发生接地故障,请通知维护人员进行检查。
广东电网已经在省、地两级调度主站部署了智能告警功能[5-7],涉及南瑞科技D5000、南瑞继保PCS9000、东方电子E8000 三类不同的调度主站平台。在南方电网一体化电网运行智能系统(OS2)[8-9]中,智能告警属于电网运行控制系统(OCS)的一个功能模块,如图2所示。智能告警模块获取主站平台提供的模型、数据、告警信息作为逻辑推理元素,经过推理分析后给出综合信息,调用告警窗、图形浏览等模块展示推理结果。
图2 智能告警模块的运行环境
推理规则库的完整性是影响智能告警功能实用化的关键因素。广东电网结合运行经验,提炼了智能告警推理规则库,规则库中包含百余条规则,规则内容涵盖线路事故跳闸、主变事故跳闸、母线事故跳闸、安自装置动作等电网故障或异常情况,实现了由针对单个信号的告警向针对具体事件的告警的转变。
广东电网自2017年起针对智能告警已实用化运行的地级调度主站开展了长期的运行分析,通过比对调度日志,判断智能告警推理的结果的正确性,进一步分析未正确告警的原因。
未正确告警主要包括漏告警、误告警、告警结果异常三种情形。其中,漏告警表示应该给出推理结果但实际没有给出推理结果;误告警表示应该不会给出推理结果但实际给出了推理结果;告警结果异常表示给出了推理结果但推理结果的内容不正确。
运行分析表明,未正确告警的常见原因如下。
由于厂站端推送的原始告警信息不完整,缺少了告警推理分析需要的重要元素,导致智能告警不能给出推理结果,或给出不正确的推理结果。
某地区电网调度主站智能告警模块配置的“10 kV 线路事故跳闸,重合成功”推理规则表达式如示例2 所示。
示例2 推理规则表达式:
规则名称:10 kV 线路事故跳闸,重合成功。
逻辑推理元素:X1表示10 kV 线路保护动作;X2表示开关分位;X3表示重合闸动作;X4表示开关合位。
逻辑推理结果:日期××时间××,××站10 kV××线事故跳闸,重合成功。线路发生故障,请通知维护人员检查。
原始告警信息:2018-09-16T14:04:15,××站10 kV××线703 开关断开。2018-09-16T14:04:16,××站10 kV××线703 开关重合闸动作为动作。2018-09-16T14:04:16,××站10 kV××线703 开关闭合。
由于调度主站未收到线路保护动作告警信息,智能告警规则匹配失败,不能给出推理结果,导致漏告警。
考虑到程序运行稳定性,智能告警规则匹配时采用时间窗机制。从接收到符合某条推理规则的逻辑推理元素开始,启动时间窗,计时结束后,结束规则匹配,给出推理结果,释放软硬件资源。
如果厂站端推送给调度主站的告警信号存在延时,逻辑推理元素的时间差超出了推理时间窗,则超出时间窗的告警信息将不能正确纳入规则匹配过程,导致智能告警不能给出推理结果,或给出不正确的推理结果。
某地区电网调度主站智能告警模块配置的“110 kV 线路事故跳闸,重合成功”、“110 kV 线路事故跳闸,无重合闸信息”推理规则表达式分别如示例3、示例4 所示,智能告警时间窗配置为10 s。
示例3 推理规则表达式:
规则名称:110 kV 线路事故跳闸,重合成功。
逻辑推理元素:X1表示110 kV 线路保护动作;X2表示开关分位;X3表示重合闸动作;X4表示开关合位。
逻辑推理结果:日期××时间××,××站110 kV××线事故跳闸,重合成功。线路发生故障,请通知维护人员检查。
示例4 推理规则表达式:
规则名称:110 kV 线路事故跳闸,无重合闸信息。
逻辑推理元素:X1表示110 kV 线路保护动作;X2表示开关分位;X3表示重合闸动作。
逻辑推理结果:日期××时间××,××站110 kV××线事故跳闸,无重合闸信息。线路发生故障,请通知维护人员检查。
原始告警信息:2018-05-29T22:48:15,××站110 kV××线零序方向过流I 段动作为动作。2018-05-29T22:48:15,××站110 kV××线1296 断路器断开。2018-05-29T22:48:39,××站110 kV××线重合闸动作为动作。2018-05-29T22:48:39,××站110 kV××线1296 断路器闭合。
由于2018-05-29T22:48:15 的开关断开信号与其后的重合闸动作、开关闭合信号之间的时间差超出智能告警时间窗(10 s),重合闸动作、开关闭合信号没有纳入规则匹配过程,智能告警判断“110 kV 线路事故跳闸,无重合闸信息”。规则(如示例4 所示)匹配成功,给出的推理结果是:2018- 05-29T22:48:15,××站110 kV××线事故跳闸,无重合闸信息。线路发生故障,请通知维护人员检查。与线路事故跳闸后的重合闸实际情况不符。
厂站在调试、定检时,会向主站上发送无规律的告警信号,这些信号不能反映设备的实际运行状态。正常情况下,当调度员在主站挂上调试/检修标识牌后,智能告警模块可以过滤调试/检修设备的告警信号。
实际运行过程中,调度员如果没有及时挂牌或漏挂标识牌,调试/检修信号将会参与智能告警逻辑推理,产生不正确的推理结果,干扰调度员判断电网实际运行状态。
准确的原始告警信息、完善的推理模型、稳定运行的规则匹配程序是影响智能告警推理结果正确性三个重要因素。 告警信号分类不正确、告警推理规则配置不正确将直接导致智能告警检索不到正确的匹配对象,无法推理出正确的结果。由于此类原因引起的不正确告警问题相对容易排查,问题整改过后一般不会重现。
长期运行经验表明,调度自动化主站智能告警的实用化程度取决于原始告警信息的准确性和推理规则库的完备性,调度机构通过智能告警的运行分析和未正确告警问题的闭环整改,发现并处理原始信号和模型存在的问题,在提升智能告警正确率的同时,也提升了原始信号和模型的质量。
推理规则库是智能告警功能的核心,推理规则的制定对专家经验的依赖度较高。随着运行经验的积累,推理规则将不断得到完善,智能告警推理结果将更加丰富且准确,调度运行人员的监控压力将进一步减小。