基于图形和状态推理的计算机联锁运维智能诊断方法研究

2019-08-27 01:26徐德龙
铁道标准设计 2019年9期
关键词:演绎推理工控机道岔

徐德龙

(1.中国铁道科学研究院集团有限公司通信信号研究所,北京 100081; 2.国家铁路智能运输系统工程技术研究中心,北京 100081)

经过30多年的发展,我国车站计算机联锁系统在普速铁路和高速铁路都得到了广泛应用,现已进入成熟运用阶段[1]。截止到2017年底,全路已超过6 000个车站采用计算机联锁,占全路车站总数的70%[2-3]。计算机联锁为铁路信号的关键系统,是信号系统的核心,同时也是进路信息的源头,为相关信号系统输出基础信息,其可靠性、可维护性不言而喻。随着大数据、人工智能、物联网等技术的应用,在铁路电务维护和保障体系中,实现故障原因的智能分析、故障定位等新功能被提上日程,进一步提升计算机联锁电务维修机的能力形成了广泛共识。本文提出了计算机联锁运维智能诊断方面的典型显示方法,重点结合演绎推理和模糊推理进行了故障诊断定位技术的研究。

1 国内外发展现状研究

国内外各铁路信号控制系统都在朝着智能化运营维护方向发展,路内企业也开始研究维修诊断技术。

(1)国外信号设备的智能化方面

国外很多国家都很重视计算机联锁设备的智能运营维护。如英国 Westinghouse公司研制的SSI计算机联锁系统配置有技术人员终端,通过该设备对系统运行状态进行记录,并通过该终端实现远程诊断;庞巴迪公司的EBILOCK计算机联锁系统配置有维护诊断中心(MDC)设备,通过该设备收集、分析系统的性能、诊断信息和报警信息,并通过该设备实现远程监视;德国西门子公司的 SIMIS-W计算机联锁系统配置有服务与诊断计算机,通过该计算机记录系统状态信息、联锁出现的错误及故障信息。

(2)国内信号设备维护技术方面

我国全面推广的信号集中监测系统,信号集中监测通过连接相关信号系统和单元,获取信息并用于故障报警和分析,对于维护发挥了一定的作用。单个系统方面,ZPW-2000A轨道电路研制故障定位诊断系统,可对室内、室外设备的11段故障给出精确的故障诊断和定位[4]。相关学者对铁道信号安全计算机监测技术提出了数据降维和模型训练的方法[5]。

多年来,行业内都把重点都聚焦在影响系统安全功能的部分[6-7]。而在维护方面,基层维护人员遇到问题时不知道如何查询,更多是依靠专业人员分析,维修机可用性不高。因此,需要研究一种计算机联锁运维智能诊断方法,将现有的维修机升级为具有智能诊断能力的维修机。其技术路线和方法是:首先是全面记录联锁系统的大数据信息,建立信息数据库;其次是优化界面显示方法,便于识别;再次是基于图形和状态以及推理方法推断出故障位置或区域,实现故障定位智能化。

2 联锁系统信息大数据

大数据信息是故障诊断的重要基础。电力系统在开展故障诊断方面有很多的研究,文献[8]介绍了电力系统故障诊断的时序模糊逻辑推理方法,指出故障诊断的基础是警报信号的正确性和完整性。计算机联锁的智能故障诊断同样也需要完整、准确的大数据信息。

计算机联锁系统主要靠软件实现系统功能,运行的软件具有不可见性和不可触摸性[9-10]。维修机作为计算机联锁系统中重要的运维实现设备,首先要做到从值班员操作到现场设备动作、列车行驶以及联锁系统自身状态等全过程都要有据可查。因此,要将联锁的运行信息按类别细化并储存。如表1所示,将系统信息分操作、驱采、报警、状态、提示、系统6类信息,并将每类信息细化为来源、时间、类型、信息名称、内容、状态6个维度,以上信息形成联锁系统信息大数据库的关键信息,表1为大数据信息的内容、状态等基本要求。

3 推理技术在计算机联锁运维中的应用

在推理技术方面,国内学者对不确定性推理的原理、方法等已研究多年,为人工智能、专家系统的发展提供了理论基础[11]。文献[12]分析了对概率推理、D-S证据推理和模糊推理3种常用的不确定性推理方法,文献[13]阐述了演绎推理和模糊推理在潜艇攻击中的运用。本文对演绎推理和模糊推理两种理论基本原理研究的基础上,将计算机联锁智能诊断的需求结合推理技术进行应用研究。

3.1 演绎推理方法

所谓演绎推理(Deductive Reasoning),就是从多个被认为正确的前提出发,通过推导即“演绎”,得出具体陈述或个别结论的逻辑过程[12]。演绎推理是从一般(或普遍)到特殊的推理。如果用公式来表达演绎推理,可以表述为式(1)的形式。

大前提如果M,则P

小前提S是M

结论S是P

(1)

其中,大前提是已知的一般原理,小前提是事件,结论是根据一般原理对事件做出的判断。演绎推理的方法可以应用到计算机联锁运维中,将基本维修常识作为大前提,故障情况作为小前提,以此得出故障分析的结论。例如联锁机脱机的故障分析如式(2)所示。

大前提主机笼板卡故障,会脱机

小前提CAN通信板是主机笼的板卡

结论CAN通信板故障,会脱机

(2)

这个例子中的大前提、小前提皆为事实。推理形式也是严格无误的,因此,可以确定推理结论是正确可信的。在故障发生时,往往会有多条故障报警,如板卡故障、脱机等故障会同时发生,可以结合演绎推理的结论,推理出真正的故障点。

3.2 模糊推理方法

大系统发生故障时,故障现象往往比较复杂,且可能伴随着多处报警,此时一般都不具备演绎推理的条件,因此要采用不确定性推理技术进行模糊推理问题。其原理是借用经典演绎推理的基本框架,用模糊集方法来模拟人思维的推理过程[14]。如果用公式来表达模糊推理,可以表述为式(3)的形式。

大前提如果M,则P

小前提S是M′

结论S是P′

(3)

应用模糊推理时,M到P是一种模糊关系,根据模糊关系以及M与M′的相似程度,得出结论P′。在具体的模糊推理问题中,一般由专家经验或通过大量试验等办法来获取大前提。因此,将我国铁路积累的案例库和运用数据作为模糊推理的大前提是充分的,以式(4)的故障案例为例,说明模糊推理的应用。

大前提维修机与其他通信全断,为维修机网线故障

小前提操作机A、B与维修机1网通信中断

结论维修机至1网交换机的网线故障

(4)

这个例子中的大前提并非严格意义的准确,但从经验或概率角度,这确实是最可能的情况。当通信中断报警时,因为通道中有交换机等设备,且一般会致使多个逻辑通道中断发生,在短暂时间内不可能精确判断出故障位置。采用模糊推理的方法,能快速给出结论,替代专家的思维分析。

4 故障诊断实例研究

结合主流的计算机联锁系统实例,对设备硬件故障、通信故障、继电接口故障3种典型故障进行智能分析研究。

4.1 设备硬件图形显示及故障推理

设备硬件故障种类较多,如UPS、联锁机电源、联锁机采集驱动、联锁机CPU、联锁机机笼、联锁机通信板、视频分配/放大器、工控机主板、工控机以太网卡、交换机等。其中,电源故障、板卡方面故障比较典型。故障显示及定位首要的工作是显示机柜模型,显示方法有平面示意、三维显示等。本文采用三维模型的方式显示硬件设备,直观、多角度的显示故障位置,便于维修人员对照实物设备快速找到对应部件,从而实现硬件问题的快速维修处理[15]。本文设计机柜三维模型窗口,并在窗口内显示综合柜、联锁柜、扩展柜的三维模型,如图1所示。

4.1.1 显示方法

当机柜内的设备故障或状态异常时,以联锁系统信息大数据信息作为基础,在机柜图对应板卡位置显示红色。当设备整体机笼停机时,整体机笼显示红色方框。如联锁机停机,将对应联锁机机笼以红色方框显示;驱采机停机,将对应驱采机机笼以红色方框显示。如图1所示,电源故障报警发生时,机柜中的电源模块会显示为红色。为了便于维护人员识别备品,可对模块弹出,显示故障电源的三维视图。

4.1.2 推理应用

以上故障显示方法需要依据信息大数据和推理方法找出故障点,故障定位分析如下。

(1)基于演绎推理的精准故障定位方法

仍以式(2)的脱机故障为例。式(2)故障现象为联锁机Ⅱ系脱机,并且Ⅱ系CAN通信板报警,可以得出本次故障为Ⅱ系CAN通信板故障导致了Ⅱ系脱机。通过演绎推理的结论,确定故障点后,在机柜图上将故障部位用红色方框表示出来,便于维修人员进行故障处理。

(2)基于模糊推理的粗略故障定位方法

在很多硬件故障中,并不能准确地确定故障部位,如工控机重启故障,因系统组成设备多,故障情况也相对复杂。因此,归类汇总非常重要。首先需要对工控机故障点进行梳理,找出故障点的突出问题;再结合常见的故障现象,在经验库中将各种工控机故障进行归类,确定优先排查范围。如表2所示,根据行业内关于计算机联锁运用情况的数据,工控机的故障点为工控机整机、主板、以太网卡、声卡、硬盘/电子盘、电源、显卡,其中主板和电源故障率突出。

表2 计算机联锁系统工控机故障器材统计(2008年~2017年)

表2的数据可以作为工控机方面故障推理的基础数据,根据故障率高低设定优先排查范围,将故障率高的故障点作为推理的大前提。通过模糊推理,如式(5)所示,工控机重启最大可能的故障范围就是主板和电源问题,发生监控A机多次黑屏、重启问题,将在机柜图上推出的故障部位用黄色方框表示出来。

大前提工控机重启了,为主板或电源问题

小前提监控A机多次黑屏、重启

结论监控A机主板或电源有问题

(5)

4.2 通信图形显示和推理

本文采用网络状态图来实时显示联锁系统的通信状况,状态图中包括通信设备、通信线路的状态,如图2所示。为了便于维护人员与现场设备一一对应,通信线路显示的内容为通信线路的实际连接,即为物理通道。其中,绿色线条表示该物理通道的所有逻辑连接均通信正常,黄色线条表示该物理通道的逻辑连接有部分通信正常、部分通信中断,红色线条表示该物理通道的所有逻辑连接均通信中断[16]。设备状态包括主控、备用、非主控非备用、离线4种状态。其中,绿色为主控状态,黄色为备用状态,白色为运行但非主控非备用状态,红色为离线状态。

图2 通信图形显示示意

若网络图物理连接线为红色或黄色时,需排查相连接的设备是否运行,以及连接线通道的各逻辑连接是否正常。逻辑连接状态的排查是一个难点,可通过以下技术方案解决。①当鼠标移动至对应物理连接线附近时,通过ToolTip文字提示显示物理通道的所有逻辑通道连接状态。②通过点击按钮,以弹出的对话框的方式显示设备所有的逻辑通道连接状态。以上为人工判断故障点的方式。

采用自动判断方式,因通信状态相对复杂,很难准确推断出故障点,更适合采用模糊推理法确定故障部位,然后在网络图上将推理后的结论用黄色方框表示出来。以分析维修机与操作机I网通信中断的故障为例,根据经验库的大前提,得出结论。

如式(4)所示,操作机A、B与维修机I网通信中断,根据大前提,推断为维修机网线故障,结合小前提的故障现象,进一步推理和缩小故障范围,得出维修机至I网交换机的网线故障为最大可能的故障点。

4.3 继电接口状态显示和推理

4.3.1 继电接口信息状态显示方法

继电接口故障也是运维过程中发生频次比较高的故障,同时也是分析难度比较大的故障。针对道岔、信号机、区段的相关继电器的输入、输出,采用如图3所示的状态方波图的形式,选取关注的信息,生成信息状态时序图,定时显示输入和输出信息的吸起、落下状态。其中,选取信息方式有2种,一是根据选择的设备(道岔、信号机、区段)名称,自动关联该设备相关的所有采集、驱动继电器;二是不针对具体信号设备时,可从采集板、驱动板中选择相应的采集、驱动信息。以202号道岔为例,经复选操作后,自动选择202号道岔所有继电器,形成道岔动作的时序图,纵坐标包括DCJ、FCJ、SFJ、DBJ、FBJ、DFH信息,横坐标包括定位状态、反位操纵道岔、道岔转动开始、转动过程中、返回反位表示、停止输出6个时间点的状态,直观地显示相关信息的动作过程。

图3 继电接口故障显示示意

在时序图中,时序线状态数值为0时,代表当前继电器为落下状态,状态数值为1时,代表当前继电器为吸起状态。

4.3.2 状态推理

演绎推理的应用。以道岔在定位时混入反位表示致使联锁无表示为例。发生道岔无表示故障,可能原因是列车通过道岔时挤岔、电路故障,或采集信息混线。在式(6)中,道岔失去表示前在定位,因混入反位状态表示,DBJ、FBJ全为“1”,联锁系统依据故障安全原则,将道岔位置状态表示逻辑状态置为“0”,控制台道岔显示无表示[17]。对于此种采集故障,人工分析需要对联锁软件有一定的了解,但若维修机能直接显示出故障点,则能减少劳动强度。以7号道岔无表示为例,分析推理应用。

(6)

通过以上推理,维修机可将联锁软件的处理方式作为大前提,按照式(3)的原理推理后,确定出7号道岔系因混入反位表示导致故障,在状态方波图显示的分析结果,将帮助维护人员快速找到故障点。

模糊推理的应用。以道岔向反位操纵,FCJ和SFJ能驱动,但仍为定位表示为例。首先确定该情况的大前提。正常情况下,操纵道岔后,道岔位置状态表示应当相应的发生变化,由定位状态表示变为反位状态表示,道岔的定位状态表示(DBJ)表示状态值应由“1”变为“0”,或者由反位状态表示变为定位状态表示[17];如果超出一定的时间后,道岔位置状态表示仍未发生变动,则说明道岔出现故障。第一种情况是道岔此时无法操到位而实际处于对应侧表示回不来的四开状态,室内为假表示;第二种情况是因电路故障而造成的无法输出或动作的情况。在现场使用中,道岔原表示不动的原因显然是第二种情况居多。在式(7)中,35号道岔不能搬到反位,道岔定位表示不断,FCJ和SFJ已经驱动。通过推理确定35号道岔不能转换的可能原因是继电器故障,因此,在状态方波图中将对应信息以方框显示。

(7)

5 结论

(1)首次提出维修机记录信息的格式、内容,建议形成联锁系统信息大数据,作为维修机智能化的基础数据。

(2)改进维修机的典型界面,提出了硬件、通信、继电接口的显示方法。包括基于三维模型的硬件显示、基于物理通道的通信状态显示、基于状态图的接电接口显示。

(3)首次将演绎推理和模糊推理运用至计算机联锁智能运维技术中,并结合3个典型故障进行推理运用。

(4)提出了提高维修效率的技术方法,为技术开发提供了技术支撑,工程化后将进一步提高系统的可维护性。

猜你喜欢
演绎推理工控机道岔
定制工控机在老旧线路计算机联锁设备中的应用
中低速磁浮道岔与轮轨道岔的差异
法律推理之演绎推理的研究概述
朔黄铁路30t重载道岔应用及强化措施
工电道岔结合部联合管理机制的探讨
场间衔接道岔的应用探讨
基于双工控机模式的混合车道系统设备控制的设计与实现
合情推理与演绎推理
合情推理与演绎推理
印刷网络化解决方案中工控机系统的设计与实现