超偏载检测装置设备状态更新故障分析

2011-06-21 07:21谈晓晓上海铁路局科研所
上海铁道增刊 2011年3期
关键词:计算机设备车站服务器

谈晓晓 上海铁路局科研所

超偏载检测装置,是一种自动地对行进中的列车实行不停车、不摘钩连续动态称重的货运安全设备。自2004 年10 月,铁道部将路内超偏载试联网到现在,设备运行状态日趋稳定,用科技手段确保运输安全的作用越来越显著。超偏载已成为铁道部提速安全保障体系统中的重要组成部分。

1 超偏载设备状态更新的原理及意义

1.1 超偏载设备的组成

简单地说,各测点的超偏载设备均由前端秤台(含传感器等)、数据采集通道、车号设备、计算机设备、车站服务器(或称集中器)、网络设备等组成。

(1)秤台:通过传感器,取得过衡列车的载荷信息;

(2)数据采集通道:接受秤台上采集到的载荷信息,并进行AD 模数转换,然后传送到计算机设备;

(3)车号设备:自动识别并存储过衡列车的车次和车辆车号,并将车号信息传送给计算机设备;

(4)计算机设备:处理好载荷信息,并且和车号设备提供的车号信息合并,形成完整过衡报文,然后上传至车站服务器,同时对于windows 系统的设备还要定时产生设备状态文件,同样上传至车站服务器;

(5)车站服务器:收集并汇总车站中各测点计算机设备传来的文件,并上传至上海局超偏载服务器,对于DOS 系统的设备,服务器还负责监控和产生状态文件,并上传;

(6)网络设备:由专线猫、网桥、光纤、电话线(网线)等构成,负责信息的传送。

1.2 设备状态更新的原理

1.2.1 Windows 系统的超偏载

前端设备中,厂家的称重程序每隔10 min 生成一个扩展名为sms 的状态文件,它包含了此时设备的状态信息。经由铁科院电子信息所的后台程序,通过网络,将sms 文件依次上传至车站服务器和上海局监控网页所在的服务器,从而更新设备状态。

1.2.2 DOS 系统的超偏载

安装在车站服务器(或集中器)上的厂家监控程序,对前端的设备进行监控,并且每隔10 min 生成一个扩展名为sms的状态文件。经由铁科院电子信息所的后台程序,通过网络,将sms 文件上传至上海局监控网页所在的服务器,从而更新设备状态。

1.3 设备状态更新的意义

为了使超偏载设备保持正常运行,超偏载值班人员需要24 h 监控设备状态。通过《货运计量检测监控系统》网页(上海局监控网页:10.128.2.75/wmis),就可以实时查看设备的状态。

在正常情况下每间隔一段时间,超偏载设备会自动上传状态文件至上海局超偏载服务器,反映此时设备的工作状态。当设备发生某些故障,导致不能正常工作时,状态文件就无法上传。如此,过一段时间,在监控网页上就可以看到该设备长时间无状态更新(根据日常使用和维护的经验,我们一般认为超过1 h即可视为故障),以此,我们就能及时发现和判断出设备的故障。因而,使设备状态保持正常更新,对于超偏载的正常使用和维护有着至关重要的意义。

2 设备状态更新故障原因的排查及处理

从原理上看,显然设备状态的更新,只和前端计算机设备、车站服务器设备、相关软件以及网络状况有关,但其中任何一个部分故障都会导致状态无法上传、更新。

2.1 故障排查的总体思路

当设备长时间无状态文件上传时,说明上述步骤或环节至少一处发生了故障,我们可按图1 流程的总体思路,逐步排查原因,尝试恢复上传。

图1 流程图之一

我们需要通过使用RemoteAdmin 软件尝试远程访问,来对设备的状态进行检查。对于前端为DOS 系统的设备,由于无法对前端设备的检查,只需检查服务器状态即可。

2.2 故障排查和处理方法

2.2.1 前端设备的检查

根据图2 的流程,检查前端工控机是否开启;查看称重程序及铁科院上传程序是否开启。

图2 流程图之二

每台Windows 系统的前端设备都安装有RemoteAdmin 软件的被控端程序,我们只需知道相应的IP 和密码,就可以使用主控端程序通过网络进行远程访问和操作。(关于具体的IP 和密码,出于安全因素,在此不作介绍。)

当可以访问时,说明前端工控机和网络设备工作正常。此时须检查厂家的称重程序和铁科院程序,确保其正常开启工作。

当无法访问时,则说明前端设备死机、断电或网络故障。此时可利用远程重启电源检查供电状态或重启设备。网络故障见"2.2.4"。

各测点都安装有远程重启电源,我们通过拨打前端的电话,就可以使用远程重启电源。当远程重启电源未能正常地发出操作提示音时,我们可以判断为前端机房停电,此时可联系车站机房进行确认,并等待通电(远程重启电源本身故障的情况只在理论上存在,至今未有发生过)。当远程重启电源正常工作时,我们可以根据提示,利用它重启前端机。若通过以上操作均无法排除故障,则请进入下一步检查服务器。

2.2.2 服务器设备的检查

根据图3 的流程,检查服务器(或集中器)是否开启;查看设备厂家监控程序(仅对前端为DOS 系统)及铁科院上传程序是否开启。

利用和检查前端设备同样的方法,尝试登录服务器(或集中器)。

当可以访问时,检查厂家的监控程序(仅针对前端为DOS 系统的设备)和铁科院上传程序,确保其正常开启工作。

图3 流程图之三

当无法访问时,则说明服务器(或集中器)死机、断电或网络故障。此时可联系车站机房的值班人员协助,检查供电状态或重启设备。网络故障见"2.2.4"。

若以上操作均无法排除故障,则进入下一步,联系铁科院电子所或设备厂家查看并处理。

2.2.3 铁科院上传程序故障的处理

至此,可基本判断硬件设备和网络状态是正常的。若问题依旧存在,则说明是软件程序故障,可致电铁科院电子所或设备厂家,请求检查软件和程序,协助处理。

2.2.4 补充

若经过重启后,设备依然无法远程登录,则故障原因可能是(1)计算机设备或通讯设备损坏,无法正常使用;(2)信道出现故障。

这两种情况都需要进行现场抢修处理。

(1)对于计算机设备,要求能正常启动,并使软件进入正常工作状态。具体修理方式与普通计算机类似,在此不再赘述。对于通讯设备则要求能相互同步、握手。如无法正常工作应及时更换。

(2)若更换通讯设备后仍旧不能恢复,则多为信道故障,需联系铁通协同处理。

3 结束语

超偏载检测装置是铁路安全运输监控工作不可缺少的一部分,而设备的状态,最为直接地反映了其是否处于正常工作中,对设备的稳定使用,有着指导意义。因此,通过在实践工作中不断总结和摸索,整理出这套相对完善的、对于设备无状态更新这类故障的原因分析以及处理方法。相信能够以此提高设备的使用安全性和稳定性,保障铁路运输的安全、高效。

猜你喜欢
计算机设备车站服务器
通信控制服务器(CCS)维护终端的设计与实现
浅谈天津港第一港埠有限公司的计算机设备管理
车站一角
计算机设备维护管理规范化探究
在北京,一个车站的治理有多难
大中型企业计算机设备运维管理研究
中国服务器市场份额出炉
得形忘意的服务器标准
计算机网络安全服务器入侵与防御
热闹的车站