动车组管理信息系统监控平台研究

2014-08-01 14:56曹伟涛
铁路计算机应用 2014年10期
关键词:动车组组件报警

李 樊,曹伟涛

(中国铁道科学研究院 电子计算技术研究所,北京 100081)

动车组管理信息系统监控平台研究

李 樊,曹伟涛

(中国铁道科学研究院 电子计算技术研究所,北京 100081)

随着动车组管理信息系统的广泛应用,系统运维的工作难度明显增加,如何有效地利用运维工具提升工作效率成为首要问题。在此基础上本文提出并设计研发出动车组管理信息系统监控平台,通过监控组件对信息系统软硬件运行状态的后台自动监控,实现了重点监控对象的报警提醒和综合展示,动车组管理信息系统软硬件台账及现场信息的统一管理,并有效的提升了动车组管理信息系统的运维工作效率。

动车组管理信息系统;监控平台;监控组件

随着动车组管理信息系统的深入运用,各级用户在工作生产中对系统的依赖性不断提高,这些都对系统的可靠性提出了更高的要求。为了进一步提升动车组管理信息系统的售后服务质量,不断提高售后服务的及时性、准确性和有效性,系统的维护服务人员需要在发现问题后的第一时间对问题进行处理,降低系统故障给用户带来的不便,提升系统用户满意度。

目前动车组管理信息系统相关的硬件设备、服务器数量大且部署分散,信息系统的网络传输及信息上报也直接影响到系统的可用性。定时定点查看系统软硬件情况的维护方式覆盖面不够,时效性不强,不能及时发现系统软硬件运行存在的故障和隐患且费力费时,这都导致了目前动车组管理信息系统维护工作量大、工作效率不高。因此,设计并研发出一套稳定、可靠、高效的信息系统监控平台,是提升动车组管理信息系统售后服务质量的前提。

1 动车组管理信息系统监控平台分析

1.1 监控平台需求分析

为减少动车组管理信息系统维护工作中的重复劳动,降低错误率,在不增加维护人员数量的前提下提高工作效率,通过对动车组管理信息系统的维护情况进行梳理、归纳及总结,将影响信息系统正常运行的软硬件运行状态指标定为监控对象,通过监控平台实现对这些监控对象的自动监控及报警。

动车组管理信息系统监控平台的总体需求包括:

(1)实现对信息系统软硬件运行状态的后台自动监控

动车组管理信息系统服务器的正常运行是系统运行的硬件保障,信息系统各类数据信息的加载与同步是系统运行的软件保障,信息系统各使用单位至中国铁路总公司服务器的网络联通是系统运行的网络保障,动车组调报信息的上报是系统运行的数据保障。所以动车组管理信息系统监控平台要实现对服务器运行状态、信息系统运行状态、网络联通状态、数据库备份及调报信息上报的后台自动监控。

(2)实现对重点监控对象的综合展示

动车组管理信息系统监控平台的运用应改变系统维护人员原有的定时定点查看系统运行状态、网络联通状态及信息上报状态的工作方式,用图形化界面展示被监控对象的运行情况,发生报警时,以声像提醒的方式通知维护人员解决。

(3)实现报警信息的闭环处理

当报警发生时,系统维护人员需对报警信息进行处理,对于报警的处理过程系统需进行跟踪及存储,确保报警信息得到解决。报警处理信息能够按报警类型、报警地等条件进行查询与统计,为值班员的工作考核提供依据。

(4)实现监控地点及报警阀值的配置

由于各使用单位信息系统服务器类型及数量各异,调报信息上报要求也各不相同,监控平台应满足对监控对象及监控报警阀值的自由配置。

1.2 监控平台业务分析

1.2.1 后台监控业务分析

对动车组管理信息系统的后台监控可以分为硬件类监控和软件类监控,硬件类监控主要实现对信息系统的服务器及网络设备运行状态的监控,这些设备运行正常是动车组管理信息系统运行的基础;软件监控主要实现对信息系统传输状态、系统运行状态、数据库状态及调报信息上报的监控,这些状态的正常是动车组管理信息系统运行的保障。

信息系统的服务器及网络设备有数百台且分散在铁路总公司及全路各个动车(车辆)段及运用所,对这些设备运行状态的监控十分重要,经过对近几年的系统维护记录进行整理后发现目前影响动车组管理信息系统最多的硬件因素包括服务器CPU的占用率、内存的占用率、硬盘的占用率、服务器上IIS的运行情况及网络联通状况。

动车组管理信息系统各使用单位每天进行接送车、数据上报、故障同步等操作时都需要大量数据传输到铁路总公司,如果数据库、数据传输、文件装载等出现问题就会直接影响到这些模块的正常运行。所以,实现对MQ传输状态、履历同步状态、数据库运行状态、文件装载情况及接送车状态的监控也非常重要。

车组状态、开行信息、检修实绩、高级修日报,这些信息是铁路总公司车辆调度编制交接班日报的基础,直接关系到动车组每日走行公里的累计及检修信息的记录,这些信息的上报是动车组管理信息系统使用的重中之重,也是系统维护工作最重要的环节。所以动车组管理信息系统监控平台也要实现对调报信息的监控。

综上所述,后台监控需涵盖的重要监控指标有16个,如表1所示。

表1 动车组管理信息系统监控平台监控需求

1.2.2 报警管理业务分析

当后台监控的各项监控指标发生报警后首先对报警信息进行判断,如果已经发生过相同的报警且该报警还未处理完毕则不进行重复报警。否则,发出声像报警提醒。系统维护人员可以对报警信息进行查询及处理,对报警信息的处理操作及处理时间作为报警处理记录进行存储。对于不同类型的报警信息,可进行推荐解决方案配置,当发生该类报警时系统维护人员可直接查看到推荐解决方案或进行解决方案的快速查询。

2 动车组管理信息系统监控平台设计

2.1 总体架构

动车组管理信息系统为分布式应用,信息系统服务器分布于全路各地,所以需要通过开发监控组件来实现对服务器、数据库和信息系统运行状态等监控对象状态信息的采集。当监控对象的状态信息超过报警阀值后生成报警信息传输给监控平台服务器并在监控报警页面进行报警提醒,提醒维护人员及时进行处理。系统的总体架构图如图1所示。

图1 总体架构图

2.2 功能架构

动车组管理信息系统监控平台根据功能不同划分为后台监控、报警管理、台账管理、用户管理和综合展示5个模块,系统功能架构如图2所示。

图2 系统功能框架

后台监控模块通过安装在动车组管理信息系统服务器上的监控组件实现对信息系统服务器、数据库及系统运行状态信息的采集和报警预判,将运行状态信息或报警信息传输到监控平台服务器。报警管理模块实现报警提醒、报警处理和报警配置功能。台账管理模块实现对动车组管理信息系统的软硬件台账及现场信息的统一管理。用户管理模块负责对监控平台用户进行分级管理。综合展示模块对后台监控信息及各类台账信息进行展示。

3 监控平台关键技术研究

3.1 异构系统的硬件监控实现

硬件监控主要是监控动车组管理信息系统服务器CPU占用率、内存占用率、硬盘占用率、IIS进程状态及网络联通状态,通过开发硬件监控组件实现。由于信息系统服务器操作系统类型各异,硬件监控组件采用Java语言开发。

硬件监控组件根据服务器的操作系统类型和监控配置文件启动相应的监控线程,每个监控线程通过监控配置文件获取相应的监控周期、报警阀值及报警确认策略,当发生报警后将相关的报警信息及报警记录发送给监控平台服务器。

硬件监控组件实现监控的流程如图3所示。

图3 硬件监控组件监控流程图

3.2 多数据源的软件监控实现

软件监控主要是监控动车组管理信息系统传输状态、系统运行状态、数据库运行状态及调报信息上报状态,通过开发软件监控组件实现。软件监控的内容多数存储在Oracle数据库中,所以软件监控组件通过Oracle存储过程实现。部分监控项统计表如表2所示。

表2 软件监控项统计表

4 结束语

动车组管理信息系统监控平台的研发及应用显著提高了动车组管理信息系统的维护工作,减少了各类信息查询及信息录入的时间,在不增加维护人员的前提下提高了维护工作效率;实现了动车组管理信息系统软硬件的自动监控报警,有效地减少了维护工作量,降低了硬件故障对信息系统运行的影响;通过监控平台的使用还发现了信息系统中不易被察觉的缺陷,促进了信息系统的进一步完善和改进,提升了信息系统的稳定性。

[1] 铁道部运输局.动车组管理信息系统总体方案[R].北京:铁道部运输局,2009.

[2] 郑红强,王春露.基于B/S架构的智能交通信息系统监控平台的设计[J].电子设计工程,2010,18(4):44-47.

[3] 史天运.动车组管理信息系统及其关键技术[C].第七届中国智能交通年会论文集,北京:电子工业出版社,2012.

责任编辑 陈 蓉

Monitor Platform of China Electric Multiple Units Management Information System

LI Fan, CAO Weitao
( Institute of Computing Technologies, China Academy of Railway Sciences, Beijing 100081, China )

With the wide application of China Electric Multiple Units Management Information System (EMUs-MIS), the degree of difficulty for system maintenance was significantly increased, how to boost productivity of the maintenance work with maintenance tool became a most important thing. This paper designed Monitor Platform of EMUs-MIS, implemented automatic monitoring for the operating state of EMUs-MIS’s hardware and software, alarmed and displayed the key monitored object, implemented the unified management for standing book of EMUs-MIS’s hardware and software as well as site information, which promoted the maintenance work eff i ciency of EMUs-MIS.

Electric Multiple Units(EMUs); Monitor Platform; monitor component

U279.2∶TP39

A

1005-8451(2014)10-0016-04

2014-04-16

李 樊,副研究员;曹伟涛,助理研究员。

猜你喜欢
动车组组件报警
无人机智能巡检在光伏电站组件诊断中的应用
新型碎边剪刀盘组件
“95后”动车组女司机的首个春运
“湖南造”首列CJ6动车组上线运营
U盾外壳组件注塑模具设计
动车组BTM带内干扰的排查与整治
LKD2-HS型列控中心驱采不一致报警处理
桥梁组件搭配分析
CRH3型动车组轮对压装曲线研究
2015款奔驰E180车安全气囊报警