方 薇
轨道交通是一个立体、复杂的系统工程,其通信系统如同人体的神经将各个设备联系在一起协同工作,在整个轨道交通系统中具有不可替代的作用。通信系统的故障报警与分析是系统稳定运行的重要保障,目前大部分机房采取了定时巡查环境设备和24h值班机制等措施,但这些措施不能从根本上解决设备故障问题。为此,提出通信设备的故障告警系统方案,讨论其主要功能实现方式,以达到统一监控轨道交通通信网状态变化,和实现故障统一告警的管理目标。
轨道交通通信系统的构成十分复杂,包括轨道通信主干传输网 (传输系统)、程控交换电话系统、广播系统、闭路电视监控系统、时钟系统、无线通信系统等。其中传输系统是轨道交通通信系统的核心。如图1所示。
图1 轨道交通通信系统
1.传输系统,目前广泛使用的主干传输网有SDH、ATM、OTN等。通过传输系统可实现列车语音、图像、数据等各类型信息的传输与资源共享,为各种应用提供传输通道。传输系统分为传输和接入二层。传输层提供数据通道,保证各应用业务安全稳定地在节点之间传输;而接入层负责实现应用业务接入和汇聚功能,并将汇聚后的应用业务提交给传输节点。
2.程控电话交换系统,可细分为公务电话系统与专用电话系统。公务电话系统根据轨道交通的规模具有不同的容量。一般设置1—2个交换局,程控交换机置于控制中心,各车站通过远端模块实现接入。专用电话系统由枢纽主系统和车站分系统二级结构组成。
3.广播系统,可分为控制中心、车站及停车场等广播系统。通常广播业务为中心到车站的点到多点业务,而中心对车站系统的监控维护通道则为点对点业务。
4.闭路电视监控系统,作为一种图像通信,具有直观、实时的动态图像监视、记录和跟踪控制等功能,是通信指挥系统的重要组成部分,具有独特的指挥和管理效能,成为轨道交通设备自动化调度和管理的必备设施。
5.时钟系统,主要由控制中心设备包括GPS/CCTV信号接收单元、主备一级母钟系统、监控系统、车站 (车辆段)主备二级母钟、子钟和传输通道等构成。
6.无线通信系统,为行车调度员与司机、车站值班员与司机、司机与司机以及公安、环控、维修等用户提供移动通信手段。
1.减少管理的综合成本。在网络的日常运营中,能实现集中故障告警分类和分级管理,减少网管系统的操作复杂性,降低网管维护人员的技术要求。实行故障告警集中管理,大幅度地降低日常维护操作的工作量。集中网管采用标准化操作界面,也减少维护人员面对众多厂家管理界面的误操作可能。此外,采用了集中操作的网管终端,能够进一步减少各分系统本身网管配套设备的使用率,甚至有可能将其精简为网管的中介设备。因此,故障告警集中管理有助于网络资源的最佳利用,通过网络共享数据输出设备,减少网管中心的配置种类和配套设备,这样将有望减少初期设备投资,有效降低日常运营成本。
2.提高维护效率和水平。按照设备的实际特点,形成切合实际的人机管理接口界面,提供人性化、一体化的操作和维护方式。其软件以自动化的运行操作和流程为指导,减少平均故障维修时间,加速用户询问响应,有效地促进网络能力的利用率。集中管理数据库,对于提高管理效率和质量也是至关重要的。集中管理故障告警能够有效地收集和整理整个通信网的运行状况,生成统一的性能报表,有利于掌握系统综合性能的长期变化及趋势,进一步提高维护的总体水平。
1.维护管理终端,应能显示全线各车站、车辆段、停车场和控制中心通信设备的组成图。
2.维护管理终端,应能根据子系统设备监控模块所发出的监控信息,实现故障定位。在查询状况或告警状况下,通信各子系统设备的工作状态及故障信息必须达到电路板级。
3.通信系统出现故障后,应控制切换主备用设备,故障排除后网络配置能自动恢复。
4.设备发生故障时,应能发出可见、可闻的告警信号,同时应启动相应故障的应对程序向导模块,以帮助集中网管人员实施系统维护。
5.维护管理终端应能自动纪录网络故障设备的有关信息、定期自动或人工生成管理报表,能按照要求周期性地进行自动分析,对于设备性能发生的变化,根据设定的条件提出预警报告。
轨道交通通信设备故障分析系统,结合目前轨道运营单位的发展和业务需要,考虑未来业务功能的扩展,尝试建立一个完整的系统体系,面向全局及应用业务的管理。其基本要求是要稳定、正常地运行,并在此基础上能够实现较高的功能扩展。
系统主要由数据采集模块、数据存储模块、故障分析模块及监视模块组成。如图2所示。
1.数据采集模块,负责从轨道通信系统中收集各子系统的状态及告警信息,将数据格式统一化并存入数据存储模块。如图3所示,数据采集模块在传输系统、电话系统、广播系统、闭路电视监控系统、时钟系统以及无线通信系统中都有相应的数据接口,通过这些数据接口及时地采集各个通信子系统的状态信息。由于各通信子系统的多样性,所采集的数据格式并不统一,因此需要将各个状态信息的数据格式进行转换,以统一的格式存入数据存储模块。
图2 轨道交通通信设备故障分析系统功能模块图
图3 数据采集模块
2.数据存储模块,用于接收并存储数据采集模块所收集到的各通信子系统的数据。数据存储模块具有稳定性、易存储性、安全性等特点,定期的将所存储的数据进行整理优化,并将已经过期的不再具有分析价值的数据进行删除。另外,出于对系统稳定性的要求,数据模块会对所存储的数据进行备份,以防数据丢失。而针对数据的安全性,将所采集数据的存储,划定了不同的权限,通常情况下这些数据并不具备修改权限,最大限度地保证通信子系统所采集数据的准确性、有效性和可靠性。
3.故障分析模块,作为本系统的核心模块,负责读取数据存储模块中各通信子系统的状态信息,分析这些状态数据,得出目前各通信子系统的运行状态,不仅能够及时的进行故障告警,还可以对潜在的系统故障进行趋势预判。数据采集模块采集的状态信息数据,可以是各通信子系统自身的故障告警信息,也可以是系统运行的状态信息。由于通信子系统的运作模式和结构框架各不相同,因此需要对各子系统编写各自的分析算法。为了高效、统一的实现故障分析功能,故障分析模块集成了通信系统状态信息分析的基本模型,可以针对各子系统自身特性在原有基本模型上进行算法继承与扩展。
4.监视模块,是故障分析系统与用户管理员的交互模块,为用户管理员对本系统的配置、管理、监控提供接口。监视模块将数据存储模块中存储的各子系统状态信息数据呈现给用户管理员,并及时显示故障分析模块对各状态信息数据的分析结果。管理员通过拓扑图、告警列表、子系统列表等多种方式查看系统运行情况。还可以通过实时查询和历史查询来详细显示系统告警信息。
通过多数据采集模块的功能扩展,还可以对各通信子系统的其他数据进行有效的查询,如子系统账户信息、配线架信息、文档信息等。用户管理员还可以通过交接班管理功能实现对人员工作状况的管理,如交接班排计划、交接班日志、日志查询等。系统管理员还可以对本系统用户进行增加、删除、修改、查询等操作,为不同的系统用户赋予不同的操作权限。
数据库表结构依据Third Normal Form(3NF)设计,3NF规定:表内每列必须是最小的原子单元,即不能再分;表内每列必须和主键相关,不相关的列放入别的表中,一个表只描述一件事情;表内各列必须和主键直接相关,不能间接相关。故障分析系统的数据结构设计包括站点、子系统、板卡、故障告警灯等多个数据表。
从数据存储模块中取出各通信子系统的状态信息数据,通过各自模型分析故障并产生告警,并将告警信息存回数据存储模块中,成为历史告警信息,便于以后的查询与综合分析。告警信息可以分为多个字段,包括故障发生时间、故障所述通信子系统、故障所在位置、故障级别、故障描述、故障修复时间等信息。
故障相关性分析模型需要建立整个通信网络的拓扑信息,当网络发生变化后,故障监测的功能不间断。具体包括网元层和网络连接层,网元层描述网络设备的类型,是物理网元的一个抽象描述。网元面向每个具体应用,不同的通信子系统其网元类型也不相同,包括子网、局站、机框、机槽、机盘、端口等。网络连接层描述的是网元之间的连接关系,包括光复用段和传输段。当故障相关告警已知后,告警分析提供网管人员定位具体发生的故障和故障地点。如果只有部分规则已知或者出现未知规则,网管人员要依据全部的有用信息,找出与故障最匹配的告警模式。
系统应用阶段,将已经完成的系统接入实际的轨道交通通信设备中,进行相应的调试和完善,以达到最佳的运行状态。实施过程中,需要对硬件系统、软件系统进行安装与配置,根据环境合理部署,使用不同的硬件设备、配置不同的软件参数,来保证系统稳定性和运行效率,见表1—表4。
表1 服务器硬件系统配置
表2 客户端硬件系统要求
表3 服务器软件系统配置要求
表4 客户端软件系统环境配置要求
依据系统配置对系统进行初始化设置,配置数据的准备、整理、测试、完善、确认等是影响系统能否稳定运行的重要因素。根据目标站点的实际运营情况,包括网络拓扑结构、站点信息、主板信息、工作用户、组织结构、告警要求等,整理成调研文档。根据调研结果,参阅文档,形成标准化的配置文档,文档中包括全部系统相关项、建议值、非功能要求等。为保证配置的正确性,需要复查审议,经专家组审核通过确认后,再进行具体的配置实施操作。
根据最终确认的配置信息对系统以及设备进行参数配置。运行系统,对各个模块进行逐一测试,根据测试结果与用户需求进行比较,提出相应的改进意见,对系统进行功能调试,最终达到最佳运行状态。
目前轨道交通通信设备故障分析系统已经上线运行,系统运行平稳,有效增加了故障处理效率,提高了地铁设备告警以及处理的自动化水平,可加快告警故障处理速度,改善轨道交通设备的运行质量,有力地保障了地铁的正常运营。虽然轨道交通通信设备故障分析系统的设计和实现达到了预期目标,但是仍有发展空间,未来研究将采用机器学习等方法来优化告警相关性分析方面的功能,增强用户体验。
[1] 陈棉,刘晓玫,沈春迎.多媒体电子地图的信息传递[J].长江大学学报自然科学版:医学卷,2003(3):23-26.
[2] 程国达.嵌入式系统的硬/软件协同设计研究[D].复旦大学,2003.
[3] 华亮,杨世锡.基于uC/OS-Ⅱ的嵌入式系统应用平台的构建[J].计算机工程,2004,30(15):184-186.
[4] 姜宏伟.防盗监控--让通信基站具有自卫能力[J].通信电源技术,2007,24(4):75-78.
[5] 姜换新.ARM嵌入式系统C语言编程[J].计算机应用与软件,2003,10(20):15-19.
[6] 李斌,陈建辉,邱鹏.基于嵌入式系统的行驶信息记录报警系统[J].仪表技术与传感器,2006(8):50-52.
[7] 刘昶,涂菶生.基于遗传算法的随机排队系统参数优化[J].1994中国控制与决策学术年会论文集,1994.
[8] 樊铁钢.三种排队方式的比较[J].系统工程,1993,3:12.
[9] 王庆华,郝伟.地理信息系统的发展趋势[J].资源开发与市场,2005,21(1):28-30.
[10] 吴卓娟,孙涛,屈杰.基于故障录波数据的变电站故障分析系统[J].电力科学与工程,2010,26(5):22-25.
[11] 王成,王富章.轨道交通通信传输系统技术发展及设备选择[J].铁道通信信号,2007,43(9):54-56.
[12] 张向涛,朱红.基于 GSM和 ARM的远程监控系统[J].电子技术 (上海),2006,33(9):57-59.
[13] 张骥,叶桦.基站机房集中监控系统及其可靠性设计[J].东南大学学报:自然科学版,2006(S1).
[14] 吴新平,董德存.城市轨道交通信息集中监控系统的设计与实现[J].城市轨道交通研究,2006,8(4):47-49.
[15] 王茜.移动基站动力及环境设备集中监控系统的设计[J].计算机应用,2002,22(3):56-57.