轨道交通中无线调度子系统的问题研究

2020-09-10 02:24李石凤
电子乐园·中旬刊 2020年8期

李石凤

南京地铁运营有限责任公司

摘要:无线调度子系统为地铁无线重要的用户系统,是行车的关键部件,主要由调度服务器和调度台组成。调度子系统向中心调度员提供功能强大的调度指挥功能,是地铁运营指挥的主要操作平台,经过二次开发后,调度子系统除能实现TETRA集群系统标准的调度功能外,还增加根据用户要求定制的功能。本文重点研究调度子系统的组成及使用过程中出现的疑难问题,为系统维保提供技术支持,为故障提供解决措施。

关键词:原装调度台;二次开发调度台;心跳包;TETRA无线通信系统

一、系统概述

调度子系统包含二次开发部分和无线原装部分,二次开发主要是调度服务器和调度终端;原装部分主要调度终端MC7500C和相关配件。

南京地铁的调度子系统包括互为备份的调度服务器和多个调度台,根据用户功能分为总调度台、行车调度、维修调度、环控(防灾)调度和车辆段调度。

调度服务器为高端的机架式服务器,该服务器上配置有windows服务器操作系统和SQLServer专业数据库及二次开发的调度服务器软件。

调度台的硬件包括Motorola的MCC7500原装调度台、二次开发调度台主机(即每个调度台包括两台计算机主机)、1套计算机标准配件(显示器、键盘和鼠标)、1套音频附件(MIC、扬声器和脚踏PTT)。每个调度台配置一套简易KVM切换设备,用户通过该设备操作控制二次开发主机和MCC7500主机。每套调度台的硬件配置都是一致的,但每个调度台的用户权限是不一样,通过用户名和密码区分。调度用户的管理对象(如通话组、电台、车站等)由系统管理员进行设置,可以根据需要为调度用户灵活设置管理对象。只有合法的调度用户才能登录调度台软件,如果用户输入错误的用户名和密码,调度台软件将弹出出错提示框。

调度台是用户进行调度运行指挥的主要操作平臺,用户可以通过它对系统内的列车司机、车站值班员以及手持台移动用户发起各种呼叫,或者接收它们的呼叫,以建立与这些用户之间的语音和数据通信。

二、问题研究

地铁运营多年,调度子系统发生过多起故障,影响范围大,故障处理的时间也较长。下面针对调度子系统出现的典型问题故障进行梳理分析。主要有以下两类问题:

(一)调度台注册鉴权失败

运营初期出现多次二次开发无法启动的现象,大多为原装主机没有正常启动,重新启动硬件或软件即可恢复。但有次问题比较典型,二次开发和原装台重启,重装都不能正常启动。

调度台问题现象为行调1(原装10.142.116.7加二次开发192.168.11.122)控制台灯显黄,显示调度台鉴权失败无法注册。

排查过程:第一步二次开发主机与原装主机通过IP进行ping通测试,数据正常,没有延时,确认两者网络通道是正常。第二步使用行调1的xd1用户名登录无线调度台备件(原装台10.142.116.2和二次开发192.168.11.127),行调1的用户名可以正常使用,说明用户名和密码是正确有权限的。由此判断调度大厅行调调度台软件系统可能有问题。

使用无线原装调度台备机(OP210.142.116.2)替换调度大厅原装调度台(OP710.142.116.7)并修改IP地址为(10.142.116.7),复制心跳包“cram.ior”软件仍无法正常登陆。把有问题的原装主机(OP710.142.116.7)替换为OP2(10.142.116.2)。重新启动原装台数据库,开启四个进程;开启原装台监控软件,通过用户名ConUser2和密码motorola开启原装台调度软件;发现监控软件可以监控原装台调度软件的启动和运行;接着把原装台的心跳包拷入二次开发主机;并把二次开发调度台中windows/Systems/drivers/etc的“host”IP地址改成一对一映射。启动二次开发的DPH程序后,发现依然登录不上去,与初始的故障现象一致;但远程连接原装台监控软件ManagerMonitor上有数据显示,显示二次开发调度台调用的原装台的鉴权用户名为ConUser2和密码ConUser2,而实际上OP2的原装台软件的鉴权用户名为ConUser2,密码为motorola。二次开发数据系统中原装台的鉴权用户名ConUser2的密码与原装数据库中的原装台ConUser2的密码设置不一致,导致原装台用户名ConUser2一直无法被二次开发调度台调用。在原装网管UCM软件中更改用户名ConUser2鉴权密码由motorola改为ConUser2,二次开发调度台重新覆盖对应的心跳包,二次开发上显示控制台鉴权正常,可登录。

一套调度台包含一台二次开发主机和一台原装主机,每台主机都有对应的IP地址,二次开发主机必须得到原装台的合理授权,才可以正常使用。此问题的原因有两方面:一是新增一套调度台备机,调试过程中把原装台ConUser2的密码更改,二次开发中没有对应更改,导致二次开发一直没法调用原装ConUser2,即原装系统内密码被原装厂家修改,二次开发调度服务器内未改,并且现场维保人员不知道。二是原装用户名与原装主机的IP对应关系可以灵活对应,不是唯一对应。针对此次问题原因,平时设备调试过程中,要关注细节,涉及的用户名和密码需做好记录,并保证各个数据的用户名和密码一致,并告知团队同事,同时要善于利用原装调度台的监测软件,掌握调度台启用的步骤。掌握用户名和IP的对应关系。

(二)调度台组信息获取失败

运营过程出现二次开发调度台的车组显示打叉,及无车组信息,导致调度台无法与行驶列车通话。查看数据库核心路由等设备都正常,原装调度台与二次开发调度台和中心设备的网络通信正常。当有部分调度台出现这类现象,其他调度台只要重启就会出现此类现象,不重启的话可以正常使用。原装调度台自检发现trunkingsystemstatus状态为“?”;正常状态为“√”。

通过自检软件DiagnosticCentre连接验证,发现MCC7500componentsVerification(组件验证)和Upgradereadiness Verification (更新准备验证)为Failed状态。

原装网管UEM反复提示如下告警:

1、ConsoleSiteControlPath_1116.1:zone15DOWN,NOACTIVITYRECEIVEDDIMETRAZcConsoleSCP:3.4.92.1控制台站点控制路径处于断开状态,没有收到任何活动。

2、ConsoleSiteControlPath_1116.2:zone15DOWN,TRANSMITRETRYFAILUREDIMETRAZcConsoleSCP:3.4.92.2控制台站点控制路径处于断开状态,传输重试失败

3、Redundancyattributeoftheentityhaschanged-UNDETERMINED,LINKDOWN实体的冗余属性发生变化,未确定连接断开

MCC7500系列一个调度台站点与区域控制器建立用于删除调用和设置的控制会话。活动区域控制器到调度台组的控制路径由一个称为LinkOp的调度台处理,向系统注册并分配资源的第一个调度台成为LinkOp,它是与ZC保持通信的唯一活动控制台。

调度台组中,总是有一个在用LinkOp调度台和一个备用的调度台(在出现故障时准备接管LinkOp调度台的责任),其他调度台保持非活动状态(此处活动是指与ZC的通讯)。所有调度台通过LinkOp调度台将其消息发送到ZC,但所有调度台都能够通过多播接收ZC消息,除了与ZC通信外,还交换声音信息,以确认各自的正确操作。当LinkOp调度台发生故障时,其余的调度台都知道,备用调度台变成在用的LinkOp调度台,转换时间需要约10秒。

LinkOp即调度台组与区域核心的逻辑连接,正常有两个逻辑连接,此模式称为路径多样性。控制路径是创建的逻辑链接,以方便区域控制器与MCC7500系列调度台组通信。控制路径为冗余模式:活动路径和备用路径。

因之前所有的控制台都正常注册和使用,故障时,两条控制通道处于断开状态,导致原装调度台注销之后再登录,无法获得ZC全部的资源信息,导致原装控制台某些监测不过关。

MCC7500C调度控制台提供一套应用程序编程接口(API)供二次开发厂家使用。它可供第三方接口通过计算机辅助调度(CAD)系统连接非摩托罗拉其他调度台,使之与摩托罗拉MSO系统通信。本线路使用的二次开发设备为五十四所的,即通过API接口两者获得联系。

摩托罗拉MCC7500C调度控制台允许其他软件应用程序监视和控制其应用软件。它是通过应用程序接口(API)完成的。API可以支持多个应用程序同时访问它们的,API可以同时服务调度控制台用户界面和第三方应用程序,必须通过CAD系统协助。有三个API可供希望通过调度控制台访问无线电系统特性和功能的第三方使用。

控制台调度接口API

控制台调度接口API是一组函数或消息,用于全面管理和维护软件应用程序与调度系统之间的连接。此API中定义的函数和消息:允许应用程序在控制台系统中注册和注销。只有注册的应用程序才允许与控制台功能API接口。本故障过程过程,二次开发调度软件和原装调度软件都可以登录。故控制台调度接口的API可以正常使用。

资源配置API

资源配置API是一组用于检索与调度系统相关的配置和别名信息的函数。配置信息包括:系统中资源列表(通话组或通播组);系统中每个资源上可用的容量及特征列表。别名信息通常指:用户无线电单元ID(例如,单元6118301=“泰山新村组”);单元用户状态,(例如,状态7=“现场”)。配置和别名信息是通过系统网络管理子系统输入的。本故障现象显示当时资源配置API出现问题,各通话组的信息二次开发调度台读取不到。

控制台功能API

控制台功能API是一组功能消息,允许实时监控和控制摩托罗拉调度通信系统。此API中定义的函数和消息用于:1监视系统中的呼叫活动;2向用户单元发起语音和数据通信。

本次故障时原装台和二次开发调度台的组信息都处于打叉状态,因原装台无法获得ZC的全部资源,原装台信息不全,从而导致二次开发调度台无法从原装台的API获取组信息,从而导致故障现象,所有的通话组都处于打叉的状态。即故障点集中在原装调度台与ZC之间的通讯。原装台与ZC服务器之间的通信是通过核心交换机相连。分析交换机的VLAN配置,发现VLAN16为调度台的网段。夜间34端口(接的总调调度台)出现反复离线状态。最终处理的措施是断开此局域网段内所有调度台,重新连接,并重启调度台恢复。结合后续故障及资料分析,发现当某个调度台短时间反复重启10多次之后,会出现此类组信息打叉的现象,故推测是此类行为被ZC认为有病毒攻击,激发系统高级行为阻塞,导致LinkOp调度台至ZC控制的两条逻辑链路处于几乎断开状态,调度用户可以登录,但是没法获得资源组信息,导致原装调度台也没有资源组的API信息给二次开发。

三、总结

本文重点介绍调度子系统的硬件组成及两个典型的问题的分析。调度子系统是硬件相对集成简单的系统,软件比较复杂,平时维保过程要善于利用监控软件ManagerMonitor和诊断软件DiagnosticCentre及原装的UEM软件掌握调度后台软件所处的状态,处理故障。平時维保过程中,禁止局部更改调度台的密码,导致二次开发和原装系统的配置不统一;掌握调度台问题的典型现象及处理措施,便于应急处理,同时也要善于分析告警日志,进行预防性维修。