李 竑 上海铁路局电务处
GSM-R网络运维数据分析系统的研究
李 竑 上海铁路局电务处
目前常用的一些GSM-R网络运维子系统,多偏重于自身环节的故障处理,系统间缺乏联动,其功能离完整、全面地提供GSM-R系统维护、管理的技术支撑需求还有相当的距离。GSM-R网络运维数据分析系统主要从大数据技术角度将GSM-R网络各运维子系统的数据进行整合和深度挖掘,可对C3无线连接超时故障进行自动分析,并对GSM-R网络运用质量进行趋势分析,为全面掌控GSM-R网络运行情况提供有效的技术支撑手段。
GSM-R网络;C3无线连接超时;自动分析;大数据技术
自GSM-R系统开通运用至今,维护单位已经陆续具备了多种GSM-R系统的运行支持手段,涵盖了GSM-R网络管理、接口监测、无线覆盖等方面。这些系统从GSM-R网络不同的环节进行数据采集,提供GSM-R系统维护所需的统计、故障排查、性能监测等手段。但普遍存在系统间缺乏联动、系统缺乏自动分析能力、系统设计偏重于故障处理和性能监测等问题。
为解决上述问题,就需要建立一个综合的GSM-R网络运维数据分析系统,该系统应能将各种相对独立的GSM-R运维系统的数据进行整合,将GSM-R网络的性能数据、接口监测数据、无线覆盖数据、基础数据、地理信息(GIS)数据等进行统一分析处理,最终实现对数据深度挖掘,提高数据利用效率,提供对数据的汇总分析和趋势分析,在实现C3无线连接超时业务故障快速诊断及原因分析的基础上,对GSM-R网络质量变化发展趋势实现预判,以提升GSM-R网络运行质量和维护管理水平。
1.1 软件架构
系统软件架构主要分为数据采集、数据聚合、数据挖掘、数据呈现等四个功能部分,如图1所示。
数据采集:系统自身没有数据录入的需要,其数据全部来自各类专业子系统,可通过标准接口进行对接采集所需数据。
数据聚合:采集到的数据主要有结构化与非结构化两种类别。系统可分别对两种数据进行处理,生成系统可用的数据源。
数据挖掘:系统采用物理存储与业务逻辑分别处理的方式,运用大数据手段将数据的业务逻辑层单独处理,处理后的数据可用于系统呈现及输出。
数据呈现:将最终数据以统计分析、结果输出等形式实现人机交互。
图1 GSM-R网络运维数据分析系统软件架构
1.2 数据处理架构
GSM-R网络运维数据分析系统作为GSM-R网络的综合运维管理分析系统,可以将现有的GSM-R网络运维相关数据接入到平台中,包括GSM-R接口监测系统、动车综合检测系统、GSM-R设备网管系统、GSM-R无线路测系统、列控设备动态监测系统等。
因接入的系统较多、数据格式复杂(结构化数据、半结构化数据、非结构化数据)、数据深层次运用及系统智能化分析等因素,所以系统采用了大数据处理技术。数据处理架构如图2所示。
图2 GSM-R网络运维数据分析系统数据处理架构
C3列控车地信息传送是目前GSM-R网络承载的最重要一项业务,由于C3无线连接超时可能会引起C3降级,严重时会导致列车停车从而对正常的列车运行秩序造成影响,所以C3无线连接超时分析需要及时、快速、准确。上海局是高铁大局,每天上线运行的动车组非常多,因此,C3无线连接超时分析是目前各级GSM-R维护人员最为重视,也是最为繁重的一项工作。下文主要对GSM-R网络运维数据分析系统的C3无线连接超时自动分析功能进行重点介绍。
2.1 C3无线连接超时基本概念
C3无线连接超时是指车(ATP)或地(RBC)在规定的时间内没有接收到对方发送的应用层数据。在C3系统的ATP、RBC中定时器T_NVCONTACT设置了2个C3应用层数据包正确接收的时间参数,目前该定时器设置为20 s。
C3无线连接超时引起的降级故障是指列车采用C3系统控制列车运行时,由于RBC与OBC之间无线连接超时使得列车在速度降低到C2系统允许的运行速度后自动转换到C2系统运行。
2.2 C3无线连接超时原因分类
C3无线连接超时原因主要分为三类:通信原因、信号原因和不明原因,这三种类型的原因又可根据具体故障原因进行细分,常见的原因分类如表1所示。
表1 常见故障原因分类
2.3 C3无线连接超时自动分析
通过对大量C3降级故障案例的研究分析,同时吸取维护人员积累的分析经验,在总结C3降级故障类别判断关键点的基础上,系统确定了C3无线连接超时自动分析的流程(如图3所示)。
图3 C3无线连接超时自动分析流程图
2.3.1 理清拆链流程
判断首先发起拆链的单元和网络连接释放时的原因值,这是判断降级故障归属和原因的重要参考。比如,若是 BSC 或 MSC首先发起的拆链,那么极有可能是通信网络方面的原因导致的降级;若是 RBC应用层发起的拆链,那么降级的主要原因就首先考虑在 RBC方面。
2.3.2 检查 GSM-R网络状态
(1)检查连接释放前 Abis接口信令流程和上下行话音质量、电平值。
(2)检查信令流程以判断是否有未完成的切换,判断是否因 T3103超时或 RLT超时引起掉话。
(3)通过读取降级前的测量报告判断上下行话音质量和电平值是否发生劣化,判断是否因无线网络质量或ATP异常引起掉话。
2.3.3 检查列控用户数据传输情况
重点查看PRI接口监测数据是否有以下现象:
(1)判断连接断开前,PRI接口持续 5 s以上各层均无任何数据交互。
(2)判断降级发生时的车地通信场景,比如是否处于RBC交权区。
(3)判断是否有OBU或RBC不响应对端应用层消息的情况。
(4)判断链路层上下行链路是否可达,是否有标志通信异常的数据类型。
2.3.4 综合GSM-R网络状态和列控用户车地通信情况判断C3降级故障类型
(1)若是因为通信连接质量差导致 RLT超时或切换时T3103超时引起的车地通信中断,或 MSC/BSC设备故障引起连接异常释放,判为通信原因。
(2)若通信连接质量良好,由于列控系统用户层,EuroRadio安全层、传输层或链路层出现不符合协议规范的异常,从而发起连接释放,判为信号原因。
(3)对于三个接口均未发现异常,不能确定是列控系统车载端、地面端或GSM-R网络中某一方原因的情况,在本文的研究中暂时将其归为“不明原因”类。
除了对C3无线连接超时进行自动分析,GSM-R网络运维数据分析系统还可根据维护管理需要,通过采集大量的网络运行数据,进行大数据的分析,进而实现GSM-R网络运行质量趋势分析。
该平台通过采用分层次的评估体系以达到简化无线通信系统评估复杂度的目的。根据 GSM-R无线通信网络对C3列控系统影响的不同层面,将评估体系分为系统层评估、业务层评估及资源层评估。其中对 GSM-R无线通信网络RAMS指标的评估称为系统层评估,对 GSM-R无线通信网络对其所承载业务的影响的评估称为业务层评估,对 GSMR无线通信网络的基本通信能力的评估称为资源层评估。
GSM-R网络综合质量评价方法由两部分组成,一部分是基于历史数据的分析,另一部分是计算基于指标标准值的分析,最后通过加权求处理得到综合评价的结果。主要算法流程如图4所示。
图4 GSM-R网络综合质量评价流程图
GSM-R网络运维数据分析系统将GSM-R系统的网络资源、网络性能数据、接口监测数据、无线覆盖及干扰数据、用户数据、地理信息(GIS)数据等进行统一分析处理,建立了GSM-R系统运行数据仓库和数据间的相互关联,实现了C3无线连接超时故障快速智能诊断及原因分析,提高GSM-R系统业务运用质量;系统还可对GSM-R网络综合质量进行客观综合评价。该系统自2016年3月起部署应用以来运行稳定,界面简洁友好。维护人员通过使用系统的网络性能分析,C3无线连接超时自动分析,报表生成与管理,接口信令回溯等功能,能有效提升GSM-R网络的维护和C3无线连接超时分析工作的效率,对加强GSM-R网络的维护管理工作,提升GSM-R网络维护管理水平和运行质量有着很好的现实指导意义。
[1]铁道部科学技术司,铁道部运输局.CTCS-3级列控系统总体技术方案. 2008.
[2]铁道部科学技术司,铁道部运输局.2009.CTCS-3级列控系统与GSMR网络系统接口规范.
[3]铁路通信技术中心.王买智.《C3通信超时分析方法的研究》
[4]《GSM-R综合网络管理系统研究与实现》.
责任编辑:许耀元
来稿日期:2016-11-08