我国高速铁路 GSM-R 网络通信检测/监测数据分析应用的思考

2014-09-06 03:34邢小琴王卫东王惠生高利民
铁道运输与经济 2014年2期
关键词:全路铁路局监测数据

邢小琴,王卫东,王惠生,高利民

(1. 中国铁道科学研究院 研究生部,北京 100081;2. 中国铁道科学研究院 基础设施检测研究所,北京 100081)

0 引言

“数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合,为探查和分析新的数据类型,以及采用新方法分析旧有数据类型提供了令人振奋的机会”,“是在大型数据存储库中,自动地发现有用信息的过程”[1]。进入21世纪以来,随着信息化技术在我国的发展和推进,国内大中型企业大多都建立了先进的信息化系统,甚至构建了数据仓库,数据爆炸式的增长,人们越来越意识到应用数据挖掘技术的重要性,迫切希望告别基于简单统计分析的“报表”决策时期,跨入使用数据挖掘技术的“知识”决策时代。

近几年来,随着铁路信息化建设的发展,我国逐步建成多个面向应用的管理信息系统,如货物运输管理系统、旅客运输管理系统、列车调度命令系统、自动列车身份认证系统、车辆管理信息系统、通信信号管理信息系统、工务管理信息系统等[2]。但是,这些系统各自为政,鲜有信息交互,给跨部门协作带来较大困难。针对这种现象,我国提出了建立铁路智能运输系统的概念[3],目标在于通过各个系统的协同工作,使固定设施、移动设施和维修设施有机协调成为一个整体,以提高整个铁路运输的效率。为此,国内专家学者纷纷开展了大量的基础理论研究,如基于元数据的信息共享研究、基于XML 的通用数据模型研究、物联网技术研究、云计算技术研究、知识推理、数据挖掘技术研究等,同时也在一些铁路关键子系统内进行了应用试验研究。在货运方面,通过对铁路货票历史数据的挖掘分析预测未来的货运量,以便为铁路各级管理者优化运力资源配置、策划市场营销提供决策支持[4-6];针对货运客户信息数据进行挖掘,便于根据不同类别的货主制定不同的优惠措施,提高铁路企业的客户关系管理和决策水平[7]。在客运方面,主要以铁路客票发售和预定系统为研究主体,以数据仓库和数据挖掘技术(主要是神经网络技术)为手段建立客流分析预测模型,为铁路部门合理安排客运能力提供决策信息[8]。

目前,铁路基础设施管理维护部门积累了大量各专业的检测/监测数据和养护维修记录,如工务的轨道、弓网专业数据,电务的通信、信号专业数据。如何有效地利用这些海量数据,通过数据挖掘和知识推理技术,研究轨道、弓网、通信、信号各子系统内部部件或参数之间的复杂关系,进而分析预测其状态和演变趋势,为养护维修部门的故障诊断、预防性养护维修提供参考。为此,从全路高速铁路全球移动通信系统(Global System for Mobile Communications for Railways,GSM-R)网络的检测/监测数据入手,通过分析当前各类数据的应用现状及需求,提出建立全路通信检测/监测数据分析平台,并且对平台功能及结构进行整体规划。

1 GSM-R 网络通信检测 / 监测数据分析需求及其应用现状

在 CTCS(Chinese Train Control System)-3级列车运行控制系统(简称C3列控系统)中,GSM-R 网络作为系统的一部分,为列车车载设备与无线闭塞中心(Radio Block Centre,RBC)提供双向信息交互的通道。车载设备通过 GSM-R 网络接收 RBC 发出的线路参数、行车许可和临时限速等信息;车载设备通过 GSM-R 网络向 RBC 传送列车的运行速度、位置等动态信息。GSM-R 网络状态及服务质量对C3列控系统运行状态具有重大影响。

1.1 数据分析需求

列控系统遵循故障导向安全的原则,C3降级至 C2(CTCS-2级列控系统)虽然不会引起重大安全事故,但在一定程度上会影响铁路运营效率,亟需通过科学的方法从列控系统设备、GSM-R 网络设备相关的大量数据中寻找规律,发现导致降级的深层次原因。

铁路综合检测列车每月对高速铁路线路的GSM-R 网络进行测试,测试主要内容包括场强覆盖、语音通信服务质量和电路域服务质量中的多个指标。目前,对测试问题的发现和原因分析完全依靠分析人员凭经验判断,受分析人员的经验、精力,以及数据本身和分析工具的限制,尚无法对1条线路的多次测试数据进行全面、多角度的比较分析和趋势分析,使大量的检测数据没有得到充分的利用。

在铁路局核心网机房安装的 A 接口、应用二进制标准(Application Binary Interface Standard,ABIS)接口和主速率接口(Primary Rate Interface,PRI)监测系统,能够对管内所有运营列车通过上述3个接口的信令和业务数据进行全面监测。按照中国铁路总公司在2010年颁布的《 GSM-R 数字移动通信网ABIS、A、PRI 接口监测系统技术条件(V1.0)》,地面接口监测系统除了实时监测、记录、解析网络信令和列控数据业务外,还具备 C3降级异常捕获及一些指标或参数的统计功能,供系统维护人员参考。网管系统可以对常见的网络故障和异常进行自动检测。然而,在实际应用中,面对每天产生的海量监测数据,系统维护人员多是针对某个问题在相关时间点内的数据进行查询,而不可能有足够的时间去深入分析数据,导致大量数据信息闲置。

1.2 数据应用现状

GSM-R 网络动态检测、接口监测数据是对铁路通信网络运用质量评价的重要依据。然而,这些数据资源的现状却是分散、保密、不流通的,成为一个个的信息孤岛,真正价值无法得到实现。

(1)铁道部基础设施检测中心的动态检测数据。目前,铁道部基础设施检测中心已经实现了综合检测列车动态检测数据的存储管理,并且以文件的形式向铁路局提供下载。但是,检测文件需要检测设备厂家提供的专用回放软件才能进行查看,数据分析人员无法获取全面、有效的原始数据信息,只能局限于与测试指标相关的部分信息。因此,由于数据格式保密,并且不得不以文件形式进行存储的方式大大限制了后续数据的分析应用。

(2)铁路局电务检测车的检测数据。目前,各铁路局根据需要自主选择不同厂家的通信检测设备,用于铁路局电务检测车。对于铁路局而言,即使同时拥有同一条线路的综合检测列车和铁路局电务检测车的检测数据,由于文件格式不相同依然会导致分析人员无法进行融合分析。另外,即使综合检测列车和铁路局电务检测车使用相同的检测设备,目前也没有工具或手段能够对这2种格式相同的检测数据或更多的数据进行比较分析或趋势分析。

(3)接口监测数据。铁路局核心网接口监测系统、网管系统负责监测运营旅客列车在 GSM-R网络中的通信运用情况,以及 GSM-R 网络自身的状态,其监测数据信息量大、内容丰富。然而,由于各厂家对数据格式保密,网络维护人员无法获取原始数据,也无法利用数据分析工具分析这些原始数据,更无法将各类检测数据、接口监测数据进行关联分析,进而达到故障诊断、发现隐性故障的目的。另外,每个铁路局使用的接口监测系统不一样,产生的数据格式也不尽相同。由此造成对于一条跨越多个铁路局的高速铁路,通过关联各个接口监测系统的数据无法了解全线的网络运用情况,上级单位只能看到各铁路局分别给出的统计分析报表。

综上所述,目前对 GSM-R 网络检测/监测数据的应用还非常有限,主要停留在对当时、当次数据的简单统计和部分问题的报警处理上,亟需利用高效的分析方法和手段对大量历史数据进行挖掘分析,从中找出有用的规律和知识,帮助维护部门快速准确地进行故障诊断,并且提供合理的预防性养护维修决策支持。

2 全路 GSM-R 网络通信检测 / 监测数据分析平台

为了有效利用 GSM-R 网络的通信检测/监测数据,首先应建立全路数据共享平台,使各种数据成为可利用的资源,在此基础上建立数据分析平台,利用数据挖掘技术为各级部门提供决策支持。全路GSM-R 网络通信检测/监测数据分析平台不仅为分析人员提供数据综合分析应用的条件,也为高校和科研院所创造科研开发的环境,促进数据挖掘、机器学习、专家系统等方法和技术在铁路通信业务中的应用。

2.1 数据共享平台

依托铁路数据网,实现全路电务系统内通信相关业务部门之间数据信息的互联互通。在此基础上,动态检测数据、接口监测数据、网管数据、RBC 司法记录单元(RBC Judicial Record Units,RJRU)系统的监测记录(预留)、列控设备动态监测系统(Dynamic Monitoring System for Train Control Equipment,DMS)的监测数据(预留)等实现在各级业务部门内的流通,形成全路通信检测 / 监测数据共享平台,如图1所示。

图1 全路通信检测 / 监测数据共享平台示意图

(1)数据共享。在原始数据格式公开的基础上实现数据共享或提供数据接入适配单元,目的在于使存储到平台的数据具有统一的格式,这是保证数据可分析的前提条件。运用数据共享平台,铁路局可以获取全面的动态检测数据,作为故障诊断、网络优化的重要参考;铁道部基础设施检测中心可以获取测试终端、综合检测列车的接口监测数据,通过综合分析提高检测数据的分析质量。

(2)分布式数据存储管理。原则上各检测、监测系统所属单位自行存储其原始数据。在数据分析中心设置文件管理目录系统,各级单位可以对检测/监测数据文件进行检索和查询,根据需要从平台上获取权限范围内的数据。

2.2 数据分析平台

在数据共享平台的基础上,建立以数据挖掘、专家系统等技术为核心的数据分析平台,向全路各级用户提供应用服务。

2.2.1 数据分析平台功能

数据分析平台的功能划分为以下3类,数据分析功能、检测/监测问题闭环管理功能和决策支持功能,如图2所示。其中数据分析功能为整个平台的核心功能,是后面2类应用功能的基础。

图2 数据分析及应用

(1)数据分析功能。①全面的数据回放功能,能够接入并且回放全路主流检测系统产生的检测数据,具备多项指标联动分析功能,具备信令分析功能。②典型故障自诊断功能,对动态检测、接口监测中发现的典型问题实现自动诊断,可以将接口监测数据与动态检测数据进行融合分析。③网络运行状态评价功能,通过对线路多次检测、监测结果的历史数据进行对比分析,分析网络运行状态及其发展趋势。④网络运用质量评价功能,将接口监测数据与动态检测数据进行融合分析,结合实际列控系统车地通信应用情况,对网络运用质量进行评价。⑤专题数据挖掘分析工具,针对实际应用中的重点、难点问题设计专用数据挖掘算法及流程,对分析结果进行可视化展示。⑥其他分析工具,如指标统计功能、报表输出功能等。可以根据通信专业数据特点设计多种统计分析工具,供分析人员根据需要自行调用进行感兴趣的分析。

(2)检测/监测问题闭环管理功能。铁道部基础设施检测中心已经实现对动态检测数据的闭环管理,包括检测结果发布、问题整改反馈、复测销号等,未来还应增加对接口监测系统中存在问题的闭环管理。

(3)决策支持功能。①分析 GSM-R 网络状态变化趋势和 C3列控系统通信质量,为网络维护部门提供故障诊断、预防性维修计划建议。②为铁路局提供管内线路网络运行状态、C3列控系统运用质量的总体评价,为铁路局主管领导提供决策支持。③提供全路各线路网络运行状态、C3列控系统运用质量的总体评价,为中国铁路总公司主管领导提供决策支持。

2.2.2 数据分析平台结构

数据分析平台由数据集成及清洗(接入)、数据仓库(存储)、数据分析工具和可视化展示4个部分组成,如图3所示。采用分布式数据挖掘方式,分别在铁道部基础设施检测中心、铁路局网管中心、电务检测所等地建立数据仓库,各数据仓库之间能够进行数据流通,并且按需配备分析工具。

3 关键技术研究

全路 GSM-R 网络通信检测/监测数据分析平台的实现,需要解决以下关键技术。

(1)设计检测/监测数据的统一接入格式和数据仓库结构。对各类数据源进行调研,综合考虑数据功能和后续数据分析需要,设计统一数据接入格式和数据仓库结构。

(2)研究网络状态表示模型、典型故障表示模型,建立网络状态数据库和故障库。研究GSM-R 网络动态检测数据、地面接口监测数据中关键特征量的提取、表示和特性分析,研究各特征量之间的关联关系,建立网络状态表示模型;研究C3列控系统中运营列车列控信息的传输特性和传输质量的表示方法;对检测和实际应用中发现的典型故障数据进行分类整理,研究故障现象数据的特征量提取、表示和特性分析,研究各特征量之间的关联关系,建立故障模型;形成网络状态数据库和C3列控系统降级故障库。

(3)研究数据挖掘技术在通信检测/监测数据中的应用。调研系统内各级单位的实际应用需求,确定数据挖掘任务,按照“数据整理—数据清洗—数据挖掘方法选择—数据挖掘—模型验证”的思路逐步开展研究工作。研究数据挖掘方法在数据分析平台中的实现,如应用基于规则的分类方法设计 C3降级故障分类器,实现降级故障自动诊断功能。

图3 数据分析平台结构

(4)研究数据本身及数据挖掘分析结果的可视化展示技术。研究业务数据的可视化技术,便于分析人员多角度、动态地观察、跟踪数据;研究基于地理信息系统(Geographic Information System,GIS)的 GSM-R 网络状态、列控系统运用质量的可视化方法,以及动态检测/地面监测中报警病害数据的动态可视化展示技术。

4 结束语

基于铁路通信专业各级单位的实际应用需求,提出建设全路 GSM-R 网络通信检测/监测数据分析平台。该平台建立在全路数据共享平台的基础上,利用计算机科学和数据挖掘领域的先进技术,解决铁路电务部门生产中的实际问题,实现生产方式由人工到自动化、智能化的转变,促进全路数据分析应用水平的提高,为养护维修部门的故障诊断、预防性养护维修提供参考,提高铁路运输企业的生产效率。

[1]Pang-Ning Tan,Michael Steinbach,Vipin Kumar. 数据挖掘导论[M]. 范 明,范宏建,译. 北京:人民邮电出版社,2013.

[2]Hanning Wang. Metadata-oriented Data Model Supporting Railway Distributed System Integration[J]. Journal Of Software,2012,7(4):814-822.

[3]徐 杰,贾利民,秦 勇,等. 铁路智能运输系统通用信息平台的设计与实现[J]. 中国铁道科学,2006,27(3):89-95.

[4]徐 薇,黄厚宽,李昆仑. 数据挖掘和数据仓库的关系研究[J]. 广西师范大学学报,2003,21(1):131-135.

[5]刘雄鹏,雷定猷. 基于数据仓库的铁路货票数据分析决策支持系统[J]. 电脑与信息技术,2004(4):51-54.

[6]梁毅刚,耿立艳,张占福. 基于核主成分-最小二乘支持向量机的区域物流需求预测[J]. 铁道运输与经济,2012,34(11):63-67.

[7]钟 雁,郭雨松. 数据挖掘技术在铁路货运客户细分中的应用[J]. 北京交通大学学报,2008,32(3):25-29.

[8]郑 丹,王 耀. 数据挖掘在铁路客流分析预测中的应用[J]. 计算机系统应用,2009(11):169-171.

猜你喜欢
全路铁路局监测数据
UIC和欧盟铁路局签署一项协调框架协议
既有灾害监测系统接入铁路局中心系统方案研究
全路通信骨干网智能运维管理平台构架及需求分析
GSM-R接口监测数据精确地理化方法及应用
广告索引
呼和浩特铁路局GSM-R系统现场应用故障分析与处理
The Use of Futures and Forward in Risk Reduction,Speculation and Arbitrage
Stocks and Bonds An Analysisof the UK investment scene
环评中引用大气现状监测数据的研究
GPS异常监测数据的关联负选择分步识别算法