吕 赫
(1 中国铁道科学研究院集团有限公司 机车车辆研究所, 北京 100081;2 北京纵横机电科技有限公司,北京 100094;3 动车组和机车牵引与控制国家重点实验室,北京 100081)
我国动车组上线运营数量越来越多,动车组调度运用和检修维护压力不断加大。随着动车组装备技术的进步和智能化程度的不断提高,动车组在运行过程中产生了海量信息,这些信息通过车载无线传输系统实时传往地面数据中心。地面数据中心整合处理这些信息,通过友好直观的形式提供给地面专家,使得地面专家及时掌握动车组运行状态信息,实现动车组故障的远程应急指导。同时,地面数据中心通过长期对动车组车载数据的积累和分析,可以发现潜在的运行规律,多维度诊断动车组健康状态,实现以可靠性为中心的状态检修。因此,综合运用动车组车载数据,可以提高动车组监测保障力度和检修维护效率。
国外许多国家在动车组车载信息地面监控及处理方面取得了大量的研究和应用成果。法国TGV、德国ICE、美国AC6000CW、英国IC125 型高速列车都实现全列车自动诊断,各种监测信息以无线方式实时地发送到调度中心和维修中心,可在地面下载机车的诊断数据,实现远程监控[1]。
国内既有车的客车运行安全监控系统TCDS(Train Coach Running Diagnosis System)是由铁科院研发的覆盖客列检、客整所(整备所)、车辆段、各路局集团、国铁集团的综合安全监控信息系统。该系统制定发布了统一规范的车地传输协议标准、相关设备技术标准,以及配套的设备维护管理办法,可兼容不同厂家生产的多种不同的车载监控设备,以及25K、25G、25T 等多个车型。该系统实现地面对提速客车的全程监控,切实保障客车运行安全,重点检测客车轴温、制动、转向架、客车供电、电器及空调等多个子系统运行安全状况。经过15 a 的运用和发展,TCDS 已成为保障我国铁路客车运行安全的有力手段[2]。
动车组车载信息无线传输及地面监控系统(WTDS)是对动车组运行状态信息进行采集、传输、实时监控、数据记录与故障分析的技术平台,是保证动车组运营安全,提高动车组检修效率的重要手段。在动车组运行过程中,车载设备采集动车组列车网络控制系统(TCMS)的重要参数、故障数据及位置数据。通过互联网实时传输关键数据,经过WTDS 地面数据中心处理后,可实时监测动车组运行状态,统计动车组参数变化规律,对重大故障进行综合诊断,深入分析列车故障发生原因,对保证动车组安全高效运营具有重要意义。
WTDS 实时数据由互联网发送到国铁集团外网服务器,并通过安全网闸传输至国铁集团内网服务器。WTDS 过程数据由于数据量较大,采用回库下载的模式,即动车组回库后通过设在动车所内的无线接入设备,将动车组数据自动同步至位于动车所内的数据工作站中。动车所技术人员在对数据进行分析后将分析结果上传至国铁集团内网服务器。WTDS 同时向其他系统,如动车组司控动作监控系统(EOAS)发送数据,如图1所示。
图1 WTDS 系统架构图
WTDS 系统目前实时接收3 000 余列标准组动车组数据,远期可能达到5 000 列标准组动车组接入,日均产生数据量超过10 亿条。需要采用高并发、高可靠、高负载的数据处理技术,实现各数据处理节点的负载均衡,从而完成海量数据的实时处理。应用数据总线技术可有效地对各数据处理模块解耦,将复杂的数据处理问题拆解成子模块进行分解处理,还可以应对数据流量的频繁变化,在数据流量较大时通过数据总线对数据进行缓存,减缓波峰时瞬间对系统造成的性能压力。
WTDS 地面数据中心按照私有协议接收到动车组发送的实时数据后,为了能够高效稳定地处理数据,应用了数据总线技术。WTDS 数据处理流程如图2 所示,各个数据处理模块通过数据总线连接,所有数据分散成多个分区存储在数据总线中。每包数据进入数据总线时会根据各分区的负载情况分配到待处理数据较少的分区。数据总线为每个数据包标识递增序列号(ID),代表其进入数据总线的先后顺序,并按顺序存储在分区中。各个数据处理模块在数据总线中选择不同的分区,获取数据,完成数据处理。各数据处理模块自己维护已完成处理的数据ID。处理完成后,数据处理模块向数据总线请求下一个数据包(ID+1)。各数据处理模块也可以从其他任意位置开始数据处理(ID+n)。这样,不同数据处理模块可以并行工作在同一个数据总线之中,每个数据处理模块都保留自己的ID,互相之间不干扰,保证了数据的一致性,为并发处理提供了线程安全的保证,数据处理高效稳定。当单点发生故障时,可以由其他数据处理模块接续完成数据处理任务。数据总线中保留的数据非常庞大,当自身处理性能不足时,通过负责均衡策略将分区分配到不同服务器上。当服务器过载时,通过扩容可以将数据重新均匀分配,保证数据可靠性。
图2 WTDS 数据处理流程图
WTDS 系统完成数据处理工作后将数据存入数据库保存。现场用户无法直接使用海量的车载数据进行分析,需要运用数据可视化技术对车载数据进行综合展示。数据可视化主要旨在借助图形化手段,清晰有效地表现数据。现场用户需要对数据的特征和不同动车组在数据层面所存在的差异进行分析,从而实现对稀疏而复杂的数据集进行深入的洞察[3]。动车组数据内容庞杂、数据项点繁多,传统的数据查看获取信息效率极低且容易遗漏大量有效信息。系统实现了几种动车组数据的可视化方案,帮助用户更好地理解数据。
该方案将车地通信状态与地理位置相结合,综合利用甘特图、折线图,将地理位置与通信质量做出对比,分析动车组与地面通信的状态,以及线路对车地通信质量的影响情况。车地通信质量数据可视化如图3 所示,甘特图用于展示以时间维度标识的通信质量,红色为通信质量不佳;折线图用于定量展示通信延时情况。地图展示通信质量与线路地理位置的关系,红色为通信质量不佳的位置。右侧菜单栏可选择不同车组号、时间、数据类型。
图3 车地通信质量数据可视化
该方案通过对相同子系统下故障发生次数的对比,提取离群值(异常车组),从而更有针对性地详细排查故障,排查重大故障隐患。子系统故障频率数据可视化如图4 所示,用不同颜色的圆点表示不同车组在指定时间范围内子系统的故障发生次数。四分位数箱体用于表示某子系统全部动车组的故障发生频率分布情况。如果某列动车组故障发生频率明显高于其他动车组,则应特别关注。目前,在生产运营中,分析人员主要对单个故障进行分析,而该方案提供了故障分析的宏观视角。
图4 子系统故障频率数据可视化
该方案通过分析温度预警的时间分布特征,从而发现规律,并针对预警高发时段进行针对性分析及原理剖析。温度预警时域分布数据如图5所示,横轴表示温度预警发生的不同时段,蓝色圆圈表示某个温度预警在该时段内发生的次数,圆圈越大发生的次数越多。由图5 可看出,上午发生温度预警的概率明显大于下午。可以提示各系统专业人员进行进一步的分析。
图5 温度预警时域分布可视化
该方案通过关联不同温度预警类型与地理位置,对齿轮箱温度预警和转向架温度预警在不同地理位置的分布差异进行了分析。现有研究中心较少分析不同类型温度预警与线路地理位置之间的关系。通过分析温度预警与线路地理位置的关系,京广线转向架温度预警高发,京沪线线路齿轮箱温度预警高发。应加强相应线路情况的排查,并对重点部件运用情况进行检查。
该方案通过对车组制动状态的时间分布进行聚类分析,发现特殊状态发生频率的异常变化,进而提示技术人员进行针对性分析。制动状态聚类分析数据如图6 所示,可以发现某动车组在半个月内,7 级电制动状态发生频率异常,需进行排查。目前,这种长期的特殊状态频率变化往往被忽视。
图6 制动状态聚类分析数据可视化
该方案通过对比全部动车组在相同时间内的牵引变流器出口温度,进而发现状态异常动车组。在此方案中,针对工业场景下数据量巨大,可视化速度慢的问题,对盒须图中非离群值部分在保留统计特征前提下进行了降采样,提高了显示速度。牵引变流器出口油温数据如图7 所示,每一个盒须图箱体表示牵引变流器出口油温在特定时间范围内的温度分布。某动车组牵引变流器出口温度分布显著高于其他动车组,应予特别关注。
图7 牵引变流器出口油温数据可视化
文中针对动车组车载数据的特点,对国内外车地数据传输系统的现状进行了分析,提出了动车组车载信息无线传输系统的系统架构。针对动车组车载信息数据量大,地面数据中心系统负载、系统可靠性要求高的特点,提出了基于数据总线技术的地面系统负载均衡方案。同时,为了更好的分析海量车载数据,提出了车地通信质量数据可视化、子系统故障频率可视化、温度预警时域分布可视化、温度预警地域分布数据可视化、制动状态聚类分析数据可视化、牵引变流器出口油温数据可视化,共6 种动车组车载数据可视化方案。通过这些数据可视化方案的应用,为海量数据的分析提供了全新的视角,显著地提高了用户分析动车组车载数据的深度和广度。