杨 博,刘 琪,张哲瑞,李康乐,闫莉莹
(1.西安中车永电捷通电气有限公司,陕西 西安 710018;2.大连机车车辆有限公司,辽宁 大连 116021)
随着城市地铁线网的增多,原有低效的维保方式已无法满足地铁公司日益增长的业务需求,亟需寻求新的解决方案。通过物联网等技术实现车辆状态的实时监控,建立车辆运维系统,将传统的车辆变得更加智能,对于实现地铁公司的数字化转型意义重大[1]。然而地铁不同线路的车辆大多由不同的厂商生产,且车上设备种类众多,如果都采用各设备供应商的专用监控方案,由每个设备提供自己的数据采集和落地服务,则会导致成本上升和布线冗杂[2],因此实现能够将不同厂家、多种设备的数据进行综合采集、集中发送和监控的运维系统是解决问题的核心。
本文提出了一种基于车载运维主机和地面数据中心的多线网通用地铁运维系统,该系统包含车载的运维主机和地面的数据中心,运维主机通过MVB、485、以太网等接口获取车载设备的运行状态信息,然后通过LTE/WLAN传输到地面的数据中心,数据中心再负责将数据进行整合、分析和呈现。
目前车辆上装备的监控系统多为烟筒式架构(见图1),弓网监控、乘务监控等有监控需求的系统都配置有各自的通信模块、天线和地面服务器,各系统间服务与数据不共享,形成数据和服务孤岛,导致车辆运维成本升高,由于车顶空间有限,为保证通信质量,避免信号间相互干扰,各天线间需要保持合理的间距,导致布线困难。为解决上述问题,可采用共享式架构,将各系统功能相似部分进行抽象,由运维主机替代各系统原有的通信模块和外置天线,由数据中心替代各系统原有的地面服务器。
图1 烟筒式架构图
系统总体架构如图2所示:在每列车上安装一台运维主机,运维主机具备485、MVB和M12以太网等接口,可通过多种接口采集车上设备的状态数据;将设备数据收集组包后,通过LTE/WLAN传输至地面数据中心,考虑到网络安全,须加装防火墙。数据中心包含接收运维主机数据的数据采集服务器、将数据存储的数据存储服务器和解析数据的应用服务器;采用微服务的架构,一套硬件通过容器技术划分出多个虚拟空间,提供Docker给各车载设备部署数据模型和应用,通过Kafka或Rest API进行数据的交互,避免了服务器硬件的重复投入。
图2 系统总体架构图
运维主机替代了车上各系统原有的通信模块和天线,因此需要采集各设备的应用数据,然后进行存储和发送。需要采集的信息可分为两种:一种是列车各设备运行状态数据,如速度、网压、制动空压机压力等信号,这类信息实时性要求高,但数据量不大,可通过MVB接口进行采集;另一种是用于设备健康管理的数据,如接触器动作次数、电容充放电时间、弓网监测的视频等信息,这类信息由于数据量较大且实时性要求不高,需要通过以太网接口进行采集。
由于隧道内LTE网络不稳定,而进行设备的健康管理对数据的连续性要求又比较高,因此运维主机需要将采集到的数据进行缓存,并和地面数据中心实现断点续传的功能。运维主机还须具备集成数据记录仪功能,将通过MVB和以太网接口采集的列车运行数据存储在内置的固态硬盘中。数据发送包含LTE和WLAN两种方式:LTE通道用于实时时间的发送;WLAN通道用于音视频、硬盘数据等大数据的发送。
根据运维主机的上述需求,设计的控制器硬件包括核心控制板、通信板、电源板、接口板等模块;核心控制板用于运行Linux操作系统,进行数据处理及存储、协议转换。选用Toradex公司的Apalis iMX6D,搭载恩智浦MCIMX6D7CVT08 SoC,具备双核800 MHz处理能力,自带1 G DDR3和4 G eMMC NAND Flash,能满足应用需求。
通信板用于数据的无线传输,外接天线通过LTE/WLAN等无线方式将数据发送至地面数据中心,选用华为ME909s-821模块,上行速率50 Mbps,下行速率150 Mbps,具备Mini PCIe接口和核心板连接。
为兼容列车上的多种接口协议,接口板设计了2路CAN接口、2路以太网接口、2路MVB接口、1路485接口和3路外部天线接口(4G、Wi-Fi、GPS及北斗)。
车辆与地面的无线传输通道由4G网络和段内无线局域网组成,其中4G通道提供实时传输,即使车辆在线上提供运营服务,也能实时将数据传回到位于车辆段内的服务器中;段内无线局域网用于离线的数据传输,当车辆回到车辆段,车辆将通过车载设备自动连接地面无线网络,从而实现将车辆数据通过WLAN传输到地面服务器。
为提高无线局域网的网络性能、网络管理和安全管理能力,采用“AC无线控制器+AP”模式构建无线局域网,保证无线网络的高性能,易于管理和安全性。为了避免AC单点故障的问题,采取AC 1+1热备份,增加网络的可靠性。核心交换机也采用1+1热备份,保证传输的可靠性与安全性。根据网络管理特点,网管平台采用B/S架构,瘦客户端的方式,可通过远程方式登录管理,网管平台的WLAN功能模块可组件化解耦,按需拆卸,便于在网络不同场景下灵活组合使用。
由于列车通常在上行段和下行段都设有停车场,数据库将同时部署在2个停车场,其中一个停车场的服务器定义为主服务器,同时接收4G和无线网络传回的数据;另一个停车场的服务器定义为从服务器,只接收无线网络传回的数据。当位于辅助停车场的从服务器接收到数据后,将通过2个车库间的VPN网络把数据发送到主停车场的主服务器。
数据中心作为整个运维系统的处理核心,接收并存储车辆的海量运行数据,并基于大数据分析和挖掘技术,通过分析列车运行状态变化趋势,辅助车辆人员进行智能决策。系统实时与车载运维主机进行数据交互,采集和处理传感器数据,实现车辆在线故障诊断、故障预测以及亚健康预判等功能,实现车载故障预测和健康管理,指导维保人员维修决策,并可实现与地铁公司的EAM系统对接,当运维系统识别到列车发生故障后,实现维修工单自动生成和派发。
系统主要模块包括数据处理、在线监控、事件管理、工单管理、数据分析、健康管理和系统管理。数据处理模块包含数据接收、数据解析和数据存储。实时数据通过实时流式数据接收方式接收车载数据,数据以Socket数据流形式发送,Kafka将数据流整理为数据流序列,并有序地提供给后端实时数据处理程序。针对大数据量的离线数据,待列车回库后,以FTP方式实现数据接收。
在线监控模块按使用需求可实现线路级、列车级和部件级监控,线路级监控可宏观显示当前线路正常和故障状态的车辆数目。列车级监控可显示列车位置、列车号、网压、速度、运行模式、站点、故障状态等信息,部件级监控可显示单个设备的电压电流、接触器开断等详细状态信息,并实现了将列车HMI界面1:1无差别复制到运维系统的功能,方便维保人员对车辆状态的远程诊断。
事件管理模块用于对列车已发生的故障进行管理,包括事件监控、事件管理和事件查询,可对列车发生的故障实时报警,并可实现类似应急预案的功能,预定义故障可能的原因、故障相关变量和给出建议的解决措施。为减少误发,提高预警的准确性,支持事件信息的人工更新和修正,根据历史故障和模型预警情况,构建并不断完善知识库。
根据列车故障状况和维修建议,系统自动生成维修工单,工单管理模块包括工单生成、结果回填和评价。根据列车健康情况,构建维修工单,并自动推送到地铁公司EAM系统,实现工单自动生成和派发,待工单关闭后将执行结果及相关信息推送回运维系统,进行结果回填和评价。
数据分析模块包括历史数据查询和运营信息分析2个功能。针对故障调查等特定的数据需求,可通过列车号和时间查询列车运行历史数据,再现故障发生时的列车运行状态,为调查分析提供数据支撑。该模块还支持将牵引能耗、再生电量和里程等运营信息生成报表,供决策分析使用。
传统的列车维保按运营里程进行分级检修,在设备达到使用寿命时提前进行预防性更换。为降低列车维修成本和正线故障率,实现车辆预防修到状态修的转换,亟需对设备健康状况进行管理,实现设备状态数据、故障数据、预警数据的管理和分析。首先对管理对象按功能结构进行拆解,以逆变器为例,可拆解为接触器、电容、IGBT、传感器等具体部件,然后根据部件特性搭建故障预警模型,具体界面如图3所示。
图3 设备健康管理和评估界面
以IGBT为例,IGBT模块的失效多为其内部疲劳逐渐积累,并与外部运行环境多种因素相互作用的综合结果。主要故障模式可分为芯片失效与热疲劳失效,其中芯片失效为内部高温和过电应力导致,瞬时发生,很难通过状态检测;热疲劳失效是指IGBT内部结温引起的热应力所致,包括断裂、焊料层裂纹等。因此可通过检测实时电流、电机频率结合IGBT 的损耗模型和变流器热模型计算出IGBT 模块的芯片温度和壳温,通过实时雨流算法计算出IGBT 的温度波动幅度及频次,最后结合IGBT的寿命模型对IGBT健康度进行实时评估,给出合理的维修建议。
本文针对地铁监控领域所面临的通用性问题,开发了基于车载运维主机和地面数据中心的地铁运维系统。设计了运维主机硬件,实现了列车数据的采集和转发;搭建了地面数据中心,完成了地铁设备的在线监控与管理,并实现了设备健康管理和评估,与硬件模块一起提供了适用于地铁设备的软硬件一体化运维解决方案。