列控车载子系统故障时空特性分析及可靠性研究

2019-12-31 05:32蔡伯根上官伟
铁道学报 2019年12期
关键词:列控车次车载

陈 斌,蔡伯根,2,3,上官伟,2,3,王 剑,2,3

(1.北京交通大学 电子信息工程学院,北京 100044;2.北京交通大学 轨道交通控制与安全国家重点实验室,北京 100044;3.北京市电磁兼容与卫星导航工程技术研究中心,北京 100044)

我国“十三五”规划明确规定,截至2020年,中国高速铁路运营里程将达到3万km。高速铁路的快速发展,给国家经济发展、民生保障带来了极大的发展空间,这对高速铁路的运行安全提出了更高的要求。高速铁路列车运行控制车载子系统(以下简称列控车载子系统)作为控制列车运行的核心部分,其安全、可靠运行是保障高速列车高效、稳定、安全运行的关键。作为一个结构复杂、功能多样,特别是具有安全苛求特性的系统,列控车载子系统的故障特性对于系统的全生命周期管理和维护维修工作具有十分重要的作用。在运行过程中,由环境干扰、部件磨损、设备老化等引起的系统自身设备性能退化,会导致系统可靠性下降,从而引发故障,给高速列车的安全、高效运行带来隐患。列控系统在运行时,会自动生成记录系统运行状态、事件的日志数据,对其数据特征的研究,能够使维护维修人员及时掌握系统的运行情况,适时地对系统进行检修与维护,保证列车的正常安全运行。

系统故障特性是指能够表征故障分布、演变等过程的数学描述。故障特性的研究对于系统的故障诊断、可靠性分析、维护维修决策的制定等有着重要的作用。目前在电力传输系统、军事、计算机网络、软件工程等诸多领域已经有很多学者开展了关于故障特性的研究。曹一家等[1]基于电力网络本身的演化机理,构造了一种复杂电力网络的时空演化模型,对电力网络的演化规律进行了分析。撖奥洋等[2]针对双馈风力发电系统分析了电网发生故障时定子短路电流呈现的多态故障特征,对实现电网稳定及故障后的快速恢复具有重要意义。杨乐等[3]针对军事装备故障数据的时空特性提出一种基于Apriori算法的快速挖掘算法,对装备故障的时空共现模式进行分析。Matsukawa等[4]针对通信网故障产生的频率及对网络用户和运营商的影响严重程度进行了分析,并利用广义Pareto分布对故障频率和严重度之间的关系进行了估计,文章提出的方法对通信运营商的网络运营和管理有较大的帮助。还有学者分别在传感器领域[5]、通信领域[6]等进行了关于故障特性的研究。

列控车载子系统运行数据包含系统运行状态信息,包括正常运行状态与各种类型的故障状态,列控车载子系统数据的利用主要集中在系统的故障诊断、可靠性评估等层面。

故障诊断是列控系统数据应用最直接的领域之一。Wang等[7]基于双层特征提取的文本挖掘方法,对铁路系统的故障诊断进行了研究,提高了故障诊断的准确率。Zhao等[8]利用文本挖掘对高速列车维修记录中的故障特征进行提取,并用贝叶斯网络对故障诊断的不确定性与复杂性进行优化与调整,提高了故障诊断结果的准确性。邹运怀[9]利用文本挖掘的方法,设计了道岔故障分类器,实现了对道岔故障的自动分类,确保数据记录的准确有效。臧钰等[10]利用神经网络对列控系统关键设备速度传感器的故障状态进行诊断,并从模式识别角度出发,建立速度传感器隐藏的故障状态模型。Yin等[11]基于深度学习方法提出了一个针对高速列车车载设备的自动诊断网络工具。此外,还有学者利用贝叶斯网络[12]、粗糙集[13]、时间序列分析[14]等方法对列控系统数据用于故障诊断进行研究。

列控系统故障数据在可靠性评估层面的应用主要集中在列车运行控制系统、铁路通信系统、牵引供电等的核心系统及部件方面。冯玎等[15]针对列车牵引供电设备建立了连续时间Markov退化过程,利用均匀加速技术求解可靠性参数,预测未来时刻处于不同工作状态的牵引供电设备数量,可为牵引供电设备维修策略的制定提供决策支持。张友鹏等[16]建立了高速列车车地通信子系统的贝叶斯网络模型来评估其可靠性,并在此基础上,利用模糊综合评判法将维修资源分配到薄弱环节中。Liu等[17]基于高速动车组牵引传动系统的结构参数和运行原理,建立了牵引传动系统的可靠性框图模型,进而对牵引传动系统的可靠性进行估计。Su等[18]提出基于故障树和贝叶斯网络的CTCS-3列控系统可靠性评估方法,故障树能更好地描述系统的冗余性和容错性等特点,结合贝叶斯网络处理不完备数据的优势,为列控系统可靠性评估提供了有效的方法。Sun等[19]将主成分分析和马哈拉诺比斯距离结合,从列控设备参数中提取关键退化特征,采用BP神经网络对列控关键设备的寿命预测进行了研究。

列控车载子系统与一般的工业系统有较大的区别。在列控车载子系统中,各个组成部件的性能参数无法实时获取,性能数据积累量较少,从性能参数出发分析各部件的性能退化情况较为困难。目前常用的方法有两种,一是以列控车载子系统故障统计数据出发,从宏观的角度分析系统故障发生的趋势[20-21],二是从系统部件的故障率出发,通过失效分布来评估系统的可靠性[22-24]。

系统的故障分布特征对系统的故障诊断、可靠性评估分析与维护维修策略的制定有着重要的支撑作用,然而目前针对列控车载子系统故障分布特征的研究较少,大多只是从少量的样本数据出发对系统的故障诊断及可靠性评估进行研究,且样本的选择没有明确的依据。基于此,本文在以上文献分析的基础上,针对大量的列控车载子系统日志数据,建立列控车载子系统数据空间模型,并对其故障态势分布进行分析;在故障物理空间分布特征方面,以发生故障的车次与类型为依据对故障的空间特征进行分析,发现系统的薄弱环节,有助于维修维护工作的进行;在故障时间特性方面,从系统群和单一系统出发,通过系统群的故障率时间分布以及系统个体故障时间分布,对系统的故障时间分布特性进行分析;以系统故障时空分布特性为依据,选取典型系统和设备,分析其可靠性相关指标。

1 列控车载子系统数据模型构建

列控车载子系统运行数据大多是以文本格式记录的,部分类型数据见图1,其具有以下特点:

(1)庞杂:列控车载子系统数量庞大,且型号较多,以某动车段为例,每天发行约250对高速列车,对应5种车载子系统类型,造成数据内容、类型的庞杂。

(2)混乱:现行的数据分析工作中只是按照数据的下载时间对数据进行存储,且没有形成规范化的数据查询、回放模式,造成数据混乱。

(3)随机:系统的运行数据随着系统工作状态的变化而产生随机性。

(4)多义:由于列控车载子系统各组成部件中存在着共用的信息流,导致某一部件发生故障时,其非正常工作状态信息会随着数据流的传播导致其他正常工作部件也会表现出故障特征,进而使得系统故障数据存在着隐含的多义性。

图1 部分列控车载子系统数据示例

由于列控车载子系统数据具有以上特点,以及在数据的管理过程中,工作人员之间存在理解差异,对数据的整理与存储缺乏统一的标准,容易造成数据的混乱,对后期的设备维护工作产生干扰。此外,高速列车在运行时会执行不同的运行班次,系统运行时间具有较大的不确定性,对于表征系统故障的特征如故障发生时间、发生类型等信息的获取比较困难,本文首先针对列控车载子系统数据进行数据模型的构建。

列控车载子系统的数据种类有很多种,比如系统的日志文件、数据分析工区的交接班记录、年度故障覆盖表,但其具有共同的属性,即一条完整的记录信息包含4个关键元素:系统标识、时间、数据记录内容及数据记录内容属性。定义列控车载子系统数据模型如下:

定义1定义列控车载子系统数据模型R为一个四元组

R={Tr,Ti,L,C}

( 1 )

其数据元素为

ri={tr_i,ti,lm,cn}

( 2 )

式中:Tr为系统标识空间,其元素tr_i∈Tr代表系统的唯一标识,在实际中对应于系统所属的列车车次标识;Ti为数据时域空间,ti∈Ti代表系统数据记录时间;L为数据记录内容空间,lm∈L是系统数据记录内容,随系统型号不同而不同;C为数据记录内容属性空间,cn∈C是数据记录内容的属性,数据记录内容属性直接映射为系统运行状态,包括正常运行状态与故障类型,即有

C=Cfault∪Cnormal

( 3 )

其中

( 4 )

式中:cm为故障类型;M为故障类型总数。本文参照日常维护日志,将系统故障类型分为应答器接收模块(BTM)类、通信(NET)类等共12类。

而式( 1 )中L与C之间存在着映射关系Φ(·),表征数据记录内容与系统的运行状态之间的关系为

∀lm∈L:
[(∃cn∈C)⟹(Φ(lm)=cn)]

( 5 )

通过定义1,可以将不同格式、不同类型的数据进行统一化建模管理,并且在数据模型建立后,在数据模型的基础上,从不同类型的数据中提取与系统运行状态相关的信息。因此,给出列控车载子系统故障数据空间模型的定义。

定义2定义列控车载子系统故障数据空间模型为

∀ri∈R:
ifcn∈Cfault
thenri∈Rfault

( 6 )

式中:Rfault为列控车载子系统故障数据空间,同样,其也是一个四元组,为

Rfault={Tr_f,Ti_f,Lf,Cfault}

( 7 )

列控车载子系统故障数据空间包含了故障系统标识空间、故障数据时域空间、故障内容空间和故障属性空间,通过对故障数据空间的有效利用,能够快速定位故障的特征信息,为故障的分析与处理提供便利的条件。

根据式( 1 )定义的列控车载子系统数据模型,本文以某动车段2015年1月至2017年7月的某型号列控车载子系统日志数据为来源,对原始数据进行以数据清洗为目的的预处理,建立该时间段内的列控车载子系统数据模型,部分结果如表1所示。

表1 数据模型部分结果

根据列控车载子系统数据模型,本文通过式( 8 )计算了162套设备在928 d的每天故障次数,以此来评估该动车段系统群的故障分布态势,见图2。

( 8 )

由图1可以看出,从整体分布态势上看,列控车载子系统故障在不同的时间和车次维度上,故障的分布量差异较大,具有不均衡的特点。

在不同的系统及故障类型角度方面,不同的系统工作次数与工作时间也不尽相同,甚至差别很大,导致其故障频率也会有一定的差别,不同类型故障的分布也存在着较大的差异。另外,从不同的时间角度出发:系统故障次数与时间之间的关系具有不确定性,波动性较大,无明显的变化趋势。下面从故障的时空特性方面对车载系统的故障分布特征进行分析。

图2 故障分布态势

3 列控车载子系统故障时空分布特性分析

3.1 列控车载子系统故障物理空间分布特征

故障在物理空间上的分布特性一般体现在以下几个方面:故障发生的地点、故障发生的类型以及各个类型故障的分布情况。以列控车载子系统为研究对象,本文从两个方面对系统的故障物理空间分布特性进行分析:列控车载子系统故障车次分布特征和故障类型随车次的分布特征。

3.1.1 列控车载子系统故障车次分布特征

对列控车载子系统故障分布空间中的元素,以车次为类别在时间维度上进行求和,得到各车次发生故障的次数,并建立系统故障在发生车次的分布特征,见图3,可以看出,各车次开机运行次数不尽相同,且差异较大,且各车次发生故障的次数也不相同。但从故障频率分布来看,运行次数较多的大部分车辆故障频率处于一个较低的水平,有两个车次(2538和5530)的故障频率较高,在日常运营维护中应当加强对其的维护维修工作。对于运行次数较少的车辆,数据不能完全表征其运行的健康状态,在其生命周期中应加强对系统的监控工作。

图3 故障车次分布特征

3.1.2 故障类型随车次的分布特征

本文参照日常维护日志,将系统故障类型分为应答器接收模块BTM类、轨道电路信息接收模块STM类、通信COM类、测速测距单元SDU类等共12类。不同类型故障在系统中所占的比重也有所不同。本文经过对上述车载日志数据进行处理,以各类型故障随车次发生的次数为依据做出图4的热力图。

图4 故障类型随车次分布热力图

由图4可以看出,通信类、继电器类在大部分车次中发生次数较多,同时,BTM类故障的发生分布比较均匀,这几类故障可以归为常发故障。此外,可以看到测速测距类故障在两个系统(车次201和车次2521)中发生的次数远大于其他系统,应当加强对这两个系统的测速测距单元的故障分析。

3.2 列控车载子系统故障时间分布特性分析

3.2.1 系统群故障率时间分布特性分析

对2015年系统群每天运行次数及故障发生次数进行统计,得到系统群每日故障率随时间的分布,见图5。可以看出,系统群在2015年8月1日至2015年10月1日之间故障率较高,可能的原因之一是环境温度较高,导致系统工作状态受到影响。另外从全年系统群故障率来看,其波动起伏较大,说明系统工作的不稳定性较大,应当进一步加强对系统的维护检修工作。

图5 系统群每日故障率

3.2.2 系统个体故障数据时间特性分析

在铁路领域中,车载子系统的工作量一般以里程为计量单位,而对于连续运行的系统而言,以可靠性等为表征系统性能状态的指标体系中,一般是以时间为计量单位,故分析列控车载子系统故障时间特性对系统的可靠性评估与分析十分重要。

3.2.2.1 系统个体故障发生时间分布特性分析

本文选取2015年运行时间最长的系统2547车次,以月为时间单位,从列控车载子系统数据模型中对此系统的故障时间进行分析,结果见图6。由图6可以看出,所选取的系统故障发生的次数与时间没有明显的依赖关系,在运行次数较多的几个月里,系统的故障率在10%左右。有个别月的故障率偏高,原因是当月系统的运行次数较低,即使是故障率偏高,但是系统发生的故障次数也处于比较低的水平。

图6 2015年系统2547车次每月运行及故障分析

3.2.2.2 系统故障间隔时间分布特性分析

系统故障间隔时间是衡量系统可靠性的重要指标之一。由图4可知,通信类、继电器类在大部分车次中发生次数较多,本文选取2015年内故障较为频繁的4套系统(2507、2522、2526、2530),分别对其通信类故障和继电器类故障进行故障间隔时间的计算,并对其分布进行简单的核密度估计,与频率直方图做对比,结果见图7,可以看出,故障间隔时间概率密度拟合曲线随时间呈下降趋势,并趋于平稳,可见其所服从的分布可能是威布尔分布或指数分布。

3.3 列控车载子系统物理空间-时间分布特性分析

上文分别从物理空间和时间的角度对车载子系统的故障分布特性进行了分析,而对系统故障在物理空间和时间上的联合分布特性进行分析,能够更好地掌握不同故障在不同时间上的分布态势。本文选取2015年故障数据,对上文中12种故障类型每月的故障比重进行计算,得到故障的物理空间-时间分布特性见图8。由图8可以看出,通信类和继电器类故障比重较高,其他类型故障比重都处于比较低的水平。值得注意的是BTM类故障在2015年12月故障比重较高,应当对2015年12月BTM的工作状况进行分析,查找故障频发的原因,及时纠正,提高其工作可靠性。

图7 选取系统及相应故障的直方图与核密度估计

图8 故障物理空间-时间分布

对于大量系统的故障时空特性的分析,能够很好地掌握系统群中故障的分布情况,在维护维修策略的制定中能够有所侧重,同样,对于系统的可靠性评估而言,短时间内无法对全部系统进行有效的可靠性分析,通过对故障的时空特性分析,有利于选取典型的系统和部件,实行可靠性分析工作。

4 基于时空分布特性的列控车载子系统可靠性分析与验证

由上文的故障时空特性分析可知,通信类和继电器类故障较为频繁,且在2015年内4个车次的故障频率较高(分别是图7中的2507、2522、2526和2530)。故本文选取图7中的4个车次(2507、2522、2526和2530)的车载子系统通信类及继电器类故障作为研究对象进行可靠性分析。在可靠性领域,系统的寿命数据特别是电子系统的寿命数据分布大多符合指数分布或威布尔分布,结合图7的结果,本文选取指数分布和两参数威布尔分布作为待选分布,利用极大似然估计法对其分布进行拟合,并从两者中选取更合适的分布进行可靠性指标的评估。

极大似然估计法是通过找到一组参数,使得似然函数的值最大。指数分布和两参数威布尔分布的概率密度函数分别为

fe(t)=λe-λt

( 9 )

(10)

则两者的似然函数为n次抽样试验概率密度的乘积。

(11)

(12)

在计算中,对乘积多项式的最大值求解比较复杂,但是对似然函数取对数得到对数似然函数后,乘积多项式会转化为求和多项式,对其求解最大值会简单很多。对式(11)和式(12)两边分别取自然对数得到对数似然函数为

(13)

(14)

按照以下方法对4套系统各两个故障类型的故障间隔时间进行分布拟合,最终对可靠性指标进行评估。

基于时空分布特性的列控车载子系统可靠性分析方法为:

Step1根据时空特性分析结果选取典型系统、典型部件的故障间隔时间数据。

Step2选取指数分布,按照式(13)求解关于参数λ的对数似然函数。

Step3选取两参数威布尔分布,按照式(14)求解得到关于参数(α,β)的对数似然函数。

Step4利用极大似然估计法分别对指数分布和两参数威布尔分布的参数进行估计。

Step5利用k-s检验法对分布模型进行假设检验验证,根据k-s检验值与显著性水平选取最优分布模型。

Step6利用最优分布模型对可靠性相关指标进行分析。

表2列出了根据上述方法对所选取的4套系统各2个故障类型的参数拟合结果。其中,α、β分别为两参数威布尔分布的尺度参数和形状参数,λ为指数分布的参数,Dw和De分别为威布尔分布和指数分布的k-s检验法的检验统计量,其临界值为Dε,pw和pe分别是威布尔分布和指数分布统计检验的p值。威布尔分布拟合成立的条件是:Dw≤Dε且pw>0.05,指数分布拟合成立的条件是:De≤Dε且pe>0.05。

由表2可以看出,所选的4个系统各2种故障的故障时间间隔对威布尔分布的统计检验均成立,说明其均符合两参数威布尔分布。但是对指数分布而言,只有2057-通信和2530-通信的故障间隔时间的统计检验成立,其他均不符合指数分布,故选取威布尔分布为最优分布模型。

表2 参数拟合结果

平均故障间隔时间MTBF是指系统相邻两次发生故障的间隔时间平均值,是衡量系统可靠性的一个重要指标。在符合威布尔分布的前提下,其计算公式为

(15)

式中:Γ为Gamma函数。将表2中威布尔分布拟合参数带入式(15),得到各个平均故障间隔时间如表3中MTBF列所示。可以看出,对于同一类型故障,其故障间隔时间在各车次之间有一定的差距,通信类故障的MTBF最长约为328 h,最短约为164 h,继电器类故障MTBF最长约为257 h,最短约为137 h。对于同一个系统而言,其通信类故障MTBF均高于继电器类MTBF。

表3 平均故障间隔时间

另外一个系统可靠性的分析指标是系统的故障率,故障率函数的计算公式为

(16)

上述4套系统的通信类和继电器类故障率曲线分别见图9和图10。

图9 通信类故障率

图10 继电器类故障率

对于通信类和继电器类故障而言,所选取的4套系统的两类故障率在初始时间具有明显的下降趋势,然后均趋于平稳,说明选取的4套系统通信类和继电器类设备均处于早期故障期和偶然故障期。

系统的可靠度计算公式为

(17)

分别对各车次通信类和继电器类的可靠度进行计算,计算结果见图11和图12。

在所选4个车次中,2526车次通信类和继电器类可靠性均下降最快,而2522车次通信类和继电器类可靠性下降最慢。2526、2522、2530、2507车次的4套系统通信类的可靠度下降到50%时的时间分别大约是:150、250、250、200 h,继电器类可靠度下降到50%的时间分别大约是:70、120、120、110 h,此结果也证明了上文中两类故障率的对比结果。

图11 通信类可靠性

图12 继电器类可靠性

上文分析了同一类型可靠性在不同车次的变化趋势,本文对2502车次的车载子系统通信类、继电器类和整个系统的可靠度进行分析,见图13。

图13 2502车载子系统可靠性

从图13中可以看出,在2507车次载子系统中,通信类的可靠度要高于继电器类可靠度,对于整个系统来说,由于车载子系统不仅仅包含通信类和继电器类设备,故整个系统的可靠性必定会低于通信类和继电器类的可靠度。针对车载系统的维护要综合考虑不同设备故障类型对可靠性的影响,以可靠性最低的设备为参考建立合适的维护维修策略,才能更大程度上提高车载子系统运行的可靠性。

5 结束语

本文研究了高速铁路列控车载子系统故障时空特性的问题。考虑到高速铁路列控车载子系统数据记录具有不确定性和不完整性等特点,本文提出了列控车载子系统数据模型的概念,并针对某动车段某型号列控车载子系统建立其数据空间模型,分析其故障态势分布及系统故障时空特性。

从物理空间分布特性角度,本文分别从故障发生的物理空间、类型及故障随系统的分布特征出发,对故障发生的物理空间特性进行分析,结果表明有两个车次(2538和5530)的故障频率较高,同时发现通信类、继电器类、BTM类和测速测距单元类故障发生比例较大,在日常维护中应当加强对相应车次系统和相应类型设备的维护维修工作。从时间分布特性角度,本文分别从系统群和系统个体相关数据的时间分布特性进行分析,发现系统群每日故障率在8—10月期间较高,且全年波动较大,系统个体故障发生次数与时间没有明显的依赖关系。对几个特定系统特定故障类型相关的可靠性进行分析,所选择的几个系统的特定故障的故障间隔时间符合威布尔分布,各故障类型对应的可靠性在不同车次中存在差异,对于同一车次的可靠性分析要综合考虑不同设备故障类型对可靠性的影响。

猜你喜欢
列控车次车载
调度集中系统车次号技术的研究
一种车载可折叠宿营住房
动车所车次号处理逻辑存在问题分析与对策
列控联锁数据管理分析平台的研究与探索
高速铁路列控系统工程数据编制常见问题浅析
列控中心驱采不一致分析及改进方案
Folic acid attenuates high-fat diet-induced steatohepatitis via deacetylase SlRT1-dependent restoration of PPARα
便携式列控中心测试设备设计与实现
高速磁浮车载运行控制系统综述
奔驰S级48V车载电气系统(下)