基于改进支持向量域描述的道岔转辙机运行状态异常检测

2019-07-29 06:01王君臣徐田华
铁路计算机应用 2019年7期
关键词:转辙机道岔因数

王君臣,徐田华,陈 聪

(北京交通大学 轨道交通控制与安全国家重点实验室,北京 100044)

随着中国铁路的飞速发展,给人们的出行带来便利的同时,也给铁路各相关部门带来巨大的维护压力。转辙机是保障行车安全,改善劳动强度,提高行车效率的铁路信号系统的关键设备。一旦转辙机发生故障,轻则导致列车晚点,影响行车效率,重则导致列车挤岔或脱轨,危及行车安全,造成财产损失和人员伤亡[1]。

液压道岔转辙机[2-3]在实际运行过程中会受到滑床板异常、道岔尖轨爬行、锁闭框不够方正、油缸渗油、节点老化等异常事件影响,这些异常事件可能当时对道岔运行影响不大,道岔能转换到位,缺口、表示都正常。但是此时转辙机处于亚健康状态,运行时间一长就会导致道岔故障的发生,因此对道岔设备的运行状态进行异常检测具有很强的必要性。

传统的异常检测工作主要由现场维护人员定期浏览微机监测采集到的道岔转辙机运行数据,并在现场对运行中的道岔进行检测与维护,从而确定道岔的运行状态。这种方法给现场维护人员造成极大负担,并常常导致漏判和错判,为列车安全运行带来巨大隐患。

目前,国内外许多学者对道岔转辙机进行研究。例如赵林海等人[4-5]对道岔转辙机典型故障下的功率曲线进行分析,提出了一种基于灰关联的道岔故障诊断方法。文献 [6-8]用专家系统的方法构建道岔转辙机的故障诊断模型。H Kim等人[9-10]用动态时间规整的方法来对道岔转辙机进行故障诊断。钟志旺等人[11]提出了基于支持向量数据描述(SVDD)的道岔转换故障检测和健康指标评估方法。但是他们的研究重点在于检测出故障模式,忽略了道岔转辙机的异常状态。

针对道岔转辙机运行过程中产生的数据大都是正常数据,异常数据缺乏的情况,提出采用改进的支持向量域描述的方法进行异常检测。SVDD算法[12]是找到一个超球面,包含尽量多的正常点,而其半径尽量小,落在这个超球面以外的都是不正常的点。但是,该算法从支持向量机理论的基础上来说是有损失的,它的目标函数中缺少了使分类间隔尽量大这个条件,而这个条件恰恰是统计学习理论结构风险最小化的体现,因此该算法的推广能力一般。文献[13]提出一种新型的支持向量描述算法,通过引入变量ρ很好地提高了算法的推广能力。本文将该方法应用到道岔转辙机运行状态的异常检测中,实验表明,具有较高的异常识别率,满足电务部门的应用需求。

1 功率数据采集、清洗与分段

1.1 道岔功率数据采集

转辙机的功率数据不仅体现三相电流电压值的大小,同时也包含它们的相位角大小,因此相对于电流曲线而言,功率曲线反映的信息更多,也更接近于道岔转辙机运行过程中实际克服的阻力变化。

转辙机功率数据是由三相交流转辙机功率采集单元采集而来的。采集单元在1QDJ吸起时开始工作,每隔40 ms采样一次三相电流电压数据,经过计算得出瞬时功率数据,在1QDJ落下时结束工作。正常的道岔运行一次的功率曲线,如图1所示。

图1 ZYJ7转辙机正常时功率曲线

1.2 道岔功率数据清洗

转辙机设备在长期运营过程中,会产生一批“脏”数据。例如:(1)因系统断电重启采集系统异常而产生的非数字数据;(2)在维修过程中维护人员做卡缺口试验而产生的数据;(3)因道岔转换不到位出现回操现象的数据;(4)控制电路故障而产生的数据。这些数据要么是人为产生的故障数据,要么不能反映道岔的运动状态。因此在建立模型之前需要对对这些数据进行清洗。

以广州铁路集团长沙站15#道岔2014年9月~2015年1月的1 000组转辙机功率数据为例,提取每组数据道岔锁闭、1QDJ即将落下的时间点T。统计参数T,其分布如表1所示。

表1 15#道岔转辙机时间T的分布

对T>8.08 s的数据分析发现,这些数据可分为两类:(1)道岔转换不到位回到原位的;(2)道岔卡缺口曲线。因此,数据清洗中可以把这两类数据清洗出来,存入到故障数据库。还需把重复数据和全为零的数据清除,数据清洗流程,如图2所示。

1.3 道岔功率数据分段

当转辙机带动道岔尖轨从定位移动到反位时,其可以分解为3个过程:定位解锁、转换、反位锁闭。

解锁:三相异步电机启动后,锁闭杆内锁闭解锁切断原表示,锁闭杆移动带动锁闭杆凸台滑入锁钩缺口,完成外锁闭解锁,如图3中的a~b。

转换:动作杆继续移动,通过尖轨连接铁和锁钩带动原斥离轨和密贴轨同时在滑床板上移动,直到原斥离轨和基本轨密贴,如图3中的c~d。

锁闭:原斥离轨与基本轨密贴后,锁闭杆继续移动,锁闭杆凸台顶起锁钩,道岔外锁闭装置完成锁闭,切断三相动作电路,接通表示电路,如图3中的e~f。

图2 数据清洗流程

图3 道岔解锁、转换、锁闭的开始和结束时动作杆的状态

由上面分析可以知道,解锁和锁闭这两个过程大致互为对称关系,所以这两个过程所消耗的时间也基本相等。

道岔功率数据可以表示为确定的一维时间序列Xt,Xt={xt, t=1, 2,…, n}。

图4 正常曲线和卡缺口曲线对比

图5 功率曲线分段

图4中,红色为正常曲线,蓝色曲线为道岔卡缺口曲线,即卡4 mm异物道岔不能锁闭。图中蓝色曲线在t=[12 s, 14 s]的第1个下降沿为4 mm异物消失引起功率的变化,第2个下降沿为道岔锁闭完成引起的。由此可以得出,道岔的锁闭时间约为0.8 s,解锁时间也约为0.8 s。

电机的启动时间在0.6 s左右,因此可以将序列Xt按时间提取其解锁、转换、锁闭3段X1、X2、X3,Xi={xi1, xi2, …, xin},i=1, 2, 3, 功率曲线分段,如图5所示。

2 特征提取与降维

2.1 特征提取

道岔功率数据是具有维数高、变长度、结构复杂等特点。如果直接对原始的功率数据进行异常检测,需要面临巨大的计算量,且检测效率低,因此需要对原始数据进行特征提取和降维。

目前,信号的时域统计特征由于计算简单而常用于设备的状态监测中,有量纲的统计指标有均值、幅值、峰峰值以及均方根值;无量纲的统计指标有偏斜度峭度、峰值因数、波形因数、脉冲因数等,其中,偏斜度可以表示信号偏离正态分布的程度,而峭度、峰值因数、波形因数和脉冲因数在一定程度上反映出振动信号是否含有冲击成份,并且脉冲因数对于冲击类故障比较敏感。因此,分别对序列X1, X2,X3提取均值、幅值、峰峰值、均方值、偏斜度、峭度、峰值因数、波形因数和脉冲因数这9个指标为特征。

2.2 特征降维

机器学习的降维方法主要有主成分分析、奇异值分解法、因子分析法等。主成分分析也称主分量分析,把多指标转化为少数几个综合指标(即主成分),其中,每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。

假设 l个 n 维数据 Xi=(x1, x2,…, xn),i=1, 2, …, l已经进行了中心化,即原坐标系经过坐标变换后得到的新坐标系为(w1, w2,…, wn),其中,wi是标准正交基,即

如果将数据从n维降到m维,即丢弃新坐标系中的部分坐标,则新的坐标系为(w1, w2,…, wm),数据Xi在m维坐标系中的投影为Zi:Zi=(z1, z2,…,zm),其中,zj是xj在低维坐标系里第j维的坐标,

对于任意一个样本Xi,在新的坐标系中的投影为WTXt,在新坐标系中的投影方差为WTXiXTiW,要使所有的样本的投影方差和最大,也就是最大化即:

利用拉格朗日函数求解式(1)可以得到式(2)。

则主成分分析的计算流程如下:

(1)对所有样本进行中心化处理;

(2)计算样本的协方差矩阵XXT;

(3)求解协方差矩阵的特征值λ和特征向量v;

(5)将原始样本投影到新坐标系下,得到新样本为 Yk=(y1k, y2k, …,ymk)T。

表2显示了对序列X1,X2, X3经特征提取后得到的特征集分别采用PCA算法进行降维分析所得出的前6个λ值的分布情况,设定累积贡献率为80%,则只需要取前2个主元λ1和λ2,前2个主元的累积贡献率分别达到了87%,89%,87%。

表2 经PCA计算得到的前6个λ值

3 改进 SVDD算法

3.1 SVDD算法原理

设训练样本集X={xi|i=1, 2,…,n},支持向量域描述方法是在高维特征空间中寻找一个以R为半径,a为圆心的超球体Ω。为增强算法的鲁棒性,引入松弛因子ξi≥0,i=1, 2,…,n,满足mercer条件的核函数K(x,y)=〉φ(x), φ(y)〉,这样,算法可以描述成优化问题,如式(3)。

其中,C为控制参数,用于调整最小超球体和数据误差之间的平衡。该问题的对偶形式为式(4)。

3.2 改进的SVDD算法

目前,支持向量域描述算法从支持向量机理论的基础来说是有损失的。由于它们在目标函数中缺少了使分类间隔尽量大这个条件,而这个条件恰恰是统计学习理论中结构风险最小化的体现,因此目前超球面支持向量机算法的推广能力有限。

为了解决SVDD算法的推广能力,引入变量ρ,则新分类超球面,如图6所示。

图6 最优超球面

该算法的优化问题描述如式(5):

其中, y1=±1,采用拉格朗日算子法求解该问题,即:

其中,α1, β1和 σ都是拉格朗日因子, 并且α1≥0, β1≥0和σ≥0。求解式(6)的偏导数,得:

将式(7)带入到式(6)中,引入核函数,得到其对偶表达式,即:

4 实验分析

以长沙站15#道岔2015年3~5月的道岔功率数据为例,经过数据清洗后得到300组样本数据,其中,运行正常数据200组,解锁异常40组,转换异常30组,锁闭异常30组。样本数据,如表3所示;异常曲线,如图7所示。

表3 训练和测试过程中各算法的样本选择数

在表3中,算法A表示最近邻算法,算法B表示支持向量域描述算法,算法C表示改进后的支持向量域描述算法。

图7 道岔运行曲线

在实验过程中,将样本分为两部分:(1)用作训练;(2)用于测试。样本具体选择数量,如表3所示。算法B和算法C中的核函数均选择径向基函数,即 :

其中,在二分类问题上,将样本的真实类别与机器学习得到的类别的组合分为真阳例(TP),假阳例(FP),真阴例(TN),假阴例(FN)4种情形,令TP,FP,TN,FN分别表示其对应的样本数,因此可以得到准确率真阳率假阳率实验结果,如表4~6所示。

表4 解锁阶段3类算法的比较

表5 转换阶段3类算法的比较

表6 锁闭阶段3类算法的比较

以测试样本到分类界面的距离d(d≥0)为变量,画SVDD算法模型和改进SVDD算法模型的ROC对比曲线,如图8~10所示。

图8 解锁阶段两算法的ROC曲线对比

图9 转换阶段两算法的ROC曲线对比

从实验结果可以看出,KNN算法对正样本能准确识别,但容易将异常样本判断为正常样本,这对于铁路设备安全是不能容忍的。SVDD算法能够完全识别出异常样本,但是由于本身算法的局限性,容易对正常样本判断为异常,虚警率较高。从ROC曲线看改进算法的性能明显好于原算法,且能完全识别异常样本,而且需要的训练样本数也少于SVDD算法,虚警率分别只有8.3%,6.2%和4.4%,能满足铁路维护的需求。

图10 锁闭阶段两算法的ROC曲线对比

5 结束语

本文在研究道岔运行原理的基础上,对功率数据按照解锁、转换、锁闭进行分段处理,分别选取均值、幅值、峭度、波形因数等时域特征,并用主成分分析法对特征进行降维处理,分别对解锁、转换、锁闭建立异常检测模型。通过实际采集的数据对算法进行了实验验证,结果表明,改进的支持向量域描述的算法完全能满足现场维护人员的需要。

猜你喜欢
转辙机道岔因数
因数是11的巧算
“积”和“因数”的关系
模块化电液转辙机的设计与实现
一种新型交流转辙机控制电路在地铁中的应用
S700K-C转辙机防水解决方案探讨
铁路车站平行进路带动道岔联锁控制优化方案
计算机联锁系统带动道岔选路存在问题及改进措施
联锁表的带动道岔、防护道岔设计方法
中低速磁浮道岔与轮轨道岔的差异
S700K转辙机接点组改造过程控制和研究