付文秀,周晓勇,李弘扬,郭 毅
(1.北京交通大学 电子信息工程学院,北京 100044;2.中铁通信信号勘测设计院有限公司,北京 100071)
列车车载ATC 设备是控制列车运行安全与效率的核心设备.若列车车载ATC 设备发生故障,将极大的影响列车的运行效率.因此,及时诊断出列车车载ATC 设备的故障,成为了研究重点.
故障诊断通常可以分为三类,即建立分析模型诊断方法、专家经验诊断方法以及智能数据驱动诊断方法[1].尽管故障诊断方法多种多样,但是,将合适的故障诊断技术应用于列车车载ATC 设备的故障诊断显得更具有实际意义[2-3].由于车载设备结构的复杂性不利于构建具体的数学分析模型,专家经验诊断方法以及智能数据驱动诊断方法在车载设备故障诊断中应用较为广泛.
文献[4-5]根据实际维护中的专家经验分别对CTCS2-200C 车型和CTCS3-300T 车型上的列控车载BTM 设备故障数据进行了分析.文中阐述了车载BTM 设备常见的故障现象,并分析了故障原因,得出对BTM 设备故障的处理意见与预防措施.但是,专家知识依靠人工经验,存在覆盖面不完全的风险.
文献[6]将地铁车载ATP 设备作为研究对象,结合故障数据统计结果与SA-BP(Simulate Anneal-Back Propagation)神经网络,建立故障诊断模型,并进行了模型验证.文中对车载ATP 设备的故障诊断进行了研究,但是只考虑了紧急制动情况下的ATP 故障,故障现象考虑比较单一.文献[7]将车载设备故障诊断问题转化为了数学问题,利用小波网络对BP 神经网络进行了优化,但是优化之后的BP 神经网络存在局限性,仅解决了13 号线地铁车载设备的故障诊断预测问题.
一个问题的复杂度与输入样本的数量和维度均相关,多特征问题本身样本维度较大,若样本数量过大,计算将更加复杂.车载ATC 设备结构复杂,子设备众多,故障特征多样化.支持向量机SVM 是一种先进的小样本学习方法,计算的复杂性主要取决于支持向量的数量.因此,根据SVM的这一特点,寻找车载ATC 设备故障样本中的支持向量,并利用支持向量对样本进行分类诊断.
根据车载ATC 设备的故障特点以及SVM 的优势,本文作者采用了一种基于粒子群算法改进的支持向量机(PSO-SVM)故障诊断算法.基本思路是:通过对车载ATC 设备的历史故障记录表进行分析,根据专家经验得到历史故障数据集,利用粗糙集理论对故障数据特征集进行约简,得到约简属性集;通过训练集,对PSO-SVM 进行训练,建立故障诊断模型;最后,利用广州某地铁线路车载ATC 设备故障历史数据,对模型进行验证分析.
地铁车载ATC 设备子模块众多,需要较高的安全性. 设备主要由列车自动驾驶系统(Automatic Train Control,ATO)、列车自动防护 系 统(Automatic Train Protection,ATP)、列车接口单元(Train Interface Unit,TIU)、列 车 无 线 单 元(Train Radio Unit,TRU)、应 答 器 收 发 模 块(Balise Transceiver Module,BTM)、本地通信单元(Local Communication Unit,LCU)、光脉冲测速传感器(Optical Pulse Generator,OPG)等组成,结构如图1 所示.
图1 地铁车载ATC 设备结构Fig.1 Structure of ATC equipment on subway vehicle
分类问题一直是机器学习研究中的热点问题之一,支持向量机作为强分类器,相比其他的机器学习方法,具有较多的优势.支持向量机的目标是解决一个凸二次规划的问题,并且得到的该二次规划问题的解一定是唯一的解.支持向量机是通过最大化两个不同类之间的间隔,求出最佳超平面的模型,是基于结构最小化模型,而不是经验风险最小化模型[8].
粗糙集理论是处理模糊和不确定问题的数学工具[9].利用粗糙集理论对原数据样本进行属性约简,可以不改变原有样本的分类能力,并且有效的减少了故障诊断的时间,提高了故障诊断的能力.
从数学角度看,粗糙集的研究对象是一个集合,可以表示为一个四元组:IS={U,A,V,f},其中U代表论域,即研究对象集合;A是条件属性C与决策属性D的交集,即A=CD;V是属性值A的值域集合;f表示论域中的每个对象与其属性的映射关系.假设任取B⊆A,E⊆A,当U/IND(B)=U/IND(B-E)仍成立时,则E为冗余属性,可以被约简,而最大集合B与U存在不可辨识关系(等价关系).由此,可以使用约简后的最大集合B作为研究对象.
当前,列车车载ATC 设备的故障主要由现场工班维修人员记录在设备检修记录表中,最后这些记录被汇总到历史故障记录表中.分析广州某线2017—2018 年的故障数据,统计归纳出车载ATC 故障如图2所示.
图2 2017—2018 年数据统计信息Fig.2 Data statistics in 2017—2018
本文只研究车载ATC 设备信号设备的故障,不研究非信号类故障.因此,可以构建故障类型表如表1所示.
表1 故障类型Tab.1 Fault types
现场汇总的历史故障数据表,虽然没有统一的格式,但是依旧存在一些共有的特征词汇可以辨别.以2017 年5 月24 日故障信息为例,其内容为:“列车回厂后下载数据查看ATP-S 系处于脱机状态,检查27 车ATP-S 系 的ATP-IO 板状态,发现ATP-IO 板灯位显示异常,判断为ATP-IO 板故障,更换后恢复正常.”其中,“ATP-IO 板状态”为该文本的关键词汇,选取该词汇为特征词汇.按照此方法,分析404 条文本信息,可以构成特征词汇表,如表2 所示.
表2 故障特征词汇Tab.2 Fault feature glossary
从历史故障数据记录表中提取出的特征词汇表只能反应该特征词汇在记录表中的出现频率较大,但是不能体现该词汇在记录表中的重要程度,且不能区分相近词汇,因此使用词语逆频率(Term Frequency-Inverse Word Frequency,TF-IWF)方法表征词汇在记录表中的权重大小[10-11],即重要程度.
式 中:TFi,t表示 词 语i在文本t中的频 率;IWFi表 示词语i在整个词汇库中的频率倒数取对数,表示区分程度,出现次数越少,区分程度越高;ni,t为词语i在文本t中出现的次数;∑k nk,t为所有词语的次数之和;∑i=1m wi为所选词语出现的次数之和;wi为词语i在所选词语中出现的次数.
作为示例,使用“ATP-IO 板状态”特征词汇进行计算,根据上述文本,ATP-IO 板状态在上文中出现1 次,文本共有词汇23 个,分词技术得到的所有文本词汇总数为14 544 个,总文本中该词汇出现次数为13 次.因此,代入式(1),可以得到“ATP-IO 板状态”的权重为0.305 1,为了后续粗糙集的处理,本文采用倍乘的方法得到倍乘后的权重为0.610 2,得到权值决策表,如表3 所示.
表3 故障属性决策表(a)Tab.3 Fault attribute decision table (a)
表3 故障属性决策表(b)Tab.3 Fault attribute decision table (b)
表3 故障属性决策表(c)Tab.3 Fault attribute decision table (c)
粗糙集处理离散型属性,因此需要对故障属性决策表进行离散化处理.将重要度分为两个等级,分别为0 和1,采用四舍五入的方法将决策表离散化,构建离散权重表,如表4 所示.
以故障数较少的TIU 故障说明属性约简方法.根据TF-IWF 方法可以得到的TIU 故障的权重矩阵为
矩阵中,行代表文本,列代表不同的特征词汇.将信息相同的对象删除,由此得到压缩后的信息矩阵.
表4 离散化故障属性决策表Tab.4 Discretized fault attribute decision table
据此,删除冗余属性得到如下矩阵
代入属性项,得到最小约简矩阵
因此可以将TIU 故障的属性约简为{F1,F14},依此办法,可以得到各故障类型的属性约简如表5 所示.
表5 属性约简结果Tab.5 Attribute reduction results
对约简属性取并集,表2 的属性约简结果为{日志中断,等级切换,BTM 紧制,位置紧制,ATO紧制,联锁紧制,ATP-IO 板状态,OPG 速度异常,雷达速度异常,SRP 切换,BTM 切换,主从系切换,SRP 错误,LCU 错 误,ATO 激 活,空转打 滑,OPG 通道异常,雷达通道异常,天线强度异常,ATO 通信异常,速度传感器供电故障,测速雷达供电故障,LCU 供电故障,BTM 供电故障}.通过粗糙集约简,将原有的29 个特征词汇约简为24 个,减少了冗余输入量.同时,属性决策表,其中包含了各属性对故障类型的关联关系,这些关联关系表征了故障类型与各个故障特征之间的离散关系,与构建数据集的方式类似.因此,本文使用生成的离散化后的决策属性表可以作为后续模型训练的数据集.
构建拉格朗日函数,将最小化模型对偶化并选择合适的核函数[12],模型转化为
式中:γ为高斯径向基参数,是高斯核函数中的唯一参数,其影响着样本空间中的数据从低维到高维的映射效果,并最终影响故障诊断的效果.同时,惩罚系数C也影响着最终的诊断效果.因此,本文将粒子群算法应用到寻找最优的参数C和γ.将样本代入SVM 的决策函数,可以得到样本的回归估计值ŷ.因此,将粒子群算法的适应度函数取为可以直接反应SVM 性能的均方差
当群体终止迭代之后,将种群最优的位置映射到SVM 中的C和γ.
粒子群算法的寻优具体流程如下:
1)初 始 化 粒 子 群(C,γ),确 定 群 体 规 模sizepop,给定算法最大迭代数pso_option.maxgen.
2)将每个粒子的个体极值local_fitness 设置为当前位置,利用适应度函数计算适应度,取适应度最好的local_fitness 作为全局极值global_fitness.
3)更新粒子的速度和位置.
式中:c1是自我学习因子;c2是社会学习因子;r1和r2为 随 机 数;xtid和vtid为 粒 子i在 第t次 迭 代 时d维的位置和速度;ω为惯性权重;ptid为粒子i在d维 的粒子个体极值位置;ptgd为种群在d维的全局极值位置.
4)评价每个粒子的适应度.
5)将每个粒子的适应度值与其local_fitness 做比较,若优则更新.
6)将更新后的每个粒子的个体极值local_fitness 与global_fitness 比 较,若 优,则 更 新global_fitness,否则保留原值.
7)判断是否满足终止条件,若达到最大迭代次数或所得解不再变化,则终止迭代,否则继续返回步骤3).
PSO 算法伪代码如下:
因此,模型的整体构建流程如图3 所示.
从代码中可以看出,c1和c2是粒子群算法的两个重要参数,它们的好坏决定了全局最优解的好坏,分别使用3 种方式调节学习因子以优化学习因子参数.
图3 PSO-SVM 模型流程图Fig.3 Flowchart of PSO-SVM model
1)收缩学习因子
式中:φ为学习因子调节参数;c为学习因子.
2)异步学习因子
式中:cstart,cend均为学习因子;T为设置的最大迭代次数.
3)同步学习因子
式中:cmax,cmin分别为学习因子最大值和最小值.
本文研究的是多分类问题,对于多分类问题,每个分类标签都可以求出各自的准确率,但是各自的准确率不足以反应全数据的分类情况,也就难以对比不同分类方法的优劣.多分类问题的评价指标一般可以采用宏平均法(Macro Average)和加权平均法(Weighted Average),宏平均法适用于各标签类数据均衡的情况,而加权平均则更适合数据非均衡分布的情况.根据本文多分类问题,以及数据分布的情况,本文采用加权平均法来评价模型的分类效果.
文献[13]介绍了通过F1_score 求取加权平均的方法.公式为
式中:P为模型的精确率;R为模型的召回率.推出模型的加权平均为
式中:Fi为类别i对应的F的值;Pi为该类别在模型正确的预测值中所占的比例;n为类别的总和.
为了体现本文建立的算法模型的稳定性,使用各算法模型进行30 次试验,根据概率论理论基础中的平均值、极差、标准差等参数,对试验结果进行评估.
故障原始样本集来源于广州某地铁线路车载ATC 设备故障历史数据,经过数据挖掘,约简样本总数为404 条,其中故障特征为24 项,故障类型为8 项.模型选用70%的样本作为训练集,30%的样本作为测试集.本文先对粒子群算法中不同的学习因子进行评估,得出较为合理的调节方法,并得到最佳惩罚函数参数与高斯径向基参数;其次,对SVM、PS0-SVM、神经网络3 种模型分别进行30 次故障准确率试验并进行对比分析.
测试环境:处理器Intel Core i5,主频2.3 GHz,电脑内存4 GB,WINDOW10 x64 操作系统,模型使用Matlab 矩阵实验室软件建立.
选取粒子群种群数量为20,最大终止迭代数为50,种群数量为20,分别选取合适的c1和c2的初始值,对不同的学习因子调节方式进行评估,如图4所示.
同步学习因子调整方式,粒子收敛速度适中,适应度较好,选用同步学习因子调整方式.迭代次数t=15,粒子群收敛,由公式可以计算出此时的最佳c1=c2=0.54,得出最佳适应度下的最佳惩罚函数C=2,γ=0.5,并得出该次试验中的加权平均故障准确率为92.150 2%,如图5 所示.
图4 不同因子适应度曲线Fig.4 Curves with different learning factor fitness
本文在确定PSO-SVM 的两个最佳参数的基础上,使用未约简的数据集对SVM 模型进行训练,同时利用相同的约简后的测试集和验证集,分别对SVM、PSO-SVM 以及常见的神经网络模型进行了训练验证,并使用加权平均故障准确率进行对比评估,得到如图6 所示结果.
由图6 可知,使用约简数据集训练SVM 模型的效果稍优于使用未约简数据集SVM 模型.同时使用约简故障数据集,相较于SVM 算法,PSO-SVM 算法显然在故障诊断准确率上表现更加优异,而神经网络与PSO-SVM 在数据显示上相差不大.为进一步对比各模型的优劣,对30 次试验的故障诊断率数据分析,并使用TOC 函数记录模型的训练测试时间,如表6 所示.
图5 SVM 参数选择结果(等高线图)Fig.5 SVM parameter selection results
表6 模型试验结果数据分析Tab.6 Data analysis of model test resuls
图6 加权平均故障率结果Fig.6 Weighted average failure rate result
由表6 可以看出,数据约简对模型的准确率略有提高,但提高幅度较小,但是在训练测试时间上,使用约简后的数据集优势更大.同时,改进后的SVM 算法模型对故障诊断的效果有了较大的提高,多次试验后的极差与标准差要小于神经网络模型,说明稳定性方面优于神经网络模型.
由此,验证了本文利用PSO 对SVM 算法改进的可行性与有效性.
1)采用了一种基于改进粗糙集理论和PSO 算法优化SVM 模型的地铁列车车载ATC 设备的故障诊断方法,分别对3 种PSO 算法的学习因子调节方式进行评估,并得出最佳的SVM 模型参数,最后使用未约简的数据集对SVM 模型进行训练与测试,同时使用约简后的故障数据集对SVM、PSO-SVM 和神经网络模型行训练与测试.
2)由测试结果可以得出:约简后的数据集可以提高故障诊断的准确率以及提高模型训练的效率.相较于其他的模型,本文使用的PS0-SVM 模型对原有模型进行了优化处理,并且相较于神经网络模型,PSO-SVM 模型得出的故障诊断准确率高,故障诊断的稳定性也更加好,在地铁列车车载ATC 设备的故障诊断中有一定的借鉴意义.