吕坦悦,陆小敏,王 健
(1.南通河海大学海洋与近海工程研究院,江苏 南通 226300; 2.河海大学计算机与信息学院,江苏 南京 210098)
地铁车辆作为城市轨道交通的核心组成部分,其车辆拥有不同的配置,子系统部件众多,且来自不同设备投标人的维修工艺复杂,每辆车在使用全寿命周期中需要经历多个修程以保证运行的可靠性和安全性。目前的轨道交通系统对地铁主要采取计划修和故障修相结合的方式,同时在检修过程中依赖人工经验对地铁的部件进行健康评估和保养维修,以此提升地铁的安全系数。但是这种基于人工经验的计划修和故障修难度较大,耗时较长,成本较高,不利于提高经济效益。
20世纪90年代末以来,随着信息技术突飞猛进的发展和广泛应用,综合诊断系统逐渐向监控、诊断、预测和维修一体化的方向发展。1992年,Khoshgoftaar等人[1]利用自动训练的神经网络测定系统故障的变化趋势,实现对健康状态的预测;2000年,Bunks等人[2]利用隐马尔科夫知识对直升机关键部件构建模型,实现故障和剩余寿命的预测;2006年,Pérez-Miana等人[3]首次在状态预测中引入贝叶斯网络方法。
在上述基础上,人们又利用决策树和层次分析法对一些特定物体和现象进行了预测。徐旭冉等人[4]通过决策树算法以及大规模的训练数据集建立空气质量预测模型,其收敛速度快、精度高。司巧梅[5]提出了基于决策树的农业气象灾害等级预测模型,采用决策树C4.5分类算法,建立了农业气象灾害等级决策树预测模型。冯文婧等人[6]利用层次分析法提出了航天器健康评估体系分级构建思想,实现各故障模式对航天器系统、单机设备影响的量化和分析。蔡文嘉等人[7]采用层次分析法,选择特征量指标,依据专家意见,构造指标判断矩阵,通过计算变换将智能电能表的供货优先级形成评价性指标。但这些方法只是从单方面解决问题,其鲁棒性较差。
本文将同时采用决策树[8-11]和层次分析法[12-16]对地铁车辆整体进行健康评估,提出利用神经网络蒸馏的软决策树定性地判断地铁车辆是否为健康状态,利用层次分析法通过专家打分和权重计算定量地评估地铁车辆健康状态的具体分数,从定性、定量2个角度实现对地铁车辆健康状态的宏观评估与把控,为后期调整与制定地铁检修计划做准备,同时有利于地铁检修方式从计划修向状态修的转变。
神经网络已被证明是执行分类任务中一种非常有效的方法。当输入是高维数据、输入与输出间关系复杂,且有大量标注训练样本时,神经网络的性能极其优异。所以本文采用Frosst和Hinton[17]提出的使用训练好的神经网络创建一种软决策树的方法。
该算法步骤为:将地铁的部件系统包括PIS系统、转向架系统、制动系统、车体系统、牵引系统、车门系统、车钩系统、内装系统、空调系统、火警报灾系统、照明系统的健康分数,构成向量x={x1,x2,…,xL},作为模型的输入向量来训练网络模型,可得到地铁为健康或非健康的概率,公式为:
pi(x)=σ(xwi+bi)
(1)
其中,wi和bi分别为每个内部节点i的权重和偏置,σ为sigmoid激活函数,则每一个内部节点i选择左边分支的概率为:1-pi(x)。因此,可以得到一个简单的、静态的关于地铁状态为健康或是非健康的输出类k的分布,公式为:
(2)
其中,Ql表示在第l叶子节点的概率分布,αl表示第l叶子节点的学习参数。其包含内部节点和叶子节点的具体软决策树简单案例如图1所示。
图1 具有单个内部节点和2个叶子节点的软二元决策树示意图
本文采用交叉熵损失函数训练网络模型,如式(3):
(3)
其中,pl(x)为根节点到叶子节点的路径概率和,T为地铁健康状态的实际值,Ql为网络模型的实际输出值。最后,通过误差进行反向传播,不断优化网络模型。
本文使用训练好的神经网络构建一种软决策树(Soft Decision Tree)的方法,这种决策树相比从训练数据中直接学习的网络能够更好地泛化。
地铁车辆是一个复杂的机电一体化设备,其包含的子系统子部件众多,为了构建真实反应地铁车辆情况的层次分析模型,本文从评价指标的完整性、独立性、真实性入手,将地铁车辆划分成11个部件系统:PIS系统、转向架系统、制动系统、车体系统、牵引系统、车门系统、车钩系统、内装系统、空调系统、火警报灾系统、照明系统。考虑到部分子部件数据无法收集的情况,本文没有将层次分析模型构建到第三层子部件,但其方法思路和两层模型一致,下文将以地铁-子系统两层分析模型为例,进行地铁车辆整体情况健康状态评价的研究。具体的地铁车辆层次分析模型的样式如图2所示。
图2 地铁车辆层次分析模型图
在对地铁车辆整体情况健康评估的过程中,层次分析法依托人工经验,仔细分析地铁车辆层次模型,考虑各层因素内部之间的影响以及上下层因素的联系,对指标之间的重要程度设置相应的数值,然后以此计算各指标影响地铁车辆整体健康状态的权重值。
1)评估指标专家打分。
对于地铁车辆评估指标[18-20]的打分,本文主要是邀请多名地铁检修经验丰富的老员工和地铁制造商的技术专家,由他们共同商量决议各指标的分数,避免由一名工作人员打分的个人主观性和考虑全面性的问题;通过将评估指标两两对比,减少评分人员主观模糊不清的情况,使评分结果更可靠、更准确。由多位专家商量决议的评估指标打分表如表1所示。
表1 评估指标打分表
PIS转向架制动车体牵引车门车钩内装空调火警照明PIS11/71/711/511/3111/31转向架71175757537制动71175737537车体11/71/711/511/3111/31牵引51/51/551535535车门11/71/711/511/3111/31车钩31/41/331/3313311内装11/71/711/511/3111/31空调11/51/511/511/3111/31火警31/31/331/3313313照明11/71/711/511111/31
2)特征根和权重向量的计算。
(4)
3)权重一致性检验。
对于判断矩阵的各个评估指标因素,需要计算其一致性指标,防止出现矛盾的现象,保证计算出的权重结果能够进行地铁车辆的健康状态评估。根据公式(4)计算公式(5):
(5)
其中,CI为一致性指标,RI为平均随机一致性指数。根据得到的结果,可以看出其检验结果基本符合一致性条件,所以按照“和法”计算出的评估指标权重[23-24]可以用于后期地铁车辆整体情况的健康状态评估。
地铁检修工作人员在日常检修中依据轨道交通集团有限公司运营分公司标准化委员会制定的电客车均衡修作业指导书进行子系统部件情况记录,其主要结果包含:健康与非健康。健康即地铁的部件系统运行正常,功能良好,不会导致地铁车辆的故障;非健康意味着部件系统存在一些问题,需要展开相应的维修,但此非健康情况不一定会造成地铁停运,不需要展开紧急维修。例如内装系统中的某个座椅某个扶手出现损坏,并不影响地铁车辆的正常运行,只需要在库内维修中进行部件更换,提升乘客乘坐地铁的舒适度,但是牵引系统中的牵引电机出现问题,则地铁车辆必须立即停运,展开故障维修。地铁车辆部件系统具体的评语情况如表2所示。
表2 部件系统评语表
整体情况情况描述得分范围健康运行正常、功能良好[70,100]非健康出现问题、需要维修[40,70)报废问题严重,需换新[0,40)
实验数据来自于地铁运营分公司的检修数据和实际运营数据,本文对地铁车辆部件系统的健康状况和地铁车辆实际运营情况进行整理;然后将11个部件系统的数据,即PIS系统、转向架系统、制动系统、车体系统、牵引系统、车门系统、车钩系统、内装系统、空调系统、火警报灾系统、照明系统,输入到上文已经建立好的决策树模型和层次分析法模型,从定性和定量2个角度对地铁车辆进行健康状态评估。定性主要包括健康和非健康2种情况,此处健康与非健康判断标准是根据地铁车辆当天实际运营中有无出现紧急故障,造成停运维修的情况,如果在地铁车辆运行的过程中,发现一些小问题,例如某个车厢内的显示器出现损坏,并没有影响地铁车辆实际运行,本文将这种情况定义为地铁处于健康状态;定量是根据检修工作人员和地铁设备制造商专家对子部件互相重要程度的打分,计算出影响地铁车辆健康状态的子系统权重值,然后以此计算出地铁车辆的健康状态分数值。其相应的流程图见图3。
图3 本文算法流程图
1)定性分析。
本文进行了软决策树模型的实验,定性地判断地铁车辆是健康还是非健康,实验中使用数据量为1000的数据集,其中训练集为800,测试集为200。具体的准确率的实验结果如表3所示。
表3 各算法实验结果比较
模型准确率/%神经网络模型93.37决策树模型95.48软决策树模型97
通过实验,结合地铁车辆检修领域的业务知识,对于目前出现的实验结果可以看出,软决策树判断效果比神经网络和决策树都好,且准确率较高。
但地铁车辆是一个复杂的机电一体化设备,每天部件系统都可能发生各种各样的新情况,之前的训练集库里可能会缺失某种情况,因此训练集需要保持不断更新。另外地铁各系统是一个复杂的部件集合体,某个关键部件出现损坏可能会导致地铁车辆停运检修,或某个损坏部件是重要组件但并不影响地铁车辆运行。正是这种情况与原因,造成部件系统健康状态的复杂性,以及对地铁车辆整体健康状态影响的多样性,所以接下来还需要对地铁进行定量分析。
2)定量分析。
在地铁车辆整体情况的健康评估过程中,上文已经使用决策树模型定性地对地铁车辆健康状态进行评估,但是仅仅知道地铁是否健康是不够的,还需关注地铁车辆的健康程度,便于后期地铁保养与检修计划的制定,因此本文使用层次分析法定量分析地铁车辆的健康状态程度,下面针对表4所示的实际案例进行分析。
表4 地铁及各子系统健康状况表
PIS转向架制动车体牵引车门健康健康健康健康健康健康车钩内装空调火警照明实际地铁健康非健康健康健康健康健康
表4反映地铁及各子系统实际健康情况,根据层次分析法的评语设定,转换成对应的分数,见表5。
表5 地铁各子系统健康分数表
PIS转向架制动车体牵引车门858585858585车钩内装空调火警照明实际地铁855585858584.0377
按照层次分析法求出的权值w和其对应的分数g为:w=[0.0310, 0.2557, 0.2368, 0.0310, 0.1475, 0.0310, 0.0771, 0.0310, 0.03690, 0.08670, 0.03492];g=[85, 85, 85, 85, 85, 85, 85, 55, 85, 85, 85],然后求出地铁车辆的健康状态分数为:
Z=w·g=84.0377>75
(6)
其中,w为各子系统的权重值,g为对应系统健康状态分数,Z为地铁车辆整体的健康状态分数,实际计算得到地铁健康状态分数为84.0377,大于75分,所以地铁车辆处于健康状态,且健康程度为84。当层次分析法的量化分数所属健康状态类别与决策树的定性判断结果不同时,以决策树的定性判断结果为准,因为决策树模型的训练依托大量实际数据,而层次分析法依靠专家经验,从整体的角度出发,以决策树模型的定性判断结果为准更加可靠,而量化的分数为该健康状态类别分数区间的最低分。
本文首先分别介绍决策树和层次分析法算法的研究现状;然后根据子系统和地铁车辆健康状态数据集构建软决策树,用测试数据集验证2种决策树模型对地铁车辆健康状态评估的准确率,并根据实验结果即评估准确率的趋势和差异做出总结分析,实现对地铁车辆健康状态的定性判断;其次依托实际业务领域建立层次分析模型,通过专家经验值计算出各评估指标权重值,同时设置好相应的评语集和分数,依据各子系统的健康状态定量求出地铁车辆整体的健康状态分数,从而实现对地铁车辆定性、定量的健康状态评估,有利于地铁车辆检修方式从计划修到状态修的转变。