梁先勇
摘要:牵引电机是动车组动力传动系统中的关键部件,在牵引电机故障中最常见的故障为牵引电机接地故障。通过对某动车组牵引电机控制单元的历史数据挖掘,实现对牵引电机接地故障的预测。数据挖掘建模使用了RBF神经网络、决策树和支持向量机3种机器学习算法。试验结果表明,3种算法的预测准确度均高于84%,其中决策树相较于RBF神经网络和支持向量机,具有更高的预测精度,模型预测精度达到85.6%。因此,选取决策树模型预测动车组牵引电机接地故障的发生。
关键词:动车组;牵引电机;高速铁路;接地故障預测;决策树;RBF神经网络;支持向量机;故障诊断
引言
高速铁路是铁路未来的发展方向,各国都投入大量人力物力进行高铁建设。近十年,我国高速列车得到了快速发展,但也暴露一些问题。例如,动车组可靠性故障会造成动车经常性的晚点以及运行安全报警等问题,给高铁的运营推广带来了阻力。牵引供电系统是动车组中最重要的子系统之一,牵引供电系统的可靠性直接影响动车组能否正常运营。近年来,很多学校和企业在铁路牵引供电系统方面做出了大量研究。文献以整条高速铁路所有牵引变电站的供电系统可靠性和铁路通过能力为评估对象,研究外部电力系统(发电厂、输电网、牵引变电站和接触网)对高速铁路牵引供电的可靠性,但没有对高铁内部的牵引供电系统故障做深入研究。文献对动车组的牵引供电系统故障进行统计分析,得出接触网系统的故障占重要比重,应采取措施减小各种自然因素引起的故障,建立了较为完善的牵引供电系统故障统计表格,为提高电力牵引供电系统的供电可靠性提供了依据,但没有涉及故障模式及其影响方面的研究。文献针对某一地铁典型牵引供电系统结构,利用故障树分析(和故障模式、影响及危害度分析对典型地铁牵引供电系统可靠性进行分析,在故障树图中划分出系统的最小割集,找出接触网系统与高压断路器、中压断路器是该地铁供电系统的薄弱环节;但是没有指出故障模式对系统的影响及危害度。
1动车组牵引电机常见故障
牵引电机是动车组行进过程中的动力及控制作用的来源,其主要负责供电驱动和制动蓄电等功能,在实际运营过程中,由于动车组的运行速度过快,牵引电机很容易出现质量问题[1]。根据实际工作的有关经验以及相关文献的阐述,牵引电机故障主要可以分成以下几种:常见故障、定子故障、速度传感器故障、温度传感器故障、轴承故障和其他类型故障。
(1)定子故障是比较常见的一种动车组牵引电机故障问题。一般来说,定子匝间短路及绕组接地故障属于最容易出现的一种定子故障,和其他故障相比较,定子故障会导致部分线路出现绝缘失效的情况,其严重性极为突出。(2)速度传感器故障是牵引电机运行过程中较为常见的一种故障,主要为传感器本身器件原因及高温高压电流快速变化导致的信号传输不整正确,进而导致牵引电机实际速度与传感器反馈给控制系统的速度不一致,影响牵引系统正常运行。(3)温度传感器故障原因机理与速度传感器类似,只是温度传感器传递的是牵引电机各主要部件的温度信号,如定子铁芯、转子铁芯、轴承等,而速度传感器传递的是牵引电机的速度信号。(4)轴承故障也是一种不容忽视的牵引电机故障。众所周知,动车组的牵引电机轴承部分可以分成保持架、滚动体以及内外圈及外圈绝缘陶瓷镀层。为保证动车组牵引电机在线的顺畅运行,在多数的牵引电机返厂检修过程中均会对轴承进行换新,令用户按照固定周期要求对润滑脂进行补充,防止电机运行过程中轴承的磨损。因此,轴承故障多数是由于牵引电机受到突发外力作用导致的轴承滚动体受损及绝缘层损伤故障。(5)其他故障主要指由于其他不可控因素导致的牵引电机故障,如动车组运行过程中地面飞石导致的排风罩变形、传感器电缆损伤、铭牌脱落等。
2建模预测
首先,需要对原始信号进行预处理,将实际按每秒1次的频率进行采样,将相电流和接地电压的瞬时值转化为平均值。输入变量为速度、相电流IL1、相电流IL2、相电流IL3、中间环节电压、功率、接地电压比,由于实际数据的量纲不同,所以需要对数据进行归一化处理。输出变量设为牵引电机是否发生接地故障(取值“0”或“1”,“0”代表未发生故障,“1”代表发生故障)。选择径向基(RadialBasisFunction,RBF)神经网络、决策树和支持向量机3种常用的预测算法进行预测。①RBF神经网络是一种3层前向网络,它通过输入层空间到隐含层空间的非线性变换以及隐含层空间到输出层空间的线性变换,实现输入层空间到输出层空间的映射。RBF是某种沿径向对称的标量函数,通常定义为空间中x点到某一中心cj之间欧氏距离的单调函数,最常用的径向基函数是高斯函数,形式为式中:cj为函数中心向量;σj为宽度向量。高斯函数的作用域表现出局部性,即当x远离σj时函数取值较小。②决策树方法可以充分利用先验信息处理数据间的非同质和非线性关系,有效地对数据进行预测分类,并具有很高的分类精确度和预测效率,适合于样本数据量较大的情况。决策树算法两大核心问题是决策树的生成与剪枝,生成树方法有信息熵和GINI系数。
其中,信息熵和GINI系数的定义如下:设p(xi)=P{X=xi},X的熵定义为选择信息熵将在树的每个节点上使用信息熵度量选择测试属性,具体做法是选择具有最大信息熵的属性作为当前节点的测试属性。使用该法的前提是所有属性都是分类的,即取离散值,连续值的属性必须离散化。选择GINI系数将根据层间的GINI系数差来选择测试属性以及控制决策树的深度,具体的做法是选择层间的最大GINI系数差所对应的属性作为当前节点的测试属性,当GINI系数差小于指定的标准值时,停止树的增长。树剪枝的方法分为不剪枝、先剪枝和后剪枝。其中,不剪枝指对决策树不进行剪枝;先剪枝指在下设条件得到满足之前就停止继续扩展决策树;后剪枝指错误率低于指定标准值时则开始剪枝。③支持向量机适用于二分类问题,在高维空间中寻找一个超平面作为二分类的分割,以保证最小的分类错误率,而且能够处理线性不可分的情况。支持向量机学习的基本思想是求解能够正确划分训练数据集,并且使得几何间隔最大地分离超平面,满足几何间隔最大的超平面是唯一的。
基于RBF神经网络、决策树和支持向量机3种算法和样本数据的故障预测步骤和参数设定如下:①根据已知的正常与接地故障状态下的特征数据建立训练样本集{xi,yi},y∈{0,1};x为输入变量,即速度、相电流IL1、相电流IL2、相电流IL3、中间直流电压、功率、接地电压比;y为目标变量,即牵引电机是否发生接地故障(取值“0”或“1”,“0”代表未发生故障,“1”代表发生故障)。②RBF神经网络。一般情况下,隐含层中心个数要大于输入变量的个数,隐含层中心个数设得越多,训练的效果越好,但是耗时也越长。本文将隐含层中心个数分别设为7~14,进行比较可发现,当隐含层中心个数为8时,模型的预测误差最小,因此最终将RBF神经网络的隐含层中心个数设为8。
3结束语
基于FMECA方法,综合分析了某动车组牵引供电系统的故障模式、故障原因、故障影响、故障发生频率以及严重度,并对其危害度进行定性分析,得出本系统危险故障源包括:IGBT模块监控不起作用、变压器油泵34‐F55跳开、制冷风扇故障和变压器油流故障等。
参考文献:
[1]张振宇.动车组牵引电机故障分析及诊断[J].内燃机与配件.[2]贾潞.CRH380BL型动车组牵引电机接地故障原因分析[J].机车车辆工艺.