柳玉超
(中车青岛四方机车车辆股份有限公司,山东青岛 266111)
齿轮箱作为牵引系统的重要机械部件,直接影响机车的安全行驶,对齿轮箱故障识别诊断的效率关系到铁路运输质量。因此,研究机车齿轮箱故障诊断具有重要意义。
以电力机车的齿轮箱为研究对象,采用遗传蚁群算法优化的多核支持向量机,对齿轮箱故障进行识别分析,避免了单核支持向量机精度较差的问题,并与神经网络、单核支持向量机、标准遗传算法优化的多核支持向量机方法进行比较分析。
齿轮箱主要故障类别可分为齿轮与轴承故障、密封不良、保持架故障、箱体故障以及无故障(正常)等5类模式。研究发现齿轮轴承发生故障,如密封不良、齿轮磨损时,较小的粉尘及金属屑会进入润滑油中,导致齿面的磨粒磨损、磨粒浓度变化。齿轮磨损发生故障,润滑油中铁、铬和锌元素的含量明显增加;保持架磨损故障,铜元素的含量明显增加;箱箱体磨损故障,铝元素的含量明显增加;密封不良故障,硅元素的含量明显增加。因此,选择铁、铬、锌、铜、铝、硅、和磨粒含量作为齿轮箱诊断的输入。
SVM(Support Vector Machine,支持向量机)是由Vanpik提出的一种基于统计学习理论的智能学习方法。传统单核支持向量由于单核的局限性,难以适应复杂故障诊断问题,且识别精度低,难以用于实际问题。为此,采用多核函数解决单核的不足,多核支持向量机是2个及以上的单核函数通过线性组合,得到支持向量机的核函数。常见的核函数主要有:
(1)线性核函数 K(X,Y)=(X,Y);
(2)多项式核函数 K(X,Y)=(X·Y+c)d,其中 c为常数,d 为多项式阶数;
(4)Sigmoid 核函数 K(X,Y)=tanh(v(X,Y)-c),其中 v 为尺度,c为衰减参数。
式中:M 为单核数目,dk为第 k 个单核的权值,Kk(xi,x),为基本的核函数。单核支持向量机分类函数的形式见式(2)。
式(3)中的约束条件为式(4)。
式中:b为偏置量,C为惩罚参数,ξi为训练误差。
利用对偶化条件,构建Lagrange函数,结合KKT条件,将约束优化问题转化为无约束优化问题。见式(5)。
式中:σ为核函数宽度。求解式(5),建立MKSVM模型,形式为式(6)。
遗传算法在全局寻优方面具有很强能力,但在计算过程中没有使用反馈信息,后期计算过程中很可能出现大量无用迭代。蚁群算法充分利用了系统的正反馈,具有很强收敛能力,但由于前期计算过程缺乏信息素,导致前期求解速度较慢。为了充分利用两种算法的优点,避免各自缺点,将遗传算法和蚁群算法组合,首先利用遗传算法进行全局寻优,然后再利用蚁群算法快速找出最优解。
(1)初始化种群。采用实数编码,初始化遗传算法种群规模M,最大迭代次数 Genmax,终止迭代次数,Gen(Gen<Genmax)种群最小进化率Rmin,交叉概率Pc,变异概率Pm。
(2)适应度值函数。见式(7)。式中:l为训练样本个数,Ti为训练样本的目标输出值,Yi为训练样本实际输出值。
(3)选择、交叉和变异操作。轮盘堵转法选出新的父代。交叉随机选择2个个体,单点交叉。随机选择一个个体,进行变异操作。
若遗传算法连续迭代次数达到Gen,种群进化率都小于Rmin,终止遗传算法,或者当迭代次数达到最大值Genmax,终止遗传算法,进入蚁群算法。
初始化蚂蚁数量m,信息素强度Q,蚁群最大迭代次数Nmax,信息素影响因子α,启发式影响因子β,信息素残留系数ρ。
(1)信息素初值设置。见式(8)。利用遗传算法得到的较优解,根据式(7)初始化信息素,其中τc为根据具体问题设置的信息素常数,τG为遗传算法求得的优化解转换值。
(2)选择概率。对于每只蚂蚁根据概率转移公式(8)得式(9),式中:α为信息素影响因子,β为启发式影响因子。
(3)信息素跟新。依据式(7)计算适应度值,根据式(9)更新信息素,得式(10),式中:ρ为信息素残留系数,Q为常数,代表信息素强度。
已知齿轮箱故障的训练样本集为(x1,y1),…,(xm,ym),其中xi∈Rd,yqi∈{+1,-1},i=1、…、m,q=1,…,f,m 为电机故障训练样本的个数,f为故障模式数目。选择多项式核函数和高斯径向基核函数构造多核核函数,多核核函数见式(11),式中:α为权重系数。
利用改进MKSVM实现齿轮箱故障诊断的步骤:
(1)数据预处理,归一化处理,消除指标类别差异的影响。
(2)利用遗传蚁群算法优化支持向量机参数C,σ,d,α。
(3)根据遗传蚁群算法优化得到的支持向量机参数C,σ,d,α,利用提取得到的主成分数据求解式(11),得到对应的第q类故障的支持向量机故障诊断分类器模型。同理,可得5个基于GACA-MKSVM齿轮箱故障分类器模型。
(4)利用求得的f个齿轮箱故障分类器模型建立故障诊断系统模型,如图1所示。
图1 支持向量机故障诊断分类器模型
(5)利用故障诊断分类器模型进行故障诊断。在仿真研究中,先将输入数据t输入支持向量机故障诊断分类器模型MKSVM1,若 f(t)输出结果为+1,则该故障属于故障模式 1;否则,将输入数据作为支持向量机故障诊断分类器模型MKSVM2的输入,依次计算,直到相应的f(t)输出结果为+1,得出相应的故障模式。若最终的决策函数没有出现+1情况时,则该故障属于其他故障模式。齿轮箱故障诊断流程如图2所示。
图2 基于GACA-MKSVM故障诊断流程
以电力机车齿轮箱为研究对象,选择某机务段和谐号电力机车齿轮箱故障资料为样本。选取300组数据作为样本数据,200组数据作为网络训练样本数据,100组数据作为网络测试样本数据。用F1,F2,F3、F4及F5分别表示齿轮与轴承故障、密封不良、保持架故障、箱体故障以及无故障(正常)等5类故障模式,训练样本、测试样本部分数据如表1所示。
表1 部分样本数据
经遗传蚁群算法优化得到的5种故障模式的支持向量机(MKSVMl-MKSVM5)参数。然后,得到对应的5类故障的支持向量机故障诊断分类器模型,随机选取5组测试样本,分别为a1=(0.001,0.042,0.058,0.057,0.099,0.011,0.143,0.051),a2=(0.946,1,0.512,0.598,0.751,0.438,0.974,0.979),a3=(0.102,0.029,0.040,0.126,0.202,0.956,0.401,0.099),a4=(1,0.867,0.496,0.434,0.674,0.460,0.911,0.892),a5=(0.002,0.038,0.060,0.051,0.011,0.176,0.002,0.003)输入故障诊断分类器模型进行故障模式识别。输入数据维数为8维,诊断结果见表2。
表2 基于GAGA-MKSVM故障诊断模型测试结果
从表2可知,基于GACA-MKSVM故障诊断模型对验证数据的诊断结果与实际故障完全一致,准确率为100%。进一步研究,每类故障模式中取10组数据作为验证数据,故障识别准确率仍为100%。可见,基于GACA-MKSVM故障诊断模型对于小样本仍然具有良好的分类性能。
为了进一步说明该方法的有效性,从每种故障模式样本中选取共60组为训练样本,剩余的样本为测试数据样本,与直接使用支持向量机(SVM)、标准遗传算法优化支持向量机(GASVM)故障诊断方法进行比较分析,4种方法对验证数据的故障诊断结果对比如表3所示。
表3 4种诊断模型测试结果
从表3可以看出,基于CGA-LSSVM故障诊断模型对齿轮箱的故障识别准确率明显高于BP神经网络、SVM,GA-SVM故障诊断模型。
研究基于遗传蚁群优化多核支持向量机的齿轮箱故障诊断方法,建立高性能的齿轮箱故障诊断模型。遗传蚁群相比标准遗传算法搜索效率更高而且很好地解决了过早收敛的问题,优化后的基于多核支持向量机的齿轮箱故障诊断模型故障识别准确率更高。以电力机车的齿轮箱为研究对象,仿真结果表明:遗传算法优化多核支持向量机的故障诊断方法应用于电力机车齿轮箱故障诊断,故障识别准确率高。该方法为电力机车齿轮箱的故障诊断提供借鉴参考。