刘波,宁芊
(四川大学电子信息学院,成都 610065)
在工业生产中,滚动轴承是旋转机器中最常用的零件之一,它的运行是否正常直接影响到设备运行的安全[1]。然而滚动轴承早期出现的故障并不容易被发觉,巨大的机器噪声会把其他声音淹没,其结果会造成不可估量的损失。因此研究对滚动轴承的故障诊断,在最短的时间内排除故障,尽快恢复机器的正常运行,在工程中具有重要的研究意义和实际应用价值[2]。
轴承故障诊断的关键在于故障特征的提取和故障类型的识别。机械滚动轴承出现故障时产生的振动信号是一种典型的非平稳信号,仅通过传统的时频分析如Fourier变换等是难以准确全面地提取机械轴承的特征量,进而对滚动轴承的故障诊断产生较大的影响。针对此问题,文献[3]采用小波分析能够来处理该非平稳信号。虽然小波分解在处理非线性、非平稳特性信号方面具有多分辨率分析的能力和表征局部特征的能力,同时具有在低频部分具有较高的频率分辨率和较低的时间分辨力,但在高频部分却具有较低的频率分辨力和较高的时间分辨力[4]。为了解决此问题,文献[5-7]采用小波包分析进行轴承信号处理。小波包分析方法能够对信号进行全面的分解,不论是低频信号还是高频信号,都能有效地反映信号的时频特征,从而更有效地进行信号的特征提取。为了有效选择表征滚动轴承运行状态的特征向量,文献[8]采用KPCA(Kernel Principle Component Analysis)对融合特征集进行二次特征提取。然而,仅仅通过降维处理并不能有效判别轴承的运行状态,所以需要与模式识别算法相结合[9]。
在故障状态识别方面,神经网络、支持向量机等越来越多的分类器被应用于机械滚动轴承故障诊断领域[10-11]。但是人工神经网络需要大量的故障数据样本,而在工程应用中,很难获得足够多的故障数据样本[12],同时人工神经网络收敛速度慢且易陷入局部最优状态[13];而实际中,表征滚动轴承特征的数目多,且存在着数据计算量大、训练模型复杂等问题,同时容易产生“过拟合”现象,从而导致轴承故障诊断时间过长和精度低。支持向量机[14]是能解决小样本,避免过学习的有效方法,且具有高泛化能力和避免局部极小点的优点[15]。但支持向量机在人为选择核函数参数上存在不确定性,进而影响故障诊断结果[16],故需要采取必要的参数优化措施。
基于此,本文以电机驱动端轴承振动信号为研究对象,提出综合时域特征、频域特征和小波包能量特征构建多维特征,利用GA优化的SVM分类器进行故障诊断,从轴承故障特征的提取和故障状态识别两个方面提高诊断准确率。首先采用小波包频带能量进行特征提取,以小波包能量特征作为表征轴承特征量之一,同时混合传统时频特征量,构建多维特征。为了提高轴承故障诊断的效率和准确率,利用KPCA对多维特征进行降维以去除众多特征之间交叉冗余的信息,形成新的特征集合并作为最终状态识别的特征量输入;同时利用GA对SVM参数(惩罚因子c和核参数g)进行优化,选择最优的训练参数,形成诊断GA-SVM模型;此外,采用交叉验证方法保证诊断模型的可靠性和泛化能力;最后,基于120组实验数据验证了该方法在轴承小样本故障诊断中的有效性和优越性。
小波包信号分解的原理是将信号分解并均匀划分得到相应的子频带滤波信号。由于每个子频带的滤波信号都具有相对应的能量,所以可以用分解的到的子频带中信号的能量组成特征向量,进而反映机械设备的运行状态。
小波包分析能够有效处理故障轴承产生的非平稳信号,其中Daubechies小波包函数在轴承振动信号分析中应用广泛。选取db4小波包函数对各通道信号进行3层正交分解,然后提取第3层上8个节点的能量(称为小波包能量)作为特征。其中第j层上节点n的小波包能量定义为:
其中:wj,n(k)为小波包系数;Nj为第 j层各节点的小波包系数的数目。
由于提取的特征指标不统一且存有一定的交叉冗余性,同时特征之间还存有非线性的关系,为了有效地提取表征轴承状态的特征量,需要对特征集进行降维处理。PCA是一种线性降维的方法,是利用特征的协方差矩阵判断变量间的方差一致性,寻找出变量之间的最佳的线性组合来代替特征,从而达到降维的目的;但是轴承特征之间是存有非线性的关系,用线性关系去刻画,显然是低效的。为了解决此问题,本文利用KPCA核化的思想,将样本的空间映射到更高维度的空间,进而进行线性降维。
遗传算法(GA)参考生物自然选择和遗传机制而演变来的一种启发式算法[17]。这种算法在搜索和求解最优化问题时,主要包括对优化问题的解进行编码、初始化种群、计算适应度,以及通过选择、交叉、变异等三个基本操作获得最优的个体。相比较于传统的优化算法,GA具有诸多优点:①能够求出优化问题的全局最优解,可以有效避免局部最优解,同时在求解复杂的优化问题上具有一定的优越性[18];②优化结果与初始条件无关,具有较强的鲁棒性[19];③因为算法的并行性,搜索效率高[20]。并行性主要体现在个体适应度评价的并行性、整个群体中每个个体适应度评价的并行性和子代群体产生过程的并行性。
SVM是由Vladimir等人[21]在1995年提出用的机器学习方法,是以统计学理论为基础的模式识别技术,同时采用最小化结构风险的原则,通过构造最优分类超平面对数据进行分类;其根据有限的样本信息,能够在模型的复杂性与学习能力之间取得平衡,寻求出最佳效果来提高模型泛化能力。
设训练样本集(xi,yi),i=1,2,3,…,n,其中n为训练样本个数,xi为样本空间,yi样本类标签。超平面方程:wx+b,其中,w为权值,b为阈值且在满足约束条件 yi(wTw+b)≥1-ξi,ξi≥0下有最小化公式:
经过内积核函数K(xi,xj)将线性不可分问题转化为高维空间的可分类问题,则最大化问题为:
则分类函数为:
对于非线性的分类问题,SVM利用核函数将低维非线性数据映射至某个高维空间,避免维数灾难;然后在高维空间再对转换后的数据进行线性分类,由于径向基核函数(Radial Basis Function,RBF)能直观反映数据之间距离,同时其分类效果要优于其他的核函数,故本文研究选用RBF作为SVM模型的核函数。
RBF表达式为:
其中,λ为拉格朗日乘子,σ为RBF参数。
在对机械滚动轴承进行故障诊断时,首先对振动信号进行降噪和时频变换等处理,提取时域和频域特征,然后利用理论1.1提取小波包能量特征;之后综合传统的时域特征、频域特征和小波包能量特征作为振动信号的多维特征;同时,采用理论1.2对多维特征进行降维处理,形成最终作为分类器SVM的输入值。
(2)特征提取
首先对对轴承振动信号提取时频域特征,传统时频特征参数的详细定义和计算公式见文献[22]。其中时域特征量16个,记作T=[t0,t1,…,t15];频域特征量13个,记作F=[f0,f1,…,f12];小波包能量特征8个,记作E=[e0,e1,…,e7];综合三者不同指标的特征,得到特征集X=[T,F,E]。
根据理论2.1.1的步骤提取出T、F、E三者特征,并组合成X=[T,F,E]。但提取的特征量有些对滚动轴承的故障诊断贡献很小,甚至几乎没有贡献,这部分特征量考虑为冗余信息;同时还存有一些不敏感的特征量,且对轴承故障诊断的效率和准确率产生比较大的影响;除此之外,特征之间也存在线性或者非线性关系。因此,为了剔除冗余信息和不敏感信息,有必要进行降维处理。
本文通过理论1.2对多维特征集合X进行降维处理,有效的压缩故障数据,去除大量冗余数据和噪声以及消除特征之间的相关性,从而得到最优的特征子集,然后经过归一化后,最终获得能够反映滚动轴承各运行状态的多维特征Xb,并以Xb作为分类器的输入进行对滚动轴承状态的识别,保证了识别的效率和准确率。
由2.1获得多维特征Xb后,设计并优化SVM分类器。SVM分类器采用RBF核函数,然而惩罚因子c和核参数g两者的参数选择直接影响到SVM的分类精度和泛化能力,所以利用GA优化c和g,并得到bestc和bestg,GA优化SVM的参数流程图1所示。至此,完成了基于多变量特征和GA-SVM模型的滚动轴承故障诊断模型的设计,流程图2所示。其具体的完整诊断步骤如下:
Step1:提取滚动轴承信号的时域特征向量T,频域特征量F,小波包能量特征量E,共同构成37维故障特征向量。
Step2:对滚动轴承特征样本作归一化处理,以期消除量纲影响,并将处理后的数据样本分为训练集和测试集;
Step3:利用KPCA对滚动轴承的训练集和测试集进行数据降维操作,以期消除冗余信息和特征之间的相关性,得到优化后的多维特征Xb;
Step4:利用训练集设计LSSVM模型,同时采用GA优化SVM参数。其中以训练集模型分类精度作为适应度函数,对基于LSSVM的惩罚因子c和核参数g进行迭代寻优,获得最佳参数值bestc和bestg,同时建立起基于训练集的GA-SVM轴承故障诊断模型。
从思想文化上来说,改革开放四十年来所取得的巨大成就是建立在关于实践标准的大讨论的基础上的。今天,“实践是检验真理的标准”这句口号不仅始终发挥着思想解放的作用,而且已经在不同程度上融入了我们的精神之中,成为我们各项社会实践的指南。如果我们把它与西方历史上所曾经发生的启蒙运动加以比较的话,那么我们可以毫不夸张地说,这也是中国现代思想史上一次伟大的启蒙运动。它不仅破除了偶像崇拜,而且作为一种思想原则极大地推动了中国社会主义现代化事业的飞速发展。今天,从启蒙的背景上来思考这样一场伟大的变革是完全必要的。
Step5:以多维特征测试集Xb作为输入,利用构建好的GA-SVM模型进行轴承故障诊断,并计算得到故障诊断准确率。
图1 GA优化SVM的参数(c&g)流程图
图2 基于多维特征和GA-SVM的故障诊断流程
对滚动轴承状态进行仿真实验。软件平台为Windows 8.1系统,MATLAB R2015b;计算机硬件为Intel Core i3-2350M,CPU@2.30GHz,8GB内存。
实验中采用美国凯斯西储大学实验驱动端轴承数据,其中采样频率为12KHz,转速为1750r/min,其中电机故障直径为0.007英寸,驱动端轴承的4种故障状态为:正常、内圈故障、滚动体故障和外圈故障。
驱动端滚动轴承的原始信号时域图,如图3所示。
图3 原始信号
根据2.1节理论,对轴承数据进行特征数据提取,不同状态的轴承数据特征各100组,其中70组做训练集,30组做测试集。经分析,可按下述步骤实现基于多维特征融合和GA-SVM的滚动轴承的故障诊断:
(1)针对原始数据的时域、频域和小波包能量特征提取时,可以通过傅立叶变换实现原始信号的去噪;同时每种滚动轴承的运动状态按7:3的比例随机划分为训练集数据和测试集数据并设置每类故障的标签,如表1所示。
表1 训练集与测试集
其中:对4种运行状态下的轴承振动信号进行小波包能量特征提取,其中小波包能量分布如图4(a)(b)(c)(d)所示。
图4
小波包能量分解信号提取结果分析:从图4(a)、(b)、(c)、(d)的对比中可以发现:滚动轴承不同运行状态下的小波包能量分布存在明显的不同,因此可以将其作为表征轴承运行状态的有效输入特征量。
(2)经过2.1.2节归一化和KPCA降维处理之后,计算获得轴承运行状态的多维特征Xb。其中Xb的维度为4(如图5所示),即本文用此4个核主成分来表征由高维数据集X,进而达到降低维度和消除冗余的目的。
图5 KPCA主成分(4维)
(3)结合上一步骤处理后的数据集,利用GA对SVM进行参数寻优,并使用5折交叉验证法进行验证,最终获得最优参数bestc=2.7625和bestg=26.6095,同时完成GA-SVM模型的构建。其中,遗传算法的适应度曲线如图6所示。
图6 遗传算法适应度曲线
(4)利用训练好的GA-SVM模型对轴承数据的故障诊断,并将该方法与其他故障诊断方法进行比较,同时为了避免诊断结果的偶然性,实验采取10次诊断结果的平均值作为最终的测试结果。如表2所示。
表2 多种算法的状态识别比较
为了进一步探究不同特征对实验诊断结果准确率的影响,实验分别采用时域特征T,频域特征F和小波包能量特征E以及多维特征Xb作为KPCA_GA-SVM模型的输入特征值,进行轴承故障识别,实验的最终结果采取10次诊断结果的平均值,如图表3所示。
表3 不同特征的状态识别
由表3可以看出,作为轴承诊断模型GA-SVM输入特征,多维特征Xb的故障识别精度高于各单维特征(时域特征T、频域特征F、小波包能量特征E)的故障识别精度。说明相比于单维特征,多维特征在特征提取方面提高了轴承故障状态识别率。
利用各不同特征作为SVM、GA-SVM和KPCA_GA-SVM模型的输入并进行轴承运行状态识别,结果表明:由表2可见,利用输入特征,通过对比GASVM和KPCA_GA-SVM模型进行轴承故障状态识别。结果表明在同样的识别率100%下,相比较于GASVM模型训练时间0.348s而言,KPCA_GA-SVM模型构建时间为0.073s,时间缩短了50.29%,说明对提取的滚动轴承故障信号特征经过KPCA降维处理之后,不仅可以准确地反映滚动轴承状态信息,而且缩短了模型的构建时间;同时,通过对比SVM和GA-SVM的诊断结果:GA-SVM的状态识别率为100%,相较于SVM的识别率W%,其故障诊断识别率提高了5.33%,说明SVM模型参数的选择对诊断结果有很大影响的,而GA能够有效地优化SVM模型参数,寻找出该模型最佳的参数,避免了惩罚参数c和核函数参数g选择的盲目性,有效地提高了支持向量机对轴承故障诊断的识别精度。
由表3可见,时域特征T、频域特征F、小波包能量特征E作为输入特征时轴承状态识别率分别为89.17%、65.83%、86.67%,而形成的融合特征Xb作为分类模型的输入特征时,轴承状态识别率可达100%,说明为了提高诊断结果的准确率和可靠性,融合以上三种特征并作为后续滚动轴承分类器的最终输入是很有必要的。
(1)实验结果表明,基于本文设计的多维特征融合和KPCA_GA-SVM故障诊断模型能够准确有效地识别出滚动轴承各类特征状态,从而达到故障诊断的目的。
(2)本文提出的基于多特征融合和KPCA_GASVM的滚动轴承诊断模型,从特征提取和状态识别两个方面提高了滚动轴承的诊断结果。
(3)实验对比了传统的时域特征T、频域特征F和小波包能量特征E以及三者的融合特征Xb,从GASVM的故障诊断识别结果发现,较单维特征,三者融合的多维特征的识别率更高。结论表明通过本文提出的方案从特征提取方面提高了轴承故障诊断准确率。
在接下来的工作中,将进一步探究多分类器融合在轴承故障诊断方面的应用,以求提高轴承故障诊断的分类效果。