基于KICA-GDA和LSSVM的齿轮箱轴承故障诊断

2019-03-05 09:33杨伟新李舜酩
噪声与振动控制 2019年1期
关键词:齿轮箱特征向量特征值

杨伟新,王 平,,李舜酩

(1.中国航发湖南动力机械研究所,湖南 株洲 412002; 2.南京航空航天大学,南京 21000)

齿轮箱滚动轴承故障信号的谱峭度、信息熵[1-2]等故障特征是机械系统状态的重要特征信息,该特征信息对系统状态变化规律反应敏感,可通过将这些特征量作为最小二乘支持向量机[3](Least Squares Support Vector Machine,LSSVM)分类器的输入来实现齿轮箱滚动轴承故障的识别。然而当齿轮箱滚动轴承发生故障时,因受到刚度非线性、间隙和外部载荷等因素的影响,振动信号常表现为非平稳、非线性的特征,另外,轴承故障信号往往被齿轮箱内部结构其他部件和环境激发的振动噪声信号所污染,会导致轴承故障特征向量间存在严重的相关性,这些问题都会影响LSSVM分类的准确性,使得识别轴承故障的难度加大。LSSVM分类器需要获得更高的分类性能就必须先消除输入向量间的相关性,核独立分量分析(Kernel Independent Component Analysis,KICA)是非线性特征抽取工具,其分离过程不受信噪比的影响,其关键是利用非线性核函数将原始特征空间映射到核特征空间[4],通过去掉不同故障特征间的冗余,从而消除特征向量间的相关性。广义辨别分析(Generalized Discriminant Analysis,GDA)方法,可有效地将各故障特征进行了非线性融合[5],融合后的特征向量将包含有更多的故障类别信息。本文通过齿轮箱滚动轴承故障诊断实例,说明了KICA-GDA和LSSVM的故障诊断方法的有效性。

1 KICA-GDA

1.1 核独立分量分析(KICA)算法

核独立分量分析(KICA)是一种非线性特征抽取方法[6],是通过利用非线性核函数将原始特征空间映射到再生核希尔伯特空间(Reproducing Kernel Hilbert Space,RKHS)中,并在RKHS空间利用典型相关分析(Kernel Canonical Correlation Analysis,KCCA)算法得到原始特征向量的最大相关系数。

文献[6]中指出,假设输入空间的样本xk∈RN,k=1,2,…,l被某各非线性映射Φ到某一特征空间H,得到Φ(x1),Φ(x2),…,Φ(xl),那么输入空间的点积形式在特征空间就可以用Mercer核表示为K(xi,xj)=(Φ(xi)·Φ(xj)),一般常见的Mercer核函数包括:

1)多项式核

2)高斯核

设有输入特征向量集X={x1,x2,…,xn}且x∈Rn,定义x1和x2为特征向量集中两随机变量。首先通过非线性核函数K(·,x)映射到RKHS空间形成的映射向量Φ={φ(x1),φ(x2),…,φ(xn)),且 有Φ(x)=K(·,x),设F为映射的核函数空间,其中核函数采用多项式核函数,然后利用KCCA方法计算随机变量f1(x1)和f2(x2)之间的最大相关系数ρF,相关系数可表示为

利用再生核希尔伯特空间的重构特性来计算ρF,可得

则有

设随机变量x1和x2的N个观测值组成的向量分别为xk1和xk2,两都在空间F的映射向量为Φ(xk1)和Φ(),k=1,2,…N,若映射到空间的数据已进行过中心化,则Bach在文献[6]中提出

因此,求解上式可等价于求解下式的特征值。

式中:K1和K2是基于观察数据x1和x2的Gram矩阵。式(5)可以推广到多个变量的情况

1.2 广义辨别分析法(GDA)算法

广义辨别分析GDA[7]的核心是通过一种非线性核映射函数,将低维输入空间中的线性不可分特征映射到一个高维的特征空间H,然后运用线性Fisher判别准则求解出此高维空间最优映射方向α。设有特征样本X={x1,x2,…xn}且x∈Rn,样本类别数量为C。第i类样本子集为Xi,样本数量为ni,第i类样本的均值。经非线性映射函数Φ映射后的样本向量Φ(x)∈H(即高维空间),在H空间样本的类内离散矩阵SΦW、类间离散矩阵SΦB为

高维空间H中的Fisher判别准则为

式中:ω∈H为特征核映射后的特征向量;ωopt是通过求解的特征值并按从大到小排序获得的前r个主要特征向量,从而实现降维,并且ω满足=0,j=1,…,r,也一定位于H空间中所有训练样本Φ(x)张成的空间内;J(ωopt)表示ωopt所对应的适应度值。根据再生核理论,解得

式中:α为H空间中ω的最佳核判别方向。将式(9)与式(10)联合可得

式中:Kb、KW是依据核距离μi计算出来的数值,无量纲。μi定义为

H空间中的正交约束条件式等价于

因而可以推导得

式中:K(xi,x)为核函数。由式(14)可知样本特征向量x映射到H空间的非线性映射过程的全部运算,实际上是由核函数来代替完成的,本文GDA采用核函数为多项式核函数,多项式核函数代数式见式(2)。

2 最小二乘支持向量机(LSSVM)算法

支持向量机(Square Support Vector Machine,SVM)能够解决小样本、非线性和高维数等实际问题,并成功应用于旋转机械的故障分类[8-9]。最小二乘支持向量机LSSVM算法[3]对SVM算法进行了一些优化,LSSVM利用等式约束条件代替SVM的不等式约束条件,优化了Lagrange乘子αi求解;另外,LSSVM算法将求解二次规划问题转化为求解线性方程组,降低了计算的复杂度并提高了程序的运算速度。

对于样本数据(xi,yj),(i=1,…,n),其中xi为输入,yj为输出。LSSVM可描述为求解如下优化问题

式中:J为目标函数;w为权向量;b为偏置;ξ为松弛变量;f为平衡分类误差和算法复杂度的惩罚因子,非线性变换函数φ(x)可将样本x从原空间的非线性问题变换为高维特征空间的线性问题。

该优化问题对应的Lagrange方程为

根据优化条件

消去w和ξ可化为解以下线性方程组

式中:l=[1,1,…,1]T1×n,I为单位矩阵。通过解方程组(18)可得到LSSVM分类决策函数

3 KICA-GDA与LSSVM的故障诊断方法

基于KICA-GDA与LSSVM的齿轮箱滚动轴承故障诊断方法流程如图1所示。

图1 KICA-GDA与LSSVM故障诊断方法流程图

诊断步骤如下:

1)分别测取传动齿轮箱滚动轴承在不同运行状态下(外圈故障、内圈故障及保持架故障)的振动信号;

2)选择合适的时间间隔,分别将3种故障状态下的振动数据分成若干段,对每段数据先进行归一化处理,然后并计算每段数据的谱峭度K={K1,K2,…,Kk}、信息熵H={H1,H2,…,Hk}、功率谱密度指数FC={FC1,FC2,…,FCk}等10种特征值(特征值选取见表1)作为原始特征向量,其中,将表1中的第一行特征值作为第一特征,第二行特征值作为第二特征;对原始特征向量间的相关性进行分析,并将其直接作为LSSVM分类器的输入,得到故障分类准确率;

3)利用KICA-GDA方法对原始特征向量进行处理,并对处理后特征向量间的相关性进行分析;

4)将经KICA-GDA方法处理后的特征向量作为LSSVM分类器的输入,得到故障分类准确率;

4 实例应用

测取传动齿轮箱的振动信号,实验装置由三相电机,齿轮箱,及其连接机构组成,核心设备是齿轮箱,内部结构示意图如图1所示。采样频率恒定为8 000 Hz,旋转速度从150 r/min到1 800 r/min,故障包括外圈故障,内圈故障及保持架故障。三类故障各选取13段数据,每段数据有1 024个点,每段数据计算10种特征值(故障特征值表见图1),因此每一类故障130个特征,以其中110个作为训练集,其余20个作为测试集。

图2 变速箱内部示意图

计算三类故障特征相关性矩阵,如图3所示。

图3 原始特征值相关矩阵图

由相关矩阵图可知各特征值之间存在较强相关性;3种故障特征值在特征空间的分布如图4所示。

可以看出有重叠部分,其聚类效果较差,这是由于齿轮箱结构故障,部件产生的振动之间耦合性强,造成了各个故障之间振动信号表征比较相似,从而使其特征不能准确地聚类到每一故障类别中。

将原始故障特征向量输入LSSVM进行分类,其分类正确率为63.72%,预测计算结果示意如图5所示。

采用KICA-GDA方法对上述故障特征进行处理,通过该方法去掉了不同故障特征间冗余,并对故障特性进行非线性融合,处理后的特征间相关矩阵如图6所示。

表1 轴承故障特征值表

图4 特征值空间分布

图5 不经处理的特征进行预测示意图

图6 处理后的特征相关矩阵

与图3相比,其不同特征间相关性降低;经处理后的3种故障特征空间分布如图7所示,与图4相比,类间距离增大,无重叠部分,分类效果得到明显的提升。

盒型图[10]可以说明每个特征的特征值所处的位置及其误差,因此将经KICA-GDA处理后的特征之间的关系用盒型图表示出来,如图8所示。

其中红色十字点表示异常点,黑色线表示上下误差,蓝色框表示绝大数点都在这个范围内,另外,每个特征值都进行了归一化处理。因此,从图8中可以得知,不同故障类型在每个故障特征下都能较明显地分开。将处理后的故障特征向量输入LSSVM分类器进行分类,其分类正确率为99.54%,与直接将故障信号的原始特征向量作为LSSVM分类器输入进行分类的效果比较,其分类精确度大大提高,预测示意图如图9所示。

图7 处理后的特征分布

图8 不同故障间的盒型图

图9 KICA-GDA处理后预测结果示意图

5 结语

影响齿轮箱滚动轴承振动信号因素较多,尤其在故障运行时,振动信号往往表现为非线性非平稳性特性,使得直接采用LSSVM分类器对故障进行分类得不到理想的效果。本文将KICA与GDA相结合,提供了一种非线性非平稳性信号的处理方法,采用该方法对故障信号进行预处理,去除了故障特征间的冗余,提取了不同部分的特征,在一定程度上减弱了故障造成各部件固有振动影响,从而提高了分类性能。试验结果表明,将KICA-GDA与LSSVM相结合对齿轮箱滚动轴承实测故障信号进行分类,与单独使用支持向量机分类器(LSSVM)的故障分类准确率(63.72%)相比,提高了齿轮箱滚动轴承故障分类准确率(99.54%),验证了本文方法的有效性。

猜你喜欢
齿轮箱特征向量特征值
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
风电齿轮箱轴承用钢100CrMnSi6-4的开发
克罗内克积的特征向量
单圈图关联矩阵的特征值
迭代方法计算矩阵特征值
一类三阶矩阵特征向量的特殊求法
提高齿轮箱式换档机构可靠性的改进设计
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
求矩阵特征值的一个简单方法
基于伪故障信号的齿轮箱故障诊断方法