杨路航 李宝庆 王 平 王 健 杨 宇
1. 湖南大学机械与运载工程学院,长沙,410082 2. 中国航发湖南动力机械研究所,株洲,412002 3. 中国航空发动机集团航空发动机振动技术重点实验室,株洲,412002
滚动轴承故障智能诊断在本质上都是模式识别问题,最常用的就是反向传播神经网络[1](back propagation neural network,BPNN)和支持向量机[2](support vector machine,SVM)。基于深度学习的故障诊断模型[3-4]能直接从原始信号中提取特征并具有自适应学习能力,但是它们都有共同的缺陷,即网络结构参数需要人为设定并需要大量训练样本和较长的训练时间,限制了这些方法在工程实际中的应用。SVM作为一种简单有效的分类方法,有着良好的泛化能力,其本质可以看作基于凸包的最大边距分类算法[5-8],即用凸包逼近每个类区域,根据两个凸包之间最近的点来构造分类超平面,只不过这类凸包的边界趋于无穷,以一个分类超平面将两个凸包分开。ZENG[6]对凸包边界进行约束,提出了弹性凸包(flexible convex hull,FCH)分类方法,通过改变弹性因子对凸包进行紧致或宽松的估计来提高凸包的分类精度。但该方法在进行分类超平面优化时,忽略了凸包内部大部分样本点的决策贡献,导致测试集分类精度降低。因此,笔者对弹性凸包输出进行改进,提出了概率输出弹性凸包 (probability output flexible convex hull,POFCH)分类方法。该方法使用凸包顶点优化分类超平面,然后计算所有样本点到超平面的距离,借助于概率输出的思想[5,9]进行稀疏映射,最小化交叉熵极大似然函数,将分类器的距离输出转化成对正负类的概率估计输出,形成比距离更为合适的类别判断方法。该方法在处理多分类问题时,采用一对一原则,同时对多个分类器的输出概率进行成对耦合,进一步提高了多分类的精度和鲁棒性。
滚动轴承故障的识别精度不仅受模式识别方法有效性的影响,还与故障特征提取的准确性有关。传统时域或频域分析方法所能获得的信息比较有限[10],而滚动轴承原始振动信号构成的时频图像包含不同条件下滚动轴承的丰富特征信息。振动信号时频图的纹理信息不仅可以保留振动信号的周期特性,还能够保留时域和频域联合作用信息。轴承发生故障时,其时频图包含了丰富的纹理特征。灰度共生矩阵(gray level co-occurrence matrix,GLCM)可充分描述图像纹理信息,广泛用于图像识别[11-12]和故障诊断[13-15]。本研究使用比较成熟的连续小波变换[16-17]来获得时频分布,通过计算时频图的灰度共生矩阵,选取灰度共生矩阵统计参数来构造特征集,以充分反映时频图纹理特征(time-frequency image texture,TFIT)。然后,将纹理特征集作为概率输出弹性凸包的输入样本,识别滚动轴承的不同故障。实验结果表明基于概率输出弹性凸包和纹理特征的滚动轴承故障诊断方法具有较高的准确性和鲁棒性。
在实数向量空间H中,空间中任意一点用x表示,给定的样本集X={x1,x2,…,xn}在空间H的凸集C称为X的凸包,可以表示为
(1)
式中,αi为第i个样本的组合系数。
引入弹性因子λ∈(1, ∞)并结合样本数n,给凸包的组合系数设定新的上下限,形成新的模型——弹性凸包:
F(X)=
(2)
通过简单推导得出样本集X的弹性凸包可以等价地表示为新的样本集:
(3)
弹性凸包分类的原理就是寻找一个最优超平面,该平面垂直平分两个凸包最近点连接线段,使得该平面在正负类样本凸包之间产生最大的间隔。
正类样本集的所有点满足〈w,x〉+b>0,负类样本集的点满足〈w,x〉+b<0,其中,w为分类超平面的法向量,x为样本点,b为偏置。分类超平面的确定就是两个凸包最近点的求解问题:
(4)
i=1,2,…,n+j=1,2,…,n-
式中,n+、n-分别为正类样本和负类样本的个数;λ+、λ-分别为正类凸包和负类凸包的弹性系数。
展开式(4)得到:
(5)
式(5)是一个凸二次规划问题,本文采用标准的优化算法进行求解,同时借助核函数进行核空间映射,将输入空间的线性不可分问题转化为特征空间的线性可分问题。本文采用高斯核作为核函数:
(6)
其中,σ为高斯核函数的宽度参数,控制函数径向作用范围。记式(5)的最优解为α*,根据α*可确定最优分类超平面的法向量w*和偏置b*:
(7)
法向量和偏置确定后,凸包上的点x与最优分类超平面的距离为
f(x)=〈w*,x〉+b*
(8)
决策函数定义为
y=sgn(〈w*,x〉+b*)
(9)
如图1所示,凸包边界点可以实现对一类样本集的凸估计,分类超平面的优化求解过程只考虑凸包顶点的决策贡献,忽略了凸包内部大部分点,因此不宜直接采用距离输出决策。
图1 弹性凸包分类原理Fig.1 Classification principle of flexible convex hull
(10)
(11)
当F的梯度为零向量时,对应式(11)的解为最优解。
图2 凸包样本分布不均匀Fig.2 Uneven distribution of convex hull samples
参数A和B的优化求解实际上可以看做分类超平面的平移。对于二分类问题,可以获得x属于正类和负类的概率估计P+和P-(P++P-=1)。改进后的决策函数定义为
(12)
rij+rji=1
(13)
rij≈Pi(Pi+Pj)
对式(13)变换求和得
(14)
为使式(14)的等价误差尽可能小,对式(14)移项求最小值,则式(14)转化为以下模型:
(15)
将式(15)展开写成矩阵形式:
(16)
式中,P为样本属于某一类的概率;[Qij]n×n为二次型矩阵。
对式(16)的求解是一个凸二次规划问题,本文采用标准算法进行求解,得到样本所属第i类的概率Pi。概率输出弹性凸包多分类的决策函数定义为
y=argmax{P1,P2,…,Pn}
(17)
概率输出弹性凸包多分类采用概率输出决策,原始的弹性凸包多分类采用投票原则进行决策。
灰度共生矩阵Pd(m,n)表示从灰度等级为m的点沿水平方向向右移动dx、竖直方向向下移动dy,到达灰度等级为n的点的概率,其中,m,n=1,2,…,L-1;L为灰度级,如图3所示。灰度共生矩阵的生成方向记为θ,常取角度为0°、45°、90°和135°。一般来说,d确定后,θ也确定,且存在
(18)
图3 灰度共生矩阵生成原理图(dx=1, dy=0)Fig.3 Generating principle diagram of gray level co-occurrence matrix (dx=1, dy=0)
基于概率输出弹性凸包和纹理特征的滚动轴承故障诊断的流程如下:首先对加速度传感器采集到的滚动轴承原始振动信号进行连续小波变换,得到小波时频图;然后根据时频图的灰度共生矩阵获得对应的纹理特征,并把特征集划分为训练集和测试集;最后根据训练集训练概率输出弹性凸包模型对测试集进行识别验证,实现故障诊断。特征提取的详细步骤如下:
(1) 故障信号通常伴有较强的冲击,根据morlet小波的冲击适应性[18],将morlet小波作为小波基函数进行连续小波变换,获得时域振动信号的时频图,并将时频图转化为256像素×256像素的灰度图。
(2) 将时频图分成4个128像素×128像素的图像,它们分别对应2个高频区域和2个低频区域。
(3) 分别求出时频图每个区域4个方向(0°、45°、90°和135°)上的灰度共生矩阵。
(4) 综合考虑4个方向的特征,按照2.1节计算出4个区域不同方向上的纹理特征,并求其对应的均值和方差,形成32维特征向量,记为TFIT。
实验1数据来自美国凯斯西储大学轴承数据中心。轴承为型号6205-2RS的SKF深沟球轴承,采样频率为48 kHz,每12 000个采样点划分为一个样本,得到1 400个样本。故障状态类型如表1所示。
表1 轴承数据样本
按照2.2节步骤提取时频图纹理特征,并与文献[3]的特征提取方法进行对比,文献[3]提取22个时域和频域统计参数作为特征,记为TTF(traditional time frequency);将概率输出弹性凸包分类器与原始弹性凸包和支持向量机进行对比。数据集A用来识别故障类型及故障程度,数据集B用来识别故障类型。对于概率输出弹性凸包,需要优化的参数有高斯核参数σ和弹性因子λ。采用5折交叉验证进行网格搜索最优参数,σ的搜索范围为2-8~28,指数步长为0.2,λ搜索范围为20~24,指数步长为0.2。图4所示为采用纹理特征和概率输出弹性凸包方法的网格搜索准确率分布,实验数据集为B,得出最优的σ、λ分别为1.136和2。
图4 TFIT+POFCH网格搜索最优参数Fig.4 Grid search optimal parameters based on TFIT and POFCH
采用网格搜索算法确定原始弹性凸包分类器和支持向量机分类器的参数。通过网格搜索算法确定最优参数后,在最优化参数下进行20次五折交叉验证,得到故障识别准确率,见表2,其中,模型为通过不同的特征集和不同的分类器进行组合得到的故障分类模型
表2 识别准确率
通过特征不变和分类器不变的比较可以看出,本文方法比原始的弹性凸包分类方法和支持向量机有更高的识别精度。在故障识别上,时频图纹理特征比传统时频特征有更高的识别精度。观察数据集A上分类模型的识别精度,以支持向量机为例,采用TFIT的故障识别精度较TTF有很大的提高,这说明时频图纹理特征能很好地反映各类故障。这是因为时频图像同时保留了时域和频域的联合作用信息,对滚动轴承的故障特征保留更加完全。
为使本文方法更具说服力并验证概率输出弹性凸包的泛化能力,在数据集B上以时频图纹理特征为故障特征进行实验。采用不同数量的样本作为训练集,并将其余样本作为测试集,随机独立重复实验20次,分类结果如图5所示。
图5 试验1的测试集识别准确率与训练集占比关系Fig.5 Curve of test set-recognition accuracy-proportion of training set of test 1
由图5可以看出,TFIT特征在训练样本较少的情况下仍保持93%以上的准确率;当训练集样本仅占10%时,概率输出弹性凸包也能保证测试集准确率接近95%,说明概率输出弹性凸包有良好的泛化能力。从识别精度变化曲线也可以看出,概率输出弹性凸包的分类精度最高。
实验2的数据为湖南大学旋转机械故障试验台的滚动轴承数据。试验台架如图7所示,滚动轴承型号为6205-2RS SKF,通过激光切割获得内圈故障、外圈故障和滚动体故障,每类故障的切割深度都为0.2 mm。电机转速为986.1 r/min,采样频率为10 kHz。获取的样本如表3所示。
图6 旋转机械故障试验台Fig.6 Rotating machinery failure test device
表3 轴承数据样本
采用实验1的方法在最优化参数下进行20次5折交叉验证,将时频纹理特征作为故障特征,概率输出弹性凸包分类器的最优参数为σ=2.2129,λ=1.7411。实验过程中,记录每个模型的训练时间和测试时间。实验平台的处理器型号为Intel Xeon E3-1231 v3@3.40GHz,软件环境为MATLAB2018b。实验结果如表4所示。
表4 识别准确率及平均运行时间
由表4可以看出,基于概率输出弹性凸包的分类方法依旧表现出了最高的准确率,并在两个特征集上提高了原始弹性凸包的分类精度,虽然训练时间和测试时间相较于原始弹性凸包和SVM有所延长,但均在0.1 s以内,能够满足实时诊断的要求。进行20次随机独立重复试验,观察测试集准确率随训练集样本量变化的曲线。由图7可以看出,概率输出弹性凸包有着最好的分类效果,并且测试集的识别精度随着训练样本的增多而提高。在纹理特征集上,概率输出弹性凸包分类器在仅有10%的样本作为训练集时,测试集的识别精度超过96%,而原始弹性凸包识别精度不到94%。概率输出弹性凸包分类方法提高了原始弹性凸包的识别精度,能够较好地识别故障。
图7 试验2的测试集识别准确率与训练集占比关系Fig.7 Curve of test set recognition accuracy-proportion of training set of test 2
为了验证POFCH的鲁棒性,对数据集B和C先按照8∶2比例拆分为训练集和测试集,对于每种类型的训练集,从其他类别的训练集中选择2个样本(作为当前类别的离群点)添加到当前类别的训练集中,再进行训练,验证测试集的准确率,随机独立重复20次,实验结果如表5所示。
表5 鲁棒性测试准确率和识别精度下降率
表5中计算识别精度下降率的计算公式为
(19)
其中,c1为不加离群点时的识别精度,即表2和表4中20次五折交叉验证(即训练集和测试集按8∶2划分)的结果,c为添加离群点后的识别精度。可以看出在不同的数据集上,概率输出弹性凸包的准确率依旧最高,并且从识别精度下降率来看,离群点对概率输出弹性凸包的影响最小,说明概率输出弹性凸包有更好的抗噪性和鲁棒性。
本文提出的概率输出弹性凸包分类方法在处理多分类时,对不同分类器的输出概率进行成对耦合,以概率输出弥补距离输出的不足,消除了原始弹性凸包的缺点;利用数字图像处理技术,以振动信号时频图纹理特征为故障特征来构建故障诊断模型。实验结果表明,概率输出弹性凸包的分类精度和鲁棒性高于距离输出弹性凸包,且能准确区分滚动轴承的不同故障,有较高的鲁棒性。