张 弛
(上海交通大学机械与动力工程学院,上海 200240)
滚动轴承作为旋转机械设备的关键部位,以其为对象进行故障诊断一直是研究的热点。当滚动轴承发生故障时,故障引起的脉冲会周期性重复出现,其重复频率被称为轴承故障特征频率。通过信号处理技术,可以把振动信号中与故障相关的特征提取出来,由提取出的故障特征可以实现对轴承的故障诊断[1]。
目前,常用的信号处理技术主要有两类:一类是以快速傅里叶变换为基础的传统信号处理方法,主要包括功率谱分析、小波分析[2]、经验模态分解法[3]等;另一类是以机器学习为代表的智能诊断技术,主要包括主成分分析(PCA)[4]、支持向量机(SVM)[5]、基于遗传算法的神经网络[6]、深度卷积神经网络(CNN)[7]等。传统信号处理方法往往需要大量先验知识,对故障机理有深入了解,且需要大量工程实践作为辅助支持;智能诊断技术对数据本身特征进行提取,无需对故障机理进行深入研究,但是存在计算量大、耗时长等问题。
随着深度学习理论的日益成熟及计算机算力的提升,深度卷积神经网络在故障诊断上有了广泛的应用。李思琦等[8]应用集合经验模态分解对滚动轴承振动信号进行分解重构,随后将重构后的信号带入卷积神经网络中进行故障诊断。张立智等[9]通过短时傅里叶变换得到信号的时频图。将时频图输入到二维卷积神经网络中从而实现对滚动轴承的故障诊断。杨兰柱等[10]通过对卷积神经网络的卷积层进行改进,将原始信号数据作为输入,对滚动轴承故障诊断进行系统性研究。Li S B等[11]将多传感器信号经快速傅里叶变换后的特征均方根图作为卷积神经网络的输入,并结合改进的D-S理论实现对滚动轴承的故障诊断。上述研究均是对原始数据进行预处理或者对网络结构进行优化,需要大量的先验知识,缺乏一定鲁棒性。
针对上述不足,本文提出一种基于CNN-SVM的轴承故障诊断方法。该方法只需输入原始数据且只需简单的网络结构即可对滚动轴承故障进行准确识别,无需大量先验知识,具备较好的鲁棒性。
卷积神经网络本质上是监督学习中的多层神经网络模型,主要由卷积层、池化层以及全连接层组成。
卷积层作用主要是通过过滤器对信号的局部区域进行卷积,随后生成输出特征图。其输出表达式为:
(1)
池化层又称降采样层,主要用来减少冗余特征,降低网络参数,从而避免过拟合。
全连接层用于进一步提取池化层的输出特征,将进一步提取得到的特征输入到Softmax函数中进行分类。
一般的卷积神经网络结构如图1所示。
图1 卷积神经网络结构
支持向量机(SVM)是一种基于小样本统计理论的算法,主要用来进行分类。通过最大化分类超平面和数据之间的余量从而找到最优分类超平面,如图2所示。
图2 最优分类超平面
设输入为xi(i=1,2,...,M),其中M为样本数量。针对二分类问题,分类标签y∈{-1,+1}。在线性数据的情况下可以确定能分离给定输入数据的超平面f(x)=0。
f(x)=wTx+b=0
(2)
式中,w是M维权重向量,b是偏置标量。w和b决定了超平面与原点之间的距离。通过求解下述最优化问题从而实现不同类之间的距离最大化,即:
(3)
对于线性不可分问题,引入松弛变量εi≥0和惩罚因子C,从而过渡到软间隔支持向量机:
(4)
基于卷积神经网络具有强大的特征提取能力且支持向量机具有高效的分类能力。本文提出一种基于CNN-SVM的自适应提取特征的滚动轴承故障诊断模型,利用卷积神经网络中卷积核池化操作对原始的数据进行特征的学习及提取,这些特征能够最大化的表征原始数据,随后将提取出后的特征即全连接层的结果作为支持向量机的输入并对其进行分类,从而实现滚动轴承的故障诊断。
本文基于CNN-SVM的故障诊断模型具体参数如图3所示。将原始数据转换成32×32的矩阵作为输入,第一层卷积层由1个大小为3×3的卷积核组成,第二层卷积层由8个大小为3×3的卷积核组成,池化层大小为2×2。
图3 CNN-SVM模型结构及参数
为验证本文所提方法的可行性,本文采用美国凯斯西储大学的滚动轴承数据中心的轴承振动数据进行实验验证。试验台由一个2 hp的三相感应电动机轴承和一个测力计组成,该测力计用于产生额定负载,其风扇端和驱动端各有一个型号为SKF-6205-2RS的轴承,振动传感器放在驱动端进行振动信号采集。故障类型分别为内圈故障、外圈故障及滚动体故障,每种故障尺寸分别有0.007 in、0.014 in、0.021 in与0.028 in,电机负载为0~3 hp。
本文取负载为0 hp且故障尺寸分别为0.007 in、0.014 in、0.021 in的内圈、外圈、滚珠故障及正常数据共十类数据,每种故障类型取1000个样本,则共能得到10 000个样本。每类数据取1024个点,并将其尺寸转换成32×32的样本图作为CNN-SVM模型的输入,按照7:2:1的比例划分训练集、测试集和验证集。具体参数如表1所示。
表1 实验数据参数
(1)特征提取可视化
利用卷积神经网络对每种故障中的每个样本进行自适应的故障特征提取,然而卷积神经网络相当于一个黑箱子,为了进一步对卷积神经网络特征提取能力进行分析,本文采用流形学习中常用的t-SNE技术对CNN输出层即特征提取结果进行降维可视化。如图4、图5所示,图4为原始样本分布。从图4可以看出原始数据分布杂乱无章,无法通过原始数据对不同故障进行分类。图5为经过CNN提取特征后的样本分布。
图4 原始数据可视化结果 图5 CNN提取特征后可视化结果
可以看出,虽然样本数据仍有部分误分类,但是相同故障样本已经明显地聚集在一起,得到10个样本群,相比原始数据更利于分类。由此可见,CNN能通过卷积和池化操作同时进行降噪及特征提取的功能。
(2)基于CNN-SVM模型诊断结果
基于卷积神经网络提取出原始数据特征后,利用支持向量机算法对提取出的特征进行分类。SVM本身是一个二值分类器,在解决多分类问题时往往有两种方法。第一类是直接法,直接法是指直接对目标函数进行修改,将多个分类面的参数求解问题合并到一个最优化问题中,通过求解该最优化问题实现一次性多分类,但是该方法计算复杂度高,往往只适用于小样本数据,因此本文采用第二种方法:间接法。间接法是指通过组合多个二分类器来实现多分类器的构造,常见的方法有一对多(OVR)及一对一(OVO)法,本文采用一对一法进行分类。
表2为训练集、测试集及验证集的准确率,由表2可知,CNN-SVM模型能精准地对该滚动轴承故障进行诊断。表3为测试集中CNN-SVM模型对每一类故障的诊断结果。由表3可知,该模型能对每一类模型做到精准分类,除了对第一类故障识别准确率为96.00%及第5类故障识别准确率为78.22%,其它故障准确率均为100%。图6为该模型识别结果的混淆矩阵。由表2、表3及图6可得该模型对轴承故障诊断具有很高精确度。
表2 分类准确率
表3 测试集中每种故障分类准确率
续表
图6 CNN-SVM模型分类结果混淆矩阵
(3)与其他模型结果对比
将本文提出的CNN-SVM诊断模型与以下4个模型进行对比:
①原始数据+SVM
②原始数据+决策树
③原始数据+CNN
④原始数据+CNN特征提取+决策树
表4为CNN-SVM模型与上述4个模型测试集上故障分类的准确率对比结果。由表可知,用CNN对原始数据进行自适应特征提取后的故障分类准确率均高于直接用原始数据进行故障分类准确率,且本文提出的CNN-SVM模型准确率高于其它4种模型。
表4 模型测试集故障分类准确率对比
针对滚动轴承故障诊断提出基于CNN-SVM的滚动轴承故障诊断模型,并以凯斯西储大学滚动轴承数据为对象进行试验验证。经过该模型对实测数据的诊断结果表明,CNN-SVM模型能自适应地对滚动轴承故障特征进行提取且能够很好地对故障特征进行分类,且分类准确度高于其它常见故障诊断模型,由于该模型基于数据驱动,具有很强的鲁棒性,因此可以应用于各类滚动轴承故障诊断中,具有一定现实意义。