IEWT-CS和LCNN在轴承故障诊断中的应用

2020-07-28 01:53:04陈志刚杜小磊张楠张俊玲

哈尔滨工程大学学报 2020年3期

陈志刚，杜小磊，张楠，张俊玲

(1.北京建筑大学机电与车辆工程学院，北京 100044； 2.北京市建筑安全监测工程技术研究中心，北京 100044)

滚动轴承是旋转机械的关键部件之一，其健康状况直接影响整机的工作性能，因此对滚动轴承进行及时诊断具有重要意义。

对轴承进行故障诊断时，噪声的存在会对诊断结果产生很大影响，在轴承振动信号降噪方法中，小波阈值法降噪时阈值和小波基函数难以选取；奇异值分解 (singular value decomposition，SVD)[1]降噪法在噪声强度较大时效果差；局部均值分解(local mean decomposition，LMD)、固有时间尺度分解(intrinsic time scale decomposition，ITD)、经验模态分解(empirical mode decomposition，EMD)[2]降噪需要对信号反复迭代，存在端点效应和虚假分量问题；变分模态分解(variational mode decomposition，VMD)[3]降噪时预先设定的模态分量个数会直接影响降噪效果。压缩感知(compressive sensing，CS)[4]降噪避免了阈值选取问题，通过对轴承振动信号进行压缩采样并重构实现信号的降噪。经验小波变换(empirical wavelet transform，EWT)[5]降噪通过自适应分割信号的频谱并构造合适的小波滤波器提取不同的模态函数，降噪结果更稳定。

在当今大数据时代，传统的基于“特征提取+模式识别”的轴承智能故障诊断模式越来越不能满足自动化诊断要求。深度学习[6]克服传统智能诊断方法的固有缺陷[7]，很大程度上摆脱依赖诊断专家的信号处理与特征提取经验，一些深度学习技术已经进入机器健康监测系统。赵光权等[8]利用深度置信网络(deep belief network，DBN)直接对滚动轴承时域振动信号进行自动特征提取与分类。曲建岭等[9]将轴承原始时域振动信号直接输入卷积神经网络模型，从而实现对原始振动信号的逐层自适应特征提取。但在轴承故障诊断中广泛使用的DBN、堆栈自编码器等逐层深度学习技术所需要调整的参数众多，诊断过程耗时过长且极易受到噪声影响[10]；而普通卷积神经网络一般对数据的行方向和列方向均进行卷积融合运算，对于图像来说合理，但对轴承振动信号这种一维信号采用卷积运算是不合理的。基于CS、EWT和深度学习的优势，本文提出一种改进EWT-CS(improved EWT-CS，IEWT-CS)联合降噪法结合导联卷积神经网络(lead convolution neural network，LCNN)的轴承故障诊断方法。本文提出方法通过CS和改进经验小波变换(improved empirical wavelet transform，IEWT)方法对轴承振动信号进行联合降噪，LCNN用于从降噪后的振动信号中自动提取特征并识别故障，避免了人工特征提取。实验结果表明，提出方法具有很好的可行性和有效性。

1 压缩感知降噪原理

设N维纯净轴承振动信号为x，N维噪声信号为n，则轴承加噪振动信号可表示为xn=(x+n)。由压缩感知原理对其进行低维观测，设压缩感知观测矩阵为Φ(M×N维，M

y=Φxn=Φ(x+n)

(1)

构造稀疏字典矩阵ψ(N×N维)，字典矩阵ψ可对信号x稀疏化，由于噪声信号不具备稀疏性，所以ψ无法将噪声信号n稀疏化。将原始振动信号x和噪声信号n在ψ中展开，可得：

(2)

式中：θx和θn表示x和n在字典ψ上展开的系数向量，此时y可重写为：

y=Φψ-1(θx+θn)

(3)

由ψ的选择原则可知θx是稀疏的，θn不是稀疏的，设θx的稀疏度为kx，θn的稀疏度为kn，则有kx≪kn

2 改进经验小波变换

传统EWT算法自适应划分轴承振动信号频谱，并建立合适的小波滤波器提取不同频段的调幅-调频成分，从而将原始信号f(t)分解为N个单分量模态函数之和。为了找出频谱区间边界，Gilles[13]给出了4种边界检测法：局部极大值法、局部极大极小值法、自适应法和尺度空间法。前两种方法需要人为设置子分量个数；自适应法要考虑每个边界可能出现的位置；尺度空间法可能使得某些频率成分无法分离。朱永利等[14]提出一种双阈值筛选法来确定VMD中的分解模态数，较好的对局部放电信号进行了特征提取，鉴于VMD模态数k的确定方法，提出一种基于振动信号功率谱确定EWT分解模态数的幅值阈值筛选法。

功率谱表示信号功率和频率之间的关系。轴承振动信号由于易受噪声干扰，功率谱具有较强的随机性。采集到的轴承振动信号通常是复杂的非平稳信号，其中多振源激励和响应相互耦合，包含多种干扰成分，每种成分都有相应的频域特性，因此，可以将轴承振动信号的整个频段分成若干个具有窄带特性的带宽，并根据相应频带中的频率幅值判断该频带是否为有效频带，有效频带的个数即为调幅-调频分量个数。基于EWT分解模式和信号功率谱的特点，提出一种基于轴承振动信号功率谱幅值阈值筛选法以确定EWT分解模态数。幅值阈值T用以度量信号功率谱中相应频率的幅值，幅值超过T的频率被认为是原信号中的有用频率分量，被保留；幅值过小，则看做干扰忽略。使用幅值阈值筛选法确定模态数的具体实现步骤如下：

1)基于被分析轴承振动信号的频域特性确定幅值阈值T。

2)计算振动信号相应的功率谱。

3)得到功率谱的局部极大值点以及相应的下标序列。

4)基于幅值阈值T对步骤3)中得到的局部极值进行判断。幅值大于T的极值对应的下标视为有用边界，相应频带作为被分析信号的有效频带。

5)统计有效边界，得到有效的频带区间，即得到分解模态数。

在本文中，幅值阈值T依据Otsu准则[15]自适应确定，即选择特定阈值T以最大化有用频率分量和干扰频率分量之间的方差，此时2类数据之间的差异也最大。基于Otsu准则确定幅值阈值T的基本原理如下：将轴承振动信号功率谱幅值视为长度为m的离散序列{xi}，i=1，2，…，m，xmax、xmin分别为序列最大值和最小值。令灰度对应功率谱中频率幅值大小，L为灰度等级，另dx=(xmax-xmin)/L。统计幅值落在[(l-1)dx，ldx]内的值的数量为nl，l为灰度值，l=1，2，…，L。灰度值l出现的概率为pl=nl/N，N=n1+n2+…+nL。将序列{xi}的频率幅值分成2类，幅值落在[0，kdx]内的构成一类，记C0；幅值落在[(k+1)dx，Ldx]内的构成另一类，记C1。文献[16]给出2种灰度均值μ0(k)、μ1(k)和方差σ02(k)、σ12(k)的计算公式，则C0和C1的类内方差之和为：

(4)

式中：μ为整个序列的灰度均值，计算式为：

(5)

(6)

(7)

(8)

信号重建公式为：

(9)

信号f(t)可被分解为：

(10)

(11)

式中k=1，2，…，N-1。

信号经IEWT分解为若干模态分量后，按相关系数-峭度准则[16]选出故障特征较为明显的模态分量并重构信号。模态分量所包含的冲击成分越多，峭度值越大；模态分量与原信号的相关性越大，相关系数越大。

3 导联卷积神经网络

采用多传感器对轴承进行监测，增加了信息的多样性和完整性，能够更全面地反映轴承运行的状态，进行故障诊断时可获得更高的准确度。多传感器数据结构类似于二维图像，但传感器间数据的相关性与传感器内数据的相关性程度不同，若采用普通卷积神经网络对数据的行方向和列方向均进行卷积运算，对图像来说合理，但是运用到多传感器振动数据，则不同传感器(列方向)同一时间段内(行方向)的轴承振动数据就会有卷积运算，同一传感器内的数据是时间相关的，采用卷积运算是合理的；但传感器间的数据是相互独立的，如果要进行卷积运算，则要考虑到不同传感器的所有不同组合情况。金林鹏等[18]基于多导联心电信号这种特殊的二维数据结构，提出了LCNN，而多导联心电信号与多传感器振动信号的数据结构相似，因此，针对多传感器数据结构，将LCNN引入轴承故障诊断中，LCNN结构如图1。

图1 导联卷积神经网络结构Fig.1 The structure of LCNN

卷积单元CU有多个特征面，1D-Cov为一维卷积运算，每只传感器通道均有3个卷积单元，不同传感器间的卷积单元互不相干，本文设置有8只传感器，则共有24个卷积单元。普通的卷积神经网络只要3个卷积单元，每只传感器通道的振动数据依次通过最适合自身的3个卷积单元，然后汇总所有传感器通道的信息做最后的分类。本文选择适用于多分类问题的Softmax回归层做最后的分类，下面给出导联卷积神经网络前向计算公式：

设输入样本为x=[x1，x2，…，x8]，其中xi(1≤i≤8)为第i个传感器通道的数据，fc为卷积函数，fs为池化函数，则网络输出为：

(12)

式中：gAi、gBi、gCi表达式均为fs(fc(x))，但计算权值不同，函数的计算公式为：

(13)

(14)

gD(·)为全连接层计算函数，表达式为：

gD(x)=φ(Wx+b)

(15)

式中：φ通常取ReLU函数，表达式为：

(16)

gE(·)为Softmax层计算函数，假设任务为K分类问题，则表达式为：

(18)

式中Wj和bj为权重和偏置。

导联卷积神经网络采用和卷积神经网络相同的反向传播(back propagation，BP)训练算法，步骤见文献[17-18]。

综上，故障诊断步骤如下:

1)获取轴承不同故障状态振动信号样本集，构造K-SVD字典矩阵。

2)利用K-SVD字典矩阵对振动信号进行第1次降噪。

3)利用IEWT方法和相关系数-峭度准则对信号进行第2次降噪并重构信号。

4)从去噪样本集中选取80%作为训练样本，其余作为测试样本。

5)根据实际样本数据大小确定卷积层、池化层、卷积核、特征平面、学习率等参数。

6)将训练数据输入导联卷积神经网络中进行有监督网络训练，通过反向传播算法调整整个网络的权值和偏置等参数。

7)根据测试样本集的结果判断是否满足实际期望的诊断效果，如果诊断正确率过低则修正网络，再重复步骤5)和步骤6)，直到达到预期精度。图2为总流程图。

图2 故障诊断流程Fig.2 Fault diagnosis flow chart

4 实验验证

4.1 滚动轴承实验数据描述

在本实验中，滚动轴承的振动数据是从滚动轴承故障模拟实验台获得的，如图3，实验台由驱动器、电磁制动器、测试轴承等组成。轴承型号为SKF，使用电火花技术在轴承内圈、外圈和滚动体上加工故障直径分别为0.18 mm和0.36 mm的切槽，用8只传感器采集不同故障状态下的滚动轴承振动信号。转轴转速设为1 500 r/min，采样频率为24 kHz，负载为0.73 kW，转轴转1圈，传感器采集约960(48 000×60/1 500≈960)个数据点。训练LCNN网络需要大量训练样本，采用文献[9]的方法对训练数据进行有重叠样本分割，从而实现数据扩充，这种分割方式既增加了训练样本数量，又可以使LCNN的学习更具鲁棒性。最后选择了不同故障类型、不同故障严重程度的7种状态，每种状态包含1 000个样本，随机选取800个作为训练样本，剩余作为测试样本，每个样本由1 900个采样数据点组成。表1列出了7种轴承工况。为减少噪声干扰，将轴承原始信号归一化到[0，1]:

表1 7种轴承状态Table 1 Seven bearing working conditions

图3 轴承实验台Fig.3 The rolling bearing experimental setup

x′=(xi-xmin)/(xmax-xmin)

(18)

图4为7种轴承工况下的时域波形。由图4可知，早期故障信号中冲击成分能量低，噪声干扰严重，且部分冲击淹没在噪声中，振动情况较为复杂，难以区分故障类型及故障程度。且由于传统特征提取方法的不确定性和复杂性，使得轴承早期轻微故障特征不易提取，复合故障特征难以提取，致使故障诊断的难度很大。因此有必要引入深度学习技术以建立各种工况状态与输入信号之间的精确映射关系。

图4 7种轴承状态的振动信号波形Fig.4 Vibration signals of the seven bearing conditions

4.2 CS字典与LCNN网络构造

取轴承7种状态振动样本各500个，每个样本数据点为1 900，使用K-SVD算法训练得到超完备字典。经反复试验，在字典训练中，字典原子个数设为3 000个，稀疏分解原子个数为20，循环次数30次，稀疏字典矩阵ψ∈R1 900×3 000，CS观测矩阵选择高斯随机观测矩阵，重构算法使用OMP算法，OMP算法稀疏度设置为10。

经反复试验，LCNN中卷积层A为8个特征面，卷积核大小1×18，池化核大小为1×3；卷积层B为14个特征面，卷积核大小为1×12，池化核大小为1×3；卷积层C为20个特征面，卷积核大小为1×4，无池化层，全连接层神经元个数为30，Softmax层神经元数为7，代表7种故障类别。网络使用小批量随机梯度下降法来训练网络，其具体思路是在更新每一参数时都使用一部分样本来进行更新，从而使得梯度下降更加稳定，同时小批量的计算，也减少了计算资源的占用，本文设置小批量训练尺寸为30。代价函数选择交叉熵函数，最大训练迭代次数8 000次。每个卷积运算之后、激活函数之前，使用批归一化方法，该方法使得卷积提取后特征均值为0，方差为1，可以获得较大的学习速率，而且可以省去Dropout层，且会避免过拟合。网络训练时学习率为0.05，动量值为0.05。为了验证提出方法的有效性和鲁棒性，共进行5次试验。

4.3 实测信号降噪分析

按照4.2节K-SVD算法得到超完备字典，以图4内圈故障振动信号为例，经CS降噪后的结果如图5所示。

图5 压缩感知降噪结果Fig.5 CS noise reduction result

以均方根误差和信噪比衡量降噪效果，计算见文献[19]。均方根误差越小且信噪比越高，表明降噪效果越好。经计算，降噪前信号信噪比和均方根误差分别为1.751和0.698，经CS降噪后信号信噪比和均方根误差分别为4.67和0.402，这说明CS方法很好地实现了降噪。分别采用EMD和IEWT对经CS降噪后的信号进行分解，如图6和图7所示。

图7 外圈故障信号IEWT结果Fig.7 IEWT result of outer ring fault signal

由图6可以看出，EMD分解模态混叠严重，干扰过多。以IEWT分解结果为例，经计算，imf2和imf5分量峭度值和相关系数值最低，舍弃，将其余分量进行重构。经EMD和IEWT分解降噪后的重构信号如图8。经计算，EMD降噪后信号信噪比和均方误差分别为5.12和0.389，经IEWT降噪后信号信噪比和均方误差为7.79和0.205，表明IEWT分解效果优于EMD，很好地实现了2次降噪。

图8 EMD和IEWT降噪结果Fig.8 EMD and IEWT noise reduction result

图6 外圈故障信号EMD结果Fig.6 EMD result of outer ring fault signal

4.4 诊断结果与分析

为了验证提出方法的优越性，采用人工神经网络(artificial neural network，ANN)、支持向量机(support vector machine，SVM、DBN)、CNN、深度稀疏自动编码器(deep sparse auto-encoder，DSAE)等方法进行分析比较。本文提出的方法输入的是降噪后的振动数据(1 900维)。其中ANN、SVM的输入是24个特征(11个时域特征和13个频域特征)，有关这24个特征参数见文献[20]。

方法1(24个特征参数输入ANN) ANN结构为24-59-7，学习速率为0.1，迭代次数为500次。

方法2(24个特征参数输入SVM) SVM采用RBF核函数，核函数的惩罚因子和半径分别为28和0.15，由10折交叉验证法确定。

方法3(降噪数据输入DBN) DBN的结构为1 900-900-450-200-50-7，每个限制玻尔兹曼机的学习率、动量因子和迭代次数分别为0.04、0.1和200。

方法4(降噪数据输入CNN) CNN输入层维数为8×1 900，有3个卷积层，第1卷积层有8个特征面，每个特征面使用1个3×18的卷积核，池化核大小为2×2；第2卷积层使用大小为3×12的卷积核，有14个特征面，池化核大小为2×2；第3卷积层使用3×8大小的卷积核，20个特征面，池化核大小为3×3，最后1层为Softmax分类器输出。

方法5(降噪数据输入DSAE) DSAE的结构为1 900-900-450-200-50-7，每个稀疏自编码器的学习率为0.14，动量因子为0.1，迭代次数为200。

方法6未降噪数据输入LCNN。表2列出了测试阶段的平均诊断准确率与标准差，图9列出了在每次试验中采用不同方法测试的详细诊断结果。

从表2中可以看出，与其他方法相比，提出方法具有更高的测试准确率和最小的标准差，平均测试正确率达到98.58%，高于其他方法。与DBN、DSAE和普通CNN等深度学习方法相比，提出方法具有更好的稳定性，且信号降噪后的识别结果比未降噪信号的识别结果高出4个百分点，充分说明了降噪的必要性，提出方法能够稳定地区分滚动轴承的不同故障类型、不同故障严重程度。从图9可以看出，提出方法每次测试的准确率分别为99.18%、99.73%、97.93%、97.55%和98.15%。比较结果表明，提出方法具有更高的故障识别精度和稳定性。主要原因是：1)提出方法能够通过多个非线性变换有效地从输入数据中提取特征，而ANN和SVM等传统方法的性能很大程度上依赖于人工特征提取。从原始特征集中选取敏感特征后，虽然诊断结果提高，然而，这是一项非常耗费时间的任务。2)提出方法考虑到了不同传感器的不同组合情况，使每个传感器振动数据都有最合适的滤波器。

图9 不同方法的5次测试结果Fig.9 Detailed testing results of different methods for 5 trials

表2 不同方法的诊断结果Table 2 Diagnosis results of different methods

相比传统的故障识别算法，LCNN包含了自动特征提取过程，每一层对应一组特征输出，最后一层给出分类结果。以正常状态轴承振动信号为例，本文只给出LCNN提取的卷积单元A1的特征，如图10所示。可以看出，LCNN提取的特征从不同角度表现原始信号，较好地满足了Fisher判别准则[21]，更有利于最后的分类。

图10 正常状态的所提取的A1层特征Fig.10 The extracted A1 layer feature diagram in normal condtion

图11给出了提出方法的第1次测试结果的多分类混淆矩阵，由图可得，复合故障状态b和c的分类正确率较低，这是由于滚动轴承复合故障发生时，产生故障的位置与程度各有不同，导致不同故障特征相互耦合在一起，相比单一故障形式，复合故障特征叠加在一起，彼此干扰，特征信息较微弱，导致复合故障特征提取的难度增加，后期考虑将先验知识加入LCNN，并对LCNN的结构做进一步改进。

图11 多分类混淆矩阵Fig.11 Multi-class confusion matrix

5 结论

1)提出的IEWT-CS联合降噪法先对轴承振动信号样本自身构造CS字典，并进行第1次降噪，避免了阈值的人工选取；使用IEWT算法自适应的划分轴承振动信号谱的边界，从而自动确定分解模态数并利用相关系数-峭度准则进行第2次降噪，降噪效果优于EMD方法。

2)将LCNN引入滚动轴承故障诊断领域，使不同的传感器通道数据配备不同的卷积核进而使每个传感器通道的振动数据都有合适的滤波器，克服了传统的CNN对振动数据特征提取与分类的缺陷。实验结果表明LCNN能有效地对滚动轴承进行多种故障状态的识别，取得了98.58%的平均识别准确率，较好地摆脱了对人工特征提取的依赖，特征提取能力和识别能力优于ANN、SVM、DBN、CNN、DSAE等方法。

后续将对神经元层数、神经元个数以及参数优化方法等方面进行进一步研究。