摘 要:【目的】为解决传统一维卷积神经网络模型在进行轴承故障诊断时出现过拟合和泛化能力弱的问题,提出了基于改进一维卷积神经网络(1DCNN)的滚动轴承故障诊断方法。【方法】首先,利用全局均值池化层代替传统一维卷积神经网络的全连接层,以减少模型中的参数数量、降低模型复杂度,从而提高卷积神经网络的泛化能力;其次,结合Dropout正则化方法,解决模型过拟合问题;最后,由Softmax分类函数进行分类。【结果】利用凯斯西储大学轴承故障数据集进行验证,结果表明,改进后的1DCNN在进行故障诊断时可以利用相对较少的训练次数就达到较高的准确率和较好的拟合效果,且故障准确率为99.42%。【结论】该方法明显优于传统一维卷积神经网络所呈现的故障诊断效果,对解决实际轴承故障问题具有重要的理论意义和应用价值。
关键词:滚动轴承;一维卷积神经网络;故障诊断
中图分类号:TH133.33;TP183" "文献标志码:A" "文章编号:1003-5168(2024)10-0020-07
DOI:10.19968/j.cnki.hnkj.1003-5168.2024.10.004
Fault Diagnosis Method of Rolling Bearing Based on Improved One-Dimensional Convolutional Neural Network
REN Dezhen1 ZHANG Qinghua2
(1.School of Information and Control Engineering, Jilin Institute of Chemical Technology, Jilin 132000, China; 2.School of Automation, Guangdong Institute of Petrochemical Technology, Maoming 525000, China)
Abstract: [Purposes] To address the issues of overfitting and weak generalization ability when using traditional one-dimensional convolutional neural network models for bearing fault diagnosis, this paper proposes an improved one-dimensional convolutional neural network (1DCNN) method for rolling bearing fault diagnosis." [Methods] Firstly, the proposed method utilizes a global average pooling layer to replace the fully connected layer of traditional one-dimensional convolutional neural networks, reducing the number of parameters in the model, decreasing model complexity, and enhancing the generalization ability of the convolutional neural network. Secondly, by combining the Dropout regularization method, the issue of overfitting in the model is addressed. Finally, the classification is performed by the Softmax classification function." [Findings] Using the Case Western Reserve University Bearing Fault Dataset for validation, the results show that the improved 1DCNN can achieve a high accuracy rate and good fitting effect with relatively fewer training iterations during fault diagnosis, with a fault accuracy rate of 99.42%. [Conclusions] This method significantly outperforms the fault diagnosis results presented by traditional one-dimensional convolutional neural networks, and holds important theoretical significance and application value for solving practical bearing fault problems.
Keywords: rolling bearings;1D convolutional neural networks; fault diagnosis
0 引言
旋转机械的组成结构十分复杂,部件与部件之间存在一定的相互影响,而滚动轴承作为关键部件之一,在机械正常运转的过程中起着非常重要的作用[1]。滚动轴承经常在非常严苛的工况条件下运行[2],因此在机械的运行过程中经常会出现不同程度的异常,轻者可能造成设备停机等情况;严重时甚至会造成人员伤亡[3]。滚动轴承是最容易出现故障的零部件,并且故障的类型也比较多[4],例如:内圈、外圈、滚珠及保持架等。由于滚动轴承异常工况而产生的影响不容小觑,所以研究滚动轴承的故障诊断方法是十分有必要的。
早期故障诊断需要先对轴承振动信号进行处理。振动信号的处理方法有三种:时域分析、频域分析及时频域分析;再提取不同状态下的故障特征,并将这些特征作为输入传送到分类器中进行故障诊断[5]。由于时域难以分析非平稳信号,频域分析进行傅里叶变换的计算量大,而时频域分析具有可以很好地适应实际振动信号非平稳、非线性的特点且精度高、抗干扰能力强,因此常采用时频域分析法处理振动信号,典型的时频分析方法有傅里叶变换、小波变换、S变换等[6]。但早期的故障诊断存在着信号处理困难、特征提取不准确且缺乏自动化和智能化的问题,于是越来越多的学者开始使用深度学习算法进行轴承的故障诊断。这种方法和传统的特征提取方法不同,深度学习算法不再依赖于人工的分式进行特征提取,它能够自动提取故障特征,并与故障类别建立起映射关系[7]。常见的深度学习算法有:深度置信网络、稀疏自编码器、循环神经网络及卷积神经网络等[8]。其中卷积神经网络作为一种非常经典的深度学习算法被很多学者应用于轴承的故障诊断。如:Liu等[9]将一维CNN模型与二维CNN模型进行融合构成新的诊断模型,然后从样本的双域信息中提取故障特征,提高了故障诊断的准确率;刘幸倩等[10]针对CNN在特征提取时的全局特征描述能力不足等问题,提出一种增强卷积神经网络的轴承故障诊断方法,提高了模型的诊断性能;杨云等[11]提出一种改进一维卷积神经网络与双向门控单元的故障诊断方法,通过改进特征提取方式,提高了故障诊断的速度和准确率;王鑫等[12]在传统的卷积神经网络基础上添加了一层神经网络并引入了一层丢弃层,提升了网络诊断准确率;许子非等[13]提出一种基于变分模态分解与卷积神经网络的轴承故障诊断方法,提升了模型的泛化能力。虽然这些故障诊断方法在滚动轴承数据集上的诊断效果是非常可观的,但是大多数都没有将深度学习算法的自适应特征提取能力最大限度地发挥出来,这些方法更多是被用于分类,没有对原始信号进行更深一步的挖掘。因此,本研究采用卷积神经网络作为特征提取器,对原始数据信号进行深度挖掘,并在传统卷积神经网络模型上进行了少许改变。首先,利用全局均值池化层代替全连接层以减少参数数量;其次,结合Dropout正则化技术防止过拟合现象,采用Adam优化算法对参数模型进行优化;最后,结合softmax分类器进行输出,提高诊断效果。
1 1DCNN相关理论
卷积神经网络通过仿造生物的视知觉机制构建,是一种具有局部连接、权值共享等特点的深层前馈神经网络[14]。其核心思想是通过卷积操作来提取输入数据中的特征,并通过池化操作来减小特征图的尺寸。卷积操作使用一组可学习的滤波器(也称为卷积核)对输入数据进行滑动窗口计算,从而生成特征图。在处理一维序列数据时,1DCNN可以更好地处理序列数据中的局部关系,通常由多个卷积层、池化层及全连接层组成,基本结构如图1所示。
1.1 卷积层
卷积神经网络的关键是卷积层,其每一层都是由许多个卷积单元组成。卷积运算的目的是提取输入的不同特征,经卷积运算后,一些特征信息可以得到加强,并建立相应的映射关系[15]。卷积运算见式(1)。
[zlj=ixl-1j*wlij+blj] (1)
式中:[zlj]为第[l]卷积层的第[j]个特征;[xl-1j]为第[l-1]层的第[i]个特征图;[wlij]为权重,表示连接第[l]层上的第[j]个神经元和第[l-1]层上的第[i]个神经元的连接强度;[blj]为偏置,表示在第[l]层上对第[j]个神经元的特定偏置。
1.2 池化层
池化层是卷积神经网络中的一种深度学习层,也称为下采样层。通过模仿人的视觉系统从而对数据进行降维,缩小数据的空间大小,减少计算量,简化网络计算复杂度。池化操作使模型更加关注是否存在某些特征而不是特征的具体位置。池化层经常紧跟在卷积层之后,用于缩小卷积层输出的尺寸。常见的池化层操作为最大池化和平均池化。池化层的操作示意如图2所示。
1.3 Dropout
Dropout是一种正则化技术,可以在训练神经网络时随机让部分节点失活,旨在减轻模型的过拟合现象。具体就是Dropout在每一次训练迭代时,以概率p随机选择一些节点并令它们输出为0,从而进行失活。相当于每一次训练过程都训练了一个不同的子网络,从而增加了模型的泛化能力。为了保持模型的期望输出不变,Dropout技术还需要对失活节点进行缩放操作,即将剩余未失活节点的输出值乘以1/(1-p)。在测试阶段,为了得到稳定的模型预测结果,一般不再进行失活,而是将所有节点的权重乘以(1-p)。
1.4 全连接层
在全连接层中,每一个结点都与上一层的所有结点相连,在经过前面的卷积、池化操作后,将最后一个特征图展开成一维特征,并整合前面各层的特征信息。由于其全相连的特性,全连接层的参数也是最多的。全连接层的激活函数通常为ReLu函数,其后面连接Softmax分类器,从而实现分类功能。全连接的结构示意如图3所示。
1.5 全局均值池化层
全局均值池化层是一种特殊的池化层,可以将卷积层输出的所有特征图都进行池化,最终得到一个特定大小的特征向量。全局均值池化层通过将特征图中的所有元素进行平均池化,从而获得整个特征图的特征向量表示。这是一种简单而有效的特征提取方法,可以代替深层网络结构最后的全连接输出层。全局均值池化层的优点是能够避免模型在训练过程中的过拟合现象,提高模型的泛化能力。
2 改进一维卷积神经网络模型
2.1 改进后1DCNN的模型构建
为提升传统一维卷积神经网络模型的泛化能力,改变模型的过拟合问题,本研究将模型中的全连接层改为全局均值池化层如图4所示。
由图4可知,全连接层首先需要将特征图展开成一维特征,然后对这些特征信息分类并输出;全局均值池化层则是将特征图直接进行降维,将两步整合为一步,然后输入到Softmax分类器中进行分类输出,在很大程度上降低了计算量。改进后的一维卷积神经网络模型如图5所示。
此模型中一共有五层卷积层。每一层卷积核的大小和数量都不尽相同。卷积核的大小会影响网络学习到的特征复杂性。大的卷积核能够捕获更大的感受野,从而使模型能够捕捉到的特征和信息也就更多,但会使网络的局部感知能力下降。因此,前三层卷积采用大卷积核,后两层采用小卷积核。卷积核的数量决定了网络可以学习到的特征数量,所以本研究将这五层卷积核的数量依次增加,每层卷积核的数量分别为8、16、32、64、128。每一层卷积层之后都连接一层池化层,并对输入数据的每一个窗口进行最大值抽取,之后将抽取的最大值作为该窗口的输出,减少数据的维度,并且对平移不变性有很好的效果。在卷积层将采用Dropout正则化技术,随机关闭一部分神经元,以增加模型的泛化能力。全局均值池化层保留了前面各个卷积层和池化层提取到的空间信息,并去除了对输入大小的限制。最后将输出输入到分类器中进行分类。
2.2 改进后1DCNN的流程设计
本研究所提出的滚动轴承故障诊断方法大致分为三个环节:数据集划分、模型训练及模型测试。首先,直接输入原始的振动信号,采用重叠采样的方式进行样本构造,样本长度为轴承旋转两周的采样点数;然后,划分为训练集、验证集、测试集;最后,将训练集输入到模型当中,选取合适的模型参数,利用测试集数据进行验证,得到输出结果。改进后的一维卷积神经网络的工作流程如图6所示。
3 实验与结果分析
3.1 数据集介绍
该实验所用到的数据来自美国凯斯西储大学轴承数据中心公开的滚动轴承故障振动数据集。故障诊断实验平台包括电机、扭矩传感器、功率测试仪、电子控制器和待测轴承,具体如图 7所示。数据将在四种不同的负载条件下测得,分别为:0 hp(1 797 r/min)、1 hp(1 772 r/min)、2 hp(1 750 r/min)、3 hp(1 730 r/min),依据不同的负载条件形成四个数据集,标为A~D。
该实验的测试对象为驱动端轴承,轴承故障采用的是电火花技术设置的单点损伤,实验以每秒12 000个样本的速度收集数据。轴承的运行状态分为四种,即:正常状态、外圈故障、内圈故障及滚动体故障。在上述的三种故障类别中,每一类故障的损伤直径分别为:7密耳、14密耳、21密耳。因此,每组数据集共有9种损伤状态和1种正常状态,共10种状态,其标签分别为0~9。
每组数据在不同工况下划分300个样本,其中每个样本数据共包含1 024个点,10类标签共包含 3 000个样本数据。随后将实验数据混合打乱顺序,按照2∶1∶1的比例划分为训练集、验证集及测试集。具体划分见表1。
3.2 实验结果与分析
将本研究所提的滚动轴承故障诊断方法应用在上述四种数据集上。在搭建好的模型上将训练迭代次数设为200次,之后进行故障诊断,得出实验结果。但由于实验结果会伴有随机性,所以为避免出现这种情况,在每组数据集上分别进行十次实验,取十次实验结果的均值作为最后的准确率结果。将传统一维卷积神经网络的实验结果与改进后的一维神经网络的实验结果进行对比,其结果见表2。
以数据集A(0hp)为例,本研究所提的滚动轴承故障诊断方法的分类识别准确率和损失率曲线如图8和图9所示;传统CNN的分类识别准确率和损失曲线如图10和图11所示。
由图8和图9可知,训练集精度和损失分别为99.47%和0.007。开始训练时,曲线振幅比较大,迅速上升,迭代24次时,数值达到0.9;迭代100次时数值达到峰值,之后,曲线震荡的赋值较小,准确度逐步稳定在99.47%左右。由图10和图11可知,训练集精度和损失分别为94.32%和0.126。因此,传统1DCNN模型的精度和损失率都不如本研究方法所构建的1DCNN模型。
为了进一步验证本研究所构建模型的泛化能力,将测试集样本输入到训练好的模型中,所得结果用混淆矩阵进行展示如图12所示。
由图12可知,轴承正常样本被完全识别,识别率为100%。在三种故障当中,滚动体故障有4个样本识别错误,识别率为99.47%;外圈故障和内圈故障没有错误样本,识别率为100%。综上所述,本研究所提模型具有良好的泛化能力。
为了进一步地验证本研究所提方法的故障诊断效果,将其他基于CNN和基于SVM的轴承故障诊断方法与本研究所提的方法进行比较,实验结果见表3。
由表3可知,前五种方法都在传统CNN模型或SVM模型上进行了改进,这些方法都有一个共同点,都需要先将信号转换为适合模型处理的格式,再通过模型进行分类或识别,增加了模型的复杂度。而本研究所提的方法可以直接提取信号中的特征,在处理一维序列数据方面具有优势。由故障识别准确率可知,本研究所提的方法相较于其他方法在轴承故障诊断方面具有更加优越的效果。
4 结论
本研究提出的一种改进一维卷积神经网络的故障诊断方法,使用全局均值池化层代替传统卷积神经网络的全连接层,有效地减少了模型的参数数量和计算量。并通过结合正则化技术,有效地防止了过拟合现象。由于模型参数的减少导致模型的复杂度降低,所以更加便于训练。通过对不同工况进行实验,本研究所提的方法相比于传统1DCNN模型可以达到更高的故障识别率和更好的拟合效果,能够有效识别实际滚动轴承的故障状态,证明了该方法的有效性和可行性,对于解决实际轴承故障中存在的复杂、多变问题具有重要的理论意义和应用价值。
参考文献:
[1]刘鸣慧,熊建斌,苏乃权,等.基于深度学习的石化机组轴承故障诊断综述[J].机床与液压,2023,51(6):171-180.
[2]WANGL Y, ZHAO W G, LIU Y. Rolling bearing faultdiagnosis based on wavelet packet neural network characteristic Entropy[J]. Advanced Materials Research,2010,993(108-111):1075-1079.
[3]程亮,董子健,王树民,等.基于改进一维卷积神经网络的滚动轴承故障诊断分析[J].机械设计与研究,2023,39(3):126-130.
[4]王体春,解缙,咸玉贝,等.滚动轴承故障诊断的TD-DCCNN方法研究[J].重庆理工大学学报(自然科学),2023,37(7):135-143.
[5]郭盼盼,张文斌,崔奔,等.基于增强深度卷积神经网络的滚动轴承多工况故障诊断方法[J].振动工程学报,2023.
[6]FENG Z P,LIANG M,CHU F L.Recent advances in time-frequency analysis methods for machinery fault diagnosis: a review with application examples [J]. Mechanical Systems and Signal Processing,2013,38(1):165-205.
[7]李欢,吕勇,袁锐,等.基于深度卷积神经网络的滚动轴承迁移故障诊断[J].组合机床与自动化加工技术,2023(2):90-94.
[8]周奇才,沈鹤鸿,赵炯,等.基于改进堆叠式循环神经网络的轴承故障诊断[J].同济大学学报(自然科学版),2019,47(10):1500-1507.
[9]LIU J,SUN W,LI H K,et al. The method of rolling bearing fault diagnosis based on multi-domain supervised learning of convolution neural network [J]. Energies,2022,15(13): 4614-4614.
[10]刘幸倩,唐友福,李明磊,等.基于增强卷积神经网络的滚动轴承故障诊断[J].石油机械,2023,51(8):124-131.
[11]杨云,丁磊,张昊宇.改进一维卷积神经网络与双向门控循环单元的轴承故障诊断研究[J].机械科学与技术,2023,42(4):538-545.
[12]王鑫,胡天亮,习爽.基于卷积神经网络的轴承故障诊断方法[J].林业机械与木工设备,2021,49(10):50-54,59.
[13]许子非,缪维跑,李春,等.基于变分模态分解与卷积神经网络的轴承故障诊断[J].热能动力工程,2021,36(3):55-63.
[14]程学珍,王常安,李继明,等.基于自适应神经模糊Petri网的电机故障诊断[J].山东科技大学学报(自然科学版),2020,39(3):109-117.
[15]刘林密,崔伟成,李浩然,等.基于卷积神经网络的滚动轴承故障诊断方法[J].计算机测量与控制,2023,31(9):9-15.
[16]谷玉海,朱腾腾,饶文军,等.基于EMD二值化图像和CNN的滚动轴承故障诊断[J].振动.测试与诊断,2021,41(1):105-113,203.
[17]李恒,张氢,秦仙蓉,等.基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[J].振动与冲击,2018,37(19):124-131.
[18]樊星男,刘晓娟.二维卷积神经网络在轴承故障诊断中的应用[J].机械设计与研究,2022,38(3):109-113,117.
[19]张涛,王朝阳,吴鑫辉,等.基于多维特征与IGWO-SVM的电机轴承故障诊断[J].兵器装备工程学报,2023,44(9):149-154,210.
[20]刘谨言,买买提热依木·阿布力孜,项志成,等.基于改进的灰狼优化算法与SVM风机轴承故障诊断[J].机械传动,2023,47(9):160-169.