基于AlexNet和迁移学习的滚动轴承故障诊断研究*

2021-08-23 08:47院老虎陈源强杜白雨张泽鹏
机电工程 2021年8期
关键词:故障诊断卷积轴承

院老虎,陈源强,杜白雨,张泽鹏,刘 刚

(1.沈阳航空航天大学 航空宇航学院,辽宁 沈阳 110136;2.中油国际管道有限公司,北京 102206)

0 引 言

滚动轴承的应用非常广泛,在装备制造中是不可缺少的重要基础零部件,是决定重大装备产品性能、质量和可靠性的关键部件,被称为“工业的关节”。同时,它们必须以固定的转速支撑重负载,故也是最常发生故障的组件,约占所有故障组件的51%[1,2]。因此,研究准确、高效的滚动轴承状态监测和故障诊断方法具有十分重要的意义,该研究内容也一直是机械故障诊断的重点发展方向[3]。

目前,滚动轴承故障检测的方法主要有温度诊断法[4]、声学诊断法[5]、振动诊断法[6]等。振动诊断法主要分为特征提取和筛选、故障分类两个主要步骤。由于振动信号分析方法有适用轴承类型广、能诊断早期故障等优点,已广泛应用于旋转机械故障诊断中。当前,已有一些学者提出了如集合经验模态分解[7]、经验模式分解[8]、小波变换[9]等基于振动信号的滚动轴承故障特征提取方法。

然而,这些方法均不能进行大数据批量处理。为解决这一问题,一些学者提出将振动信号里提取的特征用贝叶斯分类器[10]、支持向量机(support vector machine, SVM)[11]、模糊推断及人工神经网络[12-14]等分类器进行分类,批量处理数据。但是,传统的智能故障诊断方法需要进行复杂的人工特征提取,且不同的轴承故障类型也需要不同的特征提取方法,故此类方法在简易性方面有一定的局限性。

随着深度学习方法的兴起,其逐渐被人们应用于故障诊断领域,以解决传统方法中存在的特征提取问题。2006年,HINTON G E等人[15]提出了使用自编码器降低数据的维度,并提出了使用预训练的方法,快速训练深度置信网络以抑制梯度消失。自此开始,深度学习作为一种兴起的模式识别方法,在图像识别、声音识别以及自然语言处理等方面进入了快速发展阶段[16,17]。同时,由于深度学习的多层次结构,可以学习数据中的隐含表征参数,并建立表征参数与类别之间的复杂映射关系,在故障诊断领域中也得到了大量的关注。CHEN Zhi-qiang等[18]提出了用DBN、DBM和SAE 3种深度模型进行轴承故障诊断,证明了这3种方法所实现的结果非常可靠。JANSSENS O等[19]使用FFT对轴承振动信号进行了预处理,再使用深度卷积模型对输入数据进行了特征提取,从而得出诊断结果。GUO Sheng等[20]提出了一种先对滚动轴承振动信号进行连续小波变换,并使用卷积神经网络对得到的尺度图进行分类的诊断方法。ZHANG Wei等[21]直接处理了振动信号并结合区域适应性方法,使用深度卷积模型对轴承故障进行了诊断,提高了模型诊断的效果。虽然深度学习方法避免了人工设计特征,使识别准确率有了大幅提升,但是模型的训练往往依赖大量的带标签数据,而数据的标注也会使人力成本增加。此外,与图像数据不同,轴承的振动数据需要使用专用的加速度传感器进行采集,这会使物力成本增加。因此,带标签的轴承振动样本数据数量较少且不易获取。

迁移学习是一种解决域适应问题的方法,即对于带大量标签数据及可用参数设置的源域,通过迁移已学习的知识,处理带少量标签的目标域[22]。在迁移学习中,只需微调训练后的模型并使用少量标记数据对其进行训练,即可将其应用于不同的工作。迁移学习可以在普通的个人计算机上实现,对硬件没有太高的要求,且通常只需较短的时间即可完成模型的训练。近年来,在机器学习领域,迁移学习引起了人们极大的兴趣,已广泛地应用于故障诊断、情感识别以及图像分类等相关的领域。LI Xu-dong等[23]设计了一种用于不同类型组件故障诊断的集成方法,扩展了迁移学习应用的范围。HUNG J C等[24]通过两阶段迁移学习的设计,改进了学习情感识别模型。KHAN S等[25]使用了将预先训练的CNN架构进行迁移学习的方法,在乳腺癌细胞学图像中对乳腺癌进行了检测和分类。

本文结合AlexNet和迁移学习,构建一种用于滚动轴承故障类型检测的振动图像模式识别方法;利用AlexNet网络模型在深层特征提取方面的优势和迁移学习方法在样本量需求方面的优势,解决传统诊断方法的复杂人工特征提取问题和深度神经网络训练需要海量数据的问题。

1 方法介绍

本文提出了一种基于AlexNet和迁移学习的滚动轴承智能故障诊断方法,用于解决工程实际中滚动轴承故障数据较少且难以获取的问题。该章节包括两个部分:AlexNet的迁移学习和所提出方法的一般步骤。

1.1 AlexNet的迁移学习

2012年,KRIZHEVSKY A和HINTON G E等人在深度学习思想的影响下设计了基于卷积神经网络的AlexNet模型,AlexNet模型已在数量100多万张、种类1 000类的图像上进行了训练,学习了丰富的特征表示。在机器视觉领域学术竞赛(image-net large scale visual recognition challenge, ILSVRC)中,AlexNet模型在Top-5上的分类精度达到了84.7%,而第2名仅为73.8%[26]。

AlexNet神经网络模型包含5个卷积层以及3个全连接层,共8个学习层。所有卷积层和全连接层的激活函数均采用新的激活函数-整流线性单元ReLU,即:

ReLU(x)=max(x,0)

(1)

如果输入不小于0,则ReLU的梯度始终为1。已经证明,以ReLU作为激活函数比以tanh作为激活函数的深层网络的收敛速度更快。最后的输出层为一个1 000类的Softmax层,产生一个1 000类标签的分布。其激活函数可以表示为:

(2)

Softmax可以将输出限制在(0,1)范围内,从而确保神经元被激活。

AlexNet的第一个卷积层由96个尺寸为11×11×3、步长为4的卷积核组成。第二个卷积层将第一个卷积层的输出作为输入(包括局部响应归一化和池化),该层由256个尺寸为5×5×48的卷积核组成。第三、第四、第五个卷积层顺序相连,其间不进行池化和归一化。第三个卷积层由384个尺寸为3×3×256的卷积核组成,并与第二个卷积层相连(归一化、池化)。第四个卷积层的卷积核大小为3×3×192,数量为384,第五个卷积层中含有256个尺寸为3×3×192的卷积核。

AlexNet的模型图如图1所示。

图1 AlexNet模型图

AlexNet表现出了很好的分类能力,但是训练十分耗时。此外,本文的故障图像数据集仅包含少量样本,不适合如此规模的深度网络训练。

因此,本文运用迁移学习来解决这个问题,AlexNet的迁移学习如图2所示。

图2 AlexNet的迁移学习

本文将AlexNet的最后三层替换为具有与故障类别数目相同的节点数的全连接层、Softmax层和分类输出层。然后,整个结构将分为两部分:保留层和替换层。

预训练网络中的参数已经在ImageNet上使用数百万张图像进行了训练,并且提取的特征已被证明对分类有效。只需要对这些参数进行边际调整即可适应新图像。

因此,保留层中的参数将保留并用作初始化,可以帮助训练收敛。替换层中的参数仅占整个网络的一小部分,使用小型数据集便可进行训练。

1.2 所提方法的一般步骤

本文提出了一种基于AlexNet和迁移学习的方法,用于轴承智能故障诊断。

所提方法的流程图如图3所示。

一般步骤描述如下:

步骤1:搜集滚动轴承的振动数据;

步骤2:不进行任何信号预处理或特征提取,将原始振动数据转换为振动信号图,给图像设定对应故障标签并分为训练样本和测试样本;

步骤3:微调预训练的AlexNet以构造适用于图像集的新的神经网络;

步骤4:使用训练样本对新构造的网络进行训练;

步骤5:使用测试样本对训练完成的网络模型进行测试。

2 实验验证

本文使用美国凯斯西储大学轴承数据中心数据集[27]作为实验数据,数据通过恒转速台架试验获得。

2.1 数据采集

美国凯斯西储大学测试台如图4所示。

图3 所提方法流程图

图4 实验设施

测试台包括:测力计(右)、2 HP电动机(左)、扭矩传感器/编码器(中心)。该测试台还包括一个控制电子设备,但未在图中显示。

通过放电加工将直径为7密耳(1密耳=0.001英寸)的单点故障引入这些轴承中,分别设置了内圈和滚动体上破坏直径为0.177 8 mm、0.355 6 mm、0.533 4 mm和0.711 2 mm的损伤,外圈6点钟位置破坏直径为0.177 8 mm、0.355 6 mm、0.533 4 mm的损伤。使用加速度计收集震动数据,将该加速度计通过磁性底座固定在外壳上。

两个驱动器外壳上的加速度计均位于12点钟位置。使用16通道DAT记录仪收集振动信号。试验轴承为SKF 6205-2RS JEM型深沟球轴承,轴承转速为1 797 r/min,采样频率为12 kHz和48 kHz。

2.2 数据处理

笔者选择在驱动端以12 kHz的频率采集轴承正常状态、内圈故障、滚动体故障、外圈故障这4种状态的振动数据来验证所提出方法的有效性,振动信号图如图5所示。

图5 故障振动信号

为了有足够的样本用于训练和测试分类器,笔者从每种状态下的故障信号原始数据中划分出15个长度为400的段,划分过程如图6所示。

图6 信号分割

将这4种类别的故障图分别保存并设定对应标签为正常状态、内圈故障、滚动体故障、外圈故障,将所有类别的数据文件整合到一起,构成一个包含60张图像的数据集。最后,在整理好的图像中随机选择每种故障类型下的70%作为训练样本,其余30%均作为测试样本。

2.3 网络模型的构建

(1)输入样本数据定义

要想使训练后的网络有较好的轴承故障诊断结果,需要提供一定数量的样本数据给网络进行训练。笔者把2.2节中处理好的美国凯斯西储大学的训练样本作为神经网络模型的输入。

(2)不同输出状态定义

笔者定义4种输出状态,分别对应美国凯斯西储大学数据集中的正常状态、内圈故障、滚动体故障、外圈故障。

(3)深度神经网络构建

结合以上两步所述,笔者构造了一种基于AlexNet和迁移学习的新的神经网络。

具体步骤如下:

(1)加载预训练的AlexNet网络模型;

(2)用包含4个神经元的全连接层、Softmax层以及分类输出层替换原AlexNet模型中的分类层,将输出的类别由原有的1 000类替换为标签的种类数。

2.4 实验结果

初步搭建的神经网络要通过训练才能用于新对象的分类,笔者将处理好的滚动轴承振动数据中的44组样本导入MATLAB中作为构建好的神经网络模型的输入,设置最小批量大小为10,最大历时为8,期望误差为10-4。

随着训练的进行,训练集和验证集的准确率变化曲线和损失函数变化曲线如图7所示。

图7 准确率变化曲线(上)和损失函数值变化曲线(下)

由图7可知:当迭代次数达到13次时,误差已降低至期望误差限。

当完成模型训练后,笔者将振动数据中的剩余6组样本作为检验样本,测验训练出的网络模型对滚动轴承的故障诊断准确率。

为了进一步验证所得模型的鲁棒性,重复试验10次,最终试验结果如表1所示。

表1 10次试验的准确率

从表1可以看出:本文构建的深度神经网络实现了从源任务(对ILSVRC中的1 000类图像进行分类识别)到目标任务(对CWRU中轴承的4种不同状态的振动信号图进行分类识别)的迁移学习,且具有很高的稳定性。

2.5 对比分析

笔者将本文方法与基于从头开始随机初始化权重的卷积神经网络(CNN)方法进行比较。为了确保试验的公平性和结果的可靠性,两种网络均使用CWRU数据集进行训练,并在各自的环境下进行了5次试验。此外,还采用了3种其他诊断方法来分析同一数据集,包括SVM、BP神经网络(BPNN)和深度自动编码器(DAE)。

平均分类准确率与平均训练时间如表2所示。

表2 平均分类准确率与平均训练时间

每种方法的5次试验诊断准确度如图8所示。

图8 分类准确率对比图

通过与现有的先进故障诊断方法对比可知:本文提出的方法在诊断准确率方面有所提高。与不使用迁移学习的常规神经网络模型相比,本文提出的基于迁移学习的诊断方法的模型平均训练时间大大减少。进一步验证了本文所提出的基于AlexNet和迁移学习的轴承故障诊断方法的有效性和优越性。

3 结束语

本文提出了一种基于AlexNet和迁移学习的滚动轴承振动图像模式识别方法,将处理好的原始振动图像构造为模型的训练样本集,构建了适用于滚动轴承故障诊断的神经网络模型,并使用准备好的训练数据集对网络模型进行训练,使用CWRU轴承数据集对模型进行了验证。

研究结果表明:

(1)使用迁移学习方法构造网络模型可以有效降低模型对训练数据样本数量的要求,更加适用于实际工程应用中样本数量较少的情况;

(2)使用AlexNet和迁移学习方法训练出的轴承故障诊断模型在使用CWRU轴承数据集进行验证时得到了100%的分类精度,优于现有的网络模型。

本文方法的局限性在于,滚动轴承在不同故障状态下的振动信号差异较大、易于分别。笔者后续将就差异较小的故障诊断问题做进一步研究。

猜你喜欢
故障诊断卷积轴承
轴承知识
轴承知识
基于包络解调原理的低转速滚动轴承故障诊断
基于3D-Winograd的快速卷积算法设计及FPGA实现
轴承知识
轴承知识
从滤波器理解卷积
数控机床电气系统的故障诊断与维修
基于傅里叶域卷积表示的目标跟踪算法
因果图定性分析法及其在故障诊断中的应用