洪腾蛟, 丁凤娟, 王 鹏 , 冯 定*, 凃忆柳
(1.长江大学机械工程学院, 荆州 434023; 2.湖北省油气钻完井工具工程技术研究中心, 荆州 434023;3.南京林业大学机械电子工程学院, 南京 210037)
设备的高效运转是建立在精准的故障诊断和及时的保养维修的基础上,根据故障诊断的结果能够判断出设备的运转状态,便于及时对故障设备进行维修和保养[1-2]。随着产品更新换代速度的加快和生产效率的提高,工农业生产对故障诊断的高效性、便捷性和精确性提出了更高的要求。目前常用的故障诊断方法有:直接观察法、专家系统法、振动噪声测试法等。传统的故障诊断方法很大程度上依赖于人工干预和经验值判断,无法准确高效定位和识别故障点、故障类型以及故障程度,尤其是对早期故障的发生缺乏预警能力,给工农业生产带来了较大的风险,甚至影响到作业工人的生命安全[3-4]。近年来,随着研究的纵深和应用面的扩展,深度学习技术取得了诸多重大突破,其具有的强大的特征提取能力和优异的学习训练能力引起了轴承故障诊断领域学者的大量关注和研究[5]。深度学习技术能够在海量多维的测量数据中不依赖人工标记故障特征,自动提取有效参数进行学习,以训练优化网络模型,降低环境干扰和工况变化所引起的故障诊断不准确和故障程度辨识率低的问题,促进轴承故障诊断技术向着自动化和智能化方向发展。基于此,主要概述深度置信网络(deep belief network, DBN)、卷积神经网络(convolutional neural network, CNN)和自编码器(auto encoders, AE) 三种典型的深度学习模型,并论述了深度学习在轴承故障诊断领域的应用进展。最后讨论了深度学习在轴承故障诊断领域所存在的问题及未来的发展趋势。
深度学习(deep learning)由Geoffrey Hinton教授在2006年提出[6-7],属于机器学习的分支,也是人工智能研究领域的前沿趋势之一,具有强大的数据处理能力和特征提取与分类能力,广泛应用于设备故障诊断、语言识别、图形图像处理等领域[8-9]。相较于浅层神经网络不易处理复杂函数和自然信号以及模型泛化能力的不足,深度学习具有深层自主学习能力和强大的模型诊断与自我泛化能力有效弥补了传统方法对人工经验的依赖性[10-11]。深度学习的本质,是在机器学习和神经网络专家系统框架中构建大量的隐含层[12],并通过海量的数据训练学习,构建出深层非线性网络结构用以逼近复杂函数,从而提取出所需要的模型特征来提升分类和预测的准确性,具备从少数样本数据学习中直达本质特征的能力。区别于传统的浅层学习,深度学习具有以下特点。
(1)强调了模型架构的层次深度[13]。深度学习与传统的浅层学习具有一定的相似性,二者都是采用分层学习结构,包括输入层、隐含层和输出层。其主要区别在于,深度学习在隐含层中设置了多层次、多维度的隐含节点用以训练和学习,并将前一层的训练结果作为下一层的输入样本,通过逐层训练和学习有效提高了模型的精确性。
(2)突出了特征学习的重要性。深度学习神经网络将分类器与特征学习结合到一起,有效减少了手工设计与提取特征的工作量,系统可自动提取、学习特征信息,并对特征进行逐层组合、变换,将原空间的样本特征变换到新的特征空间,以实现分类、识别和预测的功能[14]。同时由于特征的提取与学习经历了多层次、多维度的泛化过程,其特征表达能力得到了有效提升,能够表达大规模数据和复杂问题。
通过文献分析可知,典型的深度学习模型主要有深度置信网络(DBN)、卷积神经网络(CNN)和自编码器(AE)[15-17]。其中,DBN是多层节点深度学习网络,能将低层数据特征逐层抽象为高层特征表示,无需人工提取特征,提高了学习过程的智能化和精确化,使用大量无标签数据通过逐层贪婪算法对样本进行训练,然后再使用少量有标签数据对整个网络进行微调(fine-tune),得到整个神经网络的最大概率数据,能用于有监督学习,也能用于无监督学习。其模型结构如图1所示。
图1 DBN结构
CNN是深度学习网络的另一种模型,其模型结构如图2所示,包含多个隐层,能通过逐层的特征传递,将低层特征变换到高层特征,以实现特征的学习和表达[18]。通过研究可知,隐含层的数量越多,其模型精度越高[19],和神经网络一样都是有监督学习算法,需要使用有标签的数据作为网络训练的样本,然后用学习得到的模型对待测数据进行预测,广泛应用于语音识别[20]、图像处理[21]、行为检测[22]、文本分类[23]等领域,具有强大的分类能力。
图2 CNN结构
AE[24]分为两个部分:编码器和解码器,它是一个典型的无监督三层神经网络结构,如图3所示,包括输入层、隐藏层和输出层。自编码器通过对误差函数的重构来复现输入数据进而降维并提高特征提取的准确性[25]。在自编码器的框架下,学者开发了变种模型,如降噪自编码器、堆叠降噪自编码器、栈式自编码器、稀疏自编码器等。
图3 AE结构
轴承结构简洁、相对摩阻小、启动性能好,是旋转设备的关键部件,广泛应用于各类装置中,为工农业生产提供了重要支撑和保障[26],但由于工作环境和负载变化等因素影响,极易引起轴承故障[27],给生产作业和经济发展带来重大损失,因此对其进行及时有效的故障诊断具有重要意义[28-30]。
传统的故障诊断方法[31-32]大多集中在浅层学习方面,通过人工提取特征、降维来进行故障诊断[33]。对于多维复杂的故障问题处理能力不足,特征的提取与分类主要依赖人工,缺乏有效的无标签样本学习能力,诊断精度较低,且对数据处理的硬件设备要求较高,体积庞大。
随着深度学习、传感器技术和数据融合研究在故障诊断领域的快速发展,使得实时采集轴承状态信息成为可能,为其高精度故障诊断提供了切实可行的途径。自深度学习引入到轴承故障诊断领域以来,取得了大量的研究成果,相比浅层神经网络,深度学习有着更高的效率和准确性[34]。万齐杨等[35]提出一种基于深度卷积自编码器的轴承故障诊断方法,首先采用小波变换构造出不同状态下振动信号的时频域图,然后使用深度卷积自编码器对时频图进行去噪,最后利用卷积神经网络对去噪后的时频图进行故障分类。结果表明在高噪声环境下,所提出的故障诊断方法比CNN、堆叠降噪自编码器两种深度学习方法具有更高的故障识别率。吴小龙等[36]使用传统的深度神经网络(deep neural networks, DNN)中被广泛用于无监督学习的去噪自编码器进行特征提取,然后对传统的DNN中的去噪自编码器进行稀疏化处理,使得特征的提取更加合理、准确,并在DNN中引入核函数运算,形成多核结构,进一步提高深度神经网络在轴承故障诊断中可靠性、稳定性和诊断精度。Sun等[37]从轴承受力分析、结构优化、环境件构造等角度对轴承的故障诊断展开研究,通过故障数据采集、特征提取与融合,建立了轴承有限元模型,并设置了试验验证,改善了轴承径向载荷不均、滚子损坏和保持架应力集中的不良状况。冯定等[38]通过提取高造斜率井眼轨迹控制工具悬臂轴承故障特征和故障类型,结合其作业特点分析了悬臂轴承的失效原因,并给出了推荐使用的轴承型号。杜小磊等[39]提出一种基于改进深层小波自编码器的轴承故障智能诊断方法,该方法改进小波自编码器的损失函数并引入收缩项限制,再将多个小波自编码器进行堆叠构成深层小波自编码器,并引入“跨层”连接缓解梯度消失现象,最后利用大量无标签数据对网络进行无监督预训练并利用少量带标签数据对模型参数有监督微调,结果表明该方法能有效地对轴承进行多种故障类型和故障程度的识别,特征提取能力和识别能力优于人工神经网络、深度信念网络、深度自编码器等方法。宫文峰等[40]提出一种改进CNN新方法用于滚动轴承故障的快速智能诊断,引入全局均值池化技术代替传统CNN全连接层部分,并运用数据增强、Dropout等深度学习训练技巧,该方法能有效解决传统CNN模型参数量过多的问题,提高了故障识别准确率并缩短了计算耗时。祝道强等[41]提出了一种基于一维卷积神经网络的变负载适应轴承诊断模型,卷积结构使用小卷积核层堆叠的兴衰形式,训练时对输入层进行均匀分布失活率的随机失活,以提高网络的变负载适应能力,且采用全局平均池化降低模型计算量和减轻过拟合程度,研究结果表明所提出的模型泛化能力强,能够在变负载环境下实现准确、稳定的轴承故障诊断。李涛等[42]提出一种基于粒子群优化(partical swarm optimization, PSO)算法的自适应CNN故障诊断方法,并将其应用于滚动轴承故障诊断,提高了故障诊断的精度和迭代速度。罗金等[43]提出一种基于总体平均经验模态分解(ensemble empirical mode decomposition, EEMD)和堆叠稀疏自编码(stacked sparse auto-encoder, SSAE)的滚动轴承故障诊断方法,将振动信号分解后选取大峭度值分量作为敏感故障特征,再提取其时域和频域特征构建数据集输入诊断模型进行学习训练,研究表明该方法训练耗时短,故障识别率高。顾鑫等[44]提出一种CNN与极限学机(extreme learning machine, ELM)相结合的滚动轴承自适应故障诊断方法,该方法首先通过卷积层和池化层提取低阶特征来训练神经网络以合成高阶特征,然后用于极限学习机的故障分类,能够缩短模型训练时间,提高模型的识别率和鲁棒性。周奇才等[45]提出了基于改进堆叠式循环神经网络(ISRNN)的轴承故障诊断模型,如图4所示,通过门控循环单元解决了堆叠式循环神经网络梯度消失的问题,结果表明该模型在可靠性与泛化能力方面有了一定的提高。
图4 改进堆叠式循环神经网络模型结构
针对传统轴承故障诊断过多依赖于人工经验、自动识别程度低且成本高昂的缺陷,Janssens等[46]建立了基于卷积神经网络的轴承状态监测特征学习模型,该模型能够从海量数据中自主学习有用特征用于轴承故障诊断,并针对轴承外环故障、润滑失效、转子不平衡以及轴承正常4种工况进行了试验,结果表明其故障诊断准确率达到了93.61%。许爱华等[47]提出基于卷积神经网络的电机轴承故障诊断算法,使用原始诊断数据作为网络模型的输入对其进行训练,根据振动数据的特点和试验对比选择模型的结构和参数,进而通过深层次网络结构的卷积操作以实现对原始振动数据的特征提取,最后在输出端利用Softmax分类器进行分类,该方法能够克服故障诊断算法对人工干预和专家经验的依赖,并提高故障诊断的准确率。单外平等[48]采用DBN,直接从原始数据对轴承故障进行智能识别。无需人工提取特征,降低了传统特征提取过程的操作难度和不确定性,结果表明DBN能够直接通过原始数据对轴承故障进行高效识别,运用该方法的故障识别率接近100%。针对复杂工况下从非线性非平稳振动信号中难以提取故障特征的问题,Li等[49]通过引入拉普拉斯变换细化故障特征,基于层次模熵(hierarchical fuzzy entropy, HFE)方法和改进的支持向量机二叉树(improved support vector machine based binary tree, ISVM-BT)诊断轴承故障,试验表明该方法能够有效识别不同类别和不同程度的滚动轴承故障。Ding等[50]在传统卷积自编码网络的基础上提出一种一维多尺度卷积自动编码的诊断模型,该模型首先使用并行、不同尺度的卷积核和反卷积核对输入信号进行特征提出和重构,然后将多尺度卷积核所提取得到的特征图作为分类器的输入,最后用带标签的数据对全模型的参数进行微调。研究结果表明一维多尺度卷积自动编码模型对滚动轴承故障数据有更好的识别效果。李小娟等[51]提出一种基于欧式距离的深度度量学习的轴承故障诊断方法,实现对不同类型和严重程度的轴承故障的分类识别,结果表明所建立的深度度量网络模型能够在不依赖信号处理技术和工程实践经验的情况下有效地对轴承故障进行高精度诊断,诊断结果优于传统DBN故障诊断方法以及常用时域统计特征结合支持向量机(support vector machine, SVM)分类的故障诊断方法。韩涛等[52]利用多小波变换(multi-wavelet transform, MWT)方法对滚动轴承的振动信号进行后处理,得到多小波系数分支构造特征图以建立CNN分类器组模型,从而实现对滚动轴承复合故障的智能诊断。刘慧斌等[53]利用卷积神经网络能够自动提取故障特征的特性,提出端到端的深度卷积神经网络自动提取故障特征进行多故障分析的轴承故障诊断方法,算法模型如图5所示,相较于传统的人工故障特征提取方法能够有效提高故障诊断精度和故障点定位精度。
图5 端到端深度卷积神经网络
鉴于现有轴承故障诊断模型环境适应性差、噪声干扰严重、故障样本少以及特征参数设置难的问题,Zhang等[54]将包络谱的稀疏度与峭度值引入到移不变K均值奇异值分解字典学习算法(shift-invariantK-means singular value decomposition, SI-K-SVD)中用于迭代次数和模式长度的选取,提出最优参数移不变奇异值分解字典学习算法(optimal parameter shift-invariantK-means singular value decomposition, OP-SI-K-SVD),并通过仿真与台架试验验证了OP-SI-K-SVD算法相较于经验模态分解、小波变换和K均值奇异值分解算法在齿轮箱轴承早期故障诊断中具有更高的诊断准确性和特征提取能力。昝涛等[55]设计了一种具有多输入层的卷积神经网络来优化轴承故障诊断模型的抗噪声干扰性能,提高诊断模型的鲁棒性。该模型以原始信号为初始输入层,充分发挥网络模型多输入层和自动学习原始信号特征的优势,提升模型的识别精度、收敛特性和泛化能力。赵小强等[56]针对传统轴承故障诊断方法自适应性差的缺点,提出一种改进Alexnet的滚动轴承变工况故障诊断方法,该方法直接从原始数据中提取深层数据特征,能够在变工况、强噪声的环境中自适应地对轴承进行高精度故障诊断。Kang等[57]提出了一种基于多域特征相对补偿距离和局部线性嵌入的滚动轴承状态评估方法,构造了多域特征向量和距离补偿指标,有效地消除了振动信号的相关性和冗余性,提高了轴承故障诊断的效率和精度。涂小卫等[58]提出一种快速傅里叶变换(FFT)+深度置信网络(DBN)+参数寻优的牵引系统电机轴承故障诊断方法,完成了无监督特征提取与有监督微调网络模型的构建,解决了网络参数设置难的问题,并有效提高了电机轴承故障识别准确度。谭俊杰等[59]采用核函数映射和无监督学习的深度置信网络开展轴承故障诊断研究,提高了源域和目标域的相似性,改善了训练样本不足而导致模型精度低的缺陷,并通过试验验证了该方法具有较高的诊断精度。王金瑞等[60]针对转速波动工况下的轴承故障诊断提出了根据转速信息提取频域样本进行训练的深度学习网络模型,利用平移和缩放参数处理转速波动引起的频移和幅变,减轻了模型内部协变量转移现象,加快了模型收敛。结果表明,该方法能够在转速波动工况下实现轴承故障的准确识别。Wang等[61]通过初始化深度卷积神经网络并采用粒子群寻优等方法构建了自适应卷积神经网络模型,提高了模型的高效性和鲁棒性。庄雨璇等[62]针对现有诊断模型的应用环境泛化能力不足的缺陷,提出一种基于长短时记忆网络的端到端故障诊断模型e2e-LSTM(end-to-end long short term memory network),直接利用时域振动信号对轴承的运行状态进行诊断,模型架构如图6所示。结果表明该模型环境适应性强,能够一次性识别多种轴承故障以及故障尺寸。
图6 e2e-LSTM的模型框架图
近年来,深度学习在故障诊断领域发展势头迅猛,成果颇丰,随着其在轴承故障诊断的研究深入,对于轴承状态的实时追踪与评价取得了较好的效果,其快速迭代和收敛特性更能适应科技高速发展与产品快速更新换代的要求,与大数据融合方面也有着更高的契合度,为轴承故障诊断的自动化与智能化提供了有效的途径。但现有研究大多处于理论分析与室内试验阶段,与实际工程应用尚有距离,且随着未来轴承应用场景的多样化与复杂化,高效、多维、准确的特征抓取、学习与分类,与传统故障诊断方法的有效融合、向不同类型轴承故障诊断领域延伸,故障精确定位、以及如何构建更加安全、稳定的故障诊断模型来巩固轴承在工农业生产中的重要作用等方面的研究也要有所突破。
深度学习应用于轴承故障诊断领域的目的是试图通过寻求可量测的特征向量来判断轴承处于何种状态,进而实现工农业系统的故障检测、诊断与识别匹配等。基于深度学习的故障诊断策略是模拟人类思维的学习以及推理过程,通过有效的特征提取、选择和分类识别处理诊断信息,模拟人类专家,以灵活的诊断策略对监测对象的运行状态和故障信息做出智能判断和决策。随着科技的发展和研究的深入,基于深度学习的故障诊断技术尚存在一些挑战性的问题有待进一步研究。
(1)故障诊断深度学习模型本身的准确性不够高,无法快速准确地识别轴承运行状况。深度学习模型训练耗时,验证过程较为复杂,这就要求所建立的深度学习模型准确、高效,提取的特征直观、完备。
(2)深度学习在复杂性、多元性故障诊断领域的应用尚待研究。由于诊断对象日趋复杂,复合故障和系统故障呈现出多因素耦合作用、传递路径复杂的状态,使得获取准确、有效的特征信息越来越困难,导致单一故障诊断方法难以有效溯源故障成因。如何应对新出现的故障识别与诊断问题亟待解决。
(3)深度学习故障诊断模型与传统故障诊断模型混合协同作业研究较少。如何针对不同故障和模型的特点,取长补短,实现不同模型间的相互融合与协同作业,对复杂工况下的轴承故障诊断工作而言是非常关键的。
(4)深度学习故障诊断特征的高效准确提取与识别需要重点关注。特征提取是故障诊断的关键步骤,也是进行正确故障检测和分离的前提。如何有效剥离干扰信息,直达故障特征,减小样本训练量和模型层数,缩短模型训练耗时,进行高效有序、精确的小样本模型训练是一个极具挑战的课题。
(5)海量多维训练样本的融合统一研究不够。现代工农业生产系统的复杂性造成了训练样本数据的海量、多源以及时间与空间尺度上的多维性,如何将深度学习与分散不统一的训练数据相结合,构建易于训练,可自适应协调多源海量数据融合的训练模型也是一个值得研究的方向。
随着深度学习研究在轴承故障诊断领域的不断发展与进步,提高深度学习模型的准确性、深入复杂故障诊断领域、与传统诊断模型协同作业、故障特征的高效准确提取、多维数据样本融合统一,以及提高深度学习故障诊断模型的鲁棒性,必将给故障诊断的实时性与准确性带来质的飞跃。根据现有研究可知,基于深度学习的轴承故障诊断模型训练方法主要包括有监督学习、无监督学习、半监督混合学习等。在训练数据方面,目前有标签的数据特征学习占有重要位置,然而在故障诊断的实际应用中,故障数据往往呈现出无标签、多维度,并且数据量巨大的特性,掌握这些海量数据的标签是十分困难的事情。在不远的将来,随着数据采集和存储技术的发展,无数据标签的特征学习,将会越来越被重视,如何自动、智能的为数据添加标签将是未来研究的热点。此外,研究高精度、高效率的硬件设备,配合深度学习的海量数据储存、分类及运行,能够使深度学习性能更好地发挥出来。综上所述,深度学习在轴承故障诊断领域的研究重点和发展趋势有以下几个方面。
(1)轴承故障诊断深度学习模型特征参数提取的准确性和故障诊断精度亟待提高。在复杂环境、噪声干扰和变载荷工况下确保轴承故障诊断的准确性和高效性是保障轴承安全有效运行的重要前提。
(2)深度学习故障诊断领域的新方法、新工艺、新材料需要加大研究力度。通过对轴承故障的深入研究,缩短模型训练耗时、故障诊断耗时、提高轴承使用寿命以及对传感器硬件和数据融合精度的研究,降低故障诊断的软硬件成本,更好地为生产建设服务。
(3)基于深度学习的轴承故障诊断应用范围亟须拓展。现有研究大多针对金属材料滚动轴承的故障诊断,对于塑料轴承、铰支轴承以及可承载轴向力的滑动轴承、PDC(polycrystalline diamond compact)镶嵌轴承等特种轴承和专用轴承故障诊断研究较少。与此同时,还需要加大其工程运用力度,做到理论联系实际并指导实际。
(4)不同的轴承故障诊断方法融合机制亟待建立。现有诊断方法大多只针对特定的故障种类,且新方法与传统方法分裂独立,不够全面系统。因此亟须建立覆盖范围广、辨识程度高的轴承故障诊断方法的有机融合机制。
(5)减少人工操作工作量,促进轴承故障诊断向着智能化发展。当前工农业生产逐渐向着自动化和智能化过渡,因此轴承的故障诊断也应该向着自适应检测与诊断方向发展,同时减少人工工作量和人为因素也是降本增效、提高安全性的有效途径。
(6)加大深度学习在轴承早期故障检测与状态评判方面的研究。当前,轴承故障诊断主要集中在故障发生之后,甚至是轴承功能已经丧失或局部丧失后的阶段,此时危害与损失已经无法挽回。因此,加大轴承早期故障的监测研究,做到防患于未然,也是非常有必要的。