,, ,
(同济大学,上海201804)
健康管理即收集足够的数据,借助智能算法对机械设备进行健康状况的评判,同时提供保障决策及维护计划。这是比传统故障诊断更为先进的维护方式。随着机械设备的自动化与智能化程度日益提升,人们对于设备安全性和可靠性要求也越来越高,对机械设备的健康管理成为一门学科,吸引了无数学者的目光。由IEEE可靠性协会主办的A类国际会议故障预测与健康管理技术国际会议是机械设备健康管理领域每年的盛会,近年来利用深度学习进行研究而发表在大会上的文章占有很大比例。经过多年发展,健康管理技术已开始吸收人工智能技术中表现优异的部分,基于深度学习的智能诊断研究已是健康管理的重要方向。
近些年来人工智能可谓是引爆全球的一次浪潮,诸如Google,Amazon,BAT等知名企业都在积极布局这一领域。人工智能技术中最为炙手可热的是机器学习,机器学习技术中最为炙手可热的就是深度学习,通俗的说,就是深度神经网络。这项技术目前在知识图谱、语音识别、自然语言处理、图像识别、计算机视觉等方面已有一定研究成果。2017年10月,中国人工智能学会理事长、中国工程院院士李德毅在全球1024开发者节上对传统行业的变革作出如是判断:未来人工智能冲击最大的四个行业是制造业、教育、金融和医疗。李院士将制造业排在四个行业的第一位,同时指出智能化是判断制造业发达与否的主要标准,这与国家对于智能制造的推崇不谋而合。
人工智能是关于知识的学科,是研究怎样表示知识以及怎样获得知识并使用知识的学科。传统的智能算法包括人工神经网络(artificial neural network)、支持向量机(support vector machine)、逻辑回归(logistic regression)、决策树(decision tree)和朴素贝叶斯(naive bayes)等,它们在健康管理领域已有一定成果。Ocak[1]等人分别使用ANN、SVM以及GP(gaussian process)对盾构隧道的沉降进行计算,成功地将误差率从13降到了9;而Fan[2]等人利用基于动态滑移窗的支持向量机来预测盾构隧道的沉降,取得了比SVM更好的效果;Peng[3]等人利用隐马尔可夫模型(Hidden Markov Model)和灰色模型(Grey Model)来对机械设备进行健康预测;Zio[4]等人则利用数据驱动的模糊方法对系统的剩余寿命进行了预测。虽然这些方法取得了一定的成绩,但是它们仍然很难分析复杂的故障,尤其是在缺乏先验知识的情况下,此外由于泛化能力不足,它们很难表示复杂的非线性函数。这就促使人们去探索使用深度神经网络的方法去提取特征,去逼近复杂函数并准确识别健康状况。得益于深度学习极强的非线性拟合能力,因此它很适合用于分析极其复杂的映射关系,另外深度学习技术可以由模型自身提取特征,这就避免了人工提取特征所带来的不确定性,还需要指出的是深度学习模型具有较好的泛化能力,可靠性和鲁棒性相较传统方法也有较大的提升。
深度学习是机器学习的分支,是目前最接近人工智能的领域,它通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示[5]。目前深度学习已经成功运用于对象识别[6],语音识别[7],图像识别[8]和自然语言处理[9]领域,在机械设备的健康管理领域的研究正迅速展开,它使用监督或无监督策略自动学习深层架构中的分层表示以进行分类。现如今广泛使用的深度学习模型主要有深度信念网络[10](Deep Belief Network),卷积神经网络[11](Convolutional Neural Network),循环神经网络[12](Recurrent Neural Network),栈式自动编码器[13](Stacked Auto-Encoder)以及以上方法的混合模型,以下将分别针对上述方法在机械设备健康管理上的应用展开陈述。
1)基于DBN的机械设备健康管理现状。DBN由多个RBM(Restricted Boltzmann Machines)层组成,每个RBM由一些可见单元和一些隐藏单元构成,层间全连接,层内无连接。DBN建立了一个观察数据和标签之间的联合分布,隐含层神经元被训练去捕捉在可视层表现出来的高阶数据的相关性,在处理分类问题上表现突出。
图1 深度信念网络示意图
2013年Tamilselvan[14]等人利用DBN解决健康状态分类的问题,由此打开了DBN进入故障诊断领域的大门;Tran[15]等人将DBN在故障诊断上的表现和SVM以及BP(Back Propagation)算法进行比较,得到了更好的效果;Kuremoto[16]等人用两个RBM建立DBN,并用PSO(Particle Swarm Optimization)算法优化来预测时间序列;Hrasko[17]等人则通过结合RBM和BP算法进行时间序列预测,并通过三组时序数据来验证方法的可行性;Chen[18]等人通过使用DBN学习健康状态来进行齿轮箱的故障诊断,并与传统方法做了比较,验证此方法的鲁棒性和精确性;Li[19]等人提出一种振动测量深度统计特征学习方法来对旋转机械进行故障识别,并将其用于变速箱和轴承系统,分别取得了95.17%和91.75%的故障识别准确率。
图2 卷积神经网络示意图
2)基于CNN的机械设备健康管理现状。CNN是一种前馈神经网络,它的实质是构建多个能够提取输入数据特征的滤波器,通过这些滤波器对输入数据进行逐层卷积及池化,逐级提取隐藏在数据之中的拓扑结构特征,随着网络结构层层深入,提取的特征也逐渐变得抽象,最终获得输入数据的平移、旋转及缩放不变的特征表示。CNN的主要特征是结合稀疏连接、权重共享、空间或时间上的降采样。
Chen[20]等人将CNN用于变速箱的故障识别与分类,取得了杰出的效果;Babu[21]等人利用基于深度CNN的回归方法对子系统和零部件进行剩余生命预测,并与MLP(Multi-Layer Perceptron),SVM进行比较,发现CNN方法总是能够得到更精确的数据;Janssens[22]等人提出了基于CNN的旋转机械故障识别方法,实现了自动提取特征而无需专家经验的轴承故障识别,取得了93.61%的识别准确率,而专家经验提取特征的识别准确率为87.25%;Jeong[23]等人将CNN用作分类器,对旋转机械轨迹图进行诊断,减轻了特征提取对专家经验的依赖。
3)基于RNN的机械设备健康管理现状。RNN是一种节点定向连接成环的深度神经网络,它的内部状态可以理解为动态时序行为,通俗地说,RNN可以记忆之前的神经元状态,每次训练的输出都与之前的输出有关,这也是RNN适合用来处理前后有关联的输入的原因所在。正因为这个特性,在机械设备健康管理领域RNN的研究相对多于其他算法。为了处理预测时间序列中间隔相对较长的事件,RNN的改进LSTM[24](Long Short-Term Memory)解决了求解梯度过程中long-term会产生梯度消失或是梯度爆炸的现象,另一种改进算法GRU[25](Gated Recurrent Unit)由于其结构较LSTM相对简单,也得到了广泛应用。
图3 循环神经网络示意图
Assaad[26]等人利用RNN进行时间序列的预测并与BP算法等传统算法进行比较,取得了更精确的预测结果;Obst[27]提出基于RNN的传感器网络分布式故障检测,利用学习模型通过分布式计算和节点间的通信来检测异常传感器;Yuan[28]等人使用LSTM对航空发动机进行故障的诊断,并进一步估算其剩余寿命,他们将建立的模型用于美国航空航天局NASA提供的飞机涡轮风扇发动机监控监测数据集进行测试,取得了杰出的效果;Malhotra[29]等人提出了一种基于LSTM的编码方法从多传感器时序数据中获取无监督健康指数,并以此预测剩余寿命,相比传统的指数衰减方法准确性大大提高;Chung[30]等人对LSTM和RNN以及传统回归单元例如tanh建模进行比较,发现RNN的回归单元LSTM和GRU确实优于传统回归单元。
4)基于SAE的机械设备健康管理现状。自动编码器是一种尽可能复现输入信号的神经网络,栈式自编码器就是堆叠多个自动编码器,然后进行微调来训练整个模型。SAE有两种常用的改进方法,分别叫做稀疏自编码器[31](Spares Auto-Encoder)和去噪自编码器[32](Denoise Auto-Encoder),前者可以自动从无标签数据中学习特征而给出比原始数据更好的特征描述,后者则是在输入层加入随机噪声从而得到更鲁棒的特征。
图4 栈式自编码器示意图
Li[33]等人在对航天器的信号识别与诊断的研究中利用SAE对多分类模型进行权重和偏移量的初始化,取得了比传统SVM更高的准确率;Sun[34]等人利用稀疏自编码器提取特征对电动机故障进行分类,并通过dropout[35]防止过拟合;Wang[36]等人提出一种可用于无监督特征学习的连续自编码器模型,同时在激活函数中增加了高斯随机单位,该模型成功用于变压器的故障诊断;Zhao[37]等人根据轴承振动信号的非平稳性和非线性,将SAE和DAE结合作为特征提取的方法,同样通过dropout防止过拟合,大大提高了鲁棒性;Lu[38]等人将基于栈式去噪自编码器推广到旋转机械部件的故障识别上,效果显著。
5)基于混合模型的机械设备健康管理现状。随着研究的深入,单一的模型很难进一步得到更高效的结果,而且深度学习方法有时存在忽略了故障本身机理的缺陷,也需要辅以其他方法弥补这个环节,因此人们将目光投向于结合多个算法的混合模型,希望借此能够提高对机械设备健康管理的科学性。
Wang[39]等人将PSO算法和DBN结合设计了故障检测与自学习模型,提高了识别未知故障的准确性;Cui[40]等人将DBN与BP算法结合用于变压器的故障诊断,并在MATLAB中进行建模试验取得了不错的效果;Demetgul[41]等人在解决物料搬运系统故障诊断时,将扩散图、局部线性嵌入和自动编码器相结合来提取特征,结果表明这比传统算法准确度提高了将近90%。
通过对目前学术界的这些研究成果的分析不难发现,深度学习相较于传统方法,有着突破性的优势。深度信念网络在处理状态分类问题上,其拟合能力是传统算法不能比拟的,且已经在典型零部件的故障分类领域广泛使用。卷积神经网络凭借其在图像特征提取方面的优势,在机械设备轨迹图、波形图的识别上相较专家经验有着较大的提升。循环神经网络最大的优势在于处理前后有关联的序列,这一特性恰好迎合于机械设备运行中产生的大量时序数据,通过循环神经网络不但能够取得比传统算法更高的预测精度,还能在预测的时间跨度上取得突破。栈式自编码器是一种无监督模型,通过重构输入起到降维或是分类的作用,相比于传统降维算法主成分分析实现的线性降维,栈式自编码器可以实现非线性降维,因此其特征提取能力大大提升。但是深度学习技术更像是一个黑箱,很难直接说明故障机理,因此将深度学习与传统算法相结合亦是一个值得研究的方向,且效果同样显著。
得益于计算机、传感器、通信技术和存储设备的飞速发展,即便现代机械设备呈现出大型化、复杂化、数字化的趋势,我们已经能够获得大型工程设备的各项参数指标,并将它们保存下来进行运用,这就使得更低的人力成本、更快的数据协同、更科学的算法指导工作、更智能的制造业成为了可能。与之相契合的,深度学习能够通过建立深度神经网络来模拟人脑的信息处理机制,以此学习、分析输入数据,获得解读输入数据知识的能力,同时根据输入数据特征自动调整权重,提高特征提取和学习新知识的能力。目前深度学习在制造业的主要应用如下:
1)代替肉眼检查裂纹。在深度学习出现前,零部件和材料的缺陷主要由肉眼或是影像分析方法进行,这类方法效率低,误检漏检情况严重,而基于深度学习方法能够从图片中自动识别缺陷并标识,这个工作的前提仅仅是拍张照片而已,工作人员便能够快速发现残次品。该功能的实现可以依靠卷积神经网络,通过对于原始图像逐层卷积及池化,以及正则化手段防止过拟合,最终获得不变的特征表示,由于不同裂纹对应的图像具有不同的特征,以此达到既定功能。
2)实现设备自我诊断。当故障现象出现时,机械设备能够自己去进行诊断,判断是在什么地方出了问题,导致这个问题的可能原因是什么,并给出建议的解决方案,甚至让机器自己解决问题,自我修复。该功能的实现可以借助深度信念网络或是栈式自编码器,通过提取实时运行数据的特征值,经过隐层处理后得到对应的状态识别结果。但是在故障发生时诊断有时候已经造成无法挽回的损失,因此就有了下一个应用方向。
3)异常提前感知。基于大量的历史运行数据或是仿真数据训练得到的深度模型能够在故障发生前就捕捉到故障即将发生的异常征兆,从而通过对异常征兆的分析知悉可能将要发生的故障,实现在故障发生前及时做出有效预防,减少甚至避免损失。这一功能的实现需要大批量、高质量、覆盖面广的全生命周期数据作为支撑。通过LSTM或是GRU这类循环神经网络可以很好地从当前一段时间的运行数据预测出后续一段时间的预测数据,之后将预测数据输入至训练好的诊断模型就能得到未来状态的预测情况。
4)施工质量监测。制造业向服务型转变要求我们除了对机械设备本身进行全面监控以外,还需要对施工质量进行监测,例如使用高炉炼铁时需要关心铁水的温度以及铁水中的含碳量等,使用盾构机挖掘隧道时需要关心管片的变形以及地面的沉降等。通过采集机械设备运行数据及现场相关数据,结合深度学习方法,以达到监测施工的目的。实现这一目标的途径有很多种,在直接测量施工质量较难实现时,利用深度神经网络建立施工监测数据和施工质量情况之间的映射关系亦不失为一种行之有效的方法。
实现对机械设备智能化健康管理这一美好愿景的基础是大批量、高质量、覆盖面广的全生命周期数据,没有数据的支撑几乎所有想法都只能是纸上谈兵。即便深度神经网络的非线性拟合能力再强,也需要全生命周期数据去训练,才能发挥最大的效果,因此如何去获取,管理,使用全生命周期数据是实现基于深度神经网络的机械设备的关键环节。
图5 闭环生命周期示意图
生命周期的思想的基本含义可以理解为从摇篮到坟墓的整个过程。以机械设备的生命过程为主线可以将全生命周期划分为3个阶段[42],即生命初期(Beginning of Life),生命中期(Middle of Life)以及生命末期(End of Life)。如图5,其中BOL包括产品的设计和制造阶段,MOL包括产品的使用和维护阶段,EOL包括产品的回收和报废过程。这三个阶段形成一个闭环而紧密联系[43],它们之间任意一个阶段的变化都会影响另外两个阶段,因此在对机械设备健康管理模型建模时,需要充分考虑数据的全面性,在进行数据的收集时必须覆盖整个生命周期,方能支撑起后续的监测、诊断、预测等一系列健康管理手段。
目前深度学习中较为成熟的技术是监督学习,也就是利用标记过的训练数据来推断一个功能的学习任务,这对于数据的要求是很高的,大批量、高质量、覆盖面广的全生命周期数据是实现深度学习训练的必要前提。也就是说,所需要的标签数据必须包含机械设备生命周期的各个阶段和状态,除了正常运行时所产生的数据以外,必须有足够多且全的故障时产生的数据作为训练样本。考虑到机械设备有些异常状态是严禁频繁发生的,导致样本采集难度增加,对于这种情况可以在训练时提高该异常状态样本的权重,促使模型提高模式识别精度;另外正常运行时如采集频率较快,对于这部分样本可以借鉴降噪的思想在隐层随机关闭若干个神经元,从而起到提高鲁棒性的作用。
Nam[44]等人在2013年将使用全生命周期数据预测机械设备故障情况提高到理论高度,他们提出了“Lifecycle Prognostic”的概念,他们将预测模型分为三个类别,当一个组件刚投入使用时唯一可用的信息是过去的故障信息,失效分布可以用例如Weibull分布这样的可靠性方法估计,这是第一种预测模型;在组件运行过程中会消耗可用的寿命,这种消耗模型可能是系统固有应力的函数,将这些运行条件合并到故障分布的计算中就是第二种预测模型;当退化趋于明显时,利用这些信息来提升故障分布估计就是第三种预测模型。
将基于机械设备全生命周期的数据通过一系列机器学习、深度学习方法应用于故障识别及预诊等机械设备健康管理手段的研究目前在国内外都已有一定的进展。美国田纳西大学的核工程系研究方向之一就是运用全生命周期数据进行健康管理,其中Jeffries[45]等人设计了集成多种模型的全生命周期预测算法进行剩余寿命预测,Sharp[46]等人通过贝叶斯方法实现了预测模型类型之间的转换使得得到的剩余寿命预测更为精确,其中Nam[47]等人对贝叶斯统计算法进行了深入的研究。此外美国哥伦比亚大学的Venkat教授也致力于针对大型工程系统的风险分析与健康管理,他认为一个理想的诊断系统经过全生命周期数据的训练后,应该能够快速检测并进行诊断,并且能够区分多种故障并给出解释,还需要具有一定的鲁棒性和适应性[48],他提出的基于神经网络方法的过程故障诊断方法成功运用于炼油厂流态化催裂化法的诊断[49]。国内西安交通大学机械工程学院的雷亚国等人同样在机械设备健康监测领域也有一定研究,他们面向全生命周期大数据提出了一种机械设备智能诊断的二阶段学习方法[50],第一阶段利用两层无监督稀疏滤波直接从振动信号中提取特征,第二阶段利用softmax分类器对健康状况进行分类,另外他们还针对自动编码器可能学习到相似特征的缺陷提出了一种归一化稀疏自编码器的方法来提取特征,进一步提升了诊断效果[51]。哈尔滨工业大学自动化测试与控制系的彭喜元、赵光权[52]等人也积极布局这一领域,持续开展基于DBN的特征提取与故障识别研究[53],力求在保证高准确性的前提条件下直接从原始信号中获取故障的位置和级别。
数据就像是造房子时的钢筋水泥,必须采集到足够多的,覆盖各种工况的全生命周期数据,才能加以运用,实现增值服务。如何采集、传输、存储全生命周期数据,采集得到后如何管理与运用,是实现增值服务的前提。可以说,机械设备的全生命周期管理和基于深度学习的机械设备健康管理是相辅相成,不可分割的。
由上述可见基于全生命周期数据,利用深度学习方法实现机械设备复杂系统健康管理的研究已初现端倪,但是由于机械设备愈发复杂,各个系统及其相对的各个部件都会发生各式各样的故障,且各个系统又互相制约、互相影响,这样的层次性、传播性、相关性以及不确定性使得对其全面、准确的诊断难以实现。目前对机械设备的健康管理仍然存在故障诊断方法有限、智能诊断系统薄弱等一系列问题。而可以预见的是,机械设备健康管理的智能化转型必将由深度学习去推动,为了完成由传统诊断算法向智能化的过渡,在传统算法与深度学习算法相结合以及对深度学习算法进行优化这两条途径都有很多学者投身其中。
纵观机械设备健康管理的研究现状,大多数研究仍旧是以关键零部件例如减速箱、轴承或是变压器等为研究对象,由零部件级别向系统级别乃至整机的健康管理将会是一个研究趋势。另外,能够同时实现识别的故障也以单类型为主,泛化能力不强,可是实际中机械设备的故障往往是多个因素相互耦合的结果,并且已发生的异常会引发新的故障,因此多故障诊断将是又一个研究趋势。深度学习就像是一个功能强大的黑箱,可是在原理解释上总是缺乏说服力,这个黑箱与其他的机器学习方法相配合或许能够让人可以更直观的理解为何能够实现既定效果。除此之外,随着信息技术发展导致的数据量的激增,如何使得深度神经网络模型适用于全生命周期多源大数据[54]的同时又具有较好的特征提取功能也是一个需要解决的问题。总体来说,基于深度学习的机械设备的健康管理亟待以下突破:
1)特征提取与故障机理的映射关系;
2)深度学习与传统诊断方法的结合;
3)适用于工业大数据的健康评估模型;
4)由单故障诊断向多故障诊断的转变;
5)由零部件诊断向机械系统诊断的转变。
随着制造业信息化的加速推进,传统的机械设备健康诊断技术已经不能满足工程机械向大型化、复杂化发展的趋势,因此结合时下具有极强非线性拟合能力的深度学习技术将是大势所趋。由于无线传感网、计算机技术、存储设备、人工智能等相关技术的发展,使得利用全生命周期海量数据通过深度学习的方法去进行更科学更高效的预判性诊断已经成为可能,目前也有相关学者已经开始了这方面的工作,学术界有一定相关经验可以参考。
本文对深度学习方法在机械设备故障诊断中的应用进行了综述,例如对深度学习方法在检查裂纹、设备自我诊断、异常提前感知、施工质量监测中的应用进行了综述。接着,又结合国内外基于机械设备全生命周期数据的故障识别及预诊相关研究,突出了全生命周期数据对于深度学习重要性。之后说明了在其生命周期数据的支撑下,基于深度学习的机械设备健康管理的研究趋势和面临的挑战。
面对机械设备健康管理新局势,必须牢牢把握好制造业信息化大方向,立足于全生命周期数据,以深度学习技术武器,在这场由互联网引起的变革中找准位置,从而实现从数据到信息再到知识的全过程转化。