吴 磊,纪国宜
(南京航空航天大学 机械结构力学及控制国家重点实验室,南京 210016)
结构健康监测(SHM)这一观念是1960年提出来的,用于评估结构目前的健康程度[1]。不论什么设备,由于腐蚀、疲劳、磨损和过载等可能的过程,都会导致性能开始下降,所以能够尽快可靠获得结构目前的健康情况是非常关键的,这不仅可以防止大的工作事故的发生,也可以减少维修费用。比如1973年美国三里岛核电站堆芯损坏事故、1985年美国航天飞机“挑战者号”坠毁、1986年前苏联切尔诺贝利核电站泄漏事故等等,都是由设备故障造成的严重的世界性的事故。这表明结构健康监测对于保证设备可靠有效运行是非常重要的。其次有效的结构健康监测可以减少维修费用,因为对结构尤其是大型结构定期检查耗时耗费,目前国内外对设备主要进行计划维修,但是这明显是非常不合理的,如果大型工厂里在机器停止运行后进行检查,可能会造成大的经济损失,而结构在线健康监测可以让结构在需要检查的时候对其进行检查,不浪费时间,增加了工作效率。英国曾对2000家工厂展开调查,发现使用结构在线健康监测技术后,每年可节约3亿英镑的维修费用。日本航空公司长期以来一直对JT3D喷气式发动机使用在线监测技术,将大修寿命从1200小时增加到超过12000小时,直至大修取消。因此,实施结构在线健康监测极其重要。
多数经典的结构损伤检测系统主要包含2个过程,即特征提取和特征分类,特征提取需要大量的计算处理,从而导致其无法在结构的在线监测中得到应用,并且传统的特征提取方法是人为依靠经验提取特征,提取的特征可能并不是对所监测的损伤敏感的特征,从而会影响分类的结果[2]。卷积神经网络将特征提取与特征分类融合到一个学习体中,所以它可以从原始数据的处理开始,通过反向传播同时进行优化,对特征进行提取和分类,以获得更准确的结果。最近的研究表明,卷积神经网络在许多领域比传统机器学习方法的效果更好,如图像、语音识别、心电图信号分类、电力电子技术应用中的故障检测等[3]。
本文采集了磨机中的主减速器在实际生产工作中的振动信号,以此检验引入一维卷积神经网络的结构健康监测模型的有效性。
本文内容如下:第1小节简单介绍卷积神经网络以及一维卷积神经网络;第2小二节介绍引入一维卷积神经网络的结构健康监测的模型的建立;第3小节对试验的结果进行分析。第4小节对卷积神经网络在结构健康监测中的应用做一些小结。
卷积神经网络是研究人员通过对大脑视觉皮层系统进行研究,分析大脑中信息的传递方式提出的,卷积神经网络模型是模拟大脑中神经元建立的。最初卷积神经网络是作为分类器使用,主要用于图像识别[4]。自2012年Krizhevsky等使用扩展了深度的卷积神经网络在LSVRC竞赛中取得了当时最佳的分类效果以后,卷积神经网络越来越受人们的重视[5]。卷积神经网络作为神经网络的一个重要分支,其特点在于其每一层的特征都是由上一层的输入通过卷积核才得到的。这一特点使得卷积神经网络在众多神经网络方法中脱颖而出,更适合应用于图像和音频特征的学习与表达[6]。图1表示的是卷积神经网络中的一个早期经典的网络结构,是一个非常高效的识别手写体数字的神经网络。卷积神经网络由输入层、卷积层、池化层、全连接层以及输出层组成。其中卷积层与池化层通常交替分布,通过反复叠加的卷积池化层,可以将低层特征逐步变为高层特征。图1由1个输入层、2个卷积层、2个池化层、2个全连接层和1个输出层组成。而且从图中可以发现,卷积层和池化层中的卷积核和池化采样矩阵的数量并不是只有一个,该数量称为通道(channel)数,多通道卷积核与池化层中的采样矩阵可以同时提取多种特征。所以卷积神经网络中,卷积核的数量与池化参数大小是非常关键的,图1表示通道数不同的5×5和2×2的矩阵,其中参数的数值大小通过反向传播的训练过程不断优化。
图1 LeNet-5结构图
由于二维卷积神经网络需要大量的训练数据,所以二维卷积神经网络很难有效应用在有限的数据实验中[7]。又因为一维卷积神经网络参数少了很多,不需要特别多的训练数据,所以可以弥补上述缺点,且因为都是一维计算,计算时间短且计算简单,所以适用于在线监测[8-9]。
1D卷积神经网络和上述2D神经网络类似,但有些不一样。顾名思义,上述的卷积神经网络无论是输入还是卷积层和池化层的大小都是二维矩阵,然而一维卷积神经网络输入和卷积层与池化层都是一维向量[10]。其他都和二维卷积神经网络一样,都由输入层、卷积层、池化层、全连接层和输出层组成,都是通过反向传播或梯度下降的方法不断优化参数。图2为一维卷积神经网络某一层卷积层和池化层示意图,一共3层,其中卷积核大小为3,池化层大小为2,都为一维向量。
图2 一维CNN卷积层与池化层的结构图
图3为二维的卷积神经网络中某一层卷积层与池化层示意图。其结构与1D一样,只是卷积核与池化大小分别为3×3与2×2,都为二维矩阵。
以上为1D与2D卷积神经网络的主要区别。
图3 二维CNN卷积与池化层的结构图
通过上1小节所述的一维卷积神经网络的结构特点初步建立1个一维卷积神经网络模型。模型的参数具体如下所述:一维卷积神经网络由1层输入层、2层交替分布的卷积层和池化层、1层全连接层和输出层构成。其中输入层为800×1的向量,第一层卷积层的卷积核是有20个通道的49×1的向量,第二层卷积层的卷积核是有20个通道的188×1的向量,所有池化层都是有20个通道的4×1的向量,全连接层是20×10的向量,输出层是10×2向量。卷积和池化层激活函数为tanh函数,输出层的激活函数为softmax函数。
为验证模型的有效性所采用的试验信号为实际工作中从磨机的主减速机上采集到的振动信号。试验中一共分析8组数据,它们是在随机抽取的8天的某一时间段内在主减速机运转过程中采集的振动信号。其中前3组是正常运行状态下的数据,后5组是出现故障以后的数据。采样频率为2048 Hz,采样时间为30分钟,故每组一共采集了3686400个数据,由于采集到的信号噪声很大,故需对其做一些简单的预处理,将其转换到频域中[11]。首先将采集到的8组数据中每组随机抽取连续的204800个数据,每组各分成10份,一共80份,每份20480个数据。然后对每份数据进行快速傅里叶变换转换成频域信号,由于数据中噪声成分比较大,所以进行10次平均,提高信噪比,降低噪声对识别的影响。由于采样频率为2048 Hz,取预处理之后前800个数据,得到80份800×1的向量。以此作为输入数据代入卷积神经网络中,最后输出0或1这两个结果。其中0表示运行正常,1表示出现故障。为了使模型泛化,要求训练数据不能与测试数据来自同一时间段采集的信号。所以从前3组中抽取2组数据,从后5组数据中随机抽3组数据,作为训练数据集即50份800×1的向量。剩下的作为测试数据即30份800×1的向量。并在试验完成后,再次选择不同的组别作为训练组重新验证,以便更加有说服力。所用的代码用MATLAB编写。
下面展示了部分数据的时域图和频谱图。图4是第1组和第2组数据在正常状态下的0.1 s的时域波形图与第7组和第8组数据在故障状态下的0.1 s的时域波形图。
图5是第1组和第2组数据在正常状态下的经过10次平均的频谱图与第7组和第8组数据在故障状态的经过10次平均的频谱图。
一共进行3次试验,测试结果都与实际一致。下面仅列出一种测试结果进行分析,由表1所示。
图40 .1 s时域波形图
前10个为正常数据,后20个为出现故障的数据。从表中可以得到,神经网络模型所判断的结果与实际结果全部一致且判断的概率基本都大于99%,可以初步证明本文的方法可以有效判断结构的状态。由于用来验证的数据来自于实际工作中采集的数据,所以此方法可以适用于同型号磨机的在线健康监测。此方法的主要过程总结如下:随机选取数组在机器正常运转时采集的数据以及保存的以往出现故障的数据作为训练数据集,训练神经网络模型,然后将从目前正在使用的结构上采集的数据输入该模型,进行结构健康状态判断。综上所述,测试结果可以初步证明此方法可以有效检测结构的健康状态。
图5 频谱图
表1 卷积神经网络测试结果
本文介绍了在传统的结构健康监测过程中引入1D卷积神经网络的方法,将特征提取和特征分类过程融合在一起,加快了模型特征提取和分类的时间,并利用卷积神经网络自动判断含有强噪声的结构的健康状态。文中采集的信号来自于磨机,而磨机在运转过程中振动非常大,甚至几乎每天都会因过大的振动而跳停,故在磨机主减速机运行过程中采集的振动信号含有很强的噪声,传统的结构健康监测方法需要对信号进行复杂的降噪处理,增加了计算的时间,同时由于结构复杂,最终可能需要专家或经验丰富的操作人员来判断结构的健康状态,难以实现故障自动判别。而上述试验初步验证了本文提出的方法可以从含有强噪声的信号中快速准确地获得监测结果,而不需要过多采用降噪手段以及依赖于操作人员的经验或技术水平。由于数据获取途径的限制,文中仅仅用基础的卷积神经网络的结构建立模型,而以目前卷积神经网络在其它领域的快速发展来看,卷积神经网络在结构健康监测方面还可以得到更多应用。因为卷积神经网络按其功能可以大致分为3类:分类、回归、概率估计。结构健康监测也大致可按4层结构划分:监测、定位、评估、预测。本文仅仅将卷积神经网络的分类功能应用于结构健康监测的损伤监测过程,卷积神经网络的引入大大提高结构损伤监测的效率。为了将卷积神经网络更好应用于结构健康监测,如果将卷积神经网络的回归和概率估计也应用到健康监测过程的结构评估和预测中,也必将会获得更大的收益。