随机卷积神经网络的内燃机健康监测方法研究

2021-09-08 01:20王瑞涵陈辉管聪

振动工程学报 2021年4期

王瑞涵陈辉管聪

摘要：提出了一种深度学习网络即结构?随机卷积神经网络，用于实现内燃机的智能健康监测。集成多个单一的卷积神经网络构成新的网络构架，通过卷积计算和池化操作对振动信号进行自动特征提取。在随机卷积神经网络结构中，应用Adabound优化器使学习率自适应变化，从而加快模型的权值更新。同时通过Dropout技术使结构中神经元随机失活，防止对训练数据进行复杂的协同响应，通过Dempster合成规则融合各个网络模型的诊断结果。所提出的健康监测方案用于对内燃机工作时的振动信号进行分析。实验证明，该方法克服了传统的数据驱动和卷积神经网络健康监测方法的局限性，摆脱了对人工特征设计的依赖，并且有较好的诊断性能，能够有效地对内燃机进行健康监测。

关键词：健康监测; 内燃机; 卷积神经网络; 集成学习

1 概述

内燃机作为一种重要的动力机械，广泛应用于各个领域，对其系统健康状况的监测不仅能够保证设备平稳高效的运行，而且能够及时发现出现的故障状况，有效防止重大事故的发生[1]。基于振动信号的分析是对内燃机健康状态监测的重要途径。这是由于振动信号采集方便，并且采集的振动信号包含了往复运动、旋转运动、机械冲击和气体的高速流动等丰富的信息。但是，内燃机系统的振动激励源多，其振动信号具有强耦合、弱故障特征的特点[2]，因此如何准确地提取振动信号中的有效特征是健康监测中的难点所在。

传统的振动信号分析方法是通过时频分析和图像识别方法来对故障特征进行提取和诊断[3]。其中时频分析方法包括S变换[4]，小波分析[5]，经验模态分解[6]，Winger分布[7]等，通过时频分析将一维信号映射到二维的时频分布图中，再通过图像识别方法对时频图进行分析。但是这种方法需要大量的专家知识，并且在诊断微小故障时，各个故障的时频图差异不明显，诊断效果并不理想。然而，随着机器学习的飞速发展，一种基于数据驱动的振动信号分析方法被提出，即“基于信号处理的特征提取+机器学习算法模型”的健康监测方案[8?12]，该方法分为人工设计特征、特征筛选和模型训练等三个部分。该方法相对于传统的振动信号分析法，不再需要对复杂的时频图进行图像识别，而是通过多源特征量融合实现对微小故障的诊断[13]，并且可以根据实时采集的数据对训练模型进行更新。然而，由于振动信号在时域和频域上有大量的统计指标，人工设计信号特征需要花费大量的时间和精力，并且不同的统计指标又会对最终诊断结果造成不同的影响，限制了该方法的性能。在大多数的情况下，设计合适的信号特征，并对多维特征进行合理降维难以实现。为了解决该方法的弊端，一种基于深度学习的健康监测方案在机械健康领域被提出[14]。基于深度学习的机械健康监测方案通过构建多层非线性变换的深度神经网络从原始信号中直接提取数据特征，实现故障特征的自适应提取与健康状况的智能诊断[15]。

考虑到深度学习具有处理大规模数据的能力，通过多尺度和多层次的学习，对振动信号进行分析，因此深度学习可以成为机械健康监测系统中强大有效的解决方案。雷亚国等[16]利用自动编码器（Autoencoder）对频域信号进行除噪，然后通过深度学习网络挖掘信号中的故障特征;LIU等[17]提出了一种新型的错位时间序列卷积神经网络（Dislocated Time Series Convolutional Neural Network）用于电机的故障诊断; SUN等[18]设计新型反馈神经网络来代替原卷积神经网络中的无监督方法进行滤波器权重的学习，并且最终的输出层用支持向量机来代替原Softmax函数; Shao等[19]提出新型的深度信念网络实现轴承故障的诊断，在新的网络结构中用自编码器压缩原数据和指数加权移动提高模型性能;INCE等[20]提出一种1D卷积神经网络结构，将特征提取和分类融合到单个的学习个体中，能够准确快速地实现对电机状态的监测;JANSSENS等[21]用卷积神经网络实现对信号特征的自动提取并有较高的准确率。相对于传统的基于数据驱动的健康监测方案，基于深度学习的健康监测方案不再依赖于信号分析技术和人工设计信号特征，直接实现端到端的结构，所有模型参数根据原始数据进行自动更新。表1展示了传统数据驱动和深度学习两种健康监测方案的不同点。同时，图1展示了不同机械健康监测方案的原理。

尽管深度学习模型已经在机械健康监测方面取得的了一系列的突破，但是隨着对深度学习模型的研究，仍出现了一些应用在机械健康监测的弊端，比如单一的深度学习网络结构造成了模型的泛化能力不足。同时，由于内燃机工况的复杂多变，数据量过多，造成深度学习模型训练时间过长等问题。针对模型泛化能力不足的问题，集成学习方法，比如随机森林和集成支持向量机被应用到机械健康监测中[22?23]，该方法融合多个分类器，提高模型的诊断稳定性与泛化能力。针对模型训练时间过长，多种改进的优化器被应用于深度学习网络结构中，比如Stochastic Gradient Descent（SGD）优化器，Momentum优化器，RMSprop优化器，Adam优化器，大大提高了深度学习模型拟合的速度。

在本文研究中，一种随机卷积神经网络（Random Convolutional Neural Networks）被提出并应用于内燃机的健康监测中，直接对采集的一维时域信号进行分析诊断。该种卷积神经网络结构利用集成学习思想，集成多个单一的卷积网络神经结构，并用Dempster合成规则对每个神经网络结构产生的诊断结果概率进行融合，改善以往的最大投票方案[24]对诊断结果进行判断，使得诊断结果更加直观，并且解决了不确定性的问题。同时，在RCNNs的网络结构中采用Adabound优化器和Dropout技术来加快模型拟合速度和减少模型训练参数[25?26]，最终提高模型的诊断性能。Adabound优化器结合了SGD和Adam优化器的优点，利用学习率的动态边界，在模型训练的过程中，实现了自适应优化器向SGD优化器的过渡，不仅可以提高模型的收敛速度，而且避免了模型易陷入局部最小的问题。Dropout技术在RCNN网络训练过程中随机省略网络结构中的部分神经元，从而简化网络结构，防止过拟合现象。所提出的健康监测方案可分为三个部分：（1）将多个单一的神经网络结构集成到随机卷积神经网络中，每次从训练集中随机抽取部分数据，对单一的卷积神经网络进行训练;（2）在模型训练过程中，采用Adabound优化器和Dropout技术，大大加快模型拟合速度;（3）设计一种诊断策略运用到诊断结果中，融合各个单一网络的诊断结果，使得诊断结果更加可靠和精确。

2 传统的卷积神经网络

深度学习来源于人工神经网络，是机器学习的一个分支。它具有多个非线性处理层，试图用多个处理层来挖掘数据信息。而卷积神经网络是深度学习中的一项重要技术，并且在机械健康领域中已经逐步开始应用。卷积神经网络是一种多层的监督学习神经网络，对目标进行多层表示，以获得更好的特征鲁棒性。通过多层非线性变换，挖掘数据中的有用信息，使得网络能够自动进行特征提取，最终使用分类函数或者回归函数达到数据分析的目的。卷积神经网络通过梯度下降法进行对损失函数的最小化，对各层参数进行反向调节，最终通过多次迭代找到最优参数，从而提高网络的精度[27]。同时，卷积神经网络通过局部连接，权值共享和池化来解决传统神经网络中出现的容易过拟合、梯度消失，和难以训练大量的数据集等问题。

卷积神经网络由输入层，隐含层和输出层构成。输入层可以处理多维数据，并且通过归一化等操作对数据进行标准化处理;隐含层是卷积神经网络的核心部分，其中包括卷积层、池化层、全连接层。通过构造多层卷积?池化层对原始数据进行卷积处理，卷积层实现特征提取，池化层实现特征过滤，而全连接层将重组提取的特征信息，使特征信息失去原有的多维结构，并通过激励函数传递到下一层。输出层则可通过归一化指数函数（Softmax function）实现对输入数据的分类。

2.1 卷积层

卷积层通过滤波器（filters）对局部区域进行特征提取，并通过激活函数生成输出特征。卷积层通过滤波器对输入数据I进行扫描，这里的矩阵I为原始的振动信号。滤波器的大小为F，步幅为S，填充为P。经过卷积计算，输入的结果为特征映射。特征映射的尺寸大小O可表示为

2.2 池化层

在卷积层进行特征提取后，池化层将对提取的特征映射进行特性选择和信息过滤，从而进一步减少模型参数的数量。池化层实际上是一种下采样操作，减少数据处理量的同时保留有用信息。池化层的操作有两种，最大池化和均值池化。本文采用的是最大池化。最大池化意味着每次池化操作选择该池化区域的最大值用来代表原区域。设池化长度为f，则最大池化操作便是在原特征映射c中的连续f个值中取最大值，以表示原特征映射的部分区域。经过池化层后，特征映射可表示为

经过多次卷积?池化操作后，全连接层和Softmax层将作为网络结构的最高层对输入的振动信号进行诊断与分类。

3 基于随机卷积神经网络（RCNNs）的健康监测

本文中，一种随机卷积神经网络被提出，并应用于内燃机的健康监测中。这种随机卷积神经网络采用了集成学习思想，集成多个单一卷积神经网络结构共同监测内燃机的健康状况。但是集成多个卷积神经网络结构必然需要更多的时间和计算机内存，这无疑增大了计算机的负担。因此，RCNNs采用了一种优化器即Adabound，在加快模型的拟合速度同时又保证模型不陷入局部拟合。同时，RCNNs的结构中，随机抽样层和Dropout操作被用于网络结构中，减少模型参数训练量从而防止模型陷入过拟合。在RCNNs的输出层中，采用Dempster合成规则将每个卷积神经网络的诊断结果进行融合，得到更加可靠和准确的诊断结果。

3.1 随机抽样层

设原始数据的总量为N，一个周期的数据个数为m。将总数据以m个数据点为一个数据周期进行划分，设共划分了n组数据，故N=n×m。从n组数据中，随机抽取80%的数据对单个卷积神经网络进行训练。设共有i个个体网络结构，故总共抽取了i次数据，分别对不同的网络模型进行训练。在对模型进行训练之前，需对数据进行标准化处理，使得每个周期数据集的量级在同一范围内。振动信号数据标准化的操作如下

3.2 Dropout技术

在传统的卷积神经网络结构中，每一层的神经元都会连接下一层的所有神经元，这种全部连接的网络结构会训练大量的参数，减慢了模型训练的速度。若训练数据量不够，模型参数过多，极易造成模型过拟合。Dropout操作则能很好地解决过拟合的问题，同时可以加快模型的训练速度。在训练过程中，按一定概率p使每个神经节点从其网絡结构中暂时失活，如图2所示。Dropout操作可以看作对原始网络中的神经元进行随机采样，得到一个更“瘦”的网络结构。但是在测试过程中，若还是随机失活部分神经元，将会导致输出结果的不稳定。因此，在测试阶段将每个神经元的输出乘以概率p，这样可以使在训练阶段和测试阶段每个神经元输出的期望值是相同的。

在随机卷积神经网络结构中使用Dropout技术，避免在训练过程中训练所有的神经元，减少模型参数训练量，可以在一定程度解决过拟合问题。同时，由于模型参数的减少，模型的拟合速度大大加快。具体的操作为：

3.3 Adabound优化器

由于RCNNs结构中集成了多个单一的卷积神经网络，造成结构复杂，所以训练网络所需的时间较长。因此使用优化器加快网络训练速度，在RCNNs结构中是必不可少的。传统的优化器有 SGD，Momentum，RMSprop，和Adam。SGD用固定的学习率，在模型拟合的过程中梯度下降的速度保持不变，模型达到拟合的速度较慢，并且模型在训练过程中容易产生震荡。而Adam优化器学习率会随着下降梯度的变化而变化，以最快的速度让模型收敛。但是随着迭代步数的不断增加，学习率会出现极小值，使得模型不能够收敛到最优解，在训练后期的拟合效果不如SGD优化器。本文中采用的是Adabound优化器[28]。Adabound优化器在学习率的变化范围中加了一个动态边界。学习率随着下降梯度的变化而变化，并且随着时间的推移，学习率的上限和下限会越来越紧，限制学习率减少到一个极小值，因此模型在训练过程中也会越来越稳定。Adabound优化器的原理为：

式中 Qi（w）表示在输入样本xi确定后，以参数w为未知数，以求得参数w最优解。gt表示对参数w求导的梯度公式，通过梯度随着参数w的不断变化，来改变mt和vt。mt为梯度的加权平均值，vt为梯度的加权方差值;为学习率，和为动力值;;表示被限定在[]范围内;和随着时间t的变化而变化，并不是一个恒定的上下限值。模型参数的更新可描述为

根据式（14）可知，学习率将会随着时间的变化而变化，并且与的差也会逐渐变小。在这种设置下，Adabound优化器兼具SGD和Adam优化器的優点。在训练早期由于上下界对学习率的影响较小，Adabound优化器更加接近于Adam;而随着时间的增加，裁剪区间[]越来越紧，在训练后期，使得Adabound优化器更接近于SGD，保持一定的学习率;在模型拟合后期中，Adabound优化器仍保持稳定学习率去更新模型参数。

3.4 基于Dempster规则的信息融合

在RCNNs结构中，原始振动信号数据通过Softmax层可以得到每组数据属于哪一类的概率yi。在传统的集成学习中，最大投票法被用于集成每个分类器输出的类别结果，如随机森林。虽然最大投票法比较简单且容易实施，但仍有一些弊端。在本文提出的RCNNs结构中，根据D?S证据理论[29]，采用Dempster规则对每个网络结构产生的类别概率进行融合，得到最终的分类概率。通过这种设置，使得到的分类概率更加直观并且准确。

3.5 基于随机卷积神经网络的船用柴油机健康监测流程

在本文中，一种随机卷积神经网络被设计并应用到内燃机的健康监测中。通过随机卷积神经网络对内燃机的健康状况进行实时监测。该深度学习模型结构如图3所示，步骤如下：

（1）通过传感器，收集内燃机在不同工况下的振动信号数据。

（2）对原始的时域信号数据进行标准化处理，然后将数据划分为训练集与测试集，将标准化后的数据直接输入网络结构中，不再依赖于人工的特征设计和特征筛选。

（3）采用集成学习思想和Dropout技术构造随机卷积神经网络结构。同时，Adabound优化器被用于这种新型的网络结构中，加快模型参数的更新。

（4）随机卷积神经网络由多个单一的网络结构组成。在每个网络结构中，从训练数据集中随机抽取部分数据集对网络进行训练。在本文中，随机抽样率为80%。

（5）用测试数据集对所提出的深度学习结构的性能进行测试。通过Dempster合成规则将各个网络结构预测的概率进行融合，得到最终的分类结果。

4 实验验证

4.1 数据描述

本文以四冲程柴油机（型号：R6105AZLD）为研究对象，通过监测诊断其健康状况验证所提出方法的有效性[30]。本文所用试验台如图4所示。该试验台架模拟了柴油机五种不同的工况，其五种工况模拟方案如表2所示。每种工况在相同的柴油机转速（1500 r/min）下采集振动信号数据。本实验中，采集振动信号的传感器为B&W14100型加速度传感器，设置的采样频域为4 kHz。由于柴油机为四冲程，曲轴转动720°为一个工作循环。本文中，以3200个数据点为一个采样周期。各工况的振动信号均在柴油机设置的转速下达到稳定工作状态后进行采集。由于模拟柴油机的故障工况对柴油机系统影响较大，柴油机不能在故障工况下进行长时间的运行。所以在每个工况下，采样200组数据，总共1000组。试验中，随机选取80%的样本用于训练，20%的样本用于测试。反复进行多次训练?测试，保证测试结果的准确性。

4.2 基于传统数据驱动的柴油机健康监测结果

将本文所提出的深度学习网络结构监测方案的性能与传统的数据驱动与卷积神经网络监测方案进行对比。基于数据驱动的健康监测方案通过人工设计特征，特征筛选，以简单分类器对数据进行分类。通过设计合理的信号特征，采用合理的数据降维方法对原始振动信号进行预处理，最终将处理后的振动信号输入到各种简单的分类器中对数据进行分类。而传统的卷积神经网络监测方案通过单一网络结构从时域信号数据中直接进行特征提取，达到端到端操作的目的，最终根据从原始数据学习的信息实现目标分类。

本文所有的算法编程软件为python3.6.1，操作环境是macOS。深度学习模型采用pytorch框架实现，其他机器学习算法通过python语言编程实现。

4.2.1 传统的数据驱动方法

人工设计信号特征是通过信号的时域与频域分析将振动信号的幅值、能量分布等特征随着时间变化的规律用统计学方法进行描述。时域分析通常包括相关分析、时域统计分析和包络分析，一般情况下根据时域波形对机械设备的运行状态进行粗略判断;频域分析是根据信号的频域描述对信号的组成及特征量进行分析和估计。本文将所采集的时域信号通过离散傅里叶变换转化为频域信号。常用的时域、频域统计参数如表3所示。

表3中前21个为时域特征值，后6个为频域特征值。本文研究中，将时域、频域特征统计参数组合起来构成的融合特征向量作为信号的初始特征，可有效弥补单一时域或者频域特征的不足。用这27个特征来表示原始振动信号。

若直接将27个特征作为分类器的输入对信号进行分类，则容易造成维数灾难，导致分类器的分类效果较差，所以需要进行特征筛选。本文用流形学习对时、频域统计参数特征进行自动筛选。流形学习是一种减少非线性数据维数的有效方法。通过流形学习，可以从高维空间生成低维流形结构，并得到相应的嵌入映射，最终达到数据降维和可视化的目的。在本文中，三种流形学习算法被用于特征自动筛选，分别为等距特征映射算法（ISOMAP），局部线性嵌入算法（LLE）和t?分布随机邻居陷入算法（TSNE）。数据经过流形学习处理后被输入最终的分类器中，实现对内燃机工况的诊断。

本文研究中，将时、频域特征通过三种不同流形学习算法降维到3维，方便数据可视化。经过流形学习处理后的数据如图6所示。

由图6可知，将27维特征降维至3维，3维特征为原27维特征的融合特征，每一个新的特征融合了原多个特征所隐含的信息，不再单一地表示某一个时域或频域特征信息，以达到简化数据维数的目的，其融合后的特征分别用特征一、特征二、特征三来表示。LLE算法特征筛选的效果比较差，G4和G5之间有很大的重叠，G1，G2和G3之间的间隔不大，同类之间的分布比较离散。出现这类现象的原因可能是由于LLE是基于局部邻域刻画流形结构的，即假设每个点可以被其邻域点线性重构，当其邻域不能够很好地重构该点时就会出现比较大的偏差。ISOMAP算法在特征筛选中取得了比LLE算法更好的效果。G3的所有样本点都和其他几种样本分散开来，G1和G2、G4和G5从三维可视化的角度有少量的混叠，五类不同工况下的数据点基本上都各自聚成一团，但还是有个别样本点偏离了自身群体，这是因为ISOMAP算法过分依赖于原始数据拓扑空间的稳定性，比较适合于大样本情况下的计算。而TSNE算法在特征筛选中的效果最好，特征筛选后的数据分类清晰，每种工况聚类效果明显，五种不同的工况分布在低维空间距离较远，具有较强的可分性。

本文采用的分类器是支持向量机（SVM）、极限学习机（ELM）和随机森林（Random Forest）。通过不同的分类结果的对比，得到最优的流形学习算法和分类器。本文中，将数据集按80%和20%划分训练集和测试集，训练?测试重复实验30次，最终以平均准确率作为诊断方案性能的指标，以降低随机性对分类模型的干扰。平均准确率如表4所示。

由表4分析，所有方法的准确率均超过了80%，这主要是由于本文采用了大量的时、频域统计参数特征融合的方式来表示原振动信号。这种特征融合的方法能够极大地反映原振动信号在不同工况下的变化。在所有的方法中，以TSNE作为特征提取的方法和Random Forest为分类器这种方案能够得到最高的准确率，达到90.1%。其他的方案均未达到90%，也就是说有十分之一以上的可能性会将故障工况忽略。实际上这在严苛工业应用中是不可接受的，尤其在船舶行业。在船舶航行中，柴油机一旦发生故障而且并未被及时发现，这将对全体船上工作人员的人身安全造成极大的威胁。同时由表4分析可得，SVM作为分类器在故障诊断上的效果不能令人满意。主要是由于SVM本身是一个二值分类器，无法直接进行多分类，需要构造多个SVM分别对每个故障工况进行分类，造成负类样本的数据远远大于正类样本的数据，出现了样本的极端不对称，影响了分类准确率。而Random Forest在诊断准确率上能够取得比较令人满意的效果。这是由于利用了集成学习思想，将多个决策树组合起来，能够直接对数据多分类，并且在参数训练过程中每个决策树孤立运行，最终能够得到性能较好的强分类器。

4.2.2 传统的卷积神经网络

在本文中，为了反映随机卷积神经网络结构所使用的Adabound优化器的优势，在单一的卷积神经网络模型中比较了Adabound优化器与其他几个优化器的性能，其中包括SGD，Momentum，RMSprop和Adam。不同的优化器的参数设置如表5所示。目前，还没有系统的方法确定各种优化器的最优参数。在本文研究中，每个优化器的参数都是由默认值和实验确定[26]。

图7显示了不同优化器在训练集和测试集上的学习曲线。在训练过程中，所有优化器加速的卷积神经网络结构都能达到接近100%的准确率，自适应方法Adam，Adabound优化器能够较快地使模型拟合，但是SGD优化器达到令人满意的准确率速度较慢，大约需要迭代40步，并且拟合过程波动较大。在测试集方面Momentum，RMSprop，Adam优化器能够以最快的速度达到较高的精确度，SGD优化器在迭代60步时使模型达到拟合，使用SGD优化器的网络模型在模型拟合之后的测试准确度高于Momentum，RMSprop，Adam优化器，如图7（b）所示。同时，可以发现Momentum和RMSprop优化器模型拟合好之后，准确率仍出现了部分波动。而Adabound优化器在训练集和测试集中均能较快地达到较高的准确率，并且学习曲线波动变化小，能够保持稳定的准确率。与其他优化器相比，所使用Adabound优化器网络模型的测试精度提高了约2%。

表6为模型达到拟合的时间，本文以测试集准确率稳定且达到94%为模型达到拟合的标准。由表6分析可得，Adam和Adabound这种自适应的优化器使网络模型在最短的时间内达到拟合。虽然SGD优化器在训练后期能够使模型得到较高的准确率，但是训练时间远远高于其他优化器。

4.3 随机卷积神经网络

本文所提出的随机卷积神经网络将多个单一的网络结构集成起来对内燃机进行健康监测。随机卷积神经网络从已经分好的训练集中每次随机抽取80%的数据对单一网络模型进行训练。随机卷积神经网络中的每个网络结构中都用了两个卷积层，两个池化层，和一个全连接层。池化层中的操作为最大池化，卷积层中的激活函数为ReLu，优化器为Adabound。表7列出了本文所用网络结构的相关参数设置。

本文所用不同机器学习方法的健康监测方案的性能如图8所示。箱线图中间的横线表示每个方案准确率的中位数，箱子的长度表示不同方案诊断性能的稳定性。对于传统数据驱动的方法，SVM分类器在测试集效果上明显弱于其他两个分类器，而ELM和Random Forest的平均准确率相差不大，但是Random Forest在测试集稳定性方面比ELM更具有优势。经分析可知，传统数据驱动方法监测性能方面的主要差异是由特征筛选方法导致的。不同的流形学习算法对特征的学习能力不同，因此导致了最终分类性能的不同。因此可知，特征设计和特征筛选过程对诊断性能有较大的影响。而深度学习模型在这两个过程方面有极大的优势，深度学习模型能够从时域中的振动信号自适应地提取工况特征并且完成健康状况的智能诊断。传统的卷积神经网络在健康监测诊断方面的性能明显比其他方案好，测试准确率可达到94%左右。本文所提出的随机卷积神经网络集成了卷积神经网络的优点，能够自动实现数据特征设计和特征筛选的过程。如图9所示，基于随机卷积神经网络的内燃机健康监测方案显示了较高的性能，诊断准确率可达98%以上，最高可达100%，每次诊断准确率均比CNN高。同时，随机卷积神经网络的箱线图长度最短，说明在测试集准确率方面波动最小，非常适用于在线监测诊断内燃机健康状况，可以提供高度可靠和稳定的诊断率。并且随机卷积神经网络集成了多个单一的网络结构，从每个网络结构的训练数据集中随机抽取80%用于训练，使得每个网络结构都不同，在减少数据输入的同时使得网络结构更加多样化，提高了网络结构在监测诊断方面的泛化能力。

由于最终目标是实现在线监测，因此除了诊断准确率以外，还需要监测方案能够在极短的时间内响应。在实际应用中，将诊断模型在线下训练好后，再应用到机械健康的在线監测中，所以测试时间比训练时间更具有参考价值，它能够显示监测系统对内燃机状态变化的反应速度。从表8的测试时间可以看出，以SVM为分类器的监测方案测试时间相比其他方案较长，在发生紧急事故的情况下，此种监测方案不能够在极短的时间内作出响应。同时，可以发现深度学习模型在诊断时间方面远远快于其他方案，尤其是单一的卷积神经网络能够最快地响应系统状态的变化。而本文所提出的随机卷积神经网络诊断速度也很快，时间同样小于1 s。这是由于RCNNs网络结构采用了Adabound优化器和Dropout技术，大大加快了模型参数的训练速度，同时由于深度学习模型可以直接从原始振动信号数据中提取有效特征实施诊断，不需要浪费时间在设计特征和特征筛选过程中。从准确率和测试时间两方面分析可知，本文所提出的随机卷积神经网络能够提供较高的准确率，稳定的诊断力和较短的诊断时间，完全适用于所考虑的在线监测任务。

5 分析与结论

本文的研究目的是通过振动信号实现对内燃机的健康监测。为了实现研究目的，在试验台架上对一架四冲程内燃机进行模拟故障运行，得到五种不同工况下的振动信号用于分析所提出的健康监测方案的性能。通过与传统方案的比较与分析，可以得到以下结论：

（1）传统的数据驱动方法很大程度上取决于特征设计与特征筛选的步骤。在特征设计方面，需要探索更有效的特征来表示原振动信号以进一步提高诊断结果，但这一过程需要大量的人力和专家知识。而在特征筛选方面，选用合适的流形学习算法是关键。

（2）与传统的数据驱动方法相比，深度学习模型在机械健康监测领域具有更好的性能。在模型超参数设定完成之后，深度学习模型可以从原始信号直接提取特征，无需人工干预。

（3）本文所提出的随机卷积神经网络结构中采用的Adabound优化器，可以提高船用柴油机健康监测的稳定性和性能，大大节省了模型训练时间。

（4）利用集成学习思想，构造了随机神经网络结构，解决了传统单一神经网络诊断精度不稳定的问题，大大提高了诊断模型的诊断准确率和泛化能力。

在本文研究中，所用的振动信号均在同一转速下采集到，考虑到实际情况下，内燃机的工作并不是在同一转速下，所以，以后的工作将进一步研究随机卷积神经网络在不同转速情况下的性能。

参考文献：

[1] 尚前明，王瑞涵，陈辉，等. 多信息融合技术在船舶柴油机故障诊断中的应用[J]. 中国航海， 2018， 41（3）： 26-31.

SHANG Q M， WANG R H， CHEN H， et al. Application of multi-information fusion technology for fault diagnosis in marine diesel engine[J]. Navigation of China， 2018， 41（3）： 26-31.

[2] 岳应娟，王旭，蔡艳平. 内燃机变分模态Rihaczek谱纹理特征识别诊断[J]. 仪器仪表学报， 2017， 38（10）： 2437-2445.

YUE Y J， WANG X， CAI Y P. Internal combustion engine fault diagnosis based on identification of variational modal Rihaczek spectrum texture characterization[J]. Chinese Journal of Scientific Instrument， 2017， 38（10）： 2437-2445.

[3] YANG Y， MING A， ZHANG Y， et al. Discriminative non-negative matrix factorization （DNMF） and its application to the fault diagnosis of diesel engine[J]. Mechanical Systems and Signal Processing， 2017， 95： 158-171.

[4] 王成栋，张优云，夏勇. 基于S变换的柴油机气阀机构故障诊断研究[J]. 内燃机学报， 2003，21（4）： 271-275.

WANG C D， ZHANG Y Y， XIA Y. Fault diagnosis of diesel valve train based on S transform[J]. Transactions of CSICE， 2003，21（4）： 271-275.

[5] 蔡艳平，李艾华，王涛，等. 基于时频谱图与图像分割的柴油机故障诊断[J]. 内燃机学报， 2011， 29（2）： 181-186.

CAI Y P， LI A H， WANG T， et al. Diesel engine fault diagnosis based on time-frequency spectrum image and image segmentation[J]. Transactions of CSICE， 2011， 29（2）： 181-186.

[6] 蔡艳平，李艾华，王涛，等. 基于EMD-Wigner-Ville的内燃机振动时频分析[J]. 振动工程学报， 2010， 23（4）： 430-437.

CAI Y P， LI A H， WANG T， et al. I.C. engine vibration time-frequency analysis based on EMD-Winger-Vile[J]. Journal of Vibration Engineering， 2010， 23（4）： 430-437.

[7] 劉昱，张俊红，毕凤荣，等. 基于Wigner分布和分形维数的柴油机故障诊断[J]. 振动、测试与诊断， 2016， 36（2）： 240-245.

LIU Y， ZHANG J H， BI F R， et al. Study on fault diagnosis of diesel valve trains based on Winger distribution and fractal dimension[J]. Journal of Vibration， Measurement &Diagnosis， 2016， 36（2）： 240-245.

[8] 王强，张培林，王怀光，等. 基于稀疏分解的振动信号数据压缩算法[J]. 仪器仪表学报， 2016， 37（11）： 2497-2505.

WANG Q， ZHANG P L， WANG H G， et al. Data compression algorithm of vibration signal based on sparse decomposition[J]. Chinese Journal of Scientific Instrument， 2016， 37（11）： 2497-2505.

[9] 焦晓璇，景博，黄以锋，等. 基于小波包BP_AdaBoost算法的机载燃油泵故障诊断研究[J]. 仪器仪表学报， 2016， 37（9）： 1978-1988.

JIAO X X， JING B， HUANG Y F， et al. Research on fault diagnosis for airborne fuel pump based on wavelet package and BP_AdaBoost algorithm[J]. Chinese Journal of Scientific Instrument， 2016， 37（9）： 1978-1988.

[10] 李學军，李平，蒋玲莉. 类均值核主元分析法及在故障诊断中的应用[J]. 机械工程学报， 2014， 50（3）： 123-129.

LI X J， LI P， JIANG L L. Class mean kernel principal component analysis and its application in fault diagnosis [J]. Journal of Mechanical Engineering， 2014， 50（3）： 123-129.

[11] 张立国，李盼，李梅梅，等. 基于ITD模糊熵和GG聚类的滚动轴承故障诊断[J]. 仪器仪表学报， 2014， 35（11）： 2624-2632.

ZHANG L G， LI P， LI M M， et al. Fault diagnosis of rolling bearing based on ITD fuzzy entropy and GG clustering[J]. Chinese Journal of Scientific Instrument， 2014， 35（11）： 2624-2632.

[12] 李学军，李平，蒋玲莉，等. 基于异类信息特征融合的异步电机故障诊断[J]. 仪器仪表学报， 2013， 34（1）： 227-233.

LI X J， LI P， JIANG L L， et al. Fault diagnosis method of asynchronous motor based on heterogeneous information feature fusion[J]. Chinese Journal of Scientific Instrument， 2013， 34（1）： 227-233.

[13] 徐玉秀，赵晓清，杨文平，等. 多参数与多测点信息融合的行星轮故障诊断[J]. 仪器仪表学报， 2014， 35（8）： 1789-1795.

XU Y X， ZHAO X Q， YANG W P， et al. Planetary gear fault diagnosis based on information fusion of multi-parameters and multi-points[J]. Chinese Journal of Scientific Instrument， 2014， 35（8）： 1789-1795.

[14] ZHAO R， YAN R， CHEN Z， et al. Deep learning and its applications to machine health monitoring[J]. Mechanical Systems and Signal Processing， 2019， 115： 213-237.

[15] 文成林，吕菲亚，包哲静，等. 基于数据驱动的微小故障诊断方法综述[J]. 自动化学报， 2016， 42（9）： 1285-1299.

WEN C L， L? F Y， BAO Z J， et al. A review of data driven-based incipient fault diagnosis[J]. Acta Automatica Sinica， 2016， 42（9）： 1285-1299.

[16] 雷亚国，贾峰，周昕，等. 基于深度学习理论的机械装备大数据健康监测方法[J]. 机械工程学报， 2015， 51（21）： 49-56.

LEI Y G， JIA F， ZHOU X， et al. A deep learning-based method for machinery health monitoring with big data[J]. Journal of Mechanical Engineering， 2015， 51（21）： 49-56.

[17] LIU R， MENG G， YANG B， et al. Dislocated time series convolutional neural architecture： An intelligent fault diagnosis approach for electric machine[J]. IEEE Transactions on Industrial Informatics， 2017， 13（3）： 1310-1320.

[18] SUN W， ZHAO R， YAN R， et al. Convolutional discriminative feature learning for induction motor fault diagnosis[J]. IEEE Transactions on Industrial Informatics， 2017， 13（3）： 1350-1359.

[19] Shao H， Jiang H， Zhang H， et al. Electric locomotive bearing fault diagnosis using a novel convolutional deep belief network[J]. IEEE Transactions on Industrial Electronics， 2018， 65（3）： 2727-2736.

[20] INCE T， KIRANYAZ S， EREN L， et al. Real-time motor fault detection by 1-D convolutional neural networks[J]. IEEE Transactions on Industrial Electronics， 2016， 63（11）： 7067-7075.

[21] JANSSENS O， SLAVKOVIKJ V， VERVISCH B， et al. Convolutional neural network based fault detection for rotating machinery[J]. Journal of Sound and Vibration， 2016， 377： 331-345.

[22] SHAO H， JIANG H， LIN Y， et al. A novel method for intelligent fault diagnosis of rolling bearings using ensemble deep auto-encoders[J]. Mechanical Systems and Signal Processing， 2018， 102： 278-297.

[23] KOWALSKI J， KRAWCZYK B， WO?NIAK M. Fault diagnosis of marine 4-stroke diesel engines using a one-vs-one extreme learning ensemble[J]. Engineering Applications of Artificial Intelligence， 2017， 57： 134-141.

[24] ZHANG W， LI C， PENG G， et al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load[J]. Mechanical Systems and Signal Processing， 2018， 100： 439-453.

[25] Murugan P， Durairaj S. Regularization and optimization strategies in deep convolutional neural network[J]. 2017： arXiv：1712.04711

[26] 周安眾，罗可.一种卷积神经网络的稀疏性Dropout正则化方法[J].小型微型计算机系统，2018，39（8）：1674-1679.

ZHOU A Z， LUO K. Sparse Dropout regularization method for convolutional neural networks[J]. Journal of Chinese Computer Systems， 2018， 39（8）： 1674-1679.

[27] 刘建伟，刘媛，罗雄麟. 深度学习研究进展[J]. 计算机应用研究， 2014， 31（7）： 1921-1930.

LIU J W， LIU Y， LUO X L. Research and development on deep learning[J]. Application Research of Computers， 2014， 31（7）： 1921-1930.

[28] LUO L， XIONG Y， LIU Y， et al. Adaptive gradient methods with dynamic bound of learning rate[J]. 2019：arXiv：1902.09843

[29] 徐从富，耿卫东. Dempster-Shafer证据推理方法理论与应用的综述[J]. 模式识别与人工智能， 1999， 12（4）： 424-430.

XU C F， GENG W D. Summary of Dempster-Shafer evidence reasoning theory and application[J]. Pattern Recognition and Artificial Intelligence， 1999， 12（4）： 424-430.

[30] 王际同. 基于嵌入式的柴油机在线故障诊断系统设计[D]. 太原：中北大学，2016.