基于深度SSD改进模型的传动设备状态在线监测研究

2024-04-01 02:37王宜忺周大可

计算机测量与控制 2024年3期

王宜忺，周大可

(1.国营芜湖机械厂，安徽芜湖 241000；2.南京航空航天大学自动化学院，南京 211100)

0 引言

传动设备是机械系统重要组成部分之一，作为核心零部件传统设备在精密加工、航空航天、船舶制造、汽车制造等领域，有着十分广泛的应用。传动设备的工作状态不仅会影响到机械系统的工作效率、工作稳定性和动能损失，还涉及到安全生产问题。随着机械系统精密化程度的不断提升，对传动设备控制精度、工作强度及可靠性等，都提出了更高的要求。传动设备的安全性与可靠性在很大程度上取决于日常维护保养及实施有效的在线监控，尤其是对于一些服役时间较长及使用强度较大的传动设备，应实施严格的在线监控，通过采集到的数据指标判定传统设备的工作状态[1]，及预判其使用寿命[2]。传动设备的在线监控过程，主要包括原始信号采集，信号处理，在线故障分析判别和故障点定位和分类识别等。故障信号处理和信号分析，是传动设备在线监控的关键，从现有的研究成果来看，主要从对原始信号特征的特征提取[3]，特征参数分析及状态识别等角度展开研究[4]。

文献[5]提出一种基于FFT(Fast Fourier Transform，快速傅里叶变换)特征信号提取与分析算法，利用传感器采集传动设备的工作信号，再融合细化谱和小波变换识别出原始故障集中的异常特征，进而对传统设备的运行状态做出判断。但FFT算法最大的缺点是延时，在多帧运算环境下由于信号的重叠帧较大，直接影响到算法的识别精度。此外，FFT算法的实现复杂度较高，当获取到的故障数据集规模较大时受数据规模和长度的限制，同样会影响到算法的工作效率；文献[6]设计一种经过改进的SVM模型，算法先利用小波包提取故障集特征，适用于多种故障并存情况下故障定位、分类和检测。改进SVM模型的优势是能够在小样本环境下，相对准确地实现对多故障类型的分类，由于模型中引入了不同类型的核函数，在高维映射条件下不会使故障判断中出现维数灾难；但SVM模型在处理多种故障问题时的效率明显降低，在应对大规模数据集时也存在故障分类与诊断精度降低的情况。文献[7]提出一种基于模糊理论模型的故障在线检测算法。模糊算法模型为复杂数据样本集条件下的传动设备在线监测，提供了另一种思路，该算法具有较强的灵活性，容错性高，通过模糊规模调整和隶属度函数的选择而灵活地处理和应对不同情况下设备状态问题。同时，通过模糊评价得出的结果也较为直观，有助于对最终结果的判断；但模糊算法模型也有其自身的缺点，例如将采集到的原始数据进行模糊处理，会限制最终的检测结果精度，即使在模糊处理后进行反模糊化，也无法还原到最佳水平。

随着神经网络算法的不断发展和进步，深度神经网络模型已经成为主流[8]，并开始在故障检测领域应用。尤其是在非监督环境下，可以通过构成多层深度网络结构显著提升模式的故障数据训练能力。深度结构的优势是使用较少的参数来表示复杂的函数，模型运算能力得到显著提升的同时，对于故障点的识别精度同样能够得到保证。较为常用和训练能力较强的深度网络模型包括卷积神经网络[9]、递归神经网络[10]、生成对抗神经网络[11]，YOLO模型[12]，深度置信网络[13]等。本文针对传统设备故障诊断的特征提出一种改进的SSD模型(Single Shot Detector，单激发多框检测)，SSD是一种优秀的目标检测算法，与深度卷积神经网络(CNN)相比，其计算性能和提取多尺度故障特征的能力更强，与YOLO相比其在计算速度和MAP(平均精度)方面的优势更加明显。但经典的SSD模型容易受到噪声干扰，尤其在利用高层特征层进行故障检测时往往由于信息量过少而降低故障检测精度；为此本文引入了注意力机制模块和特征增强模块，提升SSD网络的表达能力，也有助于改善算法的检测精度和总体性能。

1 传感器信号的采集调制与包络分析

针对传动设备故障信号的采集，可以根据策略参数要求选择不同类型的传感器，选用传感器时主要考虑传感器的灵敏度、线性范围及频率响应等。故障信号的处理过程如图1所示。

图1 传动设备故障信号的处理过程

采集到的故障信号中包含系统噪声和环境噪声，会后续故障信号特征提取和视频分析构成不利影响，因此要对采集到的信号做滤波处理[14]。根据香农采样定理可知[15]，故障信号的采样频率要至少高于时频分析频率2倍以上才能确保分析效果。原始信号滤波调制包括幅值调制和频率调制两个部分：首先，幅值调制就是信号卷积使高频时域信号低频信号周期的脉冲变化。调制中将两个信号在时域上相乘，通过改变幅值达到抑制噪声的目标；其次，频率调制能够使采集到的原始信号转换成变频信号，提升信号的稳定性同时也能够达到抑制噪声的目的。共振信号解调[16]是一种包络频谱分析方法，当传动系统元件受到损伤时，高速旋转中的固有振动会产生巨大冲击，并混杂系统噪声和环境噪声。带通低频滤波器对信号包络频谱进行检测，并通过剥离共振信号能够诊断出包络频谱的异常情况。

时频分析时最常见和最有效的原始信号分析方法之一[17]，传统设备故障信号具有明显的波形特征，通过观察信号的时域波形可以识别出设备是否存在异常。当传动设备的零部件发生局部损伤或存在缺陷时，信号的调制波形会出现异常，本文基于包络谱分析判定传动设备信号是否存在异常，设实时采集到的原始故障信号为s(t)，对该信号进行希尔伯特变换[18]：

(1)

(2)

其中：h(t)对应的幅值信号为g(t)，原始信号s(t)为幅值信号的包络谱：

(3)

幅值信号g(t)由于经过了幅值调制和变换，相当于对原始信号进行了预处理和噪声滤除，可以作为故障数据分析模型的输入项。根据信号的频率、幅值、包络谱等差异，能够识别出传动设备的常见故障，如点蚀、磨损、偏磨等。将振动信号图像化处理能够更直观地观测出故障点位置和故障类别，在故障信号的采集周期内，基于信号的相位点和序列特征判断故障数据与时间t的函数关系。

对传感器提取到的信号进行短时傅里叶变换，得到相位和振动之间的对应频谱，分别以信号的频率值、时间t和振动信号的幅值作为图像的横坐标、纵坐标和像素点，得到对应的振动图像，实现了从振动信号到振动图像的转换。基于图像故障识别的优势在于更直观地提取故障特征，并可以对故障特征向量进行降维处理[19]，能够处理相对规模较大的故障数据集。故障数据集中第i个复合故障信号h(t)i对应的故障图像中的像素点为(xi，yi)。

2 深度SSD网络构建及模型的改进

2.1 SSD网络构建

SSD是一种单阶段检测模型，可以对采集到的故障数据做卷积操作，并提取原始故障数据特征。无论是图像数据还是原始故障信号，SSD网络模型都能够省略重采样环节，缩短故障检测的时间。在模型卷积核的选择方面，SSD网络模型采用了较小的金字塔型结构的卷积核，能够缩短数据训练的时间和提高对故障数据定位与检测的精度，SSD网络适合处理图像数据，因此可以将故障信号转换为不同分辨率的图像数据。SSD网络从结构上分为基础卷积部分、辅助卷积部分和预测层，如图2所示。

图2 SSD网络结构设计

在基础卷积部分采用了VGG-16对输入数据进行处理，SSD与传统卷积网络相比去掉了分类层的结构，使网络结构更加简洁高效，VGG-16的基础功能与深度卷积网络模型类似。根据输入数据集的规模和复杂程度可以适度调整VGG-16结构的复杂度，具体包括了卷积层、池化层，并选择适合的激活函数调整整个网络的参数体系和结构设计；而与传统的深度神经网络结构相比，SSD增加了CONV-6，CONV-7，CONV-8，CONV-9等4个卷积层替代了传统复杂的隐含层和神经元连接结构[20]。卷积层在数据训练能力方面超过了传统深度网络的神经元结构，同时结构设计更加简洁。辅助部分是在传统卷积层结构基础上增加的特殊结构，如CONV-10和CONV-11，辅助结构提升了模型的数据训练性能，同时能够按照数据集规模大小或图像尺寸大小排序，提高SSD网络的适用性。

2.2 模型的改进

SSD网络卷积核结构采用了类似于金字塔式的结构设计，符合原始故障数据集特征提取的规律，对于每个卷积层都采用了L2级的正则化处理模式，一方面通过正则化提升对不同特征的权值赋值；另一方面正则化有助于提升置信度计算的精度，同时提升对设备故障点定位的准确性。在针对传动设备的目标检测中，经典SSD算法在检测效果上有一定程度改善，但算法效率较低，尤其在故障数据集规模较大时较低的检测效率无法满足在线检测的要求，为此本文对经典SSD网络模型的性能进行改进，从两个维度进行优化和改进：其一是引入注意力机制模块提升网络数据训练的性能。注意力机制模块本质上是一种信息共享模块，在对故障数据训练过程中避免了数据特征出现冗余，可以实现对数据的降维处理，进而提升和改进的网络模型性能；其二时引入特征增强模块，突显出更多的故障细节。

首先，引入注意力机制模块，卷积核的大小为k表示故障数据训练中信息共享的范围(即参与通道注意力预测临近数据个体的数量)，因此在卷积核大小为k的条件下，用wk表示SSD网络模型的通道注意力机制：

(4)

在wk中共包含了k×n个参数，注意力机制中第j项权重ωj与主体之间的关系表示如下：

(5)

其中：κ为注意力机制的控制参数，取值范围在0～1之间，wk与权重的关系还可以表示如下：

wk=κ(Ck(ωj))

(6)

其中：C表示为模型的一维卷积，注意力机制模块能够在指定区域内实现信息的交互和共享，当故障数据集内部的数据量累计到一定程度时，维数较小的通道和周围相近的一维卷积表现为一种线性关系：

C=ζ(ω)+b

(7)

ζ表示线性函数的斜率，当一维卷积C的数值为一个确定值时，SSD卷积核k的计算过程如下：

(8)

其次，引入特征增强模块，提升改进SSD网络模块对小故障目标及微弱特征的提取能力。特征增强的思路是在基础卷积层进行空洞卷积操作，形成特征增强模块同时还可以提高SSD网络模型原有各个模块的运算效率。将CONV4_3的卷积层进行特征融合并形成底层特征图，分别利用1×3和3×1卷积做特征二次提取，基于1×1卷积提升SSD网络模型的训练性能，及基于3×3卷积结构增强视野范围，同时改善经典SSD网络模型的数据训练效率，特征增强模块的示意图，如图3所示。

图3 特征增强模块的示意图

从两个维度对经典SSD网络结构进行改进，尽管从一定程度上增加的模型的复杂度，但注意力机制模块的引入增强了区域内部信息的共享程度，有助于提高网络模型的效率；而引入特征增强模块在没有改变分类网络结构和增加回归复杂的前提下，增加了4个BN层有效控制了模型参数复杂度，并提升了经典SSD网络特征融合的能力。改进后的结构设计，如图4所示。

图4 改进后的SSD模型结构设计

3 传动设备状态的在线监测

基于改进SSD模型的传动设备在线检测过程，包括多尺度特征融合与上采样，特征金字塔结构的改进与先验框的匹配，及损失函数选择等5个步骤：

1)传感器信号多尺度特征融合。

2)特征层的上采样。

3)特征金字塔结构的改进。

4)特征图先验框比例分析。

5)损失函数的确定

3.1 多尺度特征融合与过采样

对SSD模型中特征层进行多尺度融合可以提高网络的表达能力和算力，尤其在输入特征故障集规模较大的条件下，能够改善模型在线检测的准确率和效率。模型特征融合的方法有相加方法和通道拼合两种方法，由于简单相加容易导致特征层中出现过多冗余的信息，故本文选择了通道拼合方法。拼合指将长宽尺寸相同但包含通道数量不同的特征层进行融合，由于特征层长宽值没有改变，即使在融合时也不会改变特征层内的原始故障数据规模，还可以保留原始数据集内的全部信息。在拼合后，特征层的信息容量增大，算力增强，能够应对更大规模的故障数据集。但在特征层多尺度融合后，通道数据增加容易导致特征融合出现冗余现象，在针对SSD模型的改进中由于引入注意力机制模块，可以实现对冗余的消除和对高维特征降维处理。基于通道拼合进行多尺度特征融合，还能够降低特征层内部不同元素差异度，改善在故障数据训练过程中故障特征提取准确率。

3.2 特征层的过采样

(9)

近邻插值方法的计算量较小，能够获取在不同尺度下的新图像，解决由于数据降维带来的图像失真及检测率下降等问题。

3.3 特征金字塔结构的改进

在经典SSD目标检测中，多模型检测大都基于最后一层检测，因为最后一层卷积尺寸大且算力更强，数据训练和特征融合的能力也更强。但金字塔结构设计中位于底层特征信息量尽管较少，但位置准确率和特征提取的准确性均较高；而高层特征层尽管包含的特征较为丰富，但经过多次卷积以后对故障点的定位信息会发生偏差。为此本文采用线性插值的方法对原有SSD网络模型中的特征层金字塔结构进行优化，具体的过程是将最小的特征层尺寸增加为上一特征层尺寸，再进行下一步的特征融合，改进的过程如图5所示。

图5 对金字塔结构的改进

使用1×1卷积操作调整网络通道数量，然后在基于累加的方式选择最佳的通道数量，融合后再基于2×2卷积消除混叠效应。通过对金字塔结构的优化和改进将高层与底层特征进行有效融合，一方面有助于故障集深度特征信息的提取，另一方面也能够避免降维过程中图像失真情况的发生。SSD金字塔结构高低层特征在原图上的感受视野不同，不同特增层对应尺度存在差异，但生成比例一致。

3.4 特征图先验框比例分析

由于故障特征数据集的视野感受范围不一致，为了适应不同规模的数据集会在不同的卷积层上生成同比例但不同层尺度的先验框。假定原始的故障集特征图尺寸为m维，对应大小为k的卷积，每个网格所包含的先验框数量与卷积大学一致也为k，那么该特征图生成的先验框数量为m×n×k个，每个先验框用坐标值机图像的高度和宽度定位和预测(x，y，W，H)，先验框在对应的特征图上缩放比例S，表示如下：

(10)

其中：Smax为高特征图的最大值，Smin为低特征图的最小值，根据特征图的复杂程度和待检测数据集的规模大小设置特征图缩放比例值，先设置不同的宽高比例ξ，通常情况下取值如表1所示。

表1 待检测的特征图宽高比值范围

每个特征图单元格宽及高计算过程如下，单元格宽、高值与比例ξ密切相关：

(11)

固定的宽高比值能够确保先验框的缩放比例始终保持一致，基于改进的SSD算法模型训练时先将先验框和图像的真实框进行比对，并提取特征图中预测制定目标像素点特征，并将先验框标定为正样本；如果通过比对，所有先验框与真实框的比例都不一致，将该类样本标定为负样本，判断正负样本还可以通过观测先验框和真实框之间的重叠面积来判定，给定一个理论上的阈值范围(通常设定为0.5)，通过对比重叠面积和理论阈值的大小关系判断目标样本的正负。通常情况下输入改进SSD模型的样本均衡度都较差，正样本数量要远远低于负样本的数量，而待检测传动设备故障图像数据集，通常只包括有限多个指标，且受到系统噪声和环境噪声的影响会导致检测效率和检测精度的降低。正样本数量过少和不均衡分布，容易导致训练模型向负样本数据集的方式收敛。为解决上述问题，一方面通过调整负样本先验框的宽高比，加速负样本数据的特征提取以改善均衡度；另一方面，选择合适的SSD模型损失函数，并提高负样本数据损失函数计算效率和函数值，改善正负样本之间的不均衡度，保障模型对故障数据定位和检测的准确性。

3.5 损失函数的选择与在线故障检测的实现

SSD模型损失函数既是故障图像先验框匹配的关键，同时也是决定整个模型性能的重要工具，损失函数的值越低证明模型的数据训练性能越强，对设备故障定位和检测的准确度越高。本文选用适用于多分类的复合函数L作为改进SSD网络模型的损失函数，复合函数L的优势在于能够处理较大规模的故障集，能够处理包含多种故障在内的故障集，而且与SSD网络模型的契合度更高。决定损失函数L值的因素有SSD网络的置信度λ、边界框信息ζ、真实框的位置τ，损失函数L主要由两个部分构成，即置信度损失函数L1和位置损失函数L2：

L((x，y)，λ，ζ，τ)=

(12)

其中：α为权重系数，对于位置损失函数和置信度损失函数而言，α是一种此消彼长的关系，根据SSD模型数据训练的复杂度及故障集的规模等，适度调整两个函数的权重比例关系。确定损失函数后，改进的SSD模型在线故障状态监测进入最后一个环节，即消除精度不合适的先验框，降低模型的冗余度和复杂度，避免出现重复检测的情况。现将所有预测框按照置信度排序并计算阈值范围，直接删除置信度较低的先验框；循环迭代操作直到宣传最优先验预测框，锁定最终的传动设备状态检测结果。

4 实验结果与分析

4.1 实验准备与故障数据集的采集

本文在实验室环境下，验证提出改进SSD算法传动设备对齿轮箱运行状态的监控情况，实验用的齿轮箱实物图，如图6所示。

图6 齿轮箱实物图

实验中选择了德国MMF-KS76C100型高精度传感器，在齿轮箱工作运行中共采集了4 080个样本，包括4 000个正常样本和80个异常样本。实验用齿轮箱共包括3个齿轮组和3个齿轮轴，其中故障点的分布情况统计和故障集的构建情况如下：齿轮组的故障类型包括点蚀和磨损(这两种故障会导致齿轮箱出现异常振动和异响，严重会导致齿轮打齿或损坏)，齿轮轴的故障类型是偏磨(该种故障会导致齿轮轴同轴度降低，影响齿轮咬合精度，引发异响和其他机械故障)，如表2所示。

表2 故障样本集的构建

实验控制系统的硬件环境设置，如表3所示。

表3 实验环境设置

实验步骤如下。

1)在SSD网络上实验，并将SSD网络划分为基础网络、辅助网络和预测层。

2)改进主干网络，用注意力机制模块和特征增强模块改善网络的性能。

3)调整SSD网络模型的参数并删除4倍以下的预测层，降低神经网络模型的复杂度。

4)确定损失函数并根据数据集信号的幅值、频率和像素点，将故障信号进行转换。

4.2 结果分析

将故障样本集中80个故障样本和4 000个正常样本随机分成10组，每个组中包含8个不同类型的故障样本和400个正常样本，基于改进SSD模型对每个小组的7故障样本检测情况进行分析和讨论，具体如图7(a)～(j)所示。

图7 改进SSD算法对于每组故障的定位与检测

如图7的统计结果所示：当识别出故障样本时信号的频率会出现异常，异常频率范围通常在20～150 Hz，在改进SSD算法模型下，仅有第6组出现了1个漏检故障，其他各组都能够准确识别出8个故障点，这表明改进SSD算法具有较强的故障定位与检测效率，平均的故障检测率高达98.8%，而在相同的实验环境下，没有经过改进的SSD模型的故障检测率为94.5%，改进后的SSD模型在性能上优于传统的SSD模型。相对于传统SSD算法模型，改进SSD模型尽管在结构上进行了精简和优化，降低了模型的复杂度，但模型的故障检测性能并没有受到影响。

引入传统的FFT算法、改进SVM算法和模糊算法，统计各算法的对故障数据的定位与检测率，如表4所示。

表4 各传统算法的故障检测率 %

从对各传统算法的检测率统计结果可知：3种传统算法的平均检测精度较低，与改进SSD算法存在一定差距。改进SSD算法的优势是将对故障信号的检测转换为图像检测，能够更准确第定位故障点，同时更加频率和幅值的变化趋势描述图像像素点的差异，因此显著提高了对传动齿轮箱故障定位和检测的准确率，同时根据齿轮及齿轮轴点蚀、磨损及偏磨产生的不同振幅和不同频率，还能够准确地辨别出故障的位置和类型。

检测效率也评价故障在线监测算法性能的重要指标之一，以10组样本为对象观测各算法完成整个样本检测的耗时情况，耗时越短表明算法的效率越高。在实际在线监测中，检测效率具有重要的意义，尤其在数据集规模较大时检测效率较高算法的优势会越来越明显，完成10组检测各算法的耗时情况，如表5所示。

表5 各故障在线监测算法的检测耗时对比

数据统计结果显示，在完成10组故障样本的检测后，改进SSD算法的每组平均耗时仅为44 s，远远低于3种传统算法。SSD算法数据训练效率较高，与模型的金字塔结构设计密切相关，由于改变了传统神经网络辅助的网络结构，同时引入了注意力机制模块和特征增强模型，在确保在线监测准确率的同时，也进一步提升了模型对故障数据的训练能力和检测效率。

5 结束语

传动设备是一个机械系统核心组成系统之一，传动系统工作的稳定性决定了机械系统的性能输出，因此有必要对传动系统的工作稳定性实施在线检测。本文设计了一种基于改进SSD模型的在线监测方法，先通过对信号的时频包络分析预处理，降低噪声干扰，并通过信号幅值和频率转换，将信号转换为图像数据作为SSD模型的输入数据集。设计了SSD网络模型在基础卷积基础上增加了辅助卷积，引入注意力机制模块和特征增强模块，改善SSD网络模型的信息共享效果，并提升模型对图像数据的训练能力；最后改进了SSD模型的金字塔结构，再通过先验框匹配及选择适合的损失函数，提高对设备故障监测性能。实验结果显示，改进SSD方法在检测精度和检测效率方面，相对于几种传统算法都有较为明显的优势。