基于一维卷积神经网络的塔式起重机结构损伤诊断方法研究*

2022-10-31 09:09宋世军安增辉吴月华
起重运输机械 2022年18期
关键词:卷积准确率神经网络

宋世军 刘 昂 安增辉 杨 蕊 吴月华

1山东建筑大学机电工程学院 济南 250101 2山东富友科技有限公司 济南 250101

0 引言

塔式起重机(以下简称塔机)属于垂直作业机械,涉及高空领域,一旦塔机结构发生损伤,有可能会发生倒塌,进而造成人员伤亡的重大事故[1]。由于采集到的塔机结构数据量庞大,采用人工诊断存在效率低等问题。因此,研究塔机结构智能损伤诊断方法,实现塔机结构数据的自动分类,提高塔机结构是否存在损伤的判断速度,对保障塔机的安全可靠运行,降低事故发生率具有重要意义。

近年来,深度学习中的卷积神经网络(Convolutional Neural Network,CNN)独具的卷积结构能够处理复杂的数据结构和每个位置都会被卷积操作获取并保留特征的优势,卷积神经网络在计算机视觉、自然语言处理和轴承故障诊断识别等领域成功应用[2]。塔机结构数据属于一维信号,可通过一维卷积神经网络(1D CNN)来提取塔机结构数据特征并进行分类。本文在原有数据的基础上引进数据增强方法;建立1D CNN模型,实现了塔机结构数据的分类,并与随机森林[3](RF),支持向量机[4](SVM)和人工神经网络[5](ANN)算法进行结果对比,为进一步研究基于深度学习的塔机智能损伤诊断方法打下基础。

1 理论基础

1.1 卷积神经网络

卷积神经网络(CNN)是一种反馈神经网络,主要通过对卷积层和池化层不断的堆积叠加构成的网络结构,计算过程为[6]

式中:X为原始输入数据,θ(N)为第N层所学习的训练参数值,fN为第N层所执行的算式运算,f(X)为通过卷积、激活、池化得到的原始数据X的输出特征图。

卷积层是CNN最重要的部分,通过人工设计的方式可自动生成卷积核矩阵,将卷积从上到下、从左到右依次作用于输入数据的所有位置,最终得到卷积后的值[7]。卷积算法的数学公式为

式中:xi为当前的输入特征,xi+1为卷积后的特征图,⊗为卷积运算符号;Wi为卷积核权值,bi为偏置。

最大池化层加在卷积层之间,可有效缩小参数矩阵的尺寸和全连接层中参数的数量,起到加快计算速度和防止过拟合的作用[8]。卷积网络的最终输出为一维向量,作为n分类的一维输出向量,其与层间的神经元相连,数学表达公式为[9]

式中:x为全连接层的输入,o(x)为全连接层的输出,f(·)为激活函数,ω为全连接层的权重,b为偏置。

1.2 批标准化

为防止神经网络在训练时出现梯度消失问题,使激活函数落在敏感的区域、加快学习收敛度,引进批标准化(BN),将越来越偏向的分布拉回到标准化分布[10,11]。BN的操作可使每一层计算的结果都符合标准正态分布,其数学表达式为

式中:为平均值,xvar为标准差。

1.3 Dropout

Dropout的作用就是减少中间特征数量,增加各层特征之间的正交性,防止过拟合的发生,起到正则化的效果。神经网络在未加入Dropout时,前向传播复杂,结构如图1a所示;在加入Dropout后,神经网络使部分神经元不参与网络的训练,减弱神经元节点间的联合性,增强泛化能力,结构如图1b所示[12]。

图1 是否使用Dropout的神经网络模型

2 基于1D CNN的塔机结构损伤智能诊断

2.1 数据增强

数据增强是扩充数据样本规模的一种有效方法,数据的规模越大、质量越高越好,模型才能有更好的泛化能力,主要包括几何变换、颜色变换、SMOTE、Sample Pairing、mixup 等[13]。

考虑到塔机主要由4个主肢承受力的作用,且采集的是塔机工作做旋转运动时的数据,故对现有的样本数据进行旋转90º、180º、270º处理。采用这种方法可以尽可能地提取到相似数据之间明显的区别特征,同时又能增加参加训练的样本数量,模型训练起来得到更具有鲁棒性的特征。此方法的实现方式为

式中:x、y为旋转角度之后的新坐标值,、为需要原样本数值的坐标平均值,xi、yi为原样本数据值,θ为需要旋转的角度。

2.2 基于1D CNN智能损伤诊断的模型

本文提出的基于CNN算法用来对塔机结构损伤智能诊断,且采用的是一维卷积神经网络,如图2所示。将测得的塔机顶端位移数据输入模型,可快速判断塔机结构状态是否存在损伤。

图2 基于1D CNN的状态识别模型

在图2中,基于1D CNN诊断模型主要包括1个输入层、2个卷积层、2个池化层、4个全连接层。其中输入层为塔机位移原始数据,2个卷积层的卷积核为1×6,2个池化层的卷积核大小都是2×1,4个全连接层的节点数依次为256、128、35、2。然后,全连接层将具有分类特征的值传输给Softmax分类器,再将数据分为完好和损伤2种状态。通过对各参数的比较分析后,本文提出的1D CNN算法模型参数设置如表1所示。

表1 1D CNN模型各参数设置

Softmax输出的类别标签为向量形式,其损失代价函数表达式为[14]

式中:(xi,yi)为训练数据集;m为样本个数;yi∈{1,2,…,k}为样品的标签类别;θ为模型训练期间设置的参数集,用来最小化当前成本函数。

1D CNN诊断算法流程如图3所示。输入原始采集的塔机位移顶端数据,原始数据1行代表一个类别,48列代表着48个特征,完好状态表示为1,损伤表示为0;并将数据数的80%用于模型训练,剩余20%用于测试。然后输出预测结果并和真实类别做比较,根据实验结果不断对模型有关参数进行优化。

图3 基于1D CNN状态识别算法流程图

3 实验数据的获取

为验证本文所提出的1D CNN智能诊断算法的有效性,用刚度仪在塔机上采集的原始顶端位移数据样本进行实验,刚度计的安装位置为塔机回转塔身的任意主肢或与塔身轴线是平行的结构处[15],按照箭头指示安装。可在司机室显示仪器上读取数据。

本文实验采用刚度仪采集的数据,并用数据增强的方法增强数据,以样本原始数据总量的随机选取80%用于模型训练,剩下20%的样本数据用来测试模型。

4 实验研究

4.1 各参数的影响

本文构建的1D CNN模型,可根据准确率对应4种优化器:Root Mean Square Prop(RMSprop)、Adaptive moment estimation(Adam)、Adaptive gradient(Adagrad)、Adadelta[16]。不同的学习速率会影响实际的收敛速度,对每组优化器及学习率分别进行15次实验,取平均准确率,实验结果如表2 所示。

表2 不同优化器及学习率实验结果

由表2可知,每种优化器在学习率不同时分类结果差别明显,在学利率为0.001时Adam优化器达到的准确率最高;而RMSprop优化器在学习率为0.01和0.1时差距不大,升降不明显;Adadelta优化器虽然准确率随学习率的提高一直在增加,但不明显;Adagrad优化器与上述三者相反,学习率为0.000 1时效果达到最佳。横向对分类器对比各自的优化结果,可看出当采用Adam优化器时可使训练集(Train)和测试集(Test)达到最高准确率。为此,本文选择Adam优化器,优化学习率设置为0.001。

在有监督学习的情况下,从样本数据中学习不同种类的关键特征是实现分类较高正确率的前提[17]。为了充分提取不同种类训练样本数据中的特征信息,可采取增加卷积层的数目。本文运用的是1D CNN模型,样本数据的维数不高,采用卷积层从1层逐渐增加到5层的前提下,在训练迭代次数同为50时情况下,用分类准确率作为评价指标。

实验结果如图4所示,开始时随着卷积层数的不断增加,模型训练准确率逐渐上升趋势,但增加到3层后训练和测试准确率出现下降,在识别率上出现不佳情况。在层数为2的模型中,在兼顾训练准确率较高的基础上,测试达到了较高准确率,故在此CNN模型中的卷积层采用2层。

图4 不同卷积层数的准确率

卷积核主要用于实现跨通道交互和信息集成;实现卷积通道数量的维数减少或增加;单通道的单核卷积是乘以一个参数,但通常为多通道的多核卷积,实现多个特征层的线性组合。本文所述为一维卷积,只是在宽度方向上进行滑动窗口并相乘求和。

设置不同的卷积核维数处理相同的样本数据进行试验,实验结果如图5所示。由图5可知,在卷积核维数为1×6时可使训练和测试准确率效果达到最佳,故选用卷积核维数为1×6。

图5 不同卷积核维数的准确率

4.2 方法结构的影响

由图6可知,在加入BN情况时,训练和测试准确率上升速度较快,即收敛速度较快,可得出加入BN时效果较好。

图6 有无BN对准确率的影响

由图7可知,在训练阶段中,正确率在有无Dropout时的结果差别不大;在测试阶段,在引进Dropout技术后测试准确率明显高于不引进Dropout技术的情况。本文引进此技术,可有效提高测试准确率。

图7 有无Dropout的准确率变化

4.3 与其他方法对比

将1D CNN、RF、SVM和ANN模型的准确率进行对比,由图8可知,1D CNN模型的训练和测试准确率都高于其他3种算法,说明1D CNN模型能够较为准确地提取不同类样本数据之间的特征,具有良好的健壮性。进而证明了本文采用1D CNN模型算法的有效性。

图8 4种方法准确率比较

4.4 实验结果及分析

模型的训练和测试准确率如图9所示。训练准确率能到100%,测试准确率能达到97.3%。损失函数值如图10所示,损失函数值不断下降,说明此1D CNN模型训练效果较好,未发生过拟合现象。

图9 训练和测试准确率

图10 损失函数值

5 结论

1)本文提出的1D CNN模型训练和测试准确率较高,能较为准确地识别出塔机结构数据是损伤还是完好。

2)本文建立的模型具有有效的学习特征能力,可直接从原始数据信号中提取各自存在的差异特征。

3)模型训练和测试时用的迭代次数较少,从而证明了用时短、效率高,能有效地运用到实际情况中。

猜你喜欢
卷积准确率神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
MIV-PSO-BP神经网络用户热负荷预测
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于深度卷积网络与空洞卷积融合的人群计数