多尺度卷积胶囊网络在刀具破损监测中的应用

2023-12-07 04:15:10吴琪文周学良吴瑶
机械科学与技术 2023年11期
关键词:刀具胶囊卷积

吴琪文,周学良,吴瑶

(湖北汽车工业学院 机械工程学院,湖北十堰 442002)

随着智能制造技术的迅猛发展,数控加工装备及其辅助加工过程的智能化和自动化逐渐成为提升智能制造水平的关键之一。随着加工零件产品样式的复杂化以及所用材料硬度的提高,导致刀具失效的频率要高于传统产品。在加工过程中由于切削材料的组织和硬度不均匀、加工系统产生不良振动或是刀具刃磨质量欠佳均易造成切削刃微崩,但是当刀具发生细微崩刃时并不会引起较大的加工噪声变化,因此不易被察觉。一旦出现这种情况后刀具的切削能力会下降,虽能够继续切削工作但会大幅降低工件的表面质量,若未及时发现则会导致刀具的刃损部分迅速扩大使刀具完全丧失切削能力,造成生产线的停工。因此及时有效地监测切削刃的破损状态对提示工艺系统服役能力、减少质量损失具有重要的意义。

以往是在生产线停工后通过监测装置的触头与刀具间的接触或者非接触式激光束监测进行判断刀具的状态,但考虑到加工现场的可操作性以传感器信号来反映刀具切削刃的变化更为常用[1-2],常用信号有切削力信号[3-4]、振动信号[5]、声发射信号[6-7]、主轴功率信号[8-9]以及电流信号[10]。由于加工过程中的信号噪声含量较高,需采用信号处理技术提取有效特征来表征刀具状态。最常用的是根据加工动态信号的特性,从时域、频域以及时频域分析提取有效特征来表征刀具的变化,例如Li[11]在时域中分析电流信号均值的变化来跟踪铣刀的状态,从而达到监测的目的,Sun 等[6]依据声发射信号的特定频率分量特征来判断刀具的破损状态,文献[12-13]则将信号模态分解到不同频带分量中提取其时频域中的能量特征来监测铣刀的破损状态,Akbari 等[8]则通过时频域特征研究主轴电流信号的谐波畸变,发现峰值和均方差能够及时反映刀具的状态。通常表征刀具变化的相关特征是根据加工过程和失效机制来定义的,而特征的选择则是影响模型预测精度的关键因素,因此针对不同的加工过程想要保证后续模型预测的精度,不仅需要依靠丰富的专家经验来提取特征同时也要花费大量的时间。

随着深度学习方法的不断发展,神经网络在特征提取和异常监测方面的性能不断提高,被广泛应用于刀具状态监测研究中,也取得了相应的成果[14-15]。在神经网络中CNN 因其较强的特征提取能力被广泛应用于刀具状态监测领域,Duroa 等[16]通过搭建声发射传感器框架以采集过程数据,使用CNN 拟合刀具失效的过程来增强刀具状态监测系统的可靠性;Li 等[10]在主轴电流信号时域分析的基础上通过CNN 学习刀具在加工过程中的失效过程,达到预测刀具破损的目的;Ambadekar 等[17]基于DCNN 提取刀具的侧面磨损特征,在线监测刀具状态。以往的研究人员在利用CNN 模型监测刀具状态时,通常采用传统CNN 结构,即构造二维数据样本和二维卷积核提取刀具特征。受此启发,Antić等[18]将提取到的振动信号经短时傅里叶变换(STFT)为频谱图,再经过CNN 学习频谱图中的磨损特征,也取得了较好的监测效果。

想要通过CNN 有效提取复杂数据中刀具破损的相关特征,往往需要大量不同工况下的样本数据训练模型,才能准确得到不同状态下的特征分布。以往研究中作者对数据集的构建仅限于采集单一切削参数下的加工数据,然而单一的工况不能够全面反映机械加工中的复杂工况,因此造成模型的泛化能力差和监测准确性差的结果。针对这个问题,提出了一种基于多尺度卷积胶囊网络(Multiscaleconvolution capsule network,MCCN)的刀具破损状态监测模型,监测多种切削参数下刀具是否发生细微崩刃。考虑到工业中传感器的成本以及安装的便捷性,采用振动传感器采集多种切削参数下刀具正常和细微崩刃时的振动信号,然后通过模型中的一维多尺度卷积层对采集到的原始振动信号降噪和提取特征。进而通过模型中的胶囊网络层进一步学习特征中的空间位置信息弥补多尺度卷积层特征提取的不足,进一步提取信号中的隐藏特征。且在模型中采用学习率自适应优化算法(Adam)动态更新网络参数,同时在多尺度卷积层中设计批量归一化(Bacth normalization)来规范网络层中输入数据的分布。

1 理论基础

1.1 卷积层

卷积神经网络中的特征提取过程主要由卷积层完成。卷积层中通过卷积核对输入数据进行卷积运算生成特征图,特征图通过激活函数非线性化生成输出特征输入下一层。用Kil和bli分别表示l层中第i个卷积核的权重和偏置,卷积运算可表示为

式中:*为卷积核和局部区域之间进行点积运算;yli+1(j)为 第l+1层 中特征图i的 第j个神经元的输出特征。

激活函数让网络能够非线性映射输入信号,增强网络的表达能力。目前在卷积层中常用的激活函数为整流线性单元( R eLu) , R eLu激活函数因其在参数更新的过程中不会出现梯度弥散的性质而被广泛应用,可表示为

式中ali+1(j)为经过激活函数后的激活值。

1.2 批量归一化

批量归一化(Batch normalization, BN)的意义在于减少输入数据内部协方差的偏移,使输入数据的分布一致。在训练中利用批量归一化调整数据在网络内部层与层中的输入分布,规范每一层网络输入数据的分布不仅能够加速网络的收敛而且可以减少训练占用的内存。通常在卷积层或全连接层之后激活函数之前添加。批量归一化中,参数 γ(i)和 β(i)能够缩放和平移归一化后的特征,恢复网络的表达能力,并且在反向传播参数更新时避免梯度消失或爆炸的问题,训练更加高效。当批量归一化层的n维输入是x=(x(1),···,x(i),···,x(n))时,批量归一化操作可以表示为:

式中:y(i)为神经元响应的输出; γ(i)为 尺度因子; β(i)为平移因子,在参数更新的过程当中 γ(i)和 β(i)也能不断被更新。

1.3 胶囊网络

胶囊网络是2017 年由Hinton 设计提出的[19]。胶囊网络的特殊之处在于以胶囊向量神经元作为输入模型,而传统神经网络中是使用标量神经元作为输入;使用胶囊向量神经元作为模型的输入和输出,在降低特征信息丢失的同时也能够提高模型的特征提取能力[20]。标量神经元与向量神经元对比如图1所示。

图1 标量与向量神经元Fig.1 Scalar neurons and vector neurons

胶囊网络的结构分别由普通卷积层、主胶囊层以及数字胶囊层组成,整个运算过程可以大致分为以下3 个部分:

1)普通卷积层。与传统的卷积神经网络一样,对输入的数据进行卷积操作提取初级特征,其表达式为

2)主胶囊层。在主胶囊层中会将卷积层提取到的初级特征进一步提取为高级特征,并且胶囊化后形成主胶囊层,主胶囊主要由卷积层的输出以及挤压函数构成,其表达式为

在挤压函数中,输入的向量被压缩到0 ~ 1 之间,可以有效降低后续计算量。由于挤压函数并不会改变输入向量的方向,因此能够将主胶囊层中的特征完好的传递至数字胶囊层中。

3)主胶囊层到数字胶囊层之间的传递。胶囊在两层之间的传递涉及两个过程,即线性变换和动态路由参数更新。与全连接神经网络不同的是,在数字胶囊层的线性变换中每一个胶囊向量都会乘以一个独有的权重矩阵来预测更高级别的胶囊向量,其表达式为

式中:ui为 第i个 输入胶囊;Wij为 权重矩阵;uˆj,i为预测向量。

在动态路由过程当中,每个由线性变换所得到的预测向量uˆj,i将会按比例分配给高级胶囊sj,并且由动态路由完成参数的更新,因此将所有预测向量加权求和且经挤压函数压缩得到更高级的胶囊,其表达式为:

式(10)表示sj压 缩得到vj的 过程,参数ci j和bi j的更新过程表示为:

式中bi j的初始值表示胶囊i和 胶囊j耦合的对数先验概率。在每一次迭代中都先将bi j初始化为0,进而计算出耦合系数ci j的 初始化值和vj, 并且由vj和uˆj,i来更新bi j和ci j的值,最终得到一组最佳的耦合系数。

动态路由更新过程示意图如图2 所示。

图2 动态路由更新过程示意图Fig.2 Schematic diagram of the dynamic routing update process

2 基于MCCN 的刀具破损监测模型

2.1 MCCN 模型结构

由于加工环境中的噪音不可避免,若直接提取特征那么信号中的高频噪声会干扰局部特征的提取,从而降低预测准确性[21]。因此,本文提出了一种基于MCCN 的监测模型,有效避免噪声干扰的同时也减少了数据预处理的工作量。MCCN 模型中由多尺度卷积层提取相关特征,胶囊网络层(主胶囊层、全连接层和分类层)监测刀具状态,模型结构如图3 所示。

图3 MCCN 网络结构示意图Fig.3 Diagram of MCCN network structure

在多尺度卷积层中,将第一层卷积层设计为宽核卷积,利用宽核卷积感受野宽的特性来抑制信号中的高频噪声以此增强网络的抗噪性能,同时在宽核卷积层之后添加两层小卷积核层来增加网络的深度以提高网络学习能力。多尺度卷积层的输出作为胶囊网络层的输入,胶囊网络层的核心思想是将多尺度卷积层的标量输出胶囊化为向量,进一步提取特征中的隐藏信息提高模型的空间特征提取能力。该模型将原始信号作为输入无需对信号进行预处理,这种端到端的数据驱动方法有效降低了信号处理的复杂性。考虑到模型是直接输入原始信号各层中的数据分布会明显变化,因此在卷积层之后设计BN 层将各层数据的分布拉回一致,进而缩短训练时间提升模型性能。

2.2 前向传播

MCCN 模型中多尺度卷积层的运算过程与1.1 节中介绍的卷积运算类似,多尺度卷积层的设计能够从高维空间中抽取有效的刀具特征。由于多尺度卷积层的下一层是主胶囊层,主胶囊层中的胶囊单元为向量单元,将卷积层后激活的特征图中每8 个通道合并为一个新的胶囊单元,因此主胶囊层中胶囊的个数为上层激活特征总数的1/8,重构后的胶囊单元作为下一层的输入。

胶囊单元在主胶囊层中的运算过程见1.3 节中的介绍,数字胶囊层中输出的胶囊单元为两个维度为10 的向量,分别代表不同的刀具状态。因此对预测向量求其二范数来表征不同道具状态的概率,其表达式为

式中pj为模型输出的概率值。在模型的前向传播过程当中,经过多尺度卷积层、主胶囊层和数字胶囊层的运算后,将输出的预测向量转化为标量,最终输出的是2 个概率值,分别对应刀具的两种状态。

模型训练过程中需要通过损失函数来衡量模型输出的预测值和真实值之间的差距,作为反向传播更新网络权重参数的依据。本文模型中采用的损失函数由间隔损失和重构损失结合来计算总损失,其表达式为

在反向传播过程中选用Adam 优化方法来更新网络权重,它能够根据训练数据不断迭代更新网络的权重有效避免局部最优解的同时占用最少的内存,Adam 算法的细节可见[22]。

3 实验验证

3.1 实验平台搭建及数据采集

为了验证所提方法的有效性,搭建了车削过程刀具状态监测实验平台,并进行了实验分析。实验设备采用J1CK6132 数控车床、切削材料为45#钢,切割刀具为硬质合金(本次实验中使用两种类型的刀具:全新的刀具和细微崩刃刀具,如图4 所示)。数据采集系统为DT9857 数据采集仪,使用Kilster型号为PCB352C33 的振动加速度传感器(频率响应:0.3 ~ 15 kHz)采集车削加工中Z和Y方向的振动信号,外部传感器数据以10.24 kHz 通道采集,传感器安装示意图和实验环境如图5 所示。

图4 全新刀具和细微崩刃刀具Fig.4 New tools and slightly chipped tools

图5 实验环境和传感器布局图Fig.5 Experimental environment and sensor layout

在实验中设置6 种不同的切削参数,主轴转速为800 r/min、1 000 r/min 和1 200 r/min,进给量为0.05 mm/r 和 0.06 mm/r,切割深度直径为0.3 mm。分别使用全新的刀具和崩刃的刀具车削实验,两种不同状态的刀具分别在6 种不同的切削参数下实验,共计12 组实验。考虑到采集的数据为完整的车削加工过程包括进刀和退刀,为排除此干扰则截取稳定车削阶段的振动信号构建模型训练的数据集,且不对信号做任何处理(不同切削参数下截取稳定车削阶段中Y方向振动信号,如图6 所示)。

图6 平稳车削时原始信号图Fig.6 Original signals during smooth turning

3.2 实验设计

为了验证MCCN 模型的有效性及优越性,本文使用相同的数据集从以下角度比较验证:

1)网络参数:选取不同batch size 值和不同输入数据段长度进行分析。

2)模型对比:在确定网络参数后与CNN 和WDCNN 进行对比。

影响MCCN 模型的主要参数包括batch size 值与输入数据段长度。为比较不同batch size 值下模型性能,设计了不同batch size 值对比实验(batch size=10、25、50、75、100);由于本实验数据集为一维时间序列,输入数据段长度对网络模型的准确性也会有影响,通过设计不同长度的数据段作为模型输入对比试验(输入数据段长度为1 024、2 048、4 096)。

在确定MCCN 的batch size 值和输入数据段长度后与CNN 和WDCNN 进行对比。在本文对比的3 种模型当中,均直接将原始数据作为输入不进行信号预处理。MCCN 模型的结构参数、网络的前向传播过程以及损失函数均在第2 节中加以介绍,MCCN 模型的网络参数如表1 所示。

表1 MCCN 网络结构参数Tab.1 MCCN network structural parameters

对比模型CNN 中的卷积操作为二维卷积,池化操作为最大池化,损失函数选用交叉熵损失函数,结构参数如表2所示。

表2 CNN 网络结构参数Tab.2 CNN network structural parameters

对比模型WDCNN 是Zhang 等提出的一种用于轴承故障诊断的新型CNN 模型,因其较强的抗噪性能,能够识别不同负载下轴承的故障种类,并且达到较高的识别精度[21],因此做为本实验中的对比模型。对比模型WDCNN 中卷积为一维卷积,池化操作为最大池化,损失函数选用交叉熵损失函数,结构参数信息如表3 所示。

表3 WDCNN 网络结构参数Tab.3 WDCNN network structural parameters

3.3 实验验证与分析

如3.1 节所示,实验中设置6 种不同切削参数,主轴转速为800 r/min、1 000 r/min 和1 200 r/min,进给量为0.05 mm/r 和 0.06 mm/r,切割深度直径为0.3 mm。分别使用全新的刀具和崩刃的刀具车削实验,两种不同状态的刀具分别在6 种不同的切削参数下实验,共计12 组实验。在刀具正常状态的6 组实验中,均截取稳定车削阶段下时常为150 s 的Y方向振动信号,总点数为9 216 000。在细微崩刃状态的6 组实验中,均截取稳定车削阶段下时常为150 s 的Y方向振动信号,总点数为9 216 000。因此整个数据集的总总数据点数为18 432 000。

本次实验基于TensorFlow 框架搭建MCCN、CNN 和WDCNN 网络模型,服务器配置为Intel i7 10TH1650Ti。选取数据集的85%作为训练集,15%作为测试集,首先使用训练集训练网络模型,其次将训练后的网络模型在测试集上进行评估测试。

首先对提出的模型进行网络参数分析,MCCN模型的主要参数包括输入的数据段长度和batch size 值。对于输入数据段长度这一参数来说,数据段的长度越长其包含的时序信息就越多,卷积提取到的时序特征就越高。但是对比结果图7a)显示,不是数据段的长度越长模型的识别精度和收敛速度就越好。因此从时间成本和准确度两方面考虑,应当选择合适的数据段长度(input=2 048)作为输入。在确定输入数据段长度为2 048 的前提下,对于另一个参数batch size 来说,理论上讲batch size 的值越小,模型的精度会越高网络的收敛速度更快,但训练时间也会变长。通常情况下,增大batch size 的值,不仅可以提高内存的利用率、减少迭代次数还能够缩短计算时间,但是在数据集较大时盲目的增加batch size 值则会降低网络收敛的速度。因此选取不同的batch size 值对模型性能进行测试,测试结果如图7b)所示。从结果中也能够看出batch size值越小模型的准确率就越高收敛速度也越快,但是从时间成本和准确度两方面考虑,batch size 值并不是越小越好也不是越大越好。因此根据数据集的大小和网络的特点,选择合适的batch size 值(batch size=25)才是提高网络性能的解决办法。

在确定最优输入数据段长度和batch size 值后,将MCCN 与对比模型对比试验,结果如表4 所示。可以看出模型MCCN 和WDCNN 在测试集上预测的准确度和损失值均远高于普通的CNN 模型。然而造成这一结果的主要原因是,MCCN 和WDCNN模型当中均是使用一维信号作为模型输入和也是使用一维卷积来提取刀具特征,且输入的信号段尺寸较长来尽可能保留数据之间的时序信息。然而在CNN 对比模型中是将一维原始信号重塑成了二维矩阵作为模型CNN 的输入且使用二维卷积核提取信号中的特征。对比发现,一维数据会比二维数据包含更多的时序信息,同时一维卷积会比二维卷积更加有效的挖掘信号中隐藏的时序特征信息,所以MCCN 和WDCNN 能够更加高效准确的识别刀具在加工过程当中的状态。

从表4 中MCCN 和WDCNN 模型在测试集上的预测精度可以看出,经20 次迭代后MCCN 模型的准确率稳定在99.5%以上,且MCCN 模型的损失值在迭代过程中收敛的速度更快,并且损失值稳定于0.01 以下,这表明MCCN 模型的泛化能力和鲁棒性更强。这可能是由于MCCN 中胶囊网络层的设计不仅加深了网络深度提高了模型的学习能力,同时胶囊网络层中特征在主胶囊层到数字胶囊层之间的传播有效地过滤出关键的特征信息,减少了关键特征信息的丢失,使模型在多种工况下监测的结果更加准确。因此本文提出的MCCN 模型在实际工业加工中能够有效的监测不同切削参数下刀具是否发生破损,具有一定的优越性和先进性。

4 结论

本文建立了基于多尺度卷积胶囊网络的刀具破损监测模型,采用加速度传感器信号反映刀具的状态,并且通过多尺度卷积神经网络建立加工信号与刀具状态之间的联系。通过多尺度卷积层初步提取相关特征,胶囊网络层进一步提取特征中的隐藏信息,最终准确的识别出刀具在不同切削参数下是否发生破损。实验结果表明MCCN 模型在识别精度上均优于CNN 模型和WDCNN 模型,并且在多种切削参数下模型的泛化能力更强,在实际机械加工应用中具有一定的优越性和先进性。

猜你喜欢
刀具胶囊卷积
Shugan Jieyu capsule (舒肝解郁胶囊) improve sleep and emotional disorder in coronavirus disease 2019 convalescence patients: a randomized,double-blind,placebo-controlled trial
基于3D-Winograd的快速卷积算法设计及FPGA实现
Shumian capsule(舒眠胶囊)improves symptoms of sleep mood disorder in convalescent patients of Corona Virus Disease 2019
无织构刀具与织构刀具铣削性能对比研究
从滤波器理解卷积
电子制作(2019年11期)2019-07-04 00:34:38
基于傅里叶域卷积表示的目标跟踪算法
切削刀具刃口形貌对刀具使用寿命的影响
多功能刀具
发明与创新(2016年5期)2016-08-21 13:42:48
山高刀具推陈出新迎马年——山高刀具2013秋季新闻发布会
一种基于卷积神经网络的性别识别方法
电视技术(2014年19期)2014-03-11 15:38:20