黄 华,姚嘉靖,薛文虎,吕延军
(1.兰州理工大学 机电工程学院,甘肃 兰州 730050;2.西安理工大学 机械与精密仪器工程学院,陕西 西安 710048)
刀具磨损在线监测作为数控机床故障监测的重要任务之一,对产品加工质量、刀具利用率、加工时间、机床使用寿命都具有极其重要的作用。研究表明,准确可靠的刀具状态监测系统可避免由于各种因素造成的75%的停机时间,提高10%~60%的生产率,节省10%~40%的生产成本[1]。因此,建立一套有效的刀具状态监测系统可以在刀具达到磨损标准之前完成换刀,从而提高加工效率[2]。
刀具磨损监测常用方法有直接法和间接法[3]两种。间接法不需要停机离线测量,可实现刀具在线监测,应用最为广泛。间接法一般通过采集刀具运行信号,利用傅里叶变换、小波包分解[4]、希尔伯特黄变换[5]等方法提取信号中与刀具磨损相关的特征,并对其进行选择,筛选后的特征输入随机森林[6]、支持向量机[7-8]等机器学习模型进行模型训练与测试。目前,已有许多针对机器学习建模的研究。如秦国华等[9]提出了基于神经网络和遗传算法的刀具磨损监测与控制方法,可有效监测刀具磨损;肖鹏飞等[10]建立了一种基于自适应动态无偏最小二乘支持向量机的刀具磨损预测模型,具有较高的建模效率和预测精度。近年来,深度学习网络由于比机器学习网络拥有更深的网络层次,模型训练过程中可自适应提取与刀具磨损相关的特征,应用日益广泛[11-14]。如何彦等[15]提出了一种基于长短时记忆卷积神经网络的刀具磨损在线监测模型,对采集的数据进行序列和多维度特征提取,利用线性回归实现了特征到刀具磨损值的映射;戴稳等[16]研究了基于深度学习的铣刀磨损状态预测,建立了基于堆叠稀疏自动编码网络与卷积神经网络两种预测模型,可有效分类刀具磨损状态。
尽管上述基于机器学习与深度学习的建模方法都能够准确识别刀具磨损状态,但只能用于恒定加工参数下的刀具磨损监控。当加工参数发生变化时,模型识别精度难以保证,泛化性较差。鉴于此,本文提出一种基于多域特征联合分布适配的刀具状态识别模型,可通过特征适配算法来缩小不同加工参数下的特征差异[17],从而实现不同参数下刀具磨损状态的准确识别。首先对不同加工参数的切削信号在时域、频域、时频域分别进行特征提取,再用JDA(joint distribution adaptation)算法[18]对不同参数下的多域特征进行适配。最后利用K-最近邻(K-Nearest Neighbor, KNN)分类算法训练速度快、分类精度高、模型简单的优点,将其作为刀具磨损状态识别的分类器,对无标签刀具磨损数据进行状态识别。
特征提取是对传感器采集的大量原始信号数据进行简单化处理,同时包含数据原有信息的过程。为了深度挖掘原始信号数据包含的刀具磨损信息,本文分别从时域、频域、时频域对特征进行提取。
时域分析在原始信号数据中直接提取各类统计特征,具体特征包括均值、歪度、峭度、均方值、方根幅值、均方根值、绝对均值、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标。传感器原始信号数据可表示为x(i),i=1,2,3…N,N为采样点数,最终提取时域统计特征14个。
频域分析通过傅里叶变换将原始信号数据由时域变换到频域,再进行图谱分析和特征参数的提取。频域分析的目的在于寻找随着刀具磨损程度的增加,频谱的中心频率、峭度频率等特征参数发生变化的规律。具体频域特征表达式如下:
其中:x(k)表示x(i)的第k个频谱;f(k)表示x(i)的第k个频谱的频率值。经过频域分析最终可获得频域统计特征6个。
时频域分析利用小波包分解将原始信号数据分解成多个子带,再提取各个子带的小波包平均能量作为特征值。通过时频域分析可以弥补频域分析由于傅里叶变换窗口固定,以及一些非平稳的、短时的特征无法直接体现的不足。本文使用‘db4’小波基函数对加工过程中采集的原始信号数据进行3层小波包分解,获得8个子带信号,将子带中小波包系数的平均能量作为特征参数,最终可得8个时频域特征。
经过多域特征分析,可提取常用于刀具磨损状态监测的时域特征14个、频域特征6个、时频域特征8个,总共28个特征。提取的多域特征用于后续特征适配以及模型的训练与测试。
联合分布适配算法作为迁移学习的一种,其基本原理是通过对源域相关知识进行迁移来辅助目标域下的建模任务[19]。本文将带标签加工参数下的刀具磨损数据作为源域,不带标签的另一组加工参数下的磨损数据作为目标域,通过迁移学习中的特征适配算法JDA对两组加工参数下的多域特征进行适配,来消除特征分布差异,达到迁移目的。一般的迁移学习特征适配算法如迁移成分分析(Transfer Component Analysis,TCA)通过对边缘分布进行适配,不断缩小两域之间的距离。但该算法只在边缘分布存在差异的假设下进行适配,适配能力有限。JDA算法分别将源域特征和目标域特征的边缘分布与条件分布同时适配,从而达到特征适配的最好效果。本文利用JDA算法来解决不同加工参数对应的源域特征与目标域特征的分布不同问题。在特征适配后,源域特征用于训练分类模型,目标域特征对模型进行分类测试。
源域带标签的数据可表示为Ds={xs,ys},目标域中不带标签的数据可表示为Dt={xt,yt},其中yt未知。JDA算法假设源域和目标域的特征空间和标签空间一致,但源域(P(xs))和目标域(P(xt))边缘概率分布不同,且源域(P(ys|xs))和目标域(P(yt|xt))条件概率分布也不同。算法通过在降维过程中同时调整边缘概率和条件概率分布,寻找一个变换矩阵A,使得经过变换后的源域(P(ATxs))和目标域(P(ATxt))边缘概率分布接近,同时源域(P(ys|ATxs))和目标域(P(yt|ATxt))的条件概率分布也接近。具体过程如下:
(1)属性保留
假设X=[x1,…xn]∈Rm×n,其中n=ns+st,m为向量维度,H为中心化矩阵,则协方差矩阵为XHXT。 令A为转换矩阵,此时问题转化为:
maxATA=Itr(ATXHXTA)。
(1)
取XHXT中最大的k个特征值对应的特征向量,将其组成正交矩阵A,A∈Rm×k。 设映射后的数据为Z,则Z=ATX,Z∈Rk×n。
(2)边缘分布适配
边缘分布适配使用最大均值差异(Maximum Mean Difference,MMD)来最小化源域数据和目标域数据的分布差异,具体表达为:
(2)
求解式(2),可使映射后的目标域数据与源域数据之间的边缘概率分布差异减小。
(3)条件分布适配
计算条件概率分布需已知目标域数据标签,但在刀具磨损状态识别任务中目标域数据没有标签。JDA算法可利用源域带标签数据训练一个分类器,用该分类器给目标域数据打上伪标签,再利用伪标签计算目标域数据的条件概率分布。
取标签空间{1,2,…,C}的任一类别c,在类别c上计算源域条件概率分布(P(xs|ys=c))和目标域条件概率分布(P(xt|yt=c))之间的距离。所有类别上源域和目标域数据的条件概率分布的距离可表达为:
(3)
JDA算法的最终目标是使方差最大化,同时最小化边缘概率分布和条件概率分布,结合式(1)~式(3),可得最终目标函数:
(4)
求解式(4)可得到最终的变换矩阵A,从而可缩小源域特征集与目标域特征集之间的差异,解决不同加工参数下刀具磨损的特征差异问题。
多域特征联合分布适配的刀具磨损识别原理为:首先利用传感器采集加工过程中的主轴交流电流信号、主轴声发射信号、工作台声发射信号、主轴振动信号、工作台振动信号,将其作为原始信号数据;在此基础上,将带标签的加工参数下的切削信号数据作为源域,不带标签的另一组加工参数下的切削信号数据作为目标域,分别进行多域特征提取,进而获得源域特征集Hs与目标域特征集Ht;进一步利用JDA算法对所得多域特征进行适配,从而获得分布类似的特征表达Zs和Zt;最后,将适配后的特征分别用于KNN状态识别模型的训练与测试。多域特征联合分布适配的刀具磨损识别流程如下:
(1)训练集与测试集的构建 将不同加工参数下的传感器数据进行多域特征提取作为特征适配的源域特征Hs与目标域特征Ht。
(2)多域特征联合分布适配 利用JDA算法对源域与目标域特征进行适配,通过算法映射,使Hs与Ht经过迭代后分布差异不断减小,最终获得最优的特征表达Zs和Zt。
(3)刀具磨损状态识别 适配后的特征Zs对KNN模型进行训练,Zt对模型进行测试,即可完成刀具磨损状态识别任务。具体流程如图1所示。
本章选用NASA铣削数据集开展实验验证[20]。选择切削过程中主轴交流电流、主轴和工作台的振动以及主轴和工作台声发射共5种传感器信号,实验在松浦加工中心MC-510V上进行传感器信号的采集,传感器安装位置及刀具磨损监控过程示意图如图2所示。电流传感器采集主轴电机交流电流信号,声发射传感器和振动传感器分别安装在加工中心的工作台和主轴上,最大采样频率为250 Hz,每次走刀采集9 000个数据点。刀具选择带有6个刀片的立式端面铣刀,刀片型号为KC710,工件材料为铸铁,尺寸为483 mm×178 mm×51 mm。
NASA铣削数据集中有16个刀具磨损数据,包含8组加工参数,选择其中的3组加工参数分别作为特征适配的源域与目标域,具体加工参数如表1所示。其中主轴转速均为826 r/min保持不变,工件材料均为铸铁,切削深度为0.75 mm和1.5 mm,进给量为0.25 mm/rev和0.5 mm/rev。
表1 3种加工参数
由于实验过程中刀具磨损的测量在离线非连续状态下进行,存在进退刀现象,导致加工过程中采集到的传感器信号包含一部分干扰信号,会对最终的状态识别精度造成一定影响。因此,对原始信号进行切分处理,来消除信号采集过程中进退刀造成的影响。以参数1的第一次走刀样本为例,对5种传感器信号的处理结果如图3所示。经过上述处理过程,可获得完整的刀具切削信号,用于后续特征提取和刀具磨损状态识别模型的建立。
根据每次走刀后,刀具后刀面的磨损值大小,作出了3组加工参数下的刀具磨损曲线,如图4所示。表明各加工参数下的刀具磨损曲线间存在差异,但磨损趋势基本一致。磨损值在0.15 mm以下时,由于刀具表面粗糙度大、涂料不均等原因,在开始切削的短时间内磨损较快;磨损值在0.15~0.40 mm时,刀具处于稳定磨损阶段,磨损趋势比较平缓;0.4 mm以后刀具出现剧烈磨损现象,基本达到使用寿命。综合3组加工参数的刀具磨损情况,可将磨损过程划分成3个磨损阶段。初始磨损阶段(标签1):0 mm~0.15 mm;中期磨损阶段(标签2):0.15 mm~0.4 mm;后期磨损阶段(标签3):0.4 mm以上。磨损阶段划分依据如表2所示。
表2 磨损阶段划分
三组加工参数下,每次走刀过程中各传感器都对应9 000个采样点,以1 024个顺序采样点作为刀具磨损状态下该次走刀的一个样本。一次走刀完成后,原始信号经切分处理,可得6个样本。选用其中的14次走刀数据,最终可得到样本点数为1 024的84个样本集。
划分完成的样本分别在时域、频域、时频域进行多域特征提取,得到28个特征,5种传感器信号共可得到140个特征。利用基于t分布的随机近邻嵌入法(t-SNE)将提取的特征进行降维可视化[21],结果如图5所示。由于刀具磨损阶段划分是在刀具磨损的全寿命周期下进行,3个磨损阶段存在过渡关系,多域特征在降维可视化后各磨损阶段都能聚类,呈连续分布状态,且具有一定的相似性,表明将迁移学习算法JDA用于本文刀具磨损状态识别任务,符合迁移学习的使用前提,可避免负迁移现象的发生。
如图6所示为参数1与参数2的主轴交流电流信号在3个磨损阶段下的时域波形、频谱图和子带能量占比图。以参数1为例进行说明,同种加工参数下,交流电流时域波形最大幅值在3个磨损阶段分别为3.94、5.00和5.61,频率最大幅值分别为2.12、2.65和3.64,两者随着刀具磨损程度加剧都有增加趋势。小波包分解后子带能量主要集中在前两个子带中,其中第1个子带能量占比在3个磨损阶段分别为80.10%、74.07%和67.27%,随着磨损程度加剧子带能量占比依次减少;相反,第2个子带能量占比在3个磨损阶段分别为17.94%、24.35%和31.04%,随着磨损程度加剧子带能量占比依次增加。以上分析表明,切削信号在时域、频域、时频域都与刀具磨损程度具有一定的正相关或负相关关系,有利于后续特征到刀具磨损映射模型的建立。
在不同加工参数下的同一磨损阶段,信号波形、频谱图的最大幅值和子带能量占比在3个磨损阶段存在较大差异。以初始磨损阶段为例,两种加工参数下的时域波形最大幅值分别为3.5和1.9,频率最大幅值分别为2.2和1.7,第1个子带能量占比分别为80.10%和81.52%,第2个子带能量占比分别为17.94%和17.10%。表明不同加工参数下的同一磨损阶段,刀具磨损机理存在差异,所获得的切削信号数据分布不同,导致信号特征存在差异。这种信号特征差异给不同加工参数下刀具磨损状态的准确识别带来了较大挑战。
为验证本文方法的有效性,通过7种建模方法进行验证。
模型1不采用任何特征适配算法,源域数据训练BP神经网络模型,目标域数据对其进行测试;
模型2不采用任何特征适配算法,源域数据训练SVM分类模型,目标域数据对其进行测试;
模型3不采用任何特征适配算法,源域数据训练KNN分类模型,目标域数据对其进行测试;
模型4利用JDA算法对特征进行适配,适配后的源域特征数据训练BP神经网络分类模型,目标域特征数据对其进行测试;
模型5利用JDA算法对特征进行适配,适配后的源域特征数据训练SVM分类模型,目标域特征数据对其进行测试;
模型6利用TCA算法对特征进行适配,适配后的源域特征数据训练KNN模型,目标域特征数据对其进行测试;
模型7利用JDA算法对特征进行适配,适配后的源域特征数据训练KNN分类模型,目标域特征数据对其进行测试。
如图7所示为经JDA算法特征适配前后,3个磨损阶段的特征概率密度图,其中参数1为训练集特征,参数2为测试集特征。特征适配前,两组加工参数下不同磨损阶段的多域特征概率密度存在明显差异,尤其是在初期磨损阶段差异最大,中期次之,后期相对较小。这表明不同加工参数下刀具在相同的磨损阶段磨损规律存在差异,因此用一组参数下的磨损数据建立的刀具磨损识别模型来识别另一组加工参数下的数据可能会引起较大的识别误差;经JDA算法适配后,训练集特征与测试集特征概率密度图在3个磨损阶段的重合性都较好。在初始磨损阶段,JDA算法在一定程度上缩小了两种数据特征间的分布差异,但没有中期、后期磨损阶段适配效果明显,其原因在于刀具在刃磨初期表面粗糙度大、涂料不均,刀具个体存在差异,导致不同加工参数下采集的传感器数据存在不确定性。而在中期、后期磨损中,刀具进入稳定磨损阶段,两种特征概率密度曲线基本重合,JDA算法适配效果达到最优。以上分析表明,两种加工参数下的数据特征经JDA算法适配后分布情况几乎一致,从而验证了所提方法同时考虑边缘分布适配与条件分布适配可有效缩小不同加工参数下磨损特征的差异。
分别将3组加工参数下的特征数据集作为训练集与测试集,进行交叉组合验证,可得6种验证结果。分类准确率通过下式计算:
(5)
式中:T1表示正确分类标签1的样本数量;T2表示正确分类标签2的样本数量;T3表示正确分类标签3的样本数量;N为样本总数量。
通过模型的分类调试,KNN分类器K的取值分别为1、2、3时,分类效果最好。为了对比不同模型的识别结果,同种组合方式下的KNN取相同的K值。7种模型最终的刀具状态识别结果及所用KNN分类器K的取值如表3所示,表中第2列“1-2”表示以参数1为训练集,参数2为测试集,其他同理。本文所用JDA算法结合KNN分类器的建模方法在6种组合方式下的建模过程中的迭代精度如图8所示,6种组合方式下的适配模型在训练过程中均选择10次迭代。可以看出,经过7次迭代,模型全部趋于稳定,即可得到最终用于目标域下的刀具磨损状态识别适配分类器。
表3 磨损状态识别结果 %
从表3可以看出,模型1、模型2、模型3中用一组加工参数下的样本数据训练BP神经网络、SVM、KNN分类模型来分类另一组加工参数下的样本数据,平均识别精度分别只有46.63%、48.81%、53.57%,表明单一加工参数数据训练的识别模型来分类不同加工参数下的样本数据时,无论选择何种分类器,所建模型泛化性能极差,远不能满足刀具识别模型精度要求;模型4、模型5与本文所建模型利用JDA算法对两组参数下的多域特征进行适配,减少了数据特征边缘分布与条件分布差异,再对BP神经网络、SVM、KNN分类器进行训练与测试,平均识别精度分别提高到了70.04%、71.03%,84.52%,且本文建模方法最高识别精度可达89.29%,远高于其他6种建模方法,进一步验证了本文所用JDA算法结合KNN分类器建模方法的可行性与有效性;模型6利用TCA算法结合KNN分类器的建模方法,可减少数据特征边缘分布差异,平均识别精度达到了71.83%,但由于只对特征进行了边缘分布适配,相比于本文建模方法,识别精度较差。通过以上7种建模方法的对比表明,利用JDA算法结合KNN分类器的建模方法识别效果最优,最高识别精度可达89.29%,可有效解决不同加工参数下刀具磨损状态识别的数据特征分布不同问题,完成对不同加工参数下的刀具磨损状态识别。
本文所用方法在6种组合方式下的识别结果如图9所示,其中纵坐标“1”“2”“3”分别表示3个磨损类别标签,“°”表示刀具实际的磨损状态,“+”表示模型识别结果。可以看出,6种组合方式下模型的识别结果在初始磨损与中期磨损、中期磨损与后期磨损的过渡处重合度较低,但在3个磨损阶段的内部样本识别结果重合度较高。表明所建模型对刀具三个磨损阶段基本都能作出准确识别,而在3个磨损阶段的样本过渡处识别精度较低。这是由于3个磨损阶段的样本数据是在刀具连续的寿命周期下进行划分,3个磨损状态的数据特征在过渡处有一定的相似性,导致模型在3个磨损阶段过渡处识别精度较差。总体来看,所建模型对6种不同组合的适配情况都能作出准确识别,可以完成不同加工参数下的刀具磨损状态识别任务。
本文提出一种基于多域特征联合分布适配的刀具磨损状态识别方法,可有效解决不同加工参数下的刀具磨损状态识别建模问题。通过铣刀磨损状态识别实验验证了所提方法的可行性和有效性,为不同参数下的刀具状态识别建模提供了一种新思路。主要结论如下:
(1)使用多个传感器采集加工过程中的多处切削信号,并利用时域、频域、时频域相关特征提取方法提取信号中与刀具磨损敏感的特征。通过多传感器多域特征的融合组成多维数据特征集,可获得大量与刀具磨损相关的信息,用于模型训练过程中特征量到磨损阶段的映射。
(2)首次将迁移学习中的JDA算法结合KNN分类器,引入刀具磨损状态识别领域,用于解决不同加工参数下的刀具磨损状态识别问题。通过JDA算法对多传感器多域特征进行联合分布适配,可有效缩小不同加工参数下样本特征间的数据分布差异,最后利用KNN分类器完成不同加工参数下刀具磨损状态的识别。
(3)相比于未经特征适配的刀具状态识别结果,本文所用建模方法对不同加工参数下的刀具磨损状态平均识别精度最少可提升30%以上;与其他经过特征适配的建模方法相比,本文所用模型平均识别精度最少可提升12%以上,具有明显的识别优势。
本文建模方法只在铣削加工中进行了实验验证,为进一步验证本方法对于识别不同加工参数下刀具磨损状态的优越性,后期可通过在车床上采集数据,增加模型训练的样本量,进行模型识别的相关验证。此外,本文使用了传统的特征提取方法,比较依赖主观经验,后期可通过深度学习网络对传感器数据进行自适应特征提取,进一步提高模型的识别精度。