结合核岭回归与多目标粒子群优化算法的激光焊接工艺参数预测

2021-12-09 12:58邓新国陈家瑞徐海威
计算机集成制造系统 2021年11期
关键词:信任度适应度粒子

邓新国,王 磊,陈家瑞+,徐海威

(1.福州大学 计算机与大数据学院,福建 福州 350108;2.福建星云电子股份有限公司,福建 福州 350000)

0 引言

激光焊接作为高效精密的焊接方法,具有速度快、深度大、变形小、稳定性高等优点[1],常用于动力电池组装。为使整个电池组获得良好的性能,各电池包需在焊接上超过给定的焊接目标。然而,由于工艺参数的强耦合性及其对焊接指标的多模式影响[2],寻找满足要求的工艺参数比较困难。伍强等[3]研究发现各工艺参数对拉力的影响均存在波峰,即存在一个极大值点使拉力达到最大;王腾等[4]利用支持向量机对熔宽进行预测,将误差控制在10%以内,从而使误差分布区域较BP(back propagation)神经网络更窄,预测效果更好;杨宗辉等[5]利用偏最小二乘回归对焊缝形状进行预测,结果表明,该模型有效解决了自变量间的多重共线性问题,比传统的多元线性回归模型具有更高的精度;鄢威等[6]采用多目标优化模型,在电弧焊上通过优化工艺参数降低能耗、提高利用率;洪延武等[7]在激光—电弧复合焊接中,将多种群遗传算法与神经网络结合优化初始权重和阈值,提高了BP神经网络模型的预测精度。

然而,仅研究从工艺参数到焊接指标的映射关系并不能保证选取的工艺参数最优且稳定。焊接目标实为焊接下限,将标签数据重组为焊接下限并生成模型,将模型预测的最优工艺参数投入实际生产活动,会使生产结果不低于此下限的比例更大。本文结合多种思想共同寻找最优工艺参数。

1 实验环境及数据处理

1.1 实验环境

实验中的焊接指标包括拉力、熔深和熔宽3个标签,工艺参数包括功率、速率和离焦量3个特征。

焊接平台采用IPG 6000W激光器,焊接头为准直焊接头,光纤传输芯径为150 μm,聚焦镜焦距为250 mm,使用IPG水冷机、99.999%氮气进行冷却,通过叠焊的方式将上层材料为0.2 mm的铜镀镍、下层材料为3 mm的铜镀镍进行焊接。

在检测平台上,使用5 000 N拉力计进行拉力测试,使用金相切割机、金相镶嵌机、金相研磨机、500万像素金相显微镜对熔深与熔宽进行测量。

1.2 数据处理

历史数据中存在因设备异常、上下板间压力不够造成虚焊、记录错误等而产生的异常数据,本文用箱型公式隔离异常值,以避免对结果带来的影响。箱型公式中的四分位距表示为IQR,

IQR=Q3-Q1。

(1)

式中Q1和Q3分别为相同工艺参数下某一标签的数据由小到大排序后的第25%和第75%的数值,即下四分位数和上四分位数。数值在区间[Q1-1.5×IQR,Q3+1.5×IQR]内为正常值,在区间外则为异常值,含有异常值的样本只删除该异常值而不删除样本。

实际中,焊接指标各个标签的观测值应高于对应的目标,以发挥电池组的整体性能。因此,将样本中相同工艺参数各标签的最低值组合成对应的焊接下限,作为拟合的标签向量,即:

P=(x1,x2,…,xn);

(2)

式中:P为特征值向量;x为特征值;n为特征数量;L表示用于拟合的标签向量,即焊接下限;d为标签分量;Y为观测值向量。

最后,通过最大最小归一化将不同量纲的数据统一映射至区间[0,1],以便拟合。

2 构建核岭回归模型

核岭回归是一种重要的回归算法,具有可解释性、强泛化性等优点,被广泛应用于模式识别、数据挖掘等领域[8]。

2.1 核函数的选取

在添加保护气体的激光焊接中,存在热导焊和深熔焊两种焊接模式,两者在焊缝形成上虽然区别明显,但是界限极其模糊,很难将两种模式有效分离。因为热导焊和深熔焊并非随机出现,而是在工艺参数的某个区域内表现为深熔焊,区域外表现为热导焊,所以可以采用高斯核函数度量样本间的相似度,以降低不同模式的相互干扰。高斯核函数公式如下:

Xi=(xi1,xi2,…,xin);

Xj=(xj1,xj2,…,xjn)。

(3)

式中:X为特征向量;i,j为样本序号;x为特征值;n为特征数量;K为高斯核函数;σ用于控制样本间的相似程度。

利用样本间的欧氏距离进行相似度分析,距离越远,相似度越低,解释作用越弱;反之,相似度越高,解释作用越强。特征数量由原始数量转变为样本数量时,能够使低维非线性可分转化为高维线性可分[9]。然而,模式的突变会使该区域的回归曲线偏离正常点,这是机器与材料的原因,难以通过回归模型本身解决,后续对解的分析中将从数据本身的角度降低该问题对预测效果的影响。

2.2 模型拟合

训练集与测试集以8∶2的比例随机划分数据集,模型经训练集训练后,将在测试集上调整其超参数。核岭回归中的超参数γ(即0.5σ-2)与α(正则化项系数)至关重要,为寻找最优超参数,采用均方误差(Mean Square Error, MSE)和平均绝对误差(Mean Absolute Error, MAE)两个评价指标。首先固定α的值;在找到γ的最优值后,将其作为定值,再寻找α的最优值;在找到α的最优值后,将其作为定值,反过来再找γ的最优值。如此反复,直至超参数的值几乎不变。图1所示为α=0.082时各指标随γ变化的曲线。

当γ=5.21时,MSE达到最低值0.045;当γ=5.09时,MAE达到最低值0.182;γ取二者的平均值5.15,然后调整参数α。图2所示为γ=5.15时各指标随α变化的曲线。

当α=0.075时,MSE达到最低值0.045;当α=0.085时,MAE达到最低值0.181;α取二者的平均值0.08。最终γ和α两个超参数的取值分别为5.15和0.08。

3 多目标粒子群优化模型的建立

针对经典算法中,粒子在解空间搜索时容易陷入局部最优,出现早熟收敛的问题,提出了许多改进措施[10-14],如增加变异操作、改进速度更新的权重、网格优化等。本文实验根据陈民铀等[15]的思想改进粒子速度公式并添加变异操作,以在运行后期提高全局搜索能力,跳出局部最优解。

3.1 粒子速度的改进方案

粒子速度的惯性权重用于控制先前速度对当前速度的冲击,大的惯性权重有利于全局搜索,小的惯性权重有利于局部搜索。动态变化的惯性权重有利于平衡全局和局部搜索性能,随时间线性递增的加速因子有利于后期提升全局搜索能力。改进后的速度公式如下:

vi(t+1)=wvi(t)+aCi;

Ci=r1(pb-Pi(t))+r2(pg-Pi(t));

w=w0+r3(w1-w0);

(4)

式中:i为粒子序号;v为粒子速度;t为当前迭代次数;w为惯性权重;a为加速因子;C为粒子对个体与整体的认知程度;r1,r2,r3为[0,1]范围内变化的随机数;P为粒子的位置;pb为粒子个体的最优位置;pg为粒子个体引导者的位置;w0,w1为[0,1]内的常数,且w1>w0;a0为初始加速因子;Nt为迭代次数。

当粒子速度足够低时(各个分量上的速度均低于最低速度),随机选择粒子速度的某一分量进行变异。变异操作公式如式(5)所示,粒子位置的更新公式如式(6)所示。

(5)

Pi(t+1)=Pi(t)+vi(t+1)。

(6)

式中:r4为[0,1]范围内变化的随机数;β为变异常数;d为粒子速度的某一分量。

3.2 设定适应度函数

适应度函数因所设定焊接目标的不同而不同,适应度越小,粒子越接近焊接目标。通用的适应度函数公式为

Fi=|KRR(Pi)-T|。

(7)

式中:i为粒子序号;KRR为核岭回归模型;P为粒子的位置;T为归一化后的焊接目标;KRR(Pi)为粒子经过模型计算后的模型值;F为粒子的适应度。

3.3 维护解集及引导者的选取

在维护解集中,当非劣解的数量超过解集容量时,需要删除多余的非劣解。在选取引导者的过程中,应使当前最优解集密度最稀疏的非劣解有较高概率被选为个体引导者,从而引导更多粒子尽可能地探索未知区域。

对当前最优解集进行网格划分,以计算非劣解的拥挤度。在维护解集中,非劣解的拥挤度越高,被删除的概率越高;而在选取引导者时,非劣解的拥挤度越低,被选取的概率越高。与非劣解相关的计算公式如下:

(8)

(9)

(10)

式中:c为非劣解的拥挤度;pd为非劣解被删除的概率;ps为非劣解被选中的概率;i,j为非劣解序号;num为与该非劣解处于同一网格中的非劣解的数量;m为当前非劣解的数量。

3.4 多目标粒子群优化算法测试

以拉力为500 N、熔深为600 μm、熔宽为700 μm的焊接目标为例,观察多目标粒子群在位置空间和适应度空间的变化。数据已进行归一化处理。图3~图5所示分别为粒子群初始状态、第20次进化和第40次进化的空间效果图,其中a图中的黑色点表示Pareto最优解集,灰色点表示粒子群体;b图中的黑色点表示Pareto前沿面,灰色点表示粒子群体的适应度。

图3中,初始状态下的粒子群布满整个解空间,当前Pareto前沿面较零散。图4a中,Pareto最优解集的轮廓已经形成,粒子群聚集在所有黑色点附近,图4b中的Pareto前沿面更加丰富。相比图4a和图5a,黑色点形成的区域更加细化,说明Pareto最优解集的质量得到提高。从第20次迭代与第40次迭代可以看出,粒子主要集中在黑色点数量相对较少的区域(黑色点被大量灰色点覆盖,不易看出),而且部分粒子因变异而处于离黑色点较远处,说明运行后期仍然能够保持其搜索能力。

4 分析最优解集

因为核岭回归模型存在拟合误差,而且在多目标粒子群中存在因某个指标过于接近自身目标导致其他指标远离对应目标的现象,所以并非所有解都能应用于实际。

在激光焊接中,焊接指标对工艺参数的微弱变化并不敏感,即存在一个区域,区域内的工艺参数具有相似的焊接特性。因此,借助K近邻算法的思想,可用非劣解附近的样本分析非劣解。这里K的取值要求不严格,仅起度量的作用,然而过大与过小都不合适,通常取K=6。

如何分析和评价非劣解是关键问题。首先,邻近样本的焊接下限低于目标值为负影响,高于目标值则为正影响;其次,负影响和正影响的大小可用差值表示,由于非劣解与各邻近样本的距离可能不同,负影响和正影响的程度可用差值与距离的比值表示;最后,将各邻近样本的影响程度求和,作为非劣解在某一指标的信任度,其值越大,质量越高,反之则越低。式(11)为粒子在某一指标下的信任度,式(12)为粒子的总体信任度,其中考虑了负信任度指标数,指标数量越多,越不可靠。

(11)

(12)

式中:Cc为非劣解的信任度向量;CTc为非劣解的总信任度;d为某一指标;i为非劣解的序号;K为邻近样本总数;k为邻近样本序号;L为邻近样本的焊接下限;T为目标值;D为邻近样本与非劣解的距离;n为指标数量;w为负信任度指标的个数。

5 激光焊接工艺参数预测算法

算法1激光焊接工艺参数预测算法。

输入:数据集、焊接目标。

输出:按信任度从大到小排序的工艺参数。

步骤1通过式(1)、式(2)及归一化完成数据预处理,获得归一化参数,并将焊接目标归一化。

步骤2划分数据集,用训练集训练核岭回归模型,在测试集上选取最优超参数并完成拟合。

步骤3将步骤2的模型与焊接目标按照式(7)构建适应度函数。

步骤4对多目标粒子群参数进行初始化。

步骤5根据步骤3中的适应度函数计算粒子当前的适应度。

步骤6比较粒子当前适应度与自身过往最优适应度,以更新粒子个体最优适应度,进而根据粒子个体最优适应度评价粒子与粒子的Pareto支配关系,将当前最优粒子保存到外部存档,最后评价外部存档中粒子的Pareto支配关系并更新外部存档。

步骤7判断外部存档中的粒子数量是否超过解集容量,是则用式(9)优化解集。

步骤8判断是否达到迭代次数,是则转步骤11。

步骤9对外部存档进行网格划分,用式(10)为每个粒子选取个体引导者。

步骤10用式(4)更新粒子速度,检查粒子的速度分量是否均低于最低速度,是则用式(5)对其进行变异,然后用式(6)更新粒子的位置,转步骤6。

步骤11结合焊接目标,用式(11)和式(12)计算外部存档中各粒子的信任度,按信任度从大到小对各粒子排序,用步骤1中的归一化参数对排序后的粒子进行反归一化,得到对应的工艺参数和模型值。

6 测试结果

仍然以拉力为500 N、熔深为600 μm、熔宽为700 μm的焊接目标为例,信任度最高、信任度最低以及一些位于两者之间的工艺参数及其对应的模型值如表1所示。

表1 焊接目标对应的工艺参数

由表1可见:①从多目标粒子群的角度看,对比模型值与目标值的差距,始终不存在某一数据均优于其他数据,说明这些工艺参数均为非劣解;②信任度表示工艺参数在实际焊接中,其焊接结果在目标值之上的可能性,信任度越高,允许波动的空间越大;③多目标的求解方式,使得当某一指标趋近自身目标时,邻近样本对该指标不会有太大影响,信任度主要从其他标签获得;④相比于累加式的总信任度,模型设置的计算方式可避免因某个指标信任度过大而排列在前;⑤回归模型并非完全正确地反映数据的真实变化,相比模型值,邻近样本的数据分布更具说服力,这也是在评价标准,即式(11)中选择邻近样本而不选择模型值的原因。

建立信任度,一是解决回归曲线可能存在局部偏离实际数据分布的问题,二是对最优解集在实际应用方面做进一步筛选。

选择表1的第一条工艺参数,通过焊接和检测平台进行测试,结果如表2所示。

表2 预测的工艺参数在实际应用中的焊接结果

由表2可见:①因为模型值表示焊接下限且回归曲线存在误差,所以焊接结果通常高于模型值,但也存在低于模型值的情况;②在焊接结果与目标值的比较中,拉力与熔深均达到目标,熔宽的表现则略有逊色,这是因为熔宽的目标设置过大,以致超过回归曲线的最高点,不仅体现为熔宽的模型值未达到目标,还体现在最高信任度的值偏低;③对于该焊接目标,筛选出的最优解在熔宽方面虽有缺陷,但其焊接效果已能满足大部分需求,尤其在拉力方面,这在实际需求中非常苛刻。

7 结束语

本文首先根据标签数据构造焊接下限,由于标签数据的实际分布均位于焊接下限之上,可忽略焊接模式对工艺参数的影响,进而采用核岭回归拟合出工艺参数到焊接下限的映射关系;然后结合改进的多目标粒子群优化算法,根据设定的焊接目标与得到的回归模型进行求解操作,得到一系列非劣解;最后通过邻近样本数据为每个解提供信任度分析,进一步筛选出更优质、更可靠的工艺参数。

猜你喜欢
信任度适应度粒子
改进的自适应复制、交叉和突变遗传算法
基于粒子群优化的桥式起重机模糊PID控制
一种基于改进适应度的多机器人协作策略
全球民调:中国民众对政府信任度最高
基于粒子群优化极点配置的空燃比输出反馈控制
基于空调导风板成型工艺的Kriging模型适应度研究
汽车养护品行业运行环境分析及提高客户信任度的途径
2014,如何获得信任
基于Matlab的α粒子的散射实验模拟
基于两粒子纠缠态隐形传送四粒子GHZ态