基于小样本数据驱动的滚齿工艺参数低碳优化决策方法

2022-07-25 12:02李聪波易树平
中国机械工程 2022年13期
关键词:灰狼实验设计神经网络

易 茜 柳 淳 李聪波 易树平 何 爽

1.重庆大学机械传动国家重点实验室,重庆,4000442.重庆大学机械与运载工程学院,重庆,400044

0 引言

齿轮制造业是中国机械基础件中规模最大的行业。滚齿机作为核心滚齿工艺执行母机,运行时的碳排放量很大是齿轮制造中碳排放的主要来源之一。

对加工过程能耗、碳排放的优化常将经验公式建立的能耗、碳排放模型作为目标函数,再利用启发式算法寻求最优解。李聪波等[1]分析了数控滚齿加工过程的能耗特性,基于切削加工经验公式建立加工过程能耗模型,通过帝国竞争算法降低滚齿加工过程的能耗、缩短时间。CHEN等[2]提出一种刀具参数和切削参数优化的集成优化方法,以最小化铣削过程的能耗和时间。倪恒欣等[3]将滚齿加工的切削参数和滚刀参数作为优化变量,将滚齿过程的最小能耗和最优加工质量作为目标进行迭代寻优。

面向复杂的机床加工系统、动态的生产环境时,基于经验公式的计算结果往往不能准确反映加工系统碳排放特性和动态特征。随着智能产线、智能工厂的建设,部分研究开始重视利用数据驱动技术挖掘制造大数据中蕴含的知识和信息。一些学者采用数据驱动方法建立机械加工过程能耗预测模型。吕景祥等[4]利用162组车削数据、62组钻削数据分别构建了车削和钻削的加工能耗模型,并采用3种不同的机器学习方法进行能耗预测。XIAO等[5]利用车间收集的历史数据,通过案例对比研究了数据量大小、特征类型、算法性能等对传统机器学习和深度学习预测精度的影响。CAO等[6]建立了滚齿加工时间、成本和能耗的优化模型,采用蚁狮搜索算法对加工参数进行优化。SUN等[7]以齿轮几何精度为优化目标,采用粒子群算法和神经网络对齿轮加工参数进行优化。刘艺繁等[8]提出一种以改进多目标遗传算法为主体模型的高速干切滚齿工艺参数优化决策,将多目标帕累托解集中的下限值与经验加工的结果进行对比。

与理论模型相比,基于数据驱动的能耗预测模型具有泛化性强、普适性高的特点,可以拟合不同加工条件、不同工艺参数与优化目标之间的关系。基于数据驱动的能耗模型预测精度与样本容量密切相关。大部分制造企业的数字化、信息化基础依然薄弱,技术资源相对缺乏,尚未完全实现制造设备数据的自动采集管理和车间互联互通网络的构建[9]。样本数据驱动方法在数据匮乏领域具有不可忽视的潜力[10]。目前,产业界和学术界对小样本数据尚未有标准定义,通常将其与样本大小联系在一起,即样本量较小的数据集合[11-12 ]。已有的研究证明,相比于大数据,小样本数据容量一般有限,数据维度较小,可作为大数据的子集用于个性化问题分析[13]。面向特定问题时,小样本数据驱动方法只需要少量数据集就能进行训练,降低了人工智能方法对大量数据的依赖[14]。对制造企业小样本数据研究可较快实现对制造过程特定问题的优化和决策。

实验设计是收集高质量小样本数据的有效办法。有学者通过实验设计方法使收集到的数据均匀分布,减小数据驱动模型所需的数据量[15]。SINGH等[16]对电火花切割加工表面质量进行建模和预测,发现实验设计与神经网络相结合的方法比传统响应面法具有更高的预测精度。HAMID等[17]采用中心组合实验设计的人工神经网络(artificial neural network,ANN)预测了羧化纤维素纳米晶须对水基质中铜离子的去除效果,并将其与采用基于响应面法的预测模型进行对比,发现在中心实验设计范围内,结合实验数据的ANN具有较好的预测能力。SURESH等[18]以加工参数为自变量、刀具磨损程度为预测目标,采用中心组合实验设计方法构建了响应面模型和神经网络模型,发现实验设计方法与神经网络相结合的预测模型在减少所需训练数据的同时保持了较高的预测精度。

本文利用Box-Behnken实验设计与反向传播(back propagation,BP)神经网络相结合的方法建立面向滚齿加工工艺过程的碳排放预测模型,通过实验设计有效收集数据,确保小样条件下的数据驱动模型的预测准确性。然后,综合考虑环境影响和生产效率,以加工过程碳排放和加工时间为目标,利用改进多目标灰狼优化算法(multi-objective gray wolf algorithm,MOGWO)进行迭代优化,采用熵权-逼近理想解排序(technique for order preference by similarity to an ideal solution,TOPSIS)综合评价法选择最优方案,降低人为影响。加工实验验证了所提出方法的有效性。

1 滚齿加工工艺参数优化目标模型

基于小样本实验的滚齿加工快速优化决策方法框架见图1。该方法以滚齿加工工艺参数为优化变量,以最低生产碳耗和生产耗时为优化目标。

图1 优化方法整体框架Fig.1 Overall framework of optimization method

1.1 优化变量

影响滚齿加工过程能量消耗和碳排放的因素众多,如机床功率,刀具材料、尺寸,工件材料、形状、尺寸,切削参数,冷却条件等。本研究依托于某商用车齿轮轴热前滚齿工艺自动产线,在其他工艺条件不变的情况下,仅通过对加工参数的优化,实现滚齿加工工艺过程节能减碳的目标。由于企业实际生产必须考虑工期要求,因此将碳排放和加工时长作为目标,将同一齿轮2次滚切加工的主轴转速和进给量作为优化变量,即粗加工滚切转速n1和进给量f1、半精加工滚切转速n2和进给量f2,建立碳排放预测和优化模型。

1.2 优化目标

滚齿加工过程碳排放主要包括原材料碳排放、电能消耗碳排放、辅助物料碳排放(包括切削液和刀具的碳排放)和废物处理碳排放。由于原材料碳排放和废物处理碳排放主要在工艺设计阶段决定,切削液处理碳排放主要与切削液使用方式有关,与工艺参数关系都不大,故本文认为碳排放C主要包括电能消耗碳排放Celec和刀具使用碳排放Ctool,即

C=Celec+Ctool

(1)

Celec是滚齿加工过程主要的碳耗来源,其公式为

Celec=FelecE

(2)

其中,Felec为电能的碳排放因子,参照2019年中国南方区域电网基准排放因子[19],Felec取0.8042 kg CO2/(kW·h);E为滚齿加工过程电能总消耗,可从机床能耗监控采集仪器中获取。

刀具碳排放主要指考虑滚齿加工刀具制备产生的碳排放在每次加工中的分摊值[20],其计算公式为

Ctool=tctmtoolFtool/Ttool

(3)

式中,tct为切削时段时间;mtool为刀具质量;Ftool为刀具碳排放因子,取29.6 kg CO2/kg[21];Ttool为刀具使用寿命。

Ttool的经验公式为[22]

Ttool=k0nk1fk2

(4)

式中,k0、k1、k2为使用寿命系数;n为滚切主轴转速;f为滚刀轴向进给量。

加工时长T主要包括待机时段时间tst、空切时段时间tairc和切削时段时间tct,即有

T=tst+tairc+tct

(5)

1.3 多目标优化模型和约束条件

在保证滚齿机床自身性能和零件质量满足使用要求的前提下选择数控滚齿加工参数,故对主轴转速、进给量、零件表面质量等进行条件约束。数控滚齿工艺参数多目标优化模型为

(6)

式中,nmin、nmax分别为主轴转速的最大值和最小值;fmin、fmax分别为滚刀轴向进给量的最小值和最大值;r为滚刀刀尖半径;Ra为表面粗糙度。

2 基于Box-Behnken实验设计的滚齿加工多目标预测模型

利用工艺感知技术配置的各种信息采集装置,可以实现对制造过程数据的实时感知和获取。但大部分企业在实际生产中很难长期使用各种智能感知设备采集数据,而通过合理的实验设计可以快速得到有效的小样本数据。

2.1 Box-Behnken实验设计

Box-Behnken实验设计是可以评价指标和因素间的非线性关系的一种实验设计方法[23]。图2所示为Box-Behnken实验设计变量为3的实验点分布形式,通过该方法取得的数据可更高效地反映参数间的非线性关系,优化BP神经网络的预测效果,得到滚齿加工参数与加工碳耗和加工时长的高精度预测模型。

图2 三设计变量实验点分布Fig.2 Distribution of experimental points of three design variables

本次实验以滚齿加工工艺的4个参数为实验变量,每个变量根据机床性能和刀具耐磨程度选取一定的实验范围。该范围内,将每个因素变量分为3个水平,以防止自变量的数据分布过于集中,从而在安全范围内得到更科学的数据点。最后,按照各个参数不同水平实验点组合进行实验。

2.2 多目标预测模型构建

BP神经网络是一种多层前馈神经网络,其中的一个基本技术结构特征是信号前向传播、误差反向传播[5]。神经网络在训练阶段通过调整权重因子和偏差来达到预期结果,利用结合输入、权重因子和偏差的传递函数来评估网络的输出。本文以数控滚齿加工为研究对象,将Box-Benhnken实验设计得到的数据集作为模型输入样本,建立基于BP神经网络的预测模型[24-25]。

优化模型以2次滚切加工的转速和进给量为优化变量即BP神经网络的输入参数,以加工时长T和碳排放C为BP神经网络的输出参数。因为不同参数数据之间的数量级差距较大,因此将数据进行归一化处理:

(7)

式中,x为原始值;xmax、xmin分别为样本值的最大值和最小值;y为归一化之后的值;ymin为归一化值的下限,通常取-1;ymax为归一化值设置的上限,通常取1。

BP神经网络构建的关键问题之一是隐含层节点数的选择,节点太少,难以建立复杂的映射关系、造成误差过大,节点太多,容易造成过拟合。通常可参考神经网络隐含层节点数l的经验公式:

(8)

式中,b1为输入层节点数;b2为输出层节点数;e为[1,10]之间的常数。

由式(8)可得隐含层节点数l为[4,13]间的常数,最终根据实际的神经网络调试误差确定隐含层节点数为5。

贝叶斯正则化法在小样本、复杂样本或噪声样本中有较好的结果,可有效防止过拟合[26],所以将贝叶斯正则化法作为神经网络训练方法。MATLAB中实现贝叶斯正则化的trainbr函数仅将数据分为训练集和测试集,避免了设置验证集,有助于算法使用更多的数据进行训练。贝叶斯正则化算法根据最小化自适应权重使网络泛化和训练终止,避免过拟合。网络训练选择15%~20%的数据作为测试集,用于评估神经网络的预测精度。神经网络训练流程见图3。

图3 BP神经网络训练流程图Fig.3 Flow chart of neural network training

3 基于改进MOGWO算法和熵权-TOPSIS法的多目标优化与决策

3.1 算法框图

选择预测效果相对较好的BP神经网络作为适应度函数,并利用改进MOGWO算法进行多目标优化研究。改进MOGWO算法的优化结果通过熵权-TOPSIS法进行排序以寻找最优方案,最终实现数控滚齿过程的高效低碳运行,结合MOGWO算法与熵权-TOPSIS法的优化、决策的流程如图4所示。

图4 基于改进MOGWO算法和熵权-TOPSIS法的优化、决策流程图Fig.4 Flow chart of optimization decision based on improved MOGWO algorithm and entropy-TOPSIS

3.2 改进MOGWO算法多目标优化

本文以加工过程中的碳耗和总加工时长为目标,采用多目标灰狼算法对2次滚齿的加工参数进行优化。种群优化算法中,初始种群直接影响算法的收敛速度和最优解生成。传统的灰狼算法采用简单的随机生成方法初始化种群,可能造成最优解周围个体较少,容易陷入局部最优。本文采用拉丁超立方抽样初始化种群,使初始狼群更加均匀和多样化。拉丁超立方抽样选点的步骤如下:

(1)将n维向量空间中的每一维度分为互不重叠的m个相同区间。

(2)在每一维度的每一空间中随机抽取一点。

(3)从每一维度里随机抽取步骤(2)中选取的点,将它们组成灰狼算法初始化解。

本文针对传统灰狼算法探索能力不足的缺点,从改进控制参数递减策略和增加灰狼个体自主探索能力两方面入手,扩大狼群的搜索范围,避免陷入局部最优解。

GWO算法中,最优解为α狼,第二和第三最优解分别称为β狼和δ狼,其余候选解为ω狼。猎物对应于本文的优化目标,狼群代表不同的加工参数解集,狩猎(优化)过程由α狼、β狼和δ狼主导,ω狼跟随前三种狼寻找全局最优。狩猎过程中,围捕行为的数学表达式如下:

D=H⊗Xp(t)-X(t)

(9)

X(t+1)=Xp(t)-A⊗D

(10)

A=2ar1-aE

(11)

H=2r2

(12)

其中,t为指当前迭代次数;A、H为系数向量;Xp(t)为猎物位置的向量,即最优工艺参数解的位置向量;X(t)为灰狼位置的向量,文中表示当前工艺参数解的位置向量;⊗表示两个向量相同位置的元素相乘,即获得Hadamard乘积;D为当前工艺参数解与最优工艺参数解之间的距离;a在迭代过程中从2递减到0;r1、r2为元素在[0,1]之间取值的随机向量;E是元素全为1的向量。针对原灰狼算法探索能力不足、易陷于局部最优的特点,为增大狼群的搜索范围,对控制参数a的递减策略进行改进,使得灰狼算法在前期具有更大的探索能力。参数a改进后的公式为

(13)

式中,I为控制系数;i为算法当前迭代次数;imax为算法总迭代次数。

头狼α、β、δ外的其余候选灰狼需根据社会领导机制和狩猎行为不断更新它们的位置,位置更新公式为

(14)

式中,Xα、Xβ、Xδ分别为头狼α、β、δ的当前位置;Xt为候选灰狼的当前位置;Xt+1为候选灰狼的更新位置。

|A|≤1时,搜索向靠近猎物的方向移动;|A|>1时,搜索会远离当前猎物,扩大搜索范围。H是元素取值在[0,2]之间的随机向量,它与A共同决定狼群的搜索能力。

为增强灰狼算法的探索能力,在原算法灰狼个体只会跟随头狼的基础上,给予每个灰狼个体一定自主探索的能力,让灰狼个体在移动的过程中自主学会探索身边可能存在的非支配解。灰狼移动到位置X时,会随机探索附近某个位置X*,X(k)为原位置向量某一随机k维度位置元素,从X(k)移动到X(k)+r,即

X*(k)=X(k)+r

(15)

其中,X*(k)为X第k个位置元素的更新值,r为(-1,1)间的随机数,X*其余维度位置元素与X相同。若新位置X*所得解支配原位置解,则灰狼个体移动至探索到的新位置X*,否则灰狼留在原处。

MOGWO算法在GWO算法的基础上集成了2个新的组件以实现多目标优化,第一个组件是固定大小的外部存档,用来存储得到的非支配帕累托最优解;另一个组件是领导选择策略,用来从存档中选择3个最好的解决方案作为领导者。

3.3 熵权-TOPSIS综合评价方法

MOGWO算法优化后将提供一组结果供决策者选择,决策者能否针对具体问题灵活选择适应的评价方法及时并做出有效的评价是决策成败的关键。TOPSIS法[27-28]思路是在原始决策矩阵标准化后构造“正理想解”(一种设想的最好解)与“负理想解”(一种设想的最坏解),然后计算各决策方案与正理想解、负理想解之间的欧氏距离并排序。若评价方案最靠近正理想解且最远离负理想解,则为最优方案;否则,不为最优方案。熵权法是利用熵的概念确定指标权重的方法,它根据指标值的离散程度和变异性的大小来确定客观权重,是一种客观的赋权值方法。本文结合熵权法和TOPSIS法确定MOGWO算法优化后的最优方案。将改进MOGWO得到的一组帕累托解集进行综合评价和排序,选择综合评价分数排序中的第一名作为本文中最终优化的结果。最后将此结果与经验方案进行对比,验证BP神经网络-改进MOGWO算法的有效性。

4 实验验证

实验采用YS3120CNC6数控高速滚齿机加工齿轮,齿轮主要参数如表1所示。将2次滚切加工过程的4个加工参数设为自变量,并为每个自变量设立3个水平。根据机床性能、工件材料及刀具的磨损性能,实验设计选取的粗切的主轴转速n1为280~360 r/min,滚刀沿工件轴向的进给速度f1为3.5~4.5 mm/min;精切的主轴转速n2为360~420 r/min,进给速度f2为4~8 mm/min,各实验变量的水平见表2。确定实验变量范围和水平后,利用Design-Expert软件辅助完成各因子的组合设计。Box-Benhnken实验设计方法将各自变量不同水平的实验点合理组合,以最大程度地减少实验所需的数据量。

表1 齿轮材料及主要参数

滚齿加工粗滚与精滚之间余量的推荐值是0.5~1.0 mm[29],本文将实验的精切余量设为1 mm。实验中,滚刀的直径为80 mm、质量为1.7 kg,滚刀寿命公式中,k0取3×108,k1取-1.91,k2取-1.9[19]。实验过程中,将电流钳和电压传感器与数控滚齿机相连来获取电流及电压信号,通过HIOKI PW6001功率分析仪实时采集数据信号,最终的实验结果见表3。

表2 自变量的实验范围和水平

表3 Box-Benhnken实验设计及实验结果

本文通过MATLAB构建BP神经网络预测模型。将实验结果中的23组数据作为训练集,将剩余的5组数据作为测试集。隐含层节点数为5,将tansig传递函数作为隐含层神经元的激励函数,将purelin函数作为输出层神经元的激励函数,将trainbr函数作为训练函数。

神经网络拟合的线性回归结果如图5所示。神经网络的预测效果越好,预测值越接近真实值,拟合的直线斜率越接近于1,回归系数R也越接近1。BP神经网络训练集、测试集的R分别为0.995 64和0.981 92。如图6所示,BP神经网络预测的相对误差在±3%以内,说明BP神经网络结果较为可靠。

(a)训练集预测回归图

(b)测试集预测回归图图5 BP神经网络线性回归图Fig.5 BP neural network linear regression diagram

图6 BP神经网络预测相对误差百分比Fig.6 BP neural network prediction relative error percentage

将基于Box-Behnken实验设计的BP神经网络预测模型与其他模型预测进行对比。表4中,BDD-BP为结合Box-Behnken实验设计采集数据与BP神经网络的预测精度,BP、SVR、RF分别表示使用BP神经网络、支持向量回归(support vector regression,SVR)和随机森林(random forest,RF)对同一批滚齿加工实验中随机抽样的28组样本数据其进行建模的结果。由表4可知,在相同加工条件下,本文模型的预测最大相对误差为2.018%,远优于BP、SVR、RF等的预测结果。

表4 不同建模方法的预测结果

算法优化部分通过MATLAB编写改进的MOGWO算法。设置灰狼数目为100,最大迭代次数imax为100,网格膨胀参数为0.1,网格数为10,参数维度为4,控制系数I取100。最终的多目标优化结果如图7所示。

图7 改进MOGWO算法的Pareto最优解集图Fig.7 Pareto optimal solution set graph of improved MOGWO algorithm

使用熵权-TOPSIS综合评价方法对非支配多目标优化方案进行标准化,通过熵权法得到的权值向量进行加权标准化,最终得到正理想解的最佳解集向量U+=(0,0),负理想解的解集向量U-=(0.4809,0.5191),计算每个帕累托解到正理想解和负理想解的距离及综合评分。排名第一的最优解如下:粗切转速n1=314 r/min,粗切进给量f1=4.5 mm/min,精切转速n2=360 r/min,精切进给量f2=8 mm/min。

实际生产通常按工艺参数设计的均值进行加工,即粗切转速n1=320 r/min,粗切进给量f1=4 mm/min,精切转速n2=390 r/min,精切进给量f2=6 mm/min。为验证本文提出方法的有效性,利用NSGA-Ⅱ算法构建多目标优化模型。NSGA-Ⅱ算法的参数如下:最大种群数量为100,最大迭代次数为100,交叉概率为0.8,变异概率为0.03。将基于熵权-TOPSIS评价法的改进MOGWO算法优化结果与经验加工结果进行对比。本文方法取得的最优加工时间为1412.3 s,最优碳排放为3.496 kg CO2,与经验加工的结果(总时间1699.9 s,碳排放3.879 kg CO2)相比,优化算法方案的总时长缩短了20.4%,碳耗降低了11%。

(a)第20代改进MOGWO

(b)第20代NSGA-Ⅱ

(c)第60代改进MOGWO

(d)第60代NSGA-Ⅱ图8 帕累托前沿收敛对比图Fig.8 Pareto front convergence contrast diagram

由图8可知,改进MOGWO在第20次迭代时就已经初步收敛,形成较完整的帕累托前沿,后续的迭代中,MOGWO算法会进一步寻找分布更均匀、更多样化的帕累托解,而NSGA-Ⅱ算法在第60代才初步形成帕累托前沿。由表5可知,改进MOGWO算法帕累托解集的平均值、最优值整体均优于NSGA-Ⅱ算法。由此可得,相较于NSGA-Ⅱ算法,改进MOGWO算法的收敛更快,优化效果更好。

表5 迭代100次优化结果比较

5 结论

本文建立了以最短加工时长、最小加工碳排放为优化目标,以齿轮2次滚切加工的主轴转速和轴向进给量为优化变量的多目标优化模型。针对小样本数据,以结合Box-Behnken实验设计和BP神经网络建立的有效预测模型为多目标优化模型的适应度函数,使用改进的MOGWO算法对模型进行迭代求解,并通过熵权-TOPSIS综合方法对得到的Pareto解集进行评价决策,选择最优工艺参数组合。与经验取值法相比,优化方案的总时长缩短了20.4%,碳耗降低了11%。

本文刀具参数也是影响加工效果的一个重要因素,因此刀具参数、刀具磨损对滚齿加工效益的影响会是下一步研究重点。

猜你喜欢
灰狼实验设计神经网络
基于递归模糊神经网络的风电平滑控制策略
不同的温度
有趣的放大镜
灰狼和山羊
哪个凉得快?
神经网络抑制无线通信干扰探究
谷谷鸡和小灰狼
基于神经网络的中小学生情感分析
灰狼的大大喷嚏
浑水变清