基于改进SVR的离散制造系统能耗预测研究

2022-10-29 06:23威,王
制造业自动化 2022年10期
关键词:灰狼机床种群

陈 威,王 艳

(江南大学 物联网技术应用教育部工程研究中心,无锡 214122)

0 引言

制造业作为能源密集型工业活动之一,占据了全球能源消耗的四分之一,因此节能减排尤其重要[1]。在离散制造系统总能耗中,以机床为主体的加工过程能耗占据了很大比例。合理的工艺参数优化和生产调度能够有效地降低能耗,而优化调度的前提则是对产品加工过程中各个环节的能耗进行准确的预测。

当前物联网、大数据等技术快速发展,如何将其融合到离散制造系统中,相关学者进行了大量的研究。刘强等[2]提出针对机床设备错综复杂的运行状态,需要在研究系统内部特性规律的基础上,引入人工智能领域的机器学习算法,从而满足工业过程运行监控与自优化的需求。He等[3]从原始机械数据中提取出敏感的能耗特征,并采用卷积神经网络算法建立起所提取特征与机床能耗之间的预测模型。Bhinge等[4]提出采用高斯过程回归算法来对输入的加工参数和输出能耗之间的复杂关系进行建模。

离散制造系统在生产过程中积累了大量的多源数据,如何有效地从中挖掘出能耗信息是工业智能化领域的难点之一,由于加工设备生产环境和条件的动态不确定性,建立预测足够精确的能耗模型十分困难。本文探索应用机器学习算法从系统层面建立数据驱动的能耗预测通用模型,并通过改进算法来提高预测的精确度。首先以离散制造系统的机械加工过程为例,深入解析了能耗关联因素;然后对相关能耗数据进行预处理操作,针对能耗数据的非线性和多样性特点,引入支持向量回归(Support Vector Regression,SVR)来构建能耗模型;同时由于SVR惩罚参数和核参数的选值会影响能耗模型的预测精度,故使用改进的灰狼优化算法(Grey Wolf Optimizer,GWO)来对其进行寻优;最后通过仿真实验,并与其他算法进行对比,验证了本文改进算法的有效性且具有更高的准确度。

1 能耗影响因素分析

离散制造系统是由多个加工任务组合而成的复杂系统,因此对离散制造系统的能耗进行预测首先需要分析其加工流程,了解各加工子任务的能耗影响因素,然后采集相关的数据,通过数据驱动的方法来生成能耗模型,实现系统能耗的预测。由于离散制造系统的能耗影响因素众多,且在不同场景下影响因素也不尽相同,为了能准确分析并建立离散制造系统的能耗模型,本文以装备制造业为例,通过对机械加工时的机床结构进行拆分,从而得出能耗关联因素。

在离散机床制造系统中,根据机床设备结构组成,可将其工作时的能耗系统分解为若干能耗单元,各系统能耗相加即为机床的总能耗,其公式可表示为:

式(1)中Etotal——机床工作的总能耗;

Espindle——主轴系统能耗;

Etool——换刀系统能耗;

Efeed——进给系统能耗;

Ecutting——材料切削系统能耗;

Efluid——切削液系统能耗;

Eauxiliary——辅助系统能耗;

Econtrol——控制系统能耗;

Elubrication——润滑系统能耗;

Ehydraumatic——液压系统能耗;

Eother——其他部分系统能耗。

机床设备在运行时状态包含待机、空载和切削,以铣削加工为例,图1描述了机床加工全程的能耗变化曲线[5],机床在待机状态维持一段时间后进入空载运行状态,然后以F100(即每分钟切削100mm)的进给速度进行铣削加工,在加工过程中进给速度提升为F150,当加工结束后机床切换至空载状态,最后由于急停机床关闭。

图1 机床铣削加工能耗变化曲线

机床启动后进入待机状态时,功率变化较小,机床中各电机都尚未工作,此时仅有辅助系统、控制系统及其他系统处于工作状态,会产生能耗值,可将此阶段的待机能耗视为作恒定值。当主轴电机启动时,机床进入空载状态,此时虽然还没有实际的零件加工,但主轴系统、进给系统、切削液系统、换刀系统、润滑系统和液压系统等都已经进入工作状态,由于切削液系统、换刀系统、润滑系统和液压系统一经工作其功率变化较小,因此可将能耗看作恒定值,而主轴系统和进给系统的能耗主要与主轴转速和进给量有关。当机床进入实际切削阶段时,在空载能耗的基础上,会增加去除零件多余材料而产生的材料切削能耗。

由此可以将机床能耗分为固定能耗和非固定能耗。固定能耗为待机阶段能耗和空载阶段时除开主轴系统和进给系统外的能耗;非固定能耗由空载阶段的主轴系统能耗、进给系统能耗以及切削阶段的切削能耗组成。影响非固定能耗的因素主要有零件设计相关的毛坯材料、毛坯形状,切削刀具相关的刀具材料、刀具直径、刀具几何角度以及加工工艺参数相关的主轴转速、进给量、切削深度、切削宽度、切削速度等。

2 能耗预测模型

影响离散机床制造系统运行能耗的影响因素很多,并且作为能耗模型的输入变量存在多样性和非线性的特点,所以越来越多的研究者开始倾向于使用神经网络、支持向量回归等机器学习算法来对数据进行训练,生成合适的能耗预测模型,这样在应对加工环境发生变化的场景时,也能取得良好的预测效果。相比于神经网络算法,支持向量回归在应对小样本学习时更具优势,因此本文选用支持向量回归来预测机床能耗。

2.1 能耗数据预处理

影响机床能耗的因素包括加工毛坯材料、毛坯形状、刀具种类等非数字特征的数据,因此需要对其进行数据化处理。针对类型特征数据,尽可能对其做数字化处理,例如毛坯材料种类,由于不同毛坯材料的强度、硬度不同,从而影响切削力及能耗,于是可用硬度值表示对应材料,此外刀具种类也可用硬度值代替,而机床种类的可用待机功率和主轴电机功率等代替。对于一些无法数字化的类型特征数据如毛坯形状,可通过独热编码方式对其进行处理。

由于机床加工过程中采集到的数据量纲是不一致的,并且数值相差较大,如果直接作为模型输入进行训练,会降低训练速度和精度,因此需对其进行归一化处理,如式(2)所示:

式(2)中,xi为需归一化的第i个能耗影响因素数值,ximax和ximin为该因素的最大值和最小值,xi*为归一化后的值。数据恢复时的反归一化公式为:

2.2 基于SVR的能耗预测模型

支持向量回归是建立在支持向量机基础上的回归算法,相较于其他传统回归方法,SVR在训练更高维度、非线性的数据时更具优势,且能获得更高的回归精度。

采集到的能耗数据在完成预处理后,会得到由n组数据组成的SVR训练数据集,其中xi=(xi1,xi2,...,xim)为第i个由m个能耗关联因素组成的m维输入向量,yi为对应的一维输出能耗值,于是,x为n个m维输入向量组成的n×m维输入阵列,而y为n个输出能耗值组成的n维输出向量。

如图2所示,图中各圆圈表示数据集的每组能耗数据,SVR的目的是通过求解得到最优超平面ωTx+b=0,使得各数据与超平面之间的距离小于设定值ε,其中ω和b分别为权重向量和偏置量。对于能耗建模,本质上就是希望找到一个映射f,使得f(x)与y尽可能相等,于是对于该回归模型则有:

图2 SVR示意图

式(4)中φ()为非线性函数,它能令x映射到更高维的特征空间,使φ(x)与y成线性关系。

在传统回归模型中,通常以模型输出f(x)与实际输出y之间的差值计算精度损失,而在SVR模型中,会引入一种特殊的损失函数,这种损失函数对于小于ε的误差不敏感,即f(x)与y之间的差值小于ε时也认为预测正确,不计入损失,此方法能够提高模型的鲁棒性,为此,回归的优化问题可以写成:

式(5)描述的优化问题是建立在数据集中所有数据都处于以f(x)为中心,两侧宽各为ε的间隔带中,但实际中是存在部分数据是异常的,应该容许某些点存在一定程度上的偏离,于是在式(5)中引入惩罚参数C和松弛变量ξi和ξi*。松弛变量是指间隔带区域外正或负的偏差,而惩罚参数可以控制偏差的权重。至此,回归的优化问题可以写成:

为将约束条件与目标函数联系起来,引入非负的Lagrange乘子αi,αi*,ηi,ηi*。对ω,b,ξi和ξi*分别求偏导并令其等于0,可转化为SVR的对偶问题,再根据KKT条件[6],可得SVR的解如下:

式(7)中K(xi,x)=φT(xi)φ(x)称为核函数。由于φ(x)在实际计算时可能十分复杂,所以在SVR中,可以通过选择合适的核函数来取代φ(x)的计算。本文采用RBF核函数,表达式如式(8)所示:

式(8)中σ为核参数。

于是在确定惩罚参数C和核参数σ后,通过对包含输入变量x和输出变量y的已知能耗数据集进行训练,即可得到基于SVR的能耗模型y=f(x),在应用此模型对能耗数据进行预测时,只需将相应能耗关联因素作为输入变量代入模型,即可得到对应预测能耗值。

3 改进的智能优化算法

运用基于RBF核函数的SVR算法建立预测模型时,C和σ的值会影响模型精度,所以需进行优化。本文提出一种改进的遗传灰狼优化算法(Improved optimization algorithm based on Genetic Algorithm and Grey Wolf Optimizer,IGAGWO)来优化C和σ的取值。

3.1 灰狼优化算法

GWO算法是由Mirjalili教授在2014年提出的仿自然体算法[7]。由于其他智能算法往往需要人为设置一些影响优化精度的参数,如粒子群算法需要设置学习因子和惯性系数,差分进化算法需要设置交叉算子和变异算子,免疫算法需要设置免疫选择比例和种群刷新比例等,而GWO算法则不需要,此外GWO算法还具有易实现和收敛速度快等优点。

GWO算法通过模拟大自然中灰狼种群的社会等级机制和捕食行为来求解优化问题。在灰狼群体中,主要包括α,β,δ和ω四个等级,α是地位最高的头狼,代表已知解中的最优解,β是地位仅次于α的狼,代表次优解,δ是地位仅次于α和β的狼,代表第三最优解,ω是群体中剩余的其他狼,代表种群的候选解,ω狼遵循α狼、β狼和δ狼的领导。用Xp(t)表示猎物的位置,即优化问题的最优解,X(t)表示在第t次迭代时的灰狼位置,即当前优化问题的潜在解。灰狼种群在捕猎时会围住猎物,模拟该行为的数学公式可表示为:

式中D表示灰狼与猎物的距离,A为摆动因子,G为收敛因子,A和G的更新公式为

式中r1和r2为区间[0,1]内的随机向量,a为控制参数,其表达式如式(13)所示:

式(13)中T为最大迭代次数。

由于算法应用在实际问题时,猎物代表的最优解无法确定,因此需要通过α狼,β狼和δ狼的位置来计算出潜在的猎物位置,使得其他狼群可以更新自己的猎物围捕位置,这种围捕猎物的过程用公式表示为:

式(15)中Dα、Dβ和Dδ分别表示α狼,β狼和δ狼与其他之间的距离,Xα(t)、Xβ(t)和Xδ(t)分别表示α狼,β狼和δ狼在第t次迭代的位置。

于是,灰狼种群在迭代后的新位置为:

灰狼种群围捕猎物过程的示意图如图3所示,对于此优化模型,当||A|| 的值小于1时,GWO算法会模拟灰狼对猎物进行攻击,而当||A|| 的值大于或等于1时,灰狼会放弃对当前猎物的追捕,转而搜寻其他猎物。当满足最大迭代次数或最优解达到阈值时,算法终止。

图3 灰狼围捕猎物过程示意图

3.2 混合改进策略

GWO算法具有简单易实现、需调整参数少等优点,但也存在早熟易陷入局部最优等缺点。为提高GWO算法的寻优性能,本文在标准GWO算法的基础上,针对其缺点提出一些改进。

在标准GWO算法中,灰狼种群初始化位置是随机产生的。使用Tent混沌映射来初始化,可使种群分布会更均衡,遍历性很好。Tent映射表达式为:

GWO算法中灰狼种群之间缺乏足够的信息交换,寻优后期会存在多样性丧失的缺点,而遗传算法(Genetic Algorithm,GA)由于交叉、变异等操作可以使群体的多样性保留到后期迭代过程,因此本文引入GA算法的交叉算子和变异算子。交叉操作是从灰狼种群X(t)中选取部分个体随机匹配,对于每一对个体,按照交叉概率Pc交换它们位置向量中的部分元素。变异操作是按照变异概率Pm,判断每个个体是否变异,如变异则将其位置向量上的部分元素更改为搜索范围内的其他随机值。将交叉、变异操作新生成的种群位置信息全部储存在新的数据池,待操作完成后,对全部新旧种群按适应度值排序,取排名前列的进入下次迭代,淘汰靠后的群体。此外,为防止交叉、变异操作可能导致原先较好适应度值的个体被破坏,所以引入精英保留策略。算法首次迭代之前,当适应度值越高越好时,先在精英记忆库添加三个适应度值为0的个体,反之,则添加三个适应度值为∞的个体。在算法完成交叉、变异操作后,将记忆库个体与灰狼种群混合,一起参与新α、β、δ和下一代种群的确定,结束后重新选取排名前三的精英,更新记忆库,在进行下一次迭代。

改进后的IGAGWO算法流程如表1所示。

表1 IGAGWO算法流程

3.3 IGAGWO-SVR算法流程

IGAGWO-SVR算法即用IGAGWO算法优化SVR的惩罚参数C和核参数σ,应用在能耗预测建模时具体流程如下:

Step1:预处理能耗数据,设置IGAGWO-SVR算法的初始参数;

Step2:应用Tent混沌映射初始化灰狼种群,每个灰狼个体为二维的(C,σ)组合;

Step3:分别计算个体适应度值,首先将每个个体的C、σ和处理后的数据一并代入SVR建立模型,再将能耗输入数据代入得到的预测能耗值,与实际能耗进行比较,求得均方误差即为适应度值,确定α、β、δ狼;

Step4:按照标准GWO算法更新灰狼种群位置;

Step5:根据Pc和Pm对灰狼进行交叉、变异操作;

Step6:将精英记忆库存储的个体加入种群,计算适应度值,选取靠前的n个作为新种群,同时,选取前三作为新的α、β、δ狼并保存到精英记忆库中;

Step7:判断是否满足最大迭代次数,如满足,输出最优参数,否则返回至Step4;

Step8:以输出参数构建能耗预测模型。

4 实验结果与分析

为验证IGAGWO-SVR,本文选择在MATLAB R2016a上进行仿真实验。

4.1 IGAGWO算法性能测试

本文选取Sphere、Griewank和Sum squares三个测试函数来对IGAGWO算法进行性能测试,以验证其在寻优能力和收敛速度上的有效性,各测试函数的具体信息如表2所示。选取GWO算法、GA算法、SCAPSO算法[8]、PSOGSA算法[9]作为对比算法,各算法寻优个体数取30,迭代次数取1000,IGAGWO算法和GA算法中的Pc和Pm分别取0.8和0.05,SCAPSO算法和PSOGSA算法的参数设置与原文一致。表3记录了各算法在试验50次后最优解集合的平均值、最小值和均方差。图4~图6为各算法寻优迭代曲线,为方便比较,曲线纵坐标刻度以对数形式展现。

表2 测试函数

表3 测试结果

由表4和图4~图6可知,与另外四个算法相比,本文提出的IGAGWO算法应用在三个测试函数上,都能取得更优的解,均方差最小也表明了IGAGWO算法在多次寻优时具有更好的稳定性。综上可知,IGAGWO的寻优能力和收敛速度确有提高。

图4 Sphere函数测试

图5 Griewank函数测试

图6 Sum squares函数测试

4.2 基于IGAGWO-SVR的能耗预测模型

本文采用文献[10]中的64条能耗数据进行仿真建模,模型输入为机床切削时的切削速度、进给率、切削深度、工件直径和主轴转速五个能耗影响因素,模型输出为功耗值。

为验证IGAGWO-SVR在离散制造系统的能耗预测建模方面的性能优势,选取目前在回归建模方面应用较广的BP神经网络(Back Propagation Neural Network,BPNN)和多元线性回归(Multiple Linear Regression,MLR)作为IGAGWO-SVR的对比算法。由于IGAGWO是对SVR的C和σ进行寻优,故维度为2,C的取值定为[0.1,1000],σ的取值定为[0.001,100],其余参数与之前测试时一致。BPNN模型的输入层数为5,输出层数为1,将隐藏层数设为10,训练最大次数设置为200。

使用三种算法对能耗数据进行回归建模后,分别将预测值和实际值进行比较,每组数据的相对误差如图7所示,各算法的最大相对误差和平均相对误差如表4所示,由此可知相较于BPNN和MLR,IGAGWO-SVR算法在用于回归建模时回归结果与历史数据实际值更加接近,相对误差也更小。因此,本文提出的IGAGWO-SVR在应对离散制造系统的能耗预测问题时效果更好,预测结果更加准确。

图7 三种模型回归相对误差图

表4 三种模型回归误差比较

5 结语

离散制造系统能耗机理复杂而影响因素众多且存在非线性特点,解析模型与能耗预测比较困难。本文以机床能耗预测问题为例,首先解构了其能耗构成,分析出加工过程中具体的能耗影响因素,然后提出用支持向量回归算法来建立预测模型。针对影响回归精度的惩罚参数和核参数,提出一种融合混沌映射、交叉变异操作和精英保留策略的改进遗传灰狼优化算法来进行优化。仿真实验结果验证了本文所提算法的准确性和优越性。

猜你喜欢
灰狼机床种群
山西省发现刺五加种群分布
第11届武汉国际机床博览会
2021第24届青岛国际机床展开幕
JM2021第24届青岛国际机床博览会
灰狼和山羊
《机床与液压》投稿要求
谷谷鸡和小灰狼
灰狼的大大喷嚏
“最大持续产量”原理分析
由种群增长率反向分析种群数量的变化