田 旭,郭 宇,黄少华,刘道元,高瀚鹏,刘 赛
(南京航空航天大学机电学院,南京 210016)
制造业是国民经济的支柱产业,在生产制造过程中,消耗大量能源,排放大量温室气体,降低制造过程碳排放、实现制造系统节能优化已成为当前研究重点[1-2]。分析能耗机理和影响因素,构建车间能耗模型,便于把握车间能耗演化趋势[3],也为车间能耗优化、提高制造系统性能提供了理论基础和支持。
国内外学者在分析机床能量特性、建立车间能耗模型方面开展了大量的研究工作,主要包括数学建模和数据驱动两类。数学建模方法通过建立确定的数学模型来分析能量效率及特性,从而进行优化减少能耗。王秋莲等[4]从能量源构成角度出发,构建了数控机床能量流数学模型。ALBERTELLI[5]从能耗、损耗和效率角度分析,建立了主轴系统能量经验模型。WOJCICKI等[6]分析车床能耗构成及能量耗散机理,建立车床切削能耗数学模型。上述方法能较好适用于单机设备的能耗建模,但需要大量实验校验,难以适用于动态多变、影响因素多的离散制造车间能耗预测。
随着物联网、大数据等技术的发展,车间实时产生大量生产数据[7],采用数据驱动的智能预测方法,分析数据间关联关系,揭示系统运行机理,进行大规模复杂系统的分析与决策[8]。ZHANG等[9-10]以生产数据为驱动,将自编码器、深度置信网络等方法应用到机床能耗分析控制中。PAN等[11]采用基因表达式编程算法进行数控机床能耗建模。李聪波等[12]提出基于元动作的数控车削能耗预测模型。吕景祥等[13]采用3种智能算法建立车削和钻削加工能耗模型,实现能耗预测。当前研究中多采用卷积神经网络、深度置信网络等方法进行数据信息提取,但车间生产数据具有时序性,采用循环神经网络提取时序信息,有助于提高能耗预测的准确性。
本文以离散制造车间数据为支撑,分析车间能耗影响因素,提出一种融合双向门控循环和残差单元(bidirectional gated recurrent unit-residual unit,BiGRU-ResUnit)的车间能耗预测方法,门控循环单元结构提高模型的时序信息提取能力,残差单元丰富提取信息,防止模型退化。以某一航空离散制造车间的生产数据为例,并与常见的5种预测模型进行对比分析,验证了所提方法的适用性和有效性。
离散制造车间的能耗受人、机、料、法、环以及各类扰动事件的共同影响,能耗环节多、流程复杂、随机影响因素多,预测较为复杂。离散制造车间的能耗主要包括设备能耗、运输能耗和公共能耗[11]3个部分。设备能耗是指订单生产过程中所使用的车间设备的总能耗;运输能耗主要由物料和工件运送过程中所使用的转运车、传送带和叉车等能耗组成;公共能耗主要来源于车间的照明、空调和风扇等,如表1所示,本文仅针对车间的电能消耗进行研究。为更加准确地建立离散制造车间能耗模型,分别从能耗组成和车间总体对能耗进行具体分析。
表1 离散制造车间能耗组成
设备能耗包括加工设备和辅助设备能耗,主要组成部分为加工设备能耗。辅助设备能耗与其运行功率和开启时长成正比,且辅助设备功率值可以参考相关产品额定功率或通过实际测量获得,研究中可以认为是一个恒定值[14]。加工设备能耗可表示为:
(1)
式中:τ为时间,pk为τ时刻设备k的功率,与设备状态有关。加工设备在订单生产过程中包括启动状态、待机状态、空载状态、加工状态和停机状态5种状态。在实际生产过程中,生产设备的启动和停止时间短[15],单次能源消耗较为固定,加工设备的主要能耗产生在待机、空载和加工3种状态中。设备在完成当前调度安排后,进入待机状态[16],此时设备功率与其本身辅助部件额定功率相关,不同设备待机功率不同,但基本保持稳定,待机时间与剩余加工任务安排相关;处于加工状态时,设备功率和时间均与加工工件类型有关,加工不同零件时,设备负载不同,功率不同,加工时间不同;加工设备在完成当前工件的当前工序、等待下一个加工任务期间,会转为空载状态[16],此时运行功率与出/入缓存区工件队列和等待时间相关。
运输能耗指在加工过程中,运输设备在车间和仓库、各工序、各工位上将工件或物料进行运输所需要的能量[17]。常见的运输设备有AGV小车、传送带、叉车等,运输能耗可表示为:
(2)
式中:pu为运输设备u运输功率,τ为运输时间。运输设备工作过程中,固定工位之间的工件运输,其路线较为固定,负载与运送工件类型和数量有关,故运输能耗与AGV状态、在制品运输种类和数量有关。
公共能耗是指车间生产过程中为产品加工和技术人员工作提供合适环境以及进行生产任务查询规划等设备的能耗,包括照明设备、空调、风扇、电子看板等,这一部分能耗较为稳定。
结合上述分析,离散制造车间能耗主要包括设备能耗、运输能耗和公共能耗,考虑到公共能耗部分较为固定,车间能耗的变化主要来源于设备能耗和运输能耗部分。由于离散制造车间复杂多变,能量消耗过程复杂,难以对其能耗进行精准建模及简单计算求和,为了更加准确分析其能耗,在考虑车间生产物流全过程影响因素的基础上,建立数据驱动的车间能耗模型,以实现高精度的能耗预测。现将离散制造车间能耗影响因素主要划分为4类:加工设备状态、实时生产状态、剩余生产任务、运输设备状态,表示如下:
S=[MSt,RTt,WNt,TSt]
(3)
式中:MSt表示加工设备状态,RTt表示t时刻各工位实时生产状态,WNt表示t时刻车间剩余加工任务,TSt表示t时刻运输设备配送状态。量化表达如下:
(1)加工设备状态。加工设备状态与设备能耗直接相关,量化表示如下:
(4)
(2)实时生产状态。实时生产中状态由各工位入缓存区、在加工和出缓存区工件状态来表示,量化表示如下:
(5)
(6)
(7)
(8)
(3)剩余生产任务。生产任务可以包含一个或几个生产订单,涉及多种工件的加工,生产任务组成的不同可以由各种类型工件的数量来表示,所以将当前剩余待完成的生产任务组成量化表示如下:
(9)
(10)
(11)
基于BiGRU-ResUnit的离散制造车间能耗预测建模如图1所示。首先,对数据进行归一化,随机选取其70%作为训练集,其余作为测试集;其次,使用训练集训练BiGRU-ResUnit网络,提取数据时序特征的同时,融合残差单元避免网络退化问题,提高预测模型性能;最后,使用测试集验证预测模型的适用性和有效性。
图1 离散制造车间能耗预测模型
由于原始数据集来源较多(如时间、空间、状态等),数据集特征数众多,且各特征对应的数据具有不同的量纲和单位。如果直接通过原始数据进行预测,将导致具有较大值的特征对目标的影响大于具有较小值的特征。因此,对各数据特征进行归一化处理,去除单位限制,将其转换为无量纲的纯数值。本文采用最大最小归一化的处理方法,将各数据特征转换至[0,1]区间,实现对原始数据的等比例缩放。如式(12)所示。
(12)
式中:X*为归一化后的数据,X为原始数据,Xmax、Xmin分别为数据集中该数据特征中的最大值和最小值。
离散制造车间的能耗数据具有时序性,根据预测网络的输入需求,绑定时序排列的time_up条数据,重构形成一条新的训练数据,如式(13)所示。
(13)
式中:Sj-time_up+i为第j-time_up+i条数据,i=1,2,…,time_up。
循环神经网络(recurrent neural networks,RNN)主要用于时序预测,能够挖掘时序数据深层次的信息。门控循环单元(gated recurrent unit,GRU)[18]是一种特殊的循环神经网络,相比于常规RNN,缓解梯度消失问题,其内部由重置门和更新门两个门控组成[19],如图2所示。本文选用双向门控循环单元(bidirectional gated recurrent unit,BiGRU),由正反方向的两个GRU网络构成,加强对数据时序关联信息的获取。
图2 GRU单元结构
GRU单元t时刻的输入为xt,输出为yt和传递给下一个节点的隐藏层状态ht。输入zt和t-1时刻的隐藏层状态ht-1,获取更新门控zt和重置门控rt,如式(14)、式(15)所示。更新门控xt用于遗忘和选择记忆,遗忘、清除存储单元中的无用信息,对当前节点信息进行选择性记忆。其范围为0~1,越接近1,记忆过去的信息越多;反之,遗忘过去的信息越多。重置门控rt将当前输入xt和t-1隐藏层状态结合,rt趋近于1时,认为过去的隐藏信息都有用,并将其添加到当前信息中;rt为0时,则丢弃上个时刻隐藏信息。
zt=σ(xtWxz+ht-1Uhz+bzt)
(14)
rt=σ(xtWxr+ht-1Uhr+brt)
(15)
(16)
(17)
为获取更丰富的特征信息,需加深网络深度,但网络层数增加会引起退化问题,因此,引入残差单元[23],在丰富特征的同时,降低样本数据的特征损失,有效防止模型退化问题,便于更好把握能耗的未来变化趋势。本文所用残差单元结构如图3所示,包含卷积层、批量归一化(batch normalizaiton,BN)层、Relu激活函数层和残差连接。以x为输入,跳跃连接输出端,其连接权重为1,输出如式(18)所示。
图3 残差单元结构
F(x)′=F(x)+x
(18)
式中:F(x)为经两个卷积层提取后的特征。
在BiGRU网络特征提取的基础上,纵向叠加多个残差单元,解决网络层数加深引起的梯度爆炸或梯度消失等问题,并堆叠全连接层实现车间能耗预测。在网络训练过程中,加入dropout层,将神经网络的神经元按照一定的概率短暂性地从网络中丢失,由于是随机丢弃,增加了输入数据的多样性,避免了模型过于匹配训练的样本。通过Adam优化器不断迭代寻优,提高数据融合的准确度。采用均方损失函数(mean square error loss,MSELoss)作为损失函数,其表示为:
(19)
(20)
式中:λ为L2正则化系数,取值为0.5;ωi为各层网络权重值。
本文以某航天离散制造车间的生产数据为研究案例,验证所提能耗预测方法的有效性。车间共有13个工位,每个工位配备一定容量入/出缓存区,主要加工8种类型的工件,每个工件有固定的工艺路线。采集了36 480条制造数据,每条有761个特征。以上述数据集为基础,经多次实验,取网络参数如下:迭代次数为250,批量化尺寸为64,训练过程的模型学习率为0.000 1。网络结构如表2所示。
表2 BiGRU-ResUnit网络结构
选取均方根误差RMSE、平均绝对误差MAE、决定系数R2来反映预测模型的准确度,计算如式(21)~式(23)所示。
(21)
(22)
(23)
从测试集中随机选取100条数据,将本文所提算法模型BiGRU-ResUnit与多层感知机(multilayer perceptron,MLP)、BiGRU、卷积神经网络模型(convolutional neural networks,CNN)、双向门控循环单元-卷积神经网络模型(bidirectional gated recurrent unit-convolutional neural networks,BiGRU-CNN)、门控循环单元-残差单元(gated recurrent unit-residual unit net,GRU-ResUnit)五种对比模型的预测结果进行对比,如图4所示。MLP模型的预测结果偏差最大,CNN、BiGRU、BiGRU-CNN、GRU-CNN模型在测试集上的拟合度依次提升,证明了BiGRU-ResUnit模型预测效果最好。
(a) BiGRU-ResUnit曲线图 (b) MLP曲线图
(c) CNN曲线图 (d) BiGRU曲线图
(e) BiGRU-CNN曲线图 (f) GRU-ResUnit曲线图图4 模型RMSE损失曲线
为更直观地验证所提算法的优越性,6种模型在迭代过程中测试集的RMSE变化如图5所示,不同评价指标对比如表3所示。图5中,BiGRU-ResUnit相较GRU-ResUnit能够收敛到更优值,说明了双向结构加强了对时序数据的特征提取能力。相较于BiGRU,残差单元能够提取到更丰富的特征信息,有效防止模型退化问题,提升模型预测的准确度。从表3可以看出,MLP在所有评价指标中表现最差,其次是CNN,说明GRU能够有效的提取数据中的时序信息,提高模型的预测能力。BiGRU-ResUnit相较于其他5种方法,所有指标表现最优,说明所提方法在能耗预测方面具有优越性。
图5 模型RMSE对比图
表3 不同评价指标对比
为进一步说明BiGRU-ResUnit模型的稳定性,图6对6个模型的预测残差(由实际值和预测值之间的差值表示)进行比较分析。BiGRU-ResUnit的预测误差密度分布集中在0左右,对称到0,比其他5种方法更细长,证明了所提方法有助于减小预测误差,提高预测鲁棒性。
图6 6种算法模型残差值对比图 图7 所提算法时序预测结果图
从测试集中选取300条连续的数据进行验证,准确率为96.05%。如图7所示,预测曲线能够较好地拟合标签曲线波动趋势,说明所提BiGRU-ResUnit模型能够实现离散制造车间能耗精准预测。
本文基于离散制造车间能耗影响因素分析,建立了一种基于BiGRU-ResUnit的离散制造车间能耗预测模型。该方法将双向门控循环单元和残差单元进行结合,提高了预测模型对时序信息的捕捉能力,并丰富了网络特征,缓解网络性能退化问题。结合车间数据分析,相比其他五类网络模型,所提方法能够更好地提取能耗数据中蕴含的知识,提高能耗预测的准确度。在未来的研究中,建立更加完备的能耗组件-系统能耗关联模型,并考虑注意力机制,提高加工系统能耗的预测能力。依托生产过程在线仿真环境,以能耗预测为依据触发动态决策,建立基于深度强化学习的决策模型,实现离散制造车间的自适应能耗优化。