基于数据挖掘算法的热压罐固化周期预测研究

2021-04-25 02:12魏士鹏
航空制造技术 2021年5期
关键词:热压工装数据挖掘

魏士鹏,王 宁,袁 喆

(航空工业成都飞机工业(集团)有限责任公司,成都 610092)

复合材料是一种适用于飞行器的理想材料,在航空航天领域用量比例逐渐增多[1–3]。目前,热压罐固化工艺是生产复合材料构件的主要方法[4]。热压罐固化过程涉及复杂的热交换、热化学反应[5],以及热压罐内工装、复合材料构件、复合材料构件和罐体之间的流场、温度场的耦合效应[6],而且每次进罐的零件类型、零件个数、工装尺寸等因素不同,使得热压罐固化周期难以预测。但是热压罐固化作为整个制造流程中的一个重要环节,其固化周期将会影响整个复合材料制造周期。每次热压罐固化的周期波动较大,导致计划人员无法准确地对热压罐进行连续排罐和有效控制热压罐的空罐时长。因此,热压罐固化周期预测不仅可以提高连续排罐的准确率,为计划人员制定更精细的排产计划提供重要的数据依据,还可以缩短热压罐空罐时长,提高热压罐设备利用率,对确保完成生产任务具有重要的意义。

热压罐固化过程复杂,影响因素较多,如工装大小、工装数量、工装摆放位置、零件类型等。朱雪初等[7]提出采用仿真方法模拟实际制造过程,以此来推算工件的加工周期。但是该方法需要建立和维护一个复杂的仿真系统[8]。在实际生产过程中,每次进罐的零件及其摆放位置不尽相同。每次模拟固化过程时需要重新建立固化数模,此过程需要较长的时间。目前,还没有用数据挖掘算法根据历史固化数据对热压罐周期进行预测的研究。本文选用了支持向量回归(Support vector regression,SVR)和KNN(K–nearest neighbor)预测两种预测方法,从数据挖掘角度对热压罐固化周期进行预测,并对这两种方法进行对比分析。

1 问题描述及模型建立

1.1 问题描述

热压罐固化过程主要经历升温、恒温、降温3个阶段。在固化过程中,恒温时长为定值,因此,零件固化周期主要受升温阶段和降温阶段的影响。在升温阶段,零件主要通过工装传热升温;在降温阶段,热压罐通过循环冷却水对热压罐罐内空气进行降温来降低零件的温度。每次固化的零件个数不同,零件类型组合不同及零件的摆放位置不同。不同的进罐组合影响零件的升温速率,导致零件固化时长不同。因此,在预测热压罐固化周期时,将工装的长度、宽度、高度、重量、占地面积,工装摆放位置,罐内零件类型总数,零件自身类型,零件个数作为影响热压罐固化周期的因素。

本文选用支持向量回归与KNN预测两种数据挖掘方法对每个零件的固化时长进行预测。

1.2 支持向量回归

支持向量回归是支持向量机的推广应用,同样具有支持向量机对于处理小样本、非线性及高维数据的优势。支持向量回归[9–12]算法的思想是:(1)利用非线性映射将样本点从原始数据空间映射到高维特征空间;(2)寻找拟合函数;(3)通过f(x)计算出待预测样本点x所对应的实数值。SVR中f(x)的值可以为任意的实数[14]。

支持向量回归算法的目标是寻找最佳拟合函数f(x),使得所有样本点的目标值与f(x)拟合得到的值之间的差别小于e,同时引入松弛变量ζi和ζ*i,模型转化为[15]:

式(1)中,w是决策边界的参数,φ是从原始数据空间映射到高维特征空间的非线性变换,m为样本点个数,惩罚参数C>0。惩罚参数C是为了对差值超出e的样本点进行惩罚。当C值越大时,表示对样本点的惩罚越大。利用拉格朗日乘子将约束条件代入目标函数中进行求解,得到的最终优化目标为:

式(2)中,αi,αi*为拉格朗乘子,K(xi,xj)为核函数,部分参数的αi-α*i的值不为零的样本点被称为支持向量。最终得到f(x):

支持向量回归中e、惩罚函数C、核函数及其参数的优化选择对模型的学习精度和推广能力起着决定性作用[13,16–17]。对于核函数,一般选择高斯核函数。SVR模型需要事先给出e、C及核函数中的参数k的值。

1.3 k最近邻回归

k最近邻[18–20](K –nearest neighbor,KNN)在最初提出时是为了用于处理分类问题。KNN被广泛用于模式识别和基于内容相似性的信息检索,而回归问题相关的研究较少。KNN回归是基于实例学习的非参数预测法,通过检索历史数据集中与待预测样本的特征向量最相似的k条数据来进行预测。该方法认为,在预测问题中所有因素之间的内在联系包含在历史数据中,可以直接在历史数据中得到信息,不需要根据历史数据建立一个近似的模型[21]。KNN回归的思想是:(1)找到离待预测样本最近的k个训练样本点;(2)将这k个训练样本点的均值作为待预测样本的值。设x1,x2,…,xk分别是待预测样本x的k个最近邻样本,它们的值分别为y1,y2,…,yk,则待预测样本的值是:

1.4 建立热压罐固化周期预测模型

为了确保完成生产任务,在实际生产过程中,计划人员会安排多个零件同时进罐。假设第j个热压罐Lj中有n个零件,有m个影响热压罐固化周期的因素,Lj=(X1,X2,…Xn)。这里Xj=(Xi1,Xi2,…Xim),表示影响每个零件固化周期的因素(l=1,2,…m)。零件的完成固化的时长为yi,i=1,2,…n。第j个热压罐Lj的热压罐固化周期是指Lj罐内所有零件X1,X2,…Xn均达到工艺文件固化要求的最长固化时间。即第j个热压罐Lj的固化周期为:

热压罐固化周期预测模型:

Step1:选用支持向量回归与KNN预测两种方法对每个进罐零件的固化时长进行预测。

Step2:两种预测方法得到第j个热压罐Lj的固化周期:分别为:

支持向量回归方法预测时,e设置为0.1,C设置为1,核函数,其中参数σ是自适应的,KNN预测时,用欧式距离计算距离矩阵,且近邻的个数设置k为1。

2 预测模型结果分析

利用Matlab2014a平台构建支持向量回归模型和KNN预测模型,分别对热压罐固化周期进行预测,并开展对比试验。

本文共选取60罐,540条热压罐固化数据作为试验样本,分别采用支持向量回归模型和KNN预测模型进行预测(表1)。每次试验任意选取1罐的固化数据作为测试集,其他热压罐中所有零件的固化数据作为训练集,通过热压罐固化周期预测模型分别计算出每一罐的预测固化时长。

由表1可见,只有第6罐的KNN预测结果比SVR的预测结果差,其他罐次KNN预测结果均优于SVR的预测结果。在第7罐中,SVR的预测结果与实际固化周期相差1.6h,而KNN预测结果与实际固化周期相差0.324h。

KNN预测结果中,与实际固化周期的误差小于0.15h的有50%,误差小于0.5h的有90%。而SVR预测结果中,与实际固化周期的误差小于0.15h的为0罐,误差小于0.5h的只有60%,见表2。通过本次试验可以看出,KNN预测模型的预测结果更接近热压罐实际固化周期,能够更加准确地预测热压罐固化周期。

热压罐固化周期的影响因素较多且相互关系复杂,同时利用数据挖掘算法对热压罐固化周期进行预测是一项全新的工作,对影响因素无法做到全面的数据表征,因此难以建立准确的参数模型。支持向量回归模型虽然在处理非线性及小样本数据上具有明显的优势,但由于目前的影响因素不能很好地表征热压罐固化周期与各影响因素之间的数学关系,使得支持向量回归模型的预测结果未能达到理想效果。热压罐固化的零件本身具有重复性,如同一类型的零件多次进罐固化,过去的固化信息可作为未来事件分析的参考依据。同时KNN预测模型的优点在于不需要明确研究对象及其影响因素之间的数学关系[22–23]。KNN预测用于预测的关键是找到一组与预测对象相似的历史样本。因此,KNN预测模型更适合热压罐周期预测问题。

表1 KNN预测模型与支持向量回归模型的预测结果对比Table 1 Comparison of prediction results between KNN prediction model and support vector regression model

表2 KNN预测模型与支持向量回归模型的误差对比Table 2 Deviation comparison between KNN prediction model and support vector regression model

3 结论

现阶段,热压罐固化成型作为复合材料制造过程中的一个重要环节,对提高热压罐设备利用率,确保完成生产任务具有重要的意义。目前,生产任务日益加重,如何提高连续排罐的准确率,缩短热压罐空罐时长尤为重要。本文采用了支持向量回归模型和KNN预测模型对热压罐固化周期进行预测,通过试验的对比分析,提出KNN预测模型能够更加精确地预测热压罐固化周期,为计划人员制定精确的计划提供重要的数据支撑。今后将进一步优化预测模型,并继续研究热压罐周期的影响因素探究各因素如何影响热压罐固化周期,提高预测热压罐固化周期的精度。

猜你喜欢
热压工装数据挖掘
一起热压三通开裂失效机理研究
改进支持向量机在特征数据挖掘中的智能应用
热压法制备二硫化钼陶瓷靶材工艺研究
某型轴承防错工装的设计
探讨人工智能与数据挖掘发展趋势
热压工艺对涤纶湿法非织造材料断裂强力的影响及优化控制
基于事故数据挖掘的AEB路口测试场景
炫屹.未来家李赟 影院/智能、家装/工装,齐头并进
一种取出塑件残余量的辅助工装
陶瓷纤维摆块式热压卷圆模设计