陈 聪,吴 敏,陈略峰,章 文,杜 胜
(中国地质大学(武汉)自动化学院,湖北武汉 430074;复杂系统先进控制与智能自动化湖北省重点实验室,湖北武汉 430074;地球探测智能化技术教育部工程研究中心,湖北武汉 430074)
在工业现代化进程中,钢板的生产是钢铁工业发展的重要课题之一.随着高强度钢板的广泛应用,各行各业对钢板的质量要求越来越高.淬火是钢铁热处理工艺中的重要组成部分之一,钢板经过辊式淬火机进行淬火后,可以显著提高其强度和硬度.板形是淬火后钢板的关键质量指标,如何稳定得到高质量钢板一直是钢板淬火生产的主要难点.板形的预报可以及时反馈板形信息,操作员可以根据预报结果做出相应的决策,最大程度的降低淬火过程生产低质量钢板的风险.
近年来,很多学者对板带材板形的预报预测方法进行了大量研究.文献[1–2]针对板材扎制过程,将金属塑性变形模型和辊系弹性变形模型进行耦合,通过迭代计算应力分布值来实现板形的预报.文献[3]将前馈神经网络(back propagation,BP)应用于板形预测模型,并根据预测结果和效应矩阵来调节控制器的输出.文献[4–5]在建立板形预测模型时,综合考虑遗传算法、思维进化算法等数据驱动方法以及将传统数学公式与数据驱动方法相结合的方法.文献[6]提出一种基于Takagi-Sugeno(T–S)云推理网络的板形预测模型,采用遗传算法和模拟退火算法对模型参数进行优化.
目前国内外对板形建模的研究主要集中在轧制过程.轧制过程的研究对象是带钢,通常以卷为单位进行生产,板形普遍采用扎后带钢残余应力沿横向板宽方向的分布曲线来表示,板形预测针对的是其中一小段板子的形状,在轧制生产过程中可以通过接触式板形仪对板形进行实时测量.钢板在淬火过程的生产单位以块来计算,在淬火生产中无法对板形进行实时测量,与轧制后的板形表示方法不同,淬火后的板形着重于表示板子的整体形状,一般以缺陷类型和不平直度来表示,因此上述方法很难适用于淬火过程板形预测问题.
利用数据驱动方法对钢板辊式淬火过程板形建模的研究还比较少,板形的预报可以提前反馈生产情况,对操作人员在工况复杂的现场及时调整控制策略具有重要的参考价值.针对复杂工业过程多工况的特点,文献[7]提出一种基于波动区间预测的工况识别(operating mode recognition,OMR)方法,该方法侧重对波动区间的预测以判断工况.文献[8]提出一种多级预测模型来预测烧结过程碳效率,该模型为了提高预测精度,着重对工况的识别及相应子模型的集成.
针对多工况的钢板辊式淬火过程,本文提出一种基于工况识别的板形预报方法,该方法着重于根据识别的工况来选择合适的预报模型,以提高预报精度.首先结合辊式淬火生产过程机理,分析淬火过程数据特性.然后利用聚类算法对工况进行识别,建立各工况下的板形预报模型.最后利用实际生产数据,验证所提方法的正确性与有效性.
本文的贡献主要在于设计了多工况淬火过程的板形预报方案,通过数据展开、参数选择、模糊聚类及支持向量机算法进行板形的预报.其次,在优化板形预报模型参数的时候对粒子群优化算法(particle swarm optimization,PSO)进行了一定的改进,提升了算法的性能和模型的精度.最后利用实际工业运行数据对所提方法进行了验证,表明本文为淬火过程板形预报提供了一套可行的方案.
淬火过程中,钢板连续通过辊式淬火机[9]冷却强度不同的高压(0.8 MPa)、低压(0.4 MPa)冷却区,完成板材淬火工艺过程,其中高压段喷水系统由4种共6组喷嘴组成,低压段喷水系统由3组低压喷嘴组成,如图1所示.
图1 钢板辊式淬火过程Fig.1 Roller quenching process of steel plate
本节首先描述辊式淬火生产过程,然后对淬火过程进行特性分析,在此基础上设计板形预报方案.
钢板在进行淬火过程冷却时,沿长度方向、宽度方向、厚度方向上冷却不均匀,会造成钢板内部温度分布不均匀,进而产生复杂的热应力变化,加上组织应力的叠加,内部应力超过了钢板的屈服极限,使钢板发生翘曲变形[10],出现边浪、龟背、头扣、尾翘等板形缺陷.
除了板形缺陷之外,评价淬火后钢板板形的主要指标是钢板的不平直度,即对一平坦平面的偏离程度.通常将l m(或2 m)直尺放到淬火后钢板上表面,测量直尺与表面之间的缝隙距离即可得出不平直度.实际生产现场考核板形的主要指标为不平直度,根据板形缺陷下的不平直度及其阈值可将板形质量分为以下两种:
1) 合格:不平直度小于阈值;
2) 不合格:不平直度大于阈值.
实际淬火过程中,操作员对淬火钢板的规格尤其对厚度非常敏感,在厚度一定的情况下,通过控制冷却速度来控制钢板中心到表面的温度梯度,避免发生板形缺陷.因此,为了获得合格的板形,操作员会做出不同的控制决策以满足不同的生产需求,使工况发生变化.
淬火后钢板的板形实质上取决于淬火过程中钢板的冷却速率和冷却均匀性,而钢板由于其内部结构及构成存在一定的区别,不同钢板在淬火中完成马氏体相变的临界冷速不同,即对淬火冷却过程中冷却速度有不同的要求.淬火过程钢板产品种类规格繁多,操作人员往往会根据钢板的规格调整淬火机的工作状态,导致淬火机经常在多种不同工作状态下运行,所以淬火过程难免表现出多工况的特性.
钢板的淬火生产是一个批次生产过程,一个批次里会生产数十个钢板.但板形很难实现在线测量,通常需要在该批次钢板全部淬火结束后,经过检测人员的抽样测量得到该批次钢板淬火后的板形质量.因此,板形质量具有严重的时间滞后性,无法及时反馈给过程控制系统以及操作员,这很大程度上阻碍了淬火过程板形的有效控制.
淬火过程是温度、组织、应力/应变3方面交互作用的高度非线性过程,由于淬火过程涉及高温,欲对钢板实物的温度、组织、应力/应变进行在线实时测量,在当前技术条件下是非常困难的.因此,可以通过各种传感器在线采集淬火机的操作参数和钢板的状态参数等过程变量信息,板形的质量往往可以体现在过程变量的变化中,测量的过程变量如表1所示.
表1 过程测量变量Table 1 Process variables
淬火过程中,一个批次钢板的过程变量数据可以用一个三维矩阵X(I ×Jx×K)表示,即在一个批次中有I个钢板生产,在每个钢板淬火生产中对Jx个过程变量进行K次测量.钢板的板形质量数据用一个二维矩阵Y(I×Jy)表示,其中Jy表示钢板的板形.为了建立三维过程数据和二维质量数据之间的关系,必须对三维矩阵进行合适的预处理,通常将三维过程数据沿钢板生产方向展开为二维矩阵X(I ×KJx),将时间和变量两个方向上的数据合并在一起,每一行包含了该钢板淬火生产中所有的过程数据[11],展开方式如图2所示.
图2 三维矩阵的展开Fig.2 Expansion of three-dimensional matrix
在实际生产过程中,由于干扰的存在和工况的改变,钢板淬火过程轨迹的长度会发生变化,造成过程变量的数据不等长特性.鉴于同一个工况过程数据长度相差不大的情况,本文采用“最短长度法”来处理不等长数据.
考虑到淬火过程对钢板规格十分敏感,本文提出一种基于工况识别的板形预报方法,其结构如图3所示.首先对淬火过程采集到的原始过程变量进行数据预处理,对其进行工况识别,然后根据数据相关性分析选择模型的输入变量,通过所识别工况的板形预报模型,输出板形质量.
图3 板形预报方法结构Fig.3 Structure of flatness prediction method
在本文中,首先使用“最短长度法”处理原始数据并进行展开,运用其中钢板规格数据和模糊C均值(fuzzy C-means,FCM)聚类算法对工况进行识别,然后采用Spearman相关性系数选择合适的输入变量,利用支持向量机(support vector machine,SVM)建立各工况下的板形预报模型,并利用改进的粒子群优化算法(improved particle swarm optimization,IPSO)优化模型参数,提高模型精度.
在线应用时,在一个批次的钢板淬火生产过程中,需要采集一个钢板生产过程的完整数据,识别该钢板淬火过程所属工况后,调用对应工况的板形预报模型进行淬火过程板形质量的预报.
本节针对淬火过程多工况的特点,对其进行工况的识别,之后通过相关性分析选择合适的过程变量作为模型的输入,利用智能算法建立板形的预报模型.
在钢板淬火过程中,操作员会非常注意淬火钢板的规格,为了避免发生板形质量不合格的情况,会根据钢板规格来调整淬火机的工作状态,判断淬火过程的工况.但钢板规格众多,对工况的识别主要依靠操作员的人工经验,识别结果的可靠性较低.因此,研究淬火过程的工况识别为板形的预报甚至控制奠定了重要的基础.
本文选取的聚类特征变量为钢板的厚度、宽度、长度3个参数,在选择聚类算法对工况进行识别时,引入Silhouette系数[12]来评价聚类效果,经过多次实验表明,相较于K-Means聚类算法,FCM算法得到的Silhouette系数平均值更好,方差更小,由此认为在本文中FCM算法的聚类性能略优于K-Means算法,因此本文采用FCM算法来对淬火过程工况进行识别[13].FCM算法结合模糊理论,通过不断迭代更新聚类中心,计算钢板对工况的隶属度,使目标函数最小化,实现淬火过程工况的聚类.FCM的目标函数如下:
其中:c为淬火过程工况总数,ci为每个工况的聚类中心,xj表示第j个钢板,m为加权指数也称平滑因子,uij表示钢板xj属于i类工况的隶属度,并满足如下的约束条件:
采用拉格朗日乘数法将约束条件代入目标函数,目标函数获得极小值的必要条件是
FCM算法通过不断迭代计算目标函数,直至满足收敛条件得到最优解.在线应用时,通过式(3)的隶属度函数计算该钢板对每个工况的隶属度即可识别该钢板淬火过程所属的工况.
为减少计算时间并排除不相关的变量,本文采用Spearman相关分析方法选择输入变量.对淬火过程变量x[x1x2··· xn]和板形y[y1y2··· yn],它们之间的Spearman相关性系数为
某钢铁企业实际淬火现场,淬火机冷却系统的喷嘴主要是高压段后4组喷嘴处于工作状态.另一方面,由于同批次钢板的种类规格类似,淬火过程处于同一种工况下,辊速和辊缝控制精度较高,往往保持不变,钢板初始温度和冷却水流量会发生波动.因此,本文选择高压段后4组上下喷嘴水流量和钢板初始温度这9组工艺参数进行相关性分析.通过计算主要过程变量与板形的Spearman相关性系数,如表2所示.可以发现钢板初始温度、冷却系统第3,5组上下喷嘴水流量与板形的相关系数较大.由此可以认为,{T,是与板形相关性最大的5个过程变量,将其作为预报模型的输入变量.
综合考虑淬火过程影响板形的过程变量,选择了5组过程变量{T,作为板形预报模型的输入,选择板形质量作为其输出.由于SVM核心思想简单,适用于小规模样本,且具有优秀的泛化能力,本文采用SVM来建立板形预报模型,并利用IPSO算法对其参数进行优化[14].
SVM本质上是一个二分类的算法,类别可以用y[y1y2··· yn]来表示,表示预报板形质量.对于多维空间的输入样本x[x1x2··· xn],每个元素表示输入参数包括5组过程变量,它寻找一个最优的分类超平面wTx+b0,其中wT为超平面的法向量,b为偏移量,使得两类样本在这个超平面下的分类间隔2/‖w‖最大,得到最好的分类效果.此时相当于求解‖w‖2/2的最小值,在线性不可分的情况下,可以将上述问题转换为以下凸二次规划问题:
其中:c为惩罚参数,表示对误差的惩罚程度,ξ为松弛变量.通过引入拉格朗日乘子法,用Karush-Kuhn-Tucker(KKT)条件求解对偶问题等方法进行求解.对于非线性分类问题,通过引入核函数,将数据映射到高维空间,解决在原始空间中线性不可分的问题,本文选用的核函数为径向基函数:
其中g为核函数参数.引入核函数后,非线性分类问题可以转化为以下对偶优化问题:
其中αi和αj为拉格朗日乘子.对应的非线性分类决策函数为
SVM的惩罚参数c和核参数g的取值直接影响其分类精度,同时决定了其学习能力和泛化能力.因此,本文采用IPSO算法对SVM的惩罚参数c和核函数的参数g进行优化,提高板形预报模型精度.
PSO算法源于对鸟群捕食的行为研究,通过设计一种无质量的粒子来模拟鸟群中的鸟,粒子只有速度和位置两种属性.粒子群中的所有粒子都有一个适应度函数,判断当前位置的好坏,根据当前个体极值和当前整个粒子群全局最优解来更新自己的速度和位置[15–16],本文中粒子的位置表示SVM模型的惩罚参数c和核参数g,速度表示其每次迭代的变化程度,适应度函数为SVM模型的预报错误率
其中:pr为预报正确的样本数,pn为样本总数.粒子在每次迭代后,确定速度和位置的公式如下所示:
其中:i1,2,···,N,N是群中粒子的总数;vi是粒子的速度;w为惯性因子;random()是介于(0,1)之间的随机数;c1和c2是学习因子,通常两者相等;xi是粒子的当前位置;pbesti为每个粒子的个体极值,gbesti则为全局最优解.
PSO算法在求解优化问题时,表现出较好的寻优能力,但传统的PSO算法容易陷入局部最优,导致结果误差较大.由式(11)和式(12)可知,PSO算法的性能决定于w,c1,c2的取值,文献[17]采取一种惯性因子非线性变化、学习因子随机取值的方式来对粒子进行更新,以此来对PSO算法进行改进.本文为了克服算法易陷入局部最优即“早熟”的现象,引入变异因子α来对粒子进行重置,每次迭代寻优更新位置时,粒子有一定的概率,即在random()小于α时进行初始化.同时为了提高全局搜索能力和局部搜索能力,采用惯性因子线性递减变化的方式来对粒子位置进行更新[18],搜索前期惯性因子较大,有利于在全局范围的寻优,后期惯性因子较小,着重加强局部范围的搜索,惯性因子更新公式如下:
其中:t为当前迭代次数,tmax为最大迭代次数,wmax为惯性因子上限,wmin为惯性因子下限.
在优化模型参数时,设置PSO算法的迭代次数为50,粒子总数为40,学习因子c1和c2等于2,惯性因子w的取值范围为[0.1,1],变异因子α为0.1,并与传统PSO算法、文献[17]改进的PSO算法进行了对比,优化过程的适应度变化情况如图4所示.从图中可以看出本文的IPSO算法比传统的PSO算法、文献[17]改进的PSO算法具有更好的收敛效果,说明优化性能更好,验证了本文针对PSO算法改进的有效性.
图4 适应度变化曲线图Fig.4 Fitness change curve
为了验证本文所提方法的有效性,本文从某钢铁企业采集了近一个月内77个批次共计941组钢板的淬火生产数据,选取钢板的厚度、宽度、长度为聚类特征变量,利用FCM算法进行实验.将其中51批次的数据作为训练集进行实验,确定聚类的类别数和聚类中心,发现当聚类的簇数为4时,聚类效果较好;利用剩下的26个批次的生产数据进行测试,其结果如图5所示,表明可以将这77批次钢板淬火过程的工况划分为4类,且从图中的数据点分布情况来看,利用FCM对生产数据进行聚类是有必要的.根据聚类结果,共需建立4个不同工况的IPSO–SVM板形预报模型.考虑到FCM算法聚类效果依赖于初始聚类中心,易陷入局部最优的现象,可通过改进初始聚类中心的选取规则和目标函数来优化聚类效果.
图5 聚类结果Fig.5 Clustering results
本文选取工况识别所用的全部941组数据,采用基于过程数据的质量预测方法中常用的偏最小二乘法(partial least squares,PLS)[19]进行对比,对基于PLS的板形预报模型(PLS)、基于SVM 的板形预报模型(SVM)、基于工况识别和SVM 的板形预报模型(OMR–SVM)、基于工况识别的PSO–SVM板形预报模型(OMR–PSO–SVM)、基于工况识别的IPSO–SVM板形预报模型(OMR–IPSO–SVM)进行了实验.同时为了提高实验结果的可信度,采用交叉验证的方法进行训练和测试,预报结果如表3至表8所示.表3至表7中混淆矩阵的比例值依次为p1,p2,p3,p4,p1(p4)表示预报模型对板形质量合格(不合格)的查准率,表8中的精度指的是预报模型对两个板形质量的平均查准率计算公式如下:
表3 PLS预报结果混淆矩阵Table 3 Confusion matrix of PLS prediction result
表4 SVM预报结果混淆矩阵Table 4 Confusion matrix of SVM prediction result
表5 OMR–SVM预报结果混淆矩阵Table 5 Confusion matrix of OMR–SVM prediction result
表6 OMR–PSO–SVM预报结果混淆矩阵Table 6 Confusion matrix of OMR–PSO–SVM prediction result
表7 OMR–IPSO–SVM预报结果混淆矩阵Table 7 Confusion matrix of OMR–IPSO–SVM prediction result
表8 预报精度对比Table 8 Comparison of prediction accuracy
其中:TP表示预报板形质量合格且实际板形质量合格的样本数,FP表示预报板形质量合格但实际板形质量不合格的样本数,FN表示预报板形质量不合格但实际板形质量合格的样本数,TN表示预报板形质量不合格且实际板形质量不合格的样本数.
从表中可以看出,在没有工况识别的情况下,PLS模型和SVM 模型预报精度较低,分别为75.24%和86.29%,相比之下,根据本文提出方法建立的板形预报模型精度更高.在利用IPSO算法优化模型参数之后进一步提高了预报精度,精度达到了96.81%,说明该方法能够在淬火过程中较准确地预报板形质量.
为了进一步分析本文所提方法的可行性,在某钢铁企业淬火生产现场的控制系统中加入板形预报功能测试,其系统结构图如图6所示.基础自动化层通过传感器从工业现场收集淬火过程生产数据,并通过工业以太网传输到优化控制层.在淬火过程控制系统中通过相关板形预报模型的计算,将预报结果存储数据库中,并提供给现场操作人员,以便在出现生产板形不合格情况时及时调整工艺参数,尽可能避免一个批次内接下来生产钢板得到不合格的板形,提高板形的合格率.
图6 淬火过程控制系统结构图Fig.6 Structure of control system in quenching process
本文考虑到淬火过程多工况等特性,提出了一种基于工况识别的板形预报方法.采用FCM算法实现对淬火过程工况的识别,在此基础上建立了各工况下的IPSO–SVM模型,通过模型的计算,预报当前板形质量.利用工业生产数据进行实验,验证了该方法具有较高的预报精度,可以实现钢板淬火过程中板形质量的准确预报,为淬火生产控制决策提供参考依据.在未来的研究中,将参考扎制过程板形预测的相关成果,结合基于过程数据的质量预测方法,继续研究淬火过程板形建模以及控制方法,并将其应用于实际淬火过程,提高钢板的板形质量.