约束多目标粒子群算法在烧结配矿优化中的应用

2022-06-21 08:10王耀祖全
控制理论与应用 2022年5期
关键词:约束条件配料约束

冯 茜 李 擎 王耀祖全 威

(1.北京科技大学自动化学院,北京 100083;2.华北理工大学机械工程学院,河北唐山 063210;3.北京科技大学工业过程知识自动化教育部重点实验室,北京 100083;4.北京科技大学人工智能研究院,北京 100083)

1 引言

近年来,我国钢铁行业得到持续发展,据世界钢铁工业协会统计,2019年我国粗钢产量达到9.9亿吨,约占全球钢铁产量的52.9%,在钢铁行业迅速发展的同时给铁矿石等原材料亦提出更高的要求.然而由于我国的铁矿石品位普遍偏低,采选成本高,铁矿石开采利润持续压缩,导致国内铁矿石产量逐年下降.截至2019年,中国铁矿石产量8.44亿吨,同年中国累计进口铁矿石10.68亿吨,由此可见,我国钢铁对进口铁矿石具有较高的依赖度.以配料为基础的铁矿烧结是高炉冶炼的基础环节,烧结矿性能对高炉炼铁的品质具有极其重要的影响,通过不同品质铁矿粉的合理搭配,能够控制烧结矿中的化学成分,对烧结矿品质的提高具有重要意义.

传统的钢铁生产中,一般是根据配矿原料和辅料的实际情况,从积累的配矿方案中进行挑选,当配料成分变化频繁或者具有特殊的成分要求时,很难快速准确地得到合理的原料配比.为了尽可能结合不同铁矿石资源特性,实现铁矿资源的化学成分、烧结性能及价格的优势互补,改善烧结矿的技术经济指标及冶金性能,并最终降低高炉铁水的成本,不同种类矿石的优化搭配已经成为钢铁行业亟待解决的技术难题.

针对烧结配矿优化问题,国内外专家学者进行了多方面的研究.传统优化方法主要有单纯形法、线性规划法、专家优化法等,这些方法在实际应用中,要么受限于解决线性问题,要么具有一定的主观性.随着烧结系统研究的深入,配矿模型中涉及的变量维度、约束数目以及非线性因素不断增多,这就导致了优化难度的逐步提升,为此,一些研究人员应用群智能算法进行烧结配矿优化.曹跃等人[1]将聚类算法和组合优化相结合,解决铁矿预配料调度问题.Wu等人[2]以成本和SO2排放为优化目标,采用线性规划和遗传粒子群算法作为求解方法.Wang等人[3]提出了烧结配料级联优化框架,应用改进的人工免疫算法进行质量和能源指标的约束优化.Shen[4]融合线性规划法和非线性规划法,解决实际生产中的多目标约束优化问题,得到了最佳烧结矿配比方案.文献[5]应用层次分析法确定多个目标函数的权重,转换为单目标问题后,再使用线性规划法进行优化.Wu等人[6]基于能量流分析进行焦比约束优化,减少了烧结过程中CO2的产生.

约束处理技术中应用最为广泛的是Deb提出的约束支配准则[7],该准则偏好于可行解,容易忽略不可行解信息.华长春等人[8]针对成本和二氧化碳排放量构成的二目标问题,以约束支配准则为约束处理方法,采用非支配排序多目标遗传算法进行优化,获得了分布均匀的Pareto最优解集.为了平衡优化过程中的开发和探索之间的关系,伍铁斌等人[9]应用指数函数收敛因子对鲸鱼优化算法进行改进,同时引入旋转操作精英学习算法增强局部寻优能力,基于Deb准则进行烧结配料优化.文献[10]在选择性激光烧结过程中,建立了能耗和材料成本的约束多目标模型,并应用NSGA-II(non-dominated sorting genetic algorithm II)进行求解,取得了不错的优化效果.一些研究人员从约束处理机制上进行改进,采取目标约束融合方法[11]、自适应ε截断策略[12]等技术.为了平衡可行解与不可行解的关系,还有一些文献提出双种群策略[13]、双外部存储集[14]、多外部存储集[15]方法进行约束优化,有效防止算法陷入局部最优,维护种群多样性.

针对烧结配矿优化问题,研究人员大多采用传统约束处理技术,从搜索机制入手,与各种群智能算法相结合进行优化.本文从约束处理机制方面进行改进.选取混匀料成本和铁含量两个重要指标作为目标函数,将区域划分策略与评价准则相结合,提出基于区域划分的约束多目标粒子群算法(constrained multiobjective particle swarm optimization algorithm based on region division,RD-CMOPSO).为了保持良好的种群多样性,在目标空间中,基于角度自适应划分区域;采用双外部存储集机制,结合区域分布和评价准则进行外部存储集的维护;在此基础之上,选取全局最优粒子.通过在标准测试函数集中的测试,展现出改进算法的有效性以及良好的性能.最后,使用算法进行烧结配矿优化,并结合实际情况选择出最合理的配料方案.

2 烧结配矿数学描述

2.1 烧结配矿的要求

实际生产中,烧结配矿需要兼顾铁矿石资源的固有特性、混匀料烧结性能、高炉生产需求、高炉入炉有害元素控制要求和成本控制要求等因素.在满足基本生产需求和控制有害元素含量的条件下,结合现有资源,合理调整物料间的配比,以实现成本最低.

2.2 烧结配矿数学模型

2.2.1 化学成分的计算

1) 扣除水分后原料配比.

其中:ua为第a种原料的配比,g为烧结矿原料种类,αa(a=1,2,···,g)为第a种原料中所含水分的百分比,为扣除水分后第a种原料的配比.

2) 扣除水分后各成分百分比.

其中:yb为原料中第b种化学成分的百分比,h为烧结矿原料中化学成分种类,yab(b=1,2,···,h)为第a种原料中第b种化学成分的百分比.

3) 扣除水分后各化学成分百分比.

Yb(%)为扣除水分后第b种化学成分百分比.

4) 扣除水分和烧损影响后各化学成分含量.

其中:(%)为扣除水分和烧损影响后各化学成分百分比,Y烧损(%)为扣除水分后烧损含量百分比.

2.2.2 约束条件

约束条件主要考虑目标约束和决策约束两个方面.目标约束指的是实际标准和需求,具有一定的偏好.而决策约束指的是决策空间中符合约束条件的可行解,即某些化学成分的含量要求,这些约束条件对于最终的钢材品质具有非常重要的意义.

1) 目标约束条件.

①燃料和熔剂的百分比指燃料和熔剂占原料总质量的百分比.

其中:ur(r=1,2,···,f)为原料中第r种燃料或熔剂占原料总质量的百分比,f为烧结矿原料中燃料和熔剂种类;OLr,OUr分别为第r种燃料或熔剂决策约束条件的下限、上限.

②各成分配比之和.

2) 决策约束条件.

①烧结成分约束.

其中:(%)为扣除水分和烧损影响后第b种化学成分的约束条件;DLb,DUb分别为扣除水分和烧损影响后第b种化学成分决策约束条件的下限、上限.

②碱度约束.

碱度为扣除水分和烧损后CaO与SiO2两种成分含量百分比的比值.

2.2.3 目标函数

在满足烧结原料配比和烧结成分含量的前提下,通过优化原矿石中各种原料的比例,使得混匀料的成本最低,同时铁含量相对较高.

1) 混匀料的成本.

其中pricea表示第a种原料的价格.

2) 铁含量.

选取混匀料成本和铁含量两个重要指标作为目标函数时,全铁含量的提升往往以混匀料成本的增加为代价,因此,能够使得两个目标同时达最优的原料配比是不存在的.配矿优化的目标是在满足约束条件的前提下,应用约束优化策略求取兼顾两个相互矛盾目标的折中解.粒子群算法作为一类收敛性能好、搜索效率高的群智能算法,与有效的约束处理技术相结合,在优化领域已经获得了很多成功的应用.

3 改进的约束多目标粒子群优化算法

3.1 粒子群算法

自然界中,鸟类以群体方式协作觅食,受此启发,Kennedy和Eberhart[16]提出了粒子群优化算法(particle swarm optimization,PSO).粒子群算法被用来处理多目标优化问题,称为多目标粒子群算法(multi-objective particle swarm optimization,MOPSO).

假设决策空间中,粒子群规模为N,当前迭代次数为t,种群中第k个粒子的位置为xk(t)=[xk,1(t)xk,2(t)··· xk,d(t)],速度为vk(t)=[vk,1(t)vk,2(t)··· vk,d(t)],粒子k历史最优位置为pbestk(t)=[pk,1(t)pk,2(t)··· pk,d(t)],整个种群中的最优粒子在第d维历史最优位置为gbest(t)=[g1(t)g2(t)··· gd(t)].粒子的速度、位置更新公式为

其中:r1,r2是均匀分布于[0,1]区间的随机数,增加随机性;c1,c2为在[0,2]取值的加速度常数,控制学习步长;ω为惯性权重,调节上次的速度对当前速度的影响程度.

处理约束多目标问题,既要兼顾多个目标,平衡多样性与收敛性,又要采用有效的约束处理技术,协调目标与约束之间的关系.而实际应用过程中,不同的背景条件下往往会伴随着一些十分苛刻的约束条件限制.由于粒子群算法在无约束优化过程中的出色表现,研究人员以其为搜索机制进行约束优化.

3.2 基于区域划分的约束多目标粒子群算法

3.2.1 归一化

在约束优化过程中,目标函数之间的差异可以通过标准化处理来进行均衡.个体x归一化目标函数为

其中:N为种群规模,fmin和fmax分别为当前种群中所有个体目标函数的最小值与最大值.经过归一化后,目标值和约束违约度的取值范围均为[0,1].

个体x在第s个约束条件上的约束违反程度为

其中:约束条件共为q个,不等式约束为p个,等式约束为q −p个.一般将等式约束转化为不等式约束,δ是等式约束的容忍参数(根据需要精度设定,通常取0.001或0.0001).

种群中第j个粒子对第s个约束条件的违反程度最大值定义为

考虑到多个约束条件之间的差异,个体x的约束违约度定义为该个体对每个约束条件违反值的平均值

3.2.2 基于自适应角度区域划分的约束支配准则

Deb准则中,不可行解之间进行比较,违反约束程度低的个体更优;可行解与不可行解进行比较,可行解更优;可行解之间的比较按照无约束优化处理,非支配等级高的解更优.为了获得最优帕累托前沿(pareto front,PF),不仅需要通过可行解对可行区域内部进行搜索,还应该利用部分不可行解信息,加强可行区域与不可行区域交界区域的探索.

对于比较复杂的约束优化问题,优化前期,可行解占所有解中的比例很低甚至不存在,为了发现可行区域,应该增强全局开发能力,提高种群多样性.优化后期,当可行解达到一定比例时,应在加强局部搜索的同时防止陷入局部最优.仅仅依靠可行解的引领或者变异,会有一定的局限性.如果能够从不可行解中提取有用信息并加以利用,能够促进优化进程.

本课题组前期将自适应角度区域划分策略用于多目标优化取得了良好效果,在此基础之上,将该策略引入约束优化过程中.在目标空间中,基于角度进行自适应区域划分,将粒子的区域分布与评估准则相结合,进行局部区域粒子的筛选.保留区域内最优解和部分不可行解,以促进可行区域的开发.

按照评估准则进行粒子选取时,对于可行解,仅根据非支配等级的比较判断优劣,容易忽略一些不存在非劣解的可行区域的探索,而这类解的保留有利于维护多样性,为进一步加强局部搜索提供可能.如图1所示,粒子A与粒子B均位于可行区域中,而粒子A的非支配等级高于粒子B,通常情况下粒子B会被删除.但是,将区域划分策略融入评估准则后,粒子B如果是当前区域的局部最优解,就会被保留,这种方式有助于加强局部区域探索.

图1 目标空间中自适应角度区域划分示意图Fig.1 Schematic diagram of adaptive angle region division in target space

对于不可行解,粒子C、粒子H均位于不可行区域,此时会将约束值大的粒子删除,但粒子C、粒子H分别位于不同的角度区域,结合粒子的区域分布情况,两个粒子都会被保留,这部分粒子的存储将会促进种群向最优前沿收敛.可行解与不可行解之间的比较也不再仅以可行解优先为评判标准,而是与个体所在区域共同决定粒子的取舍.位于同一区域的粒子C、粒子K以及位于不同区域的粒子H、粒子K在进行比较时,均有机会被保留下来,有利于约束边界附近的进一步探索.对于每一个角度区域,可行解和部分不可行解的保留,有利于更大限度地维护多样性.随着优化进程的深入,可行解数目不断增加,划分区域随之增多,当每个区域中既包含可行解又存在不可行解时,既能够避免可行区域的过度探索,又有利于约束边界附近区域的搜索.因此,采取自适应方式划分区域.

根据两个外部存储集中粒子的数目,自适应调整角度,划分目标空间.初始化后,随着迭代次数的增加,外部存储集中的粒子数目会逐渐变多,划分的区域也会随之增多,直至达到区域上限后,停止划分.整个目标空间划分为Di个区域,根据当前外部存储集中的粒子个数进行自适应角度区域划分,公式如下:

其中:D为初次划分区域个数;i为划分次数,imax是区域划分最大次数;Narc为外部存档集中粒子个数,其最大容量为[Narc]max.

3.2.3 双外部存储集维护策略

为了能够在保持种群多样性的同时,提高收敛速度,接下来,将各个区域中粒子的数量与评估准则相结合,共同进行外部存储集的维护.外部存储集由外部存储集1(arc-1)和外部存储集2(arc-2)构成.其中,arc-1用来存储当前PF中的可行解;arc-2则用来保留有价值的解,包括当前PF中的不可行解和每个角度区域内的局部最优解.外部存储集中粒子个数总和作为目标空间自适应角度划分的依据.

其中:Narc1为arc-1中粒子个数,最大容量为[Narc1]max;Narc2为arc-2中粒子个数,最大容量为[Narc2]max.

自适应区域划分阶段,每个区域按照评估准则,得到局部PF并储存于arc-2中,此时,arc-2中有可能包括可行解或者不可行解.区域划分的优势在于能够充分保留每个局部区域中的最优解,特别是一些不可行解.接下来,将粒子的区域分布情况与约束支配准则相结合,对arc-1与arc-2中粒子进行信息交互,获得全局PF.arc-1保留当前PF中可行的非支配解,对于不是非劣解的粒子,如果是所在区域的局部最优解,无论是否为可行解,都被保留于arc-2中.若区域个数已经达到划分上限,arc-1的维护策略为:每个角度区域中最多存在一个可行的全局最优解,多余的粒子采用随机方式删除.arc-2的维护策略为:每个角度区域中最多存在一个局部最优解,若arc-1中在此区域已有粒子,则保留约束值最小的粒子;若arc-1中不存在位于该区域的粒子,则保留局部最优解,随机删除多余粒子.

基于区域划分的双外部存储集策略,一方面扩大了搜索范围,有利于维持种群多样性,另一方面提取了不可行解的有用信息,加速引导种群粒子向约束边界收敛.同时,arc-1和arc-2也为下一步全局最优粒子的选择提供了优秀的储备.

3.2.4 最优粒子的选择

全局最优粒子(global best particle,gbest)的选择是粒子群算法进行多目标优化时的难点,既要进行多个目标值之间的衡量,又要以满足约束条件为必要前提,多重标准之下,gbest选择会愈发困难.

结合目标空间中区域自适应划分方法以及双外部存储集维护机制,提出了gbest选择方法.自适应区域划分阶段,从arc-1中位于“稀疏”区域(粒子个数少的区域)的粒子中,随机选取gbest,若两个区域粒子个数相同,则随机选择一个区域进行上述操作.为了加强多样性,对于arc-1中不存在粒子的区域,随机选择相邻区域中粒子为gbest引导种群更新.若不存在最优可行解,即Narc-1=0,则arc-2中约束值最小的粒子被选作gbest.

3.2.5 RD-CMOPSO伪代码

RD-CMOPSO伪代码见表1.其中,n为迭代次数,in-为初始化粒子位置,v为粒子速度.

表1 RD-CMOPSO伪代码Table 1 RD-CMOPSO pseudocode

4 实验测试

4.1 测试函数

为了验证算法的可行性和有效性,使用文献[17]所提出的CTP系列基准测试函数集对提出的RDCMOPSO算法来进行测试.这些测试函数均为两目标并且约束涉及非线性不等式,能够从不同的角度对约束优化算法进行评估.CTP系列测试问题具有决策变量的维度可变,约束优化的最优PF为不连续、离散线段、离散点,解分布具有欺骗性,极易陷入局部最优等特点.

4.2 性能指标

为探究各多目标约束算法的性能,本文采用两种性能度量指标来衡量解的质量.第1个度量指标为反向世代距离[18](inverted generational distance,IGD),该指标计算真实PF到求得PF的平均距离,综合反映了多样性和收敛性,IGD值越小,解集质量越好.

第2个度量指标为超体积指标[18](hypervolume metric,HV),该指标计算给定参考点与求得PF所围成的体积,HV值越高,所获解集越靠近真实PF.

4.3 对比算法及参数设置

本文选取两类约束多目标优化算法来求解CTP标准测试函数问题.第1类为经典的约束优化算法:Deb等[7]提出的以约束占优准则为约束处理技术的NSGA-II算法,Woldesenbet等[20]将改进的适应度函数与Pareto支配相结合提出的MCMOEA算法.鉴于RDCMOPSO以粒子群算法为搜索机制,第三种比较算法为Ceollo和pulido[21]提出的基于网格划分和约束支配法则的CMOPSO算法.

第2类比较算法为较新的约束优化算法:王珊珊等[22]以Pareto支配和ε约束支配相结合为约束处理方法,提出的基于双外部存储集机制的动态约束多目标骨干粒子群(cBBMOPSO)算法.Nshimirimana等[23]以惩罚函数法为约束处理机制,提出的无需粒子群参数调节的NF-MOPSO算法.毕晓君等[12]以自适应ε截断策略为约束处理技术提出的约束多目标优化(ε-ATS)算法.

对比算法的参数设置参考原始文献,调至最佳效果.RD-CMOPSO算法在CTP1-CTP3测试函数中学习因子c1=0.8,c2=1.2,惯性权重ω=0.75.在测试函数CTP4,CTP5中,学习因子c1=0.9,c2=1.1,惯性权重ω=0.60.在测试函数CTP6,CTP7中,学习因子c1=0.95,c2=1.05,惯性权重ω=0.50.arc1和arc_2最大规模均为100.

4.4 实验结果及分析

应用RD-CMOPSO求解CTP1-CTP7测试函数问题得到的近似PF,如图2所示.

图2 RD-CMOPSO在CTP测试函数集中获得的PFFig.2 PF obtained by RD-CMOPSO on CTP

为公平起见,对比算法的初始化状态相同,种群规模均为100,最大的迭代次数均为500次.表2和表3分别给出了独立运行30次后,7种算法在7个测试函数上IGD和HV两个指标的均值(Mean)和标准差(Std).7种算法中最好的结果用黑体标出.

从表2可以看出,对于CTP函数测试集中的7个约束问题,RD-CMOPSO和其他6种算法的仿真结果相比,全部获得了最优均值,这说明本文的算法求得的最优解集分布更加均匀,能够在保证收敛性的同时具有良好的多样性.在标准差的比较中不难发现,所提出的算法具有一定的优势,说明区域划分策略与约束支配准则结合的约束处理技术,能够获得较稳定的优化效果.

表2 RD-CMOPSO与6种算法IGD指标的均值和标准差比较Table 2 Comparison of Mean and Std of IGD between RD-CMOPSO and six algorithms

表3中HV指标综合反映了算法的性能,本文算法获得均值和标准差均优于其他6种算法,这表明无论最优PF为连续线段、离散线段还是离散点,算法所求得的最优解集更加接近真实PF,有效避免了算法陷入局部最优,展现了较好的全局开发和局部搜索性能.因此,RD-CMOPSO能够获得良好的约束优化效果,具有一定的竞争力,是处理约束多目标优化问题的一种可行方法.

表3 RD-CMOPSO与6种算法HV指标的均值和标准差比较Table 3 Comparison of Mean and Std of HV between RD-CMOPSO and six algorithms

5 RD-CMOPSO在烧结配矿中的应用

5.1 烧结原料基本信息

应用某钢厂的烧结配料实例(与青钢一烧对应4号高炉烧结原料相同)中的原料信息进行配矿优化.烧结矿的原料为铁矿粉(混匀矿、塞拉利昂),燃料(煤粉、焦粉),熔剂(生石灰粉、轻烧白云石).

根据第2.2节建立的烧结配矿模型,以混匀料的成本和铁含量为优化目标,应用RD-CMOPSO进行烧结配矿优化.通过优化矿粉A、矿粉B、焦粉、煤粉、生石灰粉、轻烧白云石的配比,使得混匀料的成本最低、同时铁含量相对较高.

5.1.1 烧结原料配比要求

烧结过程中,各原料配比要求如表4中2-7列所示.其中,矿粉的百分比指某种矿粉占矿粉总质量的百分比,燃料和熔剂的百分比指燃料和熔剂占原料总质量的百分比.

表4 烧结原料配比及化学成分限制Table 4 Limitation of sintering raw materials proportion and chemical composition

5.1.2 烧结成分约束

传统的钢铁生产中,根据现有各种配矿原料和辅料的实际情况,从积累的配矿方案中进行挑选,当配料成分变化频繁或者具有特殊的成分要求时,仅依赖人工经验很难快速准确地计算出合理的原料配比.表4中8~14列给出了钢铁企业实际生产中烧结矿成分的质量指标,碱度的限制条件由式(8)给出.

为了保证高炉进料质量,除了需要根据实际供应能力对原料的配比进行调整之外,还需要确保各重要化学成分符合生产要求,必须将其控制在严苛的范围之内,否则容易导致降低烧结矿的整体质量,甚至影响最终铁水的品质.

5.2 应用效果及分析

将RD-CMOPSO与NSGA-II,CMOPSO,MCMOEA,cBBMOPSO,ε-ATS,NF-MOPSO分别应用于烧结配矿过程中进行约束优化,得出以下配比方案,如表5所示.可以发现,7种算法均能够获得符合配比要求的方案.

表5 烧结配料优化核算配比结果Table 5 Accounting result of sintering proportioning optimization

将配矿方案应用于模型中,得到烧结配料优化核算结果见表6.

表6中,第2-9列得出了各算法求得的配比方案得到的各成分含量百分比,第10列是配料成本.可以发现,随着混匀料的成本的降低,铁含量会受到一定程度的影响,以成本和铁含量为优化目标时,按照7种算法求取的配比方案进行配料,各成分含量均能够满足成分约束条件.RD-CMOPSO与6种对比算法得到的优化结果相比较,能够获得更低的成本.在满足各项约束条件的前提下,RD-CMOPSO与NSGA-II,CMOPSO,MCMOEA,cBBMOPSO,ε-ATS,NF-MOPSO相比,每吨能够降低配料成本5.6488元、4.9161元、3.9800元、3.2605元、2.4844元、2.3708元.

表6 烧结配料优化结果Table 6 Sintering proportioning optimization results

上述算法在某钢厂230 m2烧结机上进行应用,相比于优化前,每吨可节约成本0.86元(扣除烧结过程中物料化学成分偏析、设备损耗对理论计算的影响),按照2019年烧结总产量632.52万吨进行计算,为企业减少投入543.97万元.生产应用结果表明,本文提出的算法应用于烧结配矿过程中,降低了成本,提高了经济效益.

6 结论

本文提出了一种基于区域划分的约束多目标粒子群算法,将角度区域划分策略引入约束评估准则,提取不可行解信息,另外,双外部存储集的建立,保留了部分局部最优解,维护了种群多样性.实验测试结果表明,该算法能够获得分布均匀的帕累托前沿,展示了良好的多样性.结合铁矿石原料配比、化学成分含量约束多等特点,在进行烧结配料优化时,考虑了水分和烧损所带来的影响,使优化配置方案更好服务于实际生产活动.优化结果显示,在满足目标约束和决策约束条件下,提出的算法能够兼顾成本以及全铁含量两个目标值,获得良好的优化结果,有效地解决了钢铁冶炼过程中烧结配料优化问题,有利于经济效益的提高.

猜你喜欢
约束条件配料约束
丢失的配料
基于一种改进AZSVPWM的满调制度死区约束条件分析
通过优化配料方案来提高熟料质量及降低配料成本
特殊的配料
Task 2
马和骑师
复杂多约束条件通航飞行垂直剖面规划方法
适当放手能让孩子更好地自我约束
CAE软件操作小百科(11)