杨 宸,张 玮,许 鑫,张振喜,高 暾
(太原理工大学 化学工程与技术学院,山西 太原 030024)
灰狼优化算法(grey wolf optimization,GWO)是Mirjalili等[1]学者通过对灰狼跟踪、包围、追捕等过程模拟,提出的一种群体智能优化算法。灰狼算法在PID控制参数优化、图像处理、化工建模优化、机器学习等[2-5]领域得到广泛的应用。但是,灰狼算法在种群初始化时过度聚焦,在位置更新中勘探与开发能力不均衡,致使其收敛至局部最优。
为了克服这些缺陷,Mehak Kohli等[6]在种群的初始值分布定义阶段,引入混沌映射理论,使其初始化粒子在目标空间均匀分布,增强其全局寻优的能力。滕志军等[7]利用粒子群优化算法中的位置更新公式更新灰狼个体,使其能够保留自身最优位置信息,从而提高算法的收敛精度;Peng Yao等[8]引入贪婪策略,在其优胜劣汰的约束下,降低其收敛至局部最优的可能;蔡娟等[9]在头狼的位置引入高斯扰动,增强算法跳出局部最优的能力;崔建弘等[10]在狼群的初始阶段引入混沌对立学习策略,提升初始解的质量,加速算法收敛。以上工作分别从提高GWO全局寻优的能力、算法的收敛精度、收敛效率等方面展开研究,但早熟收敛、全局勘探和局部开采能力不平衡的问题仍然存在。
因此,本文提出一种非线性控制策略,且通过分析在最优狼α,β,δ的引导下种群的更新过程,提出一种基于适应度权重反向学习的位置更新策略,平衡算法的勘探与开发。保证全局寻优能力的前提下,增强算法的求解速度与精度。通过16个基准函数的寻优求解问题和GBDT的旋风分离器粒级效率模型参数优化问题[11],对该算法的有效性和工程应用效果分析对比。
(1)灰狼狩猎过程的包围策略如等式(1)、式(2)所示
(1)
(2)
(3)
(4)
(5)
其中,t是当前迭代次数;MAX是最大迭代次数;
(2)灰狼α、β、δ具有相关猎物的最佳信息,其余的灰狼根据它们3个的位置来更新自己的位置(捕食猎物),数学描述如下
(6)
(7)
(8)
式(7)定义了ω狼朝向α、β、δ前进的方向向量,式(8)定义了ω狼的最终位置。
由此可见,传统灰狼算法在初始化中分布聚集,严重影响后期搜索效果。
针对种群在初始化阶段过度聚焦的问题,本文应用混沌立方映射[6]定义初始种群,使初始化群体在目标空间均匀分布,为全局搜索奠定良好基础。混沌立方映射生成初始灰狼种群包括3个步骤,具体过程如下:
(2)将随机生成的灰狼的位置坐标按式(9)迭代2n-1次,从而产生其余的2n-1匹灰狼;按照式(10)映射到真实的解空间中
(9)
(10)
计算2n匹灰狼适应度值并按升序排列,筛选奇数项对应的灰狼作为初始种群,使种群均匀分布。
(11)
其中,t为当前的迭代次数;MAX为最大迭代次数。
(12)
(13)
(14)
对4种控制参数进行仿真,取最大迭代次数MAX为500,结果如图1所示。
图1 控制参数的变化曲线
图2 灰狼位置更新原理
首先,为扩大算法搜索范围,引入重心反向学习策略,利用整个种群的重心位置信息对三匹灰狼α,β,δ进行变异操作。
设 (X1,X2,…,Xn) 是d维解空间中每个灰狼个体的位置坐标,则其对应的种群重心位置
(15)
(16)
(17)
随后α狼执行重心反向变异操作
(18)
在重心反向变异跳出局部最优后,因为灰狼α于目标值所在的超球体邻域内不一定为最优值,所以在该邻域内采用最优解适应度值权重更新的方法,增强β和δ狼适应度的贡献。首先分别根据三匹狼α,β和δ的适应度值的大小得到各自的权重,其它个体灰狼根据该权重进行位置更新,其数学模型如式(19)、式(20)所示
(19)
(20)
BGWO灰狼优化算法步骤如下:
(1)输入种群规模N、当前迭代次数t、空间维度D、搜索空间的上下限ub和lb、最大迭代次数MAX;
(2)初始化灰狼种群的位置,对随机生成的个体灰狼执行2N-1次Cube立方映射,计算2N匹灰狼适应度并按照升序排列,筛选奇数项对应的灰狼作为初始种群;
(3)对初始化的灰狼种群进行适应度排序,确定α,β和δ;
(4)根据式(11)进行参数a的更新;
(5)根据式(15)至式(18)进行α,β和δ位置的更新,根据(19)与式(20)更新其余灰狼位置;
(6)判断是否满足最大迭代次数,若满足算法结束,否则转至步骤(3);
将该算法与标准GWO、近期相关文献提出的PSO-GWO[7]、IGWO[8]、HGWO[13]进行比较。为保证仿真实验的公平性,运行环境统一为Intel Core i5-1038 NG7 CPU,主频2.00 GHz,内存8 GB,Windows10 64位操作系统,实验仿真软件采用MATLAB R2019b。所有对比算法都统一设置了30个搜索代理,进行了500次迭代,实验分别独立运行30次,并且选取了16组标准测试函数,其中6组单峰基准测试函数、5组多峰基准测试函数和5组固定维度多峰基准测试函数。取平均值表示搜索的结果精准性,30次结果的方差表示结果的稳定性。对比测试算法参数设置见表1,测试函数见表2~表4。
表1 测试算法
表2 单峰基准函数
表3 多峰基准函数
表4 固定维多峰测试函数
各算法的均值见表5,在6个单峰函数中,除F5,在F1、F2、F3、F4、F6、BGWO算法的测试均值都优于其它4种改进算法和经典的灰狼算法,达到了理论最优解0。特别是GWO_3,引入重心反向学习的最优适应度权重更新策略,在除F5之外的其余单峰函数中,都达到了理论的最优解0。验证了该策略在全局收敛精度上的优越性能;对于高维多峰测试函数F7-F11,BGWO在所有测试函数上的寻优精度都达到最优,且在函数F7、F9、F10、F11都收敛至最优解。对于复杂函数F8,BGWO逼近理论最优解,相对性能最佳。对于固定维多峰函数,BGWO在测试函数F14、F15、F16展现了其优越性,且GWO_2除F15以外的测试,均收敛至最优解,可见所提出的非线性搜索策略适用于低维度多峰测试函数。这也反映出两种不同的策略,适用于不同的问题空间,且都有其各自的针对性,而融合两种策略的BGWO的整体寻优精度要优于标准GWO和其它改进算法。
表5 算法的均值测试结果
优化算法的优劣不仅表现在结果的精准性,还在于其稳定性,表现在寻优的方差计算结果。如表6单峰基准测试函数的方差计算结果可知,除F5,BGWO的稳定性要超越GWO与其它3种改进算法。这是因为其引入了重心反向学习的最优适应度权重更新策略,在多峰测试函数中,BGWO在稳定性上表现出众,体现出最优适应度权重更新策略改进的灰狼算法强大的全局搜索能力。在固定低维度多峰测试函数F14-F16中,BGWO表现优越,且GWO_2函数在除F15以外所有固定低维度多峰测试函数中都有着稳定的效果,验证了非线性收敛因子策略适用于固定低维度多峰问题。
表6 算法的方差测试结果
在收敛速度方面,分别选取单峰函数F1、F4、F5,多峰函数F7、F8、F11,固定维多峰函数F14、F15、F16进行测试,为了让收敛效果更加明显,将目标函数值取log变换,收敛曲线如图3所示。从单峰测试函数可以清晰地看出,BGWO与GWO_3算法在迭代次数不到100的时候,便与其它算法有了明显差别,且能快速地收敛于全局最优,这是因为引入重心反向学习的最优适应度权重更新策略,从而优化了算法的收敛速度与精度。从多维测试函数可以看出,BGWO在50次左右迭代后便收敛至全局最优,特别是从F8中可以发现,BGWO在保持快速收敛速度的同时,其搜索精度表现优越,这得益于引入新型非线性控制参数。综上所述,使用重心反向学习的最优适应度权重更新策略能够稳定快速地寻到最优值,且具有优秀的精准性。新型非线性控制参数能有效地防止算法陷入局部最优,能够更稳定地寻找全局最优值。融合了两种策略BGWO,相对于标准灰狼算法和其它改进算法,在提高收敛速度的同时增加了精度。但是,没有免费午餐定理(no free lunch,NFL)[14]指出,任何一种优化算法不可能解决所有类型的优化问题,只对某些特定的问题有效。在实际应用中,应该针对目标函数的特性,选择不同的策略,进而可以获得更好的求解效果。
图3 函数的寻优收敛曲线
PV型旋风分离器是一种高效的气固分离器,目前已广泛应用于高温高压和高含尘浓度条件的工业领域,其分离效率是评价一台旋风分离器性能的重要参数[15]。但是通过实验获取其效率时间经济代价昂贵,因此,通过机器学习方法获得效率预测模型对于工业生产是非常必要的。PV型旋风分离器结构如图4所示。
图4 PV型旋风分离器结构
GBDT是梯度提升决策树(gradient boosting decision tree)[16]的简称,是一种用于回归、分类和排序任务的机器学习技术。同其它Boost方法一样,通过集成多个弱学习器,来构建最终的预测模型。弱分类器个数、学习率、树的最大深度、分裂时最少的样本量的选取直接影响着它的鲁棒性,集成学习模型如图5所示。
图5 集成学习模型
(21)
(22)
为保证公平性,PSO、GWO、BGWO算法种群数统一设置为40,算法迭代次数设置为50次,参数区间见表7。
利用训练集进行5-fold交叉验证来计算不同参数组合预测值与真实值的均方误差,其适应度函数F为5次预测值和真实值的均方误差的平均值,其表达式如下
(23)
BGWO算法寻优过程如图6所示,最终寻优结果见表8。可以看出,BGWO算法在迭代过程既保留了前期勘探能力,又不失后期开采的精度,其适应度达到了0.001 59。
表8 算法寻优结果
图6 BGWO迭代过程
测试数据预测结果见表9,预测效果如图7所示,BGWO模型奇偶如图8所示。
表9 算法预测结果
图7 预测效果
图8 BGWO-GBDT模型奇偶
由表9和图7可以看出,相比较其它两种预测模型,预测目标变量BGWO-GBDT模型的相关系数比GWO-GBDT、PSO-GBDT分别提高0.021与0.035;在均方误差上BGWO-GBDT比GWO-GBDT、PSO-GBDT分别降低了0.000 84与0.0014,也进一步验证了改进策略的有效性。
图8显示基于BGWO-GBDT的PV旋风分离器代理模型不论在训练集还是在测试集上都达到了最佳的效果,有效解决了通过重复实验机理建模的昂贵代价问题。接下来可对PV型旋风分离器的参数选择设计进行指导。
本文首先采用立方映射定义初始种群,为全局搜索奠定良好基础;对群体在进化阶段位置更新的邻域进行了分析,引入了非线性控制参数,增强算法前期勘探能力,加快收敛速度;最后引入适应度反向学习策略,平衡了算法的勘探与开发,降低陷入局部最优的可能。通过16组测试函数仿真表明,适应度反向学习的更新策略适用于高维单峰与多峰函数,并在精度及稳定性方面优势明显;在固定维多峰测试函数中,非线性控制参数表现出更好的性能,提高了算法收敛速度。最后用BGWO对GBDT的旋风分离器效率模型参数进行优化,与其它两种预测模型对比,BGWO-GBDT取得了最高的R2及最小的MSE。结果表明该代理模型的预测精度较高,可靠性好,能有效解决昂贵代价的工业数据建模问题。