付秋峰, 肖 军, 李书臣, 张勇强, 刘 威
(辽宁石油化工大学信息与控制工程学院,辽宁抚顺 113001)
基于微粒群优化和模拟退火的约束广义预测控制算法
付秋峰, 肖 军, 李书臣, 张勇强, 刘 威
(辽宁石油化工大学信息与控制工程学院,辽宁抚顺 113001)
提出一种基于微粒群优化和模拟退火的约束广义预测控制算法,将微粒群优化和模拟退火引入到广义预测控制的滚动寻优过程中,增强对约束边界的搜索能力,并将约束条件构成约束违反度函数和适应度函数一起判断最优解的优劣,该算法可以有效地提高广义预测控制处理约束的能力。通过对一个工业对象的仿真,验证了该算法的可行性和有效性。
广义预测控制; 约束; 微粒群优化; 模拟退火
广义预测控制是在自适应控制研究中发展起来的一种典型的预测控制算法[1]。在广义预测控制中,如果被控过程是线性无约束的,则可以按照梯度寻优法求得一个解析的线性控制器。但是实际工业过程中存在很多的系统约束,使用带约束的二次规划求解时,有时会是一个非凸规划[2]。而对于约束优化问题常用的罚函数法[3],对函数和约束的特性要求较高,不易应用于复杂的约束优化问题。为提高广义预测控制的性能与应用范围,需要寻找更有效的解决优化问题的方法。
微粒群优化算法(PSO),实现简单、不要求目标函数和约束条件可微,目前已在许多优化问题中得到成功应用,但PSO的全局搜索能力较差[4]。模拟退火算法(SA)是一种随机搜索技术[5],主要用于概率突跳,在搜索时接受优化解及恶化解,有较强的全局搜索能力。因此,将PSO和SA有机结合起来,应用到带约束的广义预测控制中去,增强该算法在约束空间内的搜索能力,并将约束条件构成约束违反度函数,可以方便有效地评价求得的优化解。最后,通过一个仿真实例对该算法进行了说明。
在约束GPC中,采用受控自回归积分滑动平均(CARIMA)模型来描述受到随机干扰的对象。式中,A、B、C都是后移算子q-1的多项式(为简化计算,假设C(q-1)=1),u(t)、y(t)为过程的输入、输出量;d为滞后步数;Δ=1-q-1为差分算子;ξ(t)是一个不相关的随机序列。
引入丢番图方程1=Ej(q-1)A(q-1)Δ+q-j(q-1),可推导出预测时域为N控制时域为Nu的预测值为:式中,^Y=[^y(t+1|t),…,^y(t+N|t)]T;Δ→U=[Δu (t),Δu(t+1),…,Δu(t+Nu-1)]T
在t时刻的优化性能指标采用以下形式:式中,N1和N2分别为优化时域的始值和终值;Nu为控制时域;yr(t+j)=αjyr(t)+(1-αj)yd为参考轨迹,α为柔化系数,yd为给定值;qj、λj为加权系数。
由文献[6]可知预测控制中的系统约束存在等式约束及不等式约束,在此仅考虑不等式约束,引入工业系统常用的不等式约束,即控制量约束、输出约束、控制增量约束[7]。
控制增量约束:
控制量约束:
输出约束:
其中
因此,具有约束的GPC的滚动优化就是,在满足约束式(4)、(5)、(6)的情况下使性能指标式(3)最小,求得t时刻的最优输入序列Δ=[Δu(t),Δu(t+ 1),…,Δu(t+Nu-1)]T。
对于上述约束GPC问题,采用微粒群算法结合模拟退火算法来求取最优解。在该算法中,将约束GPC的二次性能指标作为微粒群的适应度函数进行滚动寻优,为克服微粒群算法在后期易收敛到局部极小值的缺点,引入模拟退火算法帮助其跳出局部极小值,扩大其在解空间中的搜索能力,并给出了微粒更新时遵循的可行性规则。该算法在处理约束时,把GPC的约束条件统一为Δ的表达式构成约束违反度函数,使其和适应度函数一起判断滚动优化求得的最优解的优劣。最后,给出了该算法的求解步骤。
2.1 微粒群优化(PSO)
假设在一个N维解空间中,由m个微粒组成的种群,其中第i个粒子在N维空间的位置表示为=(xi1,xi2,…,xiN),飞行速度表示为=(vi1, vi2,…,viN),每个粒子都有一个由性能指标决定的适应值,并且知道自己到目前为止所发现的最好位置Pi和群体所发现的最好位置pg。每个粒子的速度和位置按(7)式、(8)式进行变化[8]。
在该算法中,需要对GPC的被控变量Δ→U进行寻优,因此令微粒群的搜索空间维数为Nu,这样第i个微粒的位置就可表示成一个Nu维向量xi=[Δui(k),Δui(k+1),…,Δui(k+Nu-1)],并将GPC的二次性能指标式(3)作为微粒群优化的适应度函数,即:fit(xi)=J(t),利用该适应度函数对xi进行迭代更新。
2.2 模拟退火(SA)
模拟退火算法是模拟物理系统徐徐退火过程的一种随机搜索技术,主要用于概率突跳,有效避免搜索过程陷入局部极小。其计算的执行过程是“产生新解—判断—接受/舍弃”的过程。在接受新解时,对优化解均接受,对恶化解则按照exp(-ΔE/T)>rand(0,1)的概率接受,其中ΔE为新旧解的适应度函数值之差,T为退火温度。
为防止微粒群优化求得的全局最优解pg陷入局部极小,对其进行模拟退火操作。以pg为初始状态产生一个新解:=pg+η×(xmax-xmin)×N(0, 1),其中,η为搜索步长(取为0.001),N(0,1)为服从均值为0方差为1的高斯分布随机数,xmax和xmin为变量的上、下界。并计算适应度的变化值ΔE= fit()-fit(pg),将其作为是否接受该新解的一个指标。退温时,按照T(k+1)=λ′T(k)(0<λ′<1)进行退温。
2.3 构造约束违反度函数
在处理GPC的约束时,区别于罚函数将目标函数和约束结合到一个函数的做法,采用GPC的二次性能指标与约束条件分离的办法。将约束式(4)、(5)、(6)转化为关于Δ的统一表达式:
故可将以上3种约束统一为:由文献[5]可将式(9)转化为不等式约束:
其中xi=[Δui(k),Δui(k+1),…,Δui(k+ Nu-1)]即为微粒群搜索到的优化解,该函数值反映了每个粒子与边界的接近程度,以此判断滚动优化解是否可行,约束违反度值和适应度值一起构成微粒更新的指标。
2.4 微粒更新的可行性规则
按照如下的可行性规则来更新微粒的历史最优位置和种群的全局最优位置,假设为种群中第i个微粒在第t代时的历史最优位置,表示该微粒在第t+1代时所在的位置,若以下任意一种情况发生,就执行=,否则=xti。
2.5 基于PSO-SA的约束GPC算法流程
基于PSO-SA的约束广义预测控制算法流程如图1所示。
Fig.1 Algorithm flow chart图1 算法流程图
取某加热炉温度控制系统中的被控对象作为仿真研究对象,通过模型辨识可知其传递函数模型为:设采样时间为5 s。离散化后为:
约束条件为:-1.5≤u(k)≤1.5;-0.2≤Δu (k)≤0.2;-2≤y(k)≤2
设噪声为[-0.05,0.05]的均匀分布的白噪声。仿真过程中预测步长N2为6,控制步长Nu为2,加权系数q=1、λ=0.8,柔化系数α=0.25,微粒数m为50,最大迭代次数M=500,惯性权重ω=0.8,学习因子c1、c2均为2,退火常数λ′为0.5。仿真结果如下图2所示,由图2可以看出在系统存在约束时,使用基于PSO-SA的约束GPC算法,可以达到很好的控制效果。对比无约束时的仿真曲线(见图3),无约束时的输出比有约束时跟踪快,但控制量变化大,使输出有超调,而有约束的控制量变化比较平稳,输出无超调。图4为有约束时种群最优解的目标值随进化代数变化的曲线,由该曲线可以看出种群经过100次迭代就得出了最优解,收敛速度很快。
Fig.2 Simulation curves with constraints图2 有约束时仿真曲线
将PSO-SA融入到约束GPC的滚动优化过程中,既保持了微粒群算法简单容易实现的特点,又增强了全局搜索能力,因此具有更强的约束空间搜索能力。在处理约束时,将约束条件构成约束违反度函数,对滚动优化求得的最优解以约束违反度值和适应度值的大小来判断其优劣,可以方便有效地处理约束。仿真结果显示该算法可以有效地提高广义预测控制的性能,为GPC的更广泛应用提供了便利。但如何证明算法的收敛性以及进一步提高算法的运行速度,是今后需要研究的问题。
Fig.3 Simulation curves without constraints图3 无约束时仿真曲线
Fig.4 Changing curve of f itness value图4 适应度值变化曲线
[1] 钱积新,赵均,徐祖华.预测控制[M].北京:化学工业出版社,2007.
[2] 邹涛,王昕,李少远.基于混合逻辑的非线性系统多模型预测控制[J].自动化学报,2007,33(2):188-192.
[3] DEB K,AGRAWAL S.A niched-penalty app roach for constraint handing in genetic algorithm s[C]//Proceedingsof the international conference in Portoroz Slovenia,artificial neural nets and genetic algorithms.New Yo rk:Sp ringer verlag, 1999:235-243.
[4] 刘华蓥,林玉娥,王淑云.粒子群算法的改进及其在求解约束优化问题中的应用[J].吉林大学学报:理学版,2005,43(4): 472-473.
[5] Bandyopadhyay S.Simulated annealing using a reversible jump markov chain monte carlo algorithm fo r fuzzy clustering [J].IEEE trans know ledge data eng.,2005,17(4):479-790.
[6] 李少远,席裕庚.具有模糊约束的广义预测控制[J].仪器仪表学报,2001,22(2):159-160.
[7] Guzman J L,Berenguel M,Dormido S.Interactive teaching of constrained generalized p redictive control[J].Control systemsmagazine,IEEE(S0272-1708),2005,25(2):52-66.
[8] 苏成利,刘晓琴,李平,等.基于PSO与LM I优化的非线性模型预测控制[J].辽宁石油化工大学学报,2007,27(1):86-87.
(Ed.:W YX,Z)
A lgo rithm of Constrained Generalized Predictive Control Based on PSO-SA
FU Qiu-feng,X IAO Jun,L IShu-chen,ZHANG Yong-qiang,L IU Wei
(School of Inform ation and Control Engineering,L iaoning Shihua Univercity,Fushun L iaoning 113001,P.R.China)
28 September 2009;revised 15 M arch 2010;accepted 20 M arch 2010
An algo rithm of constrained generalized p redictive controlwas p roposed based on partical swarm op timization(PSO) and simulated annealing(SA).PSO and SA were used fo r iterrative op timization to enhance the search capabilities for constraint boundary.Meanw hile,a violation function was constructed by constraints.This function and fitness function determined the op timal solution better o r not.Constraint handling perfo rmance of GPC can be effectively imp roved by this algorithm.Its feasibility and efectiveness are verified via sim ulation study fo r an industrial object.
Generalized p redictive control;Constraint;Particle swarm op timization;Simulated annealing
.Tel.:+86-413-6860879;fax:+86-413-6860879;e-mail:haoxinqing6398@163.com
TP13
A
10.3696/j.issn.1006-396X.2010.02.024
1006-396X(2010)02-0089-04
2009-09-28
付秋峰(1980-),男,河南汝南县,在读硕士。
辽宁省教育厅科学研究计划资助(2004D031)。