刘高旗
(四川大学空天科学与工程学院,成都 610000)
近年来,四旋翼无人机(UAV)因其成本低、灵活度高、垂直起降、体积小等诸多优点而被广泛应用于搜救、侦察、空中摄影等军事、民用领域[1-2]。由于四旋翼无人机(简称四旋翼)为一个欠驱动、位置姿态强耦合的非线性系统,控制器的设计有一定程度的困难,需要充分考虑到执行器输入受限及系统耦合等影响[3]。对于四旋翼位置跟踪控制问题,一般对耦合的四旋翼位置与姿态环分别进行控制,且位置环的跟踪精度很大程度上取决于后续姿态环的跟踪效果,如果姿态环能够精准跟踪指定姿态,那么四旋翼整体的位置跟踪控制问题将变得容易处理。因此,设计一个能够在考虑输入受限的情况下精确控制四旋翼姿态的姿态控制器显得非常关键[4]。
目前,国内外有许多针对四旋翼的姿态控制器设计方法。文献[5]采用传统PID控制器控制四旋翼整体系统,实现四旋翼飞行控制;文献[6]介绍了四旋翼系统的线性二次调节控制器方法,通过仿真实验验证了方法的有效性;文献[7]为提高四旋翼姿态控制系统的抗干扰性,设计了一个基于改进自抗扰控制的四旋翼姿态控制系统,将全局快速终端滑模控制技术与传统自抗扰控制技术结合,达到四旋翼的姿态控制;文献[8]提出了一种基于鲁棒符号误差积分的四旋翼姿态控制策略,通过一个模型前馈控制项实现精确的模型补偿,抵消姿态模型非线性影响;文献[9]使用径向基神经网络比例微分的方法对四旋翼的姿态跟踪进行控制,采用位置环与姿态环双闭环的控制方法,使用RBF学习位置环与姿态环的输入与输出,从而使位置与姿态的模型不精确性问题得以克服;文献[10]基于反步法对四旋翼进行姿态跟踪及控制,分别对3个姿态角通道设计基于反步法的控制器,并额外采用多事件触发的机制减轻了通信资源负担。
上述方法虽然考虑了四旋翼姿态系统的耦合性等,实现了一定的姿态鲁棒控制,但都没有完全利用到四旋翼姿态二阶非线性系统的全驱性质。相比滑模法和反步法等控制方法,采用全驱系统控制方法可以得到期望特征值配置的一阶线性闭环定常系统,且易于分析闭环系统的稳定性与响应特性[11]。在姿态输入受限的情况下,针对四旋翼姿态跟踪问题,建立姿态误差二阶全驱动模型,受二阶全驱动系统参数化控制[11]的启发,在此基础上,设计了一种四旋翼姿态参数化控制器,使二阶姿态系统等价于一阶线性定常闭环系统,并通过粒子群算法优化控制器中的参数矩阵,提高姿态跟踪的动态性能,实现了输入受限下的四旋翼姿态参数化控制。
为了建立四旋翼动力学模型,且不失常规性,提出以下假设[12]:1) 四旋翼是刚体且质量保持不变;2) 重力加速度不随高度的变化而变化;3) 考虑四旋翼为小角度、低速度飞行,忽略空气摩擦力;4) 飞行器各电机螺旋桨产生的升力F1~F4和各桨叶转速w1~w4成正比例(F1~F4,w1~w4均为标量)。
定义四旋翼的虚拟控制量U1~U4为
(1)
式中:f和d分别为四旋翼升力和电机反扭矩系数;l为四旋翼机臂长。四旋翼实际的控制量即桨叶转速w1~w4可由转换矩阵得到
(2)
四旋翼位置与姿态动力学模型为[12]
(3)
(4)
其中:(x,y,z)为四旋翼位置坐标;φ,θ,ψ分别为横滚角,俯仰角和偏航角;Jx,Jy和Jz分别为绕机体系三轴的转动惯量;(dx,dy,dz)和(dφ,dθ,dψ)分别是四旋翼整体所受的总扰动在3个位置通道和3个姿态通道的分量。
首先介绍四旋翼整体控制结构,然后针对四旋翼姿态环设计参数化控制器,使姿态跟踪参考指令。
对于四旋翼的整体控制结构,可以采用位置环与姿态环分别控制的策略。位置环控制器通过跟踪四旋翼的参考轨迹(xc,yc,zc),输出虚拟控制量U1及后续姿态环控制器需要跟踪的横滚角φc与俯仰角θc;ψc为参考轨迹中的参考偏航角。对于位置环控制,可由例如线性PID或者非线性PID等经典控制器实现[5]。整体的四旋翼控制框架如图1所示,提出的参数化控制器将用于姿态环的跟踪控制。
图1 四旋翼控制框架Fig.1 Control structure of quad-rotor UAV
首先考察四旋翼姿态误差模型的一些特殊性质,即二阶全驱动性质。对于式(4)四旋翼姿态动力学模型,将其转换为等价的姿态误差模型,即令
(5)
式中:(φe,θe,ψe)为姿态误差;(φc,θc,ψc)为需要跟踪的姿态指令。
将式(5)代入式(4),得到用姿态误差来表示的四旋翼姿态误差模型
(6)
进一步,将式(6)改写成更紧凑的二阶姿态误差系统的形式,即
(7)
式中:
(8)
式中,I3,03分别表示3×3的单位矩阵和零矩阵。上述四旋翼姿态误差模型属于典型的二阶全驱动系统。
定义1[13]考虑如下二阶矩阵伪线性形式的系统
(9)
考虑到四旋翼二阶姿态误差系统为二阶全驱动系统这个特殊的性质,设计参数化控制器使四旋翼姿态误差系统稳定,即姿态误差收敛,姿态能够逐渐收敛至参考指令。
针对上述式(7)四旋翼二阶姿态误差系统,设计参数化控制律为
u=uτ+uc
(10)
(11)
(12)
式中,
(13)
2.3.1 反馈矩阵的设计目的
(14)
式中,V∈R2n×2n,为一个待定的定常非奇异矩阵。
如果能够解决问题VF,则四旋翼姿态误差闭环系统状态矩阵
(15)
为定常矩阵。对于一阶闭环定常系统来说,控制将变得简单。
2.3.2 反馈矩阵的参数化设计
在给出反馈矩阵的设计方法之前,需要先解决待定矩阵V的选取问题。对于任意给定的矩阵F,定义集合
(16)
引理1[11]H是可行集,当且仅当存在一个非奇异矩阵Q∈Rn×n使如下条件成立
Q-1FQ=Blockdiag(J1,J2)
(17)
式中,Blockdiag(J1,J2)代表J1,J2组成的块对角矩阵,子矩阵J1,J2∈Rn×n,无共同的特征值。
事实上,要找到相对应的Q并不难,例如,当F选取为子块无共同特征值的若当标准型矩阵时,对应的非奇异矩阵Q可以简单选取为对应维度的单位矩阵等。基于上述引理1,待定矩阵V选取为
(18)
矩阵Z为集合H的一个解,则矩阵V自然为定常非奇异矩阵。
(19)
式中:
(20)
上述内容给出了反馈矩阵的选取方法,可以看到,只要给定了矩阵F与矩阵Z,则反馈矩阵就可获得。下面分别讨论矩阵F与矩阵Z的一些选取问题。
首先对于矩阵F的选取,虽然原则上可以任意选取,但通过式(15)可知,四旋翼一阶闭环定常系统的系统特征值由矩阵F直接决定,它将直接决定四旋翼一阶闭环定常系统的动态及稳态性能。
对于一阶线性定常系统易知,只要系统矩阵为Hurwitz矩阵,则系统为指数渐近稳定[13]。又考虑引理1中式(17)的要求,选取矩阵F为若当标准型形式的Hurwitz矩阵。
对于参数矩阵Z的选取空间,定义集合
(21)
集合Z0(F)即为上述参数化控制律中自由参数矩阵Z的解空间集合。由引理1易知,Z0(F)为非空集合。事实上,集合Z0(F)为一个Zariski开集,在Zariski意义下,几乎对任意的矩阵Z都满足[10],因此,对于参数矩阵Z的选取约束几乎可以忽略。
至此,给出了四旋翼姿态控制器中的参数化控制律的设计及其反馈矩阵的选取原则。基于对提高四旋翼姿态误差一阶闭环线性定常系统的动态性能的考虑,优化控制器中的两个参数矩阵。
选取若当标准型形式的Hurwitz矩阵F和“几乎自由”的矩阵Z,通过参数化控制律可使四旋翼二阶姿态误差系统等价于具有式(15)系统状态矩阵的一阶定常线性闭环系统,且该系统指数级渐近稳定,姿态跟踪误差将收敛至零[13]。
然而,在实际的四旋翼姿态控制设计中,不仅要求四旋翼最终能够跟踪上姿态指令,而且需要同时考虑系统的动态性能及控制器饱和等实际问题,因此,上述四旋翼姿态参数化控制律中的参数矩阵F与Z可根据四旋翼姿态系统要求来进一步优化选取,如配置一定的闭环极点,提高动态性能以达到更好的系统性能。
考虑四旋翼姿态系统的动态性能及控制器饱和,利用粒子群优化(PSO)算法来优化参数矩阵F和Z。粒子群算法模仿鸟类集群行为,在多维搜索空间内根据个体及全体的搜索情况来达到全局优化。粒子群算法具有全局优化性,能够跳出局部最优值,不断逼近全局最优值,由于其收敛速度快及迭代步骤简单已在工程优化问题中应用颇多[14]。在粒子群算法中,每个粒子均有位置(即优化问题中的优化变量)及速度两种属性,在当前粒子群迭代后,每个粒子下一时刻的速度由粒子个体与群体的最佳位置(使优化问题的目标函数最小)共同决定,下一时刻的位置由更新后的速度决定,即
(22)
式中:v与X分别代表粒子的速度与位置;下标j=1,2,…,N,为粒子编号,N为粒子群总数;上标k=0,1,…,K,为当前迭代数,K为粒子群优化总最大迭代次数;Xbest,Gbest分别为粒子个体与整体的最佳位置;r1,r2∈[0,1],均为随机数;c1,c2>0,均为粒子速度学习因子,且满足c=c1+c2>4;ω为粒子速度惯性常数,其值为
(23)
粒子群优化算法的流程步骤如下:
1) 设置最大迭代次数K与初始粒子个数N,并初始化当前粒子群个体的速度与位置,初始化迭代次数k=0;
2) 计算当前粒子个体与整体的最佳位置Xbest,Gbest;
3) 判断是否k>K,若是,则输出最佳位置Gbest,优化结束,若否,则根据式(22)更新粒子速度与位置,令k=k+1,跳转至2)。
优化问题。
取参数矩阵F为以下若当标准型形式
F=diag(λ1,λ2,λ3,λ4,λ5,λ6)
(24)
式中,λi<0,i=1,2,…,6,为待优化的参数。由于参数矩阵Z的选取比较自由,将其选择为
Z=[z1I3z2I3]
(25)
式中,z1,z2>0,均为待优化的参数。因此,对于四旋翼姿态系统参数化控制律优化问题的总优化参数为
λ=[λ1λ2λ3λ4λ5λ6]T
(26)
以及
z=[z1z2]T
(27)
为了减少四旋翼姿态跟踪误差,提高动态性能,优化目标函数为
(28)
式中,向量Θ(t),Θc(t)分别表示四旋翼姿态及需要跟踪的姿态参考指令。考虑到控制器饱和的问题,有以下控制器输出约束
(29)
为了验证提出的四旋翼姿态参数化控制器的控制效果,与基于反步法的姿态控制器[10]对比,进行了仿真实验。仿真环境为Matlab (2019B) Simulink,采样周期为0.001 s,仿真时间为10 s,粒子群算法最大迭代次数为100,初始粒子总个数为20。四旋翼的物理参数如表1所示。
表1 四旋翼参数
经过PSO算法优化后的四旋翼姿态参数化控制器的矩阵参数及选取的反步法控制器参数见表2(反步法各控制器参数含义详见文献[10])。
表 2 参数化及反步法控制器参数
分别应用四旋翼姿态角参数化控制器与反步法控制器的姿态角跟踪情况与误差变化见图2及图3。
图2 姿态角跟踪曲线Fig.2 Attitude angles tracking curve
图3 姿态角跟踪误差曲线Fig.3 Attitude angles tracking error curve
由图2、图3可知,参数化控制器与反步法控制器都能够实现姿态角跟踪,且稳态误差较小,应用参数化控制器跟踪效果相比于反步法控制器更好,具有更好的暂态性能,如调节时间与爬升时间,具有更好的跟踪暂态性能。
图4所示为应用参数化控制器得到的四旋翼虚拟控制量。
由图4可以看到满足设置的四旋翼姿态控制器输入饱和限制,且控制量平稳。综上,在考虑执行器饱和特性的情况下,姿态参数化控制器具有较好的暂态与稳态跟踪性能。
图4 控制量变化曲线Fig.4 Control inputs variation curve
针对四旋翼在姿态控制器输入受限下的姿态跟踪控制问题,提出了一种参数化控制器,使姿态系统等价于一阶闭环定常系统,并利用智能算法优化控制器参数。经过仿真实验验证,与反步法控制器比较,本文所提控制器能够使四旋翼姿态以较好的暂态性能与稳态性能跟踪给定姿态指令,且所求控制量能够满足姿态系统控制量输入限制。