徐振,李胜,陈庆伟,季蔡娟
(南京理工大学自动化学院,210094,南京)
近年来,旋翼无人机以其成本低、操作简单的特点和优异的中低空机动性能,受到了使用者的青睐。如今在物资运输、森林灭火、目标追踪、战场侦察与打击、电力巡线等场景,无人机发挥着越来越重要的作用。目前,无人机之间的通信延迟和变质量惯量等行为,制约着无人机编队的精度及其执行任务的能力,而无人机的编队是提高无人机工作效率的有效方式。
常见的编队方法有领航跟随法、虚拟结构法、基于行为法、一致性算法等。基于行为法实现简单,多适用于未知环境,但编队收敛性很难进行精确的数学证明;虚拟结构法和领航跟随法类似,要求核心无人机的全状态反馈信息,原理简单,便于工程实现,但对核心无人机的安全性和鲁棒性要求较高,当智能体增多时,运算量较大[1];一致性算法最早由Ren[2]和Liu等[3]引入到多智能体系统的编队控制中,其分布式的特点具有良好的鲁棒性,在智能体较多的情况下优势明显。文献[4]中用一致性理论进行多机器人的队形控制和稳定性分析;文献[5]对高阶线性模型的一致性协议运用中的时变队形和时延问题进行了讨论。本文考虑小型无人机编队,结合全文侧重点和文献[15],采用领航跟随法进行编队飞行。
一方面,针对无人机编队在复杂环境中的通信延迟问题,学者们已提出多种处理方法,例如:文献[6]针对一类二阶异质多智能体系统的时延问题,提出了一种无假设条件的异质多智能体系统静态组一致性算法;文献[7]通过变量代换,将时延条件下的线性群系统编队控制问题转化为时延系统的镇定问题,以构造李雅普诺夫函数;文献[8]针对一类无速度传感器的灵巧型喷气式无人机设计时延观测器,用于估算自身状态。现阶段的文献中,时变时延多采用被动的处理方式,即通过一致性协议设计,在得知通信延迟变化率等先验条件的前提下,实现无人机群系统跟踪误差有界,但通常误差无法收敛到0,或具有一定的保守性,收敛速度较慢,而将时延状态观测器用于旋翼无人机编队的可参考案例也相对较少。
另一方面,无人机担任的工作角色,如投掷弹药、抛洒干冰、运输货物等,极易引起质量和惯量的变化。这不仅影响单个无人机的工作状态,影响时延状态观测器的收敛性,而且影响编队的全局控制性能。文献[9]利用非线性自适应控制对未知定常参数进行辨识;文献[10]基于自适应反步法和非线性阻尼算法,提出了一种鲁棒自适应控制器,实现了对惯量参数的估计,最终实现了航天器姿态控制系统全局一致有界;文献[11]针对具有未知常数惯量不确定性和外界干扰的航天器,设计了一种有限时间自适应滑模姿态跟踪控制器,使得期望姿态实现有限时间一致;文献[12]针对机械系统高频扭矩振动带来的系统惯量变化,采用抗共振滤波器和自适应神经控制器的协同作用解决了这一问题。以上文献中,系统质量和惯量多为未知定常,或仅有其一发生变化的情况,然而这两者往往是密不可分的;同时,在依据李雅普诺夫函数法设计控制律时,将待估计值处理为缓变量,只适用于部分场景,适用范围较小。
本文针对上述两个方面的问题,采用领航跟随法的编队方式,应用编队参数生成虚拟无人机位置,然后根据编队误差,设计基于时延观测器的旋翼无人机自适应编队控制器。在通信存在变时延的情况下,跟随者可以准确跟踪虚拟无人机位置,实现对各类变惯量行为的自适应调整,提高编队收敛速度和精度。设计2组仿真实验,通过跟踪不同路径和惯量变化方式,验证所提方法的有效性。
根据牛顿欧拉建模原理,参考文献[13],建立四旋翼无人机系统的动态模型
(1)
(2)
该模型遵循如下假设:
(3)
式中:p、q、r分别为机体坐标下的滚转、俯仰、偏航角速度。
由于四旋翼无人机通常做小角度运动,可利用小角度近似得
(4)
(2)四旋翼的结构是刚性且对称的。
(3)四旋翼质心与机体坐标系原点一致。
需要说明的是,由于四旋翼无人机欠驱动的特点,不可能对输出ξ中的6个自由度都进行控制。一种合理的方案是:控制质心位置[xyz]T和偏航角ψ,同时保证另外两个欧拉角[φθ]稳定有界。
在领航跟随法中,领航者沿着预先设定好的路径行进,跟随者则需要获得领航者的位置和角度信息,结合自身位姿进行控制。编队的主轨迹通常由领航无人机Rl决定。跟随无人机Rf的参考轨迹由领航无人机和结构参数生成的虚拟无人机Rv轨迹决定。一个典型的三角形编队如图1所示,编队拓扑图见图2,图中所有无人机具有相同的运动学模型。
图1 三角形编队图
图2 编队拓扑图
从一致性的角度分析领航跟随编队系统。定义控制目标ξ=[xyzψ]T,多智能体系统被称作满足一致性,当存在一个向量函数ci(t)∈Rn时,对第i个无人机有
(5)
式中:i∈{f1,f2};
被称作一致参考函数,表示一个基于三维极坐标的虚拟无人机的位置;h(t)=[hd(t),hφ1(t),hφ2(t)]∈R3为分段连续可微的时变编队信息,hd、hφ1、hφ2分别表示虚拟无人机与领航者的编队距离、水平方向夹角以及垂直方向夹角。
从控制的角度来看,即Rf1与Rf2在欧拉坐标系下,通过寻求适当的控制器ui(i=1,2,3,4)完成对位姿误差e(t)=ξi(t)-ξvi(t)的跟踪,使得e(t)渐近稳定。这样,领航跟随法下的编队控制问题就转化成了跟随无人机Rfi对虚拟无人机Rvi的位置姿态ξvi(t)=ci(t)的跟踪问题。这种考虑适用于小型编队,主要采用集中控制的方式进行通信,运算量较小。
在编队过程中,受通信条件、设备负载以及无人机系统自身存在时延等情况的限制,领航者的部分输出信息
{x1[t-δ(t)]y1[t-δ(t)]z1[t-δ(t)]
ψ1[t-δ(t)]}T=ξ1[t-δ(t)]
(6)
式中:δ(t)∈[0,Δ]为已知有界时变时延信号。
此时,跟随者无法准确获取领导者的实时位置信息。当时延大于一定阈值时,可能会出现跟随者无法有效跟踪、编队队形发散的情况。针对这种情况,本文提出一种时延状态观测器设计方法。
Σ是弱可观的,当且仅当对于1≤p≤m,观测矩阵
(7)
是满秩矩阵。
为了计算Om的秩,引入向量场h关于向量场f的李导数Lfh(X)
(8)
(9)
(10)
据此可以一步步构造出一组n=12的线性无关向量组,它是由输出向量的李导数及其梯度的所有有限线性组合得来的。第一个得到的线性无关向量组为
(11)
可得
(12)
由det(Om)=-1可知,矩阵Om是满秩的。由此可以得出,该系统是弱局部可观的。
基于2.1节的分析,针对系统
(13)
式中:C为输出矩阵;
设计如下观测器
(14)
引理1[8]若形如式(13)的系统符合
(1)M(X,t,u)满足利普希茨连续条件,
(2)时变时延δ(t)∈[0,Δ]有界,
则有
(15)
证明:对本文采用的旋翼无人机系统模型而言,设
则
有界,M21满足利普希茨连续条件,记为L=L21。
由于M(X,t,u)各元素偏导数均有界,不失一般性,M(X,t,u)满足利普希茨连续条件,L=max(Lij),i∈{1,2},j∈{1,2,3}。
(16)
式中:D=-KC;
M(t,X,u)-M(t,X,u)
(17)
当t>Δ时,有
e(t)-e[t-δ(t)]=
(18)
将式(18)代入式(16)中,得
(19)
选取李雅普诺夫函数
V=eTPe
(20)
可得
(21)
由文献[16]中定理1可得
(22)
(23)
证毕。在该观测器中,
为使其满足赫尔维茨定理,根据分块矩阵的性质,|A-KC|=|A1‖A2‖A3‖A4‖A5‖A6|,有
λ(A-KC)=
λ(A1)∪λ(A2)∪λ(A3)∪λ(A4)∪λ(A5)∪λ(A6)
(24)
(25)
由(λ+κ)2=0可得λ2+2κλ+κ2=0,κ>0,从而
k1=2κ;k2=κ2
(26)
进一步组合可求得K。通过参数整定可以得出,当κ=0.6时,观测器经过短暂的调整,可以很好地获得通信延迟下的虚拟领导者位置,为自身提供准确的目标点。同时需要注意的是,此类观测器设计时要求被观测者的精确模型,而无人机工作时,往往带有抛洒、投掷等变质量、变惯量的行为。为此需要一类具有自适应能力的控制器,以适应此类系统变化,并为观测器提供相对准确的质量与惯量变化。
定理1考虑四旋翼系统动态模型如式(1)~式(2)所示,设计控制律
(27)
(28)
(29)
(30)
组成闭环控制系统,则闭环系统渐进稳定。其中
(31)
(32)
(33)
(34)
(35)
(36)
(37)
(38)
(39)
(40)
(41)
(42)
(43)
(44)
(45)
(46)
(47)
证明:以滚转通道为例,
(48)
可以重构为
(49)
(50)
(51)
选取一个候选李雅普诺夫函数
(52)
(53)
(54)
(55)
(56)
(57)
(58)
(59)
(60)
代入V2,由此可得
(61)
综上,在该控制器作用下,φ的渐进稳定性得到证明。考虑本文设计的其余滑模函数σi和控制器ui,其余通道的稳定性证明可按照相同思路进行,取李雅普诺夫函数
(62)
(63)
为验证观测器及自适应算法的收敛性和趋近律的有效性,本节选择MATLABR2017a搭建仿真模型。实验以森林灭火为背景,测试跟随无人机在完成编队任务的同时投掷碘化银增雨焰条和均匀喷洒干冰的控制效果。仿真初始参数设定如表1所示。
表1 仿真初始参数
虚拟无人机轨迹选取螺旋线方程,表达式为Pd=[0.5cos(0.5t)0.5sin(0.5t)2+0.1t]。设无人机质量m=(3-0.03t) kg;转动惯量Ix=Iy=(0.04-0.000 6t) kg·m2,Iz=(0.08-0.000 6t) kg·m2;时变有界时延函数δ(t)∈[0,1];dFx=0.1sin(0.1πt),dFy=0.1cos(0.1πt),dFz=0.2cos(0.2πt)为各向扰动。仿真结果如图3~图7所示。
图3 螺旋线跟踪位置变化
图4 位姿观测误差
图5 位置跟踪误差
图6 质量自适应值
图7 部分系数自适应值
图8 山区路径跟踪图
选取桂林(110.61°E,25.07°N)处的高度值绘制如图8所示地形,面积为512×512 m2。为验证间断投掷时控制器对质量阶跃变的适应能力,选取m0=3 kg,每隔6 s抛下一个Δm=0.5 kg的增雨焰条,共计i=5根,转动惯量Ix=Iy=0.04 kg·m2不变,Iz0=0.08 kg·m2且每次下降0.005 kg·m2。其他参数设定与4.1节相同,结果见图8~图11。
图9 姿态跟踪误差
图10 质量自适应值图
图11 部分系数自适应值
从以上两组仿真可以看出,利用本文所提方法,在变时延存在下的情况下,无人机偏队对于变质量变惯量行为具有良好的控制能力,编队误差快速收敛至0,且未出现时间滞后现象。
本文提出了一种基于时延观测器的旋翼无人机自适应编队控制方法,在领航跟随法的基础上,抑制无人机编队中的通信时延与工作引起的惯量变化。基于无人机系统动力学模型设计了变时延状态观测器,对领航无人机状态进行观测和补偿。在补偿后的被控对象基础上,设计了自适应滑模控制器,对变负载工作状态下的质量和惯量进行估计。仿真结果表明该方法对变时延和变惯量条件下的编队控制有较强的鲁棒性。
本文选择领航跟随法进行编队验证是基于其原理简单、便于实现的特点。下一步拟将时延观测器的设计方法与基于一致性的编队方法相结合,弥补其被动式收敛的不足,提高控制精度和速度。