池海红,丁栖航,张国良
(1. 哈尔滨工程大学智能科学与工程学院,哈尔滨 150001;2. 中国运载火箭技术研究院,北京 100076)
随着各种军用高速飞行器机动能力的不断提升,用单枚导弹来打击这种具有高速高机动特性的目标变得越来越困难[1-3]。由于近年来多智能体一致性理论和信息通信技术的快速发展,使各导弹间的实时信息通信成为可能。在成员间可以进行信息交互的基础上,多枚导弹协作打击目标成为一种有效且可行的打击方法。因此,对协同制导律的研究对于未来战场具有非常重要的意义。
协同制导律要求打击系统中的每个成员必须同时命中目标,甚至在此基础上,要求各导弹以各自不同的视线角来命中目标,以达到对目标更好的毁伤效果[4-6]。
文献[7]针对反舰导弹,首次提出了攻击时间可控制导律(ITCG),其将比例导引律结合攻击时间误差偏置项得到导引律,通过对各反舰导弹预置相同的攻击时间,使多枚反舰导弹同时命中目标。文献[8]根据攻击时间误差和视线角误差设计了一个新型的滑模面,在各导弹同时击中目标的基础上,各导弹可以达到各自的期望视线角。协同制导系统采用这类打击方式时,各个导弹之间没有通信,等同于每一枚导弹单独在期望攻击时间约束下进行打击,对静止和慢速移动的目标具有较好的打击效果,但在突发情况下预设理想攻击时间是不太现实的。
随着信息通信技术的发展,导弹之间的信息共享也成为可能。文献[9]在传统ITCG基础上,由各导弹的攻击时间实时均值与实际攻击时间的误差组成ITCG中的误差反馈项,不再需要预设期望的攻击时间。伴随有限时间控制理论和多智能体一致性理论的兴起,结合两种理论的协同制导律也得到了快速发展。文献[10]根据有限时间控制理论,设计了有限时间一致性协议,并在此基础上设计了协同制导律,使各导弹可以在有限时间内同时命中固定目标,最后在协同制导系统中增加了扩张状态观测器来观测目标的机动信息,增强了系统的鲁棒性。文献[11]设计了有限时间扰动观测器来观测机动目标的加速度,并设计了新型的非奇异快速终端滑模面(NFTSM),两者结合设计了一种可打击机动目标的协同制导律。文献[12]针对大机动目标,设计了基于自适应超螺旋滑模控制理论的一阶有限时间一致性协议,在此基础上在视线方向设计协同制导律,在有限时间内将攻击时间收敛到一致的同时,有效地保证了系统存在外部扰动时的鲁棒性;此外在视线法向设计了基于自适应律和有限时间NFTSM的协同制导律,使视线角在有限时间内收敛到期望值。尽管有限时间协同制导律可以在有限时间内完成各导弹的攻击时间趋于一致和各导弹的视线角达到期望值的任务,但系统收敛时间上界很大程度取决于系统的初始值,在系统初始值很大或者不可确定的时候,收敛时间上界也可能会变得很大甚至不可预测。
随着固定时间控制理论的兴起,结合了固定时间控制理论的协同制导律得到了快速发展,固定时间控制有着系统收敛时间上界与系统初始状态无关的优点。文献[13]设计了二阶固定时间一致性协议和固定时间滑模面,并将两者结合设计了协同制导律,针对固定目标,在三维空间中进行了仿真验证。文献[14]在视线方向上设计了基于固定时间多智能体一致性理论的攻击时间协同制导律,在视线法向设计固定时间NFTSM,针对高机动目标在固定时间内满足视线角约束下的攻击时间一致。文献[15]基于固定时间一致性理论为多个主飞行器设计了协同制导律,使各个主飞行器可以在固定时间内同时命中目标,并为各个主飞行器所在群组中的从飞行器设计协同制导律,使每个组的从飞行器可以与其所在组的主飞行器的攻击时间在固定时间内达到一致,最后使整个打击群组在固定时间内同时命中目标。尽管固定时间协同制导律可以使系统收敛时间上界通过控制器参数准确确定,然而两者之间却没有较为明确的关系,大多数情况下都需要经过对控制器参数的复杂运算才能确定具体值。
为了克服有限时间控制和固定时间控制的缺点,文献[16]首次提出了预定时间控制理论,其最大的优点在于系统收敛时间的上界可以通过一个控制器中的显式参数直接设置,不再需要对控制器中的多个参数进行复杂运算。文献[17]根据预定时间控制理论,在二维空间中在切换通信拓扑下设计了基于预定时间一致性的协同制导律,使得各导弹的攻击时间在预定时间内收敛到一致。
受以上文献启发,针对三维空间中的机动目标,设计基于视线角约束和攻击时间约束的预定时间三维协同制导律。贡献如下,设计了一个新的预定时间收敛的非线性系统,其收敛时间上界可以通过显式参数直接进行设置。基于此系统设计了新的预定时间多智能体一致性协议,在此基础上设计了视线方向的协同制导律,使各导弹的攻击时间在预定时间内收敛到一致。此外设计了新型预定时间收敛非奇异快速终端滑模面,在此基础上设计了视线法向的协同制导律,使各导弹的视线角可以在预定时间内达到期望值。
在本文中,假设各导弹之间可以相互共享信息,既通信方式为双向通信,所以导弹之间通信拓扑图可以用无向图G=(v,ζ,A)来表示,v=(v1,v2, …,vn)是无向图G的所有节点的集合;ζ代表了无向图G中节点之间的连线;A=[aij]∈Rn×n为权重系数矩阵。在本文中,如果导弹i和j可以实现相互通信,则aij=aji=1,否则aij=aji=0。如果无向图中任意两个节点都可以通过一条无向路径连接起来,则称此无向图是连通的。
引理1.[18]设LA=[lij]∈Rn×n为与无向图G相对应的拉普拉斯矩阵,矩阵定义为
(1)
且LA具有如下性质:
1)0是LA的一个特征值,且其对应特征向量为1N=[1,…,1]T∈Rn。
3)如果无向图G是连通的,λ2(LA)>0是LA的第二大特征值。
引理2.[19]设x1,x2,…,xn≥0,有如下性质:
(2)
考虑如下一类非线性系统
(3)
式中:x∈Rn为系统状态;f(x;ρ):Rn→Rn是一个非线性函数,ρ∈Rb为系统的常量参数,假设原点为系统的平衡点,所以f(0;ρ)=0。系统的初始状态为x0=x(0)∈Rn。
定义1.[20]如果系统(3)是全局渐近稳定的,并且对于∀x0∈Rn,存在0≤T<∞,当t>T时,系统(3)的解满足Φ(t,x0)=0,且系统状态收敛到原点的收敛时间函数T(x0)=inf{T≥0:Φ(t,x0)=0, ∀t≥T},其中T:Rn→R+∪{0},此时称系统(3)为全局有限时间稳定。
定义2.[21]如果系统(3)是全局有限时间稳定的,并且收敛时间的上界是与系统初始状态无关的,即∃Tmax>0,对于∀x0∈Rn,满足T(x0)≤Tmax<∞,此时称系统(3)为全局固定时间稳定。
注1.对于∀x∈R,且k>0,定义sigk(x)=|x|ksgn(x)。对于∀x=[x1,…,xn]T∈Rn, sigk(x)=[sigk(x1),…,sigk(xn)]T。
引理3.[22]考虑如下受到扰动的二阶非线性系统
(4)
对系统(4)设计固定时间扰动观测器
(5)
(6)
定义3.[23]对于系统(3),如果参数ρ和预定的参数Tp满足关系:Tp=Tp(ρ)>0。如果系统(3)是固定时间稳定的,且对于∀x0∈Rn,收敛时间T(x0)满足T(x0)≤Tp<∞,此时称系统(3)为全局预定时间稳定,即系统的收敛时间上界可以由系统中的一个参数直接获得。
定理1.设计一个新的预定时间收敛系统
(7)
式中:x∈R为系统状态,对于∀x0=x(0)∈R,Tp>0, 0<α<1,k>0为系统参数,则系统(7)是全局预定时间稳定的,且收敛时间满足supx0∈RT(x0)=Tp。
证.设Lyapunov函数为
V=x2
(8)
对上式求导得
(9)
进一步得
(10)
进而可得系统状态收敛到原点的时间T(x0)
(11)
可得系统收敛时间满足
supx0∈RT(x0)=Tp
(12)
由定义3可知,系统为预定时间稳定,预定的收敛时间上界为Tp。
注2.文献[23]设计了一个预定时间收敛系统,考虑到其设计的预定时间收敛系统中的各项不能以各自不同的倍数进行放缩,本文定理1在其设计的系统基础上增加了这一功能,设计了一个新的预定时间收敛系统,相较于原有系统,新系统提升了系统的可调整性的同时保留了预定时间收敛特性。
在三维空间中,多个导弹协作打击敌方目标,在末制导阶段单枚导弹与目标的三维几何关系如图1所示。OXYZ为惯性坐标系,OXLYLZL为视线坐标系;M为导弹,T为目标;R,θL和ψL分别代表弹目相对距离、视线倾角和视线偏角;AMx,AMy,AMz和ATx,ATy,ATz分别为导弹的加速度AM和目标的加速度AT在视线坐标系下的分量。
图1 导弹目标拦截示意图Fig.1 Missile-target engagement geometry
由图1可以得到弹目三维相对运动模型为式(13)~(15)
(13)
(14)
(15)
式中:amx,amy,amz和atx,aty,atz分别为AMx,AMy,AMz和ATx,ATy,ATz的大小,皆为标量。将第i枚导弹的弹目相对运动模型分为视线方向和视线法向建立状态空间模型。
与式(13)~(15)结合可以得到第i枚拦截弹的弹目相对运动状态空间模型为
(16)
式中:
第i枚导弹的剩余攻击时间tgoi可近似得
(17)
攻击时间tfi可以近似为
tfi=t+tgoi
(18)
将式(18)求导并与式(16)联立,得到包含视线角约束的协同制导模型为
(19)
(20)
在本节中,将会分别设计视线方向的协同制导律ari和视线法向的协同制导律ai,其中ari使各导弹的攻击时间在预定时间内收敛到一致,ai使各导弹在预定时间内达到各自的期望视线角。
假设1.存在0≤dr,d1,d2<∞,使得|di(1)| 为了提升对目标打击的成功率,本文采用多枚导弹协作同时命中目标的打击方案。本节基于预定时间控制理论,针对一阶多智能体系统,设计一种新的预定时间多智能体一致性协议,在此基础上,基于本文的协同制导问题,以各导弹的攻击时间tfi为协调状态,结合固定时间扰动观测器式(5)设计视线方向的协同制导律ari,引入固定时间扰动观测器目的在于观测目标加速度在视线方向上分量的大小,设T*为预先设定的不变常数,使各导弹的攻击时间在预定时间内达到一致,并通过设计相应的Lyapu-nov函数严格证明了本文提出的预定时间协同制导律可以使协同制导系统达到预定时间稳定。 视线方向协同制导模型为 (21) 根据定理1设计一种新的预定时间一阶多智能体一致性协议 (22) 式中:Tc>0, 0<αr<1,kr>0,i=1,…,n,λ2(LA)min为无向通信拓扑图为连通情况下λ2(LA)的最小值,n为智能体的个数。 设视线方向的预定时间协同制导律ari (23) 定理2.在假设1和各导弹的通信拓扑始终为连通的前提下,针对系统(21),基于预定时间一致性协议(22)设计的预定时间协同制导律(23)可以使各导弹的攻击时间在预定时间T*+Tc内趋近于一致。 证.将协同制导律(23)代入到系统(21)中可得: (24) (25) 设Lyapunov函数为 (26) 式中:tf=[tf1,tf2,…,tfn]T,tf的初值tf0=tf|t=0。 (27) 根据引理2,可得 (28) 各导弹的通信拓扑图G始终是连通的,所以LA始终是对称的半正定矩阵。可得 LA=P-1ΛP (29) (30) 从式(30)可知,满足引理1中性质(4)的应用条件,根据引理1可得 (31) 因为 (32) 将式(31)和式(32)代入式(28)中可得 (33) 设Vr1=2λ2(LA)Vr,则上式转化为 (34) 将上式进一步展开 (35) 对上式积分可得 (36) 由上式积分可得各导弹的攻击时间收敛到一致所需的收敛时间T(tfo)满足 (37) 由上式可知 suptf0∈RnT(tf0)=Tc (38) 对于∀t>T*+Tc,Vr=0,即tfi=tfj,其中i,j=1,…,n,即各导弹的攻击时间在预定时间内达到一致。 注 3.通过在协同制导律(23)中加入λ2(LA)min,就会满足不等式(36),所以,在制导过程中发生通信拓扑切换但保持连通的情况下,系统的收敛时间上界并不会发生任何改变,依然是在设定的预定时间内稳定。 综上所述得到结论,系统(21)在协同制导律(23)的控制下,各导弹的攻击时间可以在预定时间T*+Tc内收敛到一致。证明完毕。 在本节中,基于实际打击任务,期望导弹以不同的视线角直接命中目标,以达到对目标的最大毁伤效果,本节基于预定时间控制理论,设计一个新的预定时间非奇异快速终端滑模面和预定时间滑模趋近律,针对视线角约束问题,在视线法向设计由引理3中的扰动观测器和本文设计的新型预定时间非奇异快速终端滑模面组合的预定时间协同制导律ai,使各导弹在预定时间内达到期望的攻击角,同样的,引入扰动观测器的目的在于观测目标加速度在视线法向上的分量。 根据文献[24]设计非线性函数w(x),同时定义非线性函数f(x) (39) f(x)=sig1+α2i(x) (40) 式中:x∈R, 0<α2i<1, 0<δ<1,w0=(1+α2i)δ-α2i,σ0=-α2iδ-(α2i+1)。 w(x)和f(x)的导数为 (41) (42) 根据定理1设计预定时间非奇异快速终端滑模面 (43) 式中:T2i>0,k2i>0,Si=[Si(1),Si(2)]T,Si的初值Si0=Si|t=0,w(x3i)=[w(x3i(1)),w(x3i(2))]T,f(x3i)=[f(x3i(1)),f(x3i(2))]T,i=1,…,n,n为导弹的个数。 定理3.针对系统(20),在系统到达了式(43)所示的预定时间非奇异快速终端滑模面后,各导弹的视线倾角θLi和视线偏角ψLi均可以在预定时间T2i内达到期望值。 证.系统到达滑模面(43)后,即Si=0。 在系统刚到达滑模面时,如果系统状态x3i满足|x3i(j)|>δ,j=1,2。此时滑模面Si为 (44) 由上式可得 (45) 设Lyapunov函数为 (46) 对上式求导得 (47) 根据引理2可得 (48) 根据定理1,在到达滑模面(43)之后,x3i可以在预定时间T2i内到达零附近得小邻域内,这个小邻域为|x3i(j)|≤δ,j=1,2。 当|x3i(j)|≤δ,j=1,2,滑模面Si满足 (49) 由上式可知 (50) 根据式(46)可得 (51) 由式(51)可知,系统(50)会在|x3i(j)|≤δ的范围内,j=1,2,x3i会继续向系统原点进行收敛,且满足渐进收敛条件。 注4.从后文可知,由于预定时间协同制导律(54)中存在负幂次项(1-α2i)|x3i(j)|-α2ix4i(j),j=1,2,在系统接近平衡点时式(54)会存在奇异现象,所以借鉴文献[24],通过设计w(x)对滑模面进行分段处理,当系统状态进入到平衡点附近的小邻域时,用非奇异的项将负幂次项替换掉,其中w(x)中系数设计原则在于,在解决奇异问题且保证系统稳定的基础上,使w(x)的一阶导数连续,防止因滑模面分段造成控制律的不连续,从式(49)~(51)可知,在进入到滑模面的第二阶段后,系统满足渐进收敛条件,尽管系统并不是直接收敛到平衡点,但本文通过设定小的滑模面分段值δ=0.01,其对应到本问题中的视线角误差约为0.57°,这就是说在预定时间内可以使视线角误差达到0.57°,且通过后文的仿真验证可知,视线角是可以在预定的收敛时间上界内,与期望值的差值达到(10-3)°级别。 证明完毕。 进一步地,对式(43)求导得 Ai+Biai+di (52) 设计预定时间滑模趋近律为 (53) 式中:T1i>0, 0<α1i<1,k1i>0。 将式(53)和式(52)联立可得系统(20)的预定时间协同制导律 (54) 定理4.针对系统(20),协同制导律(54)可以使系统在预定时间T*+T1i内到达滑模面。 证.将协同制导律(54)代入式(52)可得 (55) 选取Lyapunov函数为 (56) 对其求导得 (57) (58) 根据引理2,可得 (59) 根据定理1,可知系统(20)在预定时间内到达滑模面,滑模面收敛时间T(Si0)满足 supSi0∈R2T(Si0)=T1i+T* (60) 进一步地,系统(20)的系统状态收敛时间T(x3i(0))满足 supx3i(0)∈R2T(x3i(0))=T1i+T2i+T* (61) 综上所述,本节通过设计合理的Lyapunov进行了的严格的稳定性证明,本文设计的协同制导律ari和ai,可以使各导弹的攻击时间在预定时间内收敛到一致,且可以使各导弹的视线角在预定时间内达到期望值。 在本节中,以在三维空间中三枚导弹拦截一个机动目标为背景,验证本文提出的预定时间协同制导律的有效性,由于在2.1节中得出了本文的协同制导律可以保证各导弹在切换通信拓扑但保持连通的情况下,各导弹的攻击时间也可以在预定时间内收敛到一致的结论。所以本文直接在如图2所示的切换通信拓扑条件下进行数学仿真。 图2 通信拓扑图切换过程Fig.2 Communication topology change process 图2中M1,2,3分别代表导弹1,2,3。表1中x,y和z为目标以及各导弹在惯性坐标系下的位置坐标,θ,ψ和v分别为弹道倾角、弹道偏角和速度值。 表1 初始参数Table 1 Initial parameters 协同制导系统的初始条件见表1。 假设各导弹的法向加速度最大为10g,轴向加速度最大为5g,g=9.8 m·s-2,目标在三维空间中做机动规避的加速度在其速度坐标系下的表示见表2。 表2 目标加速度Table 2 Acceleration of the target 在上述一系列数学仿真背景的设定下,进行了对本文设计的预定时间协同制导律的数学仿真校验。将仿真校验分为两部分,3.1节为验证预定时间制导律(23)和(54),并将其与目前主流的如文献[14]中所设计的固定时间协同制导律进行对比分析,仿真结果如图3所示。3.2节对比了不同的预定时间参数设定对协同制导系统的影响,仿真结果如图4所示。 图3 第一组参数下的仿真结果Fig.3 Simulation results of the first set of parameters 图4 第二组参数下的仿真结果Fig.4 Simulation results of the second set of parameters 具体的协同制导系统的预定时间协同制导律参数设计为:视线方向协同制导律参数:Tc=55,n=3,λ2(LA)min=1,kr=20,αr=0.5。视线法向上协同制导律参数:δ=0.01,T2i=30,α2i=0.7,k2i=3,T1i=25,α1i=0.4,k1i=3,i=1,2,3,固定时间扰动观测器的收敛时间上界T*=10,简要来讲,各导弹攻击时间的预定收敛时间上界为T*+Tc=65 s,各导弹达到期望视线角的预定收敛时间上界为T*+T1i+T2i=65 s,各导弹的脱靶量如表3所示,仿真图像如图3所示。 在文献[14]中,基于固定时间一致性协议在视线方向上设计了协同制导律,又在视线法向上设计了基于固定时间非奇异快速终端滑模的协同制导律,文献[14]中设计的协同制导律具体内容如下。 根据文献[14],基于本文的背景下,针对系统(21),设计了视线方向协同制导律为 (62) 各导弹攻击时间的收敛到一致的收敛时间上界具体表达式为 (63) 针对系统(20),设计了固定时间非奇异快速终端滑模面 Sci=x4i+k1cisiga1ci(x3i)+k2cisiga2ci(x3i) (64) 式中:a1ci>1,0 在滑模面(64)的基础上设计了视线法向的协同制导律为 (k1cia1cidiag(|x3i(1)|a1ci-1, |x3i(2)|a1ci-1)+ k2cia2cidiag(|x3i(1)|a2ci-1, |x3i(2)|a2ci-1))x4i] (65) 系统到达滑模面时间上界满足 (66) 系统状态x3i到达系统原点时间上界满足 (67) 由于篇幅有限,不在文中展示此固定时间协同制导律的仿真图像,文中将只针对预定时间收敛和固定时间收敛这两种系统收敛方式的特点进行分析对比。 从表3、图3(a)~(b)可知,本文设计的预定时间协同制导律可以使三枚导弹同时命中机动目标,且从脱靶量来看,打击的准确度达到了厘米级别。从图3(c)可知,本文设计的预定时间协同制导律可以使各导弹的剩余攻击时间在7.32 s时达到一致,满足预期设定的在预定时间65 s内各导弹的攻击时间收敛到一致的设计目标。从图3(d)~(e)可知,视线角速率可以在25.10 s之前稳定到零附近极小邻域内,满足在预定时间65 s内收敛到零附近极小邻域的要求。 从图3(f)~(g)也可知,在25.27 s之前,θL和ψL与期望值的差值已经达到了(10-3)°级别,满足了在预定时间65 s内达到预定时间稳定的要求。由于篇幅原因,以第一枚导弹的视线方向控制输入为例来分析制导系统控制输入的变化过程,从图3(h)可知,控制输入是连续无抖振无奇异的,控制输入饱和持续时间较短,这对于实际协同制导系统来说,有利于维持制导系统的稳定性。以第一枚导弹对目标视线方向机动信息的观测情况为例来分析观测器的观测效果,从图3(i)可知,扰动观测器分别可以在6.89 s之前准确地观测外部扰动,满足其固定时间10 s内准确观测外部扰动的要求。 综上所述,本文设计的预定时间协同制导律在确定协同制导系统的收敛时间上界方面更具优势,因为可以通过协同制导律中的显式参数直接确定系统收敛时间上界,而从式(63)和式(66)~(67)可知,文献[14]中系统收敛时间上界尽管与系统初始条件无关,但收敛时间上界的表达式构成复杂,系统收敛时间上界和某个参数之间没有太直接的联系,这也体现了预定时间协同制导律的优势。 在3.1节中协同制导律参数的选取原则为预定的系统收敛时间上界接近于整个协同制导系统的工作时间,由于预定的时间本身就是系统的收敛时间上界,所以这样的参数设计是可以完成任务要求的。为了对比不同预定时间参数下协同制导系统的动态表现,由于篇幅有限,只为预定时间协同制导律设置第二组参数,其选择原则为追求更短的协同制导系统的收敛时间上界,具体协同制导律参数为Tc=20,T2i=30,T1i=5,T*=15,i=1,2,3,其余参数与3.1节中相同,同样的,简要来讲,各导弹攻击时间的预定收敛时间上界为T*+Tc=35 s,各导弹达到期望视线角的预定收敛时间上界为T*+T1i+T2i=50 s,同样由于本文篇幅有限,图4中仅展示第二组参数下的部分仿真图像。 从图4中各图分析可知,同第一组参数设定下的仿真相比,第二组参数下的制导系统攻击时间收敛过程中的动态表现变差,且控制输入饱和持续时间更长,视线角速率和视线角等收敛速度提升不是非常明显。综上所述,将预定收敛时间上界设置的过短,由于导弹自身的过载限制,对系统实际的收敛速度提升有限,但控制输入饱和持续时间变长,进而影响了扰动观测器的收敛速度,最后影响了各导弹攻击时间收敛的速度和动态表现。 本文针对在三维空间中多枚导弹协同打击机动目标的问题进行研究,首先在视线方向上,基于新设计的预定时间一致性协议设计了视线方向的协同制导律,可以使各导弹的攻击时间在预定时间内收敛到一致;此外,在视线法向上,基于新设计的预定时间非奇异快速终端滑模面和趋近律,设计了视线法向的协同制导律,使各导弹的视线角可以在预定时间内达到期望值。最后,对本文设计的预定时间协同制导律进行了相应数学仿真验证,并与固定时间协同制导律进行对比分析,又对不同预定时间参数设定下的协同制导系统的仿真表现进行了分析。综上所述,表明本文设计的预定时间协同制导律是有效的。2.1 视线方向预定时间协同制导律设计
2.2 视线法向上协同制导律设计
3 仿真校验
3.1 预定时间和固定时间协同制导律对比分析
3.2 不同预定时间参数下的对比仿真
4 结 论