通信拓扑切换下的多飞行器协同拦截方法

2019-07-05 11:21赵恩娇王松艳
宇航学报 2019年6期
关键词:观测器制导机动

赵恩娇,杨 明,晁 涛,王松艳

(哈尔滨工业大学控制与仿真中心,哈尔滨 150080)

0 引 言

近年来,随着作战形式与航空航天技术的不断发展,传统采用单一飞行器攻击的困难日益增大,因此,多飞行器协同作战的理念逐渐得到重视[1-2]。相比于传统的一对一拦截方式,多飞行器协同制导具有较大的优势,协同制导能够提高制导精度和拦截概率,进而取得更好的拦截效果。因此,对多飞行器协同拦截方法的研究具有非常重要的工程意义。

齐射攻击是协同作战中一种典型的作战形式,要求来自不同方向和位置的导弹同时击中目标[3]。齐射攻击不仅能够大大提高命中概率,还能明显增强攻击效果。近年来,多导弹协同制导的研究已逐渐引起国内外学者的关注[4-10]。现有多数关于协同制导方法的研究,均是假设各飞行器之间的通信处于理想条件下,实际通信拓扑固定。然而复杂的战场环境中,通信极有可能受到干扰,同时,由信息传输引起的随机时延也无法避免。因此,在设计多飞行器协同制导方法时,必须考虑时变拓扑对制导效果的影响。多枚飞行器齐射攻击这类问题与多智能体协同控制具有相似之处,都是研究和探索由个体之间的相互作用所产生的群体协调现象的内在机制和原理,其中一致性理论已经被大量研究,并应用在相关背景中,如卫星编队控制[11],无人机协同控制[12],多机器人系统分布式控制[13]等。因此,多智能体协同控制的一些研究结果对于多飞行器协同制导律的研究具有一定的借鉴意义。

在末制导过程中,目标的逃逸机动是影响制导精度的主要因素。针对机动目标的跟踪,卡尔曼滤波技术是一种常用的方法,但其算法复杂,且需要精确知道系统模型和特性,不利于在飞行器攻防对抗过程中使用,需要探索不依赖于目标机动模型的目标信息估计新方法。扩张状态观测器(Extended state observer, ESO)可对系统中的不可测状态以及未知扰动进行观测,它是自抗扰控制[14]等非线性控制技术的重要组成部分,在干扰估计、故障诊断中发挥着重要作用,被应用到很多工程领域[15-17]。由于扩张状态观测器理论日趋成熟以及扩张状态观测器表现出的种种优势,因此进一步探索扩张状态观测器在协同拦截制导律研究中的应用具有重要的工程意义。

针对上述讨论中存在的问题,研究提出了一种适用于通信拓扑切换情况下的多飞行器协同拦截方法。将目标的状态视作扰动,并扩张成为新的一阶状态,再利用特定的非光滑非线性误差反馈,然后选择适当的观测器参数,得到系统所有状态的观测值,将得到的机动目标的状态在制导律中进行相应的补偿。利用有限时间一致性理论,为各飞行器设计一致性协议,使得各飞行器的剩余飞行时间能够收敛到一致,从而保证同时拦截机动目标,最后验证了此方法的有效性。

1 预备知识

1.1 图论

多个飞行器间通信关系可以用图G=(v,ε,A)来描述,非空节点的集合v={1,2,3,…,n},它的节点数目称为阶,边的集合ε⊂v×v={(i,j):i,j∈v}。加权邻接矩阵A=[aij]∈Rn×n,i,j=1,2,…,n,其中aij表示以i为起点,j为终点的边的权值。根据边有无方向,图分为有向图和无向图,如果无向图的邻接矩阵是对称的,则从节点i到节点j之间有一条边,也就是说(i,j)∈ε⟺(j,i)∈ε,则aij=aji>0,无向图的邻接矩阵一般是不对称的且节点之间的边是有方向的。节点j称作节点i的邻居,而节点i的所有邻居用集合可以表示为Ni={j∈v:(i,j)∈ε,j≠i}。

1.2 有限时间一致性理论

考虑如下非线性系统

(1)

式中:f(x):U→Rn为在包含原点的开区域U上对x的连续函数。

2 协同制导模型

2.1 飞行器与目标的相对运动模型

论文研究目的是为网络中的各个飞行器设计一个协同拦截方案。网络由n个飞行器组成,并将飞行器序号顺序标记为从1到n。

考虑平面内多个飞行器协同拦截单个高价值机动目标的情况,平面几何关系如图1所示。XOY为惯性参考坐标系,M代表飞行器,下角标为飞行器的编号,即Mi代表第i个飞行器,T为目标;带有下脚标i和t的变量分别表示第i个飞行器和目标的状态量;V,a,θ,λD以及R分别代表飞行器的速度、法向加速度、弹道倾角、视线高低角和弹目相对距离。

图1 多飞行器与目标的相对运动关系Fig.1 Relative kinematics of flight vehicles and target

由图中的飞行器和目标间的相对运动关系,以第i个飞行器为例,可以得到如下第i个飞行器与目标的相对运动关系。

(2)

(3)

式中:wR和uRi分别是目标加速度和第i个飞行器加速度在视线方向上的分量;wλ和uλi分别是目标加速度和第i个飞行器加速度在视线法向上的分量。

当多个飞行器协同拦截空中来袭机动目标时,如果采用齐射攻击的作战方式,也就是要求来自不同位置和方向的多个飞行器同时击中目标,就可以大大提高命中目标的概率,并增强摧毁目标的效果。研究中要求多个飞行器同时击中目标,也就是要求各飞行器的剩余飞行时间达到一致,因此也属于一致性问题。

2.2 协同制导模型

根据上节描述飞行器与目标之间的相对运动关系,以第i个飞行器与目标的相对运动关系为例给出协同制导模型。在视线坐标系下相对运动方程描述为

(4)

式中:Ri表示第i个飞行器与目标之间的相对距离;VRi表示第i个飞行器与目标之间视线方向的相对速度分量;Vλi表示第i个飞行器与目标之间视线法向的相对速度分量;uRi和uλi分别表示第i个飞行器的加速度在飞行器与目标的视线方向及视线法向的加速度分量;wRi和wλi分别表示目标的加速度在飞行器i与目标的视线方向及视线法向的加速度分量。

在多飞行器系统执行协同拦截任务时,为了达到同时击中目标的目的,要求各飞行器具有时间一致性,也就是剩余飞行时间一致。Tgoi表示飞行器i与目标之间末制导剩余时间,采用下式估计飞行器的剩余飞行时间,这种估算方法在制导末期估计精度较高

(5)

为了得到Tgoi的变化率,对上式求导可得

(6)

为了实现多飞行器同时拦截目标,需要对各飞行器末制导剩余飞行时间进行控制,使得多个飞行器的Tgoi能达到一致,式(6)中uRi即为剩余时间变化的控制量。

在末制导过程中,当弹目接近速度小于零、视线转率接近于零时,根据平行接近原理,导弹与目标在视线方向上的加速度分量对于导弹拦截目标没有影响,因此在制导律设计时可以不考虑目标在视线方向的加速度分量[19]。因此,在研究中,考虑多个飞行器协同拦截来袭目标的情况,弹目接近速度一定小于零,可以假设目标机动加速度在视线方向的分量为零,即wRi=0,则式(4)中第二个方程可以化简为

(7)

(8)

将上式代入式(4)、式(7)并结合式(6),可以得到如下协同制导模型

(9)

在本研究中采用切换的通信拓扑结构,各飞行器根据通信拓扑结构与相邻的飞行器也进行信息交互,达到各飞行器的剩余飞行时间一致。在协同拦截问题的研究中,多对一制导律的设计包括两个主要内容:①通过对目标状态的精确估计来设计合理的制导律对目标的机动进行补偿,保证每个飞行器与目标间的视线旋转运动趋于稳定;②对多个飞行器到达目标的时间进行协调,以实现同时拦截的目的。

3 基于ESO的目标加速度估计

(10)

(11)

(12)

根据ESO理论,对式(12)设计如下的ESO

(13)

在本文协同拦截机动目标的研究中,假设各飞行器分别对目标的状态进行估计,然后将观测结果补偿到制导律中。

4 基于有限时间一致的协同制导律

根据上文的研究成果,本节给出拦截机动目标时利用ESO的估计结果进行协同拦截制导律的设计方法。

协同制导模型可知,多飞行器的协同拦截问题被转化为多飞行器系统的时间一致性问题。不仅需要设计合理的制导律对机动目标加速度进行补偿,还需要设计合理的一致性控制协议,保证各飞行器的剩余飞行时间达到一致。

(14)

(15)

此时,引入新的变量Tfi,定义Tfi为在t时刻预测得到的第i个飞行器与目标的交会时刻,则有

Tfi=t+Tgoi

(16)

对式(16)求导,并结合式(9)中剩余飞行时间变化规律可以得到

(17)

根据有限时间一致性理论,为第i枚飞行器设计视线方向的控制量

(18)

用Tgoj-Tgoi替换式中的Tfj-Tfi,Tgoi为第i枚飞行器到达目标的剩余飞行时间,Tgoj为第j枚飞行器到达目标的剩余飞行时间,因此可以得到多飞行器系统有限时间一致性定理。

假设1[21]. 假设飞行器间的通信拓扑是无向联通的,即对应于无限的时间序列[ts,ts+1),s=0,1,2,…,存在切换信号σ: [0, ∞)→P和常数T1,T2满足T1>T2>0,其中0

定理1. 对于协同制导系统(9),存在正常数T2>0使得假设1成立,采用如下控制协议

(19)

可以保证多飞行器同时拦截目标,且末制导剩余时间的一致时间

(20)

在每个区间[ts,ts+1),s=0,1,2,…,上,选取半正定函数

(21)

作为一致性分析的Lyapunov函数。

由于G(A)是连通的,V1(Tgo)=0表示对于任何i,j,都有Tgoi=Tgoj。由矩阵A的对称性可知

(22)

因此,

(23)

显然

(24)

如果V1(Tgo)≠0,

(25)

令L(A)的根λ1(LA),λ2(LA), …,λn(LA)按照增序排列。因为G(A)是联通的,根据引理1,得λ1(LA)=0,λ2(LA)>0。并且,

(26)

因此,

(27)

给定初始状态Tgo(0),如果V1(0)≠0,根据微分相似原则可以得到

(28)

并且

(29)

因此,V1(t)会在有限时间t1收敛到0,V1(t)与G(A)的代数连通性是近似相关的,因此定理1能够解决有限时间一致性问题。

(30)

飞行器法向控制指令由设计的导引律给出,本文设计有限时间导引律并对目标机动进行补偿

(31)

式中:wλi为估计得到的目标加速度值,βi>0, -1<ηi<1。

5 仿真分析

为了验证本文设计的利用扩张状态观测器(ESO)的协同制导律的在通信拓扑切换情况下的制导性能,采用如下仿真条件进行仿真校验。目标的机动信号采用机动频率为0.5 Hz,最大机动能力为amax=±3的方波信号为机动目标信号。综合考虑系统的估计精度、动态响应速度等因素,以第1枚飞行器为例,参数取值分别为β11=40,β12=140,δ1=0.001,α1=0.4,其他飞行器的参数取值与第1枚飞行器相同。仿真步长(系统的基础采样时间)为0.005 s。

各飞行器的初始状态参数如表1所示。

表1 飞行器初始状态参数Table 1 Initial state parameters of flight vehicles

三个飞行器间的通信拓扑结构如图2所示,飞行器间的通信拓扑结构以8 s为周期,每2 s切换一次,切换顺序依次为(a)→(b)→(c)→(d)。

图2 通信拓扑结构Fig.2 Communication topologies

可以得到对应的邻接矩阵为

(32)

利用上述仿真初始条件,得到如下仿真结果。图3为目标机动加速度估计值,图4为各飞行器的飞行轨迹图,图5为各飞行器与目标之间的距离变化曲线,图6给出了各飞行器的剩余飞行时间变化曲线,图7给出了各飞行器视线法向控制量变化曲线,图8给出了飞行器1和飞行器2之间的通信拓扑连接权值。对比图3目标加速度的实际值和估计值可知,经过前期的调整,利用扩张状态观测器得到的目标加速度估计值后期与实际值曲线完全重合,可见观测精度较高,说明设计的状态观测器是有效的。由图4展示的三枚飞行器协同拦截空中来袭机动目标的场景可知,来自不同方向和位置的三枚飞行器给来袭的目标形成了包围的态势,大大减小了机动目标逃逸的可行性,提高了摧毁目标的概率。观察图5的弹目距离曲线可知,各飞行器到目标的距离在初始阶段有很大差异,因此需要对飞行器的状态进行适当的调整,图7的剩余飞行时间曲线也体现了这一点,经过对剩余时间的调整,剩余飞行时间收敛到一致,并且各飞行器的弹目距离也在同一时刻变为零,说明三枚飞行器同时击中目标,实现了对来袭的机动目标的协同拦截。通过在控制指令中对机动目标的加速度进行补偿,图9的飞行器法向加速度指令变化曲线后期趋于稳定,因此各飞行器的视线转率在控制作用下能够稳定在零附近,保证飞行器能够击中目标。因此论文中设计的协同制导方法在通信拓扑切换的情况下是有效的。

图3 目标加速度估计值Fig.3 Estimation of the target acceleration

图4 飞行轨迹Fig.4 Trajectories of flight vehicles

图5 弹目相对距离Fig.5 Distance between flight vehicles and the target

图6 剩余飞行时间Fig.6 Time-to-go of flight vehicles

图7 法向加速度指令Fig.7 Control command perpendicular to the LOS

图8 飞行器1和飞行器2之间通信权值Fig.8 Communication connection weight value between flight vehicle 1 and flight vehicle 2

为验证本文设计方法的有效性及分析通信拓扑切换对仿真结果的影响,这里给出相同仿真条件下固定拓扑条件下的部分仿真结果图,其中通信拓扑采用图2(c)所示的结构图。选取仿真结果中比较有代表性的剩余飞行时间和弹目相对距离仿真结果图与通信拓扑切换情况下的仿真结果进行对比。

图9 固定拓扑条件下的剩余飞行时间Fig.9 Time-to-go of flight vehicles in fixed topology

图10 固定拓扑条件下的弹目相对距离Fig.10 Distance between flight vehicles and the target in fixed topology

观察固定拓扑条件下同样仿真条件得到的剩余飞行时间曲线和弹目相对距离曲线如图9和图10可知,本文设计的协同拦截方法在通信拓扑固定和切换两种情况下都能实现剩余飞行时间的一致,从而完成协同拦截任务,由弹目相对距离曲线可知,两次仿真的弹目相对距离都能在同一时间收敛到零。同时,对比两种情况下的剩余飞行时间,通过局部放大图可以发现,通信拓扑切换条件下的一致收敛时间在7 s左右,而固定拓扑条件下的一致收敛时间在4.5 s左右,由此可见,切换的网络会影响一致收敛时间,使的系统达到一致的时间延长。

6 结 论

本文针对机动目标加速度的协同拦截问题,提出了一种适用于通信拓扑切换的基于扩张状态观测器实现协同拦截机动目标的新思路。设计扩张状态观测器估计目标加速度,并在有限时间制导律中进行相应的补偿,保证各飞行器能够命中目标。同时,基于有限时间一致性理论设计了多飞行器系统协调控制量,使得各飞行器剩余飞行时间达到一致,并对系统有限时间稳定性进行分析,从而保证了在通信拓扑切换的情况下多个飞行器能够同时到达目标。仿真研究表明,基于扩张状态观测器估计目标加速度的方法具有算法简单、收敛速度快、估计精度高的优点,且无须建立机动目标模型。并且利用多智能体一致性理论设计的控制协议能够使得飞行器状态快速收敛,实现了有限时间一致性。表明本文设计的协同拦截方法是有效的。

猜你喜欢
观测器制导机动
含干扰项的非线性广义系统执行器故障估计*
多飞行器突防打击一体化微分对策制导律设计
THAAD增程型拦截弹预测制导方法
基于观测器的线性系统非脆弱鲁棒控制及仿真
What Are the Different Types of Robots?
高超声速伸缩式变形飞行器再入制导方法
机载武器导航与制导关键技术研究
基于非线性干扰观测器的航天器相对姿轨耦合控制
基于观测器的传感器故障检测方法对比分析
12万亩机动地不再“流浪”