基于时延补偿的AUV领航跟随编队控制

2020-04-28 02:04冯之文冯景祥

舰船电子对抗 2020年1期

冯之文，姚尧，苗艳，冯景祥

(江苏自动化研究所，江苏连云港 222006)

0 引言

在过去的几十年中，自主水下航行器(AUV)已被广泛用于执行各种水下任务，包括民用和军事应用，如深海检查、海洋测绘。对于某些特定应用，例如海洋采样、测绘和海底测量，通过多个AUV合作执行任务可以提高效率、增大服务区域并在发生故障时提供冗余，提高了系统的稳定性。一般来说，有3种主要类型的编队控制策略：即基于行为的策略[1-2]，虚拟结构策略[3-4]，和领导者-跟随者编队策略[5]。每种策略都有自己的优点和缺点[6]。在这些策略中，领导者-跟随者编队策略由于其简单性和可扩展性等优点而被许多研究广泛考虑。

在多AUV编队系统中，AUV的通信能力有限以及环境的限制，水声通信受到传播速度的限制，不可避免地会产生较大的时延;水声通信具有高噪声、多途干扰、多普勒传播等不稳定特性，使通信具有较高的误码率;水声通信所消耗的能量远高于陆上无线通信，造成水声通信范围远远变小。这类弱通信系统的主要特征有:不可忽略的通信时延、间歇性通信失效或中断、有限通信范围以及高误码率等。

信息延迟是弱通信系统必须面对的问题，对系统稳定性的影响不能忽视。由于接收到的领航AUV信息存在时间上的滞后性，系统在未来时刻的状态由当前状态和历史状态共同决定，系统的稳定性受到时延大小的影响。当个体间的信息传输延迟太大，超过某一临界值时，多AUV系统无法形成稳定的编队队形，使原来稳定的编队变为不稳定。文献[7]中，作者基于一致性的思想研究了水声通信带来的通信延迟问题，提出的控制律能够允许一定的通信时延，达到了编队控制的目的。文献[8]中，作者提出了具有通信约束的分布式水下航行器群编队控制算法，当航行器间的通信时延小于某个确定的上界时，算法是有效的。但是文中每个个体接收到的邻居个体的信息状态及其时间导数均存在一个固定的时延T，现实中个体与个体之间的通信时延是时变的，算法上具有一定的局限性。文献[9]中，作者针对时延问题，提出了一种不同时变通信延迟的解决方法，也是将AUV的编队时延问题转化成一致性问题。

目前，国内外虽然对编队控制的研究策略取得了一定的成果，有部分学者对此类问题展开了研究，但都是在较为理想的条件下展开研究，比如时延不变而且已知，或者时延可变但有时延上限，且大部分研究主要是进行一致性的算法设计，基于一些比较简单的模型得到一致性收敛的条件。基于以上的分析，针对通信延迟下，领航跟随编队控制方法队形稳定性变差的问题，本文提出了一种基于时延补偿的编队控制方案，采用反步法和李雅普诺夫直接法设计了领航跟随编队控制律，实现了理想通信情况下的编队保持。接着引入通信时延，利用最小二乘法根据领航AUV的当前和历史状态信息进行状态的拟合，根据时延误差预测出当前时刻的领航AUV的状态信息，带入到控制器中进行拟合。从仿真结果可以看出，该方法简单有效，可以减小编队的误差，提高编队的稳定性。

1 问题描述

1.1 AUV数学模型

本文只考虑AUV二维平面内的运动，因此只考虑AUV水平面内的数学模型，可分为运动学模型和动力学模型，分别如下：

(1)

(2)

从式(2)中可以看到，对于侧向速度vr而言，是没有任何外部输入的。

1.2 AUV领航跟随编队描述

考虑由n个AUV组成的系统，这些AUV将保持所需的编队队形，并且每个跟随AUV都可以和领航AUV组成1个子系统。对于每一个子系统，当领导者AUV巡航时，可以生成跟随者的参考轨迹，以使其跟随位置ηf相对于领导者位置ηl的距离为ρ，方向为α。我们提出了针对每个跟随者AUV的跟随编队控制算法。令ηl=[xl,yl,ψl]T，表示为领航者的位置矢量。然后，领导者的运动学模型可以描述为：

(3)

式中：vl=[ul,vl,rl]T，为领航者AUV的速度矢量。

类似地，跟随者AUV的运动学模型可以描述为：

(4)

如图1所示，跟随者AUV的期望位置和领航者AUV的几何关系如图1所示。

图1 领航跟随方法示意图

由此几何关系可以用领航者AUV的位置信息矢量表示跟随者AUV的期望位置矢量信息如下：

(5)

只要控制跟随船跟踪并沿着参考船轨迹运动，便可以实现编队航行。因此，基于领航-跟随方法的编队控制问题可以描述如下：在可以获知领导船的位置、姿态信息的条件下，为跟随船设计控制律，使得xf→xd,yf→yd,ψf→ψl。

1.3 控制律的设计

在这里首先假设领航者AUV与跟随者AUV之间的通信是理想的，即领航者AUV与跟随者AUV之间的通信不存在延时，在理想通信的情况下进行控制律的设计[10]。

(1) 运动学控制律的设计

由于AUV是欠驱动的，因此在其横向上没有控制输入。因此首先要设计控制速度uf和rf。定义跟随者AUV与参考船的绝对误差：

(6)

式中：ψd≜Atan2(-ey,-ex)，并定义d≜‖[ex,ey]T‖2，提出以下速度控制律，以使d和eψ收敛为零。

(7)

(8)

式中：ku,kr>0。

证明：应用上述控制律，误差动态描述可以写为：

(9)

又cosψd=ex/d,sinψd=ey/d，所以d和eψ对时间的导数可以写成：

(10)

eψ收敛到0的证明：

(11)

(12)

因此，可以容易地得出结论：eψ有界并收敛到零，即eψ是渐近稳定的。

d和vf的有界性：

-(d22/m22)vf-(m11/m22)×

{[-vf(taneψ-eψ/coseψ)-

kud/coseψ-al(·)-bl(·)taneψ]·

(13)

为了简化计算，对式(13)进行化简，在这里定义：

(14)

取李雅普诺夫函数为：

(15)

其导数为：

[g2(·)+eψ]dvf+g3(·)vf

(16)

根据杨氏不等式定理可以得出下列不等式：

(17)

所以可以得到：

(18)

(19)

(20)

因此可以得出结论：对于所有的t∈[t0,T]，vf,d都是一致有界的。现在考虑t∈[T,∞)的情况，根据eψ收敛到0的证明，随着T→∞，eψ收敛到0，然后，通过选择足够大的T和足够小的正常数ε,a,b，可以得出以下不等式：

(21)

然后，利用杨氏不等式，可以得出：

(22)

式(22)证明，对于t∈[T,∞)，vf和d都是有界的，结合之前证明的对于所有的t∈[t0,T]，vf,d有界，所以对于∀t≥t0，Vf和d是一致有界的。d的收敛性证明参照文献[11]的级联理论进行证明，不再进行赘述。

(2) 动力学控制律的设计

为了对动力学控制律进行设计，本文借助反演法将控制律扩展到动力学的层面上，将式(7)中的uf和rf作为虚拟的控制输入ufd和rfd。

首先引入误差变量：

(23)

式中：ufd和rfd为所需的速度控制输入。

速度误差的时间导数可推导为：

(24)

考虑由式(10)和式(24)描述的系统，应用以下动力学控制律：

(25)

式中：kτ1，kτ2为正数。

动力学控制律稳定性证明：

取李雅普诺夫函数：

(26)

其导数为：

(27)

根据杨氏不等式，可以获得以下不等式：

(28)

然后，如果选择速度控制增益，使得ku,kr>γ/2，则闭环系统渐近稳定。

2 基于时延补偿的编队控制

2.1 AUV通信方式

水下通信环境比陆地上要差得多，为了提高通信的稳定性，目前的AUV领航跟随编队一般选取领航AUV广播自身状态信息的方式，将信息传递给跟随AUV。如图2所示，设#1为领航者AUV，#2～#n为跟随者AUV，领航者AUV将自身的状态信息广播给跟随者AUV，跟随者AUV与领航者AUV、跟随者AUV与跟随者AUV之间均不进行通信。

图2 AUV群体通信方式

领航者AUV广播的状态信息为(x,y,ψl,t),x,y为领航者AUV的位置信息，ψl为领航者的航向角信息，t为发送信息时的时间，即时间戳，当通信理想时，按照1.3节所设计的控制律编队就可以得到很好的保持，即：

(29)

但在实际应用当中，AUV之间的通信并不能被理想化，通信延时是必然存在的，领航者在t时刻广播的状态信息必然不能在t时刻被跟随者AUV所接收，对于不同的跟随者，存在着不同的通信时延τi，即跟随者AUV会在t+τi时刻接收到领航者AUV在t时刻广播的状态信息，此时若不进行补偿，则跟随者的控制律变为：

(30)

延时系统框图如图3所示。

图3 通信延时下的领航跟随编队控制系统框图

在此控制律下，队形的保持必然不如理想通信条件下的编队效果，因为控制律中的状态信息永远不是当前时刻的领航者的状态信息，因此，需要对当前的情况采取一定的措施来改善通信延时对编队队形的影响。

2.2 AUV通信补偿原理

在实际问题中，人们常常需要从1组观测数据(xi,yi)，i=1,2,…,n中作出一种预测：下一个x对应的y值是什么，即预测函数y=f(x)的表达式。从几何上看，这个问题就是要由给定的数据点(xi,yi)，i=1,2,…,n去描绘曲线y=f(x)的图像，即所谓的数据拟合问题。插值方法可以作为处理这种问题的一种数值方法，但不是很好的方法。因为现在所给数据本身就不一定可靠，而插值曲线要求严格通过所给的每一个数据点，这种限制会保留所给数据的误差。此外，所给数据的数量通常很多，也会影响插值的效果。曲线拟合方法就是希望从这一大堆看上去杂乱无章的数据中找出规律来，设法构造一条所谓的拟合曲线，反映所给数据点总的趋势，最小二乘法就是这样的一种拟合方法。

由于AUV的机动性能不强，本文将基于最小二乘法提出补偿时延的方法。最小二乘法是很经典的参数估计方法，它计算快速简单，通常用多项式拟合模型去逼近目标轨迹，通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。

领航AUV广播的自身状态信息中包含(x,y,ψl,t)，假设领航AUV在tm时刻广播了自身的状态，系统中的某个跟随AUV在tn时刻接收到了领航者AUV在tm时刻(在这里，AUV自身信息传播时间忽略不计)的信息，则该跟随者AUV可以计算出时延τ，假设跟随者AUV在tn时刻之前一共接收到n个领航者AUV的状态信息，分别记为(x1,y1,ψl1,t1),(x2,y2,ψl2,t2),(x3,y3,ψl3,t3)...(xn,yn,ψln,tn)，本文的任务是根据这些历史信息尽可能去预测领航者AUV在tm时刻的状态信息(xm,ym,ψlm,tm)以及tm和下一通信时刻的中间状态信息。

本文中的领航者状态信息是一个四维数组时间序列，无法直接应用最小二乘法预测领航AUV当前时刻的状态，因此需要对过去时刻的状态信息进行相应的处理，本文将状态信息(xi,yi,ψli,ti)转化成3个二维状态(xi,ti),(yi,ti),(ψli,ti)，然后运用最小二乘法对历史时刻的数据进行拟合，可以得到3条关于自变量t的曲线方程如下：

(31)

根据拟合好的曲线对tm时刻的状态信息进行求解，将t=tm代入求解，得到xm,ym,ψlm，最终得到领航者经过时延补偿以后的状态量(xm,ym,ψlm,tm)，在下一个领航者状态信息到来之前，都将根据拟合好的状态曲线对领航者的状态信息进行预测，整个过程如图4所示。

图4 通信延时补偿下的领航跟随编队控制系统框图

2.3 算法流程

一般来说，曲线的拟合要用到过去时刻的大量AUV状态信息，但考虑到AUV在水中的机动性较差，也就是说AUV的运动趋势是缓慢变化的，因此在补偿通信延时，对领航者AUV的状态进行预测的时候，无需将过去时刻的所有状态信息考虑在内，只需要选取当前时刻之前的k组状态信息来拟合领航者AUV的运动状态，随着跟随AUV不断接收领航者广播的状态信息，跟随者AUV不断滑动采集当前时刻以及当前时刻之前的状态信息，实现了对领航者AUV运动轨迹的动态更新，这种做法可以提高补偿的快速性。

具体算法如下：

(1) 领航者AUV按周期向跟随AUV广播自身的状态信息；

(2) 跟随者AUV根据接收到的领航者AUV的状态信息计算出时延τ；

(3) 确定领航者AUV的前k个状态信息，根据最小二乘法对公式(31)进行拟合；

(5) 将预测得到的状态信息代入到设计好的控制器式(30)当中,得到下一时刻的状态量；

(6) 到达领航者AUV广播周期，返回(1)。

3 仿真实验

(1) 理想通信情况下的AUV领航跟随控制

由图5可以看出，在通信理想且连续的情况下，3个AUV在本文所设计的控制律中达到了较好的编队效果，图6和图7表明了领航者AUV和跟随者AUV之间的距离和相对方位角达到了仿真时所设置的期望值，验证了控制律的有效性。

图5 理想通信下AUV领航跟随编队路径图

图6 理想通信下领航跟随AUV之间的距离

图7 理想通信下领航跟随AUV之间的相对方位角

图8 通信延时下领航跟随AUV路径图

(2) 通信延迟下的领航跟随AUV编队控制

图8显示了通信延时下的领航跟随编队，由于通信延时和通信间隔的存在，相比于理想通信条件下，编队效果较差。根据图9可以看出，由于通信时延和通信间隔的存在，每隔10 s控制律才会做1次相应的调整，跟随者AUV与领航者AUV之间的相对距离已经不能维持在本文所设置的理想距离，并且领航者所做的是圆周运动，所以跟随者AUV与领航者AUV之间的距离在20 m上下浮动。由图10可以看出，跟随者AUV与领航者AUV的相对方位角也因为延时和通信间隔的存在无法达到较好的跟踪效果。

图9 通信延时下领航跟随AUV之间的距离

图10 通信延时下领航跟随AUV的相对方位角

(3) 时延补偿下的AUV编队控制

图11显示了通信延时情况下引入延时补偿和预测的编队效果，和理想通信条件相比，收敛速度略微有点差距但相比于通信延时情况，队形得到了很大的改善。从图12和图13可以看出，领航者AUV与跟随者AUV到了我们所期望的距离和方位角，达到了很好的跟踪效果。

图11 时延补偿下领航跟随AUV路径图

图12 时延补偿下领航跟随AUV之间的距离

图13 时延下领航跟随AUV之间的相对方位角

4 结束语

本文对AUV领航跟随编队控制中的通信延时问题提出了一种延时补偿的方法，领航AUV将自身状态传递给跟随AUV，跟随AUV根据领航AUV发送的当前状态信息与历史状态信息进行预测，并根据时延的大小预测出领航AUV当前时刻的状态信息，用于补偿领航跟随AUV之间的通信延时，减小系统的编队误差。通过仿真可以看出本文所提方法的有效性，减小了编队误差并提高了编队稳定性。但本文在设计的过程中，没有考虑到控制器的约束问题，结合控制约束问题进行延时补偿将是下一步工作。