闫 敬,关新平,罗小元,杨 晛
(1.燕山大学电气工程学院,河北秦皇岛 066004;2.上海交通大学电子信息与电气工程学院,上海 200240;3.燕山大学信息科学与工程学院,河北秦皇岛 066004)
21世纪是海洋的世纪,海洋将成为人类生存与发展的新空间.为提升海洋探测能力,可在特定水域部署具有计算、通信和控制能力的水下计算单元和物理对象,以构建具有维度广、安全性高以及实时性强等特点的水下信息物理系统.上述系统利用计算、通信和控制手段,可实现水下物理对象与信息网络的协同融合,对推动水下机器人、水下搜救与抓取、水下传感器网络、水声通信、水下预警与监控等领域关键技术的升级换代和跨越式发展意义重大.
在水下信息物理系统中,声呐传感器与潜器(例如:水下滑翔机以及自主水下机器人)等物理对象通过水声无线通信方式构成一个多跳自组织异构探测网络.与静态水下传感器网络[1]相比,上述探测网络引入了潜器,通过异构节点的通信组网与反馈协同,提升了探测网络的灵活性与适变性;与动态多潜器网络[2]相比,声呐传感器的引入增强了探测网络时空覆盖能力,提升了水下探测的快速性与持续性.由此可见,水下信息物理系统集水下泛在探测、适变通信和协同控制等功能于一体,具有终端异构化、结构网络化和功能灵活化等突出优点,是实现水下信息物理系统智能化与互联化的关键.
现有的水下探测、通信与控制系统通常是相互独立的.具体来说,探测系统主要关注如何利用水听器、多输入多输出探测声呐来接收目标辐射噪声与信息,同时结合信号处理手段,以提取目标特征、方位和距离等信息;通信系统主要关注如何针对水声窄带宽、多径、频率选择性衰减以及高噪声等信道特点,采取高性能、可实现的组网通信协议,以将信息从源点传输到终端;控制系统主要关注如何根据已获取的导航信息,设计比例-积分-微分、预测、滑模、自适应以及多种智能控制器,以驱动潜器实现前进、后退、纵倾、回转、升降和横移等运动.可以看出,探测与通信系统功能上具有重叠性,如果探测与通信系统互不关注对方收到的数据,那么探测与通信系统在频谱资源、能耗上将互相竞争.同时,控制系统通常假设探测与通信是完美实现的,即假设传感器与潜器等节点的反馈信息是可靠获取且实时传输的,然而水下复杂环境使得上述假设很难保证.综上可知,探测、通信、控制的分离设计,一方面使控制指令易产生信息不完整约束,另一方面探测与通信又缺少有效的反馈机制,严重制约了水下信息物理系统整体性能的提升.因此,为实现水下信息物理系统探测-通信-控制一体化设计,有必要建立水下探测、通信、控制联合设计架构.
图1是一典型的水下信息物理系统探测、通信、控制联合设计架构[3],其主要目的是对特定水域内移动目标探测、定位、跟踪和围捕.在此系统中,传感器负责探测、采集和预测覆盖区域内目标位置、姿态与速度等信息,而潜器不仅可作为移动锚节点对传感器数据进行通信转发,也可根据任务需要动态调整姿态以达到组网灵活性的提升.同时,水下传感器与潜器以水声通信与电磁波通信的形式,将收集到的水下目标位置、姿态与速度等信息,通过水面浮标与空中卫星上传到岸基控制中心.岸基中心融合目标态势,并根据探测与通信的需要形成调度控制环,进而将控制指令回传给传感器与潜器,实现水下信息物理系统探测、通信与控制性能联合提升.
图1 水下信息物理系统探测、通信、控制联合设计架构Fig.1 Co-design framework of detection,communication and control for underwater cyber physical system
2.2.1 水下环境开放性使得一体化架构建立难
水下环境的开放性,使得很难建立固定的通信基础设施.因此,为了满足水下不同监测需求,需要部署分布在不同物理空间的异构终端[4],包括主/被动声纳、前视和侧扫声纳、声学路径垂直阵、测深仪、声速剖面仪、岸基浮标、水面监控平台等探测感知终端.需要指出,水面监控平台可通过卫星通信、短波、北斗等多种宽窄带通信方式,以实现常规海况下的宽带接入与恶劣海况下的窄带接入;水面浮标,可通过水声通信方式与水下探测设备窄带接入,也可通过宽带接入的方式与水面监控平台通信;水下设备主要通过水声组网通信方式与水面浮标以及水下其它设备窄带接入.上述终端全向/定向通信并存、使用频段种类多、服务优先级不同,导致不同接入技术差异性大且不可兼容,使得建立具有自组织泛在能力的水下探测-通信-控制一体化网络架构非常困难.此外,水下信息物理系统宽带受限、通信时延大、能量有限等弱通信特性,以及水下潮汐洋流等不确定环境条件,又加剧了水下信息物理系统探测-通信-控制一体化网络架构建立的难度.
2.2.2 声呐资源受限下探测通信一体化实现难
探测通信一体化设计,不仅可以克服传统分离设计带来的资源互相竞争、效能低下的不足,而且可以通过共享射频资源与天线孔径,提升频谱利用率、降低设备间电磁干扰、增强隐蔽性.需要指出的是,探测通信一体化技术最早应用于雷达[5],其主要采用分时、分频或者分波束的方式进行功能集成,并依靠电磁波进行探测通信,具有传播速率高(≈3×108m/s)、孔径大、可用频带宽(3 MHz~300 GHz)等特点.然而,电磁波在水中呈指数规律衰减,使得基于雷达的探测通信一体化技术并不能直接应用于水下.目前,声呐仍然是水下远距离探测通信的唯一有效手段.相比于雷达信号,声呐信号传播速率低(≈1500 m/s)、孔径小、可用带宽窄(3 Hz~97 kHz)、多径效应明显[6].声呐上述资源受限约束一方面导致水下通信信号易出现线性与非线性失真、相位抖动、频率偏移,另一方面使得水下探测与通信带外干扰严重且互相抑制、增加了共享信号设计难度.如何克服声呐资源受限约束,成为水下探测通信一体化设计面临的一大挑战.
2.2.3 水声弱通信特性导致组网传输稳健性弱
水下探测-通信-控制一体化设计的核心基础是构建具有自组织、泛在、强实时、高可靠性的异构探测网络,通过探测感知、信息共享与协同控制,最大限度把信息优势转化为决策优势,以实现水下信息物理系统整体性能的提升.上述过程离不开声呐传感器与潜器等物理对象的组网传输,然而水声具有弱通信特性[7],例如:1)电磁波在水中呈指数规律衰减,使得北斗等定位系统并不能直接应用于水下,且受高噪声以及多径干扰等不稳定因素影响,水下节点间的时钟同步难以精确实现;2)水中不均匀分布的声速剖面造成声线弯曲;3)水声通信主要通过发送器和水听器实现信息收发,传播时延大且消耗的能量远高于无线电波通信.水声上述弱通信特性,导致陆地环境下的组网传输协议并不适用于水下.此外,水下节点所处的水体,在外力和自身环境参数变化等因素影响下会不断地流动,形成快时变的水下流速场,增加了组网传输的不确定性与脆弱性,进而对水下信息物理系统探测感知与控制指令的实时共享与可靠反馈提出了新的挑战.
2.2.4 复杂水下环境易使控制与反馈信息不完整
在水下信息物理系统探测-通信-控制一体化设计过程中,探测-通信系统为控制系统提供必要的信息支撑,而控制系统又可通过潜器等移动节点运动促进探测-通信性能的反馈提升.具体来说,潜器等移动节点通过自身携带的水声通信模块动态协同邻域内节点,进而通过航迹规划、追踪以及编队控制形式实现水下探测与通信性能的反馈提升.为此,如何在探测-通信-控制一体化框架下设计潜器反馈控制律显得尤为重要.目前,学者们提出了很多适合陆地环境的移动机器人反馈控制律[8],其通常忽略机器人与物理环境间的耦合关系.然而,受水声弱通信、水流、复杂水底地貌、水中悬浮物等外部因素,以及潜器动力学模型强非线性、高耦合度等内部因素影响,潜器与水下物理环境间的交互耦合异常紧密.水下物理环境局部摄动、通信时延、链路失效、噪声干扰等不确定性因素均会通过网络直接或者间接地波及到潜器控制单元,甚至导致整个反馈控制律的失效.因此,在设计潜器反馈控制律时,不仅要考虑潜器控制性能的优化,而且还需要联合考虑探测-通信性能的优化.然而,受限于目前探测、通信技术以及系统建模水平,许多关键的状态在水下复杂环境中无法实时反馈,一些重要的参数难以准确测量,导致水下控制与反馈信息不能完整匹配.如何克服复杂水下环境中控制与反馈信息不完整限制,成为反馈提升探测与通信性能面临的一大难题.
水下探测-通信-控制一体化研究,主要内容涉及水下立体探测、通信组网与协同控制,其相互依赖与制约的关系如图2所示.基于此关系,从如下3个方面进行综述:1)水下探测通信一体化;2)弱通信条件下定位组网;3)复杂水下环境中潜器协同控制.
图2 水下信息物理系统探测、通信、控制内部关联Fig.2 Internal relationship of detection,communication and control in underwater cyber physical system
水下被动与主动探测是最常见的两种探测方式,其中被动探测主要利用水听器与声呐阵列被动接收目标的辐射噪声[9],例如:潜艇与水体摩擦产生的水流噪声以及潜器自身机械噪声等,进而结合波束形成、方位估计等信号处理方式提取目标特征、方位、深度以及距离等信息.与此不同,主动探测技术通过发射声波以及接收目标反射回波方式进行探测,其发展形成了以低频大功率探测[10]、双/多基地探测[11]、前向散射探测[12]和多输入多输出(multiple input multiple output,MIMO)[13-14]为主要分支的技术脉络.尽管如此,现有的水下被动或主动探测系统多假设其与水下通信系统是两个独立的子系统,并没有考虑两者间功能上的重叠性与资源上的竞争性.
为了实现探测通信系统的集成化与智能化,Mealey于上个世纪60年代首次提出利用雷达脉冲对通信信号进行调制的思想[5].受此启发,学者们从不同角度提出了多种信号处理机制,例如:分时机制[15]、分频机制[16]、分波束机制[17]以及全共享机制[18].具体来说,分时机制将时间划分为多个时隙,进而利用转换开关在不同时隙发送探测或者通信信号,其中同一时隙不能同时发送探测与通信信号;分频机制在不同频段分别实现探测与通信功能;分波束机制将相控阵雷达的阵面划分为不同的区域与波束,进而利用不同波束实现探测与通信;全共享机制将探测与通信信号共享到同一发射波,使探测与通信同时同频运行.上述四种信号处理机制的优缺点如表1所示.考虑到雷达具有高带宽、大孔径以及快传播速度特点,现有雷达探测通信一体化系统常采用分时、分频或分波束机制.然而,水下声呐系统可用带宽窄、孔径小、声波传播速率低,相比较而言水下声呐系统更适合采用全共享机制.
表1 雷达通信一体化常用机制优缺点Table 1 Advantagesanddisadvantagesofcommon mechanisms for integrated radar and communication
目前,学者们对全共享机制下声呐探测通信一体化进行了初步研究,并从不同角度设计了多种类型的共享波形.这些共享波形主要分为探测与通信信号叠加下的共享波形、基于探测信号的共享波形以及基于通信信号的共享波形.其中,探测与通信信号叠加下的共享波形采用相互正交的波形分别执行探测与通信任务[19],其优点是可以独立设计波形,但是信号间互干扰严重、接收端信号分离困难.基于探测信号的共享波形将通信信息调制到探测信号上[20],保证了探测性能,但是其通信方向受探测波束方向性影响较大,不利于组网传输.基于通信信号的共享波形将探测信息调制到通信信号上[21],保证了通信性能,但是其声源级低特点限制了探测性能的提升,尽管如此,水下信息物理系统静态与动态多节点协同特点可弥补此不足.为更清晰表示上述结论,图3描述了基于通信信号的水下共享波形设计模式,主要包括:1)利用自身通信信号进行主动目标探测,即利用自身发射通信信号分别完成探测与传输;2)在通信同时被动目标探测;3)利用其他节点通信信号进行探测,即利用其他节点发射的通信信号作为探测照射源实现探测与通信功能一体化.
图3 基于通信信号的水下共享波形设计模式Fig.3 Design models for underwater shared waveform with the assistance of communication signal
除此之外,自干扰抑制以及回波信号处理是水下全共享机制另外两个必须考虑的问题.对于雷达系统[22],一般采用声学隔离、声学抑制、模拟域发射泄漏抑制、数字域发射泄漏抑制的方式进行自干扰抑制,以提高有效信号信噪比.同时,采用匹配滤波、信号分段以及估计融合等方式,对接收信号进行解调与信息提取,以确保系统的探测与通信性能.上述工作为声呐系统全共享机制的设计奠定了良好基础,但是水下声呐孔径与可用频带受限,使得上述基于雷达的全共享机制并不能直接应用于水下.因此,水下声呐探测通信一体化研究不能简单照搬陆地雷达探测通信一体化相关技术,而应该综合考虑声呐资源受限约束,同时结合水声低速传输、强多径等信道特点,设计与其相适应的全共享机制.
定位组网是水下探测-通信-控制一体化设计的中间环节,其目的是确定水下目标以及节点(例如:传感器与潜器)的位置信息,进而通过水声通信协议设计的方式实现稳健组网,上述过程对确保水下探测信息的可靠传输与控制信息的有效反馈至关重要.
现有定位技术大致可分为两类:距离相关技术;距离无关技术.前者主要利用主/被动声呐、前视/侧扫声呐、测深仪等探测设备进行定位,其定位精度高、受制因素少,是目前普遍采用的定位技术.一些学者已经对距离相关定位技术进行了研究,并从不同角度出发开发了协同定位算法.这些算法大多利用信号到达时间差(TDOA)、信号到达时间(TOA)、信号飞行时间(TOF)、以及信号到达角度(AOA)进行距离测量.例如,Liu等人[23]基于TDOA设计了多潜器协作的定位算法,实现了移动潜器群的精确定位.Zhou等人[24]为减小网络通信能耗,考虑水下潜器与传感器位置的时空相关性,提出了基于移动预测与TOA的协同定位算法.Luo等人[25]对传感器节点的被动移动进行分析,提出了混合网络下协同定位算法.上述定位算法假设节点间的时钟是同步且声线是直线传播的,但是受水声弱通信特性影响,节点间时钟很难达到精确同步且声线是弯曲传输的.具体来说,水下异步时钟与声线弯曲模型可表示为[26-27]
其中:T表示节点本地时钟;t表示真实时钟;α与β分别表示节点时钟漂移与偏移;C(z)表示深度为z时节点的水声传输速度;表示与水下环境相关的声速剖面陡度;b表示水面声速.
基于上述时钟与声线模型,文献[28]通过锚节点信息交互提出了多阶段请求式异步定位算法,该算法能够消除节点间时钟偏移以及声线弯曲的影响,但是存在定位延迟长、算法复杂度高的不足.为此,Mortazavi等人[29]对时钟同步与定位联合求解,并在此基础上进行声线补偿.为进一步减少通信能耗,文献[30]设计了一种基于移动预测的异步定位协议,文献[31]提出了基于无迹卡尔曼滤波的水下异步定位算法.但是,上述文献在定位估计问题求解过程中,需对非线性测量方程进行近似线性化处理,这种近似线性化求解易引入模型误差,使其定位精度降低.为克服上述不足,文献[32]提出了基于无迹变换和最小二乘法的定位策略,然而最小二乘法易使定位陷入局部最优解.为寻求全局最优解,一些学者尝试利用凸优化的方法对定位估计问题求解.尽管如此,水声弱通信约束使得水下非凸问题转化非常复杂甚至无解,因此传统基于凸优化策略的定位思路并不适用于求水下这类具有复杂约束的定位问题.为规避凸优化转化过程,一些学者尝试将迭代学习应用于定位过程,例如文献[33]提出了基于增强学习的新型定位优化估计策略,采用值迭代的方法对增量进行更新,以快速收敛位置估计的全局最优解.进一步,文献[34]分别设计了基于监督学习、无监督学习与半监督学习(见图4)的水下目标定位算法,并给出了算法全局收敛的稳定性条件,确保了收敛速度稳定、提升了位置估计准确性.
图4 基于半监督学习的水下定位估计器框架Fig.4 Architecture of the semisupervised learningbased underwater localization estimator
在水下定位过程中,水体受外力和自身环境参数变化等因素影响会不断地流动,形成快时变的水下流速场.水下流速场的存在增加了定位的不确定性、限制了异构节点间协同能力的提升.现有文献主要聚焦于如何通过设计定位估计器来确保定位精度,很少考虑水流等物理场对定位性能的影响.为此,Kim[35]将水流估计融入到水下定位协议中,提出了基于多潜器协同的水下流速场与定位联合估计算法.此外,文献[36]提出了基于拓扑切换机制的水流估计与潜器定位算法,文献[37]设计了基于观测器的定位与水流联合估计算法.然而,上述文献在定位与流速场联合估计过程中并没有考虑异步时钟、声线弯曲等弱通信特性.为弥补上述不足,文献[38]设计了如图5所示的异步定位协议,进而提出了异步时钟与声线弯曲下联合定位与流速场估计新方法,实现了弱通信约束下定位与流速场联合估计、克服了流速场对定位带来的不确定性.
图5 水下异步定位协议Fig.5 Underwater asynchronous localization protocol
基于已获取的节点位置信息,如何确保异构节点间稳健组网是通信层面另外一个亟需解决的问题.水下目标的动态特性,带来了探测的不确定性,仅通过挖掘目标的历史数据来调度传感器/潜器休眠-唤醒模式[39-40],并不能确保异构节点间稳健组网.此外,水下通信环境复杂,且受海面、海底、物体的反射与声速变化引起的折射以及多径效应等因素影响,水下节点感知与通信范围具有时变特性,甚至出现节点失效,影响网络拓扑的连通性,造成拓扑分割及局部拓扑失效,而水下洋流造成节点不可避免的漂移,使得网络拓扑具有动态特性.为确保信息的可靠传输,需要考虑网络在动态漂流条件下的拓扑变化,以实现拓扑连通性动态保持.目前,一些学者已经对水声传感网络拓扑连通性进行了研究.Gjanci等[41]构建了基于水下传感器/潜器协同的探测架构,设计了贪婪自适应调度算法来增强水下网络连通性.Pompili等人[42]对水下传感器的三维移动特性进行研究提出了Bottom-grid算法,Akkaya等人[43]在该算法的基础上提出自移动算法,通过持续调整节点深度,进一步减少相邻节点的重复覆盖,提高了探测水域的连通性和覆盖率.此外,Ibrahim等人[44]将水下节点配置描述为整数线性规划问题,并利用启发式算法求解接近最优的NPhard动态优化问题,进而实现在网络连通性前提下覆盖度的提高.然而,现有研究多以网络的覆盖度作为水下监测网络拓扑连通性动态保持的度量,并没有考虑拓扑结构对探测性能的影响,易导致连通性和覆盖度的提高以对水下移动目标探测性能的降低为代价.
此外,为降低组网过程中的通信能耗,学者们从路由以及MAC协议等角度出发设计了多种高能效水声通信协议,例如,文献[45]采用维诺图和二分图的方式降低通信能耗,文献[46]将定位地图融入到通信协议以确保通信中断时拓扑连通性.为实现拓扑连通性与能量有效性的均衡,文献[47]采用图论中最优刚性图的方法来对水下能量均衡链路进行优化.具体来说,最优刚性图是通信复杂度最小的刚性图,可在保持2连通(或3连通)同时减少网络中节点间不必要的通信消耗.为此,文献[47]将节点间的权值函数定义为节点之间的能量均衡函数,即
式中:Ecos,j与Ecos,k分别为节点j与k传输一个数据包所需能量;Eres,j与Eres,k分别表示节点j与k储存的剩余能量;Nj表示节点j的邻居集合.上述公式意味着最优刚性图是拓扑维持在刚性架构下能量均衡最优的刚性图.为此,依据三维空间中最优刚性图的刚度矩阵是一个行数为3n-6的行满秩矩阵这一性质(n为节点个数),依照对应边的长度(即能量均衡链路长度大小)对刚度矩阵进行排序重组,整理出其中行数为3n-6的行满秩矩阵,即得出由边长和最小的3n-6条边所组成的拓扑结构相对应的刚度矩阵.将上述刚度矩阵的3n-6行所表示的边连接于对应的水下节点之间即得通信链路的最优刚性图.根据邻域规则,若每个节点(包括水下传感器与潜器)都需与其邻居进行通信,则水下网络通信链路较为复杂,如图6左图所示.图6右图就是通信拓扑所对应的最优刚性图,通过比较可知图6右图通信链路明显减少,相对应地其水下网络能量均衡性能更优.
图6 基于刚性图的通信链路优化Fig.6 Rigid graph-based communication link optimization
基于文献[47]中的水下刚性拓扑优化思想,文献[48]将定位精度的一个重要指标“克拉美罗下界(CRLB)”作为定位性能的衡量指标,设计水声弱通信多约束条件下的刚性拓扑结构下的最优部署方式,使得水下移动目标在异步时钟、声线弯曲及能量受限约束下达到最好的定位效果.上述结果对进一步研究基于刚性拓扑的水下稳健组网策略意义重大.
受水流干扰等因素影响,水下传感器对目标探测误差会不断累积.因此,有必要面向探测与传输需要,增加部署少量可以自主移动的潜器,一方面作为移动锚节点向传感器提供自定位参考,并根据探测的需要对传感器数据进行中继转发、拓扑修复与组网协同;另一方面根据传感器已探测到的目标信息,通过自身携带的水声通信模块动态协同邻域内的潜器,并组成特定的编队围捕队形,以完成对水下移动目标的近距离、高精度、全方位自主探测.为完成上述任务,潜器需根据探测信息进行航迹调度,进而根据已规划航迹进行多潜器协同控制.
针对潜器的航迹规划问题,刘妹琴等人[49]对水下目标追踪研究进行了梳理,并建设性地给出了潜器航迹规划中需要考虑的因素.文献[50]提出了基于神经网络的多潜器动态航迹规划算法,文献[51]考虑水下障碍物环境提出了一种水下无碰撞航迹规划策略.进一步,文献[52]采用粒子群优化算法,利用质心交互框架设计了多潜器协同路径规划算法.文献[53]考虑水流与障碍物的影响,提出了一种基于速度集成向量的多潜器航迹规划方法.基于此,文献[54]将潜器能量有效性、水流与障碍物约束联合考虑,提出了一种基于蚁群算法的潜器航迹规划策略.此外,文献[55]考虑海流对潜器的影响,提出了基于区间优化的潜器最优时间路径规划算法.同时,文献[56]基于自适应差分进化算法,提出了潜器能量最优航迹规划策略.在上述工作中,潜器的路径长度被视为优化指标,其目的是尽可能的设计一条路径最短的轨迹,以确保潜器最短时间(或能量最小)达到目标点.然而,在水下移动目标探测过程中,仅仅考虑路径长短并不能满足感知与组网的要求,例如,为实现水下目标探测过程中局部拓扑的修复,潜器需要设计一条能联合考虑能量有效性与覆盖全面性的航迹.在陆地环境中,Mosto fi等人[57-58]将信道质量融入到机器人航迹规划过程中.基于此,文献[59]联合考虑水下通信与控制性能,提出了基于模型预测控制的多潜器路径规划算法.文献[60]将通信与控制性能描述为环境收益函数,设计了基于多目标离散搜索的多潜器航迹规划算法.然而,文献[59-60]只是简单地将通信性能映射为不同节点间的拓扑连通性,并没有考虑水下信道质量.为解决上述不足,文献[61]首次从MAC层出发,构建了通信与控制性能一体化下的联合优化问题,提出了面向水下数据收集的潜器航迹规划算法,实现了潜器通信能耗与巡航时间的均衡.此外,文献[62]将通信与控制性能联合优化问题描述为Q学习过程,提出了基于Q学习的多潜器航迹规划算法.上述算法对未来进一步考虑多径、阴影、干扰等复杂水声通信条件下的潜器通信-控制联合航迹优化问题提供了借鉴.
随着潜器航迹的确定,潜器能否达到所需要的位置将最终决定整个自主协作监测过程的成败.对于单潜器追踪控制,文献[63]基于模型预测方法提出了潜器追踪控制器.进一步,文献[64]设计了基于反推法(backstepping)的追踪控制器,以解决潜器轨迹规划和跟踪控制联合优化问题.上述控制器建立在潜器动力学模型精确可知基础上,然而与陆地机器人相比,潜器的动力学模型呈现强非线性、高耦合度等特点,且受水流、复杂水底地貌、水中悬浮物等外部因素影响,使得建立潜器精确的动力学模型非常困难.针对模型不确定问题,比例-积分-微分(PID)控制器仍然是目前最简单且常用的控制方法[65-66].该方法具有原理简单、适应性强、使用方便、鲁棒性好等优点,但PID控制器参数选择的好坏将直接影响控制器整体性能.针对模型不确定问题,文献[67]采用时滞与积分滑模面来估计模型不确定与扰动.文献[68]考虑模型参数不确定性、未知外界干扰和输入饱和限制的影响,设计了基于神经网络的欠驱动水下机器人三维同步跟踪和镇定控制器.为提高收敛速度,文献[69]提出了有限时间滑模追踪控制器,并采用神经网络估计不确定与扰动项.上述文献都假设潜器速度可以通过多普勒速度仪(DVL)精确测量的,然而受水下环境干扰以及经济等因素影响,潜器的速度信息不可能一直能够精确获取.尽管文献[70-71]考虑速度不可测约束,提出了基于观测器的潜器追踪控制器,但是其收敛速度过慢,即只能实现渐近收敛.为此,文献[72]采用快速终端滑模速度观测器来实现潜器速度信息有限时间观测,采用自适应方法估计模型不确定项,进而设计了基于自适应非奇异快速终端滑模的追踪控制器,实现了潜器有限时间内速度估计与位置追踪.同时,文献[73]采用自适应非奇异快速终端滑模控制来实现潜器输入受限下的有限时间追踪控制.
此外,受AlphaGo之父戴密斯提出的深度学习启发[74],一些学者尝试将增强学习等智能算法应用到潜器追踪控制中.例如,文献[75]将水下目标追踪描述为马尔科夫切换过程,提出了基于深度强化学习的潜器追踪控制器.然而,上述潜器追踪控制方法并没有联合考虑探测或者通信性能.为此,文献[76]考虑水声通信过程中的异步时钟以及潜器模型不确定约束,设计了一种基于强化学习的潜器联合定位与追踪控制算法,对于潜器模型中的不确定参数,使用统计学中的多元概率配置法来减少获取系统准确均值所需的计算量,其中定位与追踪控制耦合关系如图7所示.此外,文献[77]联合考虑水下探测与追踪控制性能,设计了基于改进PID的潜器追踪控制算法,其利用光学探测设备对海底目标进行探测.
图7 潜器自定位与追踪控制关系Fig.7 Relationship between self-localization and tracking control for underwater vehicle
作为单潜器追踪控制系统的扩展,多潜器编队控制应用广泛,例如,不同任务(如拾取、运输和部署)下多潜器-机械臂系统的单独和合作控制[78].一般来说,编队协同控制可分为如下3种形式:基于行为的控制策略[79]、虚拟结构策略[80]和领导者-跟随者形成策略[81],其中领导者-跟随者策略以其简单性和可扩展性等优点得到了众多研究的广泛重视.基于上述结构,学者们提出了多种潜器编队控制器,然而现有研究通常忽略了水声通信时延的影响.需要注意的是,水声通信的低传播速度,使得每传输1000 m大约需要0.67 s,水下节点时钟不易同步等原因引起传输冲突等问题,进而导致丢包或重传,加剧了通信时延;而水声通信速度又随水的盐度、温度的升降而升降,因此使得水声网络通信时延呈现动态变化的特点,而对于潜器控制系统而言,即使通信网络中存在很小的时间延迟也会导致整个控制系统的不稳定.为此,文献[82]考虑潜器编队控制中的时变通信时延,将潜器1选择为领航者,其目的是追踪目标点Xd.同时,其余潜器与领航者保持期望的相对状态,进而设计如下形式的编队控制器:
式中:τi表示第i个潜器的控制输入;N表示潜器的总个数;aij表示潜器i与j之间的邻接关系;ki与αi为待设的增益矩阵;ηi表示潜器i的姿态,γi为潜器i与1之间理想的相对状态,进而表示经过转换后的水下惯性向量;bi表示潜器i与目标点连通关系增益,其中b1>0,对于跟随者潜器bi=0;di(t)表示潜器i与水面浮标之间的时变通信时延.
与此同时,一些学者从其他角度提出了多种潜器编队控制器,例如,不确定扰动[83]以及执行器饱和[84]等.上述编队控制器大部分考虑全驱动控制系统,然而水下不确定因素可使潜器一侧推进器失效,此外欠驱动控制具有减轻潜器重量、提高总体推进效率等优点.因此,大部分潜器更适合采取欠驱动控制系统.尽管如此,欠驱动系统独立控制输入维数少于运动自由度,如何实现有限控制量控制更多自由度,是欠驱动控制的关键与难点.为此,Saber首次提出将欠驱动下的欧拉-拉格朗日系统转化为级联系统[85],进而可采用传统控制方法对机器人进行控制[85].基于此,Lu等人[86]提出了欠驱动系统的滑模控制,但是此方法的原始模型建立在机器人坐标系下,而潜器欠驱动发生在欧拉-拉格朗日方程各自由度的控制中,因此并不适用于欠驱动潜器控制系统.Ashra fiuon等人[87]利用雅克比矩阵转将潜器坐标系换成大地坐标系,同时船体坐标系下各自由度的欠驱动被转化成控制耦合关系,进而建立了平面欠驱动系统控制算法,然而该方法对参考轨迹运动方程限制过强,不适用于任意目标轨迹的追踪编队.此外,Lefeber提出将追踪误差动力学方程转化成两个线性子系统,进而分别设计控制器[88].基于此,文献[89]将艏向角及偏航角速度误差系统定义为子系统2,其余误差动力学方程定义为子系统1,将偏航角速度误差看作子系统1的时变扰动信号,进一步采用直接Lyapunov法设计了欠驱动水下机器人全局控制算法.然而,上述方法均假设期望轨迹的偏航角速度满足持续激励条件,也就是说,上述方法难以实现直线轨迹追踪.针对这一问题,Wang等人[90]构造辅助系统,进一步利用辅助系统构造误差动力学方程,从而避免持续激励假设,Park等人[91]提出了速度不可测下的欠驱动船体机器人的轨迹追踪算法,其模型中惯性矩阵为非对角结构,且参数未知.上述研究工作为水声弱通信条件下多潜器协同编队控制奠定了良好的基础.
为最终实现水下立体探测、通信组网与协同控制,有必要搭建水下探测-通信-控制一体化平台.图8是一个典型的水下信息物理系统探测-通信-控制一体化平台.目前,水下探测-通信-控制平台搭建相关研究正处于起步阶段,但是国内外已经开展的相关工作对未来一体化平台搭建意义重大.
受美国海军“水声监视系统”(SOSUS)启发,科学家在上世纪60年代就提出“建立水下探测网络”的设想.进入21世纪,尤其是“911事件”后,美国、日本等国家加快了建设水下探测网络的步伐.2005年,美国国防部斥资开展“近海水下持续监视网络”(PLUSNET),使得基于水声传感器网络的探测系统在水下环境中应用成为现实[92].2016年,美国国家基金委宣布,历时10年、耗资3.86亿美元的“大型海洋观测计划”(OOI)正式启动运行[93].同年,美国国防高级研究计划局投资研发的分布式敏捷反潜系统完成了海试,其利用数十个无人潜航器组网,首创自下而上探测模式,提升了探测精度,实验表明40个潜器组成的网络可以探测近18万平方千米的海域.2020年11月,麻省理工学院开发了一种水下反向散射定位系统[94],其通过反射调制的音频信号生成二进制脉冲,进而计算往返时间以确定位置,实验表明其浅水区估计距离精度约50 cm.此外,日本2002年构建了“新型实时海底探测网”(ARENA),并于2017年宣布将联合美国、韩国以及我国台湾筹建“太平洋海底观测网”.欧盟在海洋科学技术项目MAST-III的支持下,也相继开展了一系列水下信息物理系统探测研究.例如,法国推出了Alister轻型水下潜器,长度为1.7~2.5 m、重量为50~90公斤,可有效探测及识别水雷,搭载有合成孔径雷达,比普通声呐探测效果高5~10倍.上述重大项目的开展与相关计划的制定,推动了水下信息物理系统探测-通信-控制应用的落地,成为各国/地区技术竞争的制高点和产业布局的焦点.
我国拥有300万平方公里管辖海域、1.8万公里海岸线,深耕与经略这片蓝色国土,必须以强大的海洋探测能力作为技术支撑.与国外研究相比,我国水下信息物理系统探测-通信-控制应用研究起步较晚,但发展迅猛.国内众多研究所与高校,也开展了水下探测-通信-控制相关的应用研究,并取得了一定的成果.2009年,同济大学联合相关单元建成“小衢山海底观测实验站”[95],成为我国首个海底综合观测试验与示范系统.2013年,中科院南海海洋研究所、沈阳自动化研究所、声学研究所共同建设的“三亚海底观测示范系统”投入运行[96].哈尔滨工程大学完成的“深海高精度水声综合定位技术”入选2017年度“中国高等学校十大科技进展”.2020年6月,中科院沈阳自动化研究所研制的“海斗一号”潜航器完成了10907 m下潜深度,刷新了我国潜水器下潜深度及作业深度的记录.国内这些已开展并取得的研究成果,给水下信息物理系统探测-通信-控制一体化应用研究奠定了良好的基础.
“向海则兴,背海则衰”,大力发展海洋事业已成为全世界的广泛共识.随着海洋装备制造、传感器、信息处理和人工智能等技术的快速发展,水下信息物理系统正朝着无人化、集成化与智能化的方向快速发展.可以预见,通过探测、通信与控制的一体化设计来实现水下各种资源的共享与协同优化将成为水下信息物理系统的一个重要研究方向,也将成为未来水下综合电子信息系统发展的趋势.
本文最后列出水下信息物理系统探测-通信-控制一体化设计过程中,一些重要但尚需解决的问题以及未来值得深入探究的研究方向.
1)在探测层面,各类探测感知设备各有优缺点,只用某个单一设备并不能长时间、高可靠地确保水下探测任务的实现[97].因此,要实现对移动目标全天候、全方位的实时探测,需要部署多平台,获得多维度、多层次、互补型的动态多源数据,对其进行高效融合处理,协同完成探测任务.然而,水下环境的快时变和移动目标的高机动,使得多平台与移动目标的信息具有多尺度(时间、空间等)、多粒度、高动态、高冲突等特点.同时,水声信道的窄带宽、强多径干扰使得3~5 km距离的典型数据传输率只有6~7 kb/s,致使信息传输易发生数据丢失或污染,且声波传播的慢速率造成的传输秒级长时延及时延抖动,引发数据时空失配和错序.陆地环境下,苑晶等人[98]基于雷达与视觉进行多源信息融合以实现机器人目标探索跟踪.考虑水下复杂环境与目标机动性等约束,如何对动态多源探测信息进行高效融合以组建水下信息物理系统探测-通信-控制一体化网络架构尚未得到充分解决.
2)在通信层面,水下静态与动态节点通过声通信确定自身以及目标位置信息,进而利用水声通信协议实现稳健组网.现有的水下定位组网方式存在如下3个问题:1)通信协议主要关注如何将信息从源点传输到终端,而不关注探测与控制性能,使得通信性能的提升有可能以牺牲探测与控制性能为代价;2)传输过程中的信息安全大多忽视,但是水下节点的隐私保护与攻击防护不容忽视[99];3)信息处理优化求解大多利用传统最小二乘或者凸优化求解,导致陷入局部最优或者求解困难.针对上述问题,文献[100]提出基于差分计算的隐私防护模型,进而考虑水声弱通信与流速场影响,设计了水下传感器与目标安全定位算法;文献[101]指出针对复杂优化问题,可以基于感知得到的动态环境信息,利用强化学习、深度强化学习等算法以解决复杂优化问题,以使得系统能够适应高复杂、高动态、强对抗环境开展作业任务.目前已有研究只是做了初步的探索,但如何在探测-通信-控制一体化网络架构下实现网络有效安全通信与协同定位尚需进一步研究.
3)在控制层面,控制对象与其性能要求随探测-传输的变化而变化,对潜器反馈控制提出新的挑战.目前,潜器反馈控制通常假设探测与通信是完美实现的,即主要关注如何根据已获取的导航信息实现稳定控制,然而水下复杂环境使得上述假设很难保证.可以预见,未来潜器协同控制,不仅需要具有一定的自主控制能力,而且还需要根据任务的需要具有信息获取、任务规划、无线通信、水质适应、长续航等能力,这离不开探测、通信、导航、信号处理、人工智能技术的支持.需要注意的是,利用潜器探测海洋生态环境(探测方向)、潜器的自供电技术(能源方向)、潜器的自适应控制(控制方向)、基于蚁群算法的潜器路径规划(控制方向)、基于潜器的水下物联网构建(网络方向)、潜器编队控制(协同方向)、基于强化学习的潜器跟踪控制(控制方向)、潜器仿生设计(总体方向)、以潜器为移动边缘的水下传感器网络(通信方向)、多潜器协同任务(协同方向)、移动式水下传感器网络时间同步(导航方向)、利用过氧化氢或直接推进的动力系统(能源方向)、潜器水下无线充电(能源方向)、水陆两栖无人系统(总体方向)、基于滑模控制的潜器跟踪控制(控制方向)、改进潜器的单信标导航精度(导航方向)、声呐图像中的目标识别(探测方向)、潜器视觉定位(导航方向)、优化潜器的环境采样任务(探测方向)、潜器的深海探测任务(探测方向)已经被列入潜器的20项前沿技术趋势.因此,如何将一体化系统的反馈需求与面向控制的探测-通信相结合,进而对潜器进行联合设计与优化将是一项具有挑战性的研究方向.目前部分研究已经开始朝着这个方向开展,但是尚需结合水下物理系统的特征(例如,水声信道、噪弱通信性、噪声特性与潜器物理受限等)进一步深入研究.
4)在应用层面,水下探测-通信-控制一体化平台搭建相关研究正处于起步阶段,研究结果主要通过仿真软件进行验证.目前已有的海上实验还停留在节点通信、组网和控制分离验证的阶段.因此,如何将探测-通信-控制一体化理论成果进行海上验证,并根据海试结果进一步指导理论结果是未来需要重点研究的另外一个方向.此外,水下信息物理系统发展关键是面向应用场景,从技术发展到解决实际应用场景需求还有很多新的问题需要解决和突破.以海洋牧场中海珍品自主抓取为例,如何在弱光照与动态海流下实现“看得见”与“抓得着”是其面临的两个主要技术问题,这涉及多方面的技术突破,包括弱光照下水下图像自主识别技术、动态水流下目标定位技术、潜器航行与抓取联动装置设计技术、机械手自主抓取与回收技术等.需要强调的是,澳大利亚Blueprint实验室生产的REACH ALPHA 5机械臂是目前世界上最小最轻的水下五功能机械手,具有质量轻、精度高等优点,但是其价格昂贵,不利于规模化推广.因此,一方面需要根据应用场景的不同实现不同学科背景、多技术领域的科研人员协作;另一方面需要推进海洋试验平台共用以及数据共享,以期促进水下信息物理系统信息化与智能化.