拒止环境下视觉辅助定位与导航技术综述*

2020-03-29 14:00廖鑫淼王正平贺云涛
弹箭与制导学报 2020年6期
关键词:导航系统定位传感器

廖鑫淼,王正平,刘 莉,贺云涛

(北京理工大学宇航学院,北京 100081)

0 引言

凭借全方位、全天候、全时段和高精度的优势,以GPS为代表的全球卫星导航系统(global navigation satellite system,GNSS)在军用导航系统中扮演着关键角色[1]。卫星信号被干扰、遮挡以及欺骗攻击等导致的GNSS定位设备无法正常输出导航参数的情形称为GNSS拒止环境(denied environments)。美国国防先期研究计划局于2014年宣布开展了抗拒止环境的全源导航系统的研究,并将开发独立于GPS系统的微定位、导航与授时(positioning navigation and timing, PNT)技术[2]。目的是依靠多种传感器获取周围环境信息,利用信息融合技术得到导航信息,从而降低战争武器对GPS的依赖[3]。应对拒止环境,增加导航系统冗余信息是克服传感器获取信息污染的有效解决途径。视觉导航是一种新型的导航技术,其结构简单、价格低廉、信息量大和抗干扰能力强的优点使之在军用领域具有极大的应用前景,成为在强拒止环境中代替GNSS的很好选择[4-5]。视觉组合导航系统由于其高定位精度、高自主性以及高抗电磁干扰等优点,已经成为新型导航体制的研究热点。

1 视觉导航技术

1.1 视觉导航概述

自2004年美国宇航局推出的火星探测器漫游者依赖视觉导航相机在未知环境下完成火星探测任务起,学术界掀起了视觉导航方法研究的热潮。视觉导航的本质是以图像处理的手段挖掘图像中所包含的导航信息,利用单目或双目相机等获取周围环境信息,通过图像处理技术和定位算法提取导航信息完成导航任务。系统不依赖于其他传感器及外部设备,可以实现在未知环境下的自主导航。视觉导航系统有两种不同的实现方法[5]:

1)第一种是基于图像匹配的定位方法,采用这种方法完成视觉定位需预先采集环境图像并建立导航环境的图像数据库,在飞行过程中从图像数据库中搜索与相机拍摄图像最为匹配的图像,从而估计当前状态的飞行平台位姿。基于图像匹配的定位方法中地图的创建与导航的实时定位分开完成。

2)另一种方法克服了预先创建地图的难点,将地图创建工作与移动平台的定位工作在导航过程中并行完成,同时在后端通过闭环检测的手段提高定位精度与地图的准确度。

文中考虑在拒止环境下应用视觉导航系统实现在未知环境的自主导航,应选择同步建图的方法。

1.2 视觉导航传感器方案

同步定位与建图技术(simultaneous localization and mapping, SLAM)是未知环境下导航系统的解决方案,也是无人系统在GNSS拒止环境下导航的关键方法。Smith和Cheecemen于1987年提出SLAM问题,其描述为:将移动平台放入未知环境中的未知位置,平台利用自身的传感器由所在的初始位置开始逐步建立增量式地图,并实时确定自身在地图中的位置[6]。目前视觉SLAM方法有多种视觉传感器方案,应用最广泛的方案包括以下3类[5]:

1)基于立体视觉的双目方法。将两个相机放于不同位置,结构类似于人的双眼,双目系统可根据视差原理计算图像深度信息,双目立体相机应用场地不受限制,定位精度高。但双目视觉传感器应用前需进行复杂的标定,另外,在应用距离远大于两相机距离时这种方法将退化为单目方法。

2)基于RGB-D深度传感器的方法。当下应用广泛的RGB-D传感器包括微软公司的Kinect/Kinect v2、英特尔公司的RealSense以及华硕公司的Xtion传感器等。RGB-D传感器可以直接获得空间的深度信息,优势是廉价且体积小。但这类传感器的视场小,深度测距范围有限,不适于室外环境使用。

3)基于单目视觉的方法。单目相机相较于前两种方法具有结构简单,价格便宜,畸变较小的优势,且其应用场景更广泛。但仅用一个摄像头无法直接获得场景深度,系统需初始化获得尺度信息。

综合适用场景及系统复杂度等因素,单目视觉SLAM方法更适用于野外作战环境,其结构简单便于应用,且能满足视觉导航应用的计算精度。

2 单目视觉SLAM技术

根据算法模型的框架分类,单目视觉SLAM包含两类方法[7]:基于滤波器的方法和基于最优化的方法。基于滤波器的SLAM出现较早,经过不断的改进和完善已经较为成熟;基于最优化的SLAM技术出现较晚,但已经逐渐成为主流方法。

2.1 基于滤波器的单目SLAM方法

SLAM问题涉及到未知环境的描述与状态的位姿估计,因此早期的单目视觉SLAM方法均采用联合后验概率模型来描述该问题。具体做法是利用状态向量来存储环境中路标的三维坐标以及相机位姿,利用概率密度函数表征不确定性,递归的计算从前时刻转移到当前时刻的转移概率,从而实现同步定位与地图构建任务。

基于滤波器的单目SLAM问题的常用解决方案是基于扩展卡尔曼滤波器(extended Kalman filter, EKF)的EKF-SLAM[8]:Davison等于2007年实现了一种基于EKF的实时单目视觉SLAM系统MonoSLAM[9-11];Lemaire等在MATLAB上完成了基于EKF的单目视觉SLAM的仿真系统的搭建[12];Roussillon等应用高速摄像机实现了基于扩展卡尔曼滤波器的单目视觉SLAM系统RTSLAM[13]。基于EKF的单目视觉SLAM算法流程如图1所示。

图1 基于EKF的单目视觉SLAM算法流程

此外,粒子滤波器、无迹卡尔曼滤波器等其他滤波方法也被引入到单目视觉SLAM算法中。粒子滤波算法的核心思想源于蒙特卡罗方法,即用某件事出现的频率来代替事件的概率。利用粒子滤波的方法解决SLAM问题的优势在于算法可以表达非高斯的噪声,从而避免了线性化。但为保证算法精度,在复杂场景定位时需要较多的粒子,这大大增加了计算量。Giremus等提出使用RBPF粒子滤波器来解决SLAM问题的RBPF-SLAM方法[14],采用粒子滤波器来估计相机的位姿,使用扩展卡尔曼滤波器估计环境中特征点的位置,并同时保留了扩展卡尔曼滤波和粒子滤波各自的优势。以此为基础,Montemerlo根据环境地图中特征相互独立的特性在2002年和2003年分别提出了FastSLAM[15]和FastSLAM2.0[16],相对于基于扩展卡尔曼滤波的方法,这类方法简化了计算,在路标特征较多的情况下效果较好,但在复杂环境中计算量很大,同时在粒子迭代计算中存在退化的问题。其他基于滤波器的SLAM算法还有UKF-SLAM[17]和EIF(扩展信息滤波)[18]等,此类方法均具有同样的问题,即存在线性误差积累,且在长时间工作后算法的计算量增加导致效率降低,因而降低计算精度。

2.2 基于最优化的单目SLAM方法

Michal和Dale等[19]于2007年提出PTAM(parallel tracking and mapping)方法,是视觉SLAM技术中一项里程碑式的突破,形成了基于最优化的视觉SLAM算法基本形式框架:引入关键帧,通过将几个关键图像串联起来,进而优化跟踪轨迹与所创建的地图。该方法将地图中路标的构建及相机的跟踪定位分开作为两个线程并行进行,这两线程信息仅从优化结果的关键帧中提取和计算,通过后端进行地图与轨迹的优化。PTAM方法的流程框图如图2所示,该方法开创性利用非线性化的方法解决了单目视觉SLAM问题,其后该类型的SLAM算法大多延续了PTAM的思路。

图2 基于最优化的单目视觉SLAM算法流程

Mouragnon等[20]利用完成标定的相机,将拍摄的一定数目的图像作为关键帧,利用快速的局部光束平差法(bundle adjustment, BA)实现了单目相机的实时定位与建图。Geraldo等[21]将视觉SLAM问题表述为非线性图像对齐任务,直接将图像强度作为计算量完成了城市环境的视觉SLAM系统。Newcombe等[22]提出了一种可以快速、密集重建由单目相机实时拍摄场景的视觉SLAM方法。Hauke等[23]提出了近实时单目视觉SLAM系统,系统采用一种新的位置图优化技术,允许在闭环检测时有效校正旋转、平移和尺度漂移误差。Alberto等[24]提出了一种使用广角相机捕捉的图像来构建密集三维地图的有效方法,构建的三维地图包含关于环境结构和外观的详细信息,非常适用于大型环境。Richard等[25]提出一种不依赖于特征提取而依赖于每个像素的实时单目SLAM方法DTAP。Christian等[26]提出一种半直接视觉里程计SVO(semi-direct visual odometry),此方法不对整个图像使用直接匹配方法,而是对图像中的特征点图像块进行匹配以获取相机位姿。Herrera等[27]提出一个实时视觉SLAM系统DT-SLAM,可以增量跟踪单个2D特征,并通过匹配的2D特征估计相机姿态,而不需考虑基线的长度。Engel等[28]提出LSD-SLAM,此方法可以构建大规模一致性的环境地图。Concha等[29]提出了一种密集单目映射算法,该算法将场景先验知识融入到算法中,提高了变分立体和多视点立体方法的精度。

Raul等[30]提出ORB-SLAM,系统采用混合单应矩阵和基础矩阵使其可在的室内和室外环境中实现实时定位与构图,很好的平衡了不同环境的适应性。系统使用ORB特征进行跟踪,对运动杂波具有很强的鲁棒性,在任何场景下均可以自动选择较优的模型完成自动初始化。ORB-SLAM是现代视觉SLAM系统中既完备又十分方便实用的方法,ORB-SLAM也是最完整继承PTAM形式的一种发展方式。Engel等提出DSO(direct sparse odometry),DSO是一种高精度的稀疏和直接视觉里程计方法,它结合了一个完全直接的概率模型(最小化光度误差)和所有模型参数的一致联合优化,包括几何(在参考帧中表示为逆深度)和相机运动。近年来基于最优化的单目视觉SLAM系统已经代替基于滤波器的方法成为主流的研究方法。

2.3 视觉SLAM技术发展展望

尽管视觉SLAM技术已取得了较大突破,但尚未达到通用导航技术的标准,目前仍存在问题和技术难点:

1)视觉SLAM技术的应用前景广阔,使用环境众多,但目前多数研究都是针对室内结构化环境,对于室外广阔环境下的地图构建与定位系统研究相对较少。且多数工作环境中存在动态物体,对于动态环境建模将是视觉SLAM的一个重要研究方向。

2)视觉SLAM中的数据关联主要是通过传统的图像处理手段,利用特征检测与特征匹配等方法进行信息提取存在精度低、计算效率低下等问题,有必要研究新型图像特征检测与匹配方法,例如应用人工神经网络处理图像提高SLAM算法精度等。

3)视觉SLAM的实时性是实现导航应用的关键,算法能够达到实时导航取决于不同程度硬件设备的支撑。降低计算复杂度、优化系统框架,从而提高计算效率也是视觉SLAM发展的重要一关。

3 视觉组合导航系统

3.1 视觉辅助定位与导航技术

纯视觉导航的优缺点明显:虽具有成本低、不易受外界干扰、自主性高的优点,但其在长时间使用下,由于系统估计的状态变量的维数增加,存在精度和速度两方面的局限性。针对在拒止环境下的导航需求,视觉组合导航系统是一个很好的选择。有效引入其他导航系统作为补充而形成的视觉辅助定位与导航系统能够充分发挥视觉系统的优势。目前已有的视觉组合导航系统主要包括:

1)INS组合系统。惯性测量单元对于短时间内的快速运动估计准确,提供视觉导航初始化信息,二者融合可得到更完善的室内环境定位系统。

2)GPS组合系统。GPS系统能够得到准确、可靠的绝对位置信息,通过GPS数据与视觉导航数据的融合可有效提高在室外环境中定位的可靠性。

3)GPS、INS混合型。混合型组合导航系统可满足室内、室外多种环境要求的导航系统,实现在更为复杂的环境下不同传感器交替工作。

4)激光雷达组合。激光雷达直接测量外部物体的几何信息,不能得到环境中物体的纹理信息,与视觉相结合能更有效感知周围环境,确定导航信息。

3.2 视觉惯性组合导航技术

IMU和摄像头的结合已被证明是一种轻量级和低成本的传感器套件,可以提供精确的运动估计和定位[31]。在视觉SLAM过程中,单目像机可以在没有尺度的情况下估计局部运动,然而,对于大多数应用来说,度量尺度应是可获取的,甚至是必需的;在这种情况下,IMU可以提供这样的度量信息,并且,两种传感器模式的互补特性使这对传感器适合于精确和高动态运动估计。Azuma等[32]通过卡尔曼滤波器融合了惯性导航信息与摄像机定位信息,实验结果证明了结合惯导信息的单目视觉定位方法比单目视觉方法误差更小。对于IMU与相机之间的标定问题,由于IMU测量航向角误差较大,顾照鹏,Liu等[33-34]提出了在IMU的部分信息不可靠时的标定方法。

Mourikis等[35]采用光流跟踪特征点的方法实现了基于多状态约束卡尔曼滤波器的实时视觉辅助惯性导航算法MSCKF。Michael等[36]实现了基于EKF的视觉惯性里程计ROVIO,将惯性测量用于滤波器的状态传递过程,视觉信息在滤波器更新阶段使用。Stefan等[37]通过非线性优化的方法实现了紧耦合的视觉惯性里程计算法OKVIS,相较于基于滤波器的方法其在精度方面具有更好的表现。Raul等[38]提出一种新的基于优化的视觉惯性同步定位与建图系统ORB-SLAM2,该系统能够在已建模地图区域实现零漂移定位。Qin等[39]采用紧耦合、非线性优化的方法,通过融合预先集成的IMU测量和特征观测实现了高精度的视觉惯性里程计VINS-Mono。

3.3 视觉组合导航技术发展展望

组合导航的实现并非简单的叠加堆砌,而是要根据各种导航方式的优劣,组合形成互补,达到“一加一,大于二”的效果。视觉组合导航系统的发展方向有以下几方面:

1)组合导航系统的方案选取。根据不同传感器的优势及各种应用环境,未来将出现多种视觉组合导航方法,组合导航系统信息来源将更加广泛,进而发展出各具特色的视觉组合导航系统。

2)各导航子系统导航信息的融合,以及信息融合的方式。此方面的研究应以使系统更加精确、简单和合理为目的,有效利用视觉信息与不同传感器信息,以达到更好的导航效果。

3)硬件架构的设计。视觉组合导航系统由于系统本身结构复杂,传感器与计算平台需要进行合理的设计和安排,使系统结构最优。

4 结论

围绕拒止环境下传统的导航技术不能满足要求,需要改进与变革这一主题,提出视觉导航代替GPS系统的方案。得出单目SLAM方法适用于拒止环境作战。基于最优化的方法逐渐取代基于滤波器的方法成为单目SLAM的主流方法的结论。指出视觉组合导航技术的发展趋势,未来导航系统的发展将体现信息融合的思想,朝着更加全面、智能化的道路发展。

猜你喜欢
导航系统定位传感器
制作二氧化碳传感器
北斗卫星导航系统专名的确定与保护
基于物联网技术的船舶智能导航系统
舰船测风传感器安装位置数值仿真
氧传感器的基本检测
银行业对外开放再定位
跟踪导练(三)2
少儿智能定位鞋服成新宠
把握新定位、新要求 推动人大工作创新发展
难与易