渐进性优化的尺度自适应Cauchy稳健估计模型及其应用

2023-02-18 01:17李加元张永军艾明耀胡庆武
测绘学报 2023年1期
关键词:权函数比率残差

李加元,张永军,艾明耀,胡庆武

武汉大学遥感信息工程学院,湖北 武汉 430079

稳健估计是几何处理与平差系统中的一个核心基础问题[1-5],在摄影测量与遥感、计算机视觉、机器人视觉等领域发挥着重要作用。它是一种同时进行几何模型拟合与异常值检测的技术,能够从被污染的观测值中正确估计出观测值所满足的几何模型。由于实际观测值中不可避免地存在粗差(异常值),该技术已被广泛应用于误匹配剔除[6]、光束法平差[7-8]、点云配准[9-10]、同时定位与制图(simultaneous localization and mapping,SLAM)[11]等摄影测量任务中。基于M估计的迭代加权最小二乘(iterative reweighted least squares,IRLS)[12-19]和随机采样一致性方法(random sample consensus,RANSAC)[20-27]为最常采用的两类稳健估计方法[28]。

IRLS又称选权迭代法[12-13],相比RANSAC类方法,其优点是运算效率高并且能够确保局部最优解[28],IRLS通常采用M估计作为稳健核函数。在迭代过程中,IRLS的核心思想是基于观测值残差赋予粗差小权值,可靠观测大权值,从而缓解粗差对平差系统的影响。IRLS的关键在于权函数的选取,常用的权函数包括Huber、Cauchy、Welsch、Tukey等M估计核[13]。文献[15]基于验后方差估计思想推导权函数。文献[16]提出一种基于IGG(institute of geodesy and geophysics)权函数的迭代加权总体最小二乘法。文献[18—19]分别从效率与稳健性方面对传统M估计进行改进。IRLS及现有变种都存在一个严重缺陷,即IRLS在理论上无法处理高于50%的粗差。一旦观测值中粗差比率高于50%,此类方法完全失效。随着自动化处理的普及,观测值包含50%粗差的情形随处可见,如影像特征匹配、点云特征匹配、SLAM闭环检测等。因此,在这些任务中,对高粗差比率较为稳健的RANSAC方法更受青睐。

RANSAC是一种假设检验技术[20],它主要包括两个步骤:①基于随机最小子集的几何模型估计;②基于一致性集的几何模型验证。RANSAC交替执行上述两个步骤直至满足终止迭代条件,对应于最大一致性集的几何模型被认为是正确解。RANSAC存在大量改进算法[21-27]。MLESAC(maximum-likelihood estimation by random sampling consensus)[21]基于概率统计思想,采用最大化似然性来取代RANSAC方法的最大化一致集大小。LO-RANSAC(locally optimized RANSAC)[22]和FLO-RANSAC(fixing locally optimized RANSAC)[23]通过增加局部优化过程来减少所需的采样次数。GC-RANSAC(graph-cut RANSAC)[24]通过引入图割技术来进一步提高局部优化的可靠性。RECON(residual consensus)[25]利用残差一致性来消除RANSAC对内点阈值的依赖性。USAC(universal RANSAC)[26]将多种改进算法的特性纳入一个通用框架内,包括工程及计算等方面的技巧。MAGSAC++(marginalizing sample consensus)[27]提出一种独立于内点阈值的打分函数。但是,RANSAC类方法存在3大缺点:①采用最小集估计几何模型仅能获得近似解,最优解需全部观测值参与解算;②随着粗差比率的增加,此类方法的时间复杂度呈指数增长,运行效率低下;③RANSAC类方法难以直接应用于测量平差系统中。

近年来,许多研究工作试图突破上述M估计的瓶颈问题。例如,M估计被pbM估计器[29]和广义pbM估计器[30]重新表述为基于投影的优化问题,并基于变量误差(EIV)模型进行求解。加权Q范数[31]估计器进一步提高了Q范数模型(0

本文旨在构建一种同时继承IRLS的优点(高效且最优)与RANSAC的优点(能处理高于50%的粗差)的模型,提出了基于渐进优化的尺度自适应Cauchy稳健估计模型(注:本文所提尺度自适应模型具有通用性,并不仅限定于Cauchy估计,也适用于Huber、Tukey等M估计)。所提模型引入尺度因子来不断过滤大残差观测值并调节Cauchy核函数的稳健性,采用由粗到精的方式进行渐进优化。与前期工作[33]的不同之处主要表现为两个方面:①本文模型与统一代价函数的数学模型不同。本文模型是M估计模型的推广,为非分段函数,不存在奇异点问题;②在模型优化求解过程中,每次迭代利用控制参数剔除一部分大残差观测值,因此,在本文的优化过程中,观测值是动态变化的。而在统一代价函数模型中,尽管观测值在某次迭代中获取了很小的权值,但在后续迭代中有可能重新获得较大权值,导致迭代震荡现象。此外,本文还给出了其在经典摄影测量任务中的应用,包括匹配剔除、后方交会及点云配准。试验结果表明,该模型明显优于基于M估计的IRLS模型和RANSAC类方法。

1 经典M估计与IRLS

M估计是最大似然估计的泛化形式,其数学表达如下(以线性回归为例)

(1)

式中,ρ(vi)为稳健核函数,vi=(f(xi,θ)-yi)为观测值(xi,yi)的残差;f(·)是观测值所满足的几何模型(此处为线性模型);θ为待求模型参数;N为观测值数目。

表1 常用的M估计核函数ρ(v)和权函数w(v)(v为观测值残差,c为常量)Tab.1 Several commonly used M-estimators and their weight functions (v is the residuals of observations,c is a constant)

式(1)通常转换为下述IRLS问题进行求解

(2)

(1) 变量估计:给定权值w(vi)t-1作为已知量(t为迭代计数器),采用加权最小二乘法求解问题(3)

(3)

(3) 交替迭代执行步骤(1)和(2),直至满足算法终止条件。

2 尺度自适应Cauchy稳健估计模型

动机:经典Cauchy估计只能处理低粗差比率问题。如果粗差比率较高(>50%),则初始估计(首次迭代)模型将大幅偏离真值,从而造成正确观测值的残差较大,权重很小。图1(a)为经典Cauchy估计的权函数,可以看出,当残差为20时,其权重仅为0.01。在如此苛刻的条件下,许多正确观测值并没有实际参与优化过程。因此,理想的稳健估计代价函数应该首先让所有观测值都参与到优化过程,然后,随着迭代的进行逐渐提高代价函数的稳健性,最终变为经典的M估计函数。具体如图1(b)所示,观测值取得小权值(假设为0.01)所对应的残差阈值应随着迭代的进行不断缩小。开始时所有观测值都参与优化,尽管初始模型可能不准确,但残差较大的正确观测值仍会对优化过程做出较大贡献。每次迭代后由于阈值减小,一部分具有最大残差的观测值将会被赋予小权值,这些具有最大残差的观测值通常都是粗差观测。因此,随着代价函数的变化,许多粗差观测被剔除,真实的粗差比率会不断降低。当代价函数变为经典M估计时,真实粗差比率将会小于50%。

图1 传统Cauchy M估计与理想稳健估计的权函数曲线对比Fig.1 Comparison of traditional M-estimation function and the ideal function for robust estimation

模型:为实现上述过程,本文提出了尺度自适应Cauchy稳健估计模型。在经典Cauchy估计中引入尺度参数α来控制代价函数的稳健性,其数学公式为

(4)

与其对应的权函数为

(5)

图1(b)显示了不同尺度下的权函数曲线。可以看到,当α取值越大时,越多的观测值能够参与优化过程;反之,当α取值越小时,只有残差很小的观测值参与优化,模型估计精度越高。

求解:所提模型为经典M估计的变种,可采用“由粗到精”的IRLS优化策略。首先,将α初始化为大值(本文将初始尺度α0设为初始估计模型的最大残差),进行模型估计、粗差剔除和权值更新;然后,随着迭代过程α不断减小,并执行上述步骤直至模型收敛。

(1)变量估计:给定尺度αt-1和观测值权值w(vi,αt-1)t-1作为已知量,采用加权最小二乘法求解问题,见式(6)

(6)

(3)尺度更新:减小尺度αt=αt-1/τ,其中τ为步距常数(本文设为1.3)。

(4) 交替迭代执行步骤(1)—(3)直至满足终止条件。

可以看出,所提模型的优化过程与传统IRLS相似,仅多出粗差剔除与尺度更新过程。因而,其也具有传统IRLS方法的优点,如优化效率高、具有最优解、适用于平差系统等。

3 模型应用

稳健估计在摄影测量与遥感任务中具有重要作用,本节将所提尺度自适应Cauchy模型应用于误匹配剔除、相机位姿估计及点云配准中。

3.1 误匹配剔除

yi=f(xi,θ)=Axi+t

(7)

式中,A为2×2仿射矩阵;t为2×1平移向量;θ=(A,t)为仿射变换模型参数。误匹配剔除的尺度自适应Cauchy权函数为

(8)

3.2 后方交会

(9)

式中,P=K[R,T]为3×4相机投影矩阵;Pk(k=1,2,3)为P的第k行;θ=(R,T)为位姿参数。

后方交会的尺度自适应Cauchy权函数为

(10)

3.3 点云配准

Yi=f(Xi,θ)=RXi+T

(11)

式中,θ=(R,T)为配准参数;R为三维旋转矩阵;T为三维平移向量。

误匹配剔除的尺度自适应Cauchy权函数为

(12)

如果在模型f中加入尺度因子,该问题即变为摄影测量中经典的绝对定向问题。

4 试验结果与分析

采用模拟试验和真实数据试验来评估本文模型的稳健性、精度及效率。基于误匹配剔除、相机位姿估计及点云配准3个任务,将所提模型与Cauchy估计、Welsch估计、RANSAC、FLO-RANSAC及MAGSAC++进行对比分析。试验选用均方根误差(RMSE)、成功率及运行时间作为定量评价指标。每种方法的详细配置信息(参数与代码来源)见表2。所有方法的运行时间均在单核1.8 GB赫兹CPU i7-8550U上统计得到。

表2 对比方法参数设置与代码实现Tab.2 The parameter settings and implement details of each compared method

4.1 误匹配剔除

试验结果如图2所示,Cauchy和Welsch估计在粗差比率低于50%的情况下精度与速度均为最优。但是,一旦粗差比率超过50%,其性能将急剧下降,成功率曲线现断崖式下跌至0。这也与M估计在理论上只能处理低于50%的粗差观测的结论相吻合。与M估计相比,RANSAC类方法(RANSAC、FLO-RANSAC和MAGSAC++)和本文模型则对高粗差比率较为稳健,能处理高达90%的粗差观测。由于RANSAC类方法无法获得最优解,RANSAC和FLO-RANSAC的模型估计精度相对较差(RMSE最大)。虽然MAGSAC++也是RANSAC的一种变体,但是其在算法中采用了M估计来提升模型精度。本文方法精度与M估计相当,运行效率仅次于M估计。在粗差比率为90%时,本文模型比RANSAC方法快将近3个数量级,比采用C++实现的MAGSAC++快将近2个数量级。

图2 误匹配剔除模拟试验结果Fig.2 Comparison of mismatch removal results on the simulated data

真实试验:选取6种类型(包括可见光-可见光、红外-可见光、SAR-可见光、深度图-可见光、地图-可见光、夜光-白天)的多模态影像对进行试验对比。本文采用RIFT算法提取初始匹配点集。由于多模态影像存在严重的非线性辐射畸变,初始匹配点的粗差比率较高(>80%),传统M估计无法成功解算,故只与其他3种方法进行对比,试验结果见表3。本文模型同时取得了最佳模型精度与运行速度。模型精度相比排名第二的方法提升了15.6%;运行效率比采用C++实现的MAGSAC++快25倍,比RANSAC和FLO-RANSAC快350多倍。本文模型在每种影像对上的定性定量结果如图3所示。

表3 误匹配剔除真实试验结果Tab.3 The results of mismatch removal on real data

注:n为初始匹配数量,γ为粗差比率,黄线表示正确匹配对。图3 本文方法在多模态影像上的匹配结果Fig.3 Our feature matching results on the multi-modal image dataset

4.2 后方交会

图4 后方交会模拟试验结果Fig.4 Comparison of image orientation results on the simulated data

真实试验:选用2张由SWDC倾斜相机所摄影像作为测试数据,影像大小为5406×7160像素,摄影比例尺约为1∶8000,相对航高接近700 m。其中,第1幅影像由中心垂直摄影相机拍摄所得,焦距为12 102.1像素;第2幅影像由倾斜摄影相机获取,焦距为14 671.5像素。采用GPS-RTK技术在第1幅影像覆盖测区内布设了36个控制点,第2幅影像测区布设了60个控制点。然后,由人工刺点方式获取这些控制点所对应的像点坐标。然而,由于人工刺点错误,两幅影像中正确像点观测个数分别仅为12和15,即两幅影像的粗差比率分别为66.7%和75%。实现结果见表4,本文方法再次在RMSE和运行时间两个指标上取得了最优,解算精度约为1个像素。

表4 后方交会真实试验结果Tab.4 The results of image orientation on real data

4.3 点云配准

模拟试验:模拟过程与误匹配剔除类似,不同之处在于点云配准的观测值为三维坐标点,并且几何模型为仅包含三维旋转和平移的刚体变换。三维点由正态分布N(0,1002)获得,旋转角在区间[-π/2,π/2]内随机生成,平移量在区间[-100,100]内生成,高斯噪声标准差为0.1 m。试验结果如图5所示,M估计(Cauchy和Welsch)在粗差比率超过40%后,性能开始急剧下降。反观本文方法,即使在90%的粗差比率下,其解算成功率依然接近100%。

图5 点云配准模拟试验结果Fig.5 Comparison of point cloud registration results on the simulated data

真实试验:从ETH公开激光点云数据集中选取3个点云匹配对进行试验,每个匹配对间的真值刚体变换已知。这些激光点云的数据量非常大(千万级点数),因此,首先利用格网滤波方法进行降采样,采样间隔为0.1 m。然后,采用ISS(intrinsic shape signatures)[36]算法和FPFH(fast point feature histograms)[37]算法分别进行特征检测与特征描述,并通过最近邻匹配得到初始3D特征匹配点。由于激光点云缺乏纹理信息,3D特征描述符的显著性比较差,所以初始匹配集中粗差比率非常高(本文试验中>96%)。在进行算法对比试验之前,首先基于支持线投票策略进行初步筛选,过滤掉部分粗差观测。试验结果见表5,可知,本文模型的配准精度达到了0.2 m(两倍的点云分辨率)。除开预处理部分(降采样、初始匹配、支持线投票)的耗时外,本文模型仅需0.02 s即能实现配准参数解算。详细的定性定量结果见图6。

表5 点云配准真实试验结果Tab.5 The results of point cloud registration on real data

注:n为初始匹配数量,γ为粗差比率,绿线表示正确匹配对。图6 本文方法在三维激光点云上的配准结果Fig.6 Our registration results on 3D LiDAR point clouds

4.4 参数τ敏感性分析

基于点云配准模拟试验来分析步长参数τ的最佳取值,试验过程与3.3节类似,区别在于步长参数τ的取值不同,试验结果如图7所示。

由图7可知,当粗差比率小于80%时,τ在1.1~2.0间取值时均能取得100%的成功率;当粗差比率大于80%时,τ的取值越大,成功率越低。而算法所需的迭代次数与τ成反比,即τ越小,迭代次数越多,计算效率越低。综合成功率和效率因素,τ的建议取值范围为1.3~1.6,本文取1.3。

图7 参数τ敏感性分析试验结果Fig.7 Results of sensitivity analysis of parameter τ

4.5 模型缺陷

本文模型存在一个隐含假设前提,即粗差观测近似满足均匀或者随机分布(非对抗性粗差,non-adversarial outliers)。如果该假设前提不成立,则本文模型可能失效。比如,当粗差观测大于50%,并且它们之间也满足另一个几何模型时,本文模型的解算结果将为粗差观测所满足的几何模型。因此,其不适用于多几何模型同时估计的情形。再比如,当正确观测与粗差观测在空间分布上各自聚为一团,并且相距较远时,那么,由于初始估计偏差过大可能导致模型无法收敛。解决该类问题只需提供待求模型的良好初值。

5 结 论

本文提出了一种渐进优化的尺度自适应Cauchy稳健估计模型。该模型引入了尺度控制参数来调节经典Cauchy核函数的稳健性。此外,该参数还发挥内点阈值的作用。在优化过程中,采用粗到精的迭代加权最小二乘法(IRLS)不断提升核函数的稳健性并过滤掉大残差观测值,降低真实粗差比率。采用大量模拟与真实数据对本文模型的正确性、解算精度、运行效率、通用性进行验证,得到以下几点结论:

与采用M估计作为核函数的IRLS方法相比,本文模型能处理高粗差比率的情形。与RANSAC类方法相比,本文模型能获取最优解,模型求解精度更高,并且运行效率提升了2~3个数量级。本文模型具有较好的通用性,在误匹配剔除、后方交会和点云配准任务中均取得了很好的效果。综上所述,笔者认为该模型具有很好的实用性,在大多数摄影测量、计算机视觉等任务中能够取代已被广泛应用的RANSAC方法。

因为本文模型与经典选权迭代法在形式上保持一致,笔者相信本文模型亦能用于平差系统中,进一步提升现有平差系统的抗差性能,这将是笔者下一步的研究重点。此外,IRLS方法比牛顿法的收敛速度慢,在高维度问题上尤为突出,后续笔者将进一步研究基于牛顿法的稳健估计模型[38],提升平差系统运行效率。

猜你喜欢
权函数比率残差
基于改进权函数的探地雷达和无网格模拟检测混凝土结构空洞缺陷工程中的数学问题
基于双向GRU与残差拟合的车辆跟驰建模
一类具有时滞及反馈控制的非自治非线性比率依赖食物链模型
一类广义的十次Freud-型权函数
基于残差学习的自适应无人机目标跟踪算法
异径电磁流量传感器权函数分布规律研究*
基于递归残差网络的图像超分辨率重建
一种适用于微弱信号的新颖双峰值比率捕获策略
综合电离层残差和超宽巷探测和修复北斗周跳
两类ω-超广义函数空间的结构表示