L1范数估计平差原理及抗差性分析

2022-03-30 15:03王冠宇
科技创新与应用 2022年8期
关键词:抗差范数残差

王冠宇

(山东理工大学,山东 淄博 255000)

粗差会对最小二乘估计造成不良影响,即观测值中含有粗差时,采用最小二乘法求得的参数估值变得不再可靠[1]。L1范数最小估计作为一种稳健估计方案,虽然在计算效率方面弱于最小二乘,但在抗差方面有较为明显的优势[2]。目前对L1范数估计在测量数据处理中的应用已有大量研究,如L1范数在控制网观测值粗差探测,以及卫星定位中的应用等[3-4]。

在进行平差处理时,对于小样本观测的情形,计算效率并不是考虑的主要因素,保证精度为首要目标。在一般的观测过程,粗差出现的概率在1%~10%,且不服从正态分布[5-6]。此时若使用单纯最小二乘估计进行平差解算,参数估计必然会失实;若采用L1范数最小估计,是否会取得较高精度的参数平差值有待验证。

基于上述理论,本文详细解释了L1范数在平差过程中的应用原理,并采用matlab软件模拟观测值,通过平差实验,从内、外符精度等方面对最小二乘估计和L1范数最小估计方案的抗差性以及残差特性作出讨论。实验表明,最小二乘会使粗差等概率分配到正常观测值上,即不能从残差分布上探测到粗差;L1范数则不受影响,对粗差观测值作出有效探测。

1 L1范数估计模型及平差原理

1.1 L1估计两种算法平差模型

设有误差方程[7]:

基于线性规划理论,对式(1)采用单纯形法求解,其估计准则[8]:

其中:n为观测值个数;pi为独立观测值的权,vi为第i个观测值的残差;P和V为相应的权阵和残差向量。求解L1范数估计时通常使用基于线性规划的单纯形法或选权迭代法,解得待估参数及残差V。将参数平差式(1)作为约束条件的L1估计数学模型[9]:

将(4)代入模型式中可得到线性规划的标准形式[10]:

式(5)为具有概括性的L1范数平差模型。基于选权迭代法求解L1范数,取ρ函数为ρ(ν)=|ν|,则估计准则[11]:

式中:νi为观测值改正数;ρ(νi)为观测值权函数,式(6)对求导,得

如此进行法方程解算并迭代,直到前后两次解的差值符合限差要求为止。选权迭代法解算L1范数已有较多讨论,在此不多赘述,本文使用算法和模型相对完备的单纯形法对L1范数估计进行求解。

1.2 单纯形法求解L1范数原理

标准形式的单纯形法用向量形式表示如下[12]:

约束方程组的系数矩阵的任意非奇异子方阵B,其列向量线性无关,称为一个基矩阵,用B来表示B=(P1,…,Pm)。除基变量以外的变量Pi(i=m+1,…,n),非基矩阵用N表示N=(Pm+1,Pm+2,…,Pn)。从而可以将系数矩阵写为分块的形式A=(B,N),记XB=(x1,x2,…,xm)T,XN=(xm+1,xm+2,…,xn)T,这样待求解X写为分块形式,即BXB+NXN=b,由此解得:

这是用非基变量表达基变量的公式。此时可以将XN看作一组自由变量,给它们任意一组值,得,这就是约束方程组的一个解。如令式(5)中所有的非基变量,则,称解为线性规划问题的基本可行解。

在式(10)中令xN=0,得,则式(5)相当于。将式(10)代入目标函数的表达式,即得用非基变量表达目标函数的公式:

此时若记目标函数在x(0)处的值为f(0),即,再记,则目标函数的表达式可写为:

λj可用来判断一个基可行解是否为最优解,对于某线性规划问题的一个基B,若全部λN=cN-cBB-1N≥0,则对应的基解x(0)便是LP的最优解,否则重复上述过程。

2 实验分析

2.1 实验数据准备及流程

假设某观测向量为Y,参数真值向量为X,其存在以下关系:

式中ε是误差向量。为了实验验证方便,我们给定真值X和设计矩阵A,则观测值的真值向量:

给定的参数真值X=[1,2,3]T;随机生成100×3的设计矩阵A;根据不同情况生成的100×1的误差向量ε。生成模拟数据后,为了直观展示最小二乘估计与L1范数估计之间的差异,使用如下方案进行解算:

(1)生成服从均值为0,标准差为1的无粗差正态分布误差,分别用最小二乘估计和L1范数估计进行计算,重复计算过程10次,得到当误差分布服从正态分布时的参数X;

(2)在(1)的基础上,对每次生成的数据添加10%的较大粗差,并比较2种算法的结果差异。

2.2 实验分析

为对比2种算法所得结果,使用内符精度和外符精度进行直观展现[2]。参数的内符精度含义为所有组数据计算的参数中误差的平均,即为第i组数据第n个参数的中误差。参数的外符精度为所有数据计算的参数真误差的均方根,即mn=为第i组数据第n个参数的中误差。

根据上述实验流程,得到结果见表1。

表1 2种方法精度对比

由表1我们可以看出,当误差服从正态分布的时候,最小二乘估计和L1范数估计的内、外符精度存在较小差别,最小二乘估计精度稍优于L1范数估计,说明此时最小二乘估计最优。而当添加粗差时,对最小二乘估计会造成严重影响,L1范数则能避免粗差影响,依然保持和无粗差时相同的精度。下面,我们通过2种方案的残差值来进一步分析。

从图1中我们可以看出,在使用最小二乘估计平差时,会将粗差无差别等概率分配到其他观测值中,导致无法从残差结果进行粗差观测值的定位。说明最小二乘估计不具有抗差性,粗差会损害最小二乘估计的平差结果,从而无法达到预期精度。

图1 最小二乘估计残差值

由图2我们可以看出,L1范数估计的残差值能精确定位粗差观测值,真残差会分配到粗差较大的观测值上,说明L1范数具有较强的抗粗差能力。

图2 L1范数估计残差值

3 结束语

通过L1范数估计和最小二乘估计的实验验证,小样本情况下,当观测中不含粗差时,最小二乘估计和L1范数估计精度相差不大;当观测值中含有粗差时,L1范数最小估计能获得较好的平差结果,这与L1范数的解算原理有关,总是能在准则下选得最优的平差解。

虽然L1范数估计相比最小二乘有良好的抗差性,但并不能说L1范数估计强于最小二乘,其在某些情况存在不能真实反映粗差信息的问题,且其多适用于小样本参数估计。在抗差领域,发展L1范数与最小二乘相结合的抗差估计方法,进而为抗差最小二乘提供高质量、高可靠性残差信息,让最小二乘变得适应性更强。

猜你喜欢
抗差范数残差
基于双向GRU与残差拟合的车辆跟驰建模
浅探抗差估计在水准数据处理中的应用
抗差EKF滤波在单频低成本接收机定位算法中的应用*
基于残差学习的自适应无人机目标跟踪算法
向量范数与矩阵范数的相容性研究
基于递归残差网络的图像超分辨率重建
基于加权核范数与范数的鲁棒主成分分析
两种新的IGGⅢ的改进方案
如何解决基不匹配问题:从原子范数到无网格压缩感知
综合电离层残差和超宽巷探测和修复北斗周跳