L1范数估计平差原理及抗差性分析

2022-03-30 15:03王冠宇

科技创新与应用 2022年8期

王冠宇

（山东理工大学，山东淄博 255000）

粗差会对最小二乘估计造成不良影响，即观测值中含有粗差时，采用最小二乘法求得的参数估值变得不再可靠[1]。L1范数最小估计作为一种稳健估计方案，虽然在计算效率方面弱于最小二乘，但在抗差方面有较为明显的优势[2]。目前对L1范数估计在测量数据处理中的应用已有大量研究，如L1范数在控制网观测值粗差探测，以及卫星定位中的应用等[3-4]。

在进行平差处理时，对于小样本观测的情形，计算效率并不是考虑的主要因素，保证精度为首要目标。在一般的观测过程，粗差出现的概率在1%~10%，且不服从正态分布[5-6]。此时若使用单纯最小二乘估计进行平差解算，参数估计必然会失实；若采用L1范数最小估计，是否会取得较高精度的参数平差值有待验证。

基于上述理论，本文详细解释了L1范数在平差过程中的应用原理，并采用matlab软件模拟观测值，通过平差实验，从内、外符精度等方面对最小二乘估计和L1范数最小估计方案的抗差性以及残差特性作出讨论。实验表明，最小二乘会使粗差等概率分配到正常观测值上，即不能从残差分布上探测到粗差；L1范数则不受影响，对粗差观测值作出有效探测。

1 L1范数估计模型及平差原理

1.1 L1估计两种算法平差模型

设有误差方程[7]：

基于线性规划理论，对式（1）采用单纯形法求解，其估计准则[8]：

其中：n为观测值个数；pi为独立观测值的权，vi为第i个观测值的残差；P和V为相应的权阵和残差向量。求解L1范数估计时通常使用基于线性规划的单纯形法或选权迭代法，解得待估参数及残差V。将参数平差式（1）作为约束条件的L1估计数学模型[9]：

将（4）代入模型式中可得到线性规划的标准形式[10]：

式（5）为具有概括性的L1范数平差模型。基于选权迭代法求解L1范数，取ρ函数为ρ（ν）=|ν|，则估计准则[11]：

式中：νi为观测值改正数；ρ（νi）为观测值权函数，式（6）对求导，得

如此进行法方程解算并迭代，直到前后两次解的差值符合限差要求为止。选权迭代法解算L1范数已有较多讨论，在此不多赘述，本文使用算法和模型相对完备的单纯形法对L1范数估计进行求解。

1.2 单纯形法求解L1范数原理

标准形式的单纯形法用向量形式表示如下[12]：

约束方程组的系数矩阵的任意非奇异子方阵B，其列向量线性无关，称为一个基矩阵，用B来表示B＝（P1，…，Pm）。除基变量以外的变量Pi（i=m+1，…，n），非基矩阵用N表示N＝（Pm+1，Pm+2，…，Pn）。从而可以将系数矩阵写为分块的形式A=（B，N），记XB＝（x1，x2，…，xm）T，XN＝（xm+1，xm+2，…，xn）T，这样待求解X写为分块形式，即BXB+NXN=b，由此解得：

这是用非基变量表达基变量的公式。此时可以将XN看作一组自由变量，给它们任意一组值，得，这就是约束方程组的一个解。如令式（5）中所有的非基变量，则，称解为线性规划问题的基本可行解。

在式（10）中令xN=0，得，则式（5）相当于。将式（10）代入目标函数的表达式，即得用非基变量表达目标函数的公式：

此时若记目标函数在x(0)处的值为f(0)，即，再记，则目标函数的表达式可写为：

λj可用来判断一个基可行解是否为最优解，对于某线性规划问题的一个基B，若全部λN＝cN-cBB-1N≥0，则对应的基解x(0)便是LP的最优解，否则重复上述过程。

2 实验分析

2.1 实验数据准备及流程

假设某观测向量为Y，参数真值向量为X，其存在以下关系：

式中ε是误差向量。为了实验验证方便，我们给定真值X和设计矩阵A，则观测值的真值向量：

给定的参数真值X＝[1，2，3]T；随机生成100×3的设计矩阵A；根据不同情况生成的100×1的误差向量ε。生成模拟数据后，为了直观展示最小二乘估计与L1范数估计之间的差异，使用如下方案进行解算：

（1）生成服从均值为0，标准差为1的无粗差正态分布误差，分别用最小二乘估计和L1范数估计进行计算，重复计算过程10次，得到当误差分布服从正态分布时的参数X；

（2）在（1）的基础上，对每次生成的数据添加10%的较大粗差，并比较2种算法的结果差异。

2.2 实验分析

为对比2种算法所得结果，使用内符精度和外符精度进行直观展现[2]。参数的内符精度含义为所有组数据计算的参数中误差的平均，即为第i组数据第n个参数的中误差。参数的外符精度为所有数据计算的参数真误差的均方根，即mn=为第i组数据第n个参数的中误差。

根据上述实验流程，得到结果见表1。

表1 2种方法精度对比

由表1我们可以看出，当误差服从正态分布的时候，最小二乘估计和L1范数估计的内、外符精度存在较小差别，最小二乘估计精度稍优于L1范数估计，说明此时最小二乘估计最优。而当添加粗差时，对最小二乘估计会造成严重影响，L1范数则能避免粗差影响，依然保持和无粗差时相同的精度。下面，我们通过2种方案的残差值来进一步分析。

从图1中我们可以看出，在使用最小二乘估计平差时，会将粗差无差别等概率分配到其他观测值中，导致无法从残差结果进行粗差观测值的定位。说明最小二乘估计不具有抗差性，粗差会损害最小二乘估计的平差结果，从而无法达到预期精度。

图1 最小二乘估计残差值

由图2我们可以看出，L1范数估计的残差值能精确定位粗差观测值，真残差会分配到粗差较大的观测值上，说明L1范数具有较强的抗粗差能力。

图2 L1范数估计残差值

3 结束语

通过L1范数估计和最小二乘估计的实验验证，小样本情况下，当观测中不含粗差时，最小二乘估计和L1范数估计精度相差不大；当观测值中含有粗差时，L1范数最小估计能获得较好的平差结果，这与L1范数的解算原理有关，总是能在准则下选得最优的平差解。

虽然L1范数估计相比最小二乘有良好的抗差性，但并不能说L1范数估计强于最小二乘，其在某些情况存在不能真实反映粗差信息的问题，且其多适用于小样本参数估计。在抗差领域，发展L1范数与最小二乘相结合的抗差估计方法，进而为抗差最小二乘提供高质量、高可靠性残差信息，让最小二乘变得适应性更强。