王冠宇
(山东理工大学,山东 淄博 255000)
粗差会对最小二乘估计造成不良影响,即观测值中含有粗差时,采用最小二乘法求得的参数估值变得不再可靠[1]。L1范数最小估计作为一种稳健估计方案,虽然在计算效率方面弱于最小二乘,但在抗差方面有较为明显的优势[2]。目前对L1范数估计在测量数据处理中的应用已有大量研究,如L1范数在控制网观测值粗差探测,以及卫星定位中的应用等[3-4]。
在进行平差处理时,对于小样本观测的情形,计算效率并不是考虑的主要因素,保证精度为首要目标。在一般的观测过程,粗差出现的概率在1%~10%,且不服从正态分布[5-6]。此时若使用单纯最小二乘估计进行平差解算,参数估计必然会失实;若采用L1范数最小估计,是否会取得较高精度的参数平差值有待验证。
基于上述理论,本文详细解释了L1范数在平差过程中的应用原理,并采用matlab软件模拟观测值,通过平差实验,从内、外符精度等方面对最小二乘估计和L1范数最小估计方案的抗差性以及残差特性作出讨论。实验表明,最小二乘会使粗差等概率分配到正常观测值上,即不能从残差分布上探测到粗差;L1范数则不受影响,对粗差观测值作出有效探测。
设有误差方程[7]:
基于线性规划理论,对式(1)采用单纯形法求解,其估计准则[8]:
其中:n为观测值个数;pi为独立观测值的权,vi为第i个观测值的残差;P和V为相应的权阵和残差向量。求解L1范数估计时通常使用基于线性规划的单纯形法或选权迭代法,解得待估参数及残差V。将参数平差式(1)作为约束条件的L1估计数学模型[9]:
将(4)代入模型式中可得到线性规划的标准形式[10]:
式(5)为具有概括性的L1范数平差模型。基于选权迭代法求解L1范数,取ρ函数为ρ(ν)=|ν|,则估计准则[11]:
式中:νi为观测值改正数;ρ(νi)为观测值权函数,式(6)对求导,得
如此进行法方程解算并迭代,直到前后两次解的差值符合限差要求为止。选权迭代法解算L1范数已有较多讨论,在此不多赘述,本文使用算法和模型相对完备的单纯形法对L1范数估计进行求解。
标准形式的单纯形法用向量形式表示如下[12]:
约束方程组的系数矩阵的任意非奇异子方阵B,其列向量线性无关,称为一个基矩阵,用B来表示B=(P1,…,Pm)。除基变量以外的变量Pi(i=m+1,…,n),非基矩阵用N表示N=(Pm+1,Pm+2,…,Pn)。从而可以将系数矩阵写为分块的形式A=(B,N),记XB=(x1,x2,…,xm)T,XN=(xm+1,xm+2,…,xn)T,这样待求解X写为分块形式,即BXB+NXN=b,由此解得:
这是用非基变量表达基变量的公式。此时可以将XN看作一组自由变量,给它们任意一组值,得,这就是约束方程组的一个解。如令式(5)中所有的非基变量,则,称解为线性规划问题的基本可行解。
在式(10)中令xN=0,得,则式(5)相当于。将式(10)代入目标函数的表达式,即得用非基变量表达目标函数的公式:
此时若记目标函数在x(0)处的值为f(0),即,再记,则目标函数的表达式可写为:
λj可用来判断一个基可行解是否为最优解,对于某线性规划问题的一个基B,若全部λN=cN-cBB-1N≥0,则对应的基解x(0)便是LP的最优解,否则重复上述过程。
假设某观测向量为Y,参数真值向量为X,其存在以下关系:
式中ε是误差向量。为了实验验证方便,我们给定真值X和设计矩阵A,则观测值的真值向量:
给定的参数真值X=[1,2,3]T;随机生成100×3的设计矩阵A;根据不同情况生成的100×1的误差向量ε。生成模拟数据后,为了直观展示最小二乘估计与L1范数估计之间的差异,使用如下方案进行解算:
(1)生成服从均值为0,标准差为1的无粗差正态分布误差,分别用最小二乘估计和L1范数估计进行计算,重复计算过程10次,得到当误差分布服从正态分布时的参数X;
(2)在(1)的基础上,对每次生成的数据添加10%的较大粗差,并比较2种算法的结果差异。
为对比2种算法所得结果,使用内符精度和外符精度进行直观展现[2]。参数的内符精度含义为所有组数据计算的参数中误差的平均,即为第i组数据第n个参数的中误差。参数的外符精度为所有数据计算的参数真误差的均方根,即mn=为第i组数据第n个参数的中误差。
根据上述实验流程,得到结果见表1。
表1 2种方法精度对比
由表1我们可以看出,当误差服从正态分布的时候,最小二乘估计和L1范数估计的内、外符精度存在较小差别,最小二乘估计精度稍优于L1范数估计,说明此时最小二乘估计最优。而当添加粗差时,对最小二乘估计会造成严重影响,L1范数则能避免粗差影响,依然保持和无粗差时相同的精度。下面,我们通过2种方案的残差值来进一步分析。
从图1中我们可以看出,在使用最小二乘估计平差时,会将粗差无差别等概率分配到其他观测值中,导致无法从残差结果进行粗差观测值的定位。说明最小二乘估计不具有抗差性,粗差会损害最小二乘估计的平差结果,从而无法达到预期精度。
图1 最小二乘估计残差值
由图2我们可以看出,L1范数估计的残差值能精确定位粗差观测值,真残差会分配到粗差较大的观测值上,说明L1范数具有较强的抗粗差能力。
图2 L1范数估计残差值
通过L1范数估计和最小二乘估计的实验验证,小样本情况下,当观测中不含粗差时,最小二乘估计和L1范数估计精度相差不大;当观测值中含有粗差时,L1范数最小估计能获得较好的平差结果,这与L1范数的解算原理有关,总是能在准则下选得最优的平差解。
虽然L1范数估计相比最小二乘有良好的抗差性,但并不能说L1范数估计强于最小二乘,其在某些情况存在不能真实反映粗差信息的问题,且其多适用于小样本参数估计。在抗差领域,发展L1范数与最小二乘相结合的抗差估计方法,进而为抗差最小二乘提供高质量、高可靠性残差信息,让最小二乘变得适应性更强。