一种基于MAD改进的GNSS高程时间序列粗差探测方法

2022-03-29 03:15:34鲁铁定何锦亮徐华卿贺小星
大地测量与地球动力学 2022年4期
关键词:历元层数残差

鲁铁定 何锦亮 徐华卿 贺小星

1 东华理工大学测绘工程学院,南昌市广兰大道418号,330013 2 江西理工大学土木与测绘工程学院,江西省赣州市红旗大道86号,341000

受多路径效应、地质构造活动、测站相关误差以及外界环境影响,GNSS坐标时间序列中不可避免地存在粗差[1-3],从而对建模精度和结果的可靠性产生重大影响。因此,探测并剔除GNSS坐标时间序列中的粗差就显得尤为重要。

经典的统计量粗差探测方法有3σ准则、四分位距法(inter-quartile range,IQR)以及中位数绝对偏差法(median absolute deviation,MAD)。其中,3σ法是利用最小二乘法求得观测序列的残差,然后对残差进行粗差探测。但最小二乘本身难以抵抗粗差,使得3σ法对残差的中误差估计有偏,从而影响粗差探测的可靠性[2]。IQR法相比3σ准则受粗差影响较小,具有更好的稳健性[4];但对于离散度较大的数据会使估计值偏大,从而影响粗差探测的效果[5]。MAD法具有抗差性强、对粗差敏感的优点,相比3σ准则和IQR法具有更好的稳健性[6-7],已广泛应用于粗差探测领域[7-9]。

在GNSS坐标时间序列粗差探测中,首先需构建合适的时间序列模型,获取残差序列[2]。近年来,国内部分学者利用小波分析[10](wavelet analysis,WA)、奇异谱分析[1,5](singular spectrum analysis, SSA)、L1范数[3](L1-norm)获取GNSS坐标时间序列的残差向量,并构造粗差判别统计量进行粗差探测。这些方法的关键在于如何准确地提取原始序列的趋势项和周期项,以分离出含粗差的残差项。其中,奇异谱分析在选取滞后窗口时具有一定主观性,不同的滞后窗口对信号的提取影响较大[11];而文献[3]中L1范数与IQR组合算法可能会对粗差产生“误判”或“漏判”。小波分析具有局部化时频分析能力和多分辨率分析特性,能准确提取时间序列的趋势项和周期项,进而反映出时间序列的内在特征[12-13]。

因此,本文在MAD法基础上结合小波分析,建立一种WT-MAD粗差探测方法,以提高传统MAD法对GNSS高程时间序列中偏离度较小的粗差的探测能力。

1 原理及方法

1.1 MAD粗差探测方法

黄博华等[7]在传统MAD方法基础上对其数学表达式进行改进,得到式(1)形式的表达式。对于服从正态分布的观测序列Xn={x1,x2,…,xi,…xn},将观测数据xi与其中位数K及中位数绝对偏差(MAD)数倍之和进行比较,若xi满足

|xi-K|>n·MAD

(1)

则认为xi为粗差点。式中,K=Med{xi},MAD=Med{|xi-K|/0.674 5}(Med表示求中位数),常数n取值按实际需求确定,n值较大不易剔除偏离度较小的粗差,而n值较小可能产生误判,一般取3~5[7,9]。在探测出粗差后,将粗差值设为0或其他值予以剔除。

1.2 WT-MAD粗差探测方法

GNSS高程时间序列可看作由不同频率部分组成的信号,趋势项、周期项主要集中在低频信号中,噪声和粗差干扰项主要集中在高频信号中[14]。本文在传统MAD方法基础上,利用小波分析对其进行改进,主要思路如下:利用小波多尺度分解提取原始时间序列的低频系数,将其重构为趋势项和周期项;原始时间序列减去重构序列得到残差序列,再利用MAD法对残差序列进行粗差探测,进而确定粗差位置。具体步骤如下:

1)利用3σ准则剔除原始时间序列X(t)中偏离度较大的粗差,以避免小波分解和重构受到影响。对于剔除粗差后的缺失值,采用线性插值法插补得到X′(t)。

(2)

式中,RMSEj表示分解层数为j时原始信号与降噪信号间的均方根误差,可由式(3)求得;r为相邻层数均方根误差之比,当r接近于1时,则取最佳层数为j或j+1。

(3)

(4)

4)利用MAD估计值探测残差序列中的粗差,当残差ri满足

|ri-K|>n·MAD

(5)

时,则认为ri为粗差点,即原始数据中xi为粗差点。式中,K为残差序列的中位数。步骤1)和4)中探测的粗差即为WT-MAD法探测出的所有粗差。

2 实验与分析

2.1 模拟数据

为验证WT-MAD方法的有效性,采用由趋势项、周期项和噪声项所组成的函数模型[15]对GNSS坐标时间序列进行建模,构造模拟时间序列,函数表达式如下:

y(t)=b+v0ti+

(6)

式中,i为坐标历元时刻标识,y(ti)为GNSS测站某一分量ti时刻的坐标,b为横轴截距,v0为线性速度,m0为周期性信号个数,fm为周期项频率,am和bm表示频率为fm的周期项对应的振幅,rti为随机噪声。

将利用式(6)模拟的高程方向坐标时间序列作为原始数据,各参数设置为:b=5.0,v0=2,m0=2,a1=b1=5,a2=b2=3,σwn=4。

向原始数据中加入粗差:首先模拟服从正态分布且标准差为6σwn(σwn为噪声标准差)的随机误差序列;然后提取大于3σwn的数据,并将其随机插入到原始数据中,得到一组被粗差污染的GNSS高程时间序列。模拟时间序列的时间跨度为2016~2020年,历元间隔为1 d,总历元数为1 827,粗差总数为115,粗差占总历元比例为6.29%(图1)。

图1 模拟的高程时间序列

模拟实验采用4种方法进行对比:LS-3σ法、LS-IQR法、LS-MAD法、WT-MAD法。前3种方法均基于式(6),利用最小二乘法去除趋势项和周期项以获取残差序列,再构造粗差判别式进行粗差探测。在LS-MAD法中,经筛选取n=3;在WT-MAD法中,经筛选取n=3,选用db4小波基函数,并利用式(2)求解最佳小波分解层数,相邻层数均方根误差之比见表1。由表可知,第4层和第5层间的均方根误差之比最小,因此取小波分解层数为5。粗差探测结果如图2和表2所示。

表1 相邻分解层数均方根误差之比

从图2可以看出,LS-3σ法可探测出大部分粗差,但对偏离度较小的粗差探测效果有限,而LS-IQR法、LS-MAD法和WT-MAD法均可探测出绝大部分粗差。由表2可知,WT-MAD法粗差剔除率为98.3%,高于其他3种方法;虽然LS-IQR法和LS-MAD法均存在1个误判,但这两种方法的粗差探测率与WT-MAD法相近,这主要是因为模拟时间序列未考虑季节项、阶跃等非线性变化,且加入的噪声仅为白噪声。在先验模型准确的情况下,利用最小二乘法同样能准确获取模拟数据的残差,从而得到较好的粗差探测效果。在利用WT-MAD法剔除粗差后,通过小波分析可得到去除趋势项和周期项后的残差,结果如图3所示。从图3可以看出,残差序列为白噪声序列,无明显异常值,表明WT-MAD法可有效探测出模拟时间序列中的粗差。

图2 LS-3σ法、LS-IQR法、LS-MAD法和WT-MAD法粗差探测结果

表2 各方法粗差探测结果对比

图3 WT-MAD法剔除粗差后的残差序列

2.2 实测数据

本文选用SOPAC(scrips orbit and permanent array center)提供的“Raw”和“Clean”类型的单天高程(U)时间序列作为实测数据,其中“Raw”为原始时间序列,“Clean”为删除异常值的时间序列。

本次实验选取LHAZ、BJFS、TWTF三个IGS站2006~2020年共15 a的“Raw”数据进行分析。在IGS站中,GNSS坐标时间序列数据缺失的情况较为常见[16],而小波分析要求原始数据均匀采样,因此在粗差探测前先利用线性插值法插补缺失值。得到完整时间序列后,以LHAZ站为例,分别利用小波变换与LS法获取去除趋势项和周期项后的残差序列(图4)。由图可知,小波变换所得残差趋近为白噪声,而LS法获取的残差序列含有残余的周期性信号,表明LS法难以抵御粗差和有色噪声的影响,而小波变换在无需数据先验信息的情况下,能够更为准确地提取原始数据的趋势项和周期项。

图4 LHAZ站高程方向残差序列

利用WT-MAD法对各IGS站的时间序列进行粗差探测,与模拟实验相同,采用db4小波基函数,由式(2)求得各站最佳小波分解层数均为5,取n=3,探测结果见表3。

表3 LHAZ、BJFS、TWTF三个IGS站粗差探测结果

表3中粗差探测结果表明,3个IGS站均含有粗差,其中LHAZ站探测出的粗差最少,为100个;BJFS站最多,为104个。为验证WT-MAD方法的有效性,以LHAZ站为例,得到该方法剔除粗差后的高程时间序列,并与SOPAC提供的“Raw”数据进行对比,结果如图5~6所示。

图5 LHAZ站“Raw”高程时间序列

图6 WT-MAD法剔除粗差后的LHAZ站高程时间序列

从图5~6可以看出,原始时间序列在历元2006.5 a、历元2009.0 a、历元2014.0 a、历元2016.0 a以及历元2019.0 a附近均含有偏离度较大的粗差,而WT-MAD法可剔除这些粗差。

在利用WT-MAD法剔除LHAZ站原始高程时间序列的粗差后,通过小波变换可得到去除趋势项和周期项后的残差,结果如图7(a)所示。图7(b)为SOPAC提供的LHAZ站去除粗差、趋势项和周期项后的残差。对比图7(a)和图7(b)可知,图7(b)中历元2014.0 a和历元2021.0 a附近仍含有粗差,而图7(a)中这两个历元附近均无异常值,且残差序列近似为白噪声序列,表明WT-MAD法可更有效地剔除原始时间序列中的粗差。

图7 LHAZ站残差序列

为进一步验证WT-MAD方法的有效性,分别利用LS-3σ法、LS-IQR法、LS-MAD法和WT-MAD法对表3中3个IGS站的数据进行粗差探测,并将利用小波分析提取的趋势项和周期项作为参照,计算原始时间序列剔除粗差前后的RMSE,以此作为评判标准,结果如表4所示。从表4可以看出,3个测站中WT-MAD法探测出的粗差数量均多于LS-3σ法、LS-IQR法和LS-MAD法,且RMSE均小于其他3种方法,表明WT-MAD法可得到较好的探测效果。

表4 4种方法粗差探测结果及精度统计

3 结 语

本文针对GNSS高程时间序列非线性、不平稳性导致粗差探测困难的问题,构建一种基于MAD改进的WT-MAD粗差探测方法。该方法在进行粗差探测时不易受趋势项和周期项等影响,同时可降低数据非对称分布对MAD法的影响,从而可有效探测粗差。模拟实验和实测结果均表明,相比LS-3σ法、LS-IQR法和LS-MAD法,WT-MAD法可得到较好的探测效果,说明本文方法具有适用性和有效性。

在进行小波分析时,小波基函数及分解层数根据经验来选取,且需要进行重复实验确定,这会影响粗差探测效率,且在一定程度上具有主观性;若分解层数过大可能会造成粗差误判,过小则可能造成漏判。因此,如何快速、准确地选取小波基函数及分解层数还需进一步研究。

猜你喜欢
历元层数残差
填筑层数对土石坝应力变形的影响研究
基于双向GRU与残差拟合的车辆跟驰建模
上海发布药品包装物减量指南
康复(2022年31期)2022-03-23 20:39:56
基于残差学习的自适应无人机目标跟踪算法
历元间载波相位差分的GPS/BDS精密单点测速算法
基于递归残差网络的图像超分辨率重建
自动化学报(2019年6期)2019-07-23 01:18:32
MoS2薄膜电子性质随层数变化的理论研究
电子制作(2019年11期)2019-07-04 00:34:50
Recent advances of TCM treatment of childhood atopic dermatitis
Clinical observation of Huatan Huoxue Formula in treating coronary heart disease with hyperlipidemia
Mechanism of sex hormone level in biological clock disorder induced acne and analysis of TCM Pathogenesis