吴昊舰,刘立龙,章传银,薛张芳,张志
(1.桂林理工大学 测绘地理信息学院,广西 桂林 541004;2.广西空间信息与测绘重点实验室,广西 桂林 541004;3.中国测绘科学研究院,北京 100036)
土壤湿度即土壤中水分在土壤所占的比重。作为当今农业、气象和水文研究中的一个重要参数[1],土壤湿度发挥着无可替代的作用。传统的地基测量方法[2](如土壤湿度计法、烘焙法以及时域反射法等)虽然精度较高,但是只适用于小范围的测量并且容易受到外界环境因素的影响。通过利用全球卫星导航系统(global navigation satellite system,GNSS)接收机来接收卫星传播过程中产生的信噪比观测值来监测地表环境,能够有效弥补传统方法中时空分辨率不足的缺点。基于此建立起来的全球卫星导航系统干涉测量(global navigation satellite system interferometry and reflectomentry,GNSS-IR)遥感方法已经发展成了一项全新的技术手段。
国内外学者对于如何利用GNSS-IR方法获取土壤湿度开展了大量的研究。Zavorotny等[3]通过建立多路径电动力模型和裸土模型的反射系数进行实验,证明了多径干涉相位反演结果相对于幅度而言更加准确。Jia等[4]提出利用随机森林与支持向量机对实验数据进行最小似然检索,构造了一个包含不同土壤类型的综合模拟数据集,最终结果表明随机森林方法更适合处理反演问题。Martin等[5]基于人工神经网络算法将辅助数据与反射率平均值进行不同组合,探究了地表粗糙度与植被衰减对反射率所造成的影响。万玮等[6]依据GNSS-R接收机的特征和原理将其分为了双天线模式和单天线模式,并且给出了不同模式下的实验,证明两种模式的精度差异。梁月吉等[7]利用美国板块观测计划(plate boundary observation,PBO)数据建立了土壤湿度多星线性回归反演模型,通过提升联合反演卫星数量来提高反演精度。孙波等[8]提出了一种自适应融合算法,将GPS不同频段的多颗卫星进行加权融合,相较传统均值融合方法有效提高了反演精度。
然而上述研究大多采用的是传统的一元线性回归模型进行模型构建,且实验条件基本都是接近理想情况的。实验中常用低阶多项式拟合获取信噪比残差序列分离效果不够理想,同时存在一系列问题如未曾考虑植被覆盖的影响或者是地表粗糙度的散射影响。小波变换[9]作为一种表述信号时间与频率的分析方法,具备多分辨率分析的优点,能够同时表达时间、频率的局部特征,因此可以利用这一优点来实现卫星信号中直射信号的分离从而获取信号趋势项。BP(back propagation)神经网络则实现了一个从输入到输出的过程而且具备实现任何复杂非线性映射的能力,通过反向传播来调整网络中的阈值和权值从而使得网络实际输出与期望输出达到最小值[10],在不出现过拟合的情况下,对地表植被覆盖和地表粗糙度引起的噪声进行抑制。基于此,本文建立了一种小波变换与BP神经网络(为便于后续描述将该模型简称为小波神经网络模型)相结合的GNSS-IR土壤湿度反演模型,并利用PBO H2O项目组以及积雪遥测系统(snow telemetry,SNOTEL)提供的土壤湿度数据作为精度评定的标准。
本文下载了PBO监测网中P036测站的观测数据以及附近气候站的土壤湿度实测数据进行比较分析。图1为GNSS接收机同时接收直射信号与反射信号的原理示意图,其中H为天线高,即接收机天线相位中心到地球表面的垂直距离;AD为卫星直射信号;AR为经过地表反射后的反射信号;θ为卫星高度角。GNSS接收机此时是同时接收卫星直射信号AD与经由地面反射的反射信号AR。
图1 GNSS-IR反射原理示意图
由图1 可知,信噪比与振幅的关系如式(1)所示[11]。
(1)
式中:Ac为合成信号振幅;Ad与Ar分别为直射信号与反射信号的振幅;ψ为两种信号之间相位之差,一般通过多路径效应从所获得的信噪比(signal to noise ratio,SNR)观测值中分离出来,并以此来得到SNR中因地表反射引起的多路径变化信息。结合式(1)可知,多路径效应对信噪比的影响主要来源于卫星高度角,上式中Ad的值通常远大于Ar的值,因此采用低阶多项式拟合的方法消除趋势项Ad。图2为去除趋势项后的SNR残差序列。
图2 去除趋势项后的信噪比残差序列
由式(1)可知,合成信号的振幅与直射信号幅度、反射信号幅度和相位延迟三者有关。其中直射信号与反射信号的相位差ψ如式(2)所示。
(2)
式中:h为反射面高度;λ为载波波长。h与频率f之间的关系如式(3)所示。
(3)
由式(3)可知,反射信号频率与反射面高度h呈线性关系。又因为sinθ的变化是非线性的,所以通过L-S(lomb-scargle)频谱变换[12]的方法对频率进行分析,最终得到反射面高度h,如图3所示。
图3 L-S频谱分析图
卫星干涉信号的信噪比表达如式(4)所示[13]。
SNR=Acos(2πfsinθ+φ)
(4)
式中:A、f、φ分别为干涉信号参量中的振幅、频率及相位。其中的sinθ可以在导出卫星导航文件时一并导出卫星高度角来计算具体数值,在得到去除趋势项的信噪比之后,再将经过L-S频谱分析后得到的频率f带入式(4),进行最小二乘拟合后获得干涉信号SNR的振幅和相位。文献[13]表明上述三个特征参量都可以用于土壤湿度的反演,且与土壤湿度之间呈线性关系。图4为小波变换神经网络模型反演土壤湿度基本流程图。
图4 土壤湿度反演流程图
小波变换的实质是把函数空间中的任意函数表示成其在具有不同伸缩因子a和平移因子b在小波基函数上的投影叠加,小波基函数是基于Mallat 算法[14]实现时间-频率的分解与重构。通过改变a和b的数值继而得到具有不同时间-频率宽度的小波。
考虑到初始信号的震荡性与光滑度,本文采用正交对称小波sym作为基函数。图5表示了P036测站2017年DOY 123 PRN 32号卫星的信噪比SNR趋势分离结果,横轴为等间隔观测历元,纵轴为信噪比指数变化,单位为dB-Hz,数据采样率为15 s。由图可见,在卫星信号的低频部分,多项式拟合表现较差,难以准确地拟合SNR信号变化趋势,而最终反演所需要的反射信号是通过将原始SNR减去拟合值来获取,因此准确拟合原始信噪比至关重要。小波变换方法能很好地表达该信号的变化趋势,继而实现信号高频与低频部分的分离,实现高质量信噪比残差序列的提取。
图5 PRN 07号卫星的信号信噪比拟合图
BP神经网络模型是在1986年由Rumelhart和McCelland 为首的科研团队提出来的,其核心思想是通过负梯度下降算法将误差控制在一个较小的范围内,再将误差的变化量反向传播到神经网络的每一层,进而调整每层的参数值,经过多次迭代之后误差就会稳定在一个范围内[15]。
为了验证传统相位线性回归模型、BP神经网络模型及小波神经网络模型反演土壤湿度的可靠性与精度,本文下载了PBO中P036测站2017DOY121至2017DOY181该段时间的数据。该测站位于美国新墨西哥州天使火机场(36°25′13"N,105°17′37"W)附近,平均海拔2 529.9 m,建于2004年。采用的接收机类型为TRIMBLE NETRS,天线类型为TRM29659.00,可提供时间分辨率为15 s的L2C观测值,周围地貌较为平坦没有大型的阻碍物,因此测站数据适合于土壤湿度反演。图6为P036测站的周围地表环境。
图6 P036周围地表环境图
图7为P036与SNOTEL中心提供的PALO气象站点数据以及该测段时间范围内的降雨情况。该气象站提供了地表深处5 cm左右的土壤湿度实测值。由图7可知,PBO与SNOTEL两种土壤湿度的数据整体变化趋势基本保持一致,都与降雨事件的发生保持紧密的联系,发生强降雨事件时土壤湿度数值都会随之剧烈上升,但是从具体数值上来看存在一定的偏差,SNOTEL数值要明显小于前者。产生该现象的原因可能是PBO用来反演土壤湿度的模型存在一定的误差。
图7 土壤湿度参考值与降雨值
当卫星高度角过小时,信号容易受到周边建筑或树木的影响导致干涉现象不明显,因此本实验截取了高度角在5°~30°之间的卫星信噪比数据进行处理。利用TEQC软件对观测文件进行处理得到信噪比数据、卫星高度角和方位角等一系列数据。为了去除以直射分量为主的趋势项,在传统的低阶多项式拟合方法的基础上,采用了小波变换方法来代替多项式拟合,最终得到实验所需要的信噪比残差值即反射信号分量。
将处理后得到的反射信号分量进行L-S频谱分析变换得到频率f,再对式(4)进行最小二乘拟合得到振幅A和相位φ,把得到的三个土壤湿度特征向量作为BP神经网络输入数据,实际的土壤湿度值作为输出数据进行模型构建。进行上述处理后一共得到122组数据,经过多次调整训练集与测试集之间的比例,最终确定当两者之间的比例为3∶1时反演效果最佳。通过随机抽取的方法将数据划分为91组训练集与31组测试集。由于传统的三个特征向量中相位与土壤湿度之间的相关性最高,因此本文建立了相位与土壤湿度之间的线性相关模型,如式(5)所示。
y=1.107 1x-0.043 9
(5)
式中:y为土壤湿度值;x为信号相位值。
为了进一步探究三种模型反演能力的高低,利用P036测站DOY213至DOY274的L2C数据进行测试。图8为三种不同模型反演结果与实测值分析图,图8(a)、图8(b)、图8(c)分别代表传统相位线性回归、BP神经网络、小波神经网络模型分析图。由图8可知,在土壤湿度值较大的时候,传统相位线性回归模型明显与实测值有一定的偏移量,反演精度不如另外两种模型;BP神经网络模型整体反演效果较为理想,但依然不如小波神经网络模型,造成这种结果的原因可能是实验样本量较小产生了过拟合现象导致的。
图8 三种模型结果分析图
从图9能够明显地看出,BP神经网络模型与小波神经网络模型总体上都能很好地吻合土壤湿度真值的走势。传统相位线性回归模型虽然整体趋势较好,但是从个别天数来看,与前者存在较大的偏差,尤其是在DOY214、DOY218、DOY236、DOY246,主要是因为GPS不同卫星之间存在轨道差异,导致接收机接收到的信号分别来自不同的地表环境,进而导致反演结果发生跳变现象,而且多半出现在降雨事件发生后一段时间土壤湿度开始下降过程中。在所选取的实验天数内发生了数次降雨事件,由于受降雨天气影响,土壤湿度出现急剧上升。而且从图中能够明显看出,在土壤湿度上升的过程中小波神经网络模型相比另外两种模型的反演精度在一定程度上有较大的提升。
图9 三种模型反演结果与真值对比图
表1为三种模型反演结果精度对比。由表1可知,BP神经网络模型的均方根误差RMSE与平均绝对偏差MAE分别为0.027和0.024,决定系数R2为0.865,精度比传统相位线性回归模型提高了15.33%;而小波神经网络模型的均方根误差与平均绝对偏差分别为0.015和0.013,决定系数为0.943,精度比传统相位线性回归模型提升了25.73%,比单独的BP神经网络模型又提升了9.02%。结果证明,小波神经网络模型相对前两者而言,在误差方面有了明显的改善,说明改进后结合了小波变换的神经网络模型与实测土壤湿度的吻合度得到了进一步的提升。图10为三种模型与土壤湿度真值的绝对误差对比图,也直接证明了小波神经网络模型的误差的确要明显低于前两者。传统相位线性回归模型的误差控制在±0.08 cm3/cm-3以内,BP神经网络模型的误差控制在±0.05 cm3/cm-3,而小波神经网络模型仅仅在±0.03 cm3/cm-3以内,相比之下,在精度上得到较大提升。
表1 三种模型反演精度对比
图10 三种模型误差对比图
针对GNSS-IR反演土壤湿度研究出现的一些问题,如反射信号分离过程不理想、卫星信号不稳定以及地表粗糙度和植被系数等带来的影响,本文构建了一种将小波变换分解与BP神经网络相结合的新模型,得到以下结论。
1)土壤湿度与特征向量之间的确存在着一定的线性关系,其中反演结果较为理想的相位模型决定系数达到了0.75,反演误差控制在±0.08 cm3/cm-3以内。
2)BP神经网络模型总体反演结果有一定的改善,尤其是在降雨事件发生后土壤湿度急剧上升的过程中,能够有效抑制单颗卫星反演容易出现的异常跳变现象,而且也有效地抑制了地表粗糙度及植被覆盖等因素造成的影响。
3)BP神经网络模型与小波神经网络模型相对传统相位线性回归模型精度分别提高了15.33%、25.73%,误差同时得到了有效的改正。这说明两种模型相对于传统相位线性回归模型都有很大程度的提升,均能够有效抑制地表粗糙度和植被覆盖的影响,而神经网络模型较后者精度较低的原因是因为在卫星反射信号分离的过程中采取的方法存在较大偏差,也从侧面证明了小波变换的频率局部优化分析法对于提取反射信号分量有着较大的优势。
后续将在本文基础上引入其他算法与现有模型相结合,以及联合多模多频GNSS数据反演土壤湿度,旨在进一步提高GNSS-IR反演土壤湿度的精度。
致谢:非常感谢UNAVCO提供的GPS卫星观测数据以及ISMN项目组提供的土壤湿度参考值。