基于离散小波分解与重构的多源土壤含水量数据融合方法与评估

2023-06-12 03:32姜志伟李云飞哈斯图亚玛瑙
农业工程学报 2023年7期
关键词:数据源时空含水量

姜志伟,李云飞,姜 涛,哈斯图亚,玛瑙,胡 洁

基于离散小波分解与重构的多源土壤含水量数据融合方法与评估

姜志伟1,李云飞1,姜 涛2※,哈斯图亚3,玛瑙1,胡 洁1

(1. 内蒙古农业大学沙漠治理学院,呼和浩特 010018;2. 内蒙古工业大学经济管理学院,呼和浩特 010051;3. 内蒙古农业大学草原与资源环境学院,呼和浩特 010018)

为提高土壤含水量格点数据的区域适用性、准确性,该研究提出了基于离散小波多尺度分解与重构的多源土壤含水量数据融合方法,利用2016-2018年6-9月ESA-CCI、SMAP、ERA5-Land数据集以及地面站点观测的土壤含水量数据,在以黄河流域为主体的主要农业气候区开展了融合方法可行性和适用性研究。结果表明,融合方法能有效捕获融合数据源的多尺度特征信息,通过多源多尺度逐层特征信息权重融合与重构,能有效改进单一数据源在不同农业气候区域的适用性、时空结构和波动特征的准确性。融合结果总体评估的均方根误差、偏差(Bias)和相关系数()分别为0.053 m3/m3、0.001 m3/m3和0.721,时空分解评估的综合表现均优于单一融合数据源的评估指标,多尺度时空波动频谱结构特征与观测时空序列更吻合,特别在25 d时间尺度以内时空波动吻合度改进最为明显。该研究获得了较理想的区域土壤含水量改进预期,可为区域生态环境监测、农业可持续发展、水土保持、防灾减灾等科学研究和业务应用提供可行有效的方法参考。

土壤含水量;遥感;离散小波变换;多源数据融合;黄河流域

0 引 言

土壤含水量是表征地球能量循环的重要水文因子[1],显著影响着地表蒸散发过程、地表反射率[2],乃至气候变化,广泛应用于区域水循环、植物生长、灾害监测等研究和业务中[3-6]。然而,表层土壤含水量具有较高的时空异质性和动态变化特征,特别是在气候、植被、地形地貌以及土壤类型变化复杂多样的区域[7-9]。如何获取区域高质量的时空连续土壤含水量数据一直是区域生态环境建设和研究的重要内容。当前,土壤含水量获取方法主要有站点观测、遥感反演、水文过程模拟等。其中,站点观测方法最准确,但在时空连续性、时效性、代表性等方面存在较大局限,大区域范围应用时缺乏经济效率可持续性[10]。遥感反演[11]和水文过程模拟方法各有自身优势,均能不同程度地弥补站点观测方法的缺陷,但受到输入参数信息及其获取条件不确定性[12]、反演或模拟算法物理机理过程描述参数化等诸多因素影响[13],两者在准确性、时空连续性等方面均有较大改进空间。为此,结合遥感反演和水文过程模拟两者优势的多源数据融合方法成为近年来改进区域土壤含水量估算的热点研究之一。

随着遥感观测和陆面水文模拟技术的发展进步,区域或全球土壤含水量产品和融合算法也取得了长足进步。如最具代表的主被动微波反演土壤含水量数据集ESA-CCI、SMAP,以及陆面水文模拟土壤含水量数据EAR5-Land、GLDAS/NLDAS、CLDAS等,已广泛应用于区域和全球生态环境相关研究中。大量评估结果表明,总体上遥感反演产品精度较高,但时空连续性和分辨率相对较差,而水文模拟产品的优劣势则相反,特别是存在系统性误差,对大气强迫场数据集质量较为敏感。为获得高质量时空连续的区域土壤含水量数据,有研究发展了基于累积分布函数匹配法(cumulative distribution function,CDF)的多源土壤含水量融合方法[14],试图通过偏差订正改进融合效果。然而,该方法精度取决于选定的某一真值数据序列假定,且融合过程往往近似为线性变换,融合误差也往往较大。近年来,机器学习方法已广泛应用于多源土壤含水量估算研究中,比较典型的思路是构建以多频段微波亮温为输入、土壤含水量为输出的神经网络模型来获得土壤含水量预测结果[15]。该方法能够较好地处理输入和输出变量间的非线性、非高斯问题,可以获得较理想的预测结果。但该方法需要大量高质量训练样本,往往需要长时间的前期模型训练,海量数据样本筛选难度和模型训练成本均较大。还有研究采用三重组合分析(triple collocation analysis,TCA)方法进行多源数据融合,改进土壤含水量估算[16]。这种方法是在计算3种相互独立的数据集之间的误差权重基础上,进行多源数据的加权平均,计算简单快捷。但该方法要求3个融合数据源是相互独立的,融合过程仅考虑单个融合格点的误差,融合结果的空间结构异质性特征往往表现不佳[17]。而在图像和信号处理领域广泛应用的小波变换方法,可对特征信息进行多空间尺度分解和重构,为改善多源土壤含水量度融合结果的时空结构特征提供了可行的方法框架[18]。在该方法框架下,将融合数据源的空间特征进行多尺度分解,通过逐分解层的误差分析,实现不同融合数据源的空间结构特征的融合,进而改进各个格点的数值误差[19]。

为此,本研究在离散小波分解与重构的方法框架下,借鉴TCA误差权重估计方法,构建多源土壤含水量小波融合方法,最大化继承不同融合数据源的有用时空特征,改进单一数据源的区域适用性、时空序列准确性和波动一致性。本研究以主体覆盖黄河流域的主要农业气候区作为研究区域,选定2016—2018年6—9月ESA-CCI、SMAP、EAR5-Land 3个土壤含水量数据以及地面站点观测数据,开展融合方法可行性和有效性试验和验证。本研究可为改进区域土壤含水量估算提供有意义的方法探索参考,以期丰富区域生态环境监测、农业可持续发展、水土保持、防灾减灾等科学研究和业务的可行候选技术方法。

1 材料与方法

1.1 研究区概况

考虑到可获取的地面站点土壤含水量观测的空间覆盖范围,本研究选定的研究区域地理范围为32.75°N~41.75°N,95.75°E~119.75°E(图1)。该区域以黄河流域为主体,覆盖北方干旱半干旱区、黄土高原区、黄淮海平原区、青藏高原区东部和部分长江中下游区等主要农业气候区域,横跨干旱、半干旱和半湿润气候,由西北干旱区到东南湿润区。长期以来,该区域生态环境脆弱、水土流失严重[20],水资源供需矛盾日益突出[21],土壤含水量时空格局特征变异加剧,区域生态文明建设面临巨大挑战。

图1 研究区域及土壤含水量观测站点分布

1.2 数据与处理

1.2.1 地面站点观测数据与处理

为评估多源土壤含水量数据融合结果精度,本研究获取了国家气象科学数据中心(http://data.cma.cn/)发布的覆盖研究区域范围的1 788个观测站表层(0~5 cm)土壤含水量数据,时间范围为2016-2018年6-9月。该数据集由中国气象局业务化自动土壤水分观测站测得,数据入库前均对不同型号的自动水分观测仪(型号分别为DZN1、DZN2和DZN3)观测值进行标定质控和质量标记。

为确保数据质量,本研究按月统计了所有标记可用的土壤含水量数据的时空序列概率分布,选定累积概率密度分布在0.01~0.99之间的数据为可靠数据。在土壤含水量精度评估中,在对比分析格点双线性插值到站点、站点匹配到格点求均值的两种空间匹配方法的合理性和实际效果基础上,本研究最终选定后一种方法将各时次的所有可用站点土壤含水量数据匹配到0.25°×0.25°格点内,并对落入格点内的站点数据求均值,最终生成282个空间匹配的实测观测格点(图1),以此作为候选验证数据。

1.2.2 融合数据源与处理

本研究获取了ESA-CCI、SMAP和ERA5-Land三套土壤含水量融合数据源。

ESA-CCI土壤含水量数据集是欧空局土壤湿度气候变化倡议项目(https://www.esa-soil-moisture-cci.org)发布的基于多卫星主被动微波遥感反演的全球地表(0~5 cm)土壤含水量合成产品[22]。该数据集包含主动微波、被动微波和主被动合成三套土壤含水量产品,在全球范围内的对比评估中精度表现较好[23]。本研究采用了该数据集的辐射计与雷达土壤含水量三级日值合成产品(L3_SM_AP,格点大小为9 km×9 km)。

SAMP土壤含水量数据集是美国航空航天局(national aeronautics and space administration, NASA)发布的基于SMAP卫星微波数据的全球反演产品(https://nsidc.org/data/SPL3SMP),已广泛应用于改进气候预报、干旱监测等。已有研究也表明,该数据与ESA-CCI土壤含水量数据融合能有效提高土壤含水量数据精度[24]。本研究采用了该数据集的日值主被动合成土壤含水量产品(格点大小为0.25°×0.25°)。

ERA5-Land数据集是欧洲中期天气预报中心(ECMWF)发布的第五代全球陆面再分析产品(https://cds.climate.copernicus.eu/)。该数据集是ECMWF第五代大气再分析(ERA5)的大气强迫场驱动陆面模式独立模拟的全球陆面要素变量小时产品[25],时空覆盖连续性和分辨率较高。ERA5-Land因其采用的大气强迫场同化了大量观测信息,使其土壤含水量模拟产品(空间分辨率为0.1°×0.1°)更接近实况变化特征。

本研究获取三套土壤含水量产品的时段为2016-2018年6-9月,均经过投影变换、空间最近邻重采样以及日尺度合成(ERA5-Land土壤含水量小时值合成为日均值),匹配到0.25°×0.25°格点上,用于融合分析。

1.2.3 降水数据与处理

本研究使用的中国气象局陆面数据同化系统(CLDAS)降水格点融合产品来源于国家气象科学数据中心(http://data.cma.cn/)。该产品融合了中国5万余个地面站点观测、雷达降水等观测信息,能够准确反映实际降水的时空变化特征,在中国区域的准确性远优于国际同类产品。本研究获取了覆盖研究区域的2016-2018年6-9月小时降水格点产品,对其合成为日累积值,然后依据研究区域经纬度范围将0.01°×0.01°格点最近邻重采样到0.25°×0.25°格点上,用于融合结果分析与评估。

1.3 研究方法

1.3.1 小波变换融合方法

小波变换是特征信息多分辨率、多尺度分析的有效处理方法,可提取空间频域内土壤含水量的全局和多尺度特征。本研究在二维离散小波分解与重构框架下,构建了基于的ESA-CCI、SMAP、ERA5-Land三个土壤含水量数据的融合算法。主要融合过程为:

1)二维离散小波分解。依据小波基函数Haar小波[26]的正交、对称、滤波长度等基本特性,以及融合数据源的格点数,确定三个土壤含水量数据的空间特征分解层数均为最大5个尺度层。每个分解层均由一个二维低频近似和三个二维高频细节(分别为水平、垂直和对角方向)空间特征信息构成。离散小波信号分解表达为

2)二维离散小波高低频分解特征信息加权融合。对于每个分解层,分别计算三个土壤含水量各自对应的4个空间特征信息的方差权重,然后在4个特征信息空间上各自对ESA-CCI、SMAP、ERA5-Land三个空间特征信息分量加权求和,得到该分解层的4个融合空间特征信息。4个空间特征信息各自融合的方差权重表达为

3)二维离散小波高低频融合特征信息重构。将每个分解层的4个空间特征信息分别加权融合的结果,逐层逆向(上采样↑2)相加,重构得到最终的融合结果。每个分解层的特征信息重构可表达为

1.3.2 评估方法

本研究应用均方根误差(root mean squared error, RMSE)、平均偏差(Bias)、相关系数()3个评估指标,从时空总体、时间和空间分解3个角度对比分析土壤含水量估测值与观测值的准确性和一致性。此外,本研究将土壤含水量的时空波动特征表达为标准化空间方差时间序列,采用连续小波变换和交叉小波的方法,对比分析土壤含水量估测值与观测值的多尺度时空波动特征的吻合度。其中,连续小波和交叉小波均选定更适合表征特征信息细节波动特征的墨西哥草帽小波基函数[27]。

为充分考虑3个土壤含水量数据区域适用性差异,以及地面站点观测格点化的空间代表性,本研究在评估过程中以土壤含水量格点估测值与格点观测值的相对误差作为候选格点的选择依据,即对于任意一个观测格点位置,对应3个土壤含水量数据中有任何一个的相对误差在10%以内,则该格点被选定为参评格点。

2 结果与分析

2.1 土壤含水量总体时空特征分析

本研究获取的研究区域2016-2018年6-9月ESA-CCI、SMAP、ERA5-Land 3种土壤含水量及其三者融合结果(DWT-Merge)总体均呈现出由东南向西北逐渐降低的总趋势(图2b、图2c、图2d、图2e)。土壤含水量高值区主要分布在长江中下游区、黄淮海平原区和青藏高原区。低值区大部分集中在西北干旱半干旱区的戈壁、沙地、裸岩、裸土等区域,以及青藏高原中西部高原裸岩、裸土区域。而以黄土高原区为主体的黄河“几”字弯东南部则处于土壤含水量低值区和高值区的过渡区域。这与地面站点土壤含水量观测值(图2a)和降水量(图2f)总体时空分布特征相一致。

图2 研究区域2016-2018年6-9月平均土壤含水量与降水量空间分布

尽管ESA-CCI、SMAP、ERA5-Land 3个土壤含水量数据均能总体反映研究区域的土壤含水量空间分布特征,但三者存在明显的空间分布细节差异(表1、图3)。ERA5-Land土壤含水量时空序列均值最高,为0.280 m3/m3,值域波动范围较大(0.010~0.496 m3/m3),空间异质性明显(标准差为0.087 m3/m3)(图3c)。该数据是大气强迫场驱动的陆面过程模拟结果,一定程度地反映了区域陆气耦合的综合作用,特别是对降水变化表现出较高的敏感度。因此,与其他土壤含水量相比,ERA5-Land土壤含水量与降水(图2f)的空间格局更匹配,在长江中下游、黄淮海平原区、青藏高原东南部,甚至黄土高原区大部分降水相对较多的区域,均表现出相对偏湿的特征,而在西北干旱半干旱区偏干特征更突出(图2d)。与ERA5-Land土壤含水量相比,ESA-CCI和SMAP土壤含水量反映的是卫星过境研究区域时的瞬时土壤含水量观测,对日时间尺度内的土壤含水量影响因素(如降水)的响应敏感度相对较低。总体上,ESA-CCI与ERA5-Land土壤含水量的高值区空间分布基本一致,但前者阈值范围收窄明显,这导致总体标准差较低,空间异质性较小,研究区域内总体呈现出“不干不湿”的均质化趋势(图3a)。难得的是,ESA-CCI土壤含水量捕获到了西北沙漠、戈壁等低值区斑。在青藏高原区域,特别是在青海湖周边区域,ESA-CCI土壤含水量值域总体相对偏高,基本未反映出与降水量相一致的空间分布特征,而SMAP土壤含水量却很好地捕捉到了青藏高原区,甚至四川盆地及周边区的降水空间变化特征。与ERA5-Land土壤含水量相比,SMAP土壤含水量在青藏高原南部区域与降水空间分布特征更接近,在其他区域总体上具有一致的空间变化趋势。相较于同类型的ESA-CCI土壤含水量,SMAP土壤含水量表现出较高的空间连续性和异质性。比较遗憾的是,尽管SMAP土壤含水量值域波动范围较大,但主要集中在低值分布区间,总体偏低明显(图3b)。总体来看,以同时段土壤含水量地面站点观测和降水量空间分布为参考,ESA-CCI、SMAP、ERA5-Land 3种土壤含水量数据均有较一致的大尺度时空变化趋势,但三者间较大的细节特征差异也说明各自优缺点明显,均存在不可忽视的误差。

与ESA-CCI、SMAP、ERA5-Land 3个土壤含水量相比,基于离散小波融合的DWT-Merge土壤含水量继承了三者有效的大尺度趋势和小尺度波动特征信息,能够反映出降水量的空间分布格局特征,避免了ERA5-Land土壤含水量对降水量高度敏感导致过干过湿的问题,平滑了ESA-CCI土壤含水量在西北干旱半干旱沙漠、戈壁等区域的局地偏干“突变”斑块,保持了空间分布的连续性。特别是,DWT-Merge土壤含水量继承了SMAP土壤含水量在青藏高原区、四川盆地及其周边区的空间分布特征,改善了ESA-CCI和ERA5-Land土壤含水量在这些区域估测过低和过高的问题,与地面站点观测值时空分布特征和值域分布范围更接近。相较于ESA-CCI土壤含水量同质化趋势特征,DWT-Merge土壤含水量的空间异质性也同样得到改善。

表1 研究区域2016-2018年6-9月土壤含水量与降水量总体样本统计特征

注:OSWC表示观测土壤含水量数据,DWT-Merge表示土壤含水量融合数据,PRE表示降水数据。下同。25%、50%、75%分别为第一、二、三分位数。

Note: OSWC denotes dataset of observed soil water content, DWT-Merge denotes fusion dataset of soil water content, PRE denotes dataset of precipitation. Same below. 25%, 50%, 75% respected the first, second, and third quartile respectively.

2.2 土壤含水量评估

2.2.1 总体评估

依据观测格点位置对应ESA-CCI、SMAP、ERA5-Land 3个土壤含水量数据中有任何一个的相对误差在10%以内的参评格点选取原则,本研究选取了研究区域范围内2016-2018年6-9月时段共计69 707个时空序列评估点,并计算了总体均评估指标。对比3个土壤含水量融合数据源总体评估结果(图3),ESA-CCI土壤含水量的总体均方根误差RMSE和偏差Bias表现较优,相关系数值略低于ERA5-Land,SMAP土壤含水量的总体RMSE、Bias和表现最差。三3个融合数据源都存在不同程度的低值估测偏高和高值估测偏低的问题,SMAP和ERA5-Land土壤含水量总体低估和高估特征尤为明显,而ESA-CCI土壤含水量值域总体向均态收缩。受3个原始融合数据源的“低值高估,高值低估”的共性值域分布特征影响,DWT-Merge土壤含水量也不可避免地继承了这一特征,与观测值的回归拟合线斜率偏低,处于最小(ESA-CCI)和最大(ERA5-Land)拟合斜率之间。尽管如此,3个数据源的有效时空特征信息融合明显改善了单一原始数据源的时空值域分布特征,DWT-Merge土壤含水量总体RMSE、Bias和获得了较理想的改善预期,分别为0.053、0.001 m3/m3和0.721,均优于三个原始数据源的综合表现。

注:图中虚线为1∶1线,实线为线性回归拟合线。n为数本量。

2.2.2 时间序列评估

以地面站点观测土壤含水量空间格点为基准,本研究对ESA-CCI、SMAP、ERA5-Land和DWT-Merge 4个土壤含水量数据逐格点计算时间序列评估指标。从RMSE、Bias和3个评估指标的值域统计(表2)和空间分布特征(图4)可明显看出,DWT-Merge土壤含水量因其有效融合了3个数据源各自质量较高的区域格点特征信息,使其与地面站点观测值的准确性和相关性得到明显改进。

从RMSE评估指标来看,ERA5-Land和SMAP土壤含水量的RMSE总体表现基本相当,但两者的值域空间分布在降水较多的黄土高原区、黄淮海平原区南部和长江中下游区的表现相反,SMAP土壤含水量在长江中下游区集中表现为RMSE高值分布,而ERA5-Land土壤含水量的RMSE高值主要分布在黄土高原区北部、黄淮海平原北部,以及青藏高原东部。ESA-CCI土壤含水量的RMSE值域统计分布总体偏高,除北方干旱半干旱区中部以北降水较少区域外,在降水相对较多的其他农业气候区均表现出大面积RMSE高值分布。与3个原始融合数据相比,DWT-Merge土壤含水量的RMSE总体表现最好,其值域统计分布向低值收缩最明显,改进了ERA5-Land土壤含水量在湿润-干旱半干旱过渡区域、SMAP和ESA-CCI土壤含水量在降水较多区域存在的RMSE偏高的问题。

从Bias评估指标来看,ERA5-Land土壤含水量突出表现为总体估测偏高,除黄淮海东南区域小范围和黄河中上游以北大部分区域分布较低负偏差外,在其他农业气候区均表现为相对较高的正偏差。ESA-CCI土壤含水量在北方干旱半干旱区与黄土高原区交界过渡带也同样表现出较高的正偏差分布,而在黄淮海平原区南部表现为较低的负偏差,但Bias波动值域相对较低。SMAP土壤含水量几乎全域负偏差,除在黄淮海平原区东南部有小范围较高负偏差外,在其他农业气候区Bias值域总体以较小的负偏差为主。相较于3个较大偏差的原始数据源,DWT-Merge土壤含水量的偏差改进明显,如在ERA5-Land和ESA-CCI土壤含水量较高的正偏差、SMAP土壤含水量总体负偏差之间取得了相对理想的偏差改进效果,在黄淮海平原区东南部主要表现为较低的负偏差,在其他农业气候区则总体以较低的正偏差为主。

表2 土壤含水量时间序列评估指标统计特征

注:Bias表示平均偏差,下同。

Note: The Bias represents the average bias. Same below.

图4 研究区域2016-2018年6-9月土壤含水量时间序列评估指标

从评估指标来看,ERA5-Land土壤含水量与地面站点观测值的一致性表现最好(均值为0.599),除在黄河中上游以西、黄河下游沿岸带相对较低外,其他农业气候区均在0.500以上。SMAP和ESA-CCI土壤含水量表现总体较差,两者的均值低于0.400。前者低值主要集中在降水相对较多的黄淮海平原区中南部,在其他农业气候区有零星较高负相关值。后者值空间分布特征类似,总体表现最差。这主要是由于两者的卫星影像源数据的空间覆盖不完整,数据时空连续性较差,在与地面站点观测匹配时无法提供足够多的时间序列样本导致的。DWT-Merge土壤含水量继承了ERA5-Land土壤含水量的值域统计和空间分布特征(均值为0.578),但受限于SMAP和ESA-CCI两个土壤含水量的时空不连续性,融合的有效时间序列特征信息受到限制,其值域向低值方向略有偏移,但总体几乎接近于ERA5-Land土壤含水量的值域分布。

2.2.3 空间序列评估

以地面站点土壤含水量观测空间格点为基准,本研究计算了ESA-CCI、SMAP、ERA5-Land和DWT-Merge 4个土壤含水量数据逐日空间序列评估指标。从RMSE、Bias和3个评估指标的空间序列值域统计(表3)和时间分布特征(图5)可明显看出,DWT-Merge明显优于3个原始融合数据源的各项评估指标,在空间上与地面站点观测值的准确性和相关性改进明显。

表3 土壤含水量空间序列评估指标统计特征

图5 研究区域2016-2018年6-9月土壤含水量空间序列评估指标

从RMSE评估指标来看,ERA5-Land、SMAP和ESA-CCI土壤含水量的空间RMSE时间序列均值依次升高,值域统计分布也呈现出依次向高值方向偏移的特征,时间分布不稳定性明显增强,对空间降水量变化的敏感度相对较强。DWT-Merge土壤含水量的RMSE空间序列总体表现最好,在综合继承3个原始融合数据RMSE空间序列波动特征的基础上,较好地控制了波动幅度(均值为0.074 m3/m3),值域统计分布也处于较低的值域区间(0.07~0.08 m3/m3),时间分布较为稳定,尤其在降水量增多时段的波动幅度依然能够控制在0.1 m3/m3以内。

从Bias评估指标来看,SMAP和ERA5-Land土壤含水量的空间Bias时间序列总体表现较差,分别为较大的负偏差和正偏差,而ESA-CCI土壤含水量空间Bias表现为较低的正偏差时间波动特征。DWT-Merge土壤含水量空间Bias序列表现最好,总体以较低的负偏差为主(均值为−0.002 m3/m3),总体波动幅度与ESA-CCI土壤含水量的偏差波动幅度相当,但总体值域统计分布向0值收缩更明显,与降水量的时间波动特征总体一致。

从评估指标来看,SMAP和ESA-CCI土壤含水量与地面站点观测值的空间结构一致性总体较低,两者的值总体处于低值区间,在降水量明显增加时段均表现出明显的反向波动特征,后者的反向波幅尤为突出。这与两者卫星数据源的瞬时观测导致观测时刻与土壤含水量变化的主要影响事件(如降水)发生时段错位关系密切。相反,ERA5-Land土壤含水量是大气强迫场驱动的小时模拟变量,能及时对土壤含水量变化影响的主要气象条件(如降水)波动做出实时响应。而DWT-Merge土壤含水量正是继承了ERA5-Land土壤含水量的这个特点,与地面站点观测值的空间分布特征的一致性最高,值域分布总体在相对高值区间,总体接近但略高于ERA5-Land土壤含水量的值总体表现。

2.3 土壤含水量时空波动特征分析

为进一步探讨多源土壤含水量融合结果表征时空波动特征的能力,本研究在求得ESA-CCI、SMAP、ERA5-Land、DWT-Merge和站点观测土壤含水量、降水6个变量空间方差时间序列基础上,进一步去均值标准化,得到各变量空间方差的时间序列波动特征,通过基于墨西哥草帽小波基函数的小波分析方法得到不同时频下的小波系数,并将其绘制为二维图像(图6)。

注:T为小波周期,下同。图中箭头表示小波相位。

在研究时段内,观测土壤含水量的小波系数图在16~64 d时间尺度上集中分布了通过95%显著性水平的频谱区(白色等值线内),沿时间轴呈现出规律性的峰(正)—谷(负)波动趋势特征(图6a),总体以32d时间尺度为中心的小波系数振幅最大,能量(或功率)最强(图7)。换言之,观测土壤含水量具有显著的月尺度时空变化周期波动趋势特征。这与降水小波系数图中降水较多时段的波动周期基本吻合(图6b),如2016年6月中旬—8月初、2017年8月、2018年8月中上旬—9月初时段。在小于16 d的时间尺度上,土壤含水量的时空方差波动总体较剧烈,而降水时空方差波动相对平稳。因此,可以认为在较大时间尺度上降水对土壤含水量的累积影响效应较明显,而在小时间尺度上土壤含水量的时空波动特征并不完全取决于降水的时空波动。

注:图例后的数字代表其总功率,为各时间尺度(或周期)对应功率之和。

土壤含水量交叉小波图反映的是估测值与观测值的时空波动特征的一致性,数值越大,波动一致性越高。相应地,总交叉小波能量(功率)值越大,表征两者的总体时空波动特征一致性越高。同时,交叉小波图中95%显著性水平频谱区内的小波相位指向也能够判断估测值与观测值波动显著一致性的方向,如箭头向右表示波动趋势同向,箭头向左表示逆向,箭头向下表示波动趋势提前,箭头向上则表示波动趋势滞后。从ESA-CCI、SMAP、ERA5-Land和DWT-Merge估测的与观测的土壤含水量的时空方差波动信息的交叉小波频谱图(图6c、图6d、图6e、图6f)可明显看出,尽管在小时间尺度上估测值与观测值的时空波动特征存在着较多时段的变化不一致性,但随着时间尺度增大到16 d时,通过95%显著性水平的频谱区域逐渐增多,总体上保持了与观测值小波系数图相一致的32 d周期波动时间尺度。同时,四个土壤湿度的交叉小波系数图中95%显著性水平等值线范围内的小波相位角均呈现出一致的向右指向,表明它们与观测值的时空波动趋势是同向吻合的。四个土壤含水量估测数据在16~32 d时间尺度上均能较好地表征区域土壤含水量时空波动特征。从时间尺度小于25 d的总交叉小波功率来看(图7),DWT-Merge土壤含水量与观测值的交叉小波总能量最大,有更高的时空波动一致性,均优于其他3个土壤含水量估测数据。在25~64 d时间尺度上,DWT-Merge的交叉小波能量(5.7左右)略低于ERA5-Land的交叉小波能量(6.5左右),但远优于ESA-CCI和SMAP的交叉小波能量(两者功率均在4.0左右)。总体上,DWT-Merge估测值与观测值的总交叉小波能量最高(总功率为504),表征真实土壤含水量时空波动特征的能力更强。

3 讨 论

以往多源土壤含水量数据融合主要采用三重组合分析[16]、累积分布函数匹配法[28]等方法,还有研究采用简单的集合平均的方法[29]。这些逐像元的融合方法从一定程度上改善了单一融合数据源的区域适用性和准确性,但它们对土壤含水量的空间结构特征误差考虑不足,往往很难控制逐像元融合过程中的干扰信息。近年来,也有研究发展了二维三重组合分析[30]、动态贝叶斯融合算法[31]的多源土壤含水量融合方法。从融合结果来看,融合土壤含水量的RMSE、Bias和3个评估指标的综合表现相较于本研究提出的离散小波融合方法优势不明显,而对融合结果与观测值的空间结构特征吻合度的论证明显不足。其根本原因依然是未脱离逐像元融合的基本思路。本研究提出的离散小波多尺度分解与分层独立权重重构的融合方法则是最大限度地考虑到了不同空间尺度下融合数据源的多维空间结构趋势和细节特征,各特征分量逐层独立方差权重融合方式有利于提取和融合最能表征当前尺度下结构特征的有效信息,即融合结果是多源融合数据源由粗网格到细网格(像元尺度)的空间特征信息的动态权重融合。相较于基于像元尺度的融合方法,本研究提出的融合方法更有优势,融合结果的误差控制更有效。

在没有任何观测数据参与融合的条件下,离散小波分解与重构的多源土壤含水量融合方法能够获得理想的融合效果主要归功于多空间尺度分解层上逐层对4个高低频特征分量各自对应的融合数据源的小波分解系数进行独立方差权重融合。作为对比,常规的各特征分量逐层均值融合方式则会弱化最有效的特征信息,引入无效或干扰特征信息的比重也会随之增加。尤其是所有空间尺度和特征分量均采用单一融合权重的方式,如基于3个原始数据源计算得到的方差权重、基于最小或最大空间尺度分解层计算得到的方差权重,都会导致融合结果误差明显增大。在融合数据源值域分布和空间结构特征差异较大条件下,多层小波分解融合显得十分必要和重要。

多源土壤含水量数据的融合过程本质上是多源融合数据源有效信息的权重融合过程。因此,多源融合数据源之间是否隐含有相互弥补的时空特征信息则显得十分重要,如本研究中采用的ERA5-Land土壤含水量具有良好的时空连续性,以及与观测值的波动一致性,而ESA-CCI、SMAP土壤含水量更接近实况观测。同时,在没有观测值参与或作为标定基准条件下,融合数据源各自的时空特征也会影响融合结果,如本研究采用的三个土壤含水量数据源均存在“低值估测偏高,高值估测偏低”的共性特点导致融合结果与实测值的线性拟合斜率略有偏低。这个问题在三重组合分析融合方法中同样存在。累积分布函数匹配、动态贝叶斯等融合方法将融合数据源与观测值进行先验匹配或机器学习训练,在一定程度上能够改善融合数据源与观测值的线性回归斜率,但是在有限固定站点观测样本条件下,这些方法在大区域尺度应用的适用性和准确性也必然会受到影响,连续空间结构特征表达也相应存在较大误差。

离散小波多尺度分解与分层独立权重重构的多源土壤含水量融合方案的有效性取决于融合数据源能否提供有用的特征信息,包括大尺度波动趋势信息和小尺度细节振荡信息。如未来ESA-CCI、SMAP两个数据源质量的持续改进,特别是ESA-CCI值域分布和时空覆盖连续性改进,有助于提供更有效的空间结构特征信息。同时,如何将包括观测数据源在内的更多数据源引入到融合框架中,构建四源甚至更多源的融合方案,是未来更期待的融合方案。

目前,本研究构建的融合方案仅实现了单时次粗网格到细网格的空间特征信息融合,未来还需进一步考虑时间特征信息的有效融合,以进一步改进融合结果的时空变化一致性。此外,融合结果不确定性定量评估方法也是未来融合方案改进的重要方向,如采用动态贝叶斯融合算法的不确定性估计方案。

4 结 论

本研究提出了基于二维离散小波分解与重构的多源土壤含水量数据融合方法,以黄河流域为主体,覆盖北方干旱半干旱、黄土高原、黄淮海平原、青藏高原东部和部分长江中下游等主要农业气候区的区域为研究区域,开展了ESA-CCI、SMAP和ERA5-Land 3个土壤含水量数据的融合试验,并利用地面站点观测数据对比评估了融合结果的准确性和一致性,以及表征时空波动特征的能力。主要结论如下:

1)基于离散小波分解与重构的多源土壤含水量数据融合方法是可行和有效的,能够最大化继承融合数据源的大尺度趋势特征和小尺度波动特征,有效改进单一土壤含水量数据源的区域适用性、准确性,以及时空序列结构和波动特征。融合结果更吻合研究区域土壤含水量的真实值域和时空分布特征,具有更强的时空波动特征综合表征能力。

2)融合结果相对观测值的时空误差和一致性获得了较理想的改进预期,其总体平均RMSE、Bias和r分别为0.053、0.001 m3/m3和0.721,综合表现均优于单一的融合数据源的评估指标。融合结果较好改善了融合数据源在不同农业气候区RMSE偏高的问题,Bias时空序列均总体表现为更低的正偏差,相关系数时空序列均在较高的值域统计区间,且总体表现为空间稳定高值分布。

[1] KIM J, HOGUE T S. Improving spatial soil moisture representation through integration of AMSR-E and MODIS products[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(2): 446-460.

[2] DAN L, JI J, LIU H. Use of a land surface model to evaluate the observed soil moisture of grassland at the Tongyu Reference Site[J]. Advances in Atmospheric Sciences, 2008(6): 1073-1084.

[3] MAO K, SHI J, TANG H, et al. A neural network technique for separating land surface emissivity and temperature from ASTER imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(1): 200-208.

[4] BINDLISH R, CROW W T, JACKSON T J. Role of passive microwave remote sensing in improving flood forecasts[J]. IEEE Geoscience & Remote Sensing Letters, 2009, 6(1): 112-116.

[5] CHEN C F, SON N T, CHANG L Y, et al. Monitoring of soil moisture variability in relation to rice cropping systems in the Vietnamese Mekong Delta using MODIS data[J]. Applied Geography, 2011, 31(2): 463-475.

[6] LIU Y Y, DORIGO W A, PARINUSSA R M, et al. Trend-preserving blending of passive and active microwave soil moisture retrievals[J]. Remote Sensing of Environment, 2012, 123: 280-297.

[7] CHAI S S, JEFFREY W, OLEG M, et al. Use of soil moisture variability in artificial neural network retrieval of soil moisture[J]. Remote Sensing, 2009, 2(1): 166-190.

[8] PENG J, LOEW A, MERLIN O, et al. A review of spatial downscaling of satellite remotely sensed soil moisture[J]. Reviews of Geophysics, 2017, 55(2): 341-366.

[9] 王红梅,谢应忠,王堃. 不同类型人工草地小尺度土壤水分空间异质性特征研究[J]. 草地学报,2013,21(6):1052-1058.

WANG Hongmei, XIE Yingzhong, WANG Kun. Spatial heterogeneity of soil moisture in different artificial grasslands with finer scales[J]. Acta Agrestia Sinica, 2013, 21(6): 1052-1058. (in Chinese with English abstract)

[10] D’URSO G, MINACAPILLI M. A semi-empirical approach for surface soil water content estimation from radar data without a-priori information on surface roughness[J]. Journal of Hydrology, 2005, 321(1): 297-310.

[11] 杨丽萍,侯成磊,苏志强,等. 基于机器学习和全极化雷达数据的干旱区土壤湿度反演[J]. 农业工程学报,2021,37(13):74-82.

YANG Liping, HOU Chenglei, SU Zhiqiang, et al. Soil moisture inversion in arid areas by using machine learning and fully polarimetric SAR imagery[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(13): 74-82. (in Chinese with English abstract)

[12] TISCHLER M, GARCIA M, PETERS-LIDARD C, et al. A GIS framework for surface-layer soil moisture estimation combining satellite radar measurements and land surface modeling with soil physical property estimation[J]. Environmental Modelling & Software, 2007, 22(6): 891-898.

[13] 李得勤,段云霞,张述文. 土壤湿度观测、模拟和估算研究[J]. 地球科学进展,2012,27(4):424-434.

LI Deqin, DUAN Yunxia, ZHANG Shuwen. Soil moisture measurement and simulation: A Review[J]. Advances in Earth Science, 2012, 27(4): 424-434. (in Chinese with English abstract)

[14] ANAGNOSTOU E N, NEGRI A J, ADLER R F. Statistical adjustment of satellite microwave monthly rainfall estimates over Amazonia[J]. Journal of Applied Meteorology, 2010, 38(11): 1590-1598.

[15] ROBIN V D S, RICHARD D J, ROBERT P, et al. The effect of three different data fusion approaches on the quality of soil moisture retrievals from multiple passive microwave sensors[J]. Remote Sensing, 2018, 10(2): 107.

[16] CHEN C, HE M, CHEN Q, et al. Triple collocation-based error estimation and data fusion of global gridded precipitation products over the Yangtze River basin[J]. Journal of Hydrology, 2022, 605: 127307.

[17] GRUBER A, DORIGO W A, CROW W, et al. Triple collocation-based merging of satellite soil moisture retrievals[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(12): 6780-6792.

[18] CHENG J, LIU H, LIU T, et al. Remote sensing image fusion via wavelet transform and sparse representation[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 104: 158-173.

[19] ZHU X, CAI F, TIAN J, et al. Spatiotemporal fusion of multisource remote sensing data: Literature survey, taxonomy, principles, applications, and future directions[J]. Remote Sensing, 2018, 10(4): 527.

[20] 姬兴杰,刘美,吴稀稀,等. 1961-2019年黄河流域降雨侵蚀力时空变化特征分析[J]. 农业工程学报,2022,38(14):136-145.

JI Xingjie, LIU Mei, WU Xixi, et al. Spatiotemporal variation characteristics of rainfall erosivity in the Yellow River Basin from 1961 to 2019[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(14): 136-145. (in Chinese with English abstract)

[21] DUNXIAN S, JUN X. The spatial and temporal analysis of dry spells in the Yellow River basin, China[J]. Stochastic Environmental Research and Risk Assessment, 2013, 27(1): 29-42.

[22] HOLLMANN R, MERCHANT C J, SAUNDERS R, et al. The ESA climate change initiative: Satellite data records for essential climate variables[J]. Bulletin of the American Meteorological Society, 2013, 94(10): 1541-1552.

[23] MA H, ZENG J, CHEN N, et al. Satellite surface soil moisture from SMAP, SMOS, AMSR2 and ESA CCI: A comprehensive assessment using global ground-based observations[J]. Remote Sensing of Environment, 2019, 231: 1-44.

[24] LI L Y, LIU Y, LIAO K H, et al. Evaluation of nine major satellite soil moisture products in a typical subtropical monsoon region with complex land surface characteristics[J]. International Soil and Water Conservation Research, 2022, 10(3): 518-529.

[25] HERSBACH H, BELL B, BERRISFORD P, et al. The ERA5 global reanalysis[J]. Quarterly Journal of the Royal Meteorological Society, 2020, 146(730): 1999-2049.

[26] 张艳超,肖宇钊,庄载椿,等. 基于小波分解的油菜多光谱图像与深度图像数据融合方法[J]. 农业工程学报,2016,32(16):143-150.

ZHANG Yanchao, XIAO Yuzhao, ZHUANG Zaichun, et al. Data fusion of multispectral and depth image for rape plant based on wavelet decomposition[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(16): 143-150. (in Chinese with English abstract)

[27] LEE G, GOMMERS R, WASELEWSKI F, et al. PyWavelets: A Python package for wavelet analysis[J]. Journal of Open Source Software, 2019, 4(36): 1237.

[28] 姚晓磊,鱼京善,孙文超. 基于累积分布函数匹配的多源遥感土壤水分数据连续融合算法[J]. 农业工程学报,2019,35(1):131.

YAO Xiaolei, YU Jingshan, SUN Wenchao. Continuous fusion algorithm analysis for multi-source remote sensing soil moisture data based on cumulative distribution fusion[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(1): 131-137. (in Chinese with English abstract)

[29] 何涯舟, 张珂, 晁丽君, 等. 基于多源卫星遥感产品的土壤湿度融合与降尺度研究[J]. 河海大学学报(自然科学版),2022,50(6):40-46.

HE Yazhou, ZHANG Ke, CHAO Lijun, et al. Study on soil moisture merging and downscaling based on multi-source satellite remote sensing products[J]. Journal of Hohai University (Natural Sciences), 2022, 50(6): 40-46. (in Chinese with English abstract)

[30] ZHOU J, CROW W T, WU Z, et al. A triple collocation-based 2D soil moisture merging methodology considering spatial and temporal non-stationary errors[J]. Remote Sensing of Environment, 2021, 263: 112509.

[31] CHEN Y, YUAN H, YANG Y, et al. Sub-daily soil moisture estimate using dynamic Bayesian model averaging[J]. Journal of Hydrology, 2020, 590: 125445.

Multi-source soil moisture data fusion method and its evaluation using decomposition and reconstruction of discrete wavelet transform

JIANG Zhiwei1, LI Yunfei1, JIANG Tao2※, Hasituya3, Manao1, HU Jie1

(1.,,010018,; 2.,,010051,; 3.,,,010018,)

Here the multi-source data fusion of soil water content was proposed to improve the regional applicability and accuracy of grid data using decomposition and reconstruction of the discrete wavelet transform. The products of soil water content were estimated to test the feasibility and applicability of the improved fusion from the ESA-CCI, SMAP, and ERA5-Land. The data was also collected from the ground station in the Yellow River Basin, including the main agroclimatic region from June to September 2016-2018. The results showed that the improved fusion effectively captured the multi-scale feature information from the original data source. These multi-source and multi-scale feature information was then weighted to merge and reconstruct at each decomposition level. Finally, the regional applicability was effectively improved in the different agroclimatic regions, together with the accuracy of spatiotemporal structure and fluctuation. The merged data of soil water content was fully assessed, with the root mean square error (RMSE) of 0.053 m3/m3, the bias of 0.001 m3/m3, and the correlation coefficient () of 0.721. Furthermore, the merged data of soil water content was also much better than any single original one, in terms of the overall performance of spatiotemporal decomposition. The higher time-series RMSEs of ERA5-Land soil water content were found in the transition region from the humid to the semi-arid agricultural climate zone, as well as the SMAP and ESA-CCI soil water content in the rainy region. By contrast, the spatial-series RMSEs steadily fluctuated with a narrow range interval (0.07-0.08 m3/m3), especially the amplitude of the fluctuation was controlled within 0.1 m3/m3during increasing precipitation. The merged data of soil water content shared the lower positive bias (0.005 m3/m3) in the time series and lower negative bias (-0.002 m3/m3) in the spatial series, indicating the higher positive bias of ERA5-Land and ESA-CCI soil water content, together with the overall negative bias of SMAP soil water content. There was a similar spatiotemporal range in the correlation coefficient of the merged and ERA5-Land soil water content, indicating a slightly lower in the time series (0.578), and much higher in the spatial series (0.497). The higher matching of the merged data was achieved in the structural characteristics of the multi-scale spatiotemporal fluctuation spectrum in the observation. The higher total power of cross wavelet and stronger ability for the merged data were observed to characterize the spatiotemporal fluctuations of real soil water content. There was consistent spatiotemporal fluctuation within the time scale of 25 d. The fusion scheme was considered in the multi-dimensional trends and structure characteristics from the three data sources at different spatial scales in the fusion processing of multi-level wavelet decomposition and weighted merging level by level, compared with the Triple-Collection Analysis, and Cumulative Distribution Function Matching. Hence, the maximum layer was determined for the wavelet decomposition. There was a slightly lower linear slope of the merged soil water content, compared with the observations, due to the common feature of “overestimation of lower value, and underestimation of high value” of ERA5-Land, ESA-CCI, and SMAP soil water content. Feasible approaches in the future can be expected to improve the fusion data sources and algorithm, such as the spatiotemporal continuity and accuracy of ESA-CCI and SMAP soil water content. The observations were introduced into the fusion processing, and then the advanced fusion was developed to merge the more useful information relating to spatiotemporal characteristics of soil water content. In short, a better expectation was obtained to improve the regional soil water content. The finding can provide feasible and effective applications in the regional ecological environment, sustainable agricultural development, soil and water conservation, as well as disaster prevention and mitigation.

soil moisture; remote sensing; discrete wavelet transform; multi-source data fusion; Yellow River Basin

2022-12-18

2023-03-23

内蒙古自然科学基金面上项目(2019MS04015);内蒙古自治区科技计划项目(2021GG0081);国家自然科学基金地区科学基金项目(42161054);“科技兴蒙”行动重大专项(KJXM-EEDS-2020006);内蒙古人才引进项目(NDYB2018-6)

姜志伟,博士,高级工程师,研究方向为农业遥感应用。Email:zhiweijiang@imau.edu.cn

姜涛,博士,讲师,研究方向为地理信息科学、区域经济等。Email:taojzw@163.com

10.11975/j.issn.1002-6819.202212131

S271

A

1002-6819(2023)-07-0145-12

姜志伟,李云飞,姜涛,等. 基于离散小波分解与重构的多源土壤含水量数据融合方法与评估[J]. 农业工程学报,2023,39(7):145-156. doi:10.11975/j.issn.1002-6819.202212131 http://www.tcsae.org

JIANG Zhiwei, LI Yunfei, JIANG Tao, et al. Multi-source soil moisture data fusion method and its evaluation using decomposition and reconstruction of discrete wavelet transform[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2023, 39(7): 145-156. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.202212131 http://www.tcsae.org

猜你喜欢
数据源时空含水量
跨越时空的相遇
镜中的时空穿梭
玩一次时空大“穿越”
结合Sentinel- 1B和Landsat8数据的针叶林叶片含水量反演研究
一次冰雹过程成雹机理的数值模拟
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
时空之门
基于两相混合流理论PEMFC含水量特性分析
基于真值发现的冲突数据源质量评价算法