基于优化BP神经网络ESA CCI土壤水分重建方法研究

2023-11-13 01:36:46孙时雨宋承运

无线电工程 2023年11期

孙时雨，宋承运，周露

(1.安徽理工大学空间信息与测绘工程学院，安徽淮南 232001；2.安徽理工大学矿山采动灾害空天地协同监测与预警安徽普通高校重点实验室，安徽淮南 232001)

0 引言

土壤水分是能量、水和碳循环的重要组成部分,为陆地-大气模型、水文模型和降水预测模型提供了重要信息[1]。在多尺度相互作用中,土壤水分在控制地表能量分配、调节地表径流和土壤排水、调节冠层蒸腾和碳排放等方面发挥着重要作用[2]。长时序的土壤水分产品可用于更准确和可靠地估计深层土壤水分和蒸散发等,也可用于数据同化、天气预报和干旱监测等。因此,迫切需要可靠、准确和完整的土壤水分信息[3]。

由于土壤水分空间异质性强,用来观测土壤水分的设备成本高,不仅耗费人力,还耗费物力,因此很难建立区域和全球范围的高分辨率观测网络。传统的土壤水分观测方法一般只适合范围比较小的土壤水分的信息采集,无法应用到大范围的地表水分的测量。随着遥感技术的快速发展,卫星遥感是获取地表土壤水分(通常在0～5 cm深度)最有效的工具[4]。特别是微波遥感被认为是监测土壤水分最主流的方法,因为它能够全天工作,不受天气的限制,可穿透云层、植被和土壤[5]。各种卫星研究和应用机构的微波传感器可以生成全球遥感产品,如高级微波扫描辐射计EOS(AMSR-E)、土壤水分主-被动遥感卫星(SMAP)、欧洲航天局(ESA)的土壤湿度和海洋盐度观测卫星(SMOS)、日本的先进微波扫描辐射计2(AMSR2)和中国的微波辐射成像仪(MWRI)[6]。然而上述卫星产品的时间覆盖范围太短,无法满足水文气象的应用需求。因此, ESA CCI发布了一个完整和一致的全球土壤水分数据集。但由于卫星轨道变化、射频干扰(RFI)和微型传感器的物理限制,该数据集存在数据缺失[7]。数据缺失限制了ESA CCI 土壤水分产品的实际应用,特别是在需要空间完整和时间连续的土壤水分数据的领域,如气候模拟、干旱监测和水资源管理[8]等。

国内外已经提出了一些方法来填补卫星数据集的空白。这些方法主要可分为统计、插值和机器学习等几类。统计方法(例如多元线性回归、非线性回归)主要依赖输入和目标数据的线性和非线性关系。Wang等[9]测试了一种基于三维离散余弦变换(DCT-PLS)的最小二乘回归的统计建模方法来填补卫星产品空白。Yan等[10]运用了反距离加权(IDW)根据目标变量的空间模式填充缺失数据。其他方法已用于重建,例如Turlapaty等[11]使用改进的奇异光谱分析来填补AMSR-E土壤水分数据集中的缺失。近年来,支持向量机(SVM)和人工神经网络(ANN)被广泛用于填补遥感数据的缺失[12]。然而,基于机器学习算法模型的优劣很大程度上取决于输入变量的选择以及输入变量和目标变量的关系,模型的结构与输入变量、目标变量和周期高度相关[13]。收敛速度慢、易过拟合是传统的机器学习模型及BP神经网络的缺点,而且得到数据的精度误差大[14]。

基于以上分析,以青藏高原那曲为研究区域,利用ESA CCI V04.2组合土壤水分产品、数字高程数据(DEM)以及基于MODIS数据重建的地表温度数据、归一化植被指数(NDVI)和反照率数据,采用原子搜索优化(Atom Search Optimization,ASO)算法去优化BP神经网络模型的权值、阈值,从而建立ASO-BP土壤水分重建模型,得到空间连续土壤水分,并利用青藏高原中部土壤水分多尺度观测网(Soil Moisture and Temperature Monitoring Network on the Central TP,TP-SMTMN)数据对结果进行验证分析。

1 数据来源

1.1 研究区域概况

研究区域为青藏高原那曲地区(83°55′E～95°05′E,29°55′N～36°30′N)。那曲约有40万km2的面积,地势开阔,干湿季分明,属于高原亚寒带气候区,月平均降水量在7月最大,在12月或1月最小,年平均降水量为476.5 mm[15]。

那曲地区在3月下旬冻土开始消融,土壤水分增加。从 5月开始表层土壤水分会继续增加,受季风降水的影响,7月达到峰值,8月以后降水减小,土壤水分逐渐减小,10月温度降低,土壤水分逐渐由液态变为固态,土壤水分减小,1月达到谷值,一直持续到 3月,完成一年的循环周期[16]。研究区高程及地面观测站点示意如图1所示。

(a)研究区高程

(b)地面观测站点

1.2 遥感数据来源与处理

(1)ESA CCI土壤水分数据。ESA CCI是一种长时间序列、多卫星融合的土壤水分产品,它基于主动和被动微波传感器,生产的数据集包含主动、被动和融合数据集3种,空间分辨率为0.25°,时间分辨率为1 d[17]。它也是第一个基于遥感的长时间序列土壤水分产品,具有很好的一致性,而卫星轨道、植被、冻土、积雪和冰川等因素影响了反演后土壤水分的空间连续性与精度[18]。本文采用ECV V04.2组合土壤水分产品(每日,0.25°),作为主要数据源 (http:∥www.esa-soilmosture-cci.org/)[19]。

(2)LST、NDVI、Albedo与DEM遥感数据。LST、NDVI和Albedo数据是由MODIS MOD11C1 LST产品(0.05°)、MOD13C1 NDVI产品(0.05°)与MOD43C1反照率产品(0.05°)分别采用多时相稳健回归方法[20]和基于时间滤波统计方法[21]进行数据重建,得到空间连续的LST、NDVI和Albedo数据,分辨率为0.05°(数据来自 http:∥reverb.echo.nasa.gov/)。美国国家航空航天局(National Aeronautics and Space Administration,NASA)航天飞机雷达地形任务(SRTM)公开的DEM(30 m)(数据来自 http:∥reverb.echo.nasa.gov/DEM)。

(3)地面观测数据。由研究区内青藏高原中部土壤水分多尺度观测网的数据集提供。此数据网提供3种尺度和4种深度的土壤温度与土壤水分的观测数据,3种尺度分别为大尺度1°、中尺度0.3°与小尺度0.1°,4种深度分别为 0～5、10、20 、40 cm,观测间隔为0.5 h。由于被动微波土壤水分产品的空间分辨率为0.25°,选取中尺度(如图1(b)所示) 范围内深度为 0～5 cm的土壤水分观测数据去验证分析结果[22]。

2 研究方法与原理

2.1 BP神经网络原理

BP神经网络是一种多层前馈网络,其核心算法为误差反向传播,在函数逼近、模式识别、分类等领域应用较为广泛,具有自组织、自学习能力等特点[23]。

基本原理:基本BP算法计算误差输出时是按从输入到输出的方向执行的,而调整权值和阈值则相反。通过调整输入节点与隐层节点、隐层节点与输出节点的联接强度以及阈值,从而使BP网络的预测输入不断接近期望输出。BP神经网络还可以用来建立多元非线性关系,因此,在遥感反演估算中被广泛应用[24]。BP神经网络结构如图2所示。

图2 BP神经网络结构Fig.2 BP neural network structure

2.2 ASO算法原理

ASO算法是一种基于分子动力学模型的新颖智能算法,它通过种群间各个原子间的相互作用力来指导群体,从而进行智能优化搜索[25]。

基本原理:根据分子动力学中原子的物理运动规律建立算法模型。由牛顿第二定律可知,如果Fi是作用在第i个原子上的相互作用力,Gi为作用在第i个原子上的约束力,原子质量为mi,第i个原子的加速度可表示为:

(1)

式中:t为当前迭代的次数,d为原子所在的维数。下面对Fi、Gi、mi三个值的求解进行阐述。

(2)

式中:Kbest为适应度函数值比较好的k个原子的集合。

(3)

(4)

(5)

(6)

式中:xi和xj分别表示原子i和原子j的位置。

(7)

(3)原子质量mi(t)。第t次迭代中第i个原子的质量mi(t)由当前种群个体的适应度值大小决定,定义如下:

(8)

(9)

式中:fi(t)为第i个原子的适应度值,fmax(t)、fmin(t)分别表示原子种群中最大适应度值和最小适应度值。

(10)

在每一次迭代过程中,根据得到的加速度更新原子i的速度和位置,更新如下:

(11)

(12)

2.3 ASO-BP算法模型

本文应用一种基于ASO算法的反演模型,其关键在于通过优化原子位置来确定BP神经网络的初始权值和阈值。首先利用ASO算法对原子位置进行多次迭代搜索,以找到最优的参数组合。再利用优化后的BP神经网络模型进行土壤水分的反演。算法的流程如图3所示,其算法流程分为3步:

① 根据遥感影像选取所需的输入数据,将其进行重建和均值升尺度处理后的数据作为整体的样本集。在确定BP神经网络的拓扑结构之后对BP神经网络的权值与阈值进行初始化。

② 计算ASO算法的决策变量长度,选取均方误差作为优化的目标函数,对BP神经网络的权值与阈值进行优化。ASO计算原子适应度,更新目前找到的最优解。根据式(8)、式(9)分别计算原子的个体加速度、速度及位置更新。设置当达到最优适应度或者最大迭代次数时终止迭代的算法停止准则,输出原子个体的最优位置,否则继续重复ASO。

③ 使用优化算法对神经网络的权值和阈值参数进行优化,将优化后得到的权值和阈值参数赋给BP神经网络。输入样本集与测试集进行反演,数据归一化后最终获得土壤水分。

图3 ASO BP神经网络土壤水分重建流程Fig.3 Flowchart of ASO BP neural network soil moisture reconstruction

3 结果与讨论

由NDVI、LST、Albedo与SRTM DEM数据采用均值升尺度后得到空间分辨率为0.25°的数据,并与ECV V04.2作为输入数据,优化后的土壤水分数据作为输出,建立BP神经网络。BP神经网络中采用了正切S型传递函数tansig作为传输函数,最大的迭代次数为1 000,目标0.000 001。采用ASO后的BP神经网络训练及土壤水分反演。

为了验证土壤水分反演的有效性,评价传统BP神经网络模型和ASO-BP神经网络模型的反演精度,选取了3个指标:相关系数(R)、均方根误差(RMSE)和无偏均方根误差(ubRMSE)。一般来说,R值越大,RMSE、ubRMSE越小,则反演结果越好、精度越高。

3.1 土壤水分反演结果与分析

由ASO-BP神经网络模型、BP神经网络模型重建的2015年5月1日土壤水分如图4所示。由图4可以看出,重建后的土壤水分与重建前ESA CCI土壤水分空间分布一致,中部和西部土壤水分值较小,东部值较大。通过重建,得到了空间连续的土壤水分。

(a)ESA CCI土壤水分图

(b)BP重建土壤水分图

(c)ASO-BP重建土壤水分图

2015年1—12月ESA CCI土壤水分、重建的土壤水分和地观测站土壤水分的时间序列如图5所示。由图5可以看出,重建后的土壤水分在对ESA CCI土壤水分中缺失的土壤水分进行重建生成有效值的同时,与实测土壤水分保持一致的变化趋势。夏季土壤水分较高,冬季较低,在8月左右有一个明显的低谷,ESA CCI土壤水分与重建土壤水分在此时间段也表现出明显的低谷。但重建后的土壤水分值在4—6月以及10月低于实测值,主要是由于原始ESA CCI土壤水分在此期间低估了土壤水分,造成重建后的土壤水分值偏低。同时,弥补了在ESA CCI土壤水分1—3月以及11—12月缺少的数据,但与地面实测值相关较大,这主要是由于此时段为冻土,且在重建模型中,缺少相应时期的土壤水分数据作为输入数据。因此,提高人工神经网络输入数据的质量是进一步提高反演精度的关键步骤。

图5 2015年土壤水分的时间序列比较Fig.5 Time series comparison of soil moisture in 2015

选取地面观测网中尺度(0.3°)站点观测平均值与反演得到的土壤水分进行对比分析,图6为BP重建土壤水分(图6(a))和ASO-BP重建土壤水分(图6(b))与地面观测值的散点图。由图6可以看出,在研究期内, ASO-BP重建土壤水分值不高于地面观测值,土壤水分在大部分日期低于地面观测值。而在土壤较为干燥时,尤其是在土壤水分值小于 0.2 cm3·cm-3时,土壤水分重建值则高于地面观测值。这可能是由于土壤湿润时,多处于季风期,降雨较多,植被生长较为茂盛,采用被动微波反演土壤水分时植被透过率估算的误差,造成重建得到的 ESA CCI土壤水分低于地面观测0～5 cm土壤水分观测值,而ESA CCI土壤水分在大部分日期偏低也是造成BP重建土壤水分与ASO-BP重建土壤水分值偏低的一个重要原因。相对于BP重建土壤水分,ASO-BP重建土壤水分在土壤较为干燥时,与地面观测值更为接近,主要原因是ASO对BP神经网络初始值的优化,减小了干燥时反演土壤水分的误差。

同时,ASO-BP重建土壤水分与地面观测值的RMSE值(0.029 cm3·cm-3),ubRMSE值为0.028 cm3·cm-3,略高于BP 重建土壤水分(0.034 cm3·cm-3),ubRMSE值为0.033 cm3·cm-3,整体精度得到提高。

整体而言,重建后的土壤水分的变化趋势与站点实测数据基本保持一致,可以较好地监测土壤水分变化情况。

3.2 不同植被覆盖度下土壤水分精度分析

为了进一步分析不同植被覆盖度下ASO-BP土壤水分精度,选取NDVI值0.4作为不同植被覆盖度阈值[26],分别分析NDVI≥0.4与NDVI<0.4时土壤水分精度。表1NDVI<0.4与NDVI≥0.4时,土壤水分与地面观测值的精度比较。

表1 不同土壤水分值与地面观测值的精度比较

由表1可以看出,在高植被覆盖度下(NDVI≥0.4),ASO-BP土壤水分与BP土壤水分的R值较接近,RMSE值分别为0.031、0.026 cm3·cm-3, ubRMSE从0.024 cm3·cm-3降到0.022 cm3·cm-3。在植被覆盖区域,植被在一定程度上降低了微波信号对土壤水分的敏感性,造成微波反演土壤水分时产生误差。而BP与ASO-BP算法能够在一定程度上对植被覆盖度较高区域的土壤水分进行优化,提高精度。当NDVI<0.4时, ASO-BP算法相关系数R值(0.58),高于BP重建土壤水分(0.39), ubRMSE从0.033 cm3·cm-3降到0.028 cm3·cm-3。

因此,ASO-BP优化模型能够提高土壤水分精度,并且在低植被覆盖度区域(NDVI<0.4)时的效果比BP神经网络模型的效果要更好。

4 结论

本文使用ASO算法优化BP神经网络,融合了NDVI、LST、DEM、Albedo、ESA CCI土壤水分数据,建立了土壤水分重建模型。实验结果表明,本文算法能够实现土壤水分遥感产品的重建,同时,提高了土壤水分反演精度,得出主要结论如下:

① 通过ASO算法对BP神经网络进行优化,改善了BP神经网络算法收敛速度慢、易过拟合的缺点。在算法中,采用ASO对BP神经网络的初始值进行优化,使得土壤水分重建精度较传统BP算法获得有效提高。

② 在不同植被覆盖度下,体现了算法的适用性。高植被覆盖度区域(NDVI≥0.4),ASO-BP算法优于BP神经网络算法。ASO-BP土壤水分和BP土壤水分与地面观测值的R值从0.79提高到0.80以上, ubRMSE从0.024 cm3·cm-3提高到0.022 cm3·cm-3。在低植被覆盖度区域(NDVI<0.4),ASO-BP优化模型土壤水分精度(R=0.58,RMSE=0.029 cm3·cm-3)比传统BP神经网络精度(R=0.39,RMSE=0.034 cm3·cm-3)提高更为明显。

本文中土壤水分空间分辨率低且时间序列较短,而影响土壤水分的因素复杂多样,在一定程度上会影响土壤水分结果精度验证。同时,在结果验证方面,采用像元内地面观测站点的平均值作为真实值,但易受站点的布设位置、区域环境等因素的影响。在进一步研究中,将分析降水、土壤类型、土壤表面粗糙度等参数对模型的影响,以及土壤水分真实性验证等。