李 奎,张 瑞,2※,段金亮,吕继超
(1. 西南交通大学地球科学与环境工程学院,成都 611756;2. 西南交通大学高速铁路运营安全空间信息技术国家地方联合实验室,成都 611756)
土壤湿度(soil moisture)作为反映地表状况的一个重要物理量,不仅能够体现土地的干旱情况,还是农作物水分供应的决定因素,被精准农业、水循环等众多领域视为研究基础和关注热点[1]。针对土壤湿度的测定,现有技术途径包括电阻法、负压计法等现场测定方法,重量法和中子法等试验测定方法,以及利用红外和其它光谱数据实施解译判读的遥感法[2-4]。其中,遥感法可利用卫星和机载传感器实施大范围的全局调查和测定,在作业效率、空间覆盖度等方面优势明显[5]。
在用于土壤湿度遥感解析的众多光谱信息中,由于微波谱段对云层以及植被覆盖具有较高的穿透性,且对土壤湿度变化较为敏感,近年来针对微波遥感数据的土壤湿度反演模型和算法发展迅猛,先后出现了一系列的理论模型[6-8],也构建了诸如水云模型[9]、Oh 模型[10]、Dobois 模型[11]以及Zribi-Dechambre 模型[12]等实用性较好的半经验模型。然而,根据现有研究来看,理论模型实测参数较多且模型复杂,仅在裸土区域具有较好的反演效果。而半经验模型需要大量的研究区域实测土壤湿度和植被含水量等先验信息,且多数模型对合成孔径雷达(Synthetic Aperture Radar,SAR)入射角、土壤粗糙度(soil roughness)、雷达波段以及土壤含水率(soil water content)范围均有要求,在大区域施测过程中受先验数据的制约严重,普适性仍有待提高。
为提高模型的泛化能力,国内外学者将人工神经网络(Artificial Neuron Net,ANN)引入微波遥感协同反演土壤湿度,并开展了大量研究[13-15]。Paloscia 等[16]和Hajj 等[17]利用模拟的全极化SAR 数据,结合归一化植被指数(Normalized Difference Vegetation Index,NDVI)训练了多个ANN,对比分析了各单极化SAR 数据反演土壤湿度的效果。Hachani 等[18]使用ANN 获得了干旱和半干旱区域的土壤湿度,并且使用NDVI 指数估算研究区域植被影响。Bao等[19]计算了NDVI、增强型植被指数(Index Vegetation Enhanced,EVI)、归一化水指数(Normalized Difference Water Index,NDWI)等多个植被指数,然后分别与水云模型组合,选取最优植被指数反演土壤湿度。然而,在非干旱区的大面积土壤湿度反演时,植被覆盖类型复杂多样,不同植被类型对土壤含水率的影响存在差异较大的问题。此外,同一植被指数对不同植被类型的响应函数不同,所有植被指数都存在指数饱和问题,也导致植被含水量估算范围受到限制[20]。综上所述,仅基于单一植被指数估算或消除整个研究区域植被影响的方法在大面积土壤湿度反演中存在较大误差和不确定性。因此,现有研究多集中于植被覆盖类型变化较小的地表,研究区域亦局限于10~20 km 范围内[13-20]。由此可见,适时地发展完善可满足更多样化地表植被覆盖类型和更大范围的土壤湿度反演方法具有极为重要的理论和应用价值。
考虑到估算植被影响的植被指数均由红光和近红外波段组合而成,而多极化的SAR 数据能提供土壤粗糙度信息,本研究借助卷积神经网络(Convolutional Neural Network,CNN)能有效模拟具有相关物理意义的特征参数这一优势,联合SAR 影像与多光谱数据数据源,提出了一种结合改进的卷积神经网络实施广域土壤湿度反演的方法。随后,选取地表植被覆盖复杂、水系和建筑物较多的四川盆地区域为典型研究区开展了试验,最终在边长超过100 km 的区域范围内获得了较好的反演结果,验证了本研究所提出方法的有效性。
通过光学方法估算植被含水量影响,本质上是基于植被对近红外和短波红外区的光谱响应[21]。基于此原理,可以构建植被指数对含水量影响进行估算。其中,以NDVI、比值植被指数(Ratio Vegetation Index,RVI)、土壤调整植被指数(Soil-Adjusted Vegetation Index,SAVI)3 个指数应用最广,如式(1)、式(2)和式(3)所示
式中NIR 为近红外波段;R 为红光波段;L 为随植被密度变化的经验参数,取值范围为0~1。已有研究表明,上述3 类指数在估算植被影响方面尚存局限[20-22]。其中,NDVI 指数的缺陷主要体现在对高植被覆盖区不够敏感;RVI 指数在植被覆盖过少或过多等极端区域估算能力较为不足;而对于SAVI 指数而言,虽然在抵御土壤背景因素干扰方面有一定的优势,但需要针对不同植被覆盖情况设定合理的土壤调节系数L。
对于微波遥感反演土壤湿度而言,土壤粗糙度是植被影响因素外的另一个主要误差来源。本质上讲,多极化SAR 是目标物信息在多个维度的反映。因此,通过多极化SAR 数据构建的散射矩阵可以获取关于土壤粗糙度以及植被的信息。研究发现去极化比值与土壤表面粗糙度间具有高相关性,故构建了去极化比值(depolarization ratio,xv)式(4),用以估算和消除土壤粗糙度的影响[23]。
可以看出,各影响因子不仅独立影响地表土壤湿度,影响因子之间也存在复杂的联系,并且各变量之间的不同组合与土壤湿度之间存在相关性。在植被覆盖类型复杂、土壤粗糙度空间分布差异明显的大面积土壤湿度制图中,如何实现多极化SAR 与各个植被指数协同反演,是提高反演精度和可靠性的关键。
CNN 中的卷积层能够在原始输入变量中自适应提取反映输出变量的高维特征信息,结合ANN 中全连接层在解决非线性问题中的独特优势,CNN 在图像分类等众多领域应用广泛,但在SAR 数据反演土壤湿度研究中尚未有成熟的技术方法。本研究在联合SAR 影像与多光谱数据的基础上,引入了一种改进的卷积神经网络(Improved Convolutional Neural Network,ICNN)方法以构建新型的土壤湿度反演模型。如图1 所示,该模型的输入未直接使用植被指数,而是选取构成众多植被指数的原始红光、近红外波段观测量;此外,使用VV、VH 极化取代去极化比值,并额外引入了雷达入射角信息。在卷积层,分别采用1×1、2×1、3×1 卷积核对输入层卷积运算,其中1×1卷积核提取独立5 个原始变量;2×1 卷积核主要用于在大量训练样本支持下,自适应提取能最优表征研究区域各部分植被影响的高级特征维;同理,3×1 卷积核进一步提取旨在模拟各变量之间不同组合的特征信息。为了避免特征信息减少导致反演精度降低,保证提取的特征信息全部参与反演,在模型中去除了传统CNN 中的池化层。最后,建立了2 层24×1 规模的全连接层,直接训练出所提取的12 个高级特征维与土壤湿度之间的非线性模型。本次试验数据中,样本土壤湿度值范围为15.6%~47.7%。为了使反演结果分辨率达到0.1%,输出层需要322 个神经元。
图1 改进的卷积神经网络ICNN Fig.1 Improved convolutional neural network ICNN
为测试模型和算法的有效性,选取了位于四川盆地中部的研究区(30°12′30″N~31°27′41″N,103°24′10″E~105°10′20″E)开展试验验证(图2)。本研究区包含7个地级市,地势平坦,研究区面积约为3 345 613 hm2,研究区域边长超过100 km。该区域大部分为平原,东部有小型丘陵,属亚热带季风气候,土壤年均湿度较大,植被覆盖类型复杂多样,水系和建筑物较多且分布不均匀,耕地种类多样。
图2 研究区域 Fig. 2 Study area
为验证本研究方法适应复杂地表环境的能力,收集了研究区4—7 月Sentinel-1A(S1A)影像(VV 极化和VH 极化)和Sentinel-2A(S2A)搭载的多光谱成像仪数据。这主要是考虑到夏季植被生长繁盛,地表环境变化较快,是较为理想的典型试验时间段。考虑到SAR 影像对不同地物的辐射差异,本研究选取VV 极化的SAR 影像,对城市、河流等大面积噪声区域进行掩模处理,并以此为基准,所有影像被掩模区域均不参与反演。由于云雾对红光、近红外波段干扰较为严重,筛选了8 景无云和少云(即云量≤10%)S2A 影像参与试验。此外,鉴于短时间内地表植被变化不显著,模型训练时直接使用与SAR 影像获取时间最为接近的S2A 数据作为同步数据(表1)。在此次广域试验研究中,考虑到实测土壤湿度值为神经网络训练提供所需的标签数据难以实现,而利用模拟数据作为训练样本又将与实际情况存在较大偏差的问题。本研究选取中国气象局“CLDAS-V2.0 土壤含水率分析产品”作为模型训练的标签和模型验证时的真值(与SAR 成像时间同步)。该专题数据在与地面实测数据对比中,全国平均相关系数大于0.9,均方根误差(Root Mean Square Error,RMSE)为0.8%[27],在中国境内空间分辨率和精度远优于GLDAS 和NLDAS 等国际同类产品数据集,能提供地表高精度逐小时土壤湿度平均值。因此,本试验最终筛选出了8 期数据集用于模型训练和验证。值得注意的是,虽然CLDAS-V2.0 产品空间分辨率在同类产品中已经最高,但相对于本试验选取的S1/S2卫星影像数据源仍有较大差距。一般情况下,此类空间尺度差异会导致训练集中的标签值存在代表性误差,影响模型训练精度。但是,本研究获取了研究区域的大量时序数据,能够提供足够多的真实变化样本,从而削弱土壤湿度标签值与S1/S2 影像间因空间尺度差异造成的影响。作为数据预处理过程,首先对S1A 影像进行地形校正和辐射定标,并对S2A 数据进行大气校正和辐射定标。为了消除变量之间的量级差异,最后对获取的5 个原始变量归一化处理将原始变量值映射到0~1,如式(5)所示
表1 试验数据 Table 1 Experimental data
输入变量与土壤湿度之间存在相关性是CNN 能够训练成功的前提。本质上,主动微波遥感反演土壤湿度依赖于土壤含水率与雷达后向散射强度之间具有强相关性的物理机制。 植被和土壤粗糙度影响着雷达后向散射强度,针对其对后向散射强度的贡献做精确的量化,是获得高精度反演结果的关键问题。由于估算植被影响的植被指数均由红光和近红外波段组合而成,而多极化SAR能提供土壤粗糙度信息,同时考虑到雷达入射角与估算土壤粗糙度的去极化比值以及植被的生物量存在着一定的相关性[24-26]。因此,本研究从训练数据集中随机抽取了3 000 组数据进行统计分析,分别统计了土壤含水率与5 个输入变量之间的相关性,其结果如图3 所示。从箱型图中可知,除入射角外,其余影响因子的数据分布与土壤湿度之间几乎不存在相关性,但中位数和平均数与土壤湿度之间存在一定的正相关。随着植被覆盖复杂度和土壤粗糙度的提升(如本研究区,就具有较大的植被覆盖复杂度和土壤粗糙度),随着入射角的增加由植被和土壤粗糙度引起的多次散射部分会逐渐增强,此时植被和土壤粗糙度所贡献的后向散射分量增强且占主导,因此,统计显示入射角与含水量之间呈现为正向相关性。
统计结果有力证实了土壤湿度是受多变量的共同影响,若仅依靠单一输入变量无法有效反演土壤湿度。因此,更需要利用各种原始影响因子协同参与反演,以提高反演精度和反演模型鲁棒性。
图3 输入层变量与土壤湿度的相关性分析 Fig. 3 Correlation analysis between input layer variables and soil moisture
试验选择2018 年6 月26 日数据为模型预测数据集,其余7 期数据为训练集。考虑到CNN 对训练样本类别不平衡问题极为敏感,本研究使用下采样方法对训练数据集中的冗余样本做进一步剔除。模型中卷积层和全连接层采用ReLU 激活函数,输出层采用Softmax 激活函数。优化器采用Adam 自适应调整学习率,神经元权重和偏值项均进行初始化。为了防止过拟合,在卷积层和全连接层还分别采用了L1 和L2 正则化。从训练集中随机抽取5 000 个样本评定每轮训练的精度,进行了3 000 次迭代计算,其训练过程如图4 所示。
由图4 可以看出,随着迭代次数增加,残余损失值和训练精度快速收敛,迭代500 次后收敛速度减缓,其中训练精度有小幅度波动,整体趋于缓慢上升。由此可知,本研究使用的改进CNN 方法能使训练精度和损失值下降速率快速收敛,从而证实了本反演方法是可行的。
使用训练后的模型对预测样本进行预测,检验反演方法的实际精度和鲁棒性,其结果如图5 所示。研究区域中右边缺失部分主要由S2A 影像未覆盖导致。由图5a 和图 5b 可知,模型预测结果与真值在整个研究区域一致性较高,在较干旱和湿润区域均能高精度的反演出结果。根据图5c 进一步分析反演结果误差空间分布,其偏差范围主要为―6.3%~5.1%,误差较小。同时,趋向于最大正偏差和负偏差的部分有明显集中分布现象,误差较小的大部分区域偏差趋向于正值,造成这一现象的部分原因可能是城市群和零星的建筑物影响,即仍然有部分高噪声样本参与模型训练,对于负偏差区域,可能是高密植被和残余的水体噪声样本等因素造成的。结合误差统计图可以看出(图 6),偏差整体服从均值趋近于0 的正态分布,RMSE值为1.45%,虽然其误差平均数不为0,但其值小于反演结果分辨率,可以认为反演结果误差整体上是一个随机偏差。
图4 模型训练过程 Fig. 4 Model training process
图6 误差统计 Fig. 6 Error statistics
表2 列出了本研究方法与近年来传统ANN 反演方法的精度对比情况,忽略各研究区域间的具体地物的差异后纵向比较可知,由于干旱区和半干旱区总体上植被类型单一且覆盖稀疏,故相对于Hajj 等[17]和Bao 等[19]提出的模型,Paloscia 等[16]和Hachani 等[18]所采用的方法更为适用。其中,Hachani 等[18]提出的方法在研究区域大小、均方根误差指标上均优于已有的其他反演方法。此外,由于研究区为较湿润的地中海气候,地表覆盖情况相对复杂,使得Hajj 等[17]和Bao 等[19]方法的反演结果误差分布范围和RMSE 值较大,反演模型鲁棒性不高。尤其值得说明的是,本研究提出的ICNN 方法所适用的研究区域远大于其他方法,同时与Bao 等[19]方法相比相关系数提升了0.23。尽管在广域测算试验中,其误差分布略高于Paloscia 等[16]和Hachani 等[18]的方法,但仍远低于Hajj等[17]和Bao 等[19]方法的水平。最为重要的是,本研究提出的ICNN 方法反演结果的RMSE 值仅为1.45%,为诸方法中最优。
表2 试验结果精度对比 Table 2 Precision comparison of experimental results
精确的量化植被和土壤粗糙度对后向散射强度的贡献是获得高精度反演结果的关键问题。据此,本研究充分考虑了现有的估算上述误差影响的算法和模型的构成特点。利用改进的卷积神经网络(ICNN)对相应的原始变量通过不同尺寸的卷积核进行卷积运算,自适应提取反映测区土壤湿度时空差异的高级特征维,以此实现在广域土壤湿度反演中尽可能的提取和消除植被和土壤粗糙度影响。
随着研究区域范围的增大,特别是在非干旱区,植被和土壤粗糙度的影响时空分布不确定性增加,无法对其建立有效的关系模型。本研究提出的方法能自适应提取反映测区土壤湿度时空差异的高级特征维。因此,相对于其他方法,模型不仅能适应植被类型单一、覆盖度较小的干旱和半干旱区,也能在大面积的非干旱区具有较高的适用性和鲁棒性,其实用性更为广泛。在大量训练样本支持下,在气候较湿润且地势较为平坦的平原、丘陵等广域应用中,将有良好的表现。
此外,对于地形起伏较大的山区,由于地形原因使得雷达影像存在叠掩、透视、收缩现象,造成提取的靶区像元后向散射系数失真,无法获得足够多的真实训练样本。因此,该模型不能直接迁移到山区进行土壤湿度反演,使用时必须考虑并消除地形因素的影响。
值得说明的是,虽然SAR 影像不受云雾的影响,但是本模型使用的红光和近红外波段对环境因素较为敏感,特别是在山区云雾等现象十分普遍,因此,在山区使用本研究方法还受限于多光谱数据的完备性。
为提升主动微波遥感技术在广域土壤湿度反演应用中的模型泛化能力,本研究提出一种改进的卷积神经网络(Improved Convolutional Neural Network,ICNN)实施土壤湿度反演的方法。选取了位于四川盆地中部的研究区开展试验验证,研究区域边长超过100 km,利用8期4—7 月无云和少云的原始S1A 多极化SAR 和S2A 多光谱影像作为模型输入数据源,并以中国气象局“CLDAS-V2.0 土壤含水率分析产品”作为模型训练的标签和模型验证时的真值,将其中7 期作为训练集,1 期为验证集。试验结果表明,ICNN 训练精度和损失值在迭代500 次后就能快速收敛,反演精度和可靠性较高;在较干旱和较湿润区域(土壤含水率范围为15.6%~47.7%)均获得了较好的反演结果,因此该方法对土壤含水率范围没有明确的限制性要求。与近年来传统ANN 反演方法纵向对比发现,ICNN 方法的相关系数显著提高至0.934,均方根误差仅为1.45%,为诸方法中最优。
理论上ICNN 方法能适应0°~90°的SAR 入射角范围,同时对SAR 影像的波段范围也没有特别要求,这使得卫星影像的利用率更高,在广域土壤湿度反演中具有独特的优势。此外,本研究提出的方法不需要单独估算植被和土壤粗糙度影响,也无需采集实测参数,避免了估算植被和土壤粗糙度影响过程中产生的误差。
综上所述,与已有的模型和土壤湿度反演方法相比,该方法在可靠性和面向广域应用的普适性方面具有一定的优势,在精准农业、旱涝灾害等领域的广域监测中具有较好的应用潜力,并可为相关研究提供一定的支撑。