基于遥感技术的土壤质地空间预测方法研究进展

2023-05-11 22:14汪甜甜丁琪洵梅帅汤萌萌江文娟王强马友华
农业资源与环境学报 2023年6期
关键词:土壤质地光谱精度

汪甜甜,丁琪洵,梅帅,汤萌萌,江文娟,王强,马友华

(安徽农业大学资源与环境学院 农田生态保育与污染防控安徽省重点实验室,合肥 230036)

土壤具有支持和促进作物生长的潜力,是动植物赖以生存的物质基础。土壤质地是土壤稳定的物理和自然属性之一,与土壤的通气透水性和保水保肥性紧密相关[1]。土壤质地显著影响土壤细菌群落结构和多样性,从而影响土壤肥力[2],在耕地质量及作物适宜性评价等领域是十分重要的判定指标[3]。通过对土壤质地的空间分布进行预测和制图,不仅能丰富和完善土壤数字化数据库,还能为土壤属性空间分布研究、水分循环模拟和农业生产规划等提供依据和数据支持[4]。

目前,田间采样是获取土壤质地数据最精确的方法[5],但通过该方法获取大尺度上的土壤质地类型空间分布数据非常困难[6],需耗费大量人力和物力。遥感技术具有支持大面积快速获取田间数据和信息的优势,已经成为精准农业中最重要的监测手段之一,近年来已广泛应用在农田土壤属性空间预测研究中。

国内外很多研究基于遥感技术对区域内土壤质地空间分布特征进行了预测,从方法学的角度来分析,这些预测方法和模型大致可分为两大类:一是基于遥感图像处理和计算机视觉的土壤质地空间预测方法,包括传统的图像处理算法和方法,主要运用不同的特征,如光谱、纹理和颗粒粒径或含量,通过统计或插值分析来预测质地分布;二是基于机器学习和深度学习的土壤质地分类方法,如卷积神经网络(Convolutional Neural Networks,CNN),实现了准确的预测结果[7]。然而,不同预测方法和模型的选择需要考虑数据源、区域尺度、环境变量等因素,不同模型之间的精度并不相同。本文综述了国内外基于遥感技术的土壤质地空间分布预测研究进展,从辅助数据、预测方法和模型、应用条件和精度等方面出发,通过分析应用实例与预测效果,对比得到不同方法和模型的优缺点及适用范围,总结了不同尺度下遥感对土壤质地及环境变量的监测作用与精度验证方法,以期为开展不同区域尺度下土壤质地空间分布预测研究提供一定的参考与借鉴。

1 土壤质地遥感预测的辅助数据

1.1 雷达数据

雷达在白天和黑夜均能探测远距离的目标,且不受天气影响,具有全天候、全天时的特点,并有一定的穿透能力,通过雷达开展土壤质地的探测,可以充分降低传统方法的成本和时间,高精度传感器对土壤质地的探测效果则更优[8]。夏银行等[9]的研究指出,在合理选择探地雷达(Ground Penetrating Radar,GPR)频率的情况下可以探测出土壤不同颗粒的大小,确定土壤质地。Pittman等[10]结合激光雷达(LiDAR)提取冠层高度模型(CHM)和林隙率作为协变量,采用随机森林(Random Forest,RF)和支持向量法(Support Vector Machine,SVM)模型进行土壤质地分类,并与其他环境预测因子结合,提高了土壤质地模型的精度。Bousbih等[11]将Sentinel-1、Sentinel-2 数据的卫星湿度产品用作土壤质地的指标,基于SVM 和RF 模型的黏土含量分类和映射算法,对突尼斯中部的半干旱区土壤质地进行了估算和制图。

雷达数据可以不受天气条件和植被覆盖等约束,高精度地获取地面土壤质地特征,但雷达信号峰值的确定有赖于合适算法的选择,同时也会受到地表水分和土壤粗糙度的影响。目前基于雷达数据还难以直接探测细质土壤的粒径大小,需要借助一些环境变量作为辅助判断指标,且探测范围有限,但随着高频信号的获取和雷达数据处理技术的发展,运用雷达技术准确探测土壤质地空间分布将成为可能。

1.2 地形因子

地形作为土壤五大成土因素之一,通过影响水热分布与地表能量再分配来影响土壤物理性质,因此地形的起伏与土壤质地的变化紧密相关[12]。不少学者通过摄影测量、机载激光扫描等遥感手段获取数字高程模型(Digital Elevation Model,DEM)数据,进行高程、坡度、地形湿度指数等地形要素数据的提取,进而作为辅助变量来预测土壤质地的空间分布。Wu等[13]对西南地区土壤质地的分类研究发现,高程、低地地形分类指数和流道长度是影响研究区土壤质地等级变化最重要的地形指标。Li 等[14]通过预测丘陵区土壤质地空间分布,发现对于坡地,地形湿度指数对质地分布影响最大,而对于梯地,海拔影响最大。研究表明,海拔与土壤颗粒(如黏粒、砂粒)含量可能存在正相关或者负相关[15-17],需要结合研究尺度与其他辅助变量的重要性来具体分析,如在高海拔地区,不同成土母质(岩石风化物、坡积物、河流冲积物、湖积物等)对土壤质地的影响更显著。对于尺度和地貌类型不同的研究区而言,不同地形因子对土壤质地空间预测的贡献度不尽相同,可以将其分为基础地形指数、水文分析指数和复合地形形态指数,进一步分析地形因子之间的多元共线性及其与土壤质地的相关性,筛选出土壤质地预测的最佳辅助变量。

1.3 植被指数

土壤质地是影响植被分布的主要环境驱动因素[18],利用遥感近红外波段和红波段计算归一化差异植被指数(Normalized Difference Vegetation Index,NDVI),将其作为辅助变量能够有效提高土壤质地遥感预测精度[19]。Césarda 等[20]基于Landsat-5 数据对半干旱区进行了土壤质地分类预测研究,结果表明B2、B5、B3/B7 和NDVI 数据可以解释土壤质地的大部分空间变异。Wu 等[21]利用NDVI、地形和成土母质数据进行土壤质地的识别研究,发现对于黏土和砂土,加入NDVI数据明显提高了识别精度。植被指数还包括比值植被指数(Ratio Vegetation Index,RVI)、差值植被指数(Difference Environmental Vegetation Index,DVI)、增强型植被指数(Enhanced Vegetation Index,EVI)等,为了更好地描述土壤质地与植被系统,通常会通过土壤调节系数对上述植被指数进行修正,得到土壤调节植被指数(Soil-adjusted Vegetation Index,SAVI)[22]。此外,土壤水分变化可能对不同质地土壤中有机质积累产生不同的影响[23],进而反映在遥感光谱特征信息上,借助土壤传递函数及特定分析模型可以预测其变化关系[24]。因此,土壤水分也能够间接反映土壤质地的变化特征,利用光谱信息能够准确获取指标数据,有利于加深土壤质地空间预测研究。

2 基于遥感特征的土壤质地预测方法

2.1 光谱响应法

光谱响应法是指利用土壤颗粒含量和粒径大小与遥感影像光谱反射率的关系建立模型或进一步分析来预测土壤质地。土壤光谱反射率与土壤理化性质(如土壤粒径等)密切相关[25]。曾远文等[26]通过对土壤粒径的光谱响应特性进行研究,发现在光谱特定波段范围内,土壤粒径大小和光谱反射率响应参数呈负相关关系。曾庆猛等[27]采用3种光谱方法以及3个不同谱区,发现光谱的斜率及截距等参数能够准确反映出土壤质地等土壤物理信息。

在地形平缓地区,地形与植被等环境因素与土壤属性的协同程度较低时,光谱响应能发挥极大的优势。王德彩等[28]利用Vis-NIR 光谱代替实验室方法,建立土壤砂粒、粉砂粒、黏粒含量的预测模型。刘峰等[29]利用多个波段和多个时相建立“光谱-时间响应线”,通过光谱信息散度定量反映光谱差异,有效地揭示土壤质地的分布差异。然而,光谱反射率同时也易受到土壤中其他物质的影响。王德彩等[30]在研究土壤含水量对土壤质地的影响时发现,当土壤建模样本与验证样本水分含量的差异逐渐增大时,土壤质地分析精度明显降低。史惠兰等[31]分析了高寒草地土壤质地差异与土壤养分的空间分异特征,通过光谱信息测定发现表层土壤中的黏粒含量与碳氮比之间具有显著正相关关系。Blaschek 等[32]研究发现,通过统计分析漫反射光谱的形状和强度的差异,能够间接反映土壤水分与黏土含量、黏土矿物和土壤有机碳含量的关系。

利用光谱响应可以快速、可靠地识别土壤质地,目前国内外应用近红外(NIRS)和中红外光谱(MIRS)分析土壤质地的研究居多,但不能忽略影响光谱反射率的其他土壤因素,如土壤水分、土壤养分等,当土壤水分或有机质含量较高时,如何应用高光谱遥感反演土壤质地还有待研究。

2.2 特征波长选择法

蚁群算法(Ant Colony Algorithm,ACA)用于选择和优化遥感光谱特征波长,近年来在土壤质地方面应用较为广泛。ACA 最早于20 世纪90 年代由意大利学者Colorni等[33]提出,这是一种分布式并行群体智能算法,它能够模拟蚁群觅食的行为,即蚂蚁走过留下信息素,以此吸引更多蚂蚁带来更多信息素。根据这种正反馈路径上信息素的变化,寻求最优特征波长变量,最终达到优化土壤光谱预测模型精度的目的。邓浩然等[34]运用ACA选择特征波长,结合BP神经网络模型大幅提高了土壤质地高光谱预测精度。ACA 经过优化后,可以更好地用在土壤质地的预测研究中。张小鸣等[35]采用变量有效性精英蚁群算法(EAS)选择优化后特征波长建立回归模型,发现精度明显优于普通蚁群算法。Ding等[36]提出了一种基于限制性多态蚁群算法(RPACA)的波段选择算法(RPACA-BS),分类精度高于基于蚁群算法的波段选择算法(ACA-BS),能够大幅降低高光谱图像的维数。有研究发现,数学变换结合微分技术有利于提高光谱敏感程度,能够消除由土壤表面散射带来的影响,因而对土壤颗粒含量的解释效果相对较好[37];另外,基于拉曼光谱以及显微图像,采用多项式拟合与XGBoost 算法能够更好地优化光谱谱线,实现对土壤质地的快速判定[38]。综上,通过选择和优化光谱特征波长,可以获取土壤质地的最佳响应波段范围,进而获得高精度的预测模型。

2.3 遥感解译法

监督分类法是遥感解译的常用方法之一,该方法需要选择具有典型性的训练样本,建立计算机系统能够自动识别的像元模板。当样本之间的差异较小时,监督分类比非监督分类的精度更高。

柏军华[39]指出利用Landsat-5 的第5 波段进行土壤质地分类效果最佳,根据波段反射率特征对大面积裸土土壤质地进行遥感解译,总体分类精度达到88.6%,Kappa 系数为0.82(Kappa 系数的计算基于混淆矩阵,结果区间通常在0~1 之间,0.81~1 表示模型预测结果和实际分类结果几乎完全一致)。王琼[40]利用Landsat-5 TM数据完成监督分类后,将研究区的土壤按照黏粒含量分为砂土、砂壤土、壤土、黏土,使用重新选取的土壤质地采样点作为感兴趣区(Region of Interest,ROI)进行验证,得到Kappa 系数为0.86。艾力克木·卡德尔等[41]以Landsat 遥感影像为数据源,采用贝叶斯网络算法进行监督分类,通过具体分类结果获取土壤属性情况,取得了较好的效果。刘炜[42]利用多特征知识建立土地利用/覆被类型的目视解译方法,识别出研究区砂壤等地类信息。遥感图像纹理特征的融合能够进一步提高分类精度,确定土壤类型与土壤质地的分布情况[43]。

通过高分辨率遥感技术对土壤质地空间分布进行预测,虽然结果分布图的空间分辨率高、空间拓扑关系强,同时节省了人力物力,但其只适用于土壤大面积完全自然裸露的区域,对光谱特性较相似的质地土壤解译能力较弱且精度有限。因此,近年来监督分类法在质地空间分布预测上的应用进展不大。

3 土壤质地空间预测模型

3.1 统计学模型

3.1.1 多元线性回归

多元线性回归(Multiple Linear Regression,MLR)是经典统计学的一种方法,MLR 模型易于计算和解释,将可量化的环境因素与土壤属性之间的关系作为土壤属性空间分布预测的基础。张国平等[44]、钟鑫等[45]、杨煜岑等[46]采用MLR 模型,结合地形指标及其他土壤因子构成数据集,准确实现土壤质地等土壤属性的空间分布预测。梳理大量的研究成果发现,众多学者将MLR 模型应用于小尺度下的土壤属性空间预测,此外该模型要求土壤属性数据符合正态分布特征,但在实际研究分析中常常难以满足这一条件,因此应用不够广泛。

3.1.2 多元逐步回归

多元逐步回归(Multiple Stepwise Regression,MSR)是在回归分析的基础上,逐一将自变量引入模型进行检验,每次均保留系数显著水平最高的变量,剔除不显著相关的变量,以此建立“最佳”的回归模型。张娜等[47]利用MSR 建立遥感波段反射率与土壤粉砂粒及砂粒含量的反演模型,并利用估测数据快速确定了区域内土壤质地分布情况,发现其预测精度高于MLR 模型。孙孝林等[48]利用MSR 方法构建了皖南宣城丘陵研究区地形指数与土壤质地等土壤属性间的预测模型,取得了较高精度。裴忠雪等[49]利用大量土壤样本,运用MSR 模型证实了土壤孔隙度与土壤有机碳(Soil Organic Carbon,SOC)和全氮(Total Nitrogen,TN)具有紧密关系,可以通过辅助指标来间接反映土壤质地。MSR模型的关键在于回归变量的选取,该模型克服了MLR模型中自变量之间相互干扰、影响回归效果等缺点,但其需要较大的样本量(不宜少于200个)来提取变量之间的线性关系,否则存在参数估计的有偏性。而对于某些区域,土壤质地等属性与环境变量不一定呈现简单的线性关系,因此MSR模型并不适用。

3.1.3 偏最小二乘回归

偏最小二乘回归(Partial Least Squares Regression,PLSR)是建立在自变量和因变量矩阵基础上的双线性模型。王德彩等[50]引入了正交信号校正(Orthogonal Signal Correction,OSC)光谱预处理算法建立PLSR 模型,提高了Vis-NIR 光谱土壤质地预测精度。此外,王德彩等[30]还运用PLSR 建立了多组不同土壤水分状态下土壤质地光谱分析模型,通过模型交叉验证,对比探究了含水量对土壤质地光谱预测的影响。乔天等[51]研究发现遗传算法结合PLSR(GA-PLSR)运用于土壤质地高光谱估测,能够有效地提高模型预测精度。曹振等[52]的研究表明基于Landsat-8 数据,利用PLSR建立的模型对耕地土壤颜色的预测分类效果更优。Alomar 等[53]通过研究证实,采用PLSR 线性多元技术可以提高Vis-NIR光谱仪对黏土和砂土的预测精度。大量研究表明,PLSR可以较好地解决各变量之间的多重共线性关系和样本数少于变量数等问题,能够保证提取变量与因变量之间的最大相关性,且易于与其他算法进行优化结合,有效地压缩了光谱数据,可以避免连续光谱建模时出现的过度拟合问题。

统计学回归模型在土壤质地空间分布预测中考虑了各变量之间的关系,同时需要一定数量的土壤样本来提取土壤质地与一些相关辅助变量之间的线性关系。模型需要满足严苛的适用条件,才能实现最佳线性无偏估计,因此在尺度较小、土壤样本数较多的区域内预测精度较高。通过统计学模型来研究土壤机械组成与高光谱影像反射率之间的关系,需要选择合适的遥感数据源,尽量减少土壤中其他物质对反射率的影响。

3.2 地统计学模型

3.2.1 协同克里格

克里格法(Krigings)是地统计学中应用最为广泛和典型的插值方法,包含多种类型,其中普通克里格(Ordinary Kriging,OK)和泛克里格法(Universal Kriging,UK)均忽略了土壤属性与环境要素之间的关系,而协同克里格(Co-Kriging,CK)则能避免此弊端,它能将土壤预测变量与环境辅助变量结合起来用于无偏最优估计[54]。王德彩等[55]通过引入光谱信息作为辅助变量,在减少主变量(土壤砂粒、黏粒含量)样本数量的情况下,运用CK 模型完成研究区土壤质地分布预测制图。虽然众多研究表明,CK 模型能利用辅助变量的空间交互特征,引入环境变量会提高土壤质地遥感预测精度,但当区域环境较为均一,或预测变量与辅助变量非高度相关时,CK 的预测效果不一定会优于OK和UK。

3.2.2 回归克里格

回归克里格(Regression Kriging,RK)将土壤属性与辅助变量之间的关系通过回归方程拟合,利用克里格法对回归残差进行插值预测,结合了常规统计学与地统计学优势[56]。Taylor等[57]认为,当研究选取较多的辅助变量时,RK 的预测精度要高于CK。申哲等[58]基于对称对数比转换,选用高程、土壤类型、NDVI等辅助变量,利用SLR-RK 模型对宁夏海原县表层土壤颗粒组成的空间分布特征进行预测,并验证了其精度。连纲等[59]将研究区地形因子和土地利用情况作为辅助变量,采用MLR 和RK 模型预测黄土高原县域土壤属性空间分布,结果表明RK可有效降低预测残差,预测精度要优于MLR。当研究区多个辅助变量对土壤质地等属性特征影响较密切时,RK能够更精确地拟合变量之间的关系,从而完成土壤质地空间分布预测。

3.2.3 经验贝叶斯克里格

经验贝叶斯克里格(Experience Bayes Kriging,EBK)是一种通过建立局部模型对非均质景观区域或非平稳数据进行空间预测的插值方法[60]。Samsonova等[60]研究俄罗斯布良斯克州土壤属性空间变化情况,结果表明,EBK 由于考虑了空间非均质性,对研究区土壤质地等理化性质的空间分布特征具有更好的预测效果。但目前将EBK 用于遥感预测土壤质地的研究应用较少,缺乏与其他地统计学方法的对比研究。申哲等[58]的研究表明,虽然EBK在一定程度上考虑了土壤颗粒组成的空间自相关性,但忽略了研究区内环境因子的交互影响,比如地形破碎不连续、南北地区气候差异大、水热不均等,故而EBK 模型对该地区的土壤颗粒组成预测精度并不高。

当辅助变量(地形因子、植被指数等)较多时,RK的预测精度高于CK;当局部空间规律变化较大且环境因素影响较小时,EBK模型可能更为适用。地统计学方法易操作且结果较为可靠,但地学现象具有复杂性和独特性,模型的适用度具有局限性。目前,地统计学模型在土壤属性空间分布预测方面的应用较多,但有时也需对土壤因子进行数据变换和检验以满足空间插值的要求,而遥感数据能够提供更加直接有效的环境变量。

3.3 机器学习模型

3.3.1 支持向量机

支持向量机(Support Vector Machine,SVM)是基于统计学理论提出的一种模式识别方法,适用于小样本的分类及回归分析,且能够避免传统方法带来的局部最优缺陷。Bousbih 等[11]基于Sentinel-1、Sentinel-2数据和SVM 模型,提出了基于SVM 的黏土含量分类和映射算法,并采用三重交叉方法进行了验证,SVM分类总体准确率为63%。石伟等[61]利用典型冻土区遥感、地形和气候数据等不同环境变量进行组合,通过SVM模型建立土壤-景观模型,很好地预测了该地区土壤类型分布。杨绍锷等[62]将土壤质地粒径、有机质等土壤属性作为输入参数项,构建SVM模型,实现了土壤水力学参数的预测,预测效果优于MSR模型。同时,采用线性SVM模型,利用Sentinel-2等多光谱遥感图像的时间序列数据进行土壤质地等固有物理属性分类也具有可行性,且远端结构类别(黏土和砂壤土)的分类比中间类别(砂壤土和砂壤土)的分类更准确[63]。

SVM 模型的预测精度较高,能有效解决变量间的非线性问题,具有与统计学模型耦合的潜力。在土壤属性空间分布预测的实际研究中,往往需要解决多分类问题,而SVM 模型基本只能对变量进行二分类,且涉及到矩阵计算,过程复杂,难以处理大批量的土壤训练样本,故该模型在土壤质地空间预测方面还存在局限性。

3.3.2 人工神经网络

人工神经网络(Artificial Neural Network,ANN)通过模拟人脑神经元网络对信息进行处理,对连续型变量和类别变量均有很好的预测效果。王德彩等[64]利用Vis-NIR 光谱数据,建立了土壤砂粒和黏粒的BP-ANN 模型,结果表明基于原始光谱主成分的BP-ANN 预测结果最好,精度优于MSR 模型,能实现对土壤质地的高效预测。孙艳俊等[65]利用改进的ANN 模型——径向基函数神经网络(Radial Basis Function Neural Network,RBFNN)建立了土壤颗粒组成与多个地形因子的映射模型,结果表明,RBFNN 能精确拟合土壤质地与各环境变量之间的非线性关系,具有较高的预测精度。Taghizadeh-Mehrjardi 等[66]将地形、气候、遥感和分类数据的环境协变量作为预测因子,构建了一系列基于生物启发的杂交ANN 模型,来预测土壤质地组分空间分布,研究表明混合神经网络方法远优于BP-ANN,其中黑金蝶算法(Monarch Butterfly Optimization,MBO-ANN)模型对黏土、粉砂土和砂土的预测均方根误差(Root Mean Square Error,RMSE)分别提高了20%、10%和24%。

ANN模型对土壤属性空间分布具有较好的预测效果,尤其在大尺度区域内表现良好,能够有效地利用遥感光谱特征,且模型易于仿生杂交,具有与光谱数据结合进行算法优化的潜力,但其属于黑箱模型,不易于解释,且计算过程繁琐,还可能出现过度拟合现象。

3.3.3 随机森林

传统的树模型往往存在精度不高、抗过拟合能力不强的问题。Breiman[67]基于Bagging 方法明确提出随机森林(Random Forest,RF)算法的概念,并通过实验证明了RF能有效地解决决策树模型中出现的过拟合问题,提高模型的泛化能力。Ließ 等[12]利用RF 模型对土壤质地进行了空间预测,得到了研究区具有砂土、粉土、黏土含量信息的土壤质地图。申哲等[58]基于RK、EBK、RF 3种预测模型对黄土区土壤颗粒组成空间分布进行研究,发现RF 预测精度最高。Benedet等[68]利用便携式X 射线荧光光谱(pXRF),发现pXRF+RF 模型对砂粒、粉粒、黏粒含量的预测效果要优于pXRF+SVM 模型,通过pXRF 和可见近红外漫反射光谱(Vis-NIR DRS)数据可以分别或同时准确地预测土壤质地。

近年来,RF 在土壤属性空间分布预测方面的应用研究逐渐深入,在环境因素影响较大、变量间无明显线性关系的情况下,RF 的预测精度通常要高于统计学和地统计学模型,但同ANN 一样,RF 计算过程较为复杂,且属于黑箱模型,不易直观了解土壤属性与环境变量之间的定量关系。

3.3.4 深度学习

目前的深度学习(Deep Learning,DL)模型大多建立在神经网络之上,即可以通过反向传播对多层参数化的可微非线性模块进行训练。自动特征提取或直接从给定数据中学习是深度学习与机器学习的区别。CNN 是深度学习模型中较为常见和高效的一种方法,具有超强的图片特征提取能力。Azadnia 等[69]使用CNN 对20、40、60 cm 深度的土壤纹理图像进行分类,设计了基于CNN 模型的土壤质地预测软件的图形用户界面,结果表明CNN 方法能够快速准确地预测大规模农场土壤质地类型。Behrens 等[70]使用DL和RF 对土壤、地形数据建模,结果表明使用DL 建模产生了最准确的预测,平均比使用RF 建模精度提升4%~7%。Shanavas等[71]基于CNN和RF分类器高维光谱数据从图像中提取沙土和黏土百分比、植被指数等特征进行类型预测,取得了良好的效果。利用CNN在图像处理方面的独特性和高效性,通过ResNet50等架构训练模型,能够体现DL 在土壤团聚体分类方面的良好性能[72]。DL 模型不需要单独提取特征,甚至能够从智能手机中提取图像,生成特征图,此外DL能够提高跨季节预测和多时间尺度预测的能力[73],其局限性在于需要大规模的数据集、大量的内存、巨大的计算能力,比其他模型耗时更久。

虽然机器学习模型存在易过度拟合、不易解释等不足,但该类方法能够有效地解决土壤属性与环境变量之间的非线性问题,且在大范围区域内表现良好,对于训练样本具有自学习功能,已经逐渐成为土壤质地空间分布预测的主流方法。随着时间的推移,深度学习和机器学习模型在数据分析与建模方面的作用变得举重若轻,因为其可以通过大量的数据获得更好的结果。

4 土壤质地遥感预测应用与精度分析

土壤质地通常受到母质、气候、植被、地形和人为活动影响,采用遥感技术对土壤质地空间分布进行预测研究时,需要考虑不同研究尺度下遥感获取表层土壤质地和环境变量的效率与精度,以选择更加适用的预测模型。在小尺度区域下,地形起伏不明显,地形因子与土壤质地之间的关系较为简单,气候、植被等环境条件相对一致,可直接利用线性回归模型预测土壤质地空间分布[74]。小尺度下应尽可能地挖掘遥感高精度数据,如利用无人机(Unmanned Aerial Vehicle,UAV)搭载高光谱传感器获取更高分辨率、更多波段的地物遥感信息。Gu等[75]从UAV 高光谱和热图像中导出NDVI 和地表温度,使用梯形模型构建质地-温度-植被干燥指数(TTVDI),准确获取了土壤含水量。杨红艳等[76]通过UAV 搭载高光谱成像系统增强光谱差异,融合光谱特征、植被特征、地形特征和纹理特征等变量,利用UAV 高光谱低空遥感为土壤质地分类提供思路。利用UAV 影像高分辨率和卫星丰富的光谱信息的优势,也能提升土壤质地预测精度,如Zhu 等[77]研究发现UAV 纹理和Sentinel-2B 光谱数据的集成提高了土壤变量预测的准确性;此外利用UAV 高光谱可以对不同土壤质地组的光谱重采样,进而绘制特定区域内土壤质地分布图[78]。而在大尺度区域,受自然条件影响,经过风化、侵蚀、搬运和沉积等不同外力作用形成的成土母质对土壤质地影响较大,同时若地形错综复杂,气候、植被也会出现明显变化,土壤质地与各环境变量之间往往表现出非线性特征,此时利用遥感卫星进行大范围监测,并结合地统计学或机器学习模型预测土壤质地效果会更好。

总体来说,遥感对土壤质地和各环境变量的监测作用不容小觑。一方面,可以直接利用高通量光谱仪或传感器测定土壤不同颗粒光谱特征,建立训练集与验证集来预测土壤颗粒含量,如Thomas 等[79]指出在有机碳<5%、黏土含量<60%的典型农业土壤中,激光衍射分析(LDA)和中红外光谱(MIRS)分析可以廉价、快速、可靠地估测土壤质地,并且MIRS 对黏土含量的预测比LDA 的预测效果要好得多;Benedet 等[68]利用便携式X 射线荧光光谱法(pXRF)和可见近红外漫反射光谱法(VisNIR DRS)分别或串联使用,获取土壤样本光谱的特定吸收带,结合机器学习模型预测土壤质地,结果表明仅使用pXRF 数据的模型表现略优于单独使用Vis-NIR DRS 数据的模型。另一方面,可以借助遥感数据生成的环境协变量作为土壤形成因子,利用植被、地形和土壤湿度等相关指标间接反映土壤质地的变化情况,建立土壤质地预测模型。以往研究表明,茎叶类植物生长期对土壤质地更敏感[21],植被指数与土壤黏粒含量显著相关,植被生物量与土壤砂粒含量显著相关[22],土壤湿润度与水分变化能侧面反映土壤质地[80],因此以上环境协变量被广泛用于土壤质地遥感预测研究。例如:基于平原区作物植被长势信息预测土壤质地的分布特征[81];加入植被生物量提高了0~10 cm 土壤黏粒、粉砂粒和砂粒含量的预测精度[22];通过传感器测定土壤含水量,模拟土壤湿润宽度和深度,间接拟合土壤质地情况[80];结合激光雷达得到冠层高度和林隙分数作为拟合土壤质地模型的重要变量[10];结合Sentinel-1 和Sentinel-2卫星的SAR 和光学图像提取土壤湿度和粗糙度等土壤参数[11];机载激光扫描或无人机遥感获取高分辨率的地形数据[13];利用遥感影像提取多种植被指数与纹理特征等光学数据[22]。这些环境协变量的准确性对土壤质地遥感预测的精度至关重要。

在土壤质地遥感预测研究中,精度验证是关键一环。地面监测获取的土壤质地数据,可分为训练样本与验证样本,通过对比模型的预测值和实测的原始值,比较不同建模方法的预测精度。通常用于模型精度评价的指标包括总体精度、Kappa 系数、决定系数(R2)、均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)。Wu 等[13]将土壤质地样本按9∶1 比例随机分为训练集与验证集,用训练集构造分类器,用验证集评价模型的性能,得到SVM 模型总体精度和Kappa 系数分别为0.94、0.79;也有学者认为当样本数量少于500 时,按4∶1 的比例随机选取训练样本和验证样本是合理可行的[58,82]。从以往的研究可以看出,要准确预测土壤质地的空间分布,地面数据不可或缺,若直接利用土壤像元反射光谱的遥感方法获取土壤质地信息,应尽量选择植被稀疏的干旱和半干旱地区,或时间序列多光谱图像识别的裸露土壤地区;若借助遥感数据获取环境变量,在植被密集地区,可借助遥感植被指数和其他辅助变量(如地形、母质)实现土壤质地预测。Wu等[21]利用分类树在一对一、一对多和多对多3 种方案下对遥感影像识别土壤质地分类的有效性进行了评价,研究发现NDVI+地形和母质模型表现最好,总体精度和Kappa系数分别为0.98、0.92,茎叶类植物生长期的NDVI 是判别流域土壤质地类别的最佳时期。Zhou 等[19]利用多时相Sentinel-2 图像,对植被覆盖下的我国西南部的一处盆地进行土壤质地分类识别,结果表明结合Sentinel-2 数据和地形、母质的支持向量机分类精度最高,总体精度为0.84,Kappa 系数为0.76,海拔、母质和归一化差异水体指数(Normalized Difference Water Index,NDWI)是主要预测因子。众多研究表明,增加代表植被特征的协变量可以提高土壤质地预测精度,记录丰富的作物生长信息的多时相光学影像有助于识别土壤质地类别[83-84]。

5 展望

利用遥感光谱特征及相关辅助数据对土壤质地等属性进行空间分布预测,较传统田间调查方法节省大量成本。目前,在中小尺度区域土壤质地遥感预测方面,统计学模型和地统计学模型取得了较高的精度,今后结合高光谱遥感通过寻找敏感波段可以建立更精确的预测模型;在大尺度研究下机器学习模型则更具优势,且能很好地对离散型土壤属性进行预测,更好地训练土壤样本与辅助变量,但最佳预测模型的选择仍需要考虑研究区的空间尺度、数据特性和环境变量等因素。

(1)与其他土壤属性相比,土壤质地时效性更长,未来的挑战之一是在保证模型预测精度的情况下,减少地面实测数据,利用遥感手段合成多类型光谱反射率,深入提取各种遥感光谱特征(如红边波段),基于遥感高光谱数据开发一种快速方法来评估土壤颗粒组成情况及其潜在变化,这值得进一步研究和探索。

(2)雷达数据、地形因子、植被指数、土壤湿度等辅助数据的精度、质量会对模型的预测精度造成较大影响,目前相对廉价、易获取的小尺度下的辅助数据往往存在分辨率较低的问题,因此开发合适的降尺度方法、获取更高分辨率的遥感多时相光学影像与雷达等多源数据,获取遥感图像多尺度纹理信息作为辅助变量进行土壤质地数字制图,将是未来土壤质地空间预测研究的方向。

(3)机器学习模型相较其他模型表现出巨大的优越性,基于深度学习和机器学习的土壤质地分类方法减少了对空间模型和预处理方法的依赖。未来针对大规模遥感数据集,耦合统计学和机器学习模型机理,结合地理邻近性和光谱相似性,深入挖掘深度学习算法,将土壤物理过程模型与数据驱动机器学习的多功能性相结合,开发多算法混合模型在土壤质地遥感预测方面具有巨大的潜力。

猜你喜欢
土壤质地光谱精度
中国土壤质地分类系统的发展与建议修订方案
基于三维Saab变换的高光谱图像压缩方法
基于机器学习方法的宁夏南部土壤质地空间分布研究
基于MATLAB GUI的土壤质地类型自动识别系统
基于DSPIC33F微处理器的采集精度的提高
GPS/GLONASS/BDS组合PPP精度分析
星载近红外高光谱CO2遥感进展
改进的Goldschmidt双精度浮点除法器
苦味酸与牛血清蛋白相互作用的光谱研究
铽(Ⅲ)与PvdA作用的光谱研究