颜祥照,姚艳敏,张霄羽
(中国农业科学院农业资源与农业区划研究所/农业农村部农业遥感重点实验室,北京100081)
土壤有机质(Soil Organic Matter,SOM)是指以各种形态和状态存在于土壤中的各种含碳有机化合物,包括土壤中的动物、植物及微生物残体的不同分解与合成阶段的各种产物,具有提供作物养分、土壤保水保肥、土壤缓冲、促进土壤团粒结构形成等生物、化学和物理作用[1]。SOM含量是衡量土壤肥力高低的重要指标,其空间变异及制图是了解农田土壤肥力的空间分布格局、培肥地力、精准施肥的基础;同时,SOM也是耕地质量评价、土壤碳循环、土壤污染治理等研究的重要参数,因而,快速、准确地监测SOM含量及其空间分布特征对于农田合理使用与保护、保障粮食安全等方面具有重要意义。
遥感技术的发展为SOM预测和制图提供了有力的数据和技术支持。土壤有机质含量和组成对土壤反射率有着重大影响已为各国学者公认[2-4]。20世纪70年代,国内外学者尝试开展土壤光谱反射特性与SOM之间的相关性分析研究[3,5-6];20世纪80年代,学者开始利用多光谱遥感数据预测区域SOM含量和制图;20世纪90年代以来,随着各国非成像高光谱仪、成像高光谱遥感的技术发展,高光谱影像光谱波段数已从30多个增加到300多个,波段范围为0.4~12.7 μm,SOM遥感定量反演与制图研究有了新的突破,为进入实用化系统应用阶段提供了数据基础和技术支持。目前,利用遥感数据预测SOM含量与制图可以概括为多光谱遥感法、结合遥感数据的SOM预测性制图法和高光谱影像直接法。文章对SOM遥感制图研究进展进行综述,说明各方法的优点和局限性,重点对影响SOM高光谱影像制图精度因素进行了分析,提出SOM遥感制图需要解决的问题和展望。
多光谱遥感法主要是建立影像多光谱反射率或指数与SOM关系模型,进行SOM预测和制图,可以分为直接法和间接法。直接法是直接建立遥感影像波段地表反射率与地面样点实测SOM含量的关系模型,估算SOM含量与制图;间接法是利用植被指数等遥感光谱指标与地面实测点SOM构建模型,间接估算SOM含量与制图。
1.1.1 直接法
此方法的原理在于SOM含量不同,其光谱反射率不同,卫星传感器记录的光谱反射特征即可体现SOM含量的差异性。通过多光谱遥感影像光谱特征与实地样点SOM数据的模型构建,直接反演获得遥感监测区域的SOM空间分布格局。
多个学者在不同地域、不同尺度和多种土壤类型上运用多光谱遥感影像直接估算法进行了SOM空间格局研究。曾志远[7]利用Landsat 1陆地资源卫星多光谱图像,借助多元非线性回归方法,探测了土壤表层(0~20 cm)SOM含量,将SOM含量表示成卫星图像4,5,6,7这4个波段辐射值的函数,所得的回归方程在0.01水平上显著。Frazier等[8]利用TM数据1/4、3/4和5/4的波段比值对华盛顿州东部的Palouse地区休耕地进行SOM制图。Chen等[9]在美国南部乔治亚洲的Crisp县115 hm2的试验田,建立了表层SOM含量与航空像片红、绿、蓝波段的图像亮度值(DN值)的对数方程,预测SOM含量,指出高分辨率遥感影像能够简便、较准确地定量分析裸露地表SOM含量的空间变异性。李欣宇等[10]、张法升等[11]、刘焕军等[12]、Zaheer Ahmed等[13]分别基于Landsat 5多光谱遥感影像,结合地面采样数据,建立了研究区域表层SOM的遥感预测线性和非线性回归模型,分析了空间分布格局,为改进土壤理化参数遥感反演、土地质量评价以及土壤碳库估算等工作方法提供了理论与技术支持。王祥峰等[14]、王琼等[15]基于HJ-1卫星数据,采用多元线性回归法构建了SOM遥感监测模型,监测结果与地面SOM含量具有良好的线性关系,实现了SOM快速监测。陈思明等[16]基于Landsat 7中的TM1~TM5和TM7,采用线性波谱分离技术对研究区的TM影像像元进行分解和重建,构建SOM含量的反演模型和制图。王锐等[17]基于Landsat 8遥感影像,定量反演了重庆市江津区SOM含量和制图,结果表明第6波段反射率与SOM相关性最大为-0.840,以第4,5,6和7波段地表反射率建立的SOM含量多元回归反演模型结果较好。
遥感影像直接估算法实施过程简便,应用性较强,但该方法只能局限于裸露土壤的观测,植被覆盖影响SOM的直接遥感反演和制图效果;而且多光谱遥感图像波段少,光谱分辨率低,对SOM含量微观差异敏感性不高。因此,基于多光谱遥感影像进行SOM估算的应用前景有限。
1.1.2 间接法
卫星传感器无法直接获取植被冠层覆盖下的土壤理化性质信息,但是可以获取植被状态、生物量等指标,通过这些指标与SOM含量建立相关关系,可以间接获得遥感观测区域内SOM含量和制图。常用的植被指数有归一化植被指数(NDVI)、增强植被指数(EVI)、土壤调节植被指数(SAVI)、比值土壤指数(RSI)、归一化土壤指数(NDSI)等。
连钢等[18]借助Landsat 7 ETM遥感影像采用多元逐步回归法(SMLR)建立了SOM与SAVI关系模型,分析不同土地利用类型、不同地形条件下,SOM空间变异及分布特征,但SOM预测结果不理想。周涛等[19]基于1982—1999年8 km分辨率的月AVHRR NDVI数据集,结合反映生态系统碳循环动态变化的CASA模型及Van’t Hoff土壤呼吸模型,估算获得了8 km分辨率的全国土壤有机碳空间分布图,但制图精度不确定性较大。郭燕等[20]选择模拟GF-1数据的第1,4波段构建RSI和NDSI,采用偏最小二乘建模方法(PLSR)预测SOM,结果显示,模拟GF-1光谱也可以较好预测SOM和制图,但是模型的稳定性相对较差。
利用植被指数等指标间接估算土壤有机质含量与制图,具有省时、省力、费用低、应用性较强的特点。但是目前研究中SOM遥感预测结果和制图精度不高,需要在不同地域和尺度上进一步研究和验证,并且需要采取各种数学手段不断完善预测模型,以提高模型的普适性。
该方法以土壤—景观模型理论为基础,通过易于获得的植被、地形、气候等成土环境因素,采用统计学(如线性回归模型、决策树、神经网络、模糊聚类等)、地统计学等数学定量方法模拟土壤与成土环境因素之间的定量关系,推断难于测定的土壤属性值,并在空间上扩展,达到制图目的[21]。由于遥感技术发展,不同空间分辨率、光谱分辨率的遥感数据产品为SOM预测性制图提供了丰富的数据源,例如多光谱遥感指数数据(NDVI、湿度指数等)、高光谱遥感产品数据(地表温度、NDVI、叶面积指数等)、非成像高光谱反射率数据等。各国学者借助3S技术,充分利用多源遥感数据源,采用统计建模、辅助地统计学开展大区域范围的SOM预测性制图研究。
在采用统计建模方面,黄兴成等[22]以地形(DEM)、土地利用(矢量图)、植被指数(Landsat NDVI)为环境因子,分别采用多元线性回归模型(MLR)、SMLR和普通克里格方法得到SOM空间分布预测图,结果表明,SMLR法的预测结果精度最高,平均误差为0.167 g·kg-1、RMSE=3.65 g·kg-1、相关系数为0.697。周银等[23]以东北—华北平原为研究区,以MODIS遥感数据产品(昼夜陆地表面温度LST、净初级生产力NPP、蒸散发ET等)、土壤地面高光谱数据为预测因子,基于树形结构法构建SOM-环境预测因子模型进行SOM制图,预测结果精度RMSE=7.25、R2=0.69、RPD=1.53,制图结果与上世纪80年代第二次土壤普查SOM地图具有相似的分布规律。吴才武等[24]将MODIS第1波段反射率与土壤质地、土壤水分数据相结合,通过回归分析建立SOM预测模型和制图,预测结果能反映研究区SOM空间变异特征。Mojtaba Zeraatpisheh等[25]将DEM与ETM遥感数据产品(NDVI、RVI、PVI、SAVI和TM4反射率)作为环境变量,采用Cubist、随机森林(RF)、回归树等非线性模型和多元线性回归机器学习法,开展伊朗Borujenregion区域8.6万hm2的SOM预测和制图,结果显示RF预测和制图效果最好,R2=0.55,RMSE=38.32%。Hamza Keskin等[26]以土壤指标(土壤类型、颗粒大小、阳离子交换量CEC等19个因子)、地形指标(高程、坡度等10个因子)、生态区域(9个因子)、气候因素(降水、温度等5个因子)、土地利用(土地覆盖、土地利用等5个因子)、MODIS遥感数据(特征波段、NDVI、EVI、LAI、FPAR、NPP等16个因子)为环境变量,采用分类回归树(CaRT)、包回归树(BaRT)、增强回归树(BoRT)、RF、支持向量机(SVM)、PLSR、回归克里格(RK)、普通克里格(OK)等8种机器学习方法,开展了美国Florida州0~20 cm表层土壤有机碳预测和制图,结果表明模型估测精度顺序为 RF>SVM>BoRT>BaRT>PLSR>RK>CART>OK,计算获得了研究区域的总碳储量。Di Chen等[27]以气候(年均温、年降水量)、地形(高程、坡度等4个因子)、MODIS数据(1~7波段、NDVI、EVI、RVI、DVI、SAVI、NDWI等)为环境变量,采用CaRT、BaRT、RF、BoRT等4个机器学习方法,开展了2000—2017年湖北省的SOM预测和制图,结果表明,BoRT的SOM预测平均误差最低,SOM制图精度最好。
在采用地统计学方面,郭燕等[28]基于野外VIS-NIR高光谱测量,进行SOM与全波段和3种光谱指数(NDVI、差值指数和RSI)相关分析,并利用地统计方法和PLSR进行SOM建模预测与制图研究,结果表明,与实测SOM克里格预测误差相比,不同的指标均达到了较好的预测效果。刘艳芳等[29]以室内高光谱仪测量的土壤反射光谱为辅助变量,采用PLSR、OK、协同克里格以及RK分别构建土壤有机碳密度预测模型,结果显示,结合高光谱信息且同时考虑残差空间结构的OK模型表现优于其他模型,土壤光谱是土壤有机碳密度空间差值的理想辅助因子。Nastaran Pouladi等[30]在丹麦10 hm2农田,基于地形参数(14个)、土壤电导率、Sentinel-2遥感数据指数(DVI、NDVI、RVI、SAVI)、样点SOM数据,比较RF-kriging、Cubist-kriging、RK-kriging、Kriging 4种SOM制图方法,结果显示,基于Kriging的SOM制图方法最佳,R2=0.91,RMSE=2.27%。
遥感数据为土壤有机质预测性制图提供了丰富的植被、气候、土地利用等环境信息,目前仍是SOM制图的研究热点。结合遥感数据的土壤有机质预测性制图提高了传统土壤景观建模制图方法的精度,是大尺度范围或复杂地形地区SOM制图的有效方法。但由于SOM制图精度依赖于土壤发生环境信息的数据质量,反映SOM空间差异特征略显粗糙,尤其是小区域尺度的SOM空间分布差异特征反映不够精细化。
高光谱遥感光谱波段可达几十至上千,光谱分辨率较高,可以反映土壤表层属性细微差异。例如,我国GF-5高光谱卫星搭载的可见短波红外高光谱相机(AHSI)光谱范围为0.4~2.5 μm,可见光近红外(VNIR)光谱分辨率为5 nm,短波红外光谱分辨率为10 nm,共有330个光谱通道,为充分利用高光谱优势挖掘SOM预测和制图潜力提供了丰富的数据,利用高光谱遥感开展SOM预测与制图成为各国学者的研究热点。学者们进行了2个方面的研究:(1)基于便携式高光谱仪开展室内外SOM光谱理论与应用研究,采用不同统计建模方法估算SOM含量,并试图分析及解释其机理,为SOM制图提供理论依据;(2)实现真正的高光谱遥感制图,利用机载或星载高光谱数据开展SOM预测和制图。高光谱影像直接法是直接分析从机载或星载高光谱影像提取的可见光—近红外、中红外样点裸土光谱特征与SOM相关关系,建立反演模型,进行SOM预测和制图。
1.3.1 可见光—近红外机载高光谱SOM制图
在可见光—近红外机载高光谱SOM制图方面,Thomas Selige等[31]、Michael Vohland等[32]基于澳大利亚Hymap成像高光谱仪(128个波段,420~2 480 nm),获得了德国小区域的裸土农田光谱数据,分别构建了MLR和PLSR法的SOC(Soil Organic Carbon)高光谱反演模型,结果显示,MLR和PLSR都给出较高的SOM建模精度,并获得较好的SOM空间分布特征。Hively W Dean等[33]使用美国HyperSpecTIR成像高光谱仪(178个波段,400~2 450 nm)获取了美国Chesapeake Bay区域6块已耕作的裸地光谱数据,采用PLSR法构建了反射率一阶微分的SOM模型,模型验证精度R2=0.77,RMSE=0.3%,获得了较好的SOM空间分布图。Susana Fernández等[34]使用AHS传感器中VIS-NIR的63个波段进行了西班牙过火山区土壤总碳预测与制图,基于PLSR的SOM预测精度,制作了较好的土壤总碳分布图。Daniel Žížala等[35]使用加拿大CASI-1500(72个波段,380~1 050 nm)和SASI-600(100个波段,960~2 440 nm)获得捷克共和国4个区域的裸土高光谱影像数据,采用PLSR、支持向量机(SVM)、RF、人工神经网络(ANN)等构建SOC反演模型,结果显示,基于SVM的SOC高光谱模型验证精度最高,R2>0.8,RMSE<0.16%,获得了比较精细的SOC空间分布特征。Fabio Castaldi等[36]使用APEX高光谱成像仪(313个波段,400~2 500 nm)获得了比利时壤土耕地带和卢森堡Gutland—Oesling区域的高光谱影像,构建了基于PLSR的SOC反演模型,达到了较好的SOC预测和制图精度,RMSE<4.9 g·kg-1,RPD>1.4。
在国内,周萍等[37]利用国产航空成像光谱仪OMIS-1(128个波段,450~2 500 nm)数据,并结合ASD FieldSpec FR便携式光谱仪(350~2 500 nm)获取野外光谱数据,采用MLR模型建立研究区域农田SOM反演模型,验证精度R2=0.813 4,RMSE=0.379,实现了SOM填图。张东辉等[38]利用加拿大CASI-1500航空高光谱成像系统(72个波段,380~1 050 nm),基于神经网络模型(ANN)构建了黑龙江建三江地区黑土地SOM光谱反演模型并进行了制图,回归系数达到0.985,证明了这一方法在理论上的可靠性。汪大明等[39]利用加拿大CASI/SASI(100个波段,950~2 450 nm)航空高光谱数据,构建了黑龙江建三江PLSR回归SOM模型与制图,判定系数为0.885,RMSE为0.424,制图结果揭示了SOM分布的更多细节。
1.3.2 可见光—近红外星载高光谱SOM制图
在星载高光谱SOM制图方面,Raffaele Casa等[40]利用CHRIS-PROBA(37个波段,442~1 019 nm,空间分辨率17 m)获得意大利Maccarese两个裸土农田高光谱影像,基于PLSR建立SOM反演模型,模型验证精度不太理想,RPD<1.4,分析可能的原因是研究区域SOM含量<3.5%,SOM含量差异较小(1.76%~2.24%),光谱响应效果较低。Sina Mallah Nowkandeh等[41]使用地球观测卫星EO-1携带的高光谱传感器Hyperion影像(242个波段,357~2 567 nm,空间分辨率30 m),分别进行了伊朗Ivanekey和Uromia plain区域及澳大利亚农区的SMLR、PLSR、最小一乘回归(MinR)和主成分分析(PCR)的SOM高光谱预测和制图,结果显示,SMLR的SOM验证精度较高,R2=0.69,RMSE=0.18。Cécile Gomez等[42]基于Hyperion预测澳大利亚农区SOM,获得较好的预测和制图结果。荣媛等[43]基于Hyperion高光谱影像,采用MLR、最邻近法、装袋算法、多元感知器、RF等5种估测模型预测南京新济州湿地SOM和制图,结果显示,MLR模型预测精度最高,相关系数为0.766,RMSE=0.292。
1.3.3 中红外高光谱SOM预测和制图
学者研究显示,SOM在中红外光谱(2.5~25 μm)有明显的光谱特征[44]。McCarty等[45]比较了近红外和中红外波段估算土壤有机碳能力,认为中红外波段可以提供更好的SOC信息。Ladoni等[46]总结了前人估算SOM或SOC的研究成果,认为中红外波段估算精度较高,平均R2=0.89,而近红外波段平均R2=0.79,可见光波段平均R2=0.74。随着中红外高光谱传感器技术的发展,例如美国空间增强宽带阵列光谱仪系统(SEBASS,120个通道,2.5~13.5 μm)、加拿大Hypercam(2.5~15 μm)、芬兰AisaOWL(96个波段,7.6~12.4 μm,光谱分辨率100 nm,空间像元384)、TASI-600机载高光谱热成像系统(64个通道,8~11.5 μm,光谱分辨率55 nm,空间像元600)等光谱仪系统日益增加,基于中红外高光谱SOM预测和制图日益被学者关注,出现了少量的研究。
Andreas Eisele等[47]采用傅里叶红外变换光谱仪室内测量了土壤光谱,并光谱重采样为TASI-600的模拟数据,基于PLSR方法构建SOC反演模型,开展了SOC含量<1.5%的澳大利亚西部半干旱农业土地景观区SOC预测研究,结果显示,中红外波段SOC模型验证精度较高R2=0.90,RMSE=0.08%,并且如果将可见光—近红外—中红外光谱组合在一起,SOC预测精度大大提高R2=0.95,RMSE=0.04%,说明中红外具有预测SOC的应用潜力。Grinand C等[48]以16 km×16 km格网模式采集了法国0~20 cm表层2 086个典型土样,基于美国Nicolet 6 700漫反射傅里叶中红外反射光谱仪(DRFTS,2.5~25 nm)进行了SOC的PLSR建模预测和制图,结果显示,SOC模型预测精度较好,SOC制图趋势与实测SOC分布图相似。Pascucci S等[49]获取了意大利南部Pontecagnano地区裸土机载TASI-600高光谱热成像系统数据,基于PLSR和Cubist回归模型开展SOC预测和制图,并与实验室条件下采用傅里叶变换红外光谱(FT-IR)、可见光—近红外光谱仪的预测结果进行比较,结果显示,实验室条件下傅里叶变换红外光谱SOC预测效果(R2=0.95,RMSE=0.08,RPD=4.51)优于可见光—近红外,而TASI-600机载高光谱数据的SOC预测效果(R2=0.53,RMSE=0.26,RPD=1.46)低于室内傅里叶变换红外光谱,但该试验进一步说明中红外遥感数据具有较好地定量估算表层SOC的应用前景。
成像高光谱遥感有较高的光谱分辨率、连续的地物光谱信息,提高了SOM的探测能力,加强了小区域尺度SOM空间分布差异精细化表达,日益受到人们的关注。但因受到大气、地形、植被、地表粗糙度、土壤水分等因素影响,成像高光谱影像SOM估算精度低于室内光谱,真正实现SOM遥感的实际应用还需要大量研究。
通过分析影响成像高光谱SOM预测和制图精度原因,学者们认为SOM高光谱敏感波段优选以及适宜的SOM高光谱建模方法,是影响成像高光谱SOM预测和制图精度关键,因此,学者们开展了采用非成像和成像高光谱数据解决以上问题的研究。以下将从SOM光谱特征分析、光谱敏感波段确定、定量反演方法等方面进行论述。
土壤有机质在可见光和近红外区域有独特的光谱特性,表现在土壤反射率随着SOM含量的增加而下降,土壤反射光谱与SOM含量呈显著负相关关系[3-6]。徐彬彬等[50]发现SOM含量与可见光波段的反射率、0.62~0.66 μm、0.6 μm弓曲差等均呈高度负相关。Krishnan等[6]、Galvao等[51]研究表明,SOM含量决定其在土壤反射光谱中所起的作用,当SOM含量>2%时,其在描述土壤反射特性起主要作用;当SOM含量<2%时,SOM在遮蔽其他土壤组成物质的光谱特性(如铁锰的光谱特性)的能力有所减弱,研究SOM高光谱预测和制图时,需选择SOM含量大于2%的地区。
2.2.1 SOM光谱敏感波段位置
众多学者针对不同土壤类型,利用土壤反射光谱确定SOM最佳敏感波段的研究结论有所差异,确定的敏感波段范围可以划分为4种类型:可见光区[52-55]、近红外区[38,43,56]、可见光—近红外区[57-67]以及可见光—近红外—中红外区[16]。
刘焕军等[68]分析了黑龙江典型黑土区光谱特征,确定了580 nm、620 nm、630 nm、730 nm等可见光波段为敏感波段。郭燕等[28]分析了红壤土的光谱特征,认为973 nm、983 nm、988 nm、1 907 nm、1 917 nm、2 213 nm以及2 216 nm近红外区为SOM的敏感波段。Mathews等[69]发现可见—近红外波段(0.5~1.2 μm)反射率与SOM相关性较好。陈思明等[16]研究认为滨海湿地土壤在可见光—近红外—中红外区都有SOM敏感波段。
2.2.2 SOM光谱敏感波段确定方法
SOM光谱敏感波段与采用的选择方法有关,常用的方法主要包括相关性分析、主成分分析(PCA)等。相关性分析法是研究者采用最多的方法,用于分析SOM与光谱反射率之间的相关性,选择相关系数较高(显著)的波段作为敏感波段,用于建立SOM反演模型[28-29,43,52,57,59-61,70]。马丽等[71]、栾福明等[62]运用 PCA 法,确定了 SOM 光谱敏感波段主成分最佳因子数。
目前SOM高光谱建模方法主要分为两类,一类是线性统计模型法,另一类是非线性统计模型法。
2.3.1 线性统计模型法
线性统计模型法一般假设SOM与光谱特征呈线性关系,学者们多采用多元逐步回归(SMLR)[12]、多元线性回归(MLR)[37]、偏最小二乘回归(PLSR)[70-72]等方法构建SOM高光谱模型。王祥峰等[14]以HJ-1卫星数据为数据源,基于MLR方法构建了SOM反演模型。Susana Fernández等[34]基于PLSR法建立了SOM高光谱反演模型,其校正误差R2=0.970,RMSE=3.10,验证误差RMSE=5.85。史舟等[72]基于PLSR法建立了SOM光谱反演模型,取得了较好效果,R2和RPD分别为0.899和3.158。SOM线性模型的优点是,数据处理简单快速,基于模型的SOM制图速度也较快。但SOM与土壤光谱往往呈非线性关系,因此,该建模方法不能反映SOM与土壤光谱的非线性关系。
2.3.2 非线性统计模型法
SOM反演非线性模型主要包括人工神经网络(ANN)、RF、SVM等方法。ANN是一种模仿动物神经网络的数学模型,由输入层、隐含层、输出层构成,模拟任何输入变量和输出变量的非线性关系,在处理非线性问题上表现出较大优势。张东辉等[38]基于航空高光谱影像,采用ANN方法反演SOM和制图,回归系数达到了0.985,说明了所建神经网络模型的有效性;叶勤等[60]研究显示,BP神经网络模型的SOM反演精度较高,R2=0.893,RMSE=0.118 5%。王茵茵等[73]以陕西榆阳黄土丘陵和风沙滩地为研究对象,基于RF对表层SOM进行模拟预测,结果表明,SOM反演精度平均绝对误差在1.27~1.57 g·kg-1之间,RF算法对复杂地貌区的SOM预测更有效。齐雁冰等[74]基于MODIS遥感数据,采用RF建模方法进行陕西省SOM预测,SOM预测精度在设定的不同抽样百分比条件下,独立验证数据集的平均误差不超过3 g·kg-1,预测值与实测值的相关系数在0.7以上。SVM的处理过程可概括为升维和线性化,将非线性转化为线性,解决小样本情况下的机器学习问题。Viscarra等[54]基于SVM建立了SOC的高光谱反演模型,R2达到0.86。虽然非线性模型符合SOM和土壤光谱反射率的非线性关系,但非线性模型计算较复杂,有些SOM反演模型建模精度较高,但验证精度较低,会产生过拟合现象,同时,基于非线性模型的SOM制图速度相对较慢。
2.3.3 最优模型选择研究
线性和非线性统计模型都可以用于SOM高光谱建模,选择何种模型更优,学者们做了大量研究,结论各不相同[16,43,52,56,58-59,60-62,70]。Hamza Keskin 等[26]采用 CaRT、BaRT、BoRT、RF、SVM、PLSR、RK、OK等8种机器学习方法,开展了美国Florida州表层SOC预测和制图,结果表明RF模型精度最高,R2=0.72,RMSE=2.39 kg·m-2,RPD=1.88。袁征等[75]分别采用MLR、BPNN、模糊识别法建立高光谱SOM估测模型,研究结果表明,模糊识别模型的决定系数达到0.973,RMSE为0.046 8%,比MLR和BPNN模型精度都高。李胜男等[52]分别采用PLSR、MLR、SMLR法建立黑土区SOM反演模型,发现PLSR的SOM建模效果优于其他模型。
总结前人的研究成果,基于高光谱影像的直接土壤有机质预测和制图存在以下问题。
(1)目前机载和星载高光谱传感器较少,基于高光谱影像的SOM预测和制图研究更少,特别是基于我国GF-5高光谱卫星影像的研究还未见报道,需要探索研究基于GF-5高光谱卫星影像的SOM制图的可行性和潜力。
(2)SOM光谱敏感波段的位置和数量是影响SOM反演模型精度的关键,研究者们采用相关性分析、主成分分析等多种方法优选SOM光谱敏感波段。选择的方法不同,敏感波段位置和数量不同。采用哪种方法最合适,敏感波段选择多少,选择哪些敏感波段,还需要进一步研究。
(3)选择适宜的SOM光谱反演模型构建方法,也是另一个影响SOM光谱预测和制图精度的关键。研究者们较多基于非成像光谱数据,尝试采用线性、非线性模型或者多种建模方法组合,利用各自优势,相互取长补短,从而提升模型整体预测性能,建模方法的复杂度逐渐增强。然而,建模方法的组合不是任意搭配,需充分理解方法的原理及性能,确保形成优势互补。同时,复杂的模型虽能取得较好的预测效果,但对模型的可解释性变弱,SOM制图效率降低。另外,基于高光谱影像的SOM非线性建模研究较少。因此,选择哪些适宜的SOM光谱建模方法,或者创新建模方法和算法,也需要进一步研究。
遥感技术的快速发展和传感器的多样化,使得利用多源遥感数据的SOM预测和制图成为可能,提高了SOM制图的精度和有效性。高光谱遥感的光谱分辨率高,能够提供可见光—近红外—中红外波段的辐射信息,且连续的波段信息可以反映土壤表层属性的细微变化,为SOM预测和精细制图提供了丰富的光谱信息及空间覆盖范围,提高了SOM预测和制图精度。虽然高光谱传感器在获取地表土壤图像数据过程中,受到植被覆盖、土壤含水量、土壤表面粗糙度以及大气衰减和辐射校正的影响,也会影响到SOM预测和制图精度,但随着高质量高光谱影像数据改进技术的提高,以及加强SOM敏感波段优选和确定适宜的SOM高光谱模型方法等研究增强,基于高光谱影像开展SOM预测和精细制图可行性增大,具有更大的发展空间。
随着高光谱遥感技术的发展,SOM遥感预测和制图需要在以下几个方面开展深入研究。
(1)结合高光谱影像的土壤有机质预测性制图方法的改进。遥感数据为SOM预测性制图提供了丰富的地形、植被、气候、土地利用等环境信息,是大尺度范围或复杂地形地区SOM制图的有效方法。但对于地形变化不明显或土壤局部变异性较大区域,限制了其制图精度。高光谱遥感影像以较高的光谱分辨率区分出那些具有诊断性光谱特征的地表物质,将高光谱遥感影像参与SOM预测性制图,提高SOM预测精度和制图精细度,值得进一步探索。
(2)高光谱遥感SOM预测和制图直接方法的改进。由于适宜的SOM光谱敏感波段数量和位置以及建模方法是影响SOM高光谱反演模型精度的关键,这些问题有待进一步探索研究,提高小区域SOM高光谱预测和制图精度。
(3)中红外光谱土壤有机质预测与制图研究。研究发现中红外高光谱具有预测和SOM制图的潜力,尽管目前中红外高光谱传感器技术发展还不太成熟,但未来该领域的发展值得期待。
(4)基于深度学习的SOM预测和制图研究。深度学习由于擅长处理多源大量复杂数据,在物体检测、人脸识别、图像分类等方面优于传统的、成熟的方法,以其他方法不可比拟的优势为很多研究领域提供了新思路和新方法。深度学习是一种深层的机器学习模型,主要包括卷积神经网络模型(CNN)、循环神经网络(RNN)、深度置信网络(DBN)等[76]。在基于深度学习的SOM预测和制图研究方面,Alexandre M J-C Wadoux等[77]基于CNN方法,进行了澳大利亚Hunter valley area(220 km2)区域表层(0~10 cm)和亚表层(40~50 cm)土壤总碳制图,并与RF进行了比较研究,使用的数据包括2 388个土壤总碳样点数据(645个由室内化验分析法获得,923个由近红外光谱法获得,820个由中红外光谱法获得)、DEM、Landsat ETM第5波段和NDVI,结果显示,表层土壤总碳含量预测精度(R2=0.55,RMSE=0.93)高于RF法(R2=0.35,RMSE=1.08),该研究为SOM遥感预测和制图提供了新的研究思路。Alexandre M J-C Wadoux[78]还基于CNN,采用2万个表层(0~10 cm)SOC样点数据,结合地形、植被、气候、土壤等其他数据,开展了法国SOC制图,得到了较好的结果。因此,基于深度学习的SOM预测和制图研究,也值得进一步探索。