王婷 刘振华 彭一平 胡月明
摘要:为实现对土壤有机质含量的快速监测,在对土壤有机质含量作倒数变换的同时将土壤高光谱数据进行多种数据变换处理,筛选出与土壤有机质含量倒数变换后相关性最高的光谱指标,最后构建了土壤有机质含量高光谱反演的最佳模型,实现对土壤有机质含量的反演。结果表明:估算土壤有机质含量的最佳光谱指标为反射率一阶微分波段组合R(587,126*R(734,049)*R(1 095,892),相关系数为0.769;在此基础上构建的土壤有机质含量高光谱反演模型最佳(Y=5×1016x3-5×1010x2+59 471.000 0x+0.101 1),其决定系数R2为0.65,均方根误差(RMSE)为0.040 mg/kg。将其验证样本预测值与实测值进行比较,平均相对误差为27.00%,RMSE为4.19 mg/kg。该验证结果证明利用该模型進行华南地区土壤有机质含量的快速监测是可行的。
关键词:土壤有机质含量;高光谱;估测模型;华南地区
中图分类号:S127文献标识码:A文章编号:1000-4440(2020)02-0350-08
Abstract: In order to monitor soil organic matter content rapidly, the reciprocal transformation of soil organic matter content and a variety of data transformation processing on soil hyperspectral data were carried out. On this basis, the spectral index having the highest correlation with the content of soil organic matter after reciprocal transformation was selected to construct the best hyperspectral inversion model of soil organic matter content. The results indicated that the band combination R(587,126)×R(734,049)×R(1 095,892) was the best spectral index for estimating soil organic matter content, and the correlation coefficient was 0.769. The best hyperspectral inversion model constructed by the band combination was y = 5×1016x3 -5×1010x2+59 471.000 0x+0.101 1, with determination coefficient(R2) of 0.65 and root mean squared error (RMSE) of 0.040 mg/kg. In addition, the predicted value of the verified sample was compared with the measured value, the mean relative error (MRE) was 27.00%, and RMSE was 4.19 mg/kg. In conclusion, it is feasible to monitor the soil organic matter content in South China by using the model constructed in this study.
Key words:soil organic matter content;hyperspectrum;estimation model;South China
土壤有机质(Soil organic matter,SOM)是存在于土壤当中的含碳有机化合物总称[1],是保持土壤肥力、维持良好耕地质量的重要因素[2]。然而,快速扩张的城市化、工业化导致土壤有机质含量的变化更加明显。因此,借助现代技术快速监测土壤有机质含量显得尤为重要。
现有的获取土壤有机质含量的主要方式有2种:传统的实验室化学分析和光谱分析。传统的实验室化学分析方法是将采集的土壤样品进行制备,包括自然风干、去除杂质、压碎研磨以及过筛,再通过一些土壤有机质化学分析测定方法进行测定,例如油浴法、目视比色法、灼烧法、光度法、直接加热消解法、重铬酸钾容量法等,最后通过相应的公式来计算土壤有机质的含量[3-5]。传统的实验室化学分析方法具有较高的准确度,但在采样过程中在一定程度上会造成采样地点土壤的破坏和流失,且实验步骤繁琐,耗时费工,不便于快速、大范围地测定土壤有机质含量。
光谱分析方法是通过辨别物质的光谱差异来测定土壤有机质含量的方法。通过土壤光谱采集,分析土壤光谱与土壤有机质含量之间的相关关系,建立两者之间的线性或非线性模型,以此获取土壤有机质含量[6-10]。官晓等[6]以68组土壤样本的有机质含量和地面实测光谱数据为基础,对比了多元回归分析和模糊数学2种方法对土壤有机质含量预测分析的效果,结果表明基于模糊数学的方法具有更明显的优势,其相关系数为 89.3%,平均相对误差更小。Dhawale等[7]采用实测土壤有机质含量和相应的土壤反射率,建立了两者的最小二乘回归模型,均方根误差(RMSE)在0.76%到2.24%之间。这种方法可减少分析时间和成本,对土体的破坏性小,且具备较高的预测精度[11-13]。
有关光谱反演土壤有机质含量的研究中,模型的建立大多数以经验统计方法为主,且不同地区有不同的土壤类型和成分,最终建立的估算模型存在普适性差的问题。华南地区作为中国主要农业产区之一,目前还没有针对该地区构建的土壤有机质高光谱预测模型。因此,本研究通过Avafield地物高光谱仪实测获取的土壤光谱数据以及实验室化学分析获取的土壤有机质含量,构建亚热带典型区域广东省的土壤有机质高光谱估算模型,研究利用高光谱技术估测土壤有机质含量的可行性。
1材料与方法
1.1研究区概况
广东省处于20°09′~25°31′N和109°45′~117°20′E,亚热带季风气候,地势北高南低,主要土壤类型为红壤、赤红壤和砖红壤(图1)。耕地主要农作物有:水稻、玉米、花生及其他作物。近年来城市化和工业化建设对全省耕地有机质整体水平产生了不利影响[14]。
1.2数据来源及预处理
1.2.1土壤样本采集及处理本研究采集的75个土壤样点分布在广东省各地级市(图1),土壤类型以赤红壤、红壤、砖红壤和水稻土为主,样点的采集时间为2017年5月。采集过程中进行GPS精确定位,土层深度为0~20 cm, 质量约300 g。采集的土壤样本自然风干,剔除砂砾及动植物残体等杂质,碾磨并过筛(0.2 mm)。每个样本分成2份,分别进行土壤有机质含量的化学分析和土壤光谱反射率的测量。
每个样点分别称取土壤0.2 g,用H2SO4-HNO3-KMnO4法消解后,采用重铬酸钾容量法-外加热法进行土壤有机质含量的化学分析。所有土样的有机质含量测定结果为:最大值61.11 mg/kg,最小值5.58 mg/kg,平均值29.79 mg/kg,标准差11.59 mg/kg,变异系数38.90%。表明研究区域的土壤有机质含量为中等变异性。为了保证模型建立和验证的合理性,将75个样本按有机质含量从小到大排序,每隔4个样本抽取1个样本,一共15个样本用于验证,其他60个样本则用于建立模型。验证样本和建模样本的分布如图1所示。
1.2.2土壤光谱反射率测定及处理土壤样本的光谱反射率测定采用AvaField便携式光谱仪(荷兰Avantes公司产品),其覆盖的波段范围为340.316~2 511.179 nm,采样间隔为0.6 nm。测定土样光谱前利用标准白板和黑板对AvaField便携式光谱仪进行定标和调整。采集光谱时,为了减少外界环境的影响,将土样放置在一个黑夹子里,用50 W卤素灯作为测定光源,通过光纤连接视场角为10°的探头垂直接触来进行光谱反射率测定。在采集土壤光谱反射率时,每个土样测定5次,每次自动采集10条数据。样本的原始光谱反射率是利用AvaReader软件将异常曲线去除后的光谱反射率算数平均值。
1.3高光谱模型建立与验证
1.3.1光谱数据分析采用Savitzky-Golay平滑方法对实验室采集的光谱数据进行平滑处理以降低噪声的影响。从图2可见,采集的土壤光谱曲线变化趋势大致相同,总体呈现先增加后降低的抛物线型。在可见光和部分近红外波段范围(400~1 100 nm),反射光谱随着波长的增加而上升,在1 100 nm附近形成一个峰值,之后光谱变化趋缓。在1 400 nm、1 900 nm和2 200 nm附近有3个明显的吸收峰,深度略有差别,这可能是黏土矿物中所含的水分子和羟基的吸收带[15],基本符合土壤光谱的曲线特征。
1.3.2构建光谱指标土壤有机质在可见光和近红外波段表现出独特的光谱响应特性,且土壤光谱反射率与SOM含量一般呈显著负相关关系,SOM含量的增减变化可以从土壤反射光谱中得到一定程度的反映[15-17]。正因为有了这种特殊的响应关系,通过测定土壤的光谱反射率成为测定SOM含量的一种新方式[17]。另外,受到土壤结构和光谱测量环境等差异的影响,土壤光谱和土壤有机质含量呈现出一种非线性变化,使得光谱曲线的吸收带和反射带并不明显。而光谱的低阶(一阶、二阶)微分变换处理对噪声影响的敏感性较低[18],通过光谱变换处理可以去除部分背景、噪声的影响,增强光谱数据与有机质含量之间的相关关系[17]。因此,为了找到对土壤有机质含量更敏感的光谱指标,本研究选取光谱微分、倒数对数、双波段组合等方法对光谱数据进行处理(表1)。
1.3.3模型建立与验证利用皮尔逊(Pearson)相关分析方法筛选光谱特征指标,以光谱特征指标作为函数的自变量,因变量为实验室测得的土壤有机质含量,构建土壤有机质含量与反射光谱及其变换后的光谱数据之间的模型。构建的模型类型包括:简单线性模型,Y =a+bx;一元二次函数模型,Y =a+bx+cx2;一元三次模型,Y =a+bx+cx2+dx3;对数模型,Y =a+b×ln(x);指数模型,Y =a×exp(bx);幂模型,Y=a×xb。式中,Y为土壤有机质模拟值,x为光谱特征指标,a、b、c、d为常数。
2结果与分析
2.1土壤有机质含量与光谱指标之间的相关性
对比分析土壤有机质含量与表1中的4种光谱指標的Pearson相关性大小及其变化趋势,结果表明4种光谱指标与土壤有机质含量的相关性并不高(图3)。通过反复试验,发现土壤有机质含量倒数变换后与4种光谱指标数据的相关性得到不同程度的提高(图3)。
从图3可看出,在有机质含量未经过变换时,4种光谱指标中,光谱平滑反射率与土壤有机质含量的最高相关性较小,反射率一阶微分后与土壤有机质含量的最高相关性最高。土壤有机质含量经过倒数变换后,4种光谱反射率与土壤有机质含量的相关性得到不同程度的提高,尤其是反射率一阶微分变换后相关系数从-0.335变成-0.475。以达到的最高相关性大小来看,4种光谱指标与土壤有机质含量的相关性大小为:FDR>lg(1/R)>SDR>REF(光谱平滑反射率),其对应的相关系数分别为-0.475、-0.324、0.313、0.230。因此,在4种光谱指标中,反射率一阶微分(FDR)与土壤有机质含量的相关性最佳,在本研究中为最优光谱指标。
在土壤有机质含量经过倒数变换的基础上,筛选相关性最优的波段组合。由表2可知,4种光谱指标对应的最大相关系数都达到极显著相关水平,其中反射率一阶微分的波段组合相关系数最高,达到0.769,其最优的波段组合为R(587,126)*R(734,049)*R(1 095,892)。
2.2土壤有机质含量的高光谱估算模型
在获得4种光谱指标最高相关性所对应的波段组合的基础上,采用6种常用的回归模型方法,分别以各光谱指标最佳波段组合为自变量x和倒数变换后的土壤全有机质含量为因变量y,构建各项光谱指标[反射率光谱平滑(REF)、一阶微分(FDR)、二阶微分(SDR)、倒数对数(lg(1/R)]与土壤有机质含量之间的高光谱估算模型。当部分自变量x出现负数时,对数函数和幂函数模型被剔除(表3)。
a1:原始有机质含量与光谱平滑反射率相关性;a2:变换后的有机质含量与光谱平滑反射率相关性;b1:原始有机质含量与反射率一阶微分相关性;b2:变换后的有机质含量与反射率一阶微分相关性;c1:原始有机质含量与反射率二阶微分相关性;c2:变换后的有机质含量与反射率二阶微分相关性;d1:原始有机质含量与反射率倒数对数相关性;d2:变换后的有机质含量与反射率倒数对数相关性。
从表3可以看出,采用4~6种基本模型分别对4种光谱指标与土壤有机质含量的高光谱估算模型的效果差异较大。其中建模的决定系数(R2)介于0.17与0.65之间,均方根误差(RMSE)介于0.040 mg/kg与0.061 mg/kg之间;模型建立后进行验证获取的R2介于0.02与0.73之间,RMSE介于0.040 mg/kg与0.049 mg/kg之间。对比和分析表3中所有模型的效果可知,基于反射率一阶微分(FDR)波段组合的土壤有机质含量估算模型的反演效果要明显优于其他模型,这是因为在一阶微分变换后,光谱反射率变得更加平缓,而部分特征却得到了明显的增强,使得光谱估算模型的效果得到提升。在反射率一阶微分(FDR)波段组合的4种估算模型中,一元三次函数模型Y=5×1016x3-5×1010x2+59 471.000 0x+0.101 1的R2达到0.65,RMSE为0.040 mg/kg, R2较大且RMSE小,拟合效果最好,其拟合图见图4。
对建立的模型进行可靠性验证。在验证过程中,将模拟出的检验样本有机质含量与实测数据进行比较,从表4可以看到,检验样本预测值介于8.32 mg/kg与18.26 mg/kg之间,平均值为14.75 mg/kg,标准差为2.80 mg/kg;实测值介于5.98 mg/kg与23.37 mg/kg之间,平均值为15.38 mg/kg,标准差为5.45 mg/kg;RMSE为4.19 mg/kg。绝对误差介于0.48 mg/k与7.32 mg/kg之间,平均值为3.70 mg/kg;相对误差介于5.30%与78.43%之间,平均值为27.00%。从散点分布图(图5)也可以看出,实测值和预测值与1∶1线也较接近,可知用该模型反演效果可靠,适合用来进行土壤有机质含量高光谱估算。
3讨论
为了减小噪声影响,增强光谱数据与有机质含量之间的相关关系,本研究将土壤光谱反射率数据进行了4种变换处理,包括Savitzky-Golay平滑、一阶微分变换、二阶微分变换以及倒数对数变换,且将有机质含量进行倒数转换。在此基础上分别筛选出4种光谱指标相关系数较高的波段,再对特征波段进行组合并进行相关分析。波段组合后的相关系数得到了提高,且都达到极显著相关水平,其中反射率一阶微分的波段组合R(587,126)*R(734,049)*R(1 095,892)相关系数最高,达到0.769。
经过对比分析,基于4种光谱指标和4~6种常用数学回归模型分别建立土壤有机质含量高光谱估算模型。得到的最佳模型是以反射率一阶微分的波段组合R(587,126)*R(734,049)*R(1 095,892)为光谱指标所建立的一元三次函数模型Y=5×1016x3-5×1010x2+59 471.000 0x+0.101 1,建模时得到的R2为0.65,RMSE为0.040 mg/kg,验证时获得的R2为0.73,RMSE为0.040 mg/kg,反倒数变换后的验证RMSE为4.19 mg/kg。研究结果表明该模型用于估算土壤有机质含量是可行的。
为了最大化地提高光谱指标与土壤有机质含量之间的相关性,本研究对土壤有机质含量进行倒数变换之后再进行相关性分析、波段组合以及最后的建模,这是区别于前人[17,20-21]的研究,这为高光谱有机质含量估算模型的建立提供了新思路。由于不同地区不同土壤类型对应的土壤属性与反射率也会有所不同,在建模过程中,受这种区域因素的影响,本研究所得土壤有机质含量与光谱指标两者的最大相关系数及相应的特征波段也有所差异,这也说明目前普适性问题是建立高光譜估算模型普遍存在的问题,这也是本研究存在的一个不足点。因此,在以后的采样当中,考虑补充华南地区以外不同土壤属性的土样,以提高预测模型的可靠性和普适性;此外,在建模的过程中,尝试利用一些非线性建模方法来获取更好的预测效果。
参考文献:
[1]李志洪,赵兰坡,窦森. 土壤学[M].北京:化学工业出版社,2005.
[2]BATIONO A, KIHARA J, VANLAUWE B, et al. Soil organic carbon dynamics, functions and management in West African agro-ecosystems[J]. Agricultural Systems, 2007, 94(1):13-25.
[3]李婧. 土壤有机质测定方法综述[J].分析试验室,2008,27 (S1):154-156.
[4]季天委. 重铬酸钾容量法中不同加热方式测定土壤有机质的比较研究[J].浙江农业学报,2005,17 (5):311-313.
[5]章涛,于雷. 土壤有机质高光谱估算模型研究进展[J]. 湖北农业科学,2017,56 (17):3205-3208.
[6]官晓,周萍,陈圣波. 基于地面实测光谱的土壤有机质含量预测[J]. 国土资源遥感,2014, 26(2):105-111.
[7]DHAWALE N M, ADAMCHUK V I, PRASHER S O, et al. Proximal soil sensing of soil texture and organic matter with a prototype portable mid‐infrared spectrometer[J]. European Journal of Soil Science, 2015, 66(4):661-669.
[8]袁征,李希灿,于涛,等. 高光谱土壤有机质估测模型对比研究[J].测绘科学,2014,39(5):117-120.
[9]栾福明,张小雷,熊黑钢,等. 基于不同模型的土壤有机质含量高光谱反演比较分析[J].光谱学与光谱分析,2013,33(1):196-200.
[10]侯艳军,塔西甫拉提·特依拜,买买提·沙吾提,等. 荒漠土壤有机质含量高光谱估算模型[J].农业工程学报,2014,30(16):113-120.
[11]STEVENS A, WESEMAEL B V. Soil organic carbon stock in the Belgian Ardennes as affected by afforestation and deforestation from 1868 to 2005[J]. Forest Ecology & Management, 2008, 256(8):1527-1539.
[12]CROFT H, KUHN N J, ANDERSON K. On the use of remote sensing techniques for monitoring spatio-temporal soil organic carbon dynamics in agricultural systems[J]. Catena, 2012, 94(9):64-74.
[13]于雷,洪永勝,耿雷,等. 基于偏最小二乘回归的土壤有机质含量高光谱估算[J]. 农业工程学报,2015,31(14):103-109.
[14]曾招兵,汤建东,刘一峰,等. 广东耕地土壤有机质的变化趋势及其驱动力分析[J]. 土壤, 2013,45 (1):84-90.
[15]AL-ABBAS A H, SWAIN P H, BAUMGARDNER M F. Relating organic matter and clay content to the multispectral radiance of soils [J]. Soil Science, 1972, 114(6):477-485.
[16]徐彬彬,戴昌达. 南疆土壤光谱反射特性与有机质含量的相关分析[J]. 科学通报, 1980,25(6):282-284.
[17]刘焕军,张柏,赵军,等. 黑土有机质含量高光谱模型研究[J]. 土壤学报,2007,44(1):27-32.
[18]CLOUTIS E A. Review article: Hyperspectral geological remote sensing: evaluation of analytical techniques[J]. International Journal of Remote Sensing, 1996, 17(12):2215-2242.
[19]FUAN T, WILLIAM D. A derivative-aided hyperspectral image analysis system for land-cover classification [J]. IEEE Transaction on Geoscience and Remote Sensing, 2002, 10(2): 416-425.
[20]卢艳丽,白由路,杨俐苹,等. 基于高光谱的土壤有机质含量预测模型的建立与评价[J]. 中国农业科学,2007,40(9):1989-1995.
[21]李媛媛,李微,刘远,等. 基于高光谱遥感土壤有机质含量预测研究[J].土壤通报,2014,45(6):1313-1318.
(责任编辑:张震林)