倪隆康,何 文,顾大形*
(1.长江大学 园艺园林学院,湖北 荆州 434025;2.广西喀斯特植物保育与恢复生态学重点实验室/广西壮族自治区中国科学院广西植物研究所,广西 桂林 541006)
【研究意义】土壤是地球生物圈重要的自然资源,也是植物生长发育的载体。土壤生源要素丰度直接调节着植物和微生物的分布和生理过程,并最终影响生态系统功能[1]。传统的土壤生源要素含量实验室测定方法如酸式消解法,存在耗时耗工的问题,并且对消解过程有较高的要求,导致测定的结果往往存在误差[2]。同时,消解法也不利于在空间上提供连续土壤关键生源要素含量信息。高光谱遥感分析技术的快速发展,为在时间和空间上连续获取土壤生源要素丰度信息提供了一个方便快捷的途径[3]。【前人研究】利用高光谱遥感技术具有无损、快速获取地物信息等优势[4],国内外大量学者利用高光谱反射率估算土壤的有机质和矿物质含量。有研究表明,红壤土黏土矿物对土壤铜含量有较大影响,在830 nm、1 000 nm和2 250 nm波段土壤与铜有较强的相关性[5]。程先锋等[6]利用高光谱对铅锌矿区土壤中多种元素含量进行反演,发现实测光谱的逐步回归方法的预测模型具有较高的精度,其决定系数均高于0.816。薛利红等[7]在对土壤有机质和全磷进行高光谱反演的研究中发现,PLSR模型具有较高的预测精度且反演效果较为稳定。P等[8]利用ASD地物光谱仪和HYMAP分别在2 206 nm和2 341 nm处的反射率测得粘土、碳酸钙含量与Cr值之间存在着显著关系。以上研究表明了利用高光谱反演预测土壤中元素含量的可行性和高效性[9-10]。【本研究切入点】岩溶区基岩为碳酸盐岩,在不断风化过程中,土壤因为钙离子的不断供给,延缓了土壤脱硅富铝的速度,使上覆土壤存在高钙、高pH值等特点[11]。富钙性是岩溶区土壤较其它地区所独有的特性[12],并深刻地影响着各种生态过程。如高钙环境下过多的钙离子会直接损伤叶绿体从而影响植物的光合作用[13]。喀斯特地区富钙的土壤性质,直接影响着当地植物与农作物的生长发育以及其它元素的生物代谢作用[14],进而影响着岩溶地区群落的演替和当地生态环境的恢复。因此,基于喀斯特地区的各项研究,土壤钙含量指标是十分重要的[15]。目前高光谱反演土壤元素的研究多聚焦在铜、铁、锌等土壤元素,而对土壤钙的相关研究较少。【拟解决的关键问题】本研究利用土壤光谱数据结合实验消解测得的土壤全钙含量,采用不同方法进行分析,一是利用光谱波段两两组合的方式构建Ca光谱指数模型进行反演;另外运用主成分回归分析建模,对喀斯特区土壤Ca含量进行反演。最后对两种方法结果进行对比,以选出最佳Ca高光谱反演策略,为喀斯特地区土壤钙元素含量的估测及其空间分布遥感提供技术和数据支持。
研究区域位于广西壮族自治区境内,属于热带亚热带季风性气候。土壤取样在广西境内的东北—西南喀斯特样带上进行(图1),在样带上选取不同植被类型覆盖的7个典型岩溶区土壤为研究对象。取样区域经纬度的范围为106°57′02″E~111°13′46″E和22°27′03″N~25°06′03″N。
图1 研究区采样点分布Fig.1 The distribution of sampling sites in karst area
样点覆盖广西喀斯特地貌的多个发育阶段和多种土壤类型,并以土壤、植被及地形状况为主要参照选择7个样点。如表1所示,桂林市临桂区会仙岩溶生态与水生态研究基地和全州县白宝乡和都安县澄江镇取样点由于受到人为干扰和放牧的影响,生物多样性相对较少,植被覆盖度较差,多由一些低矮灌木和草本组成,石多土少、土薄易旱,代表退化的岩溶土壤状态。而龙州县弄岗国家级自然保护区是世界上罕见的保存完好的岩溶地区热带季雨林,以高大乔木为主,郁闭度高,土层厚、湿度大,代表岩溶土壤的原始状态。富川县朝东镇福西村等样点,则由于设立保护区人烟稀少等原因,当地植被覆盖度较高,多为乔灌草结合的自然保护林,物种多样性丰富,代表生态恢复过程中的岩溶土壤状态[16-17]。采样区范围主要选择在山坡阳坡中段,取样区域约200 m2,采用蛇形布点法进行样品采集。
表1 研究区概况Tab.1 Overview of research area
1.2.1 试验材料的采集和处理 本试验于2018年7月至9月在7个试验样地表层20 cm土壤进行样本采集,每个样地取6个样本。将样本带回实验室后,剔除碎石、植物根系等杂质,经风干处理后用机器研磨过筛并分成两份,一份用于土壤光谱的测定,另一份用于土壤Ca含量的消解测定,消解的方法采用H2SO4-H2O2消解法[18],最后使用上海FP6431火焰光度计测定土壤Ca含量。
在黑暗的实验室内采用美国ASD FieldSpec 4 Hi-Res光谱仪采集土壤反射光谱信息。该光谱仪的测定光谱范围为350~2 500 nm,光谱分辨率最高为3 nm,350~1 000 nm的范围采样间隔为1.4 nm,1 001~2 500 nm范围的采样间隔为1.1 nm,共输出2 151个光谱波段。测定时,将土样均匀铺在反射率近似为0的黑色垫板上,并刮平至1~2 mm厚,使土样表面尽量平整均匀。用50 W卤素灯作为光源,光源距离土壤样品30 cm,光源的入射角为15°,探头垂直于土样平面,探头与土壤样品平面距离15 cm。试验中每5 min校正一次参考板以减小测量误差。
1.2.2 光谱数据的处理 土壤光谱的原始数据中常存在随机误差,而且可能出现信号薄弱等问题,使其难以直接反映特征波段的特点[19]。采用光谱重采样、去除包络线及一阶导数的方法对光谱数据进行预处理是光谱降噪和增强特征波段的常用手段[5,20-21]。所有数据处理均通过MatLab和SPSS 20.0实现。
1.2.3 光谱去包络线 高光谱数据中相邻的波段经常高度相关,信息冗余并且不利于计算,而通过包络线消除法可突出光谱曲线的反射和吸收特征,更有利于和其他光谱曲线进行特征比较[22-23]。其表达式如下[24]:
其中λj是第j波段波长;Rj是j波段的原始光谱反射率;Rend和Rstart是起始光谱反射率和末端光谱反射率;λend和λstart是起始点的波长和末端点的波长。
1.2.4 光谱一阶导数 光谱导数是遥感研究中常用的光谱指标,获取土壤一阶导数光谱具有一定的平滑去噪功能,可以消除部分共有的系统误差[25]。所获取的一阶导数光谱形态会因干扰程度的不同而产生差异[26]。光谱数据一阶导数计算公式如下[25]:
其中λi为inm波长波段,ρ(λi)是波段λi的光谱反射率。
1.3.1 相关性分析 相关性分析是光谱数据分析中经常使用的方法,通过对不同数据的分析,来发现两个变量的线性关系的强弱,本研究利用Pearson相关系数对土壤钙含量差异的相关波段进行指示。计算方法如下[19]:
其中λi和Y分别代表第i个波段的反射率和样本Ca含量,δ为标准差,E表示期望值。
1.3.2 光谱指数 以实测的高光谱数据和土壤Ca含量为基础,并总结前人对土壤高光谱反演的相关研究[27-28],构建土壤Ca的高光谱指数反演模型。通过对前人的研究进行总结发现,土壤反演指数的模型主要有以下5种:差值光谱指数(difference spectral indices,DSI)、亮度光谱指数(brightness spectral indices,BSI)、比值盐分指数(ratio salt indices,RSI)、盐度指数(salt indices,SI)、归一化光谱指数(normalized difference spectral indices,NDSI)。公式见表2[27]。
1.3.3 主成分回归分析 主成分回归分析(PCR)是一种去除高光谱共线性的有效手段,它可以通过主成分的变换,将一组存在相关性的变量转换为线性不相关的变量,后进行回归分析。本研究根据不同预处理的光谱数据,根据累计贡献率和特征根,选取6个主成分,分别进行回归分析。其计算方法如下[28]:
其中v1j为m个原始变量的相关系数第i个特征值对应的特征向量;λi表示第i个波段反射率;n表示变量相关系数矩阵;j表示对应的特征值向量;Y是Ca含量的估算值;an是第n个主成分变量对应的Ca反演模型的系数。运用回归分析的方法选择出对因变量高度解释的主成分。
表2 光谱指数及公式Tab.2 Reflectance index and formula
各模型的评判结果以决定系数R2、样本均方根误差RMSE以及P作为评价标准。最终根据建模和检验参数来选取最佳光谱指数与最佳指数模型,并选择基于土壤钙含量的估算技术路线。
7个样点中土壤Ca含量的统计分析结果表3所示。最低值为2.64 mg/kg,最高值达到91.26 mg/kg,平均值达到43.131 7 mg/kg,标准差为15.622 6。数据表明研究区内土壤Ca含量较高,且变异性大。土壤中Ca含量变异性大主要是因为所选样区土壤本身差异性较大造成,且不同地区土壤温度湿度条件等有所差异,造成土壤中Ca含量的富集情况不同。土壤样品中较广的Ca含量梯度,有利于提高光谱反演模型和反演方法的适用范围。
表3 研究区土壤Ca含量描述性统计结果Tab.3 Statistic of soil Ca content in study area (mg/kg)
研究区的土壤样本相关系数分布如图2所示,通过对原始光谱进行一阶导数及去包络线处理,土壤光谱与Ca含量的相关性有了较大幅度的提高。包络线去除后光谱和一阶导数光谱与Ca含量相关性较好的波段主要出现在两个区域,一个位于570~608 nm,另一个区域位于2 260~2 350 nm。而在460 nm和945 nm附近也均表现出一定的相关性。
通过对400~2 500 nm的任意2个波段组合建立Ca的光谱指数(SI,BSI,RSI,NDSI,DSI)。其中,在一阶导数的光谱反射率条件下,各光谱指数的R2分布如图2所示。5种光谱指数与土壤Ca含量之间的相关系数总体较为一致,400~600 nm的波段与其他波段的组合均表现出较强的相关性,且以RSI指数的表现较为突出。同时,不同的光谱指数与Ca的相关系数最佳分布存在着一定的差异。如表4所示,原始光谱数据处理效果最好的是NDSI指数,它与Ca在敏感波段(603 nm,604 nm)处的决定系数为0.57,而DSI与RSI指数反演结果相同。通过平滑去噪的去包络线光谱数据,DSI与RSI指数的反演结果依旧相同,但反演精度上有所提高,决定系数整体上升达到0.55,反演能力最强的仍为DNSI指数,决定性系数也为0.57,反演能力与原始光谱一致。
图2 不同预处理光谱的相关系数分布Fig.2 Soil spectrum curves in different research areas
此外,经过一阶导数处理的光谱,各指数的反演效果均有较大提高,说明对土壤Ca含量反演而言,光谱的一阶导数变换处理较为适合,一阶导数变换去除的干扰信息多是对土壤Ca含量没有影响的信息。基于一阶导数光谱的反演模型中,表现较为突出的是RSI与NDSI指数,R2分别达到0.67和0.66,均方根误差分别为26.34和17.22,都表现出较强的反演能力,适宜喀斯特区土壤Ca含量的快速诊断。
主成分回归分析结果如表5所示,3种处理方式的光谱都具有一定的反演能力。一阶导数光谱的决定系数达到了0.57,去包络线光谱的决定系数为0.49,未经处理的原始光谱决定系数也能达到0.43,并且3种处理方式建模都能通过95%显著性检验。这证明了主成分回归分析可以有效地应用于对土壤Ca含量模型的反演。其中,经过一阶导数处理的光谱模型效果改善最为显著,其次是去包络线光谱。这说明了光谱数据经过一阶导数处理可有效避免选入原始光谱中的系统噪声。
图3 一阶导数光谱下各指数的R2分布图Fig.3 Categories based on R2with different type indices using first-order derivative spectra
表5 主成分回归分析不同的光谱处理Tab.5 PCR analysis with different spectral processing
在本研究中,高光谱反演土壤Ca含量的特征波段与其他学者的研究存在着明显的相似性。本研究通过光谱指数分析识别出的特征波段为2 260~2 350 nm,与Lagacherie P等[8]在法国南部的石灰岩和钙质砂岩土壤的2 206~2 341 nm波段、Csorba Á等[29]在匈牙利北部的农田用地和森林土壤中的2 200~2 340 nm和2 400 nm波段等土壤该敏感波段部分相吻合。但本研究也发现了在608 nm附近的光谱反射率也对土壤Ca较为敏感。这可能是由于本试验是以土壤全钙作为反演对象,与前人进行的碳酸钙反演存在着一定差异导致。
以广西喀斯特地区土壤为例,本研究通过指数分析和主成分回归分析验证了不同预处理光谱的预测能力。结果发现,相对于原始光谱,去包络线光谱指数DIS、RSI和SI在决定系数上有较大的提升,而且提取的波段也更加精准在583~636 nm波段。BSI指数在决定系数上仅提升了0.04,提升较小且决定系数较低,特征波段的筛选较模糊。而NDSI指数虽然反演效果普遍较好,但不同处理提升不大,而且特征波段的筛选也较为相近。而经过一阶导数处理的光谱相对于前两种处理有明显的提升。其中BSI指数提升最大,比原始光谱的决定系数高出0.26,比去包络线光谱的决定系数高出0.22;NDSI指数3种预处理差别不明显但均能筛选出敏感波段。DSI和RSI两种指数在相同光谱处理中所得的反演结果几乎相同,因此在Ca反演方面两种指数的无处理和去包络线处理光谱无显著差异。这与前人的研究存在一定的差异,郭鹏等[28]对土壤盐分的高光谱反演认为BSI指数为最优指数。这可能是因为不同元素之间的反演存在差异,同时BSI虽然在一阶导数光谱中反演效果较好,但在无处理光谱和去包络线光谱上则效果并不理想,说明了在不对原始数据进行降噪处理的情况下BSI指数很难识别弱信号的特征波段。
本研究所使用的光谱指数法和主成分回归分析法均有显著效果。如RSI指数反演效果最好,决定系数达到0.67,并且直接筛选出了敏感波段607 nm和2 370 nm,波段指示意义明确。主成分回归模型操作简单,主成分降维的优势比较突出,计算精度与指数差别不大,但回归结果难以筛选出特征波段,指示意义不明确。目前高光谱反演常借助卫星等进行辅助研究,如曹雷等[30]通过卫星数据对土壤盐渍化的信息提取、徐祎凡等[31]通过环境一号卫星的高光谱数据检测太湖的富营养化评价等多通过卫星等航空仪器进行辅助研究。然而由于卫星搭载的限制,往往只能对有限波段的高光谱进行数据采集,而高光谱指数模型可精确筛选敏感特征光谱,这对指导卫星搭载的用于岩溶区土壤Ca含量遥感的高光谱传感器的设计具有指导意义。