任申萍, 吕成文, 陈东来, 邓浩然
(安徽师范大学 地理与旅游学院,安徽 芜湖 241003)
土壤水分是农作物生长发育的必要条件,也是土壤墒情评价的重要指标,快速准确地预测土壤水分对精准农业的发展具有十分重要的意义[1]。高光谱技术作为近年来土壤地理学的研究热点之一,广泛应用于土壤水分的预测研究中[2]。熊静玲等采用多元散射校正结合对数一阶微分变换对样本光谱数据进行预处理,筛选敏感波长,构建基于支持向量机的土壤含水率高光谱估测模型[3]。于雷等在经Savitzky-Golay平滑和连续统去除对原始光谱数据预处理后,优选水分敏感波长,采用偏最小二乘回归方法建立模型[4]。其他相关文献还有很多[5-8]。从这些文献讨论的问题看,多关注到模型算法,从光谱数据预处理到模型构建,期望通过不断改进模型算法来提高预测效果。
土壤高光谱是土壤属性特征的综合反映,包含了丰富的土壤信息[9-10]。在土壤属性光谱预测建模中,仅仅关注模型算法,忽视其他相关属性对被预测属性光谱特征的影响是不够的。尚璇等在研究中发现,预测土壤有机质时应剔除水对反射率的影响[11]。Kuang等研究认为含水量、粉粒和砂粒对土壤总氮和有机碳光谱预测时起负向影响,土壤粘粒起正向作用[12]。宋海燕等运用正交信号处理(orthogonal signal correction,OSC)方法对光谱数据处理,以减少质地对土壤有机质光谱预测的影响[13]。质地是土壤的重要物理属性之一,质地对土壤含水量高光谱预测建模影响如何,目前相关报道还不多见。本文以巢湖流域土壤样本为例就上述问题进行讨论,以期为相关研究工作提供参考。
巢湖流域位于安徽省江淮地区中部,在116°24′18″E~117°55′38″E,30°58′58″N~32°04′48″N之间,流域面积约为9196 km2。流域地形西南高东北低,总体渐向巢湖倾斜,高海拔区主要分布在西南部,最高峰海拔高度近1400 m。土地利用类型以水田、旱地、林地为主,土壤类型有马肝田、黄白田、马肝土、黄白土、砂砾土等。
土壤样本源于课题组在巢湖流域的相关工作。根据土样质地组成差异,选取了3组,每组20个,共60个土样作为研究样本。样本组Ⅰ的砂粒含量<10%,粉粒含量65%~80%,粘粒含量20%~30%;样本组Ⅱ的砂粒含量均<10%,粉粒含量75%~90%,粘粒含量10%~20%;样本组Ⅲ的砂粒含量20%~35%,粉粒含量50%~65%,粘粒含量10%~20%。每个土壤样本在采集时均记录有详细的经纬度位置、地形地貌及土地利用方式等信息。
图1 实验流程Fig.1 Experiment flow
取60个直径8cm、深2cm的铝盒,对铝盒编号并用天平称得原始盒重,将过20目筛的土样依次置于相应编号铝盒内,装满后刮平表面。从铝盒边缓缓注入纯水,在注入过程中尽量保证土壤表面全部均匀湿润,直至土壤达过饱和状态,静置土样,待铝盒土表自由水消失后(约注水之后24h)备测。随土样水分逐日蒸发,形成水分梯度。用光谱仪测量土样光谱反射率,同时用天平称量相应土样土重,备求土壤含水率。测量频率为每隔24h对全部土样测量1遍,共持续7天,获得不同含水率土样光谱数据420条。最后将所有土样放入105℃烘箱中烘12h,取出后称量相应土重。实验基本流程如图1所示。
用烘干法获取土壤水分数据,准确度高,也是目前国际上最常用测定土壤水分的标准方法[14]。土样含水率是指土样在烘干至恒重时所失去的水分质量与烘干土质量的比值,用百分数表示。计算公式如下:
土壤含水率=(mi-md)/(md-m0) ×100%
式中:m0为空铝盒重量(g);md为烘干后土样加铝盒的重量(g);mi为每天测完光谱后土样加铝盒的重量(g)。
光谱测量采用美国ASD公司生产的FieldSpec 4型地物光谱仪。光谱测量在暗室内进行,光源使用入射角度为45°的卤素灯,采用8°视场角的光纤探头垂直放置于土壤样品的正上方,并距离土样表面15cm。每个样品从5个方向进行共计10次光谱测量,并将光谱曲线进行算术平均。
参照相关文献[15],剔除含水率高于50%的土样光谱数据,每个土样包括不同含水率光谱数据5~7条,60个土样最终保留有效光谱数据共计382条。去除土样高光谱数据中噪声较大、信噪比低的两端波段,保留400~2400nm光谱数据用于研究,并运用Savitzky-Golay卷积平滑法进行平滑去噪处理[16]。
根据土壤质地组成变量(砂粒、粉粒及粘粒含量)构建三维特征空间,用平均重心距离表示样本组土样质地分异度。参照有关文献[17],平均重心距离定义为样本组各样点到样本组重心的平均距离。计算方法如下:
(1)
按以下两种方式,设计了6个样本组。①根据土样质地组成差异将全部土样分为3个样本组:样本组Ⅰ、组Ⅱ、组Ⅲ,每组20个土样,包括不同含水率土样光谱数据依次为128条、125条、129条。②在样本组Ⅰ、组Ⅱ、组Ⅲ的基础上,通过抽样重组构成3个新样本组,以扩大样本组土样质地分异度。重组方法:在样本组Ⅰ、组Ⅱ、组Ⅲ中各随机抽出10个土样,然后两两组合,构成样本组A(源于样本组Ⅰ、组Ⅱ)、样本组B(源于样本组Ⅱ、组Ⅲ),样本组C(源于样本组Ⅰ、组Ⅲ)。重组后,样本组A、组B、组C各有20个土样,包括不同含水率土样光谱数据依次为125条、124条、127条。
采用偏最小二乘回归方法(PLSR)建模。按照土壤含水量高低对土样进行升序排列,每3个土样中选择1个土样作为预测样本集,其余土样作为建模样本集。相关建模工作在The Unscrambler 9.7软件中完成。
模型的预测精度评价指标主要有:决定系数(R2)、均方根误差(RMSE)和相对分析误差(RPD)。R2反映模型建立和验证的稳定性,R2越接近1,说明模型的稳定性越好、拟合程度越高。RMSE用来检验模型的预测能力,RMSE越小则模型预测能力越好。模型评价参数RPD是标准差与均方根误差的比值,当RPD<1.4时,说明模型无法对样品进行预测;当1.4≤RPD<2时,说明模型可对样品做粗略的估测;当RPD≥2时,说明模型具有极好的预测能力[18]。
图2 不同含水量下土样光谱反射率曲线(52号土样)Fig.2 Reflection spectrum under different soil moisture level (NO.52)
各土样光谱曲线随含水量变化趋势类似,以52号土样为例,分析不同含水量下土壤反射光谱曲线(图2)。各光谱曲线特征总体相近,在可见光波段土壤光谱曲线表现为“陡坎式”上升,至近红外波段曲线变化趋于平缓,在1400nm和1900nm附近分别存在强吸收峰,在2200nm附近存在弱吸收峰。随着土样含水量的减少,其光谱曲线整体上趋于抬升。在含水量较高时,相邻光谱曲线间隔相对较小,并且随着含水量的增加,光谱曲线逐渐接近,水分变化对光谱曲线的影响相对较小;当含水量处于低值时,相邻光谱曲线间隔相对增大,反射光谱曲线会因水分的变化而发生显著抬升或下降。该现象在前人研究中也得到验证[15]。
基于公式(1)计算了样本组Ⅰ、组Ⅱ、组Ⅲ及样本组A、组B、组C在三维特征空间的平均重心距离,结果依次为4.27、4.17、4.01、7.97、16.33和15.41。样本组Ⅰ、组Ⅱ、组Ⅲ土样质地分异度相近且相对较小,样本组A、组B、组C土样质地分异度相对较大。
运用偏最小二乘回归方法(PLSR)分别构建样本组Ⅰ、组Ⅱ、组Ⅲ以及样本组A、组B、组C土壤含水量高光谱预测模型,采用交叉验证方法来确定最佳主分量,建模结果见表1。
表1 不同样本组土壤含水量PLSR建模结果Table 1 PLSR modeling results of soil moisture content in different sample groups
由表1可知,6个样本组建模集R2在 0.872~0.944间,预测集R2在 0.823~0.927间,RPD均高于2.0,模型稳定性好、拟合程度高,都具有极好的预测能力,表明质地差异对样本组土壤含水量光谱预测模型稳定性及预测力影响不大,但在模型预测精度上,不同样本组间有一定差异。
比较样本组Ⅰ、组Ⅱ、组Ⅲ模型预测精度,考察土样质地组成的影响。表1显示,样本组Ⅱ模型预测精度优于样本组Ⅰ、组Ⅲ,表明样本组土样质地组成对模型预测结果有影响,样本组土样粉粒含量高可能更有益于提高模型预测精度。
对重组前后样本组模型预测精度进行比较,考察土样质地分异度的影响。样本组A源于样本组Ⅰ、组Ⅱ,其模型预测精度均低于其来源样本组Ⅰ、组Ⅱ,与样本组A质地分异度更大有关;样本组B源于样本组Ⅱ、组Ⅲ,样本组C源于样本组Ⅰ、组Ⅲ,样本组B和样本组C模型预测精度也均低于其来源样本组,其原因与样本组A相同。可见,质地分异度对样本组模型预测结果有影响,质地分异度小,有益于提高模型预测精度。
上述分析表明,不同质地分组土壤含水量光谱预测模型均有较好的稳定性和预测力,但在模型预测精度上不同样本组间有一定的差异。由图3可见,土样粘粒含量与光谱反射率在可见光段呈正相关性,粉粒含量与光谱反射率在全波段呈正相关性,砂粒含量与光谱反射率在全波段呈显著负相关性,但整体上质地与光谱反射率的相关性较低,其系数绝对值在0~0.25之间波动,土样含水量与光谱反射率相关系数绝对值在 0.6~0.9之间。一方面,质地对土壤含水量光谱预测建模的影响是客观存在的,另一方面,土壤含水量与土壤光谱反射率高相关性相对削弱了质地的影响,使模型保持较高的稳定性和预测力。
图3 土壤含水量、质地与光谱反射率的相关性曲线Fig.3 Correlation of soil moisture,texture and spectral reflectance
选取巢湖流域60个土壤样本,通过水分梯度实验与光谱测量,获得有效土样高光谱数据382条,在此基础上,讨论了质地差异对土壤含水量PLSR高光谱预测模型的影响,主要结论如下:
(1)不同质地分组的土壤含水量高光谱预测模型均具有较好稳定性和预测力,但在模型预测精度上有一定差异。
(2)质地组成、质地分异度对样本组模型预测精度有一定的影响,样本组土样质地分异度小、土样粉粒含量比例高有益于提高土壤含水量模型预测精度。
(3)土壤含水量与土壤光谱反射率相关系数绝对值在0.6~0.9间,质地与土壤光谱反射率相关系数绝对值在0~0.25之间,土壤含水量与土壤光谱反射率高相关性相对削弱了质地对土壤含水量高光谱预测建模的影响,使模型保持较高的稳定性和预测力。