穆其尔 杨光 陈昊宇 张天琪
(内蒙古农业大学,呼和浩特,010018)
盐渍土是我国干旱半干旱地区常见的土壤类型,分布广泛[1]。重度盐渍化会引起土地退化、土壤生产力下降以及粮食减产等一系列问题[2-3],如何准确高效地评估盐渍化土壤的理化性质是当前土壤组分研究的热点之一[4]。高光谱监测能够通过光谱数据提供地物较为完整且连续的光谱信息从而定量分析地物,克服了传统土壤盐分测定方法的费时和成本高等缺点[5]。快速准确的对土壤盐分含量的无损监测成为现实[6],成为土壤理化性质研究的理想手段。
盐渍土中的可溶性盐主要是土壤内部阴、阳离子的结合,各区域盐分离子组成不同,差异较大,且当盐分含量过多时就会对土壤有不同程度的危害[13]:碳酸盐类会显著影响土壤磷的有效性,进而影响土壤肥力;硫酸盐和钠盐会使土壤团粒结构减少,胶体分散,增大土壤粘结性,使其更易板结。因此,高效准确获取不同盐分离子组成及含量等信息有助于盐渍土的改良。内蒙古盐渍化土地种类多且严重,盐渍土面积高达566万hm2,而土默川平原是盐渍化典型分布区之一,因此,本研究以盐渍化地区托克托县为取样地点,利用室内获取的土壤高光谱数据进行可控实验,隔离外部因素影响,探索4种盐溶液(NaCl、Na2CO3、Na2SO4、NaHCO3)处理下土壤光谱曲线变化,对比不同盐分含量的土壤光谱信息之间的区别,并利用偏最小二乘回归(PLSR)和多元线性逐步回归(MLSR)两种方法分别建立不同盐分指标预测模型,进行验证和对比,以期提高盐渍化土壤盐分含量的预测精度,为内蒙古土默川平原盐渍化土壤改良提供技术支撑。
托克托县隶属呼和浩特市,位于黄河上中游的土默川平原。气候变化四季分明,为典型的干旱-半干旱性温带大陆性气候。年温差与日温差均较大,无霜期可达130 d,年均气温最高与最低月通常为7月和12月,年均气温约为7.5 ℃。该区降水年际变化较大且分布不均,主要集中于7—9月份,年降水量335~535 mm,年均蒸发量处于1 700~2 000 mm。研究区土壤类型以灰褐土、淡栗钙土为主,土壤盐分含量高且可溶性盐阴阳离子种类丰富,盐渍化土壤主要有苏打盐土、氯化物盐土、硫酸盐盐土、硫酸盐苏打盐土、硫酸盐氯化物盐土以及氯化物苏打盐土,研究区采样地实测土壤可溶性盐总量质量分数分布范围为0.77~14.63 g·kg-1。植被主要为沙生植被、盐生植被、沼泽植被和草甸植被。盐生植被分布较为零散,伴有镶嵌状分布的沼泽、草甸植被。
光谱仪器采用SVC HR-1024便携式地物光谱仪(350~2 500 nm,1 024个波段),最小积分为1 ms,350~1 000 nm光谱分辨率小于等于3.5 nm,1 000~1 850 nm光谱分辨率小于等于8.5 nm,1 850~2 500 nm光谱分辨率小于等于6.5 nm。将处理好的土壤置于黑色盛样皿内,盛样皿直径为10 cm,土壤厚度2 cm,在光源为50 W卤素灯的光照可控的暗室进行光谱测量。每次测量之前,仪器都需进行预热及白板校正,距土样表面15 cm垂直进行测量,视场角25°,探头所接受的光谱区域为直径6.77 cm的圆,小于盛样容器面积,以保证探头所接受的均为所测样品反射光谱。对每一土样进行5次重复测量,取均值为该样品的原始光谱数据。
图1 R′和R″处理后光谱曲线
研究表明,对光谱原数据进行数学变换能够更为有效的反映土壤含盐量与光谱信息之间的关系[15-17],因此选择对样本的土壤盐分及其含量与所选光谱数据的最优数学变换结果进行逐波段的相关性分析,计算相关系数r,选择相关系数高波段作为后续建模所需的敏感波段。相关系数计算公式如下:
(1)
反演土壤盐分含量的关键在于选取有效的数学模型,为保证评价模型精度及其稳定性,以及样品之间的含盐量间隔,将每种盐溶液处理的36个样本分为两部分,24个样本作为建模样本,12个样本作为验证样本。运用特征波段,采用多元线性逐步回归(MLSR)和偏最小二乘回归模型(PLSR)分别建立4种盐分的高光谱反演模型。偏最小二乘的回归方法组合了多元线性回归分析以及主成分分析和典型相关分析,经验证可有效消除参量间多重共线性,多元线性逐步回归则是优化一般多元线性分析方法的过程[14],模型的精度由决定系数(R2)和均方根误差来进行验证评价,R2越大,模型越稳定;均方根误差越小,模型预测能力越好。
从整体上来看,经盐溶液处理后的各土样光谱反射率均大于对照组,表明土壤盐分含量的增加会引起土壤反射率的增加,与张丽等[18]研究结果一致;4种光谱均在400~1 300 nm波段范围内迅速上升,在1 400 nm波段附近出现较为明显的浅水分吸收谷,在1 500~1 800 nm各曲线上升趋势明显减缓,直至1 900 nm附近出现第二个深水分吸收谷,4种土壤光谱曲线在该波段均呈整体下降趋势。经质量分数为0.8%和1.2%盐溶液处理的4种土样,在400~1 000 nm波段内反射率由大到小的顺序为Na2SO4、NaCl、NaHCO3、Na2CO3,在1 000~2 400 nm波段内反射率由大到小的顺序为Na2SO4、Na2CO3、NaHCO3、NaCl。在400~2 400 nm波段内,其余10种浓度盐溶液处理后土样光谱反射率由大到小的顺序为:Na2SO4、Na2CO3、NaHCO3、NaCl。由于各盐分含量与反射率之间的相关性具有差异,4种光谱曲线反射峰、吸收谷等位置表现出一定的不同,因此,4种盐分类型土壤在光谱曲线上较易区分。NaCl土样光谱曲线中,反射率最高的为经质量分数为0.8%盐溶液处理的土样,反射率最低的为经质量分数为15%盐溶液处理的土样,呈现出NaCl质量分数越高,反射率越低的形态。由于空气所含水分极易被氯化物吸收,水分含量的增加会使其反射率下降[20-21];Na2CO3土样、Na2SO4土样和NaHCO3土样的光谱曲线表现出反射率随含盐量增加而递增的规律,与刘亚秋等[22]研究的结果一致。
图2 不同盐分土壤高光谱曲线
由图3可知,土壤光谱波长较多,若全部代入模型进行预测,波长间的冗余性使模型预测精度降低,因此,建模所需特征波段的选取十分重要。采用皮尔逊相关系数法将4种土壤的含盐量与光谱原数据的10种数学变换结果分别做相关性分析,并以此选择后续建模所需敏感波段。4种土样原始光谱数据与土壤含盐量相关性由高到低依次为:NaCl、Na2SO4、NaHCO3、Na2CO3。NaCl土样反射率各波段相关性全部呈负相关,Na2SO4土样反射率全部呈正相关,该结论与孙亚楠等[13]研究结果一致;Na2CO3土样反射率相关性在1 905~2 205 nm和2 370~2 400 nm波段内为负相关,其余均为正相关;NaHCO3土样除1 660~2 400 nm波段外,其余波段均为正相关。4种土样经最优数学变换后高光谱与土壤含盐量相关系数,不同盐分离子对各波段的敏感性不同,当n=36,|r|>0.279代表在0.5水平上显著,|r|>0.424则代表在0.01水平上显著。
图3 最优变换后光谱与盐分质量分数的相关系数
表1 不同盐分土壤最优光谱处理方式
表2 不同盐分土壤高光谱反演模型
不同土样的不同数据处理方式之间的决定系数和均方根误差都有一定差别,同一土样采取的数据处理方式不同其模型精度也有一定区别。按照决定系数最接近1和均方根误差最小的原则,应用PLSR方法建立的模型,各个数据经变换后的模型精度明显高于MLSR方法所建立的模型。NaCl土样光谱反射率经一阶微分变换后,利用PLSR方法所建立的最优模型比MLSR方法建立的模型的决定系数增加了0.108,均方根误差降低了1.499;NaHCO3土样经对数的一阶微分变换后,应用MLSR方法建立的最优模型比PLSR方法建立的模型模型,其决定系数仍小0.017。由于MLSR方法在建立模型过程中,各个自变量的波段间相关性比较强,导致多重共线问题的出现,模型稳定性随之受影响,预测效果相对较差[13]。由此,PLSR模型相对更适合进行土壤盐分定量反演。
分别以未进行建模的剩余数据作为准真值,对模型的反演预测能力进行验证。由图4可知,模型中在土壤含盐量较高处有个别异常点,除此以外样本大体上分布在1∶1线两侧,预测值和实测值之间有较好的一致性,因此,本文所建立PLSR模型有效,较适宜进行土壤不同种类盐分浓度高光谱反演。
图4 最优PLSR模型的含盐量实测值与预测值散点图
土壤高光谱综合反映了土壤所含有机质、水分、盐分等各种组分信息,同时包括土壤类型、气象等周围的环境信息[21]。为具体了解某种盐分对土壤光谱的影响,本文选择对非盐渍土中加入适量盐溶液,在室内进行光谱反射率测定,通过可控实验在一定程度上隔绝了外部因素影响。研究发现含4种盐分各浓度土壤反射率均大于对照组,在光谱曲线上也反应出不同的特性。Na2SO4土样整体上光谱反射率最高,这是由于盐溶液处理土样过程中,盐分浓度较高时在土壤表面会出现盐斑,Na2SO4是单斜晶系,其集合体呈皮壳状或致密块状,导致光谱反射率较高。Na2CO3和NaHCO3与水结合过程中释放出CO2,从而使其结皮层外观呈蜂窝状且蓬松粗糙,反射率较Na2SO4土样低。张俊华等[22]研究发现硫酸盐型白碱结皮光谱反射率大于碳酸盐型瓦碱结皮的结论与上述结论一致。土壤盐分具有表聚性,从而增强其反射率,由此也提高了通过高光谱识别土壤盐分信息的准确性。但野外盐渍土是各类盐分的组合,不仅仅局限于本研究中所选4种盐分,因此,其他单一盐分类型,如:CaCl2、MgCl2等以及常见盐分的组合形式对土壤光谱的影响都有待进一步研究。
不同的光谱数据处理方式效果不同,本文所选取的光谱反射率数学变换方式中,对于光谱数据的一阶微分变换效果整体较好,能在不同程度上提高土壤反射率与土壤含盐量之间的相关性,这是由于光谱的微分变换可在消除漂移基线或平滑背景的干扰下,使原始光谱轮廓更加清晰,提高了光谱数据与土壤盐分含量间的相关性。刘亚秋等[19]用1 493、1 911 nm两个波段反射率的一阶导数作为特征光谱,构建的模型实现了黄河口区土壤主要盐分离子的有效估测;马利芳等[23]将所测得光谱数据进行一阶求导处理后,以4个交叉波段建模对新疆荒漠区土壤盐分含量进行了反演,与本文的研究结论基本一致。提高了原始光谱分辨率,能够使光谱数据与SSC间的相关性提高。
(1)不同种类、不同浓度的盐分对土壤的光谱曲线有不同影响,但各土样反射率均高于未经处理的土样;经Na2CO3、Na2SO4和NaHCO3盐溶液处理的土壤光谱反射率随着土壤含盐量的增加而增加,NaCl溶液处理后的土壤的反射率随着土壤含盐量的增加而递减。
(2)4种土样原始光谱数据与土壤含盐量相关性从高到低依次为:NaCl、Na2SO4、NaHCO3、Na2CO3,NaCl土样反射率各波段相关性全部呈负相关,Na2SO4土样反射率相关性全部呈正相关,NaHCO3和Na2CO3土样反射率相关性以正相关为主。对光谱原数据进行数学变换后,各土样的相关系数较大波段,大多集中在近红外波段(780~2 500 nm),其中,经NaCl处理后的土壤光谱反射率与土壤含盐量相关性较好波段在红波段(620~780 nm)也有所分布。各土样最大相关系数绝对值均大于0.767,选取的敏感波段用来建模可信度较高。
(3)4种土样建立的模型间均有一定区别,建模效果最好的是NaCl土样的光谱反射率经一阶微分变换的PLSR模型,决定系数和均方根误差分别为0.871和0.764;MLSR模型中效果最好的为经对数一阶微分处理后的NaHCO3模型,决定系数和均方根误差分别为0.824和0.846。经过数学变换后的光谱数据所建立的PLSR模型中,土壤光谱反射率经R′变换后的模型精度整体上较高,NaCl、Na2CO3、Na2SO4和NaHCO3溶液处理后的土壤样品,土壤光谱反射率经R′变换后建立的PLSR模型的决定系数依次为0.871、0.835、0.867和0.773,建模和验证精度均较高;对比两种模型,PLSR模型从整体上反演效果优于MLSR模型,更适合进行土壤含盐量模型的反演。