土壤游离氧化铁高光谱特征与定量反演

2020-01-18 03:40:26阳洋黄伟濠卢瑛李博欧锦琼唐贤王超陈勇

华南农业大学学报 2020年1期

阳洋，黄伟濠，卢瑛，李博，欧锦琼，唐贤，王超，陈勇

(华南农业大学资源环境学院/农业农村部华南耕地保育重点实验室/广东省土地利用与整治重点实验室，广东广州510642)

土壤可见−近红外反射光谱是土壤理化特性光谱行为的综合，土壤中许多组分在可见−近红外光谱范围内具有反射与吸收特征，可以用来识别土壤成分[1]。土壤反射光谱法是一种无破坏性、快速、经济的方法，已广泛应用于土壤矿物、物理、化学和生物学特性的预测[2-3]。土壤游离铁是成土母质风化、迁移转化的产物，能够反映成土过程和成土环境，是表征土壤发育程度的指标之一[4]。在中国土壤系统分类中，土壤游离铁含量是判断低活性富铁层、铁质特性和水耕人为土中铁聚、铁渗特征的指标[5]。

近年来，国内外学者在利用土壤反射光谱预测铁氧化含量和矿物类型方面开展了研究。Coleman等[6]认为红光波段(630～690 nm)和近红外波段(1 150～1 300 nm)是解释美国阿拉巴马州变性土和淋溶土铁氧化物变异的最重要波段。彭杰等[7]对湖南土壤研究表明，氧化铁含量对土壤光谱反射率有明显的影响，利用土壤线性参数预测氧化铁含量具有可行性。夏学齐等[8]研究江苏土壤发现铁氧化物含量和类型均可以在土壤反射率光谱或其一阶导数值中找到相关波段，反射光谱方法能够定量铁氧化物总量、鉴别针铁矿和赤铁矿及相对含量。Summers等[9]报道预测澳大利亚南部土壤铁氧化物的波段是400～1 100 nm，不同类型和矿物组成的土壤氧化铁偏最小二乘回归(Partial least squares regression，PLSR)预测模型需要进行校准。谢碧裕[10]研究江西丘陵地区水稻土时认为PLSR 模型为土壤氧化铁含量最优估测模型。熊俊峰等[11]利用PLSR 对全反射波段与江苏东台市土壤中不同形态铁含量进行建模预测，结果表明多元散射矫正光谱处理建立的模型最优。郭颖等[12]研究表明珠江三角洲地区水稻土无定型铁的敏感波段为404、574、784、854和1 204 nm 等，BP人工神经网络(Back propagation neuralnetwork，BPNN)模型预测土壤无定型铁含量的效果最佳。Xu 等[13]报道浙江土壤游离铁的特征波段是400～480、1 900和2 200 nm，PLSR 模型预测土壤游离铁准确性高。Camargo等[14]报道预测巴西氧化土游离铁和赤铁矿最准确的光谱波段为380～800 nm，预测模型为PLSR 模型。Sellitto等[15]认为土壤针铁矿和赤铁矿含量分别与420和535 nm 波段二阶导数处理的谱带振幅呈显著相关性，反射光谱可用来快速测定巴西氧化土中氧化铁矿物。Rossel 等[16]报道可见−近红外反射光谱可以用于估算澳大利亚表层土壤中赤铁矿和针铁矿的相对丰度，特征波段分别是880和920 nm。Bahia 等[17-18]报道利用PLSR 模型预测巴西土壤游离铁准确度高，原始反射光谱经过二阶微分和去包络线处理后对赤铁矿和针铁矿预测效果好。而魏昌龙等[19]研究表明PLSR 和BPNN 模型均不能准确预测安徽宣城土壤游离铁含量。以上研究为利用可见−近红外反射光谱预测土壤铁氧化物含量提供了依据，但对于不同区域和类型的土壤，精确预测铁氧化物的光谱转换、敏感或特征波段和预测模型均不一致，因此有必要建立不同区域土壤铁氧化物的光谱预测模型。广西位于我国华南地区，风化和淋溶作用强，脱硅富铁铝化明显，铁铝等元素以二三氧化物形态残留富集，使得该地区土壤中氧化铁矿物主导了土壤的颜色，从而明显区别于其他区域。利用土壤光谱特征定量反演广西土壤游离铁含量的研究鲜见报道，本文通过分析广西旱地土壤反射光谱与游离铁含量的关系，试图建立基于可见−近红外光谱的土壤游离铁含量预测模型，为该区域土壤游离铁含量预测提供一种简单、快速、经济的方法。

1 材料与方法

1.1 土壤采集与分析

2015年12月至2017年12月采集广西壮族自治区82个旱地土壤剖面的B层土壤(图1)，土壤类型包括雏形土、淋溶土、富铁土和铁铝土等。土壤样品经室内风干后，制备过60和100目筛的样品，结合参考文献[20]的方法进行土壤化学特性分析。土壤游离铁含量的测定用连二亚硫酸钠−柠檬酸钠−碳酸氢钠(DCB)浸提−邻菲罗啉比色法；土壤全铁含量测定用HNO3-HCl-HClO4消解−邻啡罗啉比色法；土壤有机质含量测定用重铬酸钾−浓硫酸−外加热法。土壤化学性质分析于2016年3月至2018年2月完成。选取过60目筛的土壤于2017年12月至2018年8月进行光谱的采集与处理。

图1 广西采样点分布图Fig.1 Distribution of sampling sites in Guangxi

1.2 土壤光谱数据的获取与光谱变换处理

土壤光谱用AvaField-3便携式地物波谱仪(荷兰Avantes公司)测定，其波长范围是350～2 500 nm，采样间隔为0.6(区间为300～1 000 nm)和6 nm(区间为1 000～2 500 nm)，光谱分辨率为1.4(300～1 100 nm)和15 nm(1 100～2 500 nm)，波长重复性为±0.3 nm，输出波段为1 569 nm。光谱测定在可控制光照条件的暗室内进行，光源为一盏50 W 的卤素灯，光源通过光纤连接探头，视场角为10°。土壤样品放置于直径2.5 cm、高1.5 cm 黑色瓶盖中，将土样表面刮平。探头距土样表面2～3mm 垂直进行光谱数据采集，测试之前先进行白板校正，每个土样采集25条光谱曲线，算术平均后得到该土样的实际反射光谱数据。每个土样的光谱曲线去除噪声较大的边缘波段(350～399和2 401～2 500 nm)，保留400～2 400 nm 波段的反射光谱数据用于后续研究。

在土壤原始光谱反射率基础上进行数学形式变换可以有效减少光照、背景噪声的干扰，提高光谱灵敏度，更加容易分解混合特征信息[21]。为筛选对土壤游离铁含量敏感的特征波段，本研究对土壤原始光谱进行10种变换处理，分别是一阶微分、二阶微分、倒数、倒数的对数、倒数的一阶微分、倒数的二阶微分、去包络线、平方根、平方根的一阶微分和平方根的二阶微分。用Pearson 相关系数(rλ)来衡量光谱变换后光谱反射率与土壤游离铁含量间相关程度，其计算公式如下：

式中，xi为第i个波段反射率，yi为第i个土壤游离铁含量， x 为波段反射率的平均值， y为土壤游离铁含量的平均值。

1.3 建模样本和验证样本的划分

将供试土壤按游离铁含量高低排序后随机选取建模和验证样本。建模和验证样本数分别为62和20，占总样本的75%和25%。通过SPSS 21.0对2组数据进行K-S检验[12]，得到D=0.58、P=0.74＞0.05，故可确认这两组样本来自同一分布。各样本集土壤游离铁含量的箱型散点图见图2，供试土壤基本理化性质统计如下：全铁(Fe2O3)为9.37～124.44 g/kg，均值为(57.58±27.26)g/kg，变异系数为47.35%，游离铁(Fe2O3)为1.58～108.13 g/kg，均值为(41.88±24.03) g/kg，变异系数为57.35%，有机质为2.20～48.90 g/kg，均值为(12.13±8.86)g/kg，变异系数为73.04%。

图2 土壤游离铁含量箱型散点图Fig.2 Boxplot and scatter p lot of free iron content in soil

1.4 模型建立与验证

偏最小二乘回归(PLSR)可以很好地解决各变量内部高度线性相关、样本个数少于变量个数等问题，很大程度上提高了模型的应用能力、精度及可靠性[22]。逐步多元线性回归(SMLR)则将变量逐个选入回归方程，并考虑全部变量的方差贡献值，期间利用F统计量选择或剔除自变量，不断重复，直到无法引入新变量，最终建立自变量与因变量之间的回归关系[23]。本研究采用PLSR 和SMLR 方法建立土壤游离铁含量预测模型，分别在M ATLAB 2016a 和SPSS 21.0软件中实现。

模型的预测精度通过预测值与实测值的决定系数(R2)、均方根误差(RMSE)以及相对预测偏差(RPD)来评价；R2及RPD越大、RMSE 越小，说明预测效果越好[24]。当R2＞0.90，RPD＞3.00时，模型具有极好的预测能力；当0.82＜R2＜0.90，2.50＜RPD＜3.00时，模型具有很好的预测能力；当0.66＜R2＜0.81，2.00＜RPD＜2.50时，模型具有近似定量预测能力；当0.50＜R2＜0.66，1.50＜RPD＜2.00时，模型具有对样品高含量与低含量进行区分的可能性；当R2＜0.50时，RPD≤1.50时，模型不能成功预测[25]。R2、RMSE 和RPD计算公式如下：

式中， yi为第i个样本的土壤游离铁实测值为第i个样本的土壤游离铁预测值；y为82个样本土壤游离铁实测平均值；SD为土壤游离铁实测值的标准差；n为样本数。

2 结果与分析

2.1 土壤游离铁含量的光谱特征

供试土壤游离铁含量分为＜20、20～40、40～60及＞60 g·kg−14组，对应的样本数分别为13、33、18和18，对每一组别样本计算原始光谱反射率和去包络线处理平均值，形成不同土壤游离铁含量的光谱曲线(图3)。由图3a 可知，在400～2 400 nm土壤游离铁含量与光谱反射率呈负相关关系，即随着土壤游离铁含量的增加，土壤光谱反射率降低；在可见光波段(400～780 nm)范围内光谱曲线呈明显的上升趋势，氧化铁含量越高，光谱反射率越低，在400 nm 波段附近有一个小吸收谷；在近红外波段(780～1 300 nm)范围内光谱反射率上升比较平缓，在1 300～1 600 nm 波段光谱曲线趋于重合，说明光谱曲线的差异较小；在1 400、1 900 及2 200 nm 附近存在明显的曲线吸收特征，主要是与铁的氧化物及高岭类黏土矿物所含OH−有关[26]。由图3b可知，在400 nm 附近的吸收谷与氧化铁含量有关，氧化铁含量高的比较清晰；不同游离铁含量的土壤在800 nm 附近有明显的吸收峰，900 nm 附近有吸收谷。

2.2 光谱变换形式与土壤游离铁含量的相关性

图3 不同游离铁含量的土壤光谱曲线Fig.3 Reflectivity curves of soils with different free iron contents

将土壤游离铁含量与原始光谱、去包络线、一阶微分、二阶微分、倒数、倒数一阶微分、倒数二阶微分、倒数的对数、平方根、平方根一阶微分和平方根二阶微分变换后的光谱反射率进行Pearson 相关性分析，由分析结果(图4)可知，原始光谱反射率与游离铁含量呈负相关，并且整条曲线比较平滑，很难筛选出与游离铁含量具有良好相关性的敏感波段，而经过光谱变换后的土壤光谱反射率与游离铁含量之间的相关性明显提高。为筛选预测土壤游离铁的不同光谱变换形式下的特征波段，对每种光谱变换后土壤光谱反射率与游离铁含量的相关系数进行P=0.01水平的显著性检验(|r0.01|=0.29)。去包络线光谱变换主要是突出了一些反射峰和吸收谷的信息，在可见光波段范围内相关系数绝对值最大达到0.60，其他波段相关系数绝对值最大值约为0.20。倒数、倒数的对数与平方根光谱变换光谱曲线基本是原始光谱曲线以x轴为对称轴的相似图，整体表现比较平缓。微分变换处理效果显著，多处波段相关系数绝对值≥0.50，一阶微分变换比二阶微分变换整体效果要好。从全波段来看，效果最好的光谱变换形式是倒数一阶微分。基于以上分析结果，选取通过显著性检验波段数量多的一阶微分、去包络线、倒数、倒数一阶微分和平方根一阶微分的光谱变换形式建立土壤游离铁预测模型，评估不同光谱变换后土壤游离铁含量预测精度。

2.3 不同反射光谱建模波段的确定

不同学者利用不同光谱波段建立同一土壤属性预测模型的结果不尽相同[10,12]。然而，很少有学者对基于不同反射光谱波段建立的预测模型效果进行评估，针对某种土壤属性选择较优的建模波段。

图4 不同光谱变换形式反射率与土壤游离铁含量的相关性分析Fig.4 Correlation analysis between reflectance with different spectral transformation and soil free iron content

根据供试土壤在可见−近红外波段的光谱反射率与土壤游离铁含量的相关关系，获取与土壤游离铁含量相关性较强的反射光谱建模波段。本研究中在全波段400～2 400 nm 范围内随着土壤游离铁含量增加，土壤光谱反射率降低，因此选择400～2 400 nm波段作为全波段数据。通过不同光谱变换后的光谱反射率与土壤游离铁含量相关性分析得知，经过一阶微分、去包络线、倒数、倒数一阶微分和平方根一阶微分的光谱变换，在400～580和760～1 300 nm 波段范围内有明显的反射和吸收特征，因此确定为土壤游离铁的特征波段。将光谱反射率与土壤游离铁含量的相关系数经过P=0.01水平的显著性检验，再通过逐步多元线性的方法剔除共线性波段，得到400、457、510、735、848 nm 等12个敏感波段。敏感波段光谱反射率与土壤游离铁含量间的相关系数以及方差膨胀因子见表1。

表1 敏感波段共线性检验1)Table 1 Collinearity test of sensitive band

2.4 土壤游离铁含量的预测模型

利用全波段、特征波段和敏感波段建立土壤游离铁含量预测模型(表2)。结果表明，基于全波段进行倒数和倒数的一阶微分光谱变换的SM LR 模型，验证样本的R2分别为0.80和0.82，RPD分别为2.20和2.21，模型具有近似定量预测能力；PLSR模型的验证样本R2＜0.80，RPD＜2.0，模型不能进行定量预测。基于特征波段一阶微分光谱变换的SMLR 模型，验证样本的R2为0.85，RPD为2.62，模型具有很好的预测能力；PLSR 模型的验证样本R2＜0.80，RPD＜2.0，模型不能进行定量预测。基于敏感波段建模效果不理想，SMLR 和PLSR 模型验证集R2＜0.80，除倒数一阶微分外，RPD＜2.0，模型不能进行定量预测。

图5为通过3种反射光谱建模波段建立的土壤游离铁含量最佳反演模型的实测值与预测值散点图。综合比较R2、RMSE 和RPD评价指标可知，基于特征波段一阶微分光谱变换的SMLR 模型预测土壤游离铁含量的效果最佳。土壤游离铁含量的最佳预测模型表示为：

式中，Y表示土壤游离铁含量预测值；X表示提取的

该波段处的土壤光谱反射率。

表2 土壤游离铁含量预测模型1)Table2 Calibration and validation of the model for predicting soil free iron content

图5 不同建模波段最佳模型的土壤游离铁含量Fig.5 Soil free iron content of the optimal model in different modeling band

3 结论与讨论

广西旱地土壤随着游离铁含量的增加，可见−近红外波段范围内土壤光谱反射率降低，在可见光波段的降低程度比近红外波段高，可见光波段能够提供更多的游离铁信息。土壤原始光谱经过微分光谱变换后光谱反射率与土壤游离铁含量的相关性显著提高。采用一阶微分光谱变换、特征波段(400～580、760～1 300 nm)和逐步多元线性回归建立的模型能够很好地预测广西旱地土壤游离铁含量，验证样本的R2和RPD分别为0.85和2.62。

本研究的相关性分析结果表明，土壤游离铁含量在全波段范围内与原始光谱呈负相关关系，且特征波段位于可见近红外光(400～1 300 nm)区域，在457和900 nm 波段附近具有明显的氧化铁吸收谷特征，在800 nm 波段附近有氧化铁反射峰特征。该结论同前人的研究结论一致[27]，同时也符合土壤特征光谱的产生机制[7,13]。其中，400～580、760～1 300、400、457、510 nm 等波段是本研究区域土壤游离铁的特征波段和敏感波段，其主要原因是不同土壤铁氧化物含量有差异，且不同的氧化物中羟基的数量也会对其敏感波段造成影响[14-16]。其次，光谱变换形式及波段提取方法的不同，使得同一土壤属性提取的特征波段不一致。本文提取特征波段是在相关分析的前提下，相关系数通过P=0.01显著性检验；敏感波段是进一步采用多元逐步线性手段剔除共线性波段获取的。本研究中土壤游离铁含量的反射光谱在可见光波段，反射率曲线从长波向短波波段明显下降，可见光波段反射率的降低程度高于近红外波段，这主要是由土壤铁氧化物的电子跃迁造成的，也就是说在可见光范围内能够提供更多的氧化铁信息[7]。进入红外波段后，不同游离氧化铁含量梯度的光谱曲线在1 400、1 900、2 200 nm 附近有强烈的吸收谷，这几个吸收谷是受到N—H、C—H、C—O、C＝O等功能基团的影响[3]。这与赵小敏等[1]、郭颖等[12]、黄应丰等[26]对我国南方其他区域土壤光谱特征的研究结果一致。

本研究中原始光谱反射率与土壤游离铁含量的相关性整体偏低，经过一阶微分、二阶微分、倒数、倒数的对数等10种形式变换后，微分光谱变换的光谱反射率与游离铁含量之间相关性显著提高，其中倒数一阶微分变换的相关系数提高最多，相关系数绝对值最大为0.64。熊俊峰等[11]利用全波段数据对不同铁元素含量进行反演时认为多元散射校正(MSC)光谱处理效果最好。何挺等[27]计算不同变换形式反射率与氧化铁含量的相关系数表明，变换后相关性并没有得到显著增强，只有反射率平方根的一阶微分相关系数提高最多；Xu 等[13]将氧化铁进行对数光谱变换后得到较好的预测模型。光谱变换能够降低外界噪声干扰，突出光谱特征，增强光谱反射率与土壤属性的相关性，提高基于土壤光谱预测土壤属性的精确性，然而不同光谱变换方法的建模精度存在差异[11-13]。根据不同光谱波段建模结果可知，利用特征波段(400～580、760～1 300 nm)的建模效果要优于全波段(400～2 400 nm)。研究表明不同区域和不同类型土壤，基于可见−近红外反射光谱预测土壤铁氧化物的光谱变换、特征波段及预测模型均不一致。与其他区域土壤[7,9,10,12-13]不同的是，广西旱地B层土壤中有机质含量较少，均值仅为12.13 g/kg，而土壤游离铁和全铁含量较高。全波段由于波段较多相应地增加了受其他因素或成分影响的程度，使得不仅没有凸显全面而丰富的氧化铁光谱特征信息，反而使得一些重要波段信息被掩盖[7]。

一元线性回归、偏最小二乘回归、逐步多元线性回归、反向神经网络(BPNN)等是利用光谱特征预测土壤属性最普遍的建模方法。本研究选用PLSR和SM LR 这2种模型来预测土壤游离铁含量，通过R2、RMSE和RPD评价，SMLR 建模效果要优于PLSR，与何挺等[27]用逐步回归分析得到氧化铁的预测模型结论一致；但众多研究结果[10,11,13-14,17]表明PLSR 模型能较好地预测土壤铁氧化物含量。造成这种结果的原因可能是：1)研究区土壤类型多样，不同的土壤类型的反射光谱不同[24]，而光谱反射率建立在反演模型的基础上，因此对反演结果造成影响；2)由于土壤成分复杂，当土壤氧化铁含量不高时，其他成分易对其光谱特征造成交叉干扰[13]。不同研究区域土壤中水分含量、有机质以及盐分等差异较大，模型结果自然也有较大不同。本文虽然已经尽可能排除了这些影响，但成土母质及众多含量较少成分的影响仍难以排除，还需要继续深入研究。本研究中SM LR 预测模型应用于验证样本的R2和RPD分别为0.85和2.62，与浙江[13]、巴西[14，18]土壤游离铁预测模型相近，高于江苏省东台[11]、安徽宣城[19]土壤游离铁预测模型，结果表明本研究中建立的广西旱地土壤游离铁预测模型准确度较高。从不同游离铁含量的光谱特征曲线图[24]可以看出，本研究区供试土壤光谱曲线类型属于铁影响型光谱曲线，相对来说这类光谱曲线土壤中有机质含量低，铁氧化物含量高于有机质控制型光谱曲线。根据谢碧裕[10]、郭颖等[12]研究不同区域水稻土的氧化铁含量预测模型可知，对来自不同地区不同发育母质的同一类型土壤进行预测时，其预测精度同样不能保证。因此，本研究预测模型综合考虑了土壤光谱反射率的影响因素，选择室内光谱测试环境，以避免外界环境的影响；统一土壤化学分析测定与光谱预测时的土壤粒径，并且选用自然风干的B层土壤，最大程度降低了土壤其他组分对氧化铁光谱反演结果的影响。已有研究表明土壤有机质影响土壤铁含量与光谱反射率关系，尤其是在可见光区域[28]，有机质含量对游离铁估算精度的影响小于全铁、无定型铁[11]。为了降低有机质对游离铁含量预测精度可能的影响，本研究只选取有机质含量低的B层土壤，有关土壤有机质含量对广西旱地土壤游离铁预测精度产生怎样的影响以及本研究得到的游离铁预测模型是否适用于更广泛的土壤亟待进一步深入研究。