土壤养分的近红外漫反射光谱预测模型分析

2017-03-08 09:04:46董桂梅李耀文于亚萍杨仁杰纪君柔胡永浩
天津农学院学报 2017年4期
关键词:全氮土样光谱

董桂梅,李耀文,于亚萍,杨仁杰,纪君柔,胡永浩

土壤养分的快速、无损检测是精细农业发展亟待解决的研究课题[1]。近年来,近红外反射光谱(near infrared reflectance spectroscopy,NIRS)分析技术以其检测迅速、无破坏性、无污染、不需要预处理及实时检测等优点,广泛应用于土壤养分的定量分析检测中[2-3]。

目前,很多学者开展了近红外光谱定量检测土壤养分数据处理方法的相关研究。Chang等[4]利用主成分回归(principal components regression,PCR)引入7个主成分数在波长400~2 500 nm区间,建立了土壤光谱全氮含量的预测模型,其决定系数R2为0.85,剩余预测偏差(residual predictive deviation,RPD)为 2.5;Kusumo等[5]对 350~2 500 nm反射光谱建立了土壤氮的偏最小二乘回归(partial least squares regression,PLSR)预测模型,R2=0.81,RPD为2.32。李伟等[6]利用近红外光谱,采用PLSR和人工神经网络方法分别建立土壤碱解氮含量的预测模型,校正模型的决定系数R2分别为0.95和0.96,相对误差分别为3.42%和2.67%,证明了使用近红外光谱法检测土壤碱解氮的可行性。蔡剑华等[7]探讨了基于近红外光谱技术,采用经验模态分解法实现土壤有机质含量的检测,证明了经验模态分解的土壤在光谱数据处理方面的可靠性,能够有效提高检测的准确度。

通过以上文献可知,PCR和PLSR数据处理方法是近红外光谱进行土壤养分定量分析常用的途径。在多元线性回归分析中,为消除多重共线性对回归模型的影响,PCR和PLSR常用来提高估计量的稳定性。PCR与PLSR相似,其目的都是估算出具有大量高度相关的自变量的线性模型中的回归参数。PCR是将数据一次性分解完成,得到互不相干的新数据向量,然后再对新向量建立回归模型,而PLSR遵循的是逐步回归的分析思路,即逐步提取光谱数据中的成分,逐步增加变量及检验模型的显著性,直到满足要求为止。本文主要基于近红外漫反射光谱法,分别采用PCR和PLSR建立定量分析土壤全氮含量的预测模型,通过比较模型参数确定两种数据处理方法对于土壤全氮含量预测精度的影响。

1 材料与方法

1.1 土样制备

采用土壤有效态成分分析标准物质GBW07460(陕西黄绵土)为基础土样,取110 g基础土样,将其按质量均分为22份,将每份添加不同质量的尿素(CO(NH2)2)粉末,研磨充分,混合均匀,配制成土壤全氮含量分别为0.08%、0.10%、0.12%、0.14%、0.16%、0.18%、0.20%、0.22%、0.24%、0.26%、0.28%、0.30%、0.32%、0.34%、0.36%、0.38%、0.40%、0.42%、0.44%、0.46%、0.48%、0.50%的土壤样品,共22份待测土样。

1.2 仪器设备

待测土样光谱由美国PerkinElmer公司生产的Frontier傅里叶变换型近红外光谱仪,基于近红外漫反射原理,采用配套积分球附件进行采集。仪器参数设置为:扫描范围10 000~4 000 cm-1,分辨率4 cm-1,数据采集间隔4 cm-1。

1.3 光谱采集及预处理

为保证测试的准确性,先扫描白板进行背景校正,再对样品进行扫描,22份待测土样扫描结果如图1所示。从图1可以看出,近红外光谱谱图出现不同程度的偏移或漂移,这是由于仪器、样品均匀性或其他因素影响所导致,如不加处理,同样会影响校正模型建立的质量和未知样品预测结果的准确性[8-9]。因此,建模前对采集的原始光谱先采用一阶微分变换进行基线校正,再进行归一化预处理,消除或减小干扰因素的影响。

图1 22份土样近红外漫反射原始光谱图

2 结果与分析

2.1 建模方法

(1)PCR先利用主成分分析(PCA)将变量重新组合成一组新的互相无关的隐变量即主成分数,从中抽取出几个较少的主成分数尽可能多地反映原有变量。再通过关联光谱与化学值,建立二者之间的校正模型并预测光谱以获得相应化学值[10]。

(2)PLSR是在普通多元回归的基础上,借鉴PCA和典型相关分析的思想,很好地解决了自变量间多重共线性问题,成为光谱分析中建立线性定量校正模型的通用方法[11],在预测变量高度相关或预测变量数超过样本数时特别有效。

2.2 交叉验证确定最优建模参数

PCR与PLSR都是隐变量回归法,其中一个重点就是主成分数的确定,目前常用的途径就是采用最小交叉验证均方根误差(root mean square error of cross validation,RMSECV)来选取最佳主成分数。

22份土壤样品中选定14组作为校正集,8组作为验证集。为了保证模型准确性,将最低全氮含量的数据与最高含量的数据放在校正集中。通过RMSECV最小化原则来选取最佳主成分数,RMSECV越小,表示模型的优度越好,预测精度越高。

图2为采用PCR法交叉验证时的RMSECV曲线,可以看出,主成分数为9时RMSECV最小,为0.062 7。说明利用主成分数9进行PCR建模,模型误差较小,预测精度较高。

图2 土壤全氮含量PCR法建模的RMSECV曲线

由图3可知,根据PLSR交叉验证得到的最佳主成分数为3, 此时RMSECV最小,为0.038 2。说明利用主成分数3进行PLSR建模,模型误差较小,预测精度较高。

图3 土壤全氮含量PLSR法建模的RMSECV曲线

2.3 建模与比较

根据选取的主成分数,分别采用PCR和PLSR对预处理后的光谱数据建模,处理结果如表1所示,其中预测均方根误差(root mean square error of prediction,RMSEP)越小,表明所建模型的预测能力越强,精度越高。

表1 不同处理方法土壤样品建模参数比较

由表1可以看出,分别采用最佳主成分数进行PCR和 PLSR建模及验证,结果显示,PLSR法的RMSEP=0.034小于PCR的RMSEP=0.040,表明PLSR法对于定量分析土壤全氮含量的预测精度优于PCR法。

利用PCR和PLSR验证模型得到土样全氮含量的预测值与实际值,如表2所示。分别对两种方法得到的全氮含量实际值与预测值进行相关性分析。将土壤全氮含量实际值作为横坐标,土壤全氮含量预测值作为纵坐标,进行线性拟合。得到拟合曲线如图4、图5所示。

表2 不同处理方法土壤样品建模参数比较 %

图4 PCR法土壤建模预测值与实际值相关性曲线

图5 PLSR法土壤建模预测值与实际值相关性曲线

由图4、图5可知,PCR建模得到的土壤全氮含量的预测值与实际值线性拟合决定系数R2为0.873 1,而PLSR建模的预测值与实际值线性拟合R2为0.903 5。可以看出,PLSR建模预测结果与实际值拟合效果相对较好,即预测值和实际值相关性较好,表明PLSR法相对于PCR法预测模型有较好的优度。证明了PLSR更适用基于近红外漫反射法检测土壤全氮含量,预测精度更高。

3 结论

本文旨在研究近红外漫反射光谱法检测土壤养分中建模方法对检测精度的影响,分别采用PCR和PLSR对不同全氮含量的土壤样品进行建模分析,比较了模型参数及预测结果与实际值的相关性。试验结果表明,PLSR相对于PCR而言,建模主成分数较少,模型收敛速度快,预测精度较高,更适用于近红外漫反射法检测土壤全氮含量,为提高土壤养分检测精度提供了依据。

[1]罗锡文,臧英,周志艳.精细农业中农情信息采集技术的研究进展[J].农业工程学报,2006,22(1):167-173.

[2]Morra M J,Hall M H,Freeborn L L.Carbon and nitrogen analysis of soil fractions using near infrared reflectance spectroscopy[J].Soil Science Society of America Journal,1991(55):288-291.

[3]Schimann H,Joffre R,Roggy J C,et al.Evaluation of the recovery of microbial functions during soil restoration using near infrared spectroscopy[J].Applied Soil Ecology,2007,37:223-232.

[4]Chang C W,Laird D A,Mausbach M J,et al.Near infrared reflectance spectroscopy:principal components regression analyses of soil properties[J].Soil Science Society of American Journal,2001,65(2):480-490.

[5]Kusumo B H,Hedley M J,Hedley C B,et al.Measuring carbon dynamics infield soils using soil spectral reflectance:prediction of maize root density,soil organic carbon and nitrogen content[J].Plant and Soil,2011,338(1-2):233-245.

[6]李伟,张书慧,张倩,等.近红外光谱法快速测定土壤碱解氮、速效氮和速效钾含量[J].农业工程学报,2007,23(1):55.

[7]蔡剑华,王先春,胡惟文.基于EMD的土壤有机质含量近红外光谱检测[J].农业机械学报,2010,41(9):182-186.

[8]隋世江,叶鑫,隽英华.近红外光谱技术在土壤成分检测中的研究进展[J].农业科技与装备,2012(1):14-19.

[9]郑咏梅,张铁强,张军,等.平滑、导数、基线校正对近红外光谱PLS定量分析的影响研究[J].光谱学与光谱分析,2004,24(12):1546-1548.

[10]李硕,汪善勤,张美琴.基于可见-近红外光谱比较主成分回归、偏最小二乘回归和反向传播神经网络对土壤氮的预测研究[J].光学学报,2012,32(8):289-293.

[11]褚小立,许育鹏,陆婉珍.偏最小二乘方法在光谱定性分析中的应用研究[J].现代仪器,2007(5):13-15.

猜你喜欢
全氮土样光谱
灌区渠道基土工程水敏性试验研究
柠檬酸对改良紫色土中老化铜的淋洗研究
基于三维Saab变换的高光谱图像压缩方法
膨胀土干湿交替作用下残余强度试验方案分析
治淮(2018年6期)2018-01-30 11:42:44
丰镇市农田土壤有机质与全氮含量关系分析
现代农业(2016年3期)2016-04-14 12:35:28
星载近红外高光谱CO2遥感进展
中国光学(2015年5期)2015-12-09 09:00:28
不同土地利用方式对黒垆土有机质和全氮分布规律的影响
土壤与作物(2015年3期)2015-12-08 00:47:01
苦味酸与牛血清蛋白相互作用的光谱研究
铽(Ⅲ)与PvdA作用的光谱研究
红碱淖流域湿地土壤全氮含量及分布特征研究