基于近红外光谱与多元模型的小麦氮含量估算

2016-11-28 16:22张兵范泽华姚江河陈杰
江苏农业科学 2016年9期
关键词:近红外光谱最小二乘法春小麦

张兵+范泽华+姚江河+陈杰

摘要:采用频谱测量的谷物氮元素估算方法易受作物水分等因素的影响,对此提出了采用近红外光谱与最小二乘法(PLS)的小麦氮素与水分预测方案。采用光谱传感器获得的光谱反射率数据(光谱范围是400~950 nm),在植物生长阶段(BBCH 32)测试了是否可以估算春小麦中的氮与水分。2014—2015年,在甘肃地区进行小麦的田地试验,试验场共包含36个小区,在播种期间主小区使用氮施肥(N 70 kg/hm2或100 kg/hm2),子块则使用水灌溉。在BBCH 32,对所有的小区使用便携式光谱仪测量其冠层反射率,然后,每个小区选择0.25 m2样方作为地表小麦作物量的采样,并分析总氮量。首先通过对数线性比对光谱数据进行预处理,然后使用Savitzky-Golay方法与均值化对其进行第一阶导数滤波,然后,通过偏最小二乘法(PPLS)结合光谱信息与正定数据对模型进行校准。结果表明,本方法优于基于指标的方法,其最优模型的氮、水分性能分别为RPD=2.26、RPD=1.49。

关键词:春小麦;近红外光谱;最小二乘法;主成分分析;氮含量估算;水含量估算

中图分类号: S127;S512.106 文献标志码: A

文章编号:1002-1302(2016)09-0374-05

氮是决定作物成长情况的重要养分,因为异质型土壤的质量在空间上有所变化,所以氮的使用效率也呈现空间性变化[1-2]。为了优化农产品企业的经济效益,应当使用均匀的氮施肥比例[3]。

采用电磁频谱[4]中可视与近红外频谱范围的电磁能光谱反射可实现氮含量的估算,电磁频谱的可视范围(400~700 nm)会被叶片组织的叶绿素影响,电磁频谱的近红外频谱为700~2 500 nm[5-6]。可见近红外光谱法具有分析简便快速、低成本、无污染及样品的非破坏性和多组分同时测定等优点[7~12]。本研究基于近红外技术的广泛使用对小麦的含氮量与含水量进行无损检测。

1 材料与方法

1.1 农田试验

在甘肃地区合作农产品企业的帮助下进行农田试验,试验区域的经纬度为(103.73°E,36.03°N,海拔1 537 m),年平均降水量为310 mm,年平均温度为10 ℃,平均生长季温度约15 ℃,试验地的地形平坦。

农田试验占地22.5 m×45 m,将其划分为若干个2 m×7.5 m 大小的小区,每个小区的两边均设置1.5 m×7.5 m的边界区来防止边缘效果,如图1所示。

对主小区注入氮养分(分别为70或100 kg N /hm2),对子区域则使用水灌溉[分为3个灌溉级别:少量水灌溉(W-),自然水灌溉(W0),额外的水灌溉(W+)]。具体处理方法为W-:在小区内放置2.5 m×4 m的塑料与铝合金框架遮雨;W0:仅有自然雨水灌溉,无外部水灌溉;W+:除降水以外,额外采用外部水灌溉。W+小区则采用便携式滴灌设备对其进行额外水灌溉(覆盖面积为2 m×4 m),按照不规则的时间间隔共进行40 mm水灌溉。在2014年与2015年分别进行了4、5次额外的水灌溉,如图2所示。

在2014年与2015年相同的试验田位置进行田地试验,每年同一季节进行春小麦的播种与施肥。

1.2 环境条件与土壤含水量

距离试验田约100 m处设置了1个小型气象站,每隔1 h测量降水量与大气环境参数。在2014年,每星期在每个处理小区中,通过频域反射仪对4个深度(10、20、30、40 cm)监控土壤的体积含水量。为了增加测量的频率,本试验采用ECH2O介电常数传感器在9个选择的块中(10、20 cm深度)分别连续地测量土壤环境(图2)。使用文献[13]的转换函数与土壤的纹理数据,计算土壤凋蔫点(-1 500 kPa)等级等重要土壤环境参数。

在2014年,测量之前的两星期相对较干燥,仅有12 mm降水量, 而发芽期间的降水量为[KG*5]72mm; 2015年同一时间的降水量则分别是31、162 mm。2014年从发芽直到测量时的平均空气温度为10.4 ℃;2015年的相应温度为12.0 ℃。2014年发芽到测量时间点土壤上部(0~20厘米)的含水量平均值是15%,2015年对应的平均值为25%。

1.3 频谱测量

在冠层生长期(BBCH32)测量了冠层反射率,测量方法为采用便携式田地光谱仪(Carl-Zeiss光谱仪与Hamamatsu传感器相连,并通过PCI-USB操作控制器),传感器记录太阳辐射与小麦冠层反射的辐射。将输入辐射反射分割以获得反射率数据,在作物冠层之上1.5 m处使用离最低点60°的视角操作仪器。

1.4 参考测量

频谱测量之后,选择地上小麦生物量作为样本并作为参考,样本选择方式为:在每个试验中划分1个0.25 m2的样方(图1)。采样后每隔30 min进行以此采样,并更新各统计参数值。然后将样本置于60 ℃的环境下做干燥处理(持续48 h),然后称作物的干质量。通过提取水元素来计算作物的水含量,通过比色法(使用FIAstar 5000流动注射分析仪)分析氮含量。

1.5 数据分析与统计

每年对新鲜(干燥)的作物量、植物水分以及氮含量使用分块模型进行方差分析,分块模型中将氮处理作为主小区,水处理作为子小区。将氮、水含量作为固定因子,将其他因子作为随机因素。所有测试中假设显著性值为P<0.05,图3所示是平均数据的箱线图。

Wis-NIR波谱的预处理过程如下。初步测试之后,选择3个方法来获得最优的校准结果:(1)对数线性化;(2)Savitzky-Golay方法的一阶滤波;(3)平均归一化方法。使用主成分分析法(PCA)对多光谱数据进行降维处理,在2年的数据集分析中,因为析因模型的不确定性,成分分数的分配与加载是一个矩阵旋转的任意结果,所以本研究改变PC1与PC3分数的分配来确保单年数据集的分组准确性。使用PLS与PPLS回归从辐射度数据估算出冠层的特征。因为相关的样本较小(单年n=36,2年为n=72),本研究采用leave-one-out交叉验证方法。

为了评估模型的性能,本研究计算交叉验证模型统计的集合,其中包括根均方误差(RMSE)、决定系数(R2)、一致性相关系数(定义为数据集的标准偏差与对应数据集模型预测RMSE的比例)。如果估算的RMSE与种群传播相比较大,RPD相对较小且校准模型是非鲁棒的,那么RPD与R2之间具有确定的函数关系:RPD值越高,则模型的估算能力越强。本研究结论的模型性能主要基于RPD值,其中测试过程参考文献[14]:状态为RPD<1.4的模型无法用于预测;状态为1.4≤RPD≤2的模型具有预测潜力;RPD>2的模型具有预测能力。然后使用Akiake信息准则选择模型分量的最优数量[15]。

PPLS与PLS之间最大的差异是控制参数g,通过该参数可直接调节PPLS算法,g=0.5时PPLS模型则变换为普通的PLS模型。使用PPLS算法建模,调节g参数以获得RPD最大值,校准的PPLS模型包含1个回归系数的集合,其中每个系数对应1个测量的频带。本研究为植物的氮、水含量均建立了3个模型的校准程序。

除了多元建模,本研究测试所选择指标的预测能力最终将对应VI的计算值作为独立的变量,采用线性回归方法实现回归处理(代替PPLS)。

2 结果与分析

2.1 参考数据

首先为主要效果:水灌溉对测量的生物量与植物水含量产生了明显的影响,但是并不影响氮含量。地表小麦植物中施氮肥100 kg/hm2的小区比70 kg/hm2的小区生物量、含水量以及氮含量多,2015年新鲜生物量的差异较为明显。

在处理层,氮含量较高的小区生物量越多(W+N100),而2种不同水含量供给模式的生物量接近,其中,W-小区的生物量最少(图3)。

2.2 光谱数据

原始反射率数据的方差在NIR范围中高于频谱的可视部分,如图4所示,W+小区的冠层比W-小区多反射10%以上的NIR辐射能量。在NIR区域与绿色频带中(540~550 nm),反射数据中氮含量的影响较低,但随着氮含量的升高,反射率升高;而在其他频带中则具有最小的方差,例如,低含氮量小区(蓝色、红色频带)的反射率较低。对原反射率数据预处理以防止早熟并且消除频谱方差之间的差异。在频谱区域400~420、510~530、620~660、690~710 nm(图4),方差有所变化。

2.3 分类

在多元化分析的第一步,测试频谱数据是否包含在不同的处理条件下足够区分氮含量与水元素的信息。使用PCA为相关频带融入新的变量,在每个分析的频谱数据集中,前3个主成分的数量高于总方差的98%,如图5所示。

第1个主成分(PC1)包含植物水含量的信息,图5中可看出,沿着PC1坐标上,W-小区与W+小区之间具有明显的差异。分别分析2014年与2015年数据,W-小区的所有分数为负值,W+的所有小区分数是正值。在2014年相对干燥的季节,W0分数最高与W-分数为同一级别,在2015的潮湿季节,W0的分数与W+分数相当。

第2个主成分(PC2)包含的主要信息与植物氮含量相关,分别分析每年的情况,氮比例最高的小区趋向于负的,氮比例最低的小区总体为正的。

在2年总数据集的PCA分数小区中,最相关信息包含于PC1与PC3中。这说明PC2数据中包含额外的重要变化,大约为总方差的28.5%,本研究将变化归因于2年之间数据集的差异性。

2.4 校准

在PCA分类步骤中,分别处理各小区获得了较好的质量结果,本研究从氮与水含量的冠层光谱分析量化的信息。表1所示是多元PLS与PPLS的水与氮含量结果,其中对频谱反射数据进行预处理,并使用选择的窄带植被指数完成线性回归。

比较2个测试的多元校准方法,本研究发现一个总体轻度较好的性能PPLS方法比PLS。水含量被最优估计使用PPLS模型,将g值设为0.9,然而氮含量被最优估算,将g值设为0.8。PPLS与PLS模型之间RMSE的差异可忽略不计,但是更多信息的策略RPD显示估算的提高当是使用PPLS建模的时候。

考虑单年数据集的多元校准,证明水含量与频谱数据的相关性(R2=0.87)优于氮含量(R2=0.59),综合2年数据集则对2个特征分析均可获得较好的分析效果。因为R2增加到0.86的级别,所以氮含量的预测效果提高明显;多元模型对于2年综合的水含量估算仅略差于2013年的数据集。2年综合数据集的PPLS模型RPD值高于2,说明在量化模型中使用2个模型的有效性。

作为比较,本研究也测试了线性模型对水与叶绿素状态指标的有效性。对于估算氮与水含量的效果,多元模型优于基于指标的模型。对于2季的数据集,氮含量数据都可建立较好的模型,因为综合数据集的所有测试指标获得的RPD值均大于2,而单年数据集获得了较差的校准效果,其RPD值低于1.4,所以对于定量的氮估算,不可采用NDVI的结果。

通过比较可看出,所有的指标中基于NDVI的方法给出了水分估算的最优结果,一致性系数低于NDVI,说明其模型可能过度估算了极值。当从2年中遍历水分数据,基于指标的模型性能较差。

以下部分提出氮、水含量最适应的校准模型,如图6所示。模型使用PPLS,其g值分别为0.8与0.9。深度分析线性模型使用X-Y孤立点,Q-Q分布与Cook距离指出几个对应的孤立点。从图6的分布可看出,通过删除孤立点可明显地改进模型的适应度。

3 讨论

在Vis-NIR区域(400~950 nm)使用冠层反射的频谱信息,本方法在BBCH 32阶段可在地表区分小麦的水分与氮含量。在处理层,通过PCA分开定量处理,使用PPLS模型定量地估算氮、水含量,并基于参考数据校准。此外,本研究检测了不同的频带间隔(对于水模型尤其重要),在频谱中减小近红外区域(400~950 nm)。假设传感器具有有效的频谱范围来区分谷物中的水与氮含量,该假设对于施肥的优化极为重要。

4 结论

Vis-NIR区域的频谱信息(400~950 nm)可用于小麦中氮与水含量的估算,该信息对于氮含量的优化极为重要。本方法融入了反射数据的多元化分析,并采用数据预处理技术来估算田地异质性等因素所引起的方差。而基于指标的方法则不具备足够的信息来估算氮、水含量。

参考文献:

[1]许圆圆,祖艳群,陈建军,等. 元阳梯田周围不同植物群落氮元素背景值特征及其元素循环[J]. 云南农业大学学报:自然科学版,2012,27(2):270-275.

[2]彭向永,常 宝,徐术人,等. 谷胱甘肽对小麦幼苗铜毒害的缓解作用及其与氮、硫、磷积累的相关性[J]. 农业环境科学学报,2012,31(5):867-873.

[3]黄 擎,刘博睿,蔡华杰,等. 冻融交替对不同施肥水平的黑土中氮磷元素含量的影响[J]. 农业工程学报,2015(增刊1):188-195.

[4]王 磊,谢树果,苏东林,等. 基于时间序列分析的频谱异常自主检测和稳健估计方法[J]. 电子学报,2014(6):1055-1060.

[5]何东健,陈 煦,任嘉琛,等. 土壤速效磷含量近红外光谱田间快速测定方法[J]. 农业机械学报,2015,46(3):152-157.

[6]何东健,陈 煦. 土壤有机质含量田间实时测定方法[J]. 农业机械学报,2015,46(1):127-132.

[7]Morón A,García A,Sawchik J,et al. Preliminary study on the use of near-infrared reflectance spectroscopy to assess nitrogen content of undried wheat plants[J]. Journal of the Science of Food & Agriculture,2007,87(1):147-152.

[8]vergaard,S. I,Isaksson,T,Kvaal,K,et al. Comparisons of two hand-held,multispectral field radiometers and a hyperspectral airborne imager in terms of predicting spring wheat grain yield and quality by means of powered partial least squares regression[J]. Journal of Near Infrared Spectroscopy,2010,18(18):247-261.

[9]贺城,杨增玲,黄光群,等. 可见/近红外光谱分析秸秆-煤混燃物的秸秆含量[J]. 农业工程学报,2013,29(17):188-195.

[10]胡永光,陈培培,赵梦龙. 绿茶杀青叶料含水率可见-近红外光谱检测[J]. 农业机械学报,2013,44(8):174-179.

[11]Liao Y,Fan Y,Fang C. On-line prediction of pH values in fresh pork using visible/near-infrared spectroscopy with wavelet de-noising and variable selection methods[J]. Journal of FoodEngineering,2012,109(4):668-675.

[12]Wang J,Nakano K,Ohashi S,et al. Comparison of different modes of visible and near-infrared spectroscopy for detecting internal insect infestation in jujubes[J]. Journal of Food Engineering,2010,101(1):78-84.

[13]Riley H. Estimation of physical properties of cultivated soils in southeast Norway from readily available soil information[J]. Norwegian Journal of Agricultural Sciences,1996,25(Suppl):1-51.

[14]Chang C W,Laird,David A,et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J]. Soil Science Society of America Journal,2001,65(2):480-490.

[15]Akaike H. Information theory and an extension of the maximum likelihood principle[J]. Inter Symp on Information Theory,1973,1:610-624.

[16]Barnes E M,Clarke T R,Richards S E,et al. Coincident detection of crop water stress,nitrogen status and canopy density using ground-based multispectral data[C]. Proceedings of the 5th International Conference on Precision Agriculture Bloomington. Minnesota,USA,2000.

[17]Rouse J W,Haas R H,Schell J A,et al. Monitoring vegetation systems in the great plains with erts[J]. Nasa Special Publication,1974,351:309.

[18]Lelong C C D,Pinet P C,Poilvé H. Hyperspectral imaging and stress mapping in agriculture:a case study on wheat in Beauce (France)[J]. Remote Sensing of Environment,1998,66(2):179-191.

猜你喜欢
近红外光谱最小二乘法春小麦
早春小麦田间管理抓哪些
西藏春小麦SSR遗传多样性分析
春小麦复种大豆高产栽培技术
冬小麦和春小麦