基于多维度光谱特征波长提取大豆冠层SPAD值估算模型

2020-06-17 01:37李伟凯关海鸥侯玉龙

江苏大学学报（自然科学版） 2020年3期

王璐,李伟凯,关海鸥,于崧,侯玉龙

(1.黑龙江八一农垦大学电气与信息学院,黑龙江大庆 163319;2.东北农业大学电气与信息学院,黑龙江哈尔滨 150030;3.黑龙江八一农垦大学农学院,黑龙江大庆 163319)

叶绿素是植物营养胁迫、光合能力和衰老进程阶段的良好指示器[1].因此,通过获取大豆叶片叶绿素含量对掌握大豆全育生长状况的实时监测具有重要指导意义.传统检测叶绿素主要使用化学试剂方法,其检测方法不仅对农作物有损,且存在操作过程复杂和操作时间长等缺点[2].目前实际研究和应用中,常以叶片叶绿素相对含量(SPAD值)表征叶绿素含量.以往大多采用叶绿素测定仪来获取农作物SPAD值,但检测方式普遍存在繁琐、费时等问题[3].近红外光谱分析技术具有无损、简便和快速等优势[4-6],可为检测农作物叶片SPAD值提供一种新的手段.高明[7]利用近红外光谱分析技术研究了冬小麦叶片叶绿素含量.周衍华[8]利用近红外光谱技术对脐橙叶片的含氮量、含水量和叶绿素含量等3个生化参数指标进行定量模型研究.任配培[9]利用近红外光谱技术,检测苹果表皮叶绿素含量,对果实成熟度进行快速无损检测.上述基于近红外光谱技术对农作物叶绿素含量进行了检测研究,但是大多数研究是以南方农作物为研究对象,而以北方寒地农作物为例,基于多维度光谱特征波长提取农作物SPAD值估算模型的研究鲜有报道.

为此,通过以北方寒地农作物中的大豆为例,应用多种光谱特征波长段提取技术,掌握全生育期大豆冠层近红外光谱曲线特性,提出基于多维度光谱特征波长提取大豆冠层SPAD值估算模型.

1 材料和方法

1.1 样本数据

试验设备为德国布鲁克制造的近红外光谱仪,波数范围为11 542～3 946 cm-1,分辨率为8 cm-1,扫描次数为32次.试验样本为采自黑龙江八一农垦大学盆栽基地的270个健康大豆叶片样本.大豆样本近红外光谱如图1所示.按2 ∶1的比例划分大豆冠层样本集,选择180个大豆样本作为校正样本和90个大豆样本作为预测样本[10].由图1可知,由于光谱仪在测量范围的两端包含了较大的噪音,因此选择全部样本光谱的波长范围为 990～2 452 nm(波数为10 105～4 078 cm-1),并进行分析,采用多元散射校正方法(MSC)对近红外光谱预处理,结果如图2所示.

图1 270个大豆样本近红外光谱波数-吸光度曲线

图2 MSC预处理近红外光谱波数-吸光度曲线

1.2 SPAD值测定

大豆样本的SPAD值测定与近红外光谱数据采集同步进行,使用TYS-A型手持农作物叶绿素测定仪.为了减小误差,在大豆冠层每片叶子的中部选取均匀分布的3个点(避开叶脉),测量其SPAD值[11],然后计算平均值,并以此作为该样本的SPAD值.每个大豆叶片测量的SPAD值与其近红外光谱曲线相对应.

1.3 特征波长提取方法

1.3.1竞争性自适应重加权采样算法

采用竞争性自适应重加权采样算法(CARS),通过计算交互验证均方根误差(RMSECV),并选择RMSECV最小值所对应的波长变量子集,作为提取的大豆冠层光谱曲线的特征波长.

1.3.2主成分分析算法

采用主成分分析算法(PCA)提取大豆冠层光谱曲线的特征波长,选取能代表光谱特征的主成分用来代替多维大豆冠层光谱数据和提取SPAD值相关的权重较大的特征波长.

1.3.3连续投影算法

利用连续投影算法(SPA)对大豆冠层SPAD值进行光谱波长最优值的选择,以投影向量最大的波长作为大豆冠层光谱曲线的待选波长,然后通过预测均方根误差(RMSEP)提取最优的特征波长数量,即检测大豆冠层SPAD值最佳特征波长.

2 结果与分析

2.1 SPAD值分析

大豆冠层样本的SPAD值的平均值、最大值、最小值和标准偏差见表1.

表1 大豆样本SPAD值的描述性统计

2.2 预处理和建模方法优选

针对大豆冠层多维光谱特性,对波长为990～2 452 nm的原始光谱波长-吸光度曲线进行卷积平滑和多元散射校正预处理,并选择偏最小二乘回归(PLSR)和主成分回归(PCR)作为建模方法.预处理方法结果如表2所示,其中RMSEC为校正均方根误差,RMSEP为预测均方根误差,rp为预测相关系数.通过分析得到优选的预处理和建模方法.

表2 SPAD值预测模型的预处理方法结果

由表2可知,采用PLSR建模检测大豆冠层SPAD值的精度明显优于PCR建模;对原始光谱进行卷积平滑处理后,再进行建模,与未处理前的光谱建模效果相差较小;基于多元散射校正预处理后的PLSR建模效果较佳,该模型校正样本和预测样本均方根误差分别为5.96和6.89,平均值约为6.43,预测相关系数较高.因此,对原始光谱优选多元散射校正预处理和PLSR建模方法.

2.3 特征波长的提取

2.3.1竞争性自适应重加权采样算法

选择竞争性自适应重加权采样算法(CARS)提取大豆冠层特征波长的变化过程如图3 所示.图3为波长数、交互验证均方根误差(RMSECV)及回归系数路径r′与运行次数关系曲线.由图3波长数曲线可知,在采样前期,大豆冠层光谱波长数量快速减少,随着运行次数增加,曲线逐渐平稳.

图3 波长数、均方根误差及回归系数路径与运行次数关系曲线

由图3的RMSECV曲线还可知,随着运行次数增加,曲线呈先缓慢下降、再快速上升的趋势,运行次数为32次时RMSECV值达到最小,此时检测SPAD值的模型精度较好.图3中回归系数路径曲线为波长提取过程中各波长变量在每次采样中的回归系数路径.因此,根据RMSECV值最小的原则,基于第32次采样中获得的子集定为与检测大豆冠层SPAD值含量相关的重要变量子集,提取的22个特征波长见表3.

表3 通过CARS算法选择的特征波长

2.3.2主成分分析算法

由于近红外多维度光谱波长较多,可应用主成分分析法计算主成分特征值、贡献率及累积贡献率,从而提取与SPAD值相关的权重较高的特征波长,其结果如表4所示.第1主成分的累积贡献率为81.296%,小于85%;第2主成分的累积贡献率为90.709%,因为大于85%,且前两个特征值均大于1,可看作基本包含了全部光谱的主要信息,所以选取前两个主成分代替多维大豆冠层光谱,最后通过主成分分析法得到51个特征波长.

表4 主成分因子分析表

2.3.3连续投影算法

利用连续投影算法对检测大豆冠层SPAD值的光谱波长进行选择,然后基于RMSEP值来确定最优的特征波长数量,即检测大豆冠层SPAD值的特征波长.

经过分析,根据最小均方根误差RMSEP=4.128 9,从1 464个波长点中提取大豆冠层光谱中的12个特征波长,如图4所示.

图4 SPA提取特征波长

3 讨论

3.1 估算SPAD值的不同模型结果分析

为了构建自动检测大豆叶片SPAD值的智能估算模型,并根据前面获得的原始光谱经多元散射校正预处理，利用PLSR建模可以获得较好结果前提下,在建模过程中选择利用CARS，PCA和SPA等3种算法，将和SPAD值相关的权重比较大的光谱曲线特征波长提取出来,并和多元散射校正预处理后的光谱波长进行比较.

由于多元线性回归(MLR)具有分析特征波长光谱信息的特点,因此后续可选取MLR和上一阶段效果最好的PLSR建模方法,进行基于多维度光谱特征波长提取大豆冠层SPAD值模型对比分析,从而选取检测SPAD值效果最好的模型,结果如表5所示,其中r为相关系数.

表5 检测大豆SPAD值的各模型参数

分析表5中基于不同特征波长的PLSR建模方法的模型结果可知,CARS算法提取特征波长的数量较少,且相较于多元散射校正预处理后的光谱波长及采用PCA算法和SPA算法建立模型显示的均方根误差和相关系数都较好.还可看出CARS-PLSR模型中其预测相关系数从0.731 3增大到0.857 2,校正均方根误差(RMSEC)从5.96减小到5.85，预测均方根误差(RMSEP)从6.89减小到4.45,且选择的特征波长数量从1 464个减少到22个,可见CARS-PLSR模型效果较好.

分析基于不同特征波长的MLR建模方法的模型结果可知:其PCA算法提取的特征波长数量较多,校正集和预测集的均方根误差和相关系数差异较大,且预测集的相关系数较小,预测均方根误差(RMSEP)较大;用CARS算法和SPA算法提取特征波长数量较少,选用CARS算法构建的模型中校正集和预测集的均方根误差和相关系数差异较小;比较CARS-PLSR和CARS-MLR两个模型可看出,CARS-MLR模型建立的校正集和预测集的相关参数差异较小,整体模型较稳定.

因此,选择CARS-MLR作为估算大豆冠层SPAD值的特征波长模型,在保证精度的前提下,大大简化了模型,提高了SPAD值的检测效率.

3.2 基于CARS-MLR模型估算SPAD值

CARS-MLR估算模型表述为

(1)

式中:y为大豆冠层SPAD值向量;x为提取的特征波长下对应的吸光度值;β为回归系数;ζ为SPAD值智能估算模型的误差;c为大豆冠层样本个数,个;k为通过CARS算法提取的大豆冠层特征波长光谱的维度,维.

3.3 不同的SPAD值估算模型的预测与验证

采用CARS-MLR,PCA-MLR和SPA-MLR模型,分别对估算的SPAD值预测效果进行验证.图5为3种模型估算SPAD值预测值与实测值的散点图.

由图5可知:采用CARS-MLR构建SPAD值的智能估算模型的校正样本和预测样本均方根误差分别为5.67和5.94,平均值约为5.81，模型效果较稳定.因此,基于CARS-MLR模型能较好地检测SPAD值,验证发现该模型检测大豆冠层SPAD值是可行的.

图5 3种模型估算SPAD值预测值与实测值的散点图

4 结论

1) 在采集大豆冠层光谱数据的基础上,提出检测大豆冠层SPAD值时,优选的多元散射校正预处理和偏最小二乘回归建模方法,可为快速检测大豆冠层SPAD值提供有效方法.

2) 采用竞争性自适应重加权采样算法、主成分分析法和连续投影算法,分别得到能较准确检测大豆冠层SPAD值的最佳特征波长数量分别为22,51和12个.

3) 将提取的特征波长作为新的输入变量,通过对模型效果进行综合分析,提出了基于多维度光谱特征波长提取大豆冠层SPAD值的估算模型,该模型旨在为今后农业生产中快速检测叶片SPAD值提供参考方法.