基于GA-PLS-SPA的辣椒叶片叶绿素含量高光谱估测

2024-05-22 19:49:21彭俊杰汪泓王宇肖玖军李可相邢丹
江苏农业科学 2024年7期
关键词:叶绿素辣椒

彭俊杰 汪泓 王宇 肖玖军 李可相 邢丹

彭俊杰,汪 泓,王 宇,等. 基于GA-PLS-SPA的辣椒葉片叶绿素含量高光谱估测[J]. 江苏农业科学,2024,52(7):184-192.

doi:10.15889/j.issn.1002-1302.2024.07.025

(1.贵州大学矿业学院,贵州贵阳 550025; 2.贵州省山地资源研究所,贵州贵阳 550001; 3.贵州省土地绿色整治工程研究中心,贵州贵阳 550001; 4.贵州省农业科学院辣椒研究所,贵州贵阳 550009)

摘要:叶绿素对辣椒的长势评估和营养状况管理具有重要的意义,针对高光谱存在数据量大和冗余度高的问题,探究不同特征选择算法相结合进行高光谱叶绿素含量估测的可行性。以贵州省遵义市栽培辣椒为研究对象,采集盛果期辣椒冠层高光谱数据,通过卷积平滑(SG)、一阶微分(FD)、二阶微分(SD)和多元散射校正(MSC)处理原始光谱数据,比较不同预处理方法下的贝叶斯优化随机森林(BO-RF)估测效果,以MSC预处理后的数据为基础,运用遗传偏最小二乘算法结合连续投影算法(GA-PLS-SPA)进行最优特征波段选取,最后以GA-PLS、SPA和GA-PLS-SPA分别选取的特征波段作为输入变量,建立BO-RF、RF和BP神经网络模型来验证GA-PLS-SPA的普适性和广泛性。结果表明,MSC相比其他预处理方法对叶绿素含量的反演效果最好;相同估测模型条件下,基于GA-PLS-SPA建立的估测模型精度最高,选取特征波段数量最少,为7个,GA-PLS-SPA-BO-RF是估测叶绿素含量的最佳模型,训练集的R2、RMSE和RPD分别为0.896、2.791和3.124,测试集的R2、RMSE和RPD分别为0.913、2.965和3.414;相同算法建模条件下,BO-RF的精度明显高于RF和BP神经网络。MSC处理后的光谱能极大程度提取出辣椒叶片的叶绿素信息,GA-PLS-SPA能有效实现特征波段选取,降低模型复杂度,BO-RF具有良好的叶绿素含量反演能力。

关键词:辣椒;叶绿素;高光谱波段选择;遗传偏最小二乘算法;连续投影算法;贝叶斯优化随机森林

中图分类号:S127;641.301  文献标志码:A  文章编号:1002-1302(2024)07-0184-08

叶绿素含量是作物的重要生理生化参数,是进行光合作用的重要物质,能反映作物的生长状况,是重要的长势监测指标,因此,快速、精准地监测叶绿素含量对田间生产具有科学指导意义[1]。传统叶绿素含量测定方法存在破坏性、价格昂贵和费时等特点,便携式叶绿素仪通常用于测定植物叶片的SPAD值,可以在不破坏植物的情况下快速精确测定叶绿素含量。高光谱遥感因其提供了快速、无损、及时的数据采集方法,被广泛用于精确叶绿素含量测定[2]。SPAD值只能反映植株个体水平,实际监测作物群体长势相对耗时,因此,分析作物光谱信息与植株个体SPAD值之间的关系,对于快速估算SPAD值和发展精准农业具有重要意义[3]。

辣椒种植和加工产业是贵州省的优势产业,其产加销规模位居全国首位,是赋能乡村振兴的重要抓手,然而目前对于高光谱叶绿素含量估测的研究主要集中在水稻、小麦和棉花等作物上,关于辣椒叶片叶绿素含量估测的研究较少,因此有必要进行相关探讨[4-6]。针对辣椒叶片叶绿素含量估测研究方法较少和研究内容不够丰富等问题,蒋焕煜等利用近红外漫反射全波段范围内原始光谱结合偏最小二乘法(PLS)构建了尖椒叶片叶绿素含量估测模型[7]。郭宏亮等使用多元线性回归分别建立辣椒叶片叶绿素a、叶绿素b含量的检测模型并进行对比,但是该模型存在可能会丢失部分有用光谱信息或回归过程中没有考虑光谱矩阵中的噪声导致过拟合情况[8]。以往的研究主要采用单波段和多波段植被指数或全光谱数据建立的机器学习模型来估测叶绿素含量,然而采用全光谱数据时未考虑各波段间的共线性,难以解决光谱数据的冗余问题,而使用单一敏感波段时未考虑到其他波段,会造成光谱数据的浪费[9]。因此,对高光谱数据进行特征波段选取是提高模型精度、降低模型复杂度的必要条件。遗传算法(GA)、遗传偏最小二乘算法(GA-PLS)和连续投影算法(SPA)是常见的特征选取算法,GA是一种模拟自然进化搜索全局最优解的方法,GA-PLS综合了GA的全局优化搜索能力和PLS可有效解决变量间多重共线性问题的能力,SPA不仅能够减少参与建模的光谱波段个数,而且能够保证特征波段之间的共线性最小,从而提高建模效率[10-11]。目前在叶绿素含量估测研究中,利用特征选取算法相互结合进行波段选取的研究较少,刘潭等提出一种融合相关系数法、连续投影算法和随机蛙跳算法的算法来选取特征波段,并证明融合后的算法所建立的叶绿素含量估测模型精度更高[12]。高洪燕等在对生菜冠层氮素含量进行检测的研究中提出,BiPLS-GA-SPA 3种算法联用能极大程度去除光谱和相邻变量间的共线性[13]。章海亮等提出,遗传算法结合连续投影算法挑选的特征波长可以应用于近红外光谱检测土壤有机质含量[14]。以上研究表明,特征选取算法组合使用的效果比单一算法好,能最大程度提高模型精度和简化模型。

合适的光谱预处理方法,可以有效降低光谱中的噪声信息,提高模型的稳健性[15]。赵菡利用多项式基线扣除、多元散射校正(MSC)和卷积平滑(SG)等光谱变换方法结合XGBoost构建苹果叶片生化参数反演模型,提出SG-MSC-SPA-XGBoost算法组合反演效果最好[16]。杨晓宇等利用标准正态变量变换(SNV)、MSC、光谱一阶微分(FD)和二阶微分(SD)4种方法对高光谱数据进行预处理并进行对比分析,提出MSC能有效降低原始光谱噪声,增强光谱反射率与土壤属性间的相关性[17]。以上研究表明,MSC能有效去除光谱散射影响,提高模型精度和普适性。随机森林是基于多棵回归树的集成学习模型,较单棵决策树回归具有更高的估测精度和更好的泛化性能,是目前应用于反演研究较多的机器学习模型[18-20]。贝叶斯优化框架只需经过少数次的目标函数评估即可获得理想解,对于求解目标函数表达式未知、非凸的复杂优化问题,贝叶斯优化是一种有效方法[21]。然而,BO-RF在叶绿素反演研究中的应用还鲜有报道。

本研究以贵州省遵义市栽种的辣椒为研究对象,测定SPAD值和冠层高光谱数据,首先利用SG、FD、SD和MSC 4种光谱变换方法对原始光谱进行处理,并对比分析出最佳预处理方法,然后引入GA-PLS结合SPA算法选取最优特征波段,最后以最优特征波段为输入变量,构建贝叶斯优化随机森林(BO-RF)、随机森林(RF)和BP神经网络(反向传播网络)3个模型进行辣椒叶片叶绿素含量估测研究,以对比分析贝叶斯优化模型相比传统机器学习模型的优越性,验证GA-PLS-SPA方法的普适性和泛化性。

1 材料与方法

1.1 研究区概况与试验设计

研究时间为2021年9月6日(辣椒盛果期)。研究地点位于贵州省遵义市新蒲新区贵州省农业科学院辣椒研究所官庄示范基地(104°18′20″E,25°19′44″N),属于亚热带高原季风湿润性气候区,海拔高度为 800~1 150 m,日照充足,年降水量约为1 200 mm,气候、土壤等自然条件十分适合辣椒栽培。研究区采用2因素裂区设计,主要种植黔椒8号、红辣18号、辣研101号和红全球4个辣椒品种,种植时间为2021年4月9日。

1.2 数据获取与处理

1.2.1 辣椒叶片SPAD值测定

采用日本生产的SPAD-502叶绿素仪测定辣椒叶片SPAD值。测定时避开叶脉和不平整区域,在每张叶片上、中、下部分分别测定6~10次,然后取平均值作为样本实测值。

1.2.2 高光谱数据测定

采用美国ASD FieldSpec4 Standard-Res便携式地物光谱仪对辣椒冠层光谱信号予以测定,光谱范围为350~2 500 nm,取样间隔为1 nm。天气晴朗无风,采集时间为10:00—15:00。传感器探头垂直于植被,距离叶片高度15~30 cm,每采集5株植株进行白板校正,每株植株重复测量5次,取平均值作为该样本的反射率。

1.2.3 高光谱数据预处理

由于叶绿素主要与高光谱的可见光和近红外波段有相关性,因此选取的试验光谱区域为400~1 000 nm。为减少外界噪声影响和突出辣椒光谱曲线的特征信息,对原始光谱进行SG处理、并在SG处理的基础上分别进行MSC、FD和SD预处理,所有预处理过程均在Matlab R2020b中完成。

1.3 特征波段选取

1.3.1 遗传偏最小二乘算法

GA-PLS是通过结合遗传算法全局寻优和偏最小二乘法消除共线性的特点,实现对光谱数据的特征参数选择[2,22]。本研究以SPAD值为优化目标,叶片光谱数据为基因,进行二进制编码,随机生成初始种群,再将偏最小二乘算法中交叉均方根验证误差(RMSECV)作为遗传算法中的适应度函数,并使用遗传算法进行变量筛选。GA-PLS的结果具有随机性,因此重复执行10次,再根据贡献率高、RMSECV值小的筛选原则选取特征波段。

1.3.2 连续投影算法

SPA能基于相关性计算快速选择低冗余有效波长[23-24]。这种方法能最大程度消除光谱信息冗余和特征波段之间的共线性影响,提高模型运行效率和估测精度。本研究通过GA-PLS第1次特征选取获得有效特征波段,再利用SPA进行第2次特征波段选取,使最大投影向量所对应的波段为有效特征波段,消除了通过GA-PLS筛选出的变量子集中可能包含的冗余变量。SPA和GA-PLS均通过Matlab R2020b完成。

1.4 模型构建及精度验证

1.4.1 模型构建

本研究以GA-PLS-SPA筛选后的最优特征光谱为输入变量,叶绿素含量实测值为输出变量,通过Matlab R2020b分别构建贝叶斯优化随机森林(BO-RF)、随机森林(RF)和BP神经网络3种回归模型,首先利用贝叶斯优化随机森林对比分析不同光谱预处理对辣椒叶片叶绿素含量的估测效果,获得最优光谱预处理方法,然后利用上述3种模型对比分析GA-PLS结合SPA对叶绿素含量的估测效果和该方法的适用性和普适性。

RF具有非常强的拟合能力,建模速度快,处理大数据集(高光谱数据)时非常高效,而且算法对于结果具有可解释性,在解决反演问题方面具有独特的优势[25]。RF善于处理变量间的非线性关系,但其估测性能受回归树棵数、回归树最大深度、节点划分所需最小样本数、叶子节点最小样本数等参数的影响[18]。本研究中随机森林的超参数设置为n_estimators=100,max_depths=3,其他参数采用随机森林默认值。

超参数优化能有效提高机器学习模型精度,贝叶斯优化是高效的全局优化算法,可以在短时间内获得最优超参数值。其在优化过程中利用了贝叶斯定理[26]:

p(f|1 ∶t)=p(M1 ∶t|f)p(f)p(M1 ∶t);(1)

1 ∶t= {(x1,y1),(x2,y2),…,(xt,yt)}; (2)

yt=f(xt)+εt。(3)

式中:f表示參数模型中的参数,M1 ∶t表示已观测集合;xt表示决策向量;yt表示观测值;εt表示观测误差;p(M1 ∶t|f)表示近似分布;p(f)表示f的先验概率分布;p(M1 ∶t)表示边际化f的边际似然分布;p(f|M1 ∶t) 表示f的后验概率分布。

贝叶斯优化采用迭代的方式执行优化流程,首先随机生成初始化点,然后将选定的评估点值代入目标函数求出函数值,形成新的观测值点来扩充历史观测集,并根据新的观测集更新概率代理模型,为下一次迭代做准备;重复上述过程,直到满足精度要求[18]。本研究以高斯过程为概率代理模型,交叉验证精度为目标函数,重复优化迭代多次寻找最优超参数。贝叶斯进行随机森林超参数优化的结果为n_estimators=120,max_depths=6,其他参数采用随机森林默认值。

BP神经网络是一种具有良好非线性映射能力的神经网络[27]。国内外一些研究人员已经使用BP神经网络建立了作物叶绿素含量估测模型,并取得了良好的效果。模型主要参数设置为训练均方根误差小于1×10-5,学习率为0.01。

1.4.2 精度验证

本研究选用决定系数(R2)、均方根误差(RMSE)和相对分析误差(RPD)作为模型精度评价指标。R2用来评价模型的稳定性,R2越接近1,说明模型稳定性越好;RPD和RMSE用来评价模型的估测能力,RMSE越小模型估测能力越强;当RPD<1.4时,表示模型不能估测样本;当1.4≤RPD<2.0时,表示模型可以对样本进行大致估计,可以通过对模型进行改进,提高模型的估测能力;当RPD≥2.0时,表示该模型鲁棒性较强[28]。具体公式见式(4)~式(6)。

RMSE=∑ni=1(y^i-y^)2[]n; (4)

R2=1-∑n[]i=1(y[DD(-*1]^i-yi)2[]∑n[]i=1(yi-y)2 ;(5)

RPD=SD[]RMSE。(6)

式中:n表示样本数;y^i为估测值;yi为实测值;y为样品均值;SD表示估测样本的标准差。

2 结果与分析

2.1 辣椒SPAD值统计分析

本研究共采集80株植株作为有效研究样本,每株植株为1个样本,采用最小距离算法(KS)划分数据集,选取75%的样本数据(60株)用来训练模型,25%(20株)用来测试模型,划分结果如表1所示。训练集样品的辣椒叶片SPAD值范围为37.0~76.5,均值为61.42,标准差为8.66;测试集样品的辣椒叶片SPAD值范围为37.0~71.9,均值为61.04,标准差为10.07,训练集和测试集样本的变异系数分别为14.10%和16.50%,变异系数均小于20%,变异程度较小,样本划分合理。

2.2 原始光谱和光谱预处理分析

为分析不同高光谱预处理方法对辣椒叶片叶绿素含量估测模型的影响,分别对原始光谱进行SG、FD、SD和MSC 4种预处理,原始光谱和预处理后的光谱如图1所示,不同预处理方法下的模型估测结果如表2所示。由图1-a可知,辣椒叶片的原始光谱曲线与典型植被光谱曲线的变化趋势基本相同,具有明显的变化规律,即可见光波段(400~780 nm)反射率较低,光谱曲线大量重叠,近红外波段(780~1 000 nm)反射率较高,然而光谱反射率值差异较大,其中在400~500 nm和600~680 nm波段内出现叶绿素强吸收带,绿光波段(550 nm)出现反射峰,680~760 nm波段随波长增加反射率急剧上升,760~1 000 nm波段形成植被特有的高反射率平台。通过图1-b至图1-e可知,SG、FD、SD和MSC 4种预处理均可在不同程度上消除原始光谱的基线平移和漂移问题,减少因环境、仪器自身等因素造成的背景噪声,增强部分波段反射率。

由表2可知,通过原始光谱建模的训练集和测试集的R2分别为0.786和0.534,RPD分别为2.160和1.473,说明原始光谱存在一定的噪声影响,模型存在过拟合现象。进行SG、FD、SD和MSC这4种预处理后,模型的估测精度都有一定程度的提高,均能较好地实现叶绿素含量估测,其中MSC预处理后的估测精度最高,训练集和测试集的R2均大于0.8,RPD均在2.5左右,说明MSC预处理能最大程度消除光谱散射影响;SD预处理后的估测精度最低,训练集和测试集的R2均小于0.75,RPD均在2左右。FD和SD预处理后的建模精度比MSC处理后的建模精度低,说明整数阶微分会忽略一些与叶绿素含量相关的信息,造成光谱信息丢失或背景噪声放大,影响模型性能[29-30]。因此,将MSC预处理后的光谱作为后续分析研究特征波段选取的基础。

2.3 特征波段选取结果分析

2.3.1 GA-PLS选取特征波段分析

高光谱数据具有信息冗余和波谱间信息重叠的特征,需要进行特征波段选取,以减少建模波段数并提升估测精度。本研究利用GA-PLS对MSC处理后的辣椒叶片反射光谱(400~1 000 nm)进行第1次特征波段选取,共计选取601个波段,GA-PLS返回贡献率及RMSECV结果如表3所示。由表3可知,共筛选了4个波段数,分别为9、17、49、126个波段,对应的贡献率均达到99%以上,对应的RMSECV值最大为0.075,最小为0.071。当49个波段被选用时,贡献率最大,为99.486%,RMSECV值最小,为0.071,根据贡献率高、RMSECV值小的筛选原则,选择49个特征波段用于后续连续投影算法研究。图2表示GA-PLS所选取特征波段在MSC光谱曲线上的分布情况。综合分析来看,GA-PLS具有良好的全局搜索和信息提取能力,选取49个特征波段,被剔除波段数占总波段数的91.847%,可以最大程度消除无用波段;所选特征波段分布在550 nm和 700 nm 附近以及近红外波段,集中在可见光波段内的特征波段较多,说明此处含有与叶绿素相关的信息较多,但也可能含有少量冗余信息,因此被选取的49个特征波段不是最优特征波段数。

2.3.2 GA-PLS-SPA选取特征波段分析

为了进一步简化模型和减少冗余信息以提高模型精度,在GA-PLS筛选出49个波段的基础上,利用SPA进行第2次特征波段选取。GA-PLS-SPA所选取特征波段在MSC光谱曲线上的分布情況如图3-a所示。由图3-a可知,通过SPA算法进一步筛选后,被选特征波段数量大幅减少,共选出7个波段,占GA-PLS选取波段总数的14.286%,占MSC光谱波段总数的1.165%,即原始MSC光谱数据的压缩率为98.835%,输入变量减少的同时简化了模型结构;GA-PLS-SPA选取出的7个最优特征波段为524、598、644、685、712、784、903 nm,所选波段分布在绿峰(500~600 nm)、红边(700 nm左右)和近红外波段(780~1 000 nm)处,其中位于可见光波段内的特征波段最多,有5个波段,位于近红外波段内的特征波段最少,有2个波段。图3-b表示利用SPA对MSC光谱选取特征波段的结果,可以看出,SPA选取特征波段数为78个,被剔除波段数占总波段数的87.022%,所选特征波段集中在可见光和近红外波段,说明直接利用SPA对MSC原始光谱进行波段特征选取可以在一定程度上消除冗余波段,但不能明显确定对辣椒叶片叶绿素敏感性强的波段。

2.4 叶绿素含量估测模型结果与分析

表4是基于不同特征选取方法的不同回归模型的估测结果,可以看出,通过SPA、GA-PLS和GA-PLS-SPA构建的回归模型均能在一定程度上提高模型精度和减少需要输入的特征波段数量。基于MSC全光谱建模中BO-RF精度最高,训练集R2、RMSE和RPD分别为0.839、3.472和2.498,测试集R2、RMSE和RPD分别为0.838、4.055和2.507,RF和BP精度偏低,估测效果一般,RPD均小于2,说明全光谱数据量大且含有冗余信息较多,需要进行特征波段优选。基于SPA或者GA-PLS建模中BO-RF、RF和BP 3个模型均能达到估测辣椒叶片叶绿素含量的要求,其中BO-RF模型效果最好,RF和BP效果表现一般,RF和BP训练集的R2均小于0.82,RMSE最小为3.743,RPD范围为2.091~2.313,测试集的R2均小于0.81,RMSE最小为4.404,RPD范围为2.042~2.286。基于GA-PLS-SPA建模中BO-RF、RF和BP 3个模型精度均得到显著提高并且明显高于全光谱、SPA或GA-PLS建模,其中BO-RF模型精度最優,训练集的R2、RMSE和RPD分别为0.896、2.791和3.124,测试集的R2、RMSE和RPD分别为0.913、2.965和3.414。说明SPA和GA-PLS选取出的特征波段还含有不同程度的冗余信息,波段间存在信息重叠,GA-PLS-SPA通过2次特征波段选取进一步消除了冗余信息,选出的波段更具有代表性,模型也大大简化。

综上所述,GA-PLS-SPA是一种高效的特征波段选取方法,BO-RF在反演叶绿素含量方面具有极大的优越性,两者结合构建的辣椒叶片叶绿素含量反演模型的估测效果明显优于RF或BP建立的模型,GA-PLS-SPA-BO-RF可有效提高建模效率和精度。图4表示GA-PLS-SPA-BO-RF模型的训练集和测试集散点分布。

3 讨论与结论

3.1 讨论

本研究结果显示,辣椒叶片的原始光谱曲线符合绿色植物叶片光谱曲线的变化规律,即在叶绿素和类胡萝卜素的强吸收带(400~490 nm)处反射率较低;在绿光波段,叶绿素的强反射导致光谱曲线出现波峰;在近红外波段反射率急剧上升后出现反射率平台,这可能与叶绿素对红光波段强烈吸收和近红外波段在叶片内部多次散射而形成强反射有关[31]。卷积平滑、多元散射校正、一阶导数和二阶导数4种光谱预处理方法可有效提高模型估测精度,其中基于多元散射校正方法构建的模型精度最高。这主要是因为多元散射校正解决了冠层反射光谱绝对强度差异大,光谱间存在基线平移和偏移的问题,增强了与叶绿素相关的有效信息,提高了光谱信噪比,这与毛博慧等研究得出的结论[32-33]一致。对复杂样品的光谱数据进行分析时,虽然多种预处理方法可以被用于数据的预处理,但找到一种最佳的预处理方法是很重要的工作[34]。

GA-PLS、SPA、GA-PLS-SPA分别选择了49、78、7个特征波段进行建模。结果表明,对高光谱数据进行特征波段选取,可在提升模型精度的同时简化模型结构,而且GA-PLS-SPA建模效果要优于单一的GA-PLS或SPA建模。这是因为高光谱能带来丰富光谱信息的同时,也带来了信息冗余,需要进行特征波段选取[35-36]。相关研究表明,SPA筛选出的波段子集中可能包含一些无信息波段甚至是干扰波段,不能保证选取出的波段之间共线性最小[37-38]。GA-PLS具有良好的全局搜索能力和信息提取能力,通过GA-PLS在全光谱范围内选取特征波段构成SPA的候选集,然后在此基础上进行SPA特征波段选取,避免了SPA选择结果中包含无信息波段和干扰波段。本研究所选取的特征波段分布在绿峰(500~600 nm)、红边(700 nm左右)和近红外波段(780~1 000 nm)处,与前人的研究基本相同,然而具体特征波段不同[2,32]。这是因为辣椒品种和果实颜色不同会造成所选具体特征波段不同,并且辣椒叶片光谱内可能存在土壤和杂草等干扰物造成的背景噪声。

传统线性回归模型可能会忽略高光谱与叶绿素的非线性关系,导致估测模型精度受到影响[39]。因此,本研究利用贝叶斯优化随机森林方法,输入通过GA-PLS-SPA选取的7个最优特征波段,建立辣椒叶片叶绿素含量估测模型。由结果可知,BO-RF 模型的精度明显高于RF模型,这主要是因为贝叶斯优化调节了n_estimators和max_depths等对随机森林模型性能影响较大的超参数,并且贝叶斯优化迭代次数少,收敛速度快,适合小维度的调参需求。

3.2 结论

本研究以80个辣椒叶片的SPAD值为研究对象,对原始光谱进行SG、FD、SD和MSC 4种预处理,并进行对比分析,提出结合GA-PLS和SPA选取最优特征波段,并与全光谱、SPA和GA-PLS进行比较,同时构建了BO-RF、RF和BP估测模型,主要结论如下:

(1)SG、FD、SD和MSC 4种预处理均在不同程度上提高了模型精度,其中利用MSC预处理后的光谱数据建立的模型精度最高,说明MSC能有效解决基线偏移和漂移问题,是一种能有效提高建模精度的光谱预处理方法。

(2)GA-PLS-SPA选取的7个最优特征波长建模精度最高,并且构建的BO-RF、RF和BP 3个模型均能实现辣椒叶片叶绿素含量估测,其中GA-PLS-SPA-BO-RF精度最高,训练集的R2、RMSE和RPD分别为0.896、2.791和3.124,测试集的R2、RMSE和RPD分别为0.913、2.965和3.414。表明GA-PLS-SPA能提高模型精度的同时简化模型复杂度,是一种具有强泛化性和适用性的特征波长选取算法。

(3)在相同特征波段建模时,BO-RF模型的精度比RF模型高,说明贝叶斯优化可以避免不必要的参数评估,能有效解决RF模型的局部最优问题,提高RF模型的性能。

本研究仅针对辣椒盛果期的叶绿素含量进行研究和模型构建,同时样本数量还不够丰富,未来将继续研究关于不同品种或相同品种不同生育期的辣椒叶片叶绿素含量估测方法。

参考文献:

[1]冯海宽,陶惠林,赵 钰,等. 利用无人机高光谱估算冬小麦叶绿素含量[J]. 光谱学与光谱分析,2022,42(11):3575-3580.

[2]Chen X W,Dong Z Y,Liu J B,et al. Hyperspectral characteristics and quantitative analysis of leaf chlorophyll by reflectance spectroscopy based on a genetic algorithm in combination with partial least squares regression[J]. Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2020,243:118786.

[3]武改红,冯美臣,杨武德,等. 冬小麦叶片SPAD值高光谱估测的预处理方法[J]. 生态学杂志,2018,37(5):1589-1594.

[4]Ban S T,Liu W Z,Tian M L,et al. Rice leaf chlorophyll content estimation using UAV-based spectral images in different regions[J]. Agronomy,2022,12(11):2832.

[5]Wang T L,Gao M F,Cao C L,et al. Winter wheat chlorophyll content retrieval based on machine learning using in situ hyperspectral data[J]. Computers and Electronics in Agriculture,2022,193:106728.

[6]Xiao Q L,Tang W T,Zhang C,et al. Spectral preprocessing combined with deep transfer learning to evaluate chlorophyll content in cotton leaves[J]. Plant Phenomics,2022,2022:9813841.

[7]蒋焕煜,应义斌. 尖椒叶片叶绿素含量的近红外检测分析实验研究[J]. 光谱学与光谱分析,2007,27(3):499-502.

[8]郭宏亮,黄 帅,聂楚楚,等. 基于分光吸收特性的辣椒叶片叶绿素含量测量方法研究[J]. 东北农业科学,2021,46(5):82-86.

[9]肖志云,王伊凝. 基于RF-VR的紫丁香叶片叶绿素含量高光谱反演[J]. 浙江农业学报,2021,33(11):2164-2173.

[10]王玉娜,李粉玲,王伟东,等. 基于连续投影算法和光谱变换的冬小麦生物量高光谱遥感估算[J]. 麦类作物学报,2020,40(11):1389-1398.

[11]蔡建楠,劉海龙,姜 波,等. 基于GA-PLS算法的河网水体化学需氧量高光谱反演[J]. 灌溉排水学报,2020,39(9):126-131.

[12]刘 潭,许童羽,于丰华,等. 改进特征波段选取和混合集成建模的东北粳稻叶绿素含量估算[J]. 光谱学与光谱分析,2021,41(8):2556-2564.

[13]高洪燕,毛罕平,张晓东. 光谱技术结合BiPLS-GA-SPA和ELM算法的生菜冠层氮素含量检测研究[J]. 光谱学与光谱分析,2016,36(2):491-495.

[14]章海亮,罗 微,刘雪梅,等. 应用遗传算法结合连续投影算法近红外光谱检测土壤有机质研究[J]. 光谱学与光谱分析,2017,37(2):584-587.

[15]刘燕德,程梦杰,郝 勇,等. 柑橘叶片叶绿素含量拉曼光谱定量分析方法研究[J]. 光谱学与光谱分析,2019,39(6):1768-1772.

[16]赵 菡. 苹果叶片高光谱生化参数高通量反演模型研究[D]. 阿拉尔市:塔里木大学,2022:38-66.

[17]杨晓宇,包妮沙,曹 粤,等. 基于无人机成像光谱技术的农田土壤养分估测及制图[J]. 地理与地理信息科学,2021,37(5):38-45.

[18]杨练兵,陈春波,郑宏伟,等. 基于优化随机森林回归模型的土壤盐渍化反演[J]. 地球信息科学学报,2021,23(9):1662-1674.

[19]陈 澜,常庆瑞,高一帆,等. 猕猴桃叶片叶绿素含量高光谱估算模型研究[J]. 西北农林科技大学学报(自然科学版),2020,48(6):79-89,98.

[20]王 庆,车荧璞,柴宏红,等. 基于无人机影像的冠层光谱和结构特征监测甜菜长势[J]. 农业工程学报,2021,37(20):90-98.

[21]李爱民,王海隆,许有成. 优化随机森林算法的城市湖泊DOC质量浓度遥感反演[J]. 郑州大学学报(工学版),2022,43(6):90-96.

[22]Jin J,Wang Q. Evaluation of informative bands used in different PLS regressions for estimating leaf biochemical contents from hyperspectral reflectance[J]. Remote Sensing,2019,11(2):197.

[23]袁 莹,王 伟,褚 璇,等. 光谱特征波长的SPA选取和基于SVM的玉米颗粒霉变程度定性判别[J]. 光谱学与光谱分析,2016,36(1):226-230.

[24]Wang X W,Xing X Y,Zhao M C,et al. Comparison of multispectral modeling of physiochemical attributes of greengage:Brix and pH values[J]. Food Science and Technology,2021,41(S2):611-618.

[25]由明明,常庆瑞,田明璐,等. 基于随机森林回归的油菜叶片SPAD值遥感估算[J]. 干旱地区农业研究,2019,37(1):74-81.

[26]崔佳旭,杨 博. 贝叶斯优化方法和应用综述[J]. 软件学报,2018,29(10):3068-3090.

[27]Qi H X,Wu Z Y,Zhang L,et al. Monitoring of peanut leaves chlorophyll content based on drone-based multispectral image feature extraction[J]. Computers and Electronics in Agriculture,2021,187:106292.

[28]Wang F L,Yang M,Ma L F,et al. Estimation of above-ground biomass of winter wheat based on consumer-grade multi-spectral UAV[J]. Remote Sensing,2022,14(5):1251.

[29]李长春,施锦锦,马春艳,等. 基于小波变换和分数阶微分的冬小麦叶绿素含量估算[J]. 农业机械学报,2021,52(8):172-182. [HJ2mm]

[30]Bhadra S,Sagan V,Maimaitijiang M,et al. Quantifying leaf chlorophyll concentration of Sorghum from hyperspectral data using derivative calculus and machine learning[J]. Remote Sensing,2020,12(13):2082.

[31]唐恒朋,钱晓刚,李莉婕,等. 不同施氮水平辣椒单叶光谱特征及SPAD值与叶绿素含量的相关性[J]. 西南农业学报,2016,29(10):2324-2329.

[32]毛博慧,李民赞,孙 红,等. 冬小麦苗期叶绿素含量检测光谱学参数寻优[J]. 农业工程学报,2017,33(增刊1):164-169.

[33]Kong L J,Yu H Y,Piao Z J,et al. Study of spectral response characteristics of oilseed rape (Brassica napus) to particulate [JP3]matters based on hyper-spectral technique[J]. Phyton-International [JP]Journal of Experimental Botany,2021,90(3):1015-1030.

[34]第五鵬瑶,卞希慧,王姿方,等. 光谱预处理方法选择研究[J]. 光谱学与光谱分析,2019,39(9):2800-2806.

[35]杨红艳,杜健民. 高光谱遥感图像波段选择研究进展综述[J]. 计算机工程与应用,2022,58(10):1-12.

[36]Yang J,Yang S X,Zhang Y Y,et al. Improving characteristic band selection in leaf biochemical property estimation considering interrelations among biochemical parameters based on the PROSPECT-D model[J]. Optics Express,2021,29(1):400-414.

[37]程介虹,陈争光. 基于迭代保留信息变量和连续投影的近红外光谱波长选择方法[J]. 分析化学,2021,49(8):1402-1409.

[38]Tang R N,Chen X P,Li C.Detection of nitrogen content in rubber leaves using near-infrared (NIR) spectroscopy with correlation-based successive projections algorithm (SPA)[J]. Applied Spectroscopy,2018,72(5):740-749.

[39]于丰华,冯 帅,赵依然,等. 粳稻冠层叶绿素含量PSO-ELM高光谱遥感反演估算[J]. 华南农业大学学报,2020,41(6):59-66.

基金项目:国家重点研发计划(编号:2022YFD1100307);贵州省科技支撑计划(编号:黔科合支撑[2020]1Y172号、黔科合支撑[2021]一般496号、黔科合支撑[2021]一般173号);贵州科学院青年基金(编号:黔科院J字[2018]25号)。

作者简介:彭俊杰(1996—),男,贵州贵阳人,硕士,主要从事摄影测量与遥感方面的研究工作。E-mail:1962671749@qq.com。

通信作者:汪 泓,博士,副教授,主要从事喀斯特地区遥感与数字摄影测量方面的研究。E-mail:7653606@qq.com。

猜你喜欢
叶绿素辣椒
关于辣椒的快问快答
原来,你还是这样的辣椒
你的辣椒结出果实了吗?
辣椒也疯狂
提取叶绿素
拣辣椒
中外文摘(2020年9期)2020-06-01 13:47:56
锌对白菜和香葱叶绿素含量的影响研究
绿色科技(2019年2期)2019-05-21 07:43:20
桃树叶绿素含量与SPAD值呈极显著正相关
叶绿素家族概述
生物学教学(2017年9期)2017-08-20 13:22:32
秋天的树叶为什么会变色