李 贞,王家强,李紫琴,邹德秋,张小功,韩建文,柳维扬
(塔里木大学 农学院∕南疆干旱区特色作物遗传改良与高效生产兵团重点实验室,新疆 阿拉尔 843300)
【研究意义】棉花氮素监测是评价棉花生长状况与氮肥合理施用的重要手段之一,棉花氮素营养缺乏时,其自身生理、生化参数发生一系列改变,研究表明这些参数可用于准确指示棉花氮素营养状况[1-2]。目前新疆大田棉花的现代化生产迫切需要一种适时可靠地监测棉花氮素营养状况的技术从而指导精确施肥。传统的氮素测量,需要耗费大量的时间,高光谱遥感技术作为对地的重要技术手段,可以实现棉花氮素含量无损、实时、精准和大面积监测。【前人研究进展】近些年来,高光谱遥感监测棉花也受到了广大研究者的关注,黄春燕等[3]通过高光谱监测叶片氮积累量;吴华兵等[4]利用冠层高光谱反射率及高光谱参数分析了不同施氮水平下不同棉花品种叶片氮含量与冠层反射光谱的定量关系;王克如等[5]棉花冠层光谱特征及其与植株氮含量间的定量关系以期实现棉株氮素的无损监测。采用高光谱技术对棉花养分监测分析时,会受到土壤背景、日照强度等多种因素的影响,导致测定的高光谱数据掺杂有噪声,因此需要对光谱数据进行预处理[6-7]。目前存在的光谱预处理方式种类较多,作为最基础的预处理方式Savitzky-Golay(SG)平滑算法,可以去除噪声。提高图谱信噪比,但通过SG 平滑过多或者过少均会使数据失真,导致精度降低[8]。连续小波变换(continuous wavelet transformation,CWT)在微弱信号处理方面具有一定优势,可在多尺度分解中得到光谱细节特征,提高信噪比。近年来,连续小波变换凭借处理光谱数据的优势,受到各方面学者越来越多的关注。李长春等[9]基于小波能量系数的冬小麦生物量估算,发现连续小波变换提高了模型精度;王延仓等[10]、于雷等[11]利用小波变换选取的小波系数构建土壤有机质含量估测模型,与传统数学变换估测进行对比,连续小波变换后的光谱数据构建的模型精度更优。【本研究切入点】现在国内外针对作物氮素监测的研究方法很多,但对棉花氮素含量的光谱响应分析却相对较少。为提高棉花氮素含量估算模型的准确性和普适性,研究以棉花为研究对象,尝试在SG平滑、CWT的基础上采用SG+CWT组合的方式,比较3种不同光谱预处理对棉花原始高光谱进行减弱或消除背景噪声的效果。采用BP 神经网络(back propagation neural network,BPNN)和随机森林回归(random forest,RF)两种算法构建棉花氮素含量估算模型,并进行精度验证。【拟解决的关键问题】最终选出棉花氮素含量的最佳估算模型,以期实现对棉花氮素含量的快速无损监测,为棉花氮素含量的估算提供理论依据和技术支持,为新疆棉花生产的科学管理提供参考。
选择新疆阿拉尔市塔里木大学试验田作为试验地点,新疆阿拉尔市位于塔里木盆地北缘,属于大陆性干旱荒漠气候,全年气候干燥,昼夜温差大,光照资源丰富,年日照时数为2 556.3~2 991.8 h,降雨量少,年降雨量为40.1~82.5 mm,地表蒸发强烈,年蒸发量大于2 500 mm。为了研究棉花光谱特征与其氮素含量的定量关系,于2020年4—8月在塔里木大学农学试验站进行盆栽试验,盆栽棉花氮素施用量,设置0(T0)kg∕hm2、100(T1)kg∕hm2、150(T2)kg∕hm2、200(T3)kg∕hm2、250 以上(T4)kg∕hm25 个施氮梯度,每种梯度6 个重复。2020 年4 月下旬和6 月上旬进行施肥,氮肥用尿素,其中尿素、钾肥一次性施入,磷酸氢二铵分2次施入。整个试验过程在人为可控的条件下减少误差。
棉花样本的采集于2020年6—8月选择晴朗无风的天气,分别在棉花蕾期、花期、花铃期采集棉花叶片,同时测定叶片光谱数据。每个生育期在每个处理中采集20 个样,因此,5 个施氮梯度在一个生育期共采集100个样。
棉花叶片含氮量的测定采用凯氏定氮法,棉花叶片光谱反射率的测定采用美国ASD 公司的(FieldS pecHand-hand2)便携式地物光谱,该仪器测定波段范围325~1 075 nm,精度为±1 nm,且分辨率为小于3.0 nm。棉花叶片光谱测定在10:00—14:00,天气晴朗、无风或风速很小的条件下进行量时传感器探头垂直向下,距冠层顶垂直高度约10~15 cm。每次测定5 条光谱数据,取5 条光谱曲线的平均值作为每个样品的原始光谱数据。
为了减少光谱信号中的噪声以及消除无关影响因素,研究将棉花原始光谱数据分别进行Savitzky-Golay 滤波平滑(2 阶多项式+21 点滑动卷积框架)处理[12]、连续性小波变换和SG 平滑结合连续性小波处理,从而选取3种不同预处理后的数据进行后续研究。利用相关分析法对样品光谱数据和样品叶片氮素含量进行相关性验证,并剔除异常样本,以提高样品代表性以及建模有效性,采用马氏距离法和传统的相关性分析从300个样品中剔除异常或相关性较低的样本,最终确定79个有效样。
小波变换时采用选择gaus(Gaussian)4 函数作为小波基函数。为了保证分解层数的合理性,同时又不会影响数据预处理的精度,分解尺度设置为21,22,23,…,210,即对棉花叶片光谱数据进行10 个不同尺度的小波分解,得到变换后10个尺度的小波系数[13]。
其变换公式如下:
式(1)、式(2)中:f(t)为棉花叶片光谱数据;t为光谱波段(350~1 050 nm);Ψa,b(t)为小波基函数;a为尺度因子;b为平移因子。本研究用matlab2020a和Excel2019对原始光谱进行数据变换。
本研究从筛选的79 个样本中采用KS 算法划分训练集和验证集。采用BPNN 和RF 建模方法,将选取的敏感波长对应的不同处理的光谱数据作为自变量,棉花叶片氮素含量作为因变量,对棉花叶片含氮量进行估算建模。对比基于3种不同的光谱数据预处理下两种模型对棉花氮素含量的估算效果。BPNN神经网络的隐藏层神经元设置个数为6,迭代次数设置为1 000,学习率0.01,训练的均方根误差(root mean square error,RMSE)小于0.001。
随机森林(RF)是一种基于多个决策树的数据挖掘算法,通过在训练数据集中应用 bootstrap 方法随机抽取样本构建单独的树模型,生成大量的树后组成随机森林,是由Leo Breiman和Adele Cueler在2001年提出的一种基于决策树模型的机器学习模型,具有运算快、精度高等优点[14]。随机森林模型可以解释若干自变量(X1,X2,…,XK)对因变量Y的作用,模型会在原始的数据集中选取n个观测值,并同时随机选取m个自变量构建一棵回归决策树[15]。按照以上方法重复几十到几千次,就得到了一组回归决策子树{h(x,θ_t),t=1,2,…,T}构成的组合模型,这就是随机森林模型,其中θt是服从独立同分布的随机变量,x表示自变量,T代表决策树的个数[15]。最终取这一组回归决策树的均值作为模型的回归预测结果(如公式3所示)。
R2反映的是模型拟合数据的准确程度,也是最常用于评价回归模型优劣程度的指标。R2越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好;R2越接近0,表明模型拟合的越差。RMSE 是用来衡量观测值同真实值之间的偏差,预测值与真实值相差越大,RMSE 就会越大。是样本的标准差与RMSE 的比值,RPD<1.4 认为所建模型不可靠;1.4
式中,TN是实测棉花叶片氮素含量,TNP是基于棉花叶片氮素含量估测模型的预测值,是实测棉花叶片氮素含量的均值,n表示样本数量。
为保证建模集和验证集的合理性,本研究采用马氏距离法、传统相关分析法对棉花蕾期、花期、花铃期3个时期的棉花样品进行剔除异常或相关性较低的样本,最终保留79个建模样品。按照2∶1等差选取建模集与验证集,获得53个建模集样点、26个验证集样点,并对建模数据进行描述性统计(表1)
表1 棉花叶片氮素含量统计描述特征Tab.1 Statistical description characteristics of nitrogen content in cotton leaves
从表1可知建模集和验证集对应的棉花叶片氮素含量最大值分别是44.575 g∕kg和42.060 g∕kg,最小值分别是25.943 g∕kg 和27.649 g∕kg;且本研究筛选后的全样本的棉花氮素含量均值为35.267 g∕kg,建模集与验证集所对应棉花氮素含量均值分别是35.407 g∕kg和34.982 g∕kg。分布区间合理,满足建模要求且模型不会出现过拟合的情况。
合理有效筛选特征波段是简化模型构建,提高模型估算精度的基础,因此在对棉花叶片反射光谱数据进行SG、CWT、SG+CWT 预处理的基础上提取特征波段十分必要,研究通过分析不同分解尺度的相关性热图,分别选定CWT 和SG+CWT 处理下的最优分解尺度,之后采用传统相关分析法,选取相关性较高的波长。
2.2.1 不同预处理的光谱曲线特征分析 对于预处理性能的评判,主要的标准是比较预处理后的光谱曲线与原始光谱图的变化。研究利用不同预处理的光谱数据在origin2021 中做绘制光谱曲线图,如图1所示。
图1 不同预处理下光谱曲线变化Fig.1 Spectral curve change under different pretreatment
图1 分析可知原始光谱数据经过SG 平滑处理后光谱曲线与原始光谱曲线波形基本一致,区别在于经过SG平滑处理的光谱曲线去除了局部的小毛刺,其光谱曲线显得较为平滑。在波段350~670 nm内有明显的吸收谷与反射峰,光谱波形呈现先增高后降低的趋势,在550 nm 附近形成较为明显的反射小高峰。此结论同李宗飞等[17]对滴灌甜菜叶绿素含量估算模型,表现为“根号”走势,在可见光波段反射率低,近红外波段反射率高,主要集中在420~780 nm 和920~1 100 nm。对于CWT和SG+CWT 处理,在光谱曲线波形上与原始光谱相比表现出明显的变化,波段反射光谱曲线的波谷与波峰也更加深一些,形态明显。原始光谱经连续小波分解后,1~10尺度的棉花叶片光谱曲线特征也逐渐减弱;1~7尺度的波谱曲线与R 相比起伏较大,并整体的曲线形态相似,8~9 尺度曲线光滑,形状呈抛物线状,10 尺度曲线逐渐增大有小锯齿出现构成且呈弧形。综上所述,棉花叶片光谱反射率经过SG、CWT、SG+CWT 处理后可以有效突出棉花叶片光谱特征,尤其是SG+CWT预处理局部光谱吸收特征更加显著。
2.2.2 不同预处理下光谱数据与棉花叶片氮素含量相关性分析 不同形式光谱变换在降低作物反射光谱背景噪声同时可增强其固有波谱特征,提高光谱反演作物生理生化参数潜力,因此需要在模型构建之前对原始光谱进行预处理[18]。在以往的研究中一般是在结合光谱指数的基础上SG平滑和小波变换分开进行光谱预处理,或者进行导数变换等。为了更深层次的定量化棉花叶片氮素含量的光谱响应范围,同时有助于筛选特征波段,研究采用SG+CWT 组合的方式,并对3 种不同光谱预处理后的棉花叶片光谱数据与棉花叶片氮素含量进行了相关性分析。
图3、4显示,棉花叶片光谱应用连续小波变换后,反射光谱被分解为多个尺度分量,且尺度分量与棉花叶片反射光谱具有相同的长度,小波变换后光谱数据由波长和尺度函数的小波特征组成,随着分解尺度的增加,相关性先是上升,最后到达最优分解尺度时,趋于稳定,这说明经CWT 和SG+CWT 处理后大幅提升了棉花光谱信息对棉花叶片氮素含量的敏感性。分析图5,CWT、SG+CWT 与SG 处理方式相比,在提高光谱数据与棉花叶片氮素含量相关性方面都发挥了一定作用,但前两者相比较而言,采用SG+CWT光谱数据预处理,更明显提高了与棉花叶片氮素含量的相关性。因此采用SG+CWT,挖掘光谱信号中的相关性高的特征波段效果最佳。从图2~5可知,经过不同方式的预处理之后,SG处理后在一定程度上消除高频随机误差,提高了信噪比,相关性得到很大提高,且与棉花叶片氮素相关系数较高的区域多集中在可见光范围内,基本范围控制在430~780 nm 波段内。相比SG 处理,CWT 和SG+CWT 预处理下棉花叶片光谱数据与棉花氮素含量的相关性均有了一定提高,这说明在反射光谱中表征棉花叶片氮含量的吸收方面,高光谱进行CWT 后,多尺度表征棉花叶片氮素含量变化,引起的整体反射率振幅和局部光谱形状的变化,使得小波特征优于SG 平滑的数据。目前,前人研究中还未出现将CWT 和SG 平滑共同使用下棉花叶片氮素光谱响应特征,以监测棉花叶片和氮相关的吸收特性。研究探究结合两种方式的优势,采用SG+CWT 方式处理后光谱数据棉花氮素含量的相关性也逐步增高,趋势向近红外光830~1 050 nm 波段范围扩散,且保持着较高的相关性,说明棉花光谱数据经过SG+连续小波变换之后,对于深层次放大、挖掘光谱信息有着显著的作用。
图3 CWT处理不同分解尺度的相关性Fig.3 CWT deals with the correlation of different decomposition scales
图4 SG+CWT下不同分解尺度的相关性Fig.4 Correlation of different decomposition scales under SG+CWT
图5 不同处理方式与R的相关性比较Fig.5 Correlation comparison between different processing methods and R
2.2.3 筛选特征波段 筛选特征波段可以剔除无关变量和非线性变量,简化模型,提高模型预测精确度和稳健性。研究对数据进行3 种不同预处理。由此,将一维棉花高光谱反射率数据进行线性变换,得到二维小波系数。选取基于连续小波处理的最优分解尺度下的小波系数与棉花叶片氮素含量进行相关性分析,得到相关系数矩阵。经过典型相关性分析,筛选出最优的尺度变换,从而得到变换的光谱数据。分析了每种处理后光谱数据与棉花叶片氮含量的相关性,选取R2>0.5 的波段再通过方差膨胀因子(variance inflation factor),检验共线性,进而筛选敏感波段。如表2所示。
表2 不同处理方式下样本筛选的特征波长Tab.2 Characteristic wavelength of sample screening under different processing modes
根据表2 分析可知:3 种处理下筛选的特征波长数量分别为9 个、6 个、7 个,且波长分布区间多集中于可见光和近红外光范围内。
根据2.2 的不同处理的特征波段的筛选,以相关性和方差膨胀因子选取的敏感波段和3 种不同处理后的光谱数据,采用BPNN和RF两种算法建立模型。
分析表3可知SG处理下的两种建模RPD值均小于1.4,该处理下的模型不具备估算棉花叶片氮素含量;CWT 处理下的BPNN 和RF 建模集的RPD 分别为1.413 和1.661,但相对应的验证集的RPD 值也均小于1.4,因此该处理下的两种算法建模不具备好的反演能力;SG+CWT 处理下基于BPNN 和RF 的建模集RPD 值分别为1.572 和2.084,验证集的RPD 值分别为:1.647 和1.759,此处理下的模型均可以精准、稳定的估算棉花叶片氮素含量。
表3 基于不同处理的棉花叶片氮含量与光谱的模型表现Tab.3 Model performance of nitrogen content and spectrum of cotton leaves based on different treatments
如图6 和图7 所示,将SG+CWT 预处理的两种模型的建模集和验证集分别进行线性拟合和1∶1 线性分析,可以明显的观察出,相比BPNN 模型,RF 模型的训练集拟合回归线y1 和验证集的拟合回归线y2 偏移1∶1 拟合线幅度较小,且实测值样点和预测值样点基本均分在1∶1 线附件,模型精度较高,能够更好地对棉花氮素含量进行估算。同时发现RF 模型在建模集和验证集的R2均大于BPNN 模型,且基于RF 建模的RMSE 在建模集和验证集中均小于BPNN 建模。体现出最大的R2,最小的RMSE,以及最优的建模效果。结果表明基于SG 平滑结合连续小波变换处理下构建RF 模型是估算棉花氮素含量最优的方式。
图6 SG+CWT下RF建模线性拟合分析Fig.6 Linear fitting analysis of RF modeling under SG+CWT
图7 SG+CWT下BPNN建模线性拟合分析Fig.7 Linear fitting analysis of BPNN modeling under SG+CWT
作物光谱监测中,ASD 光谱仪监测数据与遥感监测数据存在一定差异。首先获取的波段范围不同:ASD 野外光谱仪的波长观测范围为325~1 075 nm,且最小单位级为nm 级,包含常用于监测作物研究的可见光和近红外波段。遥感影像因不同传感器,所探测波段的数量、波段的范围以及中心波长会有所不同[19],如彭继达等[20]采用的Landsat 9卫星特征影像,含Landsat 9搭载OLI-2和TIRS-2传感器,其中OLI-2包含9个波段,波谱横跨可见光、近红外和中红,TIRS-2包含2个热红外波段;其次获取方式差异:ASD需要将镜头移到测量目标上获取的高光谱数据,遥感影像是在不与地球表面接触的情况下收集地球表面数据的过程,是大气层与目标相互作用的照明或能源,从目标发射或散射的电磁能被卫星传感器收集和记录,并以电子数据形式被处理成图像[21];数据处理方式也有所不同,ASD获取的高光谱数据预处理是对原始光谱进行平滑去噪、光谱变换等预处理,如乔星星等[12]探究SG平滑处理对冬小麦地上干生物量光谱监测的影响中发现,光谱SG 平滑处理在一定程度上可以提高AGDB 与预处理光谱的相关性。韦任等[22]通过预处理之后使用连续统去除法、一阶微分法、二阶微分法提高了煤岩模型的识别率。遥感影像图像预处理是对原始图像数据中存在的辐射失真、大气失真和几何失真进行校正的初始处理[21],张亦然等[23]对获取的无人机影像、Worldview-2 多光谱遥感影像、Landsat 8 OLI 多光谱遥感影像,进行校正后提取光谱反射率。就模型估算而言,ASD 高光谱数据和遥感影像解译的样点波段信息均能通过多种方式去噪、也可以建立植被指数、进行波段差值、波段比值等方式进行组合波段提高与监测指标的相关性。苏维等[24]对从高光谱影像中获取的光谱曲线进行Savitzky-Golay 平滑法、多元散射校正、一阶求导和正态变量标准化4种光谱预处理方法去燥,提高模型精度。时对光谱数据预处理和最优模型的探索,进一步保证了遥感监测作物的准确性,从而提高模型的应用途径,研究通过对高光谱数据的预处理结合两种建模方法对ASD 光谱仪测定的高光谱监测棉花氮素含量的探究,为光谱监测棉花氮素营养诊断及棉田的精确施肥管理提供了必要的技术支撑。
利用ASD光谱仪获取棉花叶片光谱信号往往会受杂散光、噪声等外界因素的干扰,从而影响棉花氮素含量的估算。研究采用SG、CWT、SG+CWT 3 种光谱预处理方法,结合BPNN 与RF 两种算法构建模型估算棉花氮素含量。SG 平滑是光谱数据预处理中最基础的方法,研究中SG 平滑处理的模型精度最低,分析原因可能为SG 平滑去除噪声有限,难以明显的改变光谱曲线的趋势和反射率的值,光谱潜在信息没有被更好的挖掘,从而导致建模效果不是很理想。CWT 作为一种常用的光谱预处理方法,与SG 平滑相比能够更好地挖掘光谱信息。目前学者们通过研究证明经连续小波预处理的光谱数据在模型反演方面提高了精度。郭斌等[25]对反射光谱进行连续小波变换预测土壤锌含量,发现变换的光谱数据反演能力更强。安柏耸等[26]构建土壤重金属镉含量估测模型,结合数学变换的连续小波分解技术有效提取土壤中的潜在信息。何汝艳等[27]联合应用CWT 与SVM 方法对条锈病胁迫下冬小麦LTN 含量进行反演,且具有较高的估测精度。与众多学者研究结果相符,研究中经过CWT 预处理的光谱数据构建的两种算法模型,精度上都有所提高。模型预测能力也在不断提升。与前人研究所不同的是本研究继两种预处理方式的基础上,采用SG 平滑与CWT 相结合的方式进行光谱数据预处理。相比SG 和CWT,SG+CWT 变换后得到的模型,精度得到很大程度的提升。BPNN 模型中验证集相比SG 和CWT 分别提高了0.127、0.24;RF 模型中相比SG 和CWT 分别提高了0.235、0.223,且此处理下,模型均具备预测棉花氮素含量的能力。
在构建棉花叶片氮素含量估算模型时,基于3 种不同处理下RF 算法的模型精度要优于BPNN。因精度验证要综合考虑,基于SG和CWT处理下的模型RPD 小于1.4,模型没有很好的预估能力。SG+CWT处理分析,RF模型验证集中棉花氮素含量预测值与棉花氮素含量实测值间的R2为0.813比BPNN提高了3.8%;RMSE 减少了4.8%;RPD 提高了6.8%,RF 的预测精度要优于BPNN 神经网络。这与竞霞等[28]利用随机森林法协同SIF和反射率光谱监测小麦条锈病研究结果相一致。分析来看,可能是因为随机森林模型在数据处理能力方面具有集成学习的特点,从而能够提高模型的精度。针对RF与BPNN算法的比较,与研究结果不符的观点在少数领域发现,Zhao 等[29]采用两种模型建立了大学毕业生就业保持率的预测模型。结果表明,BP 神经网络模型在预测精度上优于随机森林模型。究其原因,神经网络对于不确定因素的复杂系统预测效果较好,存在为了目标而创建预测模型,不考虑变量的影响。而随机森林可以提供决策树的不同解释,并且具有更好的性能。Zhao等[29]目标是创建大学毕业生就业保持率预测模型,与研究的方向和模型目标有所不同,则可能会出现BPNN优于RF的结果。在绝大多数研究领域表明RF模型优于BPNN。郭斌等[25]对露天煤矿土壤锌含量高光谱遥感反演;崔小涛等[30]基于多元线性逐步回归遗传算法优化BP 神经网络模型为准确、快速估算油菜叶片SPAD 值反演方法。张孟库等[31]对落叶松树皮厚度预测;王晓燕等[32]对农业干旱监测比较;张亦然等[23]对科尔沁沙地植被覆盖度反演发现在准确度方面RF表现出色。这说明本研究的发现基于SG+CWT 处理构建的RF算法估算模型精度高于同种处理的BPNN模型,具有较强的普适性。
从特征波段的筛选和相关性热图分析,研究发现棉花氮素含量的敏感波段集中分布在可见光和近红外区域。这与前人的研究结果相似,如:易翔等[33]研究发现利用无人机高光谱技术监测棉花生物量,棉花AGB敏感波段集中在可见光和近红外区域,且受生物量影响,可以建立定量关系;Boegh等[34]研究了8 种不同作物的冠层氮浓度与影像数据的关系,结果表明,红边位置与作物的氮浓度具有显著的线性相关关系;田永超等[35]在对反射光谱对作物氮素营养的响应中发现,在可见光、红光和绿光范围内作物氮素响应均比较敏感。研究这一发现也提高了研究结果的真实性。研究的模型只能适用于基于SG 平滑结合连续小波的光谱数据预处理方式,估算其他预处理下的模型具有局限性;在构建棉花氮素估算模型时,仅是分析对比了BPNN和RF两种机器学习算法,在后期研究中若使用更多的模型算法参与棉花氮素模型的构建,RF 模型是否更能精准的估算棉花氮素,还需要进入更深入的研究。研究未开展大范围的农田试验,研究存在忽略了一些可能存在因素的影响,估算精度有待提高。
采用3种不同的棉花光谱数据预处理,构建2种机器学习算法模型,并验证了模型精度,最终筛选出最优光谱数据预处理方式和光谱参数下的最佳模型。比较了在不同预处理下的模型表现,主要得出结论如下:
(1)从光谱曲线特征、棉花氮素含量与光谱数据相关性、建模结果3方面分析,利用SG平滑和连续小波结合进行光谱数据预处理,是最优的光谱数据处理方式。SG 平滑与连续小波变换的结合优于传统方法,相比较连续小波变换处理,较好地提升了棉花光谱与棉花叶片氮素含量的相关性,此处理方式能够深入挖掘棉花叶片光谱信息,提升棉花叶片光谱对棉花叶片氮素含量的敏感性。
(2)2 种机器学习算法构建的模型均满足精度验证要求,且模型是有效的。均可用于估算SG+CWT处理下小范围棉花的氮素含量。基于两种建模方法的比较,RF 模型验证集中棉花氮素含量预测值与棉花氮素含量实测值间的R2为0.813 比BPNN 提高了3.8%;RMSE 减少了4.8%;RPD 提高了6.8%,RF 的预测精度要优于BP神经网络。
(3)基于不同光谱数据预处理和2种不同建模方法分析,基于SG平滑结合连续小波变换处理下构建RF模型是估算棉花氮素含量最优的方式。
致谢:新疆维吾尔自治区研究生科研创新项目(XJ2022G243)同时对本研究给予了资助,谨致谢意!