基于高光谱图像的枸杞叶片叶绿素含量估算模型

2023-09-13 02:47刘若晨刘大铭李譞洞刘雪纯
山东农业科学 2023年8期
关键词:反射率枸杞叶绿素

刘若晨刘大铭李譞洞刘雪纯

(1. 宁夏大学电子与电气工程学院,宁夏银川 750021;2. 宁夏大学宁夏沙漠信息智能感知重点实验室,宁夏银川 750021)

宁夏枸杞是茄科枸杞属多年生落叶灌木[1],现已发展为宁夏特色产业,因此监测宁夏枸杞植株生长状况并进行产量预测对地区经济发展尤为重要。 叶片叶绿素含量高低能反映作物光合能力的强弱和营养生理状况的好坏,是评价植物健康水平的重要指标之一[2]。 检测叶绿素含量的方法主要有分光光度计法[3]、高效液相色谱法和原子吸收法[4]等,但此类方法只局限于较小的样本数量,对叶片有破坏性,且检测步骤繁琐,效率较低。

高光谱技术的发展使快速无损化监测作物信息得以实现,国内外基于高光谱技术监测叶绿素含量的研究也逐渐增多,主要通过从高光谱图像提取多种光谱波段信息,然后结合神经网络与优化算法,建立全波段叶绿素含量估算模型。 如:依尔夏提·阿不来提等[5]基于高光谱与BP 神经网络,利用去包络后光谱指数建立预测模型,对棉花冠层叶绿素含量进行估算,R2为0.85;王东等[6]利用高光谱图像,经特征波段筛选并结合使用BP神经网络,建立了叶绿素荧光参数的预测模型,测试集R2为0.918;孙红等[7]采集马铃薯叶片高光谱图像,利用标准正态变量校正处理数据,结合随机蛙跳算法与偏最小二乘回归法建立叶绿素含量预测模型,预测精度R2达0.8423;彭晓伟等[8]利用高光谱特征分析并结合BP 神经网络对谷子叶片叶绿素含量进行估算,预测精度R2在0.7 以上;何桂芳等[9]基于高光谱图像提取石楠叶片相关反射率,并利用多元回归建立叶绿素含量估算模型,预测决定系数R2达0.955。 但以枸杞为研究对象,利用高光谱技术与神经网络相结合建立模型预测其叶片叶绿素含量的研究还较少见。

本研究以宁夏回族自治区吴忠市同心县润德枸杞园内种植的成熟期枸杞为对象,利用无人机搭载高光谱成像仪获取高光谱图像,用SPAD-502 手持叶绿素仪获取叶片相对叶绿素含量,以光谱原始反射率与一阶光谱反射率为输入变量,建立了基于遗传算法优化BP 神经网络以及基于粒子群算法优化Elman 神经网络的预测模型,通过比较分析,确定适合宁夏枸杞叶片叶绿素含量预测的最优模型,以期为大面积监测宁夏枸杞生长状况提供技术支持。

1 材料与方法

1.1 试验材料与研究区概况

试验于2021年7月1日在宁夏回族自治区同心县润德枸杞庄园内进行,以枸杞品种“宁杞7号”的成熟期植株为试验材料。 试验区东西长48 m,枸杞行距3 m, 株距0. 7 m; 位于东经105°42'50″、北纬37°9'44″,海拔1 377 m,属温带大陆性气候,年平均气温8.7 ℃,昼夜温差10 ~16℃,年均降水量259 mm 左右,但蒸发量高达2 325 mm 以上,干旱少雨。

同时设定靶标布的位置,利用无人机搭载高光谱相机进行图像采集。

1.2 数据采集及处理

1.2.1 叶片叶绿素含量测定挑选长势接近的17 行枸杞植株,每行选6 株,每两株之间间隔4株(3.5 m),共计102 株样树。 从每株东、西两个方位各选取一片健康完整叶,选择晴朗无风、光照强的天气于上午11—12 时用SPAD-502 手持叶绿素仪测定叶绿素相对含量,重复3 次;将每株所采集的6个叶绿素数值求平均,作为该株枸杞叶片的叶绿素含量。 同时进行标记,待高光谱图像采集。

1.2.2 高光谱数据采集及处理(1)高光谱数据采集:利用大疆无人机结合Ronin 云台,搭载PIKA L 高光谱成像仪,在叶绿素含量测定相同时段采集高光谱影像。 该成像仪尺寸为10.0 cm×12.5 cm×5.3 cm,重量0.6 kg,波段范围为400 ~1 000 nm,光通道数281个,光分辨率为2.1 nm,每秒最大帧数(frames per second,FPS)为249。 无人机遥感作业前,需调整镜头为无限远焦距,并用黑白板进行辐射校正;作业航线要覆盖试验区域。

(2)高光谱图像处理:首先利用无人机后差分技术的POS 数据处理获得GPS 及航线数据,然后用Google Earth 确定分割边界,利用MegaCube软件进行分割,同时选择辐射定标进行几何与辐射校正。 利用ArcGIS 中的地理配准模块对各航线影像进行地理配准,再利用ENVI 软件对配准后的影像进行拼接,使用MegaCube 软件制作超立方体并转化为反射率影像,获取感兴趣区域反射率曲线及400~1 000 nm 波段范围的反射率值。图像处理结果见图1。

1.3 神经网络模型的优化

1.3.1 BP 神经网络模型的优化BP(back propagation)神经网络是一类典型的多层前馈神经网络,又称误差反向传播算法,1986年由Rumelhart的科研小组提出[10]。 BP 神经网络由输入层、输出层和隐含层组成,每层网络含有若干人工神经元,通过动态调整隐含层与各层级间的权值、阈值及误差可获得最优预测结果。

神经元激活函数为Tan-sigmoid 函数,见式(1);以隐含层输入值为例,如式(2)。

式中,hih(k)为k 时刻隐含层第h个神经元输入值;xi(k)为k 时刻输入变量;wih为输入层第i个神经元与隐含层第h个神经元间权值;θh为隐含层第h个神经元阈值。

以上述方式计算各层输入、输出值并利用前向传输和逆向反馈的方式进行训练,结合梯度下降算法完成网络层级间权值和阈值的修正,使预测值与实际值误差达到设定的目标值。 式(3)和(4)为权值和阈值修正过程:

式中,E 为预测值和实际值间的误差;η 为神经网络学习速率。

在BP 神经网络中,模型的预测精度与初始参数权值和阈值的选取密切相关,随机抽取初始参数往往会导致预测精度下降,使网络产生局部最优问题而无法实现高效预测。 作为启发式算法,遗传算法(genetic algorithm,GA)拥有优秀的全局搜索能力,利用该算法对BP 神经网络进行优化,可以解决其陷入局部最优的问题。 优化的核心是将随机抽取的参数值设为问题的决策变量,引入适应度、选择算子、交叉算子、变异算子,通过调整适应度及优化各算子出现概率,获取最优神经网络权值和阈值[11]。 利用GA 优化BP 神经网络的流程如图2 所示。

图2 GA 优化BP 神经网络过程

1.3.2 Elman 神经网络模型的优化Elman 神经网络是一种典型的局部递归网络,相较于BP 神经网络,不但能够针对静态问题实现建模,而且对于动态映射问题可展示出映射动态特性[10]。 该神经网络与前向网络的多层结构类似,在BP 神经网络基础上增加新的层级承接层,并将该层级连接到隐含层上,运作延时算子[12],从而提高Elman 神经网络能够适应动态变化问题的性能,提高网络的全局稳定性,相比BP 神经网络运算能力得到提升,当遇到寻优问题时可以快速找到目标。

Elman 神经网络的权值和阈值修正与BP 神经网络的相似,其承接层输出值与隐含层输出变量计算见式(5)和(6):

式中,xc(k)为k 时刻承接层的输出量;h(k)为隐含层k 时刻输出量;ε 为自链接反馈增益因子;w1表示输入层与隐含层之间的权值;w3表示隐含层与承接层之间的权值;θh表示隐含层的阈值;f(x)为Tan-sigmoid 函数;u(k)表示k 时刻的输入量。

粒子群优化算法(particle swarm optimization,PSO)是模拟鸟类种群寻找食物的过程而提出的。粒子群中每个个体都遵循自身速度和方向寻找目标解,并在搜寻过程中与其他个体分享目标最优信息,经种群内个体间交换信息并不断更新自身的速度和方向,找出全局最优解。 本研究利用PSO 对Elman 神经网络进行优化:首先建立并初始化神经网络,然后初始化PSO 算法参数,包括目标迭代次数、种群规模、学习因子、惯性权重及种群位置和速度矢量;依据设计的神经网络,随机选取种群内部粒子数;通过对粒子权值与阈值赋值计算个体适应度并执行粒子群优化算法的循环体过程,更新速度和位置矢量,直至目标迭代次数跳出算法。 Elman 神经网络利用PSO 优化后的权值和阈值进行训练与预测,从而提高网络的预测精度[13]。 PSO 优化Elman 神经网络流程见图3。

图3 PSO 优化Elman 神经网络过程

1.4 宁夏枸杞叶片叶绿素含量监测模型的构建

将高光谱全波段的反射率及一阶反射率设为模型的输入变量,分别利用上述两类优化后的神经网络模型对枸杞叶片叶绿素含量进行预测,通过对比分析预测精度,确定适合大面积预测宁夏枸杞叶绿素含量的最优模型。 预测精度用均方根误差(RMSE)、决定系数(R2)、平均绝对误差(MAE)来衡量,各参数表达式如下:

式中,n 为预测集的样本数量,p(xi)为预测值,yi为实际值。

2 结果与分析

2.1 感兴趣区反射率曲线

提取感兴趣区反射率曲线,用ENVI 中的Savitzky-Golay 滤波器平滑去噪[14],处理后的光谱曲线如图4 所示。 可见,其拥有双波峰特性,第一次波峰位于487 ~587 nm 范围内,处于蓝边(490 ~530 nm)边缘位置,振幅较小,反射率值在0.05~0.10 之间;第二次波峰位于787 ~900 nm 范围内,处于红边(680 ~760 nm)边缘位置,反射率值在0.23 ~0.30 之间。 将387 ~1 019 nm 波长均分为150个波段并提取各波段的反射率值,然后进行一阶微分运算,以部分消除大气效应、植被环境阴影、土壤等的影响,即得到102个成熟期枸杞样本的一阶微分光谱随波长变化曲线(图5),可见,经一阶微分处理后,反射率曲线的波峰与波谷位置均集中在687 ~787 nm 范围内,双波峰反射率峰值分别在0.010 ~0.012、0.007 ~0.008 之间,波谷反射率值在-0.009~-0.008 间。

图4 S-G 滤波器平滑去噪反射率曲线

图5 反射率一阶导数曲线

2.2 未优化的神经网络模型预测结果分析

基于两种未优化的神经网络,以原始反射率与反射率一阶导数分别作为输入变量,设定测试集数量在[10,20],对枸杞样本叶绿素含量进行预测,通过RMSE、MAE、R2评价,选出最优预测模型。

首先,对各类变量进行归一化处理,以消除量纲不同带来的影响,并使变量大小落在(-1,1)区间内;接着,采用经验公式确定隐含层节点个数,见式(10);其余各参数设置如表1 与表2 所示。

表1 BP 神经网络参数

表2 Elman 神经网络参数

式中:m 为输入层节点个数,n 为输出层节点个数,a 一般取1~10 之间的整数。

由表3 可见,在BP 神经网络中,无论以原始反射率还是反射率一阶导数为输入变量,均在测试集数量为12 时模型达到最优预测。 实测值与预测值对比结果如图6 所示。 当输入变量为原始反射率时,RMSE 为2.1137,MAE 为1.8173,R2为0.47334;输入变量为反射率一阶导数时,RMSE 为4.1527,MAE 为2.8582,R2为0.52610。 可见,该模型预测效果较差,未达到预期。

表3 BP 神经网络在不同测试集数量时的预测结果

图6 基于BP 神经网络的叶绿素含量预测值与实测值比较

利用Elman 网络预测的结果(表4、图7)显示,输入变量为原始反射率时,测试集数量为15的预测结果最优,RMSE 为3. 2975, MAE 为2.6024,R2为0.30210;输入变量为反射率一阶导数时,测试集数量为12 的预测效果最优,RMSE为3.4814,MAE 为3.0245,R2为0.47506。 该模型的预测效果依然无法达到预期。

表4 Elman 神经网络在不同测试集数量时的预测结果

图7 基于Elman 神经网络的叶绿素含量预测值与实测值比较

2.3 优化后的神经网络模型预测效果分析

鉴于原始BP、Elman 神经网络对宁夏枸杞叶片叶绿素含量预测的效果较差,分别采用GA 和PSO 算法对其进行优化,优化后的网络各参数设定见表5、表6。

表5 GA-BP 优化网络的参数设定

表6 PSO-Elman 优化网络的参数设定

基于GA-BP 网络的模型预测结果(表7、图8)显示,无论以原始反射率还是反射率一阶导数为输入变量,模型均在测试集数量为11 时获得最优预测结果。 其中,以原始反射率为输入变量时,RMSE 为2.2562,MAE 为1.5459,R2为0.77759;以反射率一阶导数为输入变量时,RMSE 为1.2644,MAE 为1.0115,R2为0.85836。 可见,预测效果与优化前有了明显提升。

图8 GA-BP 网络叶绿素含量预测值与实测值比较

从表8 和图9 可见,测试集数量为11 时,POS-Elman 神经网络预测精度最优。 输入变量为原始反射率时,RMSE 为0. 7369, MAE 为0.6369,R2为0.91408;输入变量为反射率一阶导数时,RMSE 为0.2554,MAE 为0.2094,R2为0.98967。 预测精度大幅提升,能够满足对宁夏枸杞叶片叶绿素含量预测的需求。

表8 PSO-Elman 网络不同测试集数量预测结果

图9 PSO-Elman 网络叶绿素含量预测值与实测值比较

综上,通过优化训练中权值和阈值的选择,解决了网络的局部最优问题,提高了预测的精度与结果的稳定性。 相比较而言,POS-Elman 神经网络预测精度更高,拟合效果更好。

3 讨论

近年来随着高光谱技术的迅速发展,利用高光谱图像提取光学特征参数[15-17]并结合神经网络或回归算法预测植物生理生化指标的研究越来越多[18-20]。 相比于原始反射率光谱,一阶微分处理后可以部分消除光谱反射率中由大气效应、植被环境阴影、土壤等因素造成的影响,更好地反映植物的本质特征[21]。 因此大多数此类研究优先选择反射率一阶导数作为模型的输入变量。

BP 神经网络通过动态调整权值与阈值精确模拟预测过程[22],而Elman 神经网络是在BP 神经网络结构基础上通过增加承接层提高网络稳定性和预测精度[23]。 但本研究中,用这两种神经网络模型预测宁夏枸杞叶片叶绿素含量的精度都较低,R2大多在0.5 以下,无法满足实际使用要求。因此,本研究利用遗传算法能自动搜索全局最优解的特性[24]对BP 神经网络进行优化,利用粒子群算法的高效全局搜索能力和鲁棒性[25]及能避免神经网络求偏导等特性优化Elman 神经网络,分别建立了GA-BP 和PSO-Elman 神经网络模型,基于无人机获取的高光谱图像和叶片SPAD实测数据,对宁夏枸杞的叶片叶绿素含量进行预测,结果表明,优化后的模型预测效果明显提升,尤其PSO-Elman 模型预测效果更好,决定系数均高于0.9,能较好满足实际应用需求。 但遗传算法自身仍存在早熟收敛和后期搜索迟钝的问题[26],而粒子群算法也存在早熟收敛以及受粒子个数、权重、迭代次数等影响的问题[27-28],在随后的研究中将进一步增加对两类优化算法的改进,便于建立更为稳定、精确的枸杞叶片叶绿素含量预测模型。

4 结论

本研究针对宁夏地区特色作物枸杞的成熟期叶片,采用高光谱技术提取387~1 019 nm 波长的反射率,使用微分光谱技术获取反射率一阶导数,结合BP 和Elman 神经网络,并分别利用GA 和PSO 算法进行神经网络优化,建立了两种神经网络模型(GA-BP 和PSO-Elman)用于对枸杞叶片叶绿素含量进行预测。 通过对预测效果的比较分析,得到如下结论:

(1)以反射率一阶导数作为输入量的预测结果好于用原始反射率作为输入变量。 在BP 神经网络中,输入量为反射率一阶导数相较于原始反射率的预测决定系数R2由0.47334 提升至0.52610。 同样在Elman 神经网络中,预测结果从原始反射率R2为0.30210 提升至反射率一阶导数

R20.47506。

(2)分别利用GA 和PSO 优化算法改进权重和阈值的选择及梯度下降算法不足的问题后,BP和Elman 神经网络模型的预测精度均明显提高,分别使GA-BP 神经网络预测的决定系数R2上升至0.85836,使PSO-Elman 神经网络的R2达到0.98967。该结果均在以反射率一阶导数为输入量、测试集数量为11 时获得。

(3)在本研究条件下,基于粒子群算法优化的Elman 神经网络模型是宁夏枸杞叶片叶绿素含量预测的最佳模型,在测试集数量为11 时预测结果最好,RMSE 为0.2554,MAE 为0.2094,R2为0.98967。

猜你喜欢
反射率枸杞叶绿素
枸杞
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
是酸是碱?黑枸杞知道
具有颜色恒常性的光谱反射率重建
提取叶绿素
采枸杞
桃树叶绿素含量与SPAD值呈极显著正相关
枸杞到底是怎么养生的?
叶绿素家族概述