基于光谱特征参数与主成分分析的玉米叶片叶绿素含量BP反演

2016-10-20 14:41杨可明卓伟刘二雄
江苏农业科学 2016年7期
关键词:叶绿素含量BP神经网络主成分分析

杨可明 卓伟 刘二雄

摘要:利用美国SVC HR-1024I型地物光谱仪对盆栽玉米叶片进行光谱测定,同时用SPAD-502叶绿素仪测定叶片的叶绿素含量。基于实测光谱的微分处理结果,获取光谱位置、光谱面积、植被指数3个方面的11个光谱特征参数(spectral characteristic parameters,SCP),分析这11个SCPs与叶绿素含量的相关性,并对这些参数进行主成分分析(principal component analysis,PCA);然后,利用这11个SCPs及其PCA结果建立误差反向传播(error back propagation,BP)神经网络输入因子,并构建了玉米叶片叶绿素含量BP反演模型(简称SCP-PCA-BP模型)。另外,选取与叶绿素含量相关性较高的8个SCP,建立常规的线性回归模型并预测叶绿素含量。反演结果表明:SCP-PCA-BP反演的预测值与实测值之间的决定系数(r2)达到0.968 7,均方根误差(RMSE)为0.893 9;而用线性回归模型反演时,只有基于SCP中微分光谱蓝边面积、面积比值、归一化面积参数的预测效果较好,其中归一化面积的预测效果最好,预测值与实测值之间r2为0.704 0,RMSE为2.895。因此可知,与常规的线性回归模型相比,SCP-PCA-BP反演模型在预测玉米叶片叶绿素方面具有更好的预测效果。

关键词:光谱特征参数;主成分分析;玉米叶片;BP神经网络;叶绿素含量;BP反演模型

中图分类号: TP75;S127 文献标志码: A 文章编号:1002-1302(2016)07-0147-04

叶绿素在植物的整个生理生态过程中非常重要,能够间接地反映植物的生长状况[1],叶绿素含量的高低可以作为植物受外界胁迫或是环境因子干扰状态下的重要指标[2]。因此,快速、高效、大面积地测量植被叶片中叶绿素含量在农学、生态学、林学等领域均具有重要的实用价值。目前,基于高光谱遥感的精准农业及其应用研究取得了较大进展,特别是叶绿素含量等生化成分反演是其近年来的研究热点之一[3-4]。高光谱遥感数据不仅具有极高的光谱分辨率(波段宽度

大量研究证明,利用高光谱遥感技术可以成功估算植被叶片中的叶绿素含量。Mutanga等通过研究证实,红边位置一般与植物冠层的叶绿素或氮素含量有较好的相关性[11];Inoue等通过研究水稻(Oryza sativa)冠层的高光谱数据与其生理状态间的关系发现,可以通过构建可见光、近红外区域内高光谱数据的多元回归模型来反演水稻叶片的叶绿素含量[12];梁亮等基于最小二乘支持向量回归(least squares support vector regression,LS-SVR)算法建立了小麦冠层叶绿素含量高光谱反演模型,并能准确估测叶绿素含量[13];李云梅等利用线性回归模型分析了水稻叶片中的叶绿素含量[14];杨杰等对350~2 500 nm范围内的光谱采用任意2个波段组合的方式构建一系列比值与归一化光谱指数,筛选出了可敏感反映水稻上部叶片叶绿素含量的高光谱指数SR(728,709)、ND(780,712)[15];周春艳等通过研究基于多参数神经网络建模的叶绿素含量精细反演方法,验证了多参数反向传播(back propagation,BP)神经网络模型可以有效地提高活体植物叶绿素含量预测精度[16]。研究成果多集中于通过多元统计分析方法探寻敏感波段构建叶绿素含量反演模型,因此本研究通过利用所提取的玉米叶片微分光谱特征参数(spectral characteristic parameter,SCP)建立基于主成分分析(principal component analysis,PCA)的BP神经网络叶绿素含量反演模型,即SCP-PCA-BP模型,同时利用光谱特征参数构建线性回归模型进行叶绿素含量的估算,通过比较2种模型的叶绿素含量反演精度,发现SCP-PCA-BP模型能更加快速、精确地估算玉米叶片叶绿素含量。

1 材料与方法

1.1 光谱数据的测定

本试验对象为实验室盆栽玉米,于2014年7月17日采用SVC HR-1024I型高性能地物光谱仪对玉米叶片进行光谱数据采集,叶片光谱数据采集范围为350~2 500 nm,其中350~1 000 nm的光谱采样宽度为1.5nm,光谱分辨率为 35 nm;1 000~1 850 nm的采样宽度为3.6 nm,光谱分辨率为95 nm;1 850~2 500 nm的采样宽度为2.5 nm,光谱分辨率为6.5 nm。采集过程应满足的条件包括光谱仪配套功率为50 W的卤素灯光源、4°视场角的探头,探头应保持垂直于叶片表面40 cm,输出的光谱曲线由3条原始的扫描光谱经过自动平均所得。为了准确地测定玉米叶片光谱数据,在测量时将玉米叶片放置于用黑色塑料袋包裹的硬纸片上。光谱反射系数经专用平面白板标准化。

1.2 叶绿素含量的测定

在玉米叶片光谱数据采集完成后,于2014年7月18日使用SPAD-502叶绿素测定仪测定玉米叶绿素含量,为了获得准确的叶绿素浓度值,每个样本叶片选定5个不同位置重复测定5次,最后将测得的5个叶绿素含量求平均,作为每张叶片叶绿素含量的实测值。

1.3 光谱一阶微分处理

光谱微分技术就是数学模拟反射光谱以提取不同的光谱参数。在植被光谱处理中,应用光谱微分能够部分消除大气效应、阴影与土壤等植被环境背景的影响,从而较好地反映植物的本质特征。光谱一阶微分可近似表达为:

R′(λi)=[R(λi+1)-R(λi-1)]/(λi+1-λi-1)。

(1)

式中:λi-1、λi、λi+1为相邻波长,nm;R(λi+1)、R(λi-1)分别为波长λi+1、λi-1对应的光谱反射率;R′(λi)为波长λi对应的一阶微分曲线值。

1.4 光谱特征参数提取

利用一阶微分处理的光谱可提取光谱特征参数,本研究共提取了11个玉米叶片的SCP。由表1可见,这些SCP主要分为光谱位置参数、光谱面积参数、光谱植被指数参数3种类型。同时,运用SPSS软件对这11个SCP与基于SPAD-502实测的叶绿素含量进行皮尔逊(Pearson)相关分析,结果见表2。

表1中微分光谱的面积变量中的红边面积(SDr)、蓝边面积(SDb)的计算公式为:

SDr(或 SDb)=∑ni=1R′(λi)[(λi+1-λi)+(λi-λi-1)]2。

(2)

从表2中得到的相关系数可以看出,样本的叶绿素含量与蓝边幅值(Dr)、蓝边位置(Db)、绿峰反射率(Rg)、蓝边面积(SDb)、比值植被指数(Rg/Ro)、归一化植被参数(Rg-Ro)/(Rg+Ro)呈明显的负相关,其中与蓝边面积(SDb)的相关系数最大,为-0.773 2;叶绿素含量与蓝边位置(λb)、面积比值(SDr/SDb)、归一化面积(SDr-SDb)/(SDr+SDb)呈明显的正相关关系,相关系数分别为0.675 1、0.790 0、0.801 0。

2 基于SCP主成分输入因子的BP神经网络

2.1 BP神经网络模型

BP神经网络是1986年由Rumelhart、McCelland为首的科学家小组提出的,为1种多层前馈型神经网络,即误差反向传播算法的学习过程,由信息的正向传播、误差的反向传播2个过程组成,可以实现从输入到输出的任意非线性映射[17-18]。BP神经网络的拓扑结构主要包括输入层(input layer)、隐含层(hidden layer)、输出层(output layer)。在光谱分析中,BP神经网络是一种非常重要的模式识别方法,特别适合解决一些复杂的映射问题。

2.2 SCP的主成分分析

主成分分析主要用于数据压缩、数据解释,其分析结果主要用于回归、指标遴选、多维度评价、系统演化过程分析以及质量控制等方面[19-20]。在应用BP神经网络构建参数预测模型时,有时神经网络的数据输入端有很多指标,并且这些指标存在一定的共线性。如果将所有的数据指标都作为神经网络的输入端,不仅会增加网络模型的复杂度,而且会降低整个网络的性能(包括神经网络的学习收敛速率、是否会出现过拟合现象等),从而大大增加计算时间,甚至影响结果预测精度。PCA可以消除原始变量间的共线性,在尽可能多地保留原始数据信息的前提下,对数据进行主要成分提取,进而减少输入层神经网络个数,改善网络拓扑结构与预测效果。

在植被叶绿素含量BP模型构建过程中,PCA与BP神经网络的结合主要是在数据输入端,通过PCA对数据进行降维,减少输入层神经元的个数,增强网络性能,增强预测效果。本研究利用MATLAB R2010a对11个SCP进行PCA处理,得到的特征值及方差贡献率见表3。

表3中的方差贡献率、累计方差贡献率分别表示各个主成分所反映的原始参数的信息量和这些主成分所反映的原始参数数据量的总和。从表3可以看出:前5个互不相关主成分变量的累计贡献率达到98.841%,可以认为用前5个主成分可以代替原有参数的所有信息,并用于建立预测模型。样本前5个主成分得分情况见表4。

3 叶绿素含量的SCP-PCA-BP模型反演

3.1 构建SCP-PCA-BP反演模型

基于PCA提取SCP主要成分作为BP神经网络输入层,用于反演玉米叶片叶绿素含量,即为所建立的SCP-PCA-BP反演模型,主要包括3个部分:利用PCA技术对11个光谱特征参数进行主成分分析,并提取11个SCP的主要成分作为BP神经网络的输入层因子;确定BP神经网络拓扑结构以及最佳隐含层神经元的个数;BP神经网络预测。

3.2 SCP-PCA-BP模型的叶绿素含量反演

本研究所构建的BP神经网络一共有3层,即输入层、隐含层、输出层。将表4中各主要成分的得分作为SCP-PCA-BP反演模型的BP输入层神经元,以相对应样本叶绿素含量为输出层神经元,在玉米叶片45个叶绿素数据中随机抽取35个作为训练样本的学习目标,其余样本数据作为网络仿真预测数据。设置隐含层神经元数为5个,网络学习速率为0.05,网络训练的迭代次数为2 000次,允许误差为0.000 1。当神经网络训练完毕后,利用剩余的15组样本叶绿素含量值作为测试数据检验模型,SCP-PCA-BP模型训练与检验精度的真实值、预测值之间的决定系数r2分别为0.937 9、0892,均方根误差(root mean square error,RMSE)分别为1269 3、1.730 2;最后将所有样本的数据作为输入矢量P进行模拟预测,并将得到的预测值与真实值进行拟合,拟合结果的真实值与预测值之间的决定系数r2为0.968 7,RMSE为0893 9,其拟合结果见图1、图2,其中RMSE计算公式为:

RMSE=∑ni=1(yi-y^i)2/n。

(3)

式中:RMSE为预测值与真实值之间的均方根误差;yi为真实值;y^i为预测值;n为样本数,个。

3.3 基于线性回归模型的反演比较

从表2中选择与叶绿素含量相关性较高的8个SCPs分别作为影响因子预测样本中的叶绿素含量,以SCP为自变量、叶绿素含量为因变量建立线性回归模型。表5列举了各

特征参数与叶绿素含量的线型回归预测模型,模型预测精度将模型的决定系数r2以及真实值与预测值之间的均方根误差作为评价指标。

由表5中的线性回归模型预测结果可知,归一化面积的预测效果最好,该模型的决定系数r2达到0.7040,高于其他特征参数的回归预测模型;叶绿素含量真实值与预测值之间的均方根误差RMSE为2.849,低于其余特征参数回归模型。基于蓝边面积所构建的回归预测模型决定系数r2为 0.691 9,均方根误差RMSE为2.895,其预测结果明显好于其余6个预测模型。因此,利用这8个SCP构建线性回归模型预测叶绿素含量时,优先考虑归一化面积(SDr-SDb)/(SDr+SDb),其次考虑蓝边面积(SDb)。

4 结论

本研究通过测定玉米叶片的高光谱数据和叶绿素浓度相对值,对获取的光谱数据进行均值、微分处理,提取了11个光谱特征参数(SCP),并对这些参数和叶绿素含量进行了相关性分析、主成分分析、回归分析、神经网络预测分析,通过这些分析得到以下结论:

(1)在列举的11个SCPs中与玉米叶片中叶绿素含量相关性最高的是归一化面积(SDr-SDb)/(SDr+SDb)参数,与叶绿素含量呈显著正相关,相关系数为0.801 0;其次为面积比值(SDr/SDb)参数,相关系数为0.790 0。

(2)在利用SCP进行回归分析与预测的结果中,归一化面积的预测效果最好,叶绿素含量真实值与预测值之间的决定系数r2为0.704 0,均方根误差RMSE为2.849;其次为基于蓝边面积所构建的回归预测模型,决定系数r2为 0.691 9,均方根误差RMSE为2.895。说明归一化面积和蓝边面积可以用于回归分析预测玉米叶片中的叶绿素含量。

(3)对SCP进行主成分分析获得的玉米叶片SCP前5个主要成分,这5个主要成分的累计方差贡献率达到98841%,保留了原始数据的绝大部分光谱信息,因此这5个主要成分可以近似代替原有参数参与建立BP神经网络预测模型,即SCP-PCA-BP反演模型并用于盆栽玉米叶片的叶绿素含量反演。模型的检验结果中叶绿素含量真实值与预测值之间的决定系数r2为0.892,均方根误差RMSE为 1.730 2。最后将所有样本的数据作为输入矢量P进行模拟预测,拟合结果的真实值与预测值之间的决定系数r2为0968 7,均方根误差RMSE为0.893 9。与线性回归预测模型相比,SCP-PCA-BP反演模型大大提高了玉米叶片叶绿素含量的预测精度。

参考文献:

[1]刘 璇,林 辉,臧 卓,等. 杉木叶绿素a含量与高光谱数据相关性分析[J]. 中南林业科技大学学报,2010,30(5):72-76.

[2]吉海彦,王鹏新,严泰来. 冬小麦活体叶片叶绿素和水分含量与反射光谱的模型建立[J]. 光谱学与光谱分析,2007,27(3):514-516.

[3]宋开山,张 柏,王宗明,等. 大豆叶绿素含量高光谱反演模型研究[J]. 农业工程学报,2006,22(8):16-21.

[4]施润和,庄大方,牛 铮,等. 基于辐射传输模型的叶绿素含量定量反演[J]. 生态学杂志,2006,25(5):591-595.

[5]王 强,易秋香,包安明,等. 基于高光谱反射率的棉花冠层叶绿素密度估算[J]. 农业工程学报,2012,28(15):125-133.

[6]朱凌红,周 澎,王忠民,等. 高光谱数据与叶绿素含量及植被指数的相关性研究进展[J]. 内蒙古民族大学学报:自然科学版,2014,29(1):41-44.

[7]Broge N H,Mortensen J V. Deriving green crop area index and canopy chlorophyll density of winter wheat from spectral reflectance data[J]. Remote Sensing of Environment,2002,81(1):45-57.

[8]Maire G L,Francois C,Dufrene E. Towards universal broad leaf chlorophyll indices using PROSPECT simulated database and hyperspectral reflectance measurements[J]. Remote Sensing of Environment,2010,89(1):1-28.

[9]陈婉婧,阎广建,吕 琳,等. 大豆叶片水平叶绿素含量的高光谱反射率反演模型研究[J]. 北京师范大学学报:自然科学版,2012,48(1):60-65.

[10]姚付启,张振华,杨润亚,等. 基于红边参数的植被叶绿素含量高光谱估算模型[J]. 农业工程学报,2009,25(增刊2):123-129.

[11]Mutanga O,Skidmore A K. Red edge shift and biochemical content in grass canopies[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2007,62(1): 34-42.

[12]Inoue Y,Penueleus J,Nouevllon Y,et al. Hyperspectral reflectance measurements for estimating eco-physiological status of plants[J]. Proc Spie,2001,4151: 153-163.

[13]梁 亮,杨敏华,张连蓬,等. 基于 SVR 算法的小麦冠层叶绿素含量高光谱反演[J]. 农业工程学报,2012,28(20):162-171.

[14]李云梅,倪绍祥,王秀珍.线性回归模型估算水稻叶片叶绿素含量的适宜性分析[J]. 遥感学报,2003,7(5):364-371.

[15]杨 杰,田永超,姚 霞,等. 水稻上部叶片叶绿素含量的高光谱估算模型[J]. 生态学报,2009,29(12):6561-6571.

[16]周春艳,华灯鑫,乐 静,等. 基于神经网络的叶绿素含量精细测量建模方法研究[J]. 光谱学与光谱分析,2015,35(9):2629-2633.

[17]费 强,赵武云,戴 飞,等. 基于BP神经网络及遗传算法的组合式板齿脱粒装置参数优化[J]. 江苏农业科学,2014,42(3):351-354.

[18]梁 帆,杨莉莉,崔世钢,等. 基于神经网络的油菜成熟度等级视觉检测方法[J]. 江苏农业科学,2015,43(8):403-405.

[19]袁晓庆,李奇峰,李 琳,等. 基于主成分分析法的农业信息化评价研究[J]. 江苏农业科学,2015,43(3):398-402.

[20]冯英娜,刘卫东,朱士农,等. 茄子农艺性状和品质性状的相关性及主成分分析[J]. 江苏农业科学,2015,43(1):166-168.

猜你喜欢
叶绿素含量BP神经网络主成分分析
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用