三种叶绿素含量遥感估算模型比较

2017-05-11 11:22王亚卿于颖
森林工程 2017年2期
关键词:方根叶绿素向量

王亚卿,于颖

(东北林业大学 林学院,哈尔滨 150040)

三种叶绿素含量遥感估算模型比较

王亚卿,于颖*

(东北林业大学 林学院,哈尔滨 150040)

叶绿素是植物光合作用的主要参与者,是分析和评估森林生产力、森林健康和研究森林生态系统固碳能力的基础,准确的估算森林叶绿素含量极为重要。本研究利用实测叶片光谱和对应的叶绿素含量,分别使用多元统计、神经网络和支持向量机方法建立叶绿素含量估算模型,并比较和分析不同估算模型的优缺点,为开展相关研究提供参考。研究结果表明:三种建模方法中以Erf-BP神经网络模型最优,拟合精度达到了94.46%,RMSE为3.321 μg/cm2;支持向量机方法次之,拟合精度在92.41%,RMSE为5.705 μg/cm2;以多元逐步回归方程精度最低,为88.74%,且RMSE偏大,达到了13.354 μg/cm2。通过拟合精度和均方根误差2个指标可以明显地比较出Erf-BP神经网络具有最好的拟合精度和稳定性。

叶绿素含量;多元统计回归;神经网络;支持向量机

0 引言

植被光合作用的主要参与者是叶绿素,它是表征植被生产力的重要因子,控制着植被氧气的释放以及有机物的合成,而森林生态系统是碳在地表的重要载体之一,准确的估算出森林的叶绿素含量对分析、评价森林生产力以及研究森林的固碳能力至关重要[1-2]。研究表明植被的健康状况不同,会引起其反射光谱在“绿峰”和“红边”反射特征的变化,而这种光谱特征可用来探测植被的形态和生长状况,以及估算植被的生化参数[3-5]。国内外学者在叶绿素含量反演模型方面做了大量的深入的工作。最初学者是通过建立地面实测数据与像元反射率之间的回归方程估算叶绿素含量[6-8]。Penuelas等的研究结果表明利用窄波段反射指数可以估算叶片的叶绿素和类胡萝卜素的浓度[9]。Blackburn利用从高光谱数据上提取的PSND(Pigment Specific Normalized Difference)指数及PSSR(Pigment Specific Simple Ratio)指数估算叶绿素含量[10]。Lam等利用TCARI/OSAVI指数来消除LAI对叶绿素测定的影响[11],均得到了很好的叶绿素反演结果。还有一些学者致力于通过叶片与光能之间相互作用过程,利用辐射传输模型定量反演叶片叶绿素含量[12-16]。无论是统计模型还是利用机理模型都可以建立叶绿素浓度的反演模型,实现利用光谱分析技术估算叶绿素浓度的目的。然而不同建模所得到的结果各有不同,本研究以实测叶片光谱和对应叶片的叶绿素含量为数据源,从统计方法的角度入手,讨论了多元回归方法、神经网络方法以及支持向量机方法估算叶绿素含量的能力。

1 研究区域及数据采集

研究区域设在黑龙江省塔河县,在研究区域内设置32个0.06 hm2的样地,根据树高,将树冠分三层,逐层取样,每层取5~10片叶子,进行室内光谱测量,并将样品放置0°的保温箱中,带回实验室进行叶绿素含量的测量,测量方法参考文献[17]。

2 研究方法

2.1 模型自变量的选择

叶绿素遥感估算模型变量主要由遥感变量和通过计算相关系数筛选的变量两部分组成。遥感变量包括与叶绿素含量有关的光谱特征变量,选取与叶绿素含量高度相关的植被指数,如NDVI、MCARI、CARI、PSSR、GNDVI等。以及实验室测量叶绿素含量的3个波段663、645、652 nm做为叶绿素含量估算模型的候选波段(见表1)。此外,还通过计算叶绿素含量与叶片光谱的相关性,选取与叶绿素含量相关性高的波段Log(R425)、Log(R466)、Log(R677)、R445、R657、Diff(R516)、Diff(R521)、Diff(R631)、Diff(R700)、Diff(R735)、Diff(R749)、Diff(R819)一并做为模型的候选变量。

表1 高光谱遥感变量的定义及描述

2.2 多元统计模型

将外业采集的样本数据通过异常值和异方差检验,剔除异常值后,随机选取其中75%作为建模样本,并利用剩下的25%作为检验样本对模型精度进行评价。将变量输入SPSS统计软件,采用逐步回归的方法,建立多元回归模型。

2.3 神经网络模型

误差反向传播算法(Back Propagation,BP)是遥感应用研究中使用广泛的一种人工神经网络模型。是用于多层神经网络训练的,由输入层、中间层以及输出层组成。随着研究的深入,学者们发现BP神经网络存在着诸多问题,如收敛速度慢;训练过程发生震荡,易陷入局部极小;难以确定其网络结构;学习样本数量和质量易影响网络的学习效率和速度等[18],从而限制了BP神经网络的进一步发展。本研究以高斯误差函数作为隐含层激活函数,建立了BP前馈神经网络(Erf-BP)[19]。

Erf-BP神经网络模型采用的是包含一个隐含层的三层式结构,隐含层和输出层传递函数分别为高斯误差函数和logsig函数,隐含层节点数由公式(1)确定[18]。

(1)

式中:m为隐含层神经元个数;n为输入层的节点数;l为输出层的节点数;δ为0~10之间的常数。

2.4 支持向量机模型

支持向量机(SupportVectorMachines,SVM)的研究始于20世纪90年代,最初是由Vapnik等人根据统计学习中的结构风险最小化原则提出的[20-22]。支持向量机是在SRM(StructuralRiskMinimization,SRM)原则上设计具有最大间隔的最优超平面,利用核函数的技巧得到输入空间中的非线性学习算法。通过不同的核函数如q次多项式函数、径向基函数、Sigmoid函数可以得到不同的支持向量机。

2.5 精度验证

利用spss20.0软件对模型及系数进行显著性检验,最后利用除建模样本以外的其余样本进行精度验证。计算预测值和真实值之间的精度公式(2)和均方根误差公式(3),作为评价模型的指标。

(2)

(3)

3 结果与分析

3.1 多元统计模型

通过查阅文献和计算相关系数,初步确定了叶绿素估算模型的候选参数为27个。利用逐步回归的方法剔除了其中23个变量,剩余的四个变量分别是PSSR、RVp、Diff(R749)与Log(R466)。在显著性水平为95%的指标下,最终得到的叶绿素反演模型为:

Chl(μg/cm2)=31.911-0.88×PSSR+66.293×Diff(R749)-6.136×Log(R466)-0.242×Rvp。

(4)

模型拟合的决定系数R2=0.812,均方根误差RMSE=13.354 μg/cm2,模型精度为88.74%。

3.2 Erf-BP神经网络模型

Erf-BP神经网络建模过程除确定的输入和输出之外,还需要进行一些必要的设置。Erf-BP神经网络的输入设置包括以下几部分:隐含层节点浮动范围为[5,16];误差函数采用误差平方和,范围为[1.0,0.1],按步长0.01递减;学习速率为0.3;动量因子为0.9;坡度因子为1。将样本数据的75%作为训练网络组,剩余25%用来进行网络性能的检验。自变量和因变量经归一化处理后,输入网络,通过多次训练网络,得到包含不同隐含层的训练网络,见表2。

表2 Erf-BP神经网络模型结果

综合表2,当隐含层神经元个数为13时,Erf-BP神经网络的精度达到最高,其中拟合精度为95.28%,检验精度为94.46%,均方根误差RMSE=3.321 μg/cm2。

3.3 支持向量机模型

本研究通过使用不同的核函数构建支持向量机模型,并对模型结果和精度进行评价。将27个变量分别输入到线性核函数支持向量机、多项式核函数支持向量机,径向基核函数支持向量机,并计算了实测数据和支持向量机模拟结果的相对误差、均方根误差,以评价不同核函数模拟结果的准确性。计算结果见表3。

表3 不同核函数支持向量机模型模拟结果

从表3中可以看出,不同核函数支持向量机模型中以修正的叶绿素吸收指数MCARI建立的模型精度最高,线性核函数、多项式核函数、径向基核函数精度分别为90.07%、90.94%、92.41%,均方根误差为7.197、6.669、5.705 μg/cm2,并以径向基核函数建立的支持向量机模型精度最高,拟合效果最好。

3.4 模型比较

本研究分别使用了多元回归分析、神经网络和支持向量机三种模型建立了叶片尺度叶绿素遥感估算模型。表4列出几种模型估算精度的比较。

表4 不同建模方法精度比较

从表4中可以看出,三种建模方法中以Erf-BP神经网络模型最优,拟合精度达到了94.46%,RMSE为3.321 μg/cm2;支持向量机次之,拟合精度在92.41%,RMSE为5.705 μg/cm2;以多元逐步回归方程精度最低,为88.74%,且RMSE偏大,达到了13.354 μg/cm2。通过拟合精度和均方根误差两个指标可以明显的比较出修改后的神经网络模型Erf-BP神经网络具有最好的拟合精度和稳定性。

4 结论

本研究以地面实测叶片光谱和对应叶绿素含量为数据源,分别使用多元回归分析方法、神经网络方法和支持向量机三种不同方法建立叶绿素含量的估算模型,并对模型精度进行比较分析。结果表明,多元逐步回归方程相比较其他两种方法,它的模型稳定性和预测精度相对比较低。支持向量机模型是20世纪90年代末出现的一种基于统计学习原理的数据分析方法,本文将其引入到叶绿素含量遥感估算模型的研究中,证明了支持向量机在遥感技术与应用领域的应用前景和空间。Erf-BP神经网络是对现有BP神经网络的一种改进算法,本研究的结果表明了Erf-BP神经网络具有较好的拟合和预测能力,并且预测结果的稳定性较高。

然而,模型的精度不能单纯的通过精度和均方根误差两项来评定,它还受到其他因素的影响。如建模样本的测量误差,样本本身的代表性等等。并且,本研究仅仅分析了叶片光谱与叶绿素含量的估算模型,如应用到遥感影像中还要考虑,叶片尺度和冠层尺度转化等问题,这些都有待进一步研究。

[1]Belanger M J,Miller J R,Boyer M G.Comparative relationships between some red edge parameters and seasonal leaf chlorophyll concentrations[J].Canadian Journal of Remote Sensing,1995,21(1):16-21.

[2]Gitelson A A,Merzlyak M N,Lichtenthaler H K.Detection of red edge position and chlorophyll content by reflectance measurements near 700 nm[J].Journal of Plant Physiology,1996,148(3-4):501-508.

[3]Miller J R,Hare E W,Wu J.Quantitative characterization of the vegetation red edge reflectance 1.An inverted-Gaussian reflectance model[J].International Journal of Remote Sensing,1990,11(10):1755-1773.

[4]Miller J R,Wu J,Boyer M G,et al.Seasonal patterns in leaf reflectance red-edge characteristics[J].International Journal of Remote Sensing,1991,12(7):1509-1523.

[5]Sampson P H,Zarcotejada P J,Mohammed G H,et al.Hyperspectral remote sensing of forest condition:estimating chlorophyll content in tolerant hardwoods.[J].Forest Science,2002,49(3):381-391.

[6]Curran P J,Kupiec J A,Smith G M.Remote sensing the biochemical composition of a slash pine canopy[J].IEEE Transactions on Geoscience & Remote Sensing,1997,35(2):415-420.

[7]Johnson L F,Hlavka C A,Peterson D L.Multivariate analysis of AVIRIS data for canopy biochemical estimation along the Oregon transect.[J].Remote Sensing of Environment,1994,47(2):216-230.

[8]Datt B.Remote sensing of chlorophyll a,chlorophyll b,chlorophyll a+b,and total carotenoid content in eucalyptus Leaves[J].Remote Sensing of Environment,1998,66(2):111-121.

[9]Penuelas J,Baret F,Filella I.Semiempirical indexes to assess carotenoids chlorophyll-a ratio from leaf spectral reflectance[J].Photosynthetica,1995,31(2):221-230.

[10]Blackburn G A.Quantifying chlorophylls and caroteniods at leaf and canopy scales:An evaluation of some hyperspectral approaches[J].Remote Sensing of Environment,1998,66(3):273-285.

[11]Lam H K,Ling S H,Leung F H F,et al.Integrated narrow-band vegetation indices for prediction of crop chlorophyll content for application to precision agriculture[J].Remote Sensing of Environment,2002,81(2):416-426.

[12]Demarez V,Gastellu-Etchegorry J P,Mougin E,et al.Seasonal variation of leaf chlorophyll content of a temperate forest.Inversion of the PROSPECT model[J].International Journal of Remote Sensing,1999,20(5):879-894.

[13]Ganapol B D,Johnson L F,Hammer P D,et al.LEAFMOD:a new within-leaf radiative transfer model[J].Remote Sensing of Environment,1998,63(2):182-193.

[14]Jacquemoud S,Baret F.PROSPECT:A model of leaf optical properties spectra.[J].Remote Sensing of Environment,1990,34(2):75-91.

[15]Renzullo L J,Blanchfield A L,Guillermin R,et al.Comparison of PROSPECT and HPLC estimates of leaf chlorophyll contents in a grapevine stress study[J].International Journal of Remote Sensing,2006,27(4):817-823.

[16]杨博,王亚东,苏小红.一种基于误差放大的快速BP学习算法[J].计算机研究与发展,2004,41(5):774-779.

[17]Yang X,Yu Y,Fan W.Chlorophyll content retrieval from hyperspectral remote sensing imagery[J].Environmental Monitoring & Assessment,2015,187(7):1-13.

[18]吴昌友.神经网络的研究及应用[D].哈尔滨:东北农业大学,2007.

[19]杨曦光.高光谱数据提取森林冠层叶绿素及氮含量的研究[D].哈尔滨:东北林业大学,2010.

[20]Vapnik V N.The nature of statistical learning theory[J].Neural Networks IEEE Transactions on,1995,10(5):988 -999.

[21]Cortes C,Vapnik V.Support-vector networks[J].Machine Learning,1995,20(3):273-297.

[22]孙存举,梁楠.遥感光谱混合模型在成都城区植被信息提取中的应用[J].四川林业科技,2014,35(5):84-87.

Comparisons of Three Remote sensing Models for Estimating Chlorophgll Content

Wang Yaqing,Yu Ying*

(College of Forestry,Northeast Forestry University,Harbin 150040)

Chlorophyll is an important participant in the photosynthetic process.Chlorophyll has been used to study and evaluate the forest productivity and forest health and is the basis of study forest ecosystem carbon sequestration ability.Therefore,it is very important to accurately estimate the chlorophyll content.Multiple linear regression models,neural network and support vector machine methods were used to establish the chlorophyll content estimating model based on the measured leaf chlorophyll content and corresponding reflectance spectrum in this study.The advantages and disadvantages of those models was compared and analyzed to provide a theoretical basis for estimating chlorophyll content based on remote sensing technology.The result showed that estimating model established using Erf-BP neural network method was the best one with the accuracy of up to 94.46%,the root mean square error(RMSE) of which was 3.321μg/cm2.The model established using support vector machine method was better with the accuracy of 88.74%,RMSE of which was 5.705μg/cm2.The model established using multiple stepwise regression method was restively poor with the accuracy and RMSE of 92.41% and 13.354μg/cm2respectively.Erf-BP neural network was concluded to be the best method with high fitting precision and good stability by the comparison.

chlorophyll content;multiple linear regression;neural network;support vector machine

2016-11-04

国家自然科学基金项目(31500518,31500519)

王亚卿,硕士研究生。研究方向:遥感与地理信息系统。

*通信作者:于颖,博士,副教授。研究方向:遥感与地理信息系统。E-mail:yuying4458@163.com。

王亚卿,于颖.三种叶绿素含量遥感估算模型比较[J].森林工程,2017,33(2):28-32.

S 758

A

1001-005X(2017)02-0028-05

猜你喜欢
方根叶绿素向量
向量的分解
聚焦“向量与三角”创新题
提取叶绿素
我们爱把马鲛鱼叫鰆鯃
桃树叶绿素含量与SPAD值呈极显著正相关
叶绿素家族概述
均方根嵌入式容积粒子PHD 多目标跟踪方法
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
数学魔术——神奇的速算