王龑,田庆久,王磊,耿君,周洋
(1.浙江省水利水电勘测设计院,杭州310002;2.南京大学国际地球系统科学研究所,南京210023)
杨树林叶面积稳定期的叶面积指数遥感估算方法
王龑1,田庆久2,王磊2,耿君2,周洋2
(1.浙江省水利水电勘测设计院,杭州310002;2.南京大学国际地球系统科学研究所,南京210023)
针对用归一化差值植被指数(Normalized Difference Vegetation Index,NDVI)估算植被叶面积指数(Leaf Area Index,LAI)不仅需要大量地面LAI观测及其数据统计,且在植被NDVI饱和时难以估算LAI等问题,提出了一种基于数据挖掘技术的LAI遥感估算方法。该方法借助数据挖掘技术从有限的数据中挖掘和发现有用的信息,排除人为干扰,提高模型构建效率和精度。文中以安徽滁州地区杨树林为研究对象,获取研究区杨树林展叶期和花果期的HJ-CDD遥感影像,利用LAI-2000同步测量杨树林LAI;借助数据挖掘技术并基于杨树林展叶期和花果期估算的LAI值,通过筛选优化构建了杨树林生长过程中叶面积稳定期的LAI估算模型,并结合叶面积稳定期实测的LAI值验证表明该模型用于杨树林叶面积稳定期LAI估算的可靠性,为植被NDVI饱和时的LAI遥感估算提供了一种有效的思路和方法。
数据挖掘;杨树林;NDVI;LAI;多光谱遥感
叶面积指数(Leaf Area Index,LAI)被定义为单位地表面积上总绿叶面积的一半[1]。植被LAI是研究植被冠层结构的一个重要参数,它控制着植被的许多生物物理过程,同时也为植冠表面最初能量交换提供结构化定量信息。地面LAI测量方法仅能获得地面有限点的LAI值,不能满足大面积植被生态和作物长势监测的需求。借助遥感手段成为行之有效地获取区域植被LAI的重要途径和方法[2],国内外已利用多光谱[3-4]、高光谱[5-6]遥感数据开展了大量相关研究。利用NDVI进行植被LAI遥感估算是普遍的经验法,但是这种方法最大缺陷是:当植被LAI达到一定值时,使植被冠层的NDVI出现饱和,造成LAI-NDVI估算模型无法精确估算LAI。这个问题一直是遥感领域研究的难点,目前国内外相关研究[7-9]仅做了因果分析,仍未提出明确的解决方法。
另外,NDVI法估算LAI主要是利用统计的方法进行的,为了保证估算的精度,需要进行大量的统计计算,数据量大且不易处理。而数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程[10]。其中,Eureqa Pro是常用的数据挖掘软件,这个程序通过原始数据间的关联性来探索方程式和隐含的数学关系[11]。
本文利用实测的杨树林LAI数据和HJ-CCD影像经预处理后的NDVI数据,借助数据挖掘常用软件——Eureqa Pro来探索叶面积稳定期与展叶期、花果期的LAI之间潜在的关联性,研究构建杨树林叶面积稳定期LAI的有效估算模型。
1.1 研究区概况
研究区位于安徽省滁州地区,地貌大致可分为丘陵区、岗地区和平原区三大类型。全市森林总面积达2733km2,森林覆盖率达到20.5%,人工林占95%以上,群落类型有阔叶林、针叶林、针阔混交林。而杨树已成为滁州市的主要造林树种之一,占的比例达80%以上,在树种结构中占有绝对优势。
1.2 数据获取
(1)LAI实测数据。
利用LAI-2000分别于2012年5月7日(花果期)、2013年4月19日(展叶期)和2013年6月8日(叶面积稳定期)分别对研究区的41个、45个、24个杨树林样地LAI进行观测,但3个生长期观测样地中一一对应的固定样地仅有16个。
(2)HJ-CCD影像数据。
获取关于研究区与观测时间相近的影像数据,如表1所示。
表1 所获取关于研究区的HJ-CCD影像
2.1 LAI估算
(1)展叶期和花果期LAI估算模型构建。
利用展叶期25个样地、花果期21个样地的实测LAI数据、与观测时间相近的HJ-CCD影像经处理后得到的展叶期NDVI1数据与花果期NDVI2数据,建立线性、对数、指数3种形式的LAI-NDVI估算模型,其相关系数如表2所示。
表2 杨树林展叶期和花果期LAI与NDVI的相关性
由表2可知,两个时期的线性模型、指数模型和对数模型的相关系数(R2)相差不大,这里选择一元线性回归模型来进行各个时期杨树林LAI的估算,如图1所示。这两个时期模型的相关性都较高,R2分别为0.661、0.604。另外利用展叶期和花果期未参加模型估算的20个地实测LAI对这两个时期模型估算的LAI进行验证,得到估算LAI与实测LAI的相关系数(R2)分别为0.65、0.577,经计算,均方根误差(RMSE)分别为0.14、0.38,可见模型精度较高。
(2)叶面积稳定期LAI估算模型构建。
当杨树林LAI达到一定值时,NDVI变化已不灵敏,因此表现不出LAI随NDVI变化的趋势。所以直接利用叶面积稳定期杨树林样地实测LAI与对应NDVI的相关关系已不能准确估算此时期的LAI值。本文间接通过杨树林生长较快且特点较明显的两个时期——展叶期和花果期来探索叶面积稳定期LAI估算模型。展叶期和花果期的LAI估算模型如式(1)、式(2)所示:
利用式(1)、式(2)分别得到16个杨树林3个生长期一一对应的固定样地的展叶期和花果期的估算值LAI1、LAI2,然后结合这16个样地实测的叶面积稳定期LAI,得到16个(LAI,LAI1,LAI2)数据对,如表3所示。
图1 两个时期的LAI估算模型
表3 叶面积稳定期杨树林LAI实测值及展叶期、花果期的NDVI值及估算LAI值
2.2 利用数据挖掘技术筛选模型
Eureqa Pro是数据挖掘技术常用的软件,它通过原始数据间的关联性来探索方程式和隐含的数学关系,并通过数据来不断分析、检验方程式和数学关系,直到找到有效和正确的方程式。
由于数据挖掘技术可以从有限的数据中挖掘和发现有用的信息,排除人为干扰,提高模型构建效率和精度,因此本文借助数据挖掘技术软件Eureqa Pro,利用表3中的16个(LAI,LAI1,LAI2)数据对来探索LAI与LAI1、LAI2之间的关联模型,其中相关系数(R2)相对较高且关系式简单的3个相关方程分别为:
将式(1)、式(2)代入式(3)、式(4)、式(5)并化简有:
因此,式(6)、式(7)、式(8)即为通过数据挖掘技术寻找并筛选出的相对较优的叶面积稳定期LAI估算模型。
3.1 LAI估算模型相关性分析
式(6)表明LAI与NDVI1和NDVI2两者间具有较好的相关性,相关系数(R2)达到0.49,但由式(7)和式(8)看出,LAI与NDVI1具有较好的相关性,相关系数(R2)为0.57,而LAI与NDVI2相关性很弱,相关系数(R2)仅为0.15。这主要是因为NDVI1为杨树林展叶期的NDVI值,展叶期杨树林生长比较快,植被覆盖度为25%~80%,NDVI变化比较灵敏,随杨树林覆盖度的增大呈线性增大。而且,展叶期的杨树林NDVI更能真实地反映杨树林的密度、林窗等参数综合信息,更能准确地表达杨树林生长状况和环境。而NDVI2为杨树林花果期的NDVI值,此时期的杨树林叶子已经完全展开并产生了一定的聚集度,减小了密度差异和林窗,这反映在遥感影像上,杨树林NDVI表现不出明显的差异性,而是表现得相对集中,即此时的NDVI变化的灵敏度降低。因此LAI与NDVI1的相关度比NDVI2大,即式(6)、式(7)的相关系数比式(8)大,更能准确反映叶面积稳定期LAI与展叶期和花果期NDVI的关联性。
3.2 LAI估算模型精度评价
为了进一步比较式(6)、式(7)式所代表模型的精度,用未参与模型构建的叶面积稳定期的8个样地实测LAI值分别对式(6)、式(7)模型的估算LAI值进行验证,如图2所示。
图2 估算LAI值与实测LAI值的相关关系
由验证结果可看出,用式(6)估算的LAI值与实测LAI值的相关系数比式(7)高。另外,经计算,式(6)估算的LAI值与实测LAI值的均方根误差(RMSE)为0.22,式(7)估算的LAI值与实测LAI值的均方根误差(RMSE)为0.48。因此,式(6)估算的LAI值与实测LAI值更接近。这是因为式(7)是LAI与NDVI1的关系表达式,而式(6)是LAI与 NDVI1和NDVI2的关系表达式;式(7)的相关系数比式(6)的相关系数大,这说明LAI与NDVI1的相关度更大;但是式(6)、式(7)是通过同时利用NDVI1和NDVI2挖掘出来的关联表达式,NDVI1和NDVI2同时参与了关联运算,所以LAI与两者均有关系。因此,式(6)更能准确地表达LAI与两者的关系,也更能真实地反映杨树林的真实生长特点,故式(6)LAI估算值比式(7)估算值的精度高,更接近实测值。
综上所述,式(6)为最优叶面积稳定期LAI估算模型。
本文利用实测LAI数据和HJ-CCD遥感数据,采用数据挖掘技术探索了叶面积稳定期LAI估算模型,通过模型相关性分析及精度评价,筛选出了最优的叶面积稳定期LAI估算模型。主要结论如下:
①利用展叶期和花果期的实测LAI和NDVI进行叶面积稳定期LAI估算具有较高的可靠性,估算值与杨树林的生长规律具有较好的一致性。
②数据挖掘的关联模型反映出了叶面积稳定期LAI与展叶期NDVI和花果期NDVI的相关度,与两者的相关系数为0.49,但与展叶期NDVI的相关性更高,相关系数(R2)为0.57,而与花果期NDVI的相关性较小,相关系数(R2)仅为0.15。
③叶面积稳定期LAI估算模型是关于展叶期NDVI和花果期NDVI两个变量的表达式,此表达式估算精度比单变量表达式精度高,更能准确地反映杨树林的生长特点。
④本文优选的LAI估算模型适用于叶面积稳定期杨树林的LAI估算,即使较疏的杨树林地NDVI未饱和,也仍然可以满足更高空间分辨率多光谱遥感杨树林LAI的估算。
⑤杨树林的LAI受到年龄和环境因子的影响,年龄的增大会导致LAI偏大。本文利用相关性分析方法研究的LAI与NDVI的相关性包含有杨树林年龄对LAI的影响,在后续研究中需要考虑去除年龄对杨树林LAI的影响。
[1]CHEN J M,BLACK T A.Defining leaf-area index for non-flat leaves[J].Plant Cell And Environment,1992,15(4):421-429.
[2]WEISS M,BARET F.Evaluation of canopy biophysicalvariable retrieval performance from the accumulation oflarge swath satellite data[J].Remote Sensing of Environment,1999,70:293-306.
[3]FANG H L,LIANG S L.A hybrid inversion method formapping leaf area index from MODIS data:experiments andapplication to broadleaf and needleleaf canopies[J].Remote Sensing of Environment,2005,94(3):405-424.
[4]KAMEL S,CHRISTOPHE F,GUERRIC M.Comparative analysis of IKONOS,SPOT,and ETM+data for leaf area indexestimation in temperate coniferous and deciduous foreststands[J].Remote Sensing of Environment,2006,102(1/2):161-175.
[5]赵丽芳.利用Hypeion高光谱遥感数据估测森林叶面积指数[D].北京:北京林业大学,2007.
[6]杨峰,范亚民,李建龙,等.高光谱数据估测稻麦叶面积指数和叶绿素密度[J].农业工程学报,2010,26(2):237-243.
[7]石月婵,杨贵军,冯海宽,等.北京山区森林叶面积指数季相变化遥感监测[J].农业工程学报,2012,28(15):133-139.
[8]WANG Q,SAMUEL A,JOHN T,et al.On the relationship of NDVI with leaf area index in a deciduous forest site[J].Remote Sensing of Environment,2005,94(2):244-255.
[9]BIRKY A K.NDVI and a simple model of deciduous forest seasonal dynamics[J].Ecological Modelling,2001,143(1):43-58.
[10]吉根林,孙志挥.数据挖掘技术[J].中国图象图形学报,2001,6(8):215-721.
[11]DUBˇCÁKOVÁR.Eureqa:software review[J].Genetic Programming and Evolvable Machines,2011,12(2):173-178.
Remote Sensing Estimation Method for Aspen Leaf Area Index During Leaf Constant Period
WANG Yan1,TIAN Qing-jiu2,WANG Lei2,GENG Jun2,ZHOU Yang2
(1.Zhejiang Design Institute of Water Conservancy and Hydroelectric Power,Hangzhou310002;2.International Institute for Earth System Science,Nanjing University,Nanjing210023)
As plenty of leaf area index(LAI)observation data are needed when vegetation normalized difference vegetation index(NDVI)is widely used to estimate LAI.In addition,it is difficult to estimate LAI when NDVI is saturated.A method that estimating LAI by data mining technology was proposed.This method can mine and discover useful information from limited data,eliminate human interference,and improve the efficiency and accuracy of modeling.In this paper,the aspen in Chuzhou city,Anhui province was taken as research object.HJ-CDD remote sensing images for aspen leaf production period and flowering and fruit-bearing period about the study area were obtained,and the aspen LAI was measured simultaneously with LAI-2000.Applying the data mining technique,a novel model is established to estimate the LAI of aspen in the leaf constant period based on those in the leaf expansion period and flowering and fruit-bearing periods.Compared with the measured data of leaf constant period,this model is proved to be reliable and effective for vegetation LAI remote sensing estimation when NDVI was saturated.
data mining;aspen forest;NDVI;LAI;multispectral remote sensing
10.3969/j.issn.1000-3177.2015.06.009
TP79
A
1000-3177(2015)142-0048-04
2015―03―17
2015―05―06
王龑(1989—),女,硕士研究生,主要从事植被遥感研究。
E-mail:wangyan_woshiwang@163.com