(1. 中国科学院新疆生态与地理研究所,荒漠与绿洲生态国家重点实验室,乌鲁木齐 830011;2. 新疆维吾尔自治区遥感与地理信息系统应用重点实验室,乌鲁木齐 830011;3. 中国科学院大学,北京 100049)
棉花叶面积指数(leaf are index, LAI)的快速、准确获取对棉花长势监测、发育期诊断、面积提取以及产量估算等遥感监测具有重要意义。该研究利用2017年和2018年的Sentinel-2多光谱卫星数据及大面积田间试验观测获取的棉花不同发育期LAI实测数据,构建了基于单波段反射率及各类植被指数的棉花不同发育期及全发育期LAI估算模型,并采用留一验证(LOOCV, leave-one-out cross validation)和交叉验证对模型精度进行了检验。结果表明:1)对于单波段反射率,基于中心波长为842 nm波宽为145 nm的B8近红外波段对不同发育期LAI估算精度最优均方根误差(RMSE, root mean square error, RMSE=0.378);2)对于各类植被指数,花蕾期(20170616)和花铃期(20170802)时增强植被指数(EVI, enhanced vegetation index,)表现最佳(RMSE分别为0.352和0.367),开花期(20180623)时校正土壤调节植被指数(MSAVI2, modified soil adjusted vegetation index 2,)估算精度最高(RMSE=0.323);3)单波段反射率和各类植被指数对全发育期LAI的估算均要优于对单个发育期LAI的估算,其中基于IRECI指数的(inverted red-edge chlorophyll index)全发育期LAI估算模型精度最佳,LOOCV检验RMSE=0.425,交叉检验RMSE=0.368;将基于IRECI的全发育期LAI估算模型应用到单个发育期LAI估算并与各单个发育期LAI估算模型精度对比,发现交叉验证RMSE平均值仅比LOOCV验证RMSE平均值高0.07,反映了全发育期LAI估算模型良好的普适性。该研究为农作物LAI估算提供了新的数据选择,完善了Sentinel-2卫星数据在LAI估算中的应用领域。
叶面积指数LAI(leaf area index)最早由Watson[1]提出,定义为单位土地面积绿色叶片的单面面积总和。叶面积指数是蒸散发、光能利用率、产量估算及作物发育期诊断、地球化学元素循环等研究中的重要参数[2],它影响叶片及冠层的诸多过程[3-5],如冠层叶绿素含量、光合速率、碳、氮循环以及作物鲜、干生物量、作物发育期等。对于农作物及森林等叶面积指数的遥感监测已有大量研究[6-7]。但这些研究中提出的各类算法面对不断更新改进的新的遥感数据,其应用精度仍需进行讨论验证[6,8]。
过去的几十年,随着遥感技术的飞速发展,很多新型的中分辨率对地观测卫星也已投入了研究应用,如2013年2月11日发射的Lsandsat-8卫星,以及由欧空局于2015年6月23日发射的Sentinel-2A和2017年3月7日发射的Sentinel-2B多光谱遥感卫星。相比Landsat-8卫星数据,Sentinel-2多光谱遥感卫星从705 ~ 865 nm特有3个红边参数波段,空间分辨率20 m,同时具有空间分辨率为10 m的3个可见光波段以及1个近红外波段,以及空间分辨率为60和20 m的近红外和短波红外波段等,共计13个波段,并且随着Sentinel-2A和Sentinel-2B双轨卫星的同时运行,Sentinel-2多光谱卫星的时间分辨率缩短至5 d,这为遥感卫星数据在农业遥感中的应用提供了更多的可能性。
Sentinel-2数据可正式获取应用前,已有很多研究通过模拟Sentinel-2卫星数据探讨了其在农业[9-13]以及森林生态[14]中的应用,证实了红边参数波段的有效性,并且Frampton等[11]基于模拟的Sentinel-2数据提出了用于估算作物叶绿素和叶面积指数LAI的IRECI(inverted red edge chlorophyll index)和S2REP(Sentinel-2 red-edge position)红边参数植被指数。在Sentinel-2数据可下载获取后,其逐渐在作物分类及面积提取[15]、生物量估算[16]、作物叶绿素[17]以及水分信息遥感监测[18]等领域展开了应用。其中,利用Sentinel-2多光谱卫星数据进行叶面积监测也有相关研究,主要包括Korhonen等[19]开展的森林叶面积指数估算、Clevers等[17]基于Sentinel-2数据的土豆叶面积指数及叶绿素含量监测以及苏伟等[20]利用Sentinel-2数据进行的玉米叶面积指数估算。这些研究所构建的基于Sentinel-2的估算模型,证实了Sentinel-2多光谱数据用于LAI估算的可行性,但研究中所构建的LAI估算模型均是针对特定研究区域、研究对象的经验模型,无法直接用于棉花LAI估算。对于Sentinel-2数据用于棉花LAI的估算还有待探讨。
利用2018年6月23日的Sentinel-2多光谱影像数据的B4,B3和B2波段的真彩色合成影像图反映研究区样点分布,如图1。研究区位于新疆维吾尔自治区北部石河子垦区,地处天山北麓中段,古尔班通古特大沙漠南缘,地理坐标位于84°58'~86°24'E,43°26'~45°20'N。在研究区内,依据棉花种植面积,选取面积超过50 hm2的棉花种植区作为样点,共选取了4个样点地进行观测点布设。为了丰富观测样本取值范围,选取的LAI观测样点中包含了不同品种(新陆早61、棉74和棉64)、不同播种日期(2017年4月20日、23日及25日)的田块,依据样点面积大小在每个样点布设8~15个不等的观测点。
通过欧洲航空局的数据共享网站( https://scihub. copernicus.eu/dhus/#/home)下载获取与地面观测时间同步的Sentinel-2多光谱卫星的Level-1C级影像数据,成像时间分别为2017年6月16日、2017年8月2日以及2018年6月23日。所有遥感影像数据均为已经过辐射校正和几何校正处理的Level-1C大气上层表观反射率。本研究采用SNAP-Sen2Cor软件对影像数据进行大气校正,并通过最近邻插值法,将大气校正后的各波段重采样至10 m后用于研究区各观测点反射率提取及植被指数计算。Sentinel-2多光谱数据不同波段中心波段分布及空间分辨率信息见表1。
表1 Sentinel-2数据主参数
表2 所采用植被指数及基于Sentinel-2数据的计算方法
采用决定系数R,均方根误差RMSE(root mean square error ),平均偏差,以及实测值与估算值拟合趋势线的斜率()和截距()进行模型精度检验。其中,RMSE数值直接体现模型估算误差的多少,其单位与实测值单位相同;平均偏差是用百分比来表示总体的估算值偏离实测平均值的程度,其值为正值时,总体上高估,为负值时,总体上低估;决定系数2、斜率和截距主要体现估算值和实测值之间变化趋势的吻合程度,决定系数2值介于0~1之间,2接近1,斜率()接近1,截距()接近0时,估算值与实测值吻合最佳。各指标的计算公式如下:
对Sentinel-2多光谱卫星各波段反射率在不同发育期以及不同LAI值时的变化特征进行分析,如图2所示。图2b中LAI值选取本研究中LAI最大值(LAI=6.67)、最小值(LAI=1.44)以及接近平均值的样本所对应的Sentienl-2多光谱反射率进行对比。从图2a可见,随着棉花从花蕾期(20170616)到开花期(20180623)到花铃期(20170802)的发育进程,Sentinel-2多光谱卫星可见光波段(B1~B4,443 nm~665 nm)反射率逐渐减小,红边参数波段(B5~B7,705 nm~783 nm)及近红外波段(B8~B8a,842 nm~865 nm)反射率逐渐增大。图2b,不同LAI取值的Sentinel-2多光谱卫星反射率与不同发育期光谱反射率变化呈现相同规律,随着LAI值从1.44增大至6.67,可见光波段反射率减小,红边参数波段及近红外波段反射率增大,由此可得出,LAI与可见光波段反射率变化呈负相关关系,与红边参数波段及近红外波段反射率呈正相关关系。
图2 不同观测时期以及不同LAI值Sentinel-2反射率特征
表3 Sentinel-2单波段反射率及植被指数与实测LAI相关关系
注:*表示相关系数显著性水平为0.001 (160.0010.708;=26,0.001=0.588;=28,0.001=0.57;=70,0.001=0.38)。
Note: * represents significant level at 0.001 (160.0010.708;=26,0.001= 0.588;=28,0.001=0.57;=70,0.001=0.38).
对比各类光谱变量在不同发育期的表现可发现,相比于棉花花蕾期(20170616)以及花铃期(2070802),开花期(20180623)时各类变量与LAI相关性最好,这一时期的Sentinel-2多光谱卫星的单波段反射率以及各类植被指数(除S2REP、REIP和MTCI)与LAI的相关性均达到0.001极显著相关水平。这可能是由于棉花花蕾期时,冠层还未封闭,Sentinel-2多光谱反射率中还包含有土壤光谱信息,而棉花花铃期时,虽然叶面积指数达到最大,此时叶片色素含量降低以及棉桃形成对光谱信息产生影响,进而导致这2个时期的很多变量与LAI的相关关系未能达到极显著相关。进一步分析发现,对于单波段反射率,红边参数波段B6、B7以及近红外波段B8和B8a与LAI相关性均达到0.001极显著水平,并且3个发育时期均是中心波长为842 nm波宽为145 nm的B8波段表现最佳,这与已有研究证实的LAI估算的敏感波段主要集中在红边参数波段及近红外波段并且与这些波段的反射率呈极显著线性相关关系的结论一致[42]。对比各类植被指数的表现,EVI在花蕾期及花铃期均表现最佳,与LAI呈0.001极显著正相关关系,对于开花期MSAVI2表现最佳,总生育期,红边参数植被指数IRECI与LAI相关性最好,具有最大的相关系数。各单波段反射率以及各类植被指数,与总样本LAI相关性,均达到极显著相关。总发育期表现优于单个发育期,主要与总样本分析中,LAI的取值分布相比单个发育期的LAI取值更为宽泛,涵盖范围更大有关,同时,对于S2REP和REIP这两类随发育期变化而变化的红边参数指标指数,也具有了更多的取值分布,因此与LAI的相关性会明显优于在单个发育期时表现。此外,观察NDVI的表现,可发现NDVI在花蕾期、开花期以及总发育期时与LAI相关性均达到0.001极显著相关,但随着棉花LAI增大到花铃期达到最大时,NDVI与LAI的相关系数降低未能达到极显著相关,这很大原因是由于NDVI随着LAI值增大,会达到饱和从而对LAI值变化的敏感性降低。
表4 基于单波段反射率及植被指数的LAI估算模型
Note:is spectral variable,is leaf area index (LAI).
从表4可见,各种类型的植被指数均有与LAI相关性达到0.001极显著代表性植被指数,如常规植被指数中,有DVI,土壤背景校正型植被指数中有MSAVI2,大气校正型植被指数有EVI,红边参数植被指数有IRECI指数,并且总体上,基于植被指数的LAI估算模型的决定系数都略高于基于单波段反射率的LAI估算模型。对比不同发育期表现最佳的LAI估算模型的输入变量,发现对于单波段反射率,基于近红外B8波段的LAI估算模型在不同发育期,相比其他单波段反射率,均具有最大决定系数;对于植被指数变量,在棉花花蕾期及花铃期均是EVI指数表现最佳,在开花期,MSAVI2表现最佳;总体模型中,单波段反射率B8a和IRECI植被指数具有最大判定系数。IRECI指数与LAI的极显著相关关系与提出该指数的研究结论一致[11]。分析IRECI指数所包含的各波段位置(表2)可发现,该指数包含了Sentinel-2的2个分别位于705 nm和740 nm的红边参数波段(B5和B6),以及位于植被光谱反射率最大的近红外783 nm处的B7波段和反射率最小的红光区域665 nm处的B6波段,利用近红外B7波段减去红光B6波段的处理削弱了LAI值较大时红光区域饱和的影响,同时通过相除的运算强化了2个红边参数与LAI的相关性。
对表4中,不同发育期及总发育期LAI估算模型中决定系数最佳的模型进行进一步精度检验。精度检验采用留一验证(LOOCV, leave-one-out-cross-validation)和交叉验证2种方式展开。留一验证是将样本数个样本作为训练样本,剩余的一个样本作为检验样本,并运行次,寻求最小验证误差,该方法可充分利用测定数据,尤为适用于样本数据较少的情况。该方法也应用在棉花色素估算的研究中[43],关于该方法的详细介绍可参考Shao[44],不再赘述。本研究中基于留一验证构建的线性模型自变量与表4中决定系数最佳的模型的自变量相同,因变量为LAI,利用MatlabR2012b中的程序代码实现。交叉检验针对总样本展开,表4中的总发育期LAI估算模型是基于总样本的2/3(46个样本)构建的,将剩余的1/3(24个样本)用于对该模型进行交叉检验,此外,同时利用各单个发育期时的样本对基于总样本构建的LAI估算模型进行交叉检验,探讨该模型的普适性。各精度检验指标的自检验及交叉检验结果见表5。
表5 模型精度检验结果
通过上述分析,基于Sentinel-2多光谱遥感数据的B8单波段反射率及EVI和MSAVI2植被指数对棉花不同发育期LAI估算精度最高,总生育期的IRECI植被指数具有最好的反演精度,因此利用这些模型进行棉花不同发育期LAI遥感制图,形成研究区LAI空间分布图,如图3。由图清晰可见,总体上,各类模型均能反映出不同时段研究区LAI的主要取值分布,在6月中旬研究区的LAI取值分布主要在2.5左右(图3a, b, c),至6月下旬大部分地区LAI取值介于2.5~4.0之间(图3d, e, f),到8月初研究区大部分地区LAI取值大于4.0,有小部分地区LAI达到7.0左右(图3g, h, i);对比不同估算参数的表现,相对于B8单波段反射率及全生育期的IRECI指数,EVI植被指数可更清晰地区分植被区域和非植被区域的LAI取值,这一点反映了EVI植被指数用于LAI空间监测的优势。
图3 基于Sentinel-2数据的LAI遥感反演制图
1)对于Sentinel-2各单波段反射率,基于B8近红外波段(842 nm)的线性模型对LAI估算精度最高。通过分析Sentinel-2各单波段反射率及各类植被指数与LAI的相关关系发现,Sentinel-2多光谱卫星的2个红边参数波段(B6和B7)及近红外波段(B8和B8a)与不同发育期LAI的相关性均达到0.001的极显著相关水平,相关系数均大于0.7,并且不同发育期的最佳LAI估算模型均基于近红外B8波段,LOOCV检验的决定系数R均大于0.564。
Remote estimation of cotton LAI using Sentinel-2 multispectral data
Yi Qiuxiang
(1.,,,830011,; 2.,830011,3.,100049,)
Rapid and accurate LAI (Leaf Area Index) acquisition is of great significance for remote sensing monitoring of cotton growth, diagnosis of growth stage, extraction of cotton plant area and yield estimation. The present research discussed the characteristics of Sentinel-2 multi-spectral satellite data for remote estimation of cotton LAI. Measured LAI from filed experiments and Sentinel-2 data in 2017 and 2018 were obtained, and LAI estimation model for different and for all growth stages were established basing on single spectral band reflectance on Sentinel-2 and various vegetation index from Sentinel-2 bands. The estimation accuracy of the established LAI models were validated by coefficient of determination (2), RMSE (root mean square error), mean bias, and slope and intercept, using LOOCV (Leave-One-Out-Cross Validation) method and cross validation, respectively. The results showed that: 1) for the single-band reflectance of sentinel-2 multi-spectral satellite data, two red-edge bands of B6 and B7, and two near-infrared bands of B8 and B8a, were all significantly (<0.001) correlated to LAI at all three tested growth stages, i.e. bud stage (16-Jun-2017), and flowering stage (23-Jun-2018), and boll stage (2-Aug-2017), with correlation coefficient greater than 0.7. And when the correlation between LAI and band reflectance were performed using data consist of three growth stages, the correlation coefficient for all tested bands reach significant level (<0.001), and the maximum correlation coefficient was 0.943 of near-infrared narrow band B8a, which center at 865 nm with a wave width of 32 nm. The accuracy of LAI estimation at different development stages was optimized using the near-infrared band B8 which with a central wavelength of 842 nm and a wave width of 145 nm, with all RMSE smaller than 0.465. 2) for seventeen LAI related vegetation indices, including EVI (Enhanced Vegetation Index), MSAVI2 (Modified Soil Adjusted Vegetation Index 2), IRECI (Inverted Red-Edge Chlorophyll Index), etc., most of them were significantly (<0.001) correlated with LAI, especially atmospheric correction index EVI, soil adjusted index MSAVI2, and red-edge index IRECI, and the coefficient of correlation were over 0.8. EVI provided the best result for LAI estimation at bud stage and boll stage, and at flowering stage it consists by MASVI2, with bud stage RMSE=0.352, and boll stageRMSE=0.367 and flowering stage RMSE=0.323, respectively. 3) LAI estimation models for whole growth stages performed better than these for one single growth stage. And the best LAI estimation models for whole growth period using single spectral band reflectance and vegetation index were respectively obtained by near-infrared narrow band B8a and IRECI, with IRECI performed slightly better, which with2=0.908 and RMSE=0.425 for LOOCV, and2=0.951 and RMSE=0.368 for cross validation. Additionally, when apply IRECI-LAI estimation model for whole growth stages on one single growth stage LAI estimation, the accuracy comparison between the IRECI-LAI model and single growth stage LAI models showed that the average cross validation RMSE was only 0.07 greater than the average LOOCV RMSE, indicating the good universality of LAI estimation model for whole growth stages.
crops; remote sensing; models; Sentinel-2 data; cotton; leaf area index (LAI); vegetation index
易秋香. 基于Sentinel-2多光谱数据的棉花叶面积指数估算[J]. 农业工程学报,2019,35(16):189-197. doi:10.11975/j.issn.1002-6819.2019.16.021 http://www.tcsae.org
Yi Qiuxiang. Remote estimation of cotton LAI using Sentinel-2 multispectral data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(16): 189-197. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.16.021 http://www.tcsae.org