苏 伟 姚 婵 李 颖 张明政 赵国强 刘峻明
(1.中国农业大学土地科学与技术学院, 北京 100083; 2.农业农村部农业灾害遥感重点实验室, 北京 100083;3.河南省气象科学研究所, 郑州 450003; 4.河南省气象局, 郑州 450003)
叶面积指数LAI是指单位土地面积上植物叶片单面面积的总和[1],直接反映植被的生长状况,对农作物长势监测、水肥管理、农业灾害胁迫监测和产量预测具有重要意义[2-3]。传统获取LAI的方法是通过野外测量获得,需要耗费大量的人力、物力,成本高,且不能进行实时和大面积的获取。遥感是快速获取大范围内地物信息的有效方法,可以反映农作物不同生长状况的光谱差异[4],因此被广泛用于农作物长势监测[5],并为肥料亏缺诊断、田间管理和产量预测等提供科学依据[6]。
随着卫星技术的发展,出现了越来越多的高时空分辨率影像[7]。Sentinel-2卫星是欧洲航天局发射的新一代卫星,一共包含13个光谱波段,其中3个红边波段对植被的生长状况敏感[8],是植被生长监测的理想数据源。但Sentinel-2卫星影像的3个红边带具有20 m的空间分辨率,与可见光和近红外波段10 m的分辨率不一致,这限制了红边波段最大优势的发挥,但是10 m分辨率波段的可用性为提高20 m的空间分辨率提供了可能,从而形成了一种有效方法,可以在不增加输入成本的情况下使输出最大化[7]。目前,已有许多学者对更高分辨率的影像增强进行了研究,提出了多种可行算法[9-12]。
可用的高空间分辨率影像数据为植被生长参数的精确反演提供了可靠的数据支持[13],但仅有少数研究者关注超分辨率影像重建对植被生长定量评估的能力。植被生长参数的反演主要有3种模型:经验统计模型、物理模型和机器学习模型。其中,机器学习模型通过对样本数据的不断训练达到最优化目标,具有很强的非线性拟合能力[14]。目前已有学者对使用机器学习模型反演植被LAI进行了研究。文献[15]利用无人机多光谱影像,采用梯度提升树和支持向量机算法建立叶面积指数的反演模型,结果表明,梯度提升树算法的预测精度高于支持向量机算法;文献[16]对利用经验回归模型、机器学习模型和辐射传输模型反演叶绿素含量进行评估,结果表明,偏最小二乘回归和随机森林回归的效果优于线性回归模型和辐射传输模型;文献[7]采用线性回归和辐射传输模型,将超分辨率影像重建用于玉米的生长状况监测,并与原始重采样数据进行对比,取得了较好的反演精度。
本文以SupReMe算法重建的高分辨率多光谱影像为数据源,基于PROSAIL模型构建查找表,并以此作为随机森林回归模型的训练数据反演玉米生育期的LAI,通过野外实测数据验证反演精度,并与基于原始重采样的Sentinel-2影像数据的反演结果进行对比,以期证明影像超分辨率重建对LAI反演的作用与意义。
研究区位于廊坊市辖区和永清县,河北省中部偏东,经纬度范围为116°38′7″~116°44′6″E,39°28′42″~39°32′54″N,地理位置如图1所示,属温带大陆性季风气候,年平均气温10~12℃,年平均降水量554.9 mm,地势平坦,海拔约13 m。该区域的主要耕作方式为玉米-小麦轮作,夏玉米的生长季节一般是从6月底到10月初。
Sentinel-2是由欧洲委员会和欧洲航天局联合倡议研发的全球环境与安全监测计划的第2颗卫星,A/B双星的时间分辨率为5 d,共有13个光谱波段,空间分辨率为10、20、60 m,包括可见光、红边、近红外、水汽、卷云以及短波红外波段。本研究选用2019年8月18日的无云Sentinel-2B卫星影像,利用Sen2cor模型完成对Sentinel-2卫星影像的大气校正,为了使每个波段的影像获得相同数量的像素,采用最近邻域法将分辨率20 m的影像重采样到分辨率10 m。本文光谱波段信息如表1所示。
表1 Sentinel-2卫星影像部分波段信息Tab.1 Band information of Sentinel-2 image
2019年8月16—22日,课题组在研究区内开展夏玉米关键生育期的实验数据采集,由于不同玉米品种的播种时间不同,研究区域中玉米的物候期大部分处在灌浆期前后,样方尺寸为10 m×10 m,与Sentinel-2影像分辨率相对应,在研究区内选择100个生长均匀的样方进行实地测量,实测数据包括LAI、叶绿素含量及精准定位信息等。LAI测量采用美国LI-COR公司生产的LAI-2200C型植物冠层分析仪,每个样方测量3~5次,取平均值作为样方LAI。同时采用华测i80型智能RTK GPS测量系统,并结合千寻位置提供的Find-CM厘米级差分定位服务,对样方点进行精准定位。叶绿素含量测量选用日本柯尼卡美能达生产的便携式SPAD-502 Plus型叶绿素含量测定仪,每个样方选择3~5株,每株上选择4片叶,每个叶片从叶基到叶尖测量3次叶绿素含量,取平均值作为样方叶绿素含量。
超分辨率算法采用SupReME (Super-resolution for multispectral multiresolution estimation)模型[12]。该模型充分利用了来自高分辨率波段的纹理信息制定规则器,可以在单个步骤中对所有较低分辨率的波段执行超分辨率算法生成高分辨率(10 m)的波段。
y=MBx
(1)
式中B——块-循环-循环-块(BCCB)矩阵,每个块代表一个2D循环卷积,与最高空间分辨率相应频带的点扩展函数(PSF)相关联
M——分块对角矩阵,每个块代表y得到x的采样
对于Sentinel-2卫星影像的13个波段,发现大于99%的信号能量保留在基于相关的本征分解的p=6个最大分量中[12]。形式上,X的列(波段向量)存在于由U∈RL×p的列所跨越的子空间中,即X=UZ,其中,Z∈Rp×n为相对于U的表示系数。z=vec(ZT),向量形式为x=(U⊗I)z,其中,I为适当维数的单位矩阵。随着维度的降低,式(1)转换为
y=MB(U⊗I)z
(2)
为了计算子空间U,执行以下3个步骤:①用双3次插值将y的每个光谱波段上采样到相同的高分辨率。②模糊每个光谱波段,使得每个光谱波段都达到最强模糊。③在模糊处理之后的数据上进行奇异值分解,保留最大的p个奇异值对应的奇异向量作为U的列。影像重建可以表示为凸优化问题,即
(Dh,Dv∈RLn×Ln)
(3)
式中 φw,q——基于权重w、q的2次正则化项
α——正则化强度
Dh、Dv——2个对角区块的线性算子(每个算子具有相同的块),z中影像的水平和垂直方向近似导数
为了简化,将这些带周期性边界条件的矩阵看作循环卷积。因此,式(3)等价于
(4)
其中v1=(U⊗I)zv2=Dhzv3=Dvz
式(4)的增广拉格朗日函数为
(5)
式中d1、d2、d3——缩放的拉格朗日乘数
μ——正权值
迭代优化3个参数块直到收敛:z、(v1,v2,v3)和(d1,d2,d3),可以得到最优的z,再由x=(U⊗I)z得到x,关于这个算法更多的信息,可以参照文献[12]。
为了量化SupReMe算法的影像重建效果,对重建影像和重采样影像逐波段计算信息熵和平均梯度[17],同时计算3个相似性统计值:决定系数(R2)、均方根误差(RMSE)和估算精度(EA)。
基于单波段光谱特征监测植被时容易受到非植被目标(背景土壤、水体等)的影响,因此需要对植被冠层敏感的波段进行组合,达到在一定程度上消除非植被目标的影响[18]。红边波段的光谱反射率在680~750 nm范围内快速上升,能够用于研究植物生理生化参数反演、冠层养分提取、健康状态监测等[19]。本研究使用的Sentinel-2遥感影像包含3个红边波段,并且重建后的影像波段空间分辨率均为10 m,因此在植被指数选取方面,选取RI[7]、NDI[7]、MCARI[20]、MTCI[21]、AIVI[22]、TCARI/OSAVI[705,750][23]、NDRE2[24]、CIred-edge[25]、NDVI[26]和RVI[27]共10个能较好估算LAI的植被指数作为玉米冠层LAI反演时随机森林机器学习法的输入特征[7,19,28]。
PROSAIL辐射传输模型是植被冠层LAI反演的常用方法,综合考虑了冠层结构、生长状况和影像的获取环境,因此,本文利用PROSAIL模型模拟不同理化参数下的玉米冠层反射率。模型的输入参数取值范围如表2所示,其中sza、oza、raa太阳-卫星观测角度来自影像的头文件,LAI、Cab、ρS以及LIDF由实测数据确定取值范围,其他参数通过先验知识、LOPEX93数据库及文献[29]确定。依据表2的参数设置,共模拟10 800条数据。
由于PROSAIL模型正向模拟得到的光谱反射率范围是400~2 500 nm,光谱分辨率是1 nm,而Sentinel-2卫星影像各波段的反射率是在一定光谱范围内,存在光谱不一致的问题,所以利用Sentinel-2卫星影像的光谱响应函数对模拟数据进行光谱积分,积分公式为
表2 PROSAIL模型参数Tab.2 Range and unit of PROSAIL model inputs
(6)
式中ρs(λ)——模拟Sentinel-2卫星影像的波段反射率
λmax、λmin——不同波段最大、最小波长范围
ρ(λi)——PROSAIL模型模拟的光谱i处的反射率
φ(λi)——Sentinel-2卫星影像对应波段的光谱响应函数
依据模拟的光谱数据通过光谱积分得到的多个波段反射率计算2.2节中提到的10个植被指数,为随机森林模型提供训练数据集。
随机森林(Random forest, RF)是一种基于分类回归树的机器学习方法,它由多棵相互独立的决策树组成,多棵树进行平行训练,取多棵树的平均值或者较多的那一类作为结果。随机森林是一种能够基于离散或连续数据集合成回归或分类函数的非参数统计技术,能处理具有噪声和大量数据的预测因子之间的复杂关系[30],随机森林的优点在于对多元线性公式不敏感,对缺失数据和非平衡数据的预测结果也具有鲁棒性[31]。随机森林总共有3个重要的参数变量:决策树数目、叶子节点最小数目、每个节点的特征数目。本研究是利用Python中的sklearn包实现随机森林模型,PROSAIL生成的查找表和野外实测数据分别作为模型的训练数据集和测试数据集,利用决定系数R2和均方根误差RMSE评估玉米冠层LAI反演结果。
为了评估使用SupReMe算法重建影像反射率的一致性,从空间细节和光谱一致性2方面进行评估,从图2a、2b、2d可看出,在使用SupReMe算法重建的影像上,居民区、道路和耕地在提高空间细节的同时并很好地保持了地物边界的一致性,相对于原始分辨率20 m的影像,重建后的影像有更为清晰的地物边界和更详细的纹理特征。为了客观、定量地评价重建后影像质量的提高情况,利用信息熵与平均梯度对重建后的影像进行质量评价,评价结果如表3所示,通过评价结果可以看出,重建后影像的客观评价指标都有提升,就信息熵而言,重建后影像的平均信息熵比重采样影像的平均信息熵提升了0.083,就平均梯度而言,重建后影像波段的平均梯度均值比重采样的影像波段平均梯度均值提升了0.007。因此,重建后的影像比重采样的影像有更丰富的信息量和更高的清晰度。
表3 超分辨率重建定量评价结果Tab.3 Quantitative assessment results of reconstructed images using super resolution method
此外,评估影像重建前后的光谱一致性,表4为重建影像和重采样影像的光谱相关性,可以看出,重建影像和重采样影像有高度的相关性,各波段的R2都不小于0.91;具有最高相关性值的波段是B12,R2为0.93;整幅影像的估算精度都不小于88.76%,这说明重建影像在保持光谱不变性的同时提高了影像的空间细节。
表4 重建前后影像反射率相关性分析结果Tab.4 Correlation analysis results of image reflectance before and after reconstruction
利用PROSAIL生成的查找表作为训练集,以所构建的10个植被指数作为输入特征,LAI作为输出变量,基于随机森林学习方法构建LAI反演模型,随机森林学习方法的核心是确定决策树数目、叶子节点最小数目和每个节点的特征数目,由于本文中输入特征只有10个,所以每个节点的特征数目为默认值,即划分时考虑所有的特征数,根据sklearn包中的GridSearchCV确定决策树数目为100,叶子节点最小数目为1,其他的参数默认。
依据实测点的位置分别提取重建影像和重采样影像的波段反射率,进而计算10个植被指数,形成2份测试数据集;基于模拟数据训练随机森林模型,再用2份测试数据集来进行预测,每一份测试数据集分别运行3次,取其均值作为最终的LAI预测结果;并通过对LAI的实测数据和预测数据进行回归分析并反演研究区的LAI。以重建影像为数据源,利用随机森林方法反演得到的研究区内玉米冠层LAI空间分布结果如图3所示,从图中可以看出,整个研究区内的LAI分布在1.0~5.0之间,绝大多数区域的LAI反演结果在3.0~5.0之间,从空间分布规律来看,研究区西部的LAI偏低,主要原因是研究区西部为永清县,该县的玉米种植时间晚于市辖区,平均玉米长势与其相比略差,研究区东部是廊坊市市辖区,玉米种植区域较大且相对集中,所以玉米长势较好。
为了定量评价利用重建影像的LAI反演精度,以野外实测的LAI为依据进行反演精度评价,图4a、4b分别为利用重建影像和重采样影像的LAI反演精度评价结果,从2个反演结果可以看出,基于2种影像的LAI反演精度的决定系数R2都超过了 0.6,说明这2个反演结果与实测值的拟合效果较好,其中重建影像的R2高于重采样影像的R2,由0.68提高到了0.70。从均方根误差RMSE来看,重建影像的RMSE比重采样影像低0.022,说明与重采样影像相比,重建影像对应实验点的反演结果与实测值离散程度较小,更接近1∶1线,LAI的反演精度得到提高。
(1)使用SupReMe算法增强的影像在保持光谱特性不变的同时提高了影像的空间细节。采用SupReMe算法重建后,影像的空间细节与原始分辨率10 m的影像具有很好的一致性,与原始分辨率20 m的影像相比,重建后影像有更为清晰的地物边界和更详细的纹理特征,重建后影像的信息熵和平均梯度都有明显提高;采用SupReMe算法重建前后,影像的反射率具有高度相关性,重采样波段和重建后的波段之间的决定系数(R2)均不小于0.91,影像重建的估算精度均不小于88.76%。
(2)采用SupReMe算法对影像进行重建可以提高玉米冠层LAI的反演精度。采用SupReMe算法进行影像重建后,LAI反演结果比原始影像数据拥有更高的R2和更低的RMSE,R2由0.68提高到0.70,RMSE由0.262降低到0.240,通过LAI和实测值的拟合趋势可以反映大范围内不同生育期的玉米长势。