基于高分四号卫星的北京市城区森林叶面积指数反演

2021-07-23 02:48高鸽黄华国马晨玉
科技创新导报 2021年10期
关键词:随机森林回归分析纹理

高鸽 黄华国 马晨玉

摘要:为分析太阳多角度的光谱信息在反演森林LAI中的应用潜力,本文基于高分卫星数据构建七种常用的植被指数,并添加纹理信息,对北京市开展区域LAI反演研究。采用随机森林和线性回归,通过提取不同太阳角度的高分卫星数据的植被指数以及影像纹理均值,与实测数据建立回归模型反演叶面积指数,R2和RMSE作为指标对模型进行精度评价。与以往的反演方法相区别,该文将太阳多角度光谱信息与纹理结合进行森林LAI的反演实验,并对反演算法进行敏感性分析。研究发现,基于高分卫星数据构建的单个角度下的植被指数与纹理数据的结合反演LAI的模型精度在0.3-0.5左右,添加太阳多角度后的植被指数和纹理信息的结合在一定范围内提高了北京市城区森林的LAI的反演精度,R2达到0.58,说明太阳多角度的光谱信息在反演森林LAI中具有一定的潜力,高分四号卫星理论秒级的时间分辨率优势在定量遥感方面具有一定开发应用的价值。本结果在该实验区验证可行,在其他地形的区域的应用效果还需要进一步的研究。

关键词:高分卫星 太阳多角度 叶面积指数 纹理 回归分析 随机森林

Forest Leaf Area Index Inversion in Beijing Urban Area Using GF-4 Satellite Data

GAO Ge HUANG Huaguo* MA Chenyu

  1. The College of Forestry of Beijing Forestry University, Beijing, 100083 China; 2. Beijing Changping Gardening And Greening Bureau, Beijing, 100000 China)

Abstract: In order to analyze the potential application of the solar multi-angular spectral information in inversion of forest LAI, the study constructs seven commonly used vegetation indexes based on GF-4 satellite data, and adds texture information to model the forest LAI in Urban Area of Beijing and conduct regional leaf area index (LAI) inversion research. The regression model for the inversion of LAI was established using random forest and linear regression, by extracting the vegetation index and image average texture of GF-4 satellite data from solar multi-angular, and the accuracy of evaluation of the model is evaluated with R2 and RMSE. In contrast to the previous inversion methods, this paper combines the solar multi-anglular spectral information with the texture information to carry out the inversion experiment of forest LAI, as well as the sensitivity analysis. Results show that the combination of vegetation indices and texture data at a single angle based on GF-4 satellite data is with an R2 of about 0.3-0.5; while by adding the solar multi-angle data improves the inversion R2 to 0.58. It can be concluded that that the solar multi-angle spectral information has some potential in the inversion forest LAI, and the high temporal resolution advantage of the GF-4 satellite is of great value in quantitative remote sensing. Despite that the experimental results are feasible in our experimental area, further research is still needed.

Key Words: GF satellite; Solar multi-angular; Leaf area index; Texture; Regression analysis; Random forest

習近平总书记在十九大报告中指出,必须树立和践行绿水青山就是金山银山的理念。准确的森林资源监测是掌握绿水青山的资源现状和消长变化动态的重要方式。北京市作为首都,应在综合先进科学技术与人力获取精准、大尺度的森林资源数据方面起到示范表率作用。但目前基于人力的森林资源清查方法,需要耗费大量的人力、物力和财力,遥感作为一种快捷迅速的技术手段,对森林资源监测具有得天独厚的优势[1]

叶面积指数(Leaf Area Index,LAI)是研究植物冠层表面物质和能量交换的一个很重要参数,叶面积指数的大小与森林树木的长势密切相关,并且能够提供树木生长的动态信息[2]。目前,关于反演叶面积指数的研究主要集中在如何提高叶面积指数反演的精度问题上。相关尝试有很多,包括增加实验数据源,采用多个遥感数据来源与叶面积指数建立模型;利用光谱与纹理的融合来提取信息反演叶面积指数等[3][4]。这些方法虽都能够在一定程度上提高反演精度,但其难以满足我国业务化的精度要求。新的信息源的挖掘仍然是当前研究热点。

高分四号是我国首颗地球同步轨道的高空间分辨率卫星,高重返周期(最高20秒)和多角度信息对叶面积指数提取及精度的提高提供了可能,其覆盖范围达960万平方公里,这对全国的森林资源叶面积指数监测具有重要意义[5]。

本实验以挖掘高分四号的多角度信息价值为主要目的,探索高分四号多角度影像信息对森林叶面积指数反演的精度的提高是否具有贡献。主要解决太阳多角度对森林调查参数反演精度的贡献,回答利用高分四号的多角度信息提高LAI遥感产品精度的可行性问题,同时,生成北京市五环内森林的LAI分布图,对于北京市城区的园林绿化设计、区域森林健康状况评估等具有一定的参考价值。本实验的创新之处在于将高分四号卫星的多角度信息与森林参数的反演结合起来,利用高分四号卫星数据提供统一区域多太阳角度遥感数据,有效解决了传统遥感数据源中單一观测角度植被指数和叶面积指数函数关系饱和点低的问题。

  1. 数据采集与数据处理

    1. 地面数据采集

本实验区位于北京市城区五环范围内(39°48′28.7″~40°04′1.68″N,116°13′10.36″~116°34′41.75″E),如图1所示,这里气候温和,年平均气温11℃,年降水量620.6mm,夏季炎热多雨,降水集中,盛行东南风,属于典型的暖温带半湿润季风大陆性气候[6]。

在北京市五环内50余处森林公园里设置样地152个,采用GPS定位,以样地中心位置的经纬度作为该样地的地理标识,每个样地大小为50m*50m,实测样地时间为2017年夏季,与选取遥感影像的拍摄时间保持较短的间隔期,采用鱼眼镜头测量叶面积指数。<!-- 没有看到图1 -->

地面实测的森林LAI的范围在0.83-4.67之间(图2),平均值为2.52,标准差为0.49,中等大小的LAI值在一定程度上减小受到光学遥感信息的饱和带来的误差。对实测的LAI值进行Shapiro检测,认为测得的LAI数值来自于正态分布(P>0.05)。

    1. 影像与数据的获取与预处理

      1. 影像获取

本文影像数据来源有两种,一是采用高分四号多光谱凝视相机数据,二是从Google Earth Pro上下载结合卫星和航拍图像的影像。

高分四号可见光谱段分辨率为50米,影像幅宽优于400km。在地面数据采集期间共获取15景影像。另外考虑到一年内林木生长很小,森林LAI变化可忽略不计,因此补充10景相隔一年的同季节的2016年的遥感影像辅助以增加数据集。影像获取时间与太阳天顶角如所示,从中筛选出10景影像云量较小,精度较高的影像。影像太阳角度分布如图4所示

图4太阳角度分布

谷歌地球(Google Earth,GE)是一款谷歌公司开发的虚拟地球软件,其遥感影像数据主要分为两部分:卫星数据和航拍数据。其中卫星数据主要来自于美国Landsat系列卫星数据,Space Imagine公司的IKONOS数据及法国SPOT系列数据;而航拍数据则主要来自BlueSky公司和Sunbun公司。本文采用矩形选框的方法把北京市行政区划范围框取在内下载影像,最高的分辨率为0.44米,再使用envi软件按照北京市行政区划范围对其进行裁剪,最终得到北京市范围的谷歌影像[7][8]。

      1. 影像预处理

GF-4影像预处理主要包括几何校正、辐射定标、大气校正。辐射定标的目的是将图像上的DN值转化为表观反射率,本研究中辐射定标采用中国资源卫星中心(http://www.cresda.com/CN/Downloads/dbcs/index.shtml)下载的绝对定标系数进行;大气校正采用ENVI中的FLAASH大气校正模块,以获得地表真实反射率。

从图5可以看出,经过大气校正,基本去除了空气中水汽等的影响;在0.5~0.8μm内,植被光谱反射曲线与实际植被光谱反射曲线基本吻合。

      1. 多角度光谱提取

本文从GF-4影像上提取了各样地的光谱数据。图6为同一个位置的多个太阳观测角的反射率变化图,主要以红光和近红外两个波段为例,按照叶面积指数大小的分布,从中分别选取4个样地,观测每个样地下不同的太阳角度对应的红外和近红外反射率特征,从中不难发现他们在可见光红光波段和近红外波段反射特征极其相似

      1. 植被指数的提取

本文通过选取以下7种光学植被指数与实测叶面积指数建立回归模型(表1),并分析和评价其精度。

三波段梯度差值植被指数

TGDVI

ρNIR、ρR、ρB、ρG分别表示近红外波段,红波段,蓝波段,绿波段。

      1. 纹理信息的提取

纹理作为一种物体表面的基本属性,描述的是图像像素邻域灰度空间分布规律,是物体表面具有不依赖颜色或亮度变化的内在特性,可以有效抑制异物同谱、同物异谱现象的发生。根据植被LAI遥感反演的先验知识,不同的LAI会在遥感图像上形成不同的纹理,纹理数据的加入在一定范围内能够提高叶面积反演的精度[9]。

本实验中的纹理信息来自谷歌影像(Google Earth Pro),谷歌地球是一款Google公司开发的虚拟地球仪软件,中国区域的空间精度通常为30m,北京市等一些区域具有高分辨率的影像,最高可达0.11m。利用ENVI5.3软件进行纹理数据的提取,首先进行主成分分析,然后以0.6m的精度进行重采样,纹理提取采用灰度共生矩阵法,设置窗口分别为3*3,5*5,7*7,灰度等级为16,32,和64,最后使用App Store里的统计工具V5.3(Zonal Statistics)插件输出纹理信息数据结果。本研究选用均值(Mean,ME),标准差(STD)2种纹理参数来表征研究区纹理空间结构。纹理分析在ENVI5.3中texture的Co-occurrence模块中实现。

  1. 实验方法

    1. 基于植被指数的经验关系方法

LAI与植被指数有很强的正相关性,一般认为两者具有某种函数形式的关系,通过建立这种函数关系,找到最佳模型进行模拟,可用来反演LAI。

植被指数的经验关系方法需要确定3个关键的要素:植被指数,模型形式和用于模型拟合的LAI数据。根据研究区域森林的波谱吸收反射规律,在红波段强吸收,近红波段强反射,随着叶面积指数的增大,红波段反射率逐渐降低,而近红外波段反射率增大,因此常用这两个波段所构造的指数来进行叶面积指数的反演。叶面积指数和植被指数的函数形式随着区域和植被类型的不同而存在差异,模型参数的叶面积指数数据可以通过地表测量和模型模拟两种方式获得。将地表测量作为地面植被叶面积指数的真值,通过拟合其与遥感植被指数的关系,可以建立两者之间的经验模型用于叶面积指数反演[10]。

    1. 建模方法

      1. 线性回归

首先利用一元线性回归的方法对7个植被指数进行LAI的回归分析,将7个植被指数按照相关性从大到小进行排序,从中选出5个相关性较好的植被指数;其次根据5个植被指数的多角度信息采用随机森林的方法进行回归拟合,共获得5个预测模型。利用地面数据集对两种模型进行验证,分析比较多角度信息的加入是否有利于提高LAI反演的精度。

      1. 随机森林

随机森林(RF)是由Breiman等提出的一种机器学习算法,其实质是对决策树算法的一个改进,通过自助法(oot-strap)重采样技术,从训练样本集中随机抽取k个样本形成新的训练样本集,从而形成k个决策树,组成随机森林,采用决策树投票来输出结果[11][12][11]。这种方法建模过程简单且结果比较精确,已广泛应用在不同领域。因此本研究使用随机森林算法对北京市城区森林LAI开展反演工作。

    1. 精度评定指标

通过精度评定,可以有效地评价出植被指数与实测叶面积指数的拟合状况,得到最优的反演模型,使得利用该模型反演后的影像值与其对应的实测值相一致。本实验采用十折交叉验证的方式,把数据集分为10个子集,每个子集均做一次测试集,其余的作为训练集。交叉验证重复10次,每次选择一个子集作为测试集,并将10次的平均交叉验证识别正确率作为结果。相关系数是描述两个具备相关性的数据之间密切程度的指标。本文选取了均方根误差(Root Mean Square Error,RMSE)和决定系数(Coefficient of Determination,R2)2种指标评价模型精度,如公式(1)和(2)所示。RMSE用来评估预测值与实测值之间的偏差,RMSE越小,模型预测的越准确。R2可以衡量光譜指数、纹理值与森林LAI之间的相关密切程度,R2越接近于1,光谱指数、纹理值与LAI之间的关系越密切,反之亦然。将相关变量放入机器中进行训练;训练好的模型用来预测目标变量,最后选择预测精度较高的模型估算研究区LAI。

  1. 结果与分析

    1. 模型建立与评价

      1. 单角度下不同植被指数与LAI反演模型的比较分析

以相关性系数和均方根误差为指标对各叶面积指数估测结果进行比较分析,结果见表2,在本实验所涉及的植被指数中,反演结果最好的5个植被指数依次是NDVI、MSR、EVI、MSAVI、TGDVI,其中NDVI所建模型的R2达到0.52,在所有指数中最高,RMSE为0.0033,在所有指数中最低,表明NDVI对LAI有最佳的预测能力,是建立北京市城区森林LAI反演模型的优选植被指数。

      1. 多角度下不同植被指数与LAI反演模型的比较分析

选取NDVI、TGDVI、EVI、MSR、MSAVI这5个植被指数,利用随机森林与LAI建立模型进行回归分析,结果见表3,在这5个植被指数中,多角度信息的加入使相关系数得到不同程度的提高。

      1. 谷歌影像纹理数据与LAI反演模型

为了得到北京市城区森林LAI更加精确的反演结果,因此加入纹理信息以生成更加精确的北京市城区森林LAI分布图。输入变量为纹理均值(ME)与纹理方差(VAR),使用Weka的RandomForest 模块处理数据,R2结果如表4所示,其中回归关系比较好的是16灰度值下的各个窗格,因此将光谱变量与纹理变量作为共同输入变量反演森林LAI,得到的结果如表4所示。

表4表明5*5窗格的空间分辨率验证数据对于LAI数据反演结果检验最优,该分辨率下叶面积指数与纹理参数之间的相关性最大,因此认为该纹理参数更适用于北京市森林叶面积指数的反演。

    1. 研究区LAI反演

本文选取估算精度高的RF模型,基于高分四号影像,对北京市城区森林LAI进行估算,结果如图8所示。<!-- 按照图片顺序标注 -->

以5个植被指数为自变量,通过ENVI的Band Math模块对北京市森林LAI进行反演,图像越亮的地方代表LAI越大,图像越黑越暗的地方代表LAI越小。由图 8 研究区LAI估算结果可以看出,北京市中部及东南部的森林比较稀疏,北部、西部地区的森林相对更加密集。线性回归估算LAI主要集中在0.8~4.7之间,大于4的地方很少,与实测LAI值较接近。LAI值在2~3的区域主要为稀疏林地。

  1. 结语

    1. 主要结论

本文应用高分四号卫星多角度遥感数据,通过经验模型法实现北京市城取森林叶面积指数的反演,使用语言镜头实测样地森林的叶面积指数,通过高分四号影像数据提取若干植被指数建立回归模型,探讨了高分四号的多角度信息对提高森林LAI反演精度的贡献。

  1. 所选取的7种典型植被指数(NDVI,MSR, EVI, MSAVI,TGDVI,DVI,OSAVI)中,NDVI,MSR, EVI, MSAVI,TGDVI等5个植被指数与LAI的关系密切,能较好的反应森林生长状况,可作为模型输入因子。

  2. 多角度信息的加入能够在一定程度上提高森林LAI反演的精度,添加多角度的信息,植被指数与LAI的相关性接近0.6,与单角度下的相关性相比,各植被指数对应的相关性均有不同程度的增加,均方根误差均有所减小。

  3. 探讨了北京市城区森林不同尺度下的纹理参数对森林LAI反演的精度的影响,不同窗口下的纹理参数与森林LAI的建立的反演模型的精度有较大的的差别,因此尺度对建模模型的优劣有显著影响。本实验地区LAI的反演上,5*5、7*7两个窗格的反演精度优于其它两个窗格。

    1. 研究展望

在实际试验过程中,高分影像的拍摄时间与地面LAI的测量时间是同时期的,谷歌影像的获取时间要早于这个时间,影像与地面数据获取的时间差对结果也会有一定的影响;另外高分四号影像成像,太阳角度的扩散也会带来一定的误差;本论文涉及纹理特征统计量是纹理均值和方差,后续也可以补充一些特征值,比如协同性,对比度等来更好的体现相关性;对于更近一步的研究通过获取同时相的谷歌卫星图,补充高分系列的影像信息源来减少太阳角度扩散带来的误差。

  1. 参考文献

  1. 刘振波,邹娴,葛云健,陈健,曹雨濛.基于高分一号WFV影像的随机森林算法反演水稻LAI[J].遥感技术与应用,2018,33(03):458-464.

  2. 邢著荣,冯幼贵,李万明,王萍,杨贵军.高光谱遥感叶面积指数(LAI)反演研究现状[J].测绘科学,2010,35(S1):162-164+62.

  3. 王枭轩,左小清,孟庆岩,占玉林,刘苗,杨泽楠,李雨秦.基于高分3号和高分2号叶面积指数反演与分析[J].云南大学学报(自然科学版),2019,41(04):731-737.

  4. 焦志敏,张晓丽,李法玲,石宽,宁亮亮,王月婷,赵明瑶.Landsat_8多光谱波段纹理对叶面积指数的影响分析[J].地理与地理信息科学,2014,30(03):42-45.

  5. 王殿中,何红艳.“高分四号”卫星观测能力与应用前景分析[J].航天返回与遥感,2017,38(01):98-106.

  6. 刘浩. 基于RS的城市森林提取及动态变化研究[D].中国地质大学(北京),2019.

  7. 王旭旺;王凡.基于全球IGS站坐标的Google Earth地图精度分析.测绘通报.2019年(S1):23-26

  8. 焦雯雯.基于Google Earth的遥感图像信息获取.科学技术创新.2020年(05):81-82

  9. 趙安玖,杨长青,廖成云.基于影像纹理特征的川西南山地常绿阔叶林有效叶面积指数的空间分析[J].应用生态学报,2014,25(11):3237-3246.

  10. 刘洋,刘荣高,陈镜明,程晓,郑光.叶面积指数遥感反演研究进展与展望[J].地球信息科学学报,2013,15(05):734-743.

  11. Breiman L.Random forests[J].Machine Learning,2001,45(1):5-32.

  12. 王丽爱,周旭东,朱新开,郭文善.基于HJ-CCD数据和随机森林算法的小麦叶面积指数反演[J].农业工程学报,2016,32(03):149-154.

猜你喜欢
随机森林回归分析纹理
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理
随机森林在棉蚜虫害等级预测中的应用
拱坝变形监测预报的随机森林模型及应用
森林碳汇影响因素的计量模型研究
消除凹凸纹理有妙招!