吕金城,王振锡,杨勇强,曲延斌,马琪瑶
(新疆农业大学林学与园艺学院/新疆教育厅干旱区林业生态与产业技术重点实验室,乌鲁木齐 832003)
【研究意义】森林蓄积量与植被分布特征对于可持续发展的生态系统管理和保护生物多样性至关重要[1]。林地林分蓄积量的估算为空间和时间上监测林地生态系统的稳定性和生产力提供了有用的信息。新疆天然林面积为602.7×104hm2(9 040.5 万亩)[2]。天山云杉(Picea schrenkiana var.tianschanica)作为天山山地最主要的地带性森林植被,其林分占新疆天然林有林地面积的44.9%,是构成天山乃至新疆森林生态系统的物质主体[3-4]。监测天山云杉的更新生长状况,对快捷准确计算其森林蓄积量对新疆林业发展有重要意义。【前人研究进展】目前大多数研究者主要是利用卫星、机载或现场传感器获取的遥感数据来实现蓄积量的估测,根据数据源与林地实际情况的不同,建立蓄积量反演模型的方式也不同,李世波[5]基于GF-1卫星影像数据,针对研究区分别建立了多元逐步回归,偏最小二乘回归与随机森林三种模型,经过对比,随机森林模型精度最高,达到了83.69%。贾嘉辉[6]使用GF-1 卫星影像针对研究区树种多样的情况,提出了分类建模的思想,对针叶林,阔叶林,针阔混交林三种林地类型分别建立模型,相比单一模型蓄积量精度从82%提升到了84.3%。曹霖[7]采用Sentinel-2A 卫星影像,建立了传统线性回归与预测机器学习回归,传统线性回归的相对误差较大(19.81%),而预测机器学习回归的相对误差较小(17.88%)。【本研究切入点】由于山地林区的林分蓄积量较大,使用传统方法估测这些地区的蓄积量,效果不佳。利用从高光谱数据计算的窄带植被指数来估计高郁闭度林分的蓄积量[8-11],但高光谱数据的使用在成本、可用性和处理能力都有其自身的局限性。WorldView-2 卫星数据被认为是多光谱分辨率卫星数据和高光谱数据之间的折衷选择,提供了比SOPT 和LandsatTM 等传统宽带卫星图像更多的波段(8个波段)和更高的空间分辨率(2 m),减少了高光谱数据中包含的不必要的冗余。对于蓄积量模型的建立,随机森林等集成方法已成功用于提高生态领域的预测精度[12],能够基于离散或连续数据集综合回归或分类函数,同时还具有处理预测值之间复杂关系的能力[13]。需利用WorldView-2 卫星影像与随机森林算法估算林分蓄积量。【拟解决的关键问题】以新疆伊犁巩留县恰西国家森林公园的天山云杉为研究对象,WorldView-2卫星影像为数据源,提取天山云杉林的光谱信息,植被指数与纹理因子,结合样地实测森林信息建立随机森林回归模型,反演天山云杉林分蓄积量,丰富现代森林资源调查技术方法,为天然林保护工程实施20年来新疆森林资源的更新恢复评价提供技术支撑。
1.1.1 研究区概况
恰西国家森林公园位于巩留县东部山区小吉尔尕郎河的支流恰西河的中游,吉尔格郎乡东南部山区,N 43°02′~43°06′,E 82°36′~82°44′。海拔1 270 ~1 600 m,属于典型温带大陆性半干旱气候,土壤深厚肥沃年均降水量达550 ~700 mm,全年平均气温7.4 ℃。
1.1.2 影像数据来源
WorldView-2卫星覆盖研究区的图像是2018年8月获得的。WorldView-2 影像由8个多光谱波段组成,空间分辨率为2m,最低点条带宽度为16.4 公里。这8个波段的光谱范围分别为400-450nm 海岸波段(Band1-COASTAL)、450-510nm蓝光波段(Band 2-BLUE)、510-581nm 绿光波段(Band 3-GREEN)、585-625nm黄光波段(Band 4-YELLOW)、630-690nm 红光波段(Band 5-RED)、705-745nm 红边波段(Band 6-RED edge)、770-895nm 近 红 外 波 段1(Band 7-NIR1)和860-1040nm近红外波段2(Band 8-NIR2)。
1.1.3 外业数据获取
2018年7月在新疆巩留县恰西国家森林公园内,通过林相图等先验数据与实地踏查结合,共设置95 块30 m×30 m 的样地,其中包含皆伐样地,择伐样地,无干扰天然林。并对样地内胸径大于6 cm 的天山云杉林进行每木检尺用于计算蓄积量。使用GPS 记录每块样地中心点及四个边点的坐标。
1.2.1 实测样地蓄积量计算
天山云杉二元立木材积公式由当地林业局根据天山西部地区最新二类调查检尺材料计算求出。天山云杉二元立木材积公式如下:
1.2.2 WorldView-2卫星影预像处理
利用ENVI5.3 对WorldView-2 卫星影像进行辐射定标、大气校正。对校正好的多景World-View-2卫星影像进行镶嵌处理,生成覆盖整个研究区的影像,同时通过选取道路、河流、建筑等交叉点对研究采用的WorldView-2卫星影像进行几何精校正。图1
图1 处理结果Fig.1 Preprocessing result diagram
1.2.3 遥感因子的设置
研究利用eCognition Developer 提取光谱信息、纹理因子与植被指数三种遥感因子。其中光谱信息包含海岸波段,蓝光波段,绿光波段,黄光波段,红光波段,红边波段,近红外波段1 与近红外波段2;纹理因子选取常用的8个,即协同性、相异性、均值、相关性、方差、对比度、熵与二阶矩,通过灰度共生矩阵方法提取,任意两像元之间的位置关系分为0、45、90 与135°四个方向;植被指数4个,分别为归一化植被指数(NDVI)、差值植被指数(DVI)、比值植被指数(RVI)与增强型植被指数(EVI),由于WorldView-2 影像的特殊性质,在WorldView-1 卫星的基础上改进,增加了近红外波段2,这个波段部分重叠在近红外波段上,但较少受到大气层的影响,该波段支持植物分析和单位面积内生物数量的研究,采用NIR1与NIR2,即植被指数为8个,研究设置共计24个遥感因子。表1
表1 纹理特征Table 1 The texture characteristics
使用R软件中的“随机森林”(RandomForest)包实现随机森林。在实地调查的95块样地中,以66块样地做为建模数据集,利用剩余的29块样地验证模型精度。
图2 研究区WorldView-2影像植被指数Fig.2 Vegetation index of WorldView-2 image in study area
研究表明,在回归树的数量达到1 200 以后回归误差趋于稳定,以1 500作为回归树的数量,解释度高达81.27%,最终选取特征变量NDVI1、NDVI2、RVI2、均一性与相关性。图3,图4
图3 随机森林遥感因子筛选Fig.3 Screening of random forest remote sensing factors
图4 随机森林结果Fig.4 Random forest result
随机森林建立的回归方程为:
其中x1为相关性,x2为NDVI2,x3为RVI2,x4为NDVI1,x5为均一性。
研究表明,将实地调查样地信息计算的蓄积量作为自变量(x),利用模型估算的样地蓄积量作为因变量(y),将二者组成对应值,建立线性回归方程:y= 0.6593x+ 9.6279,其中相关系数R2=0.8648(P<0.05),拟合效果较好。图5
图5 样地蓄积量实测值与预测值线性回归Fig.5 Linear regression of measured and predicted stock volume in sample plots
由模型拟合的蓄积量与实测蓄积量的残差分布在残差置信带[-2,+2],并且在轴x=0 上下两侧随机分布,模型不存在明显偏差。
经过模型的拟合验证,残差分析,与均方根误差的计算,通过随机森林算法建立的模型可以有效的反演天山西部天山云杉的蓄积量,对比验证模型的29块样地蓄积量的实测值与估测值,精度为86.38%。图6
图6 蓄积量残差分布Fig.6 Residual distribution of stock volume
刘俊[14]基于ALOS 与TM 遥感数据,对北京怀柔区的针叶林与阔叶林进行波段与纹理因子的提取,建立多元逐步回归模型,在模型精度验证中,计算RMSE为12.139,与研究相差不大。王海宾[15]基于GF-1 PMS影像,通过k-NN 法对北京延庆区的森林蓄积量进行估测,精度为86%,而用偏最小二乘回归进行建模估测精度只有76.6%。冯凯[16]利用Landsat8影像数据对广东省韶关市与南雄市山区的森林蓄积量进行反演,将立地因子与遥感因子作为自变量,通过POS算法优化了BP神经网络与多元逐步回归的建模方法,最后估测量与二类调查数据做对比,精度为81.2%。
研究对于蓄积量的反演,选择了比前人更适合更有效的WorldVeiw-2 影像,在算法上选择了随机森林算法,随机森林回归能够提供较小的变量子集和合理的预测精度,通过MSE 增量和节点纯度来筛选影响力较高的因子,当然由于研究的样本量不大,当更大样本量的数据集进一步实验,随机森林算法在预测超出训练数据集范围的值方面的性能还有待探究。
研究基于WorldView-2 影像,提取样地遥感因子,利用随机森林算法对遥感因子进行筛选,并建立随机森林回归模型,基于此得到样地的林分蓄积量精度达到86.38%,通过WorldView-2 影像数据反演林分蓄积量是切实可行的。方法优势明显,精度也基本满足对天山云杉林木生长状况的快速评价和动态监测需求。