基于Landsat 8 影像的汝城县森林地上生物量遥感估算研究

2020-08-12 00:42蒋瑞滨
湖南林业科技 2020年3期
关键词:回归系数样地生物量

何 矣,蒋瑞滨,文 敏

(1. 汝城县林业局,湖南 汝城 424100;2.国家林业和草原局中南调查规划设计院,湖南 长沙 410014)

植被生长依赖于光、水、养分、二氧化碳的吸收和利用,从而导致森林生物量的累积。因此,通过固碳,森林生物量在森林生态系统和碳循环中起着重要作用。精确估测森林生物量是分析森林碳动态和碳循环的基础。通过野外调查获取地上和地下森林总生物量的过程较困难,成本高昂,森林地上生物量(Aboveground Biomass,AGB)占总森林生物量的70%~90%,因此大部分研究集中在地上生物量[1]。遥感数据由于空间信息易于获取,并且具有较大覆盖范围,已被大量应用于大范围森林地上生物量的估测,其中Landsat 8影像数据由于成本较低应用最为广泛[2]。

现有研究表明,非参数或机器学习方法由于具有强大的数据拟合能力,可以提高估算精度,但由于它们对样本设计敏感,因此降低基于遥感数据估测森林地上生物量的不确定性是研究难点[3]。不确定性可能是由于忽略了空间自相关和异质性的影响。空间自相关是空间结构的最常见方法,空间异质性展现了每个位置相对于其他位置的独立性[4]。

基于此,本研究旨在提出一种方法,以改善汝城县森林地上生物量的空间制图情况。首先分析森林地上生物量的空间自相关和异质性,然后基于Landsat 8影像和汝城县森林资源一类调查数据,建立2个空间模型,包括空间滞后模型(Spatial Lag Model,SLM)和地理加权回归模型(Geographically Weighted Regression,GWR),以估算森林地上生物量,并与非空间模型普通最小二乘法进行比较,评估3个模型的拟合和预测性能,绘制森林地上生物量空间分布图。

1 研究区概况

汝城县位于湖南省郴州市东南部,地处113°16′—113°59′E,25°19′—25°52′N,属亚热带季风湿润气候区,国土总面积2424.96 km2。地貌以山地为主,四面环山,地势西北高,东南低。汝城县森林资源较为丰富,林地总面积1932 km2,其中有林地1695 km2,森林覆盖率达71.31%,活立木蓄积量1280万m3。

2 材料与方法

2.1 样地数据及森林地上生物量

在本研究中,森林地上生物量来源于2014年汝城县森林资源连续清查数据,计算方法采用李海奎等[5]建立的不同树种生物量模型,经济林和灌木生物量的计算采用平均生物量法。汝城县共有88个样地,剔除非林地和有云覆盖的样地后,最终保留48个样地参与森林地上生物量估算。

2.2 Landsat 8影像及预处理

选用美国陆地资源卫星Landsat 8 OLI为遥感数据源,影像获取时间为2014年10月15日,轨道号为122/042。用ENVI软件对其进行辐射校正和几何校正,以汝城县行政边界进行图像裁剪,提取汝城县Landsat 8遥感影像。用ArcGIS软件提取Landsat 8遥感影像的7个单波段,并计算了22个植被指数及其衍生指数,包括归一化植被指数NDVI,差值植被指数DVI,比值植被指数SR,土壤调节植被指数SAVI等[6-8]。遥感变量与森林地上生物量间的相关性使用SPSS 22.0软件计算,保留在0.05水平显著相关的因子参与模型构建[9]。

2.3 空间效应分析

在本研究中,对样地地上生物量进行了空间自相关和异质性分析。

2.3.1 空间自相关 空间自相关的研究依赖于全局和局部莫兰系数。在本研究中,使用Moran′s I描述样地地上生物量的全局空间自相关[10]见式(1)。

(1)

(2)

安瑟伦局部莫兰指数[12]被用于体现样地地上生物量的局部分布。在本研究中,局部指标包括空间关联和莫兰散点图。局部Moran’s I计算见式(3)。

(3)

2.3.2 空间异质性 块内方差(Intra-block variance,Sintra)被用来根据现有研究来量化局部空间异质性[14],计算见式(4)。

(4)

2.4 基于遥感数据的森林地上生物量估测

研究选用非空间模型普通最小二乘法(Ordinary Least Squares,OLS )及2个空间模型,包括空间滞后模型(Spatial Lag Model,SLM )和地理加权回归模型(Geographically Weighted Regression,GWR )来进行汝城县森林地上生物量的估算。

2.4.1 普通最小二乘法y和X的回归关系见式(5)。

y=Xβ+ε

(5)

式中:y为观测到的响应变量的向量,X为已知的模型矩阵,β为未知的固定效应参数向量,ε为随机误差项向量。β可通过最小二乘法获得。

2.4.2 空间滞后模型 空间滞后模型是普通最小二乘法和空间自回归模型的组合[15],见式(6)。

y=Xβ+ρWy+ε

(6)

式中:W为行总和标准化权重矩阵,Wy为空间滞后响应变量,ρ为空间自相关系数,ε为具有正态分布的行为良好误差项。

2.4.3 地理加权回归模型 地理加权回归是结合地理信息距离权重的全局普通回归模型的扩展[16]。如果数据集中的每个观测值的权重为1,则GWR模型等效于OLS模型。GWR的基础模型如式(7)所示。

(7)

式中:{β0(ui,vi),β1(ui,vi ),…,βp(ui,vi)}表示在研究区(ui,vi)处的(p+1)个回归系数,ε为具有正态分布的随机误差项向量。参数估计基于地理权重矩阵Wi。在位置i,Wi=f(di,h),其中di为位置i和所有邻居的距离矩阵,h为带宽。常用的权重函数f(di,h)包括一个固定空间内核,比如高斯距离衰减核函数,和一个自适应空间内核,比如双平方距离衰减内核。

本研究中,使用SPSS 22.0软件进行正向逐步回归,从光谱变量中选取4个与森林地上生物量显著相关的变量。普通最小二乘模型和空间滞后模型使用GeoDa软件实现,地理加权回归模型使用R软件构建,并通过不同滞后距离的森林地上生物量图和全局莫兰分析结果确定空间回归模型的带宽。

2.5 模型比较

研究选用3个统计量评估模型拟合效果,包括决定系数R2,均方根误差RMSE和赤池信息准则AIC[17]。另外,使用验证样本对模型进行验证,包括平均误差ME,平均绝对误差MAE,平均相对误差MRE,平均绝对相对误差MARE[18]。

3 结果与分析

3.1 森林地上生物量的空间特征

3.1.1 空间自相关 当距离为7.5 km时,全局莫兰指数为0.1089,Z得分2.1434,表明滞后距离和地上生物量聚类的空间分布呈正相关。局部莫兰指数和对应的Z值在表1中列出。在48个样地中,尽管70.83%的样地地上生物量值没有显示出显著的空间自相关(|Z|<1.96),但是29.17%,即14个样地地上生物量在空间上具有显著的自相关。自相关显著正值的样地有11个(Z≥1.96),其中7个样地显示了高-高聚类,4个样地显示了显著的低-低聚类(Z≥2.58)。此外,3个样地具有显著负自相关(-2.58

表1 样地地上森林生物量在带宽为7.5 km时的局部莫兰指数Tab.1 Local Moran’s I values with the bandwidth of 7.5 km for the plot AGB变量最小值最大值均值标准差偏度峰度AGB-0.020 10.027 50.000 70.000 30.712 88.571 2

3.1.2 空间异质性 在图1中,计算了森林地上生物量具有不同块大小的块内方差,以反映空间异质性。地上生物量具有滞后距离的块内方差表示给定块大小的平均局部空间变化。方差随着块的大小在距离30 km之前增大而增大,在块大小相对较大且滞后距离大约100 km时达到稳定水平。

3.2 模型表现

3个模型的精度验证结果见表2。OLS模型的R2为0.347,RMSE为28.124 t·hm-2,除常数外,具有统计学上显著的模型系数(P<0.05)。与OLS相比,空间回归模型的R2更大,AIC和RMSE更小。根据David[19]的研究,如果AIC差异大于3,则任何两个模型之间的差异在统计上都是显著的。本研究中,OLS比其他2个空间模型的AIC值更大,3个模型中每个之间的AIC差异大于3。而且,OLS相比其他2个空间模型而言,R2更小,RMSE更大,这表明空间回归模型的拟合性能明显优于OLS。GWR模型具有最大的R2(0.756),最小的AIC(1199.341)和RMSE(17.288 t·hm-2),其次是SLM。因此,GWR具有最佳拟合性能。

表2 模型精度验证Tab.2 Comparisons of precisions by different models模型建模样本(n=36)检验样本(n=12)R2RMSE/(t·hm-2)AICME/(t·hm-2)MAE/(t·hm-2)MRE/%MARE/%OLS0.347 28.124 1 260.711 -24.122 29.804 -16.550 30.451 SLM0.412 25.672 1 255.652 -23.387 28.385 -15.881 28.905 GWR0.756 17.288 1 199.341 -17.655 25.556 -8.542 25.071

基于测试数据集,3个模型的ME、MAE、MRE和MARE值显示出与基于模型拟合数据集获得的AIC和RMSE相似的预测性能。与SLM和OLS相比,GWR的ME、MAE、MRE和MARE值较小。

由表3可知,OLS、SLM模型的回归系数估计值以及GWR的回归系数范围。对于相同的光谱变量,OLS、SLM的回归系数值彼此相似,OLS的回归系数绝对值略大,GWR的回归系数的范围较广。

根据精度最高,拟合效果最好的GWR模型,绘制汝城县地上森林生物量分布图(图2)。由图2可以看出,模型预测地上森林生物量分布结果与汝城县实际植被分布一致,植被覆盖度高的地方,地上森林生物量大。

表3 模型系数Tab.3 The parameters of different models回归系数变量OLSSLMGWRβ0常数-38.144-75.441-347.144~147.800β1NDVI28.71226.884-121.900~115.812β2SAVI05160.241155.421-1.165~588.744β3DVI34212.330188.514-71.241~880.512β4SR21-45.712-40.605-121.140~108.952空间参数λ=0.415, ρ=0.447

4 结论与讨论

本研究的重点是利用遥感影像和空间回归模型来改善森林地上生物量的估算。基于样地的拟合和预测数据集以及Landsat 8遥感影像,对汝城县森林地上生物量的空间效应进行分析,结论如下:

(1)地理加权回归模型估测汝城县森林地上生物量表现最佳,决定系数最大,达到了0.756,均方根误差和平均相对误差最小,分别为17.288t·hm-2和-8.542%。其次是空间滞后模型,普通最小二乘模型表现较差。

(2)地上森林生物量分布估测结果与汝城县实际植被分布一致,植被覆盖度高的地方,地上森林生物量大。

使用遥感数据进行森林地上生物量估算时,不应忽略空间自相关和空间异质性,与现有方法相比,本研究通过空间回归来减少空间效应的影响[20]。地理加权回归模型降低了生物量的高估和低估带来的不确定性,为使用Landsat 8影像改进森林地上生物量的估算提供了巨大的潜力。后续研究将引入残差的空间自相关和空间异质性分析,进一步提高森林地上生物量估算的准确性。

猜你喜欢
回归系数样地生物量
四川省林草湿调查监测工作进展
基于高分遥感影像的路域植被生物量计算
基于星载ICESat-2/ATLAS数据的森林地上生物量估测
桉树培育间伐技术与间伐效果分析
仁怀市二茬红缨子高粱的生物量及载畜量调查
额尔古纳市兴安落叶松中龄林植被碳储量研究
轮牧能有效促进高寒草地生物量和稳定性
不同NPK组合对芳樟油料林生物量的影响及聚类分析
基于生产函数模型的地区经济发展影响因素分析
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较