基于主成分回归及遥感的贵阳市林分郁闭度估测

2020-06-03 07:02蒋维成
林业调查规划 2020年3期
关键词:对模型郁闭度样地

蒋维成

(贵州省林业调查规划院,贵州 贵阳 550003)

森林郁闭度是指林分中树冠投影面积与林地面积之比[1],是一个地区衡量乔木林地或竹林地面积进而计算森林覆盖率的重要指标;在森林资源经营管理中,是区划小班的重要条件,是反映森林生长状况,是确定森林抚育措施和采伐强度的重要指标,同时也是遥感估测森林蓄积量不可或缺的因子[2]。常用的郁闭度调查方法有目测法、样线法、样点法、树冠投影法、抬望眼法、观测管法、冠层分析仪法、Moosehom观测仪、遥感图像判读法、照片法、理论计算法等[3]。其中,树冠投影法准确度较高,但劳动强度大、耗时费力,且不利于大范围林分郁闭度测定;仪器测定法(Moosehom观测仪、球面密度计、郁闭度测定器、冠层分析仪)设备昂贵,难以推广应用;遥感图像判读法、目测法、样点法、样线法、照片法等容易受测定人员主观性的影响,测定结果一致性差,而且也缺乏必要的精确度与准确度。随着空间技术的发展及遥感数据在资源调查中的推广应用,从测定成本上、数据的时效性上及精度上把林分郁闭度测定推到一个新的高度,使林分郁闭度测定朝着低成本、高时效、高精度的方向发展。因此,寻求一种高精度、低成本且能提高林分郁闭度测定精度的方法具有重要的现实意义。对此,李崇贵、杜晓明、李擎、杨妍婷等在森林郁闭度遥感估测上做了一系列的研究[4-8],但在贵州这样的喀斯特山区相关研究却少见报道。本文以Landsat-8 OLI为遥感信息源,通过相关性分析,选择12个遥感自变量因子。为克服自变量因子间严重的多重共线性和模型的不稳定性,本研究采用主成分回归分析法建立郁闭度估测模型,为郁闭度测定提供模型参考,为区域林业经营活动提供依据。

1 研究区概况

贵阳市位于贵州省中部,东经106°07′~107°17′,北纬26°11′~26°55′。总地势西南高、东北低。苗岭横延市境,岗阜起伏,剥蚀丘陵与盆地、谷地、洼地相间。植被种类丰富。据初步查明,有维管束植物176科、489属、1 299种,其中蕨类植物29科、6l属、145种;被子植物147科、428属、1154种。

2 数据与方法

2.1 数据来源

1)遥感数据

选取贵阳市两景Landsat-8 OLI影像数据(LC81270422013272LGN00和LC81270412013272

LGN00)作为遥感数据源,其成像时间为2017年7月。每景影像数据包括9个波段数据,除全色波段(B8)空间分辨率为15 m外,其余8个波段的空间分辨率为30 m,辐射分辨率均为12 bit。

2)样地数据

采用典型性样地调查法,设置半径为13.82 m的圆形样地,郁闭度测定方法为树冠投影法,即通过测量树冠外围轮廓边缘点距离树干中心的水平距离,在图纸上画出目标树的范围,计算出树冠在样地内的投影面积,其与样地总面积的比值即为所得的郁闭度值[3]。应用此方法在研究区范围内测定了115个样地的郁闭度值,同时记录样圆的中心点坐标。

2.2 研究方法及技术路线

2.2.1研究方法

1)遥感数据的处理:为消除水汽、二氧化碳、影像本身存在的几何变形和噪声的影响以及提取研究区范围内的影像图,本研究运用ENVI 5.1遥感图像处理软件对Landsat-8 OLI数据进行辐射定标、大气校正、几何精校正、图像增强处理、图形裁剪、镶嵌、波段分离、计算差值植被指数(DVI)、归一化植被指数(NDVI)、比值植被指数(RVI)、B5/B2、B7/B4、B5*B4/B7,得到研究区遥感信息。

2)样地数据的处理:将样地中心点坐标导入ArcGIS软件并导出shp格式的点图层数据,建立样地面图层,以shp点图层中的点为圆心,以13.82m为半径,将样地以样圆的形式展绘到已进行几何精校正的遥感影像图上,并将相关信息录入对应样地。

3)自变量因子的筛选:本研究初选的遥感因子共15个,因B8为全色波段(分辨率为15m),B1和B9分别为深蓝波段和短波波段,用于观测气溶胶与卷云,本研究不考虑这3个波段,在前人研究和经验知识的基础上,只研究B2~B7波段和DVI、NDVI、RVI、B5/B2、B7/B4、B5*B4/B7共12个因子与郁闭度的相关性,结果如表1所示。12个自变量因子对郁闭度均有意义。一般地,当VIF>10时,说明因子间存在较强的共线性,当VIF越大,表明多重共线性越严重[9]。本研究拟建模的12个自变量因子VIF均大于10,说明因子间存在严重的多重共线性。根据已有的研究文献资料,解决多重共线性的方法主要有岭回归、偏小二乘回归、主成分回归和逐步回归[10],本研究采用主成分回归法构建林分郁闭度估测模型。

4)主成分分析:应用SPSS 21.0对12个自变量因子进行主成分分析,按特征根>1的原则提取主成分。

5)模型构建及精度验证:应用SPSS 21.0对模型进行构建,并利用该软件对模型进行线性显著性检验、参数显著性检验、残差正态性检验及等方差性检验。用15个样地实测数据对模型的预报精度进行验证。

表1 自变量因子的相关系数

2.2.2技术路线

研究技术路线如图1所示。

图1 研究路线Fig.1 Research route

3 主成分回归原理及模型构建

3.1 原理和方法

主成分分析的思想是利用降维思想,将多个互相关联的数值变量转化成少数几个互不相关的综合指标。这些综合指标就是原来多个变量的主成分,每个主成分都是原始变量的线性组合,并且各个主成分之间互不相关。主成分分析的任务之一就是计算主成分,最经典的做法就是用 F1( 选取的第一个线性组合,即第一个综合指标) 的方差来表达,即 Var(F1)越大,表示 F1包含的信息越多。在所有的线性组合中选取的 F1 应该是方差最大的,故称 F1 为第一主成分。如果第一主成分不足以代表原来 P个指标的信息,再考虑选取 F2。即选第二个线性组合。为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求 Cov(F1,F2)=0,则称 F2 为第二主成分。依此类推,可以构造出第三、第四,……,第P个主成分。确定主成分个数的方法有两种:①累计贡献率:当前k个主成分的累计贡献率达到某一特定值时,保留前k个主成分;②主成分的数目大大少 于原始变量的数目;③主成分保留了原始变量的绝 大多数信息,一般累计贡献率达到70%以上[9]。主成分回归的原理是用主成分分析提取的主成分与因变量回归建模。由于主成分间互不相关,并且能较好地反映原来众多相关性指标的综合信息,使得回归方程及参数估计较为可靠。

3.2 模型构建

运用统计软件SPSS 21对影响林分郁闭度的12个因子进行主成分分析,按照特征根大于1的原则筛选主成分,分析筛选结果如表2所示。

表2 解释的总方差

由表2可知,第一主成分特征值为6.555,解释了原始12个自变量的54.629%;第二主成分特征值为3.881,解释了原始12个自变量的32.341%;第三主成分特征值为1.085,解释了原始12个自变量的9.043%。前三个主成分解释了原始12个自变量的96.012%的信息,因此选择前3个主成分建立郁闭度估测模型。

故本研究按照特征根≥1的原则选取前3个主成分的得分为自变量,因变量选取实测郁闭度,建模样地数为100个,建立模型如下:

Y=0.1P1+0.01P2+0.02P3-0.471

式中,P1、P2、P3分别为第一、第二、第三主成分分量。对模型进行拟合优度检验(表3)。

表3 模型汇总

从表3可以看出,模型的复相关系数为0.874,拟合优度为0.764,修正后的拟合优度为0.756,说明该模型达到较好的拟合效果。

表4 方差分析

从方差分析(表4)结果可以看出,模型的F=104.423>F0.05,P<0.01,F检验达到了0.01的显著水平,因此,郁闭度和各主成分之间线性关系显著。

4 模型精度的验证

用15个样地对模型精度进行验证(表5)。结果表明,精度最低为74.12%,最高为81.04%,精度的平均水平为78.80%,可为区域林分郁闭度测定提供模型参考。

5 结论与讨论

5.1 结论

1)建立的郁闭度估测模型的复相关系数为0.874,拟合优度为0.764,修正后的拟合优度为0.756,达到较好的拟合效果,说明该模型在数学上是可行的。建成的模型为Y=0.1P1+0.01P2+0.02P3-0.471。

2)本研究利用15个实测样地对模型预报能力进行精度验证后,估测精度的平均水平为78.80%,可为区域林分郁闭度估测提供模型参考。

5.2 讨论

1)本研究自变量因子选择时,没有考虑立地因子,如坡度、坡向、坡位、土层厚度等,也没有考虑其他林分因子,如龄组等,故引入立地因子、其他林分因子作为自变量建立林分郁闭度估测模型有待进一步研究。

表5 模型精度检验

2)本研究以贵阳市为研究区域。贵州作为全国唯一没有平原的省份,因其地形地貌的独特性,虽然该模型拟合效果和预报能力均较好,但在地形地貌存在明显差别的其他区域的适用性有待进一步探讨。

猜你喜欢
对模型郁闭度样地
森林资源监测地面固定样地优化研究
额尔古纳市兴安落叶松中龄林植被碳储量研究
昆明市主要绿化树种阈值测定与分析
基于角尺度模型的林业样地空间结构分析
不同郁闭度马尾松林下种植射干的生长效果分析
顶风扎点
郁闭度与七指毛桃生长的相关性分析
蒙医开窍补肾针刺法对模型大鼠胸腺、脾脏指数的影响
蒙医催熟疗法对模型大鼠炎症因子影响的实验研究
脉冲接种下的双时滞的SIRS模型的稳定性与持久性