基于机载激光雷达的亚热带森林生物量估算模型研究

2022-01-19 09:07方志良王艳军
林业调查规划 2021年6期
关键词:样地生物量树种

方志良,陈 奇,任 引,王艳军

(1. 湖南科技大学地理空间信息技术国家地方联合工程实验室,湖南 湘潭 411100;2. 夏威夷大学马诺阿分校地理与环境系,美国 檀香山 96822;3. 中国科学院城市环境研究所城市环境与健康重点实验室,福建 厦门 361021)

1 研究背景

森林生物量(above-ground biomass, AGB)是森林生态系统发挥其生态功能的物质基础,是森林固碳能力的重要标志,在全球碳循环中扮演着重要角色[1]。对森林生物量和碳贮量现状及其变化速率的准确估计,有助于了解森林在区域和全球碳循环中的作用,能够为应对气候变化提供关键信息。特别是我国亚热带地区,水热条件优越,生物多样性丰富,在中国乃至全球碳循环中均起到关键作用。近年来,随着遥感技术的飞速发展,利用光学、雷达和激光雷达(light detection and ranging, LiDAR)数据进行了大量的森林生物量研究[2-5]。特别是机载LiDAR能够获得被动光学遥感所不能反映的垂直结构信息,且这些结构参数与森林生物量有着很好的相关关系,进而提高森林生物量遥感的估算精度[6]。

利用机载激光雷达技术对森林生物量的准确估算是了解全球碳循环和缓解气候变化的重要手段,而异速生长方程及森林生物量估算模型是其中的关键。机载LiDAR数据并不能直接计算生物量,首先需要实地野外样地调查数据结合异速生长方程对单木生物量进行计算,其次将单木生物量累加得到样地生物量,然后与LiDAR特征变量构建生物量估算模型,最后利用该模型对整个LiDAR覆盖区域进行森林生物量的估算。大量研究表明,不同的异速生长方程会较大程度地影响最终生物量的估算精度[7]。如Chen等[8]研究了美国森林清查中的3种不同尺度的异速生长方程在美国太平洋西北部3个研究点之间的差异和关系,发现物种的组成和树木大小均会是引起3种异速生长方程在生物量估算上的差异性。Zhao等[9]利用区域尺度和国家尺度的两种异速生长方程比较了8个模型的回归性能,提出异速生长方程的可用性和不确定性对森林生物量估算的影响。目前,森林生物量估算研究大多是根据研究区域选择已有的异速生长方程或者根据解析木数据拟合的异速生长方程,较少研究不同异速生长方程的选择对森林生物量估算模型的影响。

近年来,周国逸等[10]对文献中900多套异速生长方程进行综合分析,建立了较统一且实用的分省(自治区、直辖市)分树种生物量方程(简称I)、全国优势种(组)生物量方程(简称II)、分省混合种(组)生物量方程(简称III)、中国森林主要群系生物量方程(简称IV)共4套异速生长方程。但是,4种异速生长方程的差异性及其在亚热带区域适用性研究尚缺乏。从LiDAR数据中提取生物量的方法已很成熟。在传统的统计方法方面,研究人员采用了一系列参数或非参数统计模型来进行生物量的量化,包括简单线性回归、逐步线性回归、线性混合模型方法[11-12]。机器学习方法较适合处理高维问题,已广泛应用于森林生物量估算,如人工神经网络、支持向量回归(support vector regression, SVR)以及随机森林(random forests, RF)等[13-14]。但需要考虑不同异速生长方程的约束条件,对比分析基于机载LiDAR点云的森林生物量估算模型。

为了更好地理解基于机载激光雷达数据的亚热带森林生物量估算模型及其受异速生长方程的影响,本研究旨在比较样地尺度上的不同异速生长方程的生物量估算差异性,研究基于机载LiDAR数据的亚热带森林生物量估算模型及其误差验证分析。

2 研究区域与数据

2.1 研究区域概况

研究区域为福建省龙岩市北部地区(图1),属亚热带海洋性季风气候,以山地为主,地形比较复杂,境内山岭沿东北—西南走向,大体呈平行分布,自然资源丰富,植被群落类型复杂多样,主要乔木树种有闽楠(Phoebebournei)、丝栗栲(Castanopsisfargesii)、栲树(CastanopsisfargesiiFranch)、木荷(SchimasuperbaGardn)、楠木(PhoebezhennanS. Lee)、杉木(Cunninghamialanceolata)、马尾松(PinusmassonianaLamb)等。

图1 研究区域范围

2.2 地面调查数据

本研究区域包括96个边长为25.82 m的方形样地,应用中海达定位仪准确记录样地空间位置。通过2013年现场实地调查,在每块样地中测量胸径(diameter breast high,DBH)大于5 cm的各类树木信息,主要包括树种、胸径、平均树高、树的状态(存活、砍伐、枯死等)等,同时获取了同区域的239棵解析木数据。

2.3 机载LiDAR数据

机载LiDAR数据于2013年获取,采用的激光雷达系统是ALS70-HP,数码相机系统是LEICA RCD30,相对航高约200~4 000 m,相对地面飞行速度约250 km/h。该机载LiDAR系统中,激光器工作波长为1 064 nm,脉冲重复频率为50 kHz,激光束发散角为0.15 mrad。获取的机载LiDAR点云数据平均密度约6点/m2,小范围精细飞行区达9点/m2,地表定位平面精度为0.2 m,高程精度为0.3 m,同步获取的CCD航空影像数据空间分辨率为0.2 m。

3 研究方法

3.1 基于异速生长方程的树木单体生物量估算

使用4种异速生长方程来计算单木生物量,其来源于周国逸等[12]编译的生物量方程。根据该文献,树木单体生物量(AGB)计算为4个生物量成分的总和,公式为:

AGB=Btrunk+Bbranch+Bleaf+Broot

(1)

式中:Btrunk表示树干生物量;Bbranch表示树枝生物量;Bleaf表示树叶生物量;Broot表示树根生物量。

由于外业采集数据只包含树的胸径,而不包括单棵树高信息。因此,只选取该方法中基于胸径计算生物量的异速生长方程,公式为:

B=a×DBHb

(2)

式中:B为树木器官生物量(kg);DBH为胸径(cm);a,b为系数。

选取4种异速生长方程,其中前两种按树种类型划分,后两种按森林类型划分。 I:分省(自治区、直辖市)分树种,树种包括杉木、马尾松、木荷、其他硬阔类4类。II:全国优势种(组),树种包括杉木、马尾松、木荷、其他硬阔类4类。III:分省混合种(组),森林类型包括针叶林、阔叶林、针阔混交林3类。IV:中国森林主要群系,森林类型包括针叶林、阔叶林、针阔混交林,并在每种森林类型的基础上按胸径大小划分为3种,总共9类。

3.2 基于机载LiDAR点云的森林生物量估算模型

机载LiDAR点云数据的地面滤波和处理采用的是TIFFS软件工具[15]和Terrasolid软件辅助处理,主要包括:(1)应用数学形态学方法对所有激光雷达数据进行处理,提取窗口数据,搜寻窗口内的最低点,接着进行开运算和闭运算的处理,将激光点云数据分类为地面点和非地面点,进一步运用高程阈值法,从非地面点中分离出建筑、电力线等非植被点,剩余的即为植被点;(2)将地面点进行插值生成数字高程模型(DEM),然后根据植被点的高度坐标与相应DEM进行归一化处理,计算每个点的树冠高度,即得到冠层高度模型;(3)基于冠层高度模型及其三维结构,计算高度均值、方差、峰度、分位数、偏度、各垂直高度百分比数等15个特征变量,即生成样地尺度的生物量预测变量特征数据集[16]。

根据机载LiDAR点云计算得到的特征数据集结合样地估算生物量,设计和构建了多种生物量估算模型,包括逐步回归、支持向量回归(SVR)、随机森林(RF)和BP神经网络。

逐步回归模型是从一个自变量开始,根据自变量对因变量作用的显著程度,从大到小地依次逐个引入回归方程。当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。对每一步均要进行F值检验,以确保每次引入新的有统计意义,即方差贡献显著的变量前回归方程中只包含对因变量作用显著的变量。这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。公式为:

W=α0+α1x1+α2x2+…+αnxn+ε

(3)

式中:W为根据地面实测数据计算的样地生物量;α0,α1,α2,…,αn为模型系数;x1,x2,…,xn为基于机载激光雷达数据提取的特征变量;n为参与逐步回归的特征变量的总数;ε为正态分布误差项[ε~N(0,σ2)]。

机载LiDAR特征变量与生物量之间的关系通常是非线性的。支持向量回归(SVR)通过使用核函数将原始输入特征空间映射到一个新的高维特征空间[17],将问题线性化。采用台湾大学林智仁博士等开发的开源程序包LibSVM3.1工具,首先对样本数据进行归一化处理,将数据映射到[0-1]之间,再利用常见的核函数,通过格网搜索法确定模型参数。随机森林RF的回归过程通常涉及到两个关键参数,一个为决策树数量,即重抽样的次数,另一个为随机特征数量,即用来分割节点的最大输入变量个数。首先根据均方根误差(RMSE)最小的原则确定决策树数量,然后利用袋外数据对所有样本的特征变量的重要性进行计算,最后按特征变量的重要性依次引入模型,选择预测能力强、相关性好的特征变量组合。BP神经网络将特征变量作为神经网络输入变量,样地生物量作为神经网络输出变量,在仿真训练过程中不断调试参数,最终构建合适的神经网络模型进行生物量估算。

为了比较回归模型的性能,采用五折交叉验证方法进行模型拟合精度评估,主要指标包括确定系数(R2)和均方根误差(RMSE)。

4 结果分析

4.1 基于异速生长方程的生物量估算对比分析

4.1.1单木尺度的生物量估算对比分析

异速生长方程误差的计算要求对单木进行破坏性测量。而在本研究中,利用解析木数据(包含树干、树枝、树叶、树根及整棵树的生物量)对异速生长方程加以验证,表1总结了4种异速生长方程验证结果。

表1 4种异速生长方程估算生物量与实测生物量平均值比较

平均而言,分省分树种方法的生物量最高,中国森林主要群系方法最低,但4种异速生长方程得到的估算生物量均低于实测生物量。分省分树种和全国优势种方法在生物量估算上更为准确,而另外两种方法,特别是中国森林主要群系方法在生物量估算上严重偏低。这可能与分省分树种和全国优势种方法在树种上做了区分有关,对各个树种生物量估算更精确。图2显示了解析木数据与4种异速生长方程估算生物量之间的关系。

图2 4种异速生长方程单木生物量估算与实测值对比

对低生物量的树木,4种方法估算值都较为接近实测值,但在高生物量的树木中均出现估算偏低的情况。这可能在建立异速生长方程时,与解析木的选取有关。在实际野外调查中,大径级解析木会比较少,这时由小径级的解析木数据拟合的生物量方程估算大径级的生物量,可能会导致估算结果的偏高或者偏低,而在本研究中出现了偏低的情况。

4.1.2样地尺度的生物量估算对比分析

表2统计了4种异速生长方程在样地尺度上的生物量密度,样地数选择96个。

表2 4种异速生长方程在样地尺度上生物量密度

在样地平均生物量中,分省分树种方法最高(80.8 t/hm2),中国森林主要群系方法最低(76.8 t/hm2),这些平均生物量差别较小,最大差值仅5%。但在样地最大生物量密度统计上,4种方法存在较大差异,最大差值为23%。对4种异速生长方程估算的样地生物量密度进行两两比较(图3)。对于低生物量的样地,任意两个异速生长方程生物量估算比较接近,而对于大生物量样地,不同异速生长方程生物量估算有明显差异。这与Zhao等[9]得出的结论相似。

图3 4种不同异速生长方程在样地尺度上生物量比较

4.2 基于机载LiDAR的森林生物量估算模型

基于5折交叉验证实验的所有模型R2和RMSE如表3所示。

表3 基于不同异速生长方程和不同统计方法的激光雷达生物量模型的交叉验证统计

总体来说,基于中国森林主要群系的生物量估算模型拟合度最好,后面依次是分省分树种、分省混合种、全国优势种。把所有生物量估算模型的结果取平均值,这4种方法对应的R2依次为0.614、0.596、0.612和0.678。相对应的RMSE分别为37.8 t/hm2、39.9 t/hm2、39.1 t/hm2和32.1 t/hm2。在误差统计中,RMSE仅用于描述激光雷达生物量估算模型误差,其假设异速生长方程无误差。然而在4.1中的分析表明,不同异速生长方程的误差是不同的,特别是中国森林主要群系异速生长方程存在较大误差,即使其生物量估算模型误差较小,但其在生物量估算上的误差也可能很大。

4.3 基于机载LiDAR的森林生物量估算模型差异性分析

在测试的4种不同生物量估算模型统计方法(1种回归模型,3种机器学习方法)中。RF模型拟合结果最好,BP神经网络拟合结果最差。为了比较生物量估算模型预测生物量与异速生长方程估算生物量之间的关系,以分省分树种方法为例进行异速生长方程计算的生物量模型拟合和验证(图4)。

图4 散点图显示预测生物量与参考生物量对比

通过比较散点图中的模型线发现,4种生物量估算模型的共同点:大的生物量值往往被低估,而小的生物量值通常被高估。这与Chen[8]发现有共同之处,RF方法用于生物量回归时,由于该模型预测的是训练数据值的平均值,会导致低估高生物量区域和高估低生物量区域。但不局限于RF方法,其他的线性回归以及机器学习方法均可得出相同的结论。通过对分省分树种方法中生物量大于100 t/hm2的32个样地的计算,估算生物量的最大值和平均值分别为261 t/hm2、145 t/hm2,而SR、SVR、BP神经网络以及RF预测生物量的最大值依次为214 t/hm2、166 t/hm2、238 t/hm2、183 t/hm2,相应的平均值依次为125 t/hm2、116 t/hm2、129 t/hm2、131 t/hm2,在最大值和平均值水平上,预测生物量均低于估算生物量。高生物量样地生物量被低估是一个普遍现象,Gao等[18]也在利用生物量估算模型对高生物量样地进行生物量估算时发现,多种模型出现生物量低估的情况,特别是RF和k-近邻法模型对生物量严重低估,导致无法正确预测生物量。

研究结果表明,在亚热带研究区域,BP神经网络模型的回归性能结果较差(相关系数比SR模型低0.175),随即森林RF的结果较好,和Oliveira等[19]研究结果一致。但与Chen[8]和Li等[20]研究发现的RF效果较差形成对比。由此得出,不同森林类型、树种组成以及使用的异速生长方程等不同,会导致同样的生物量模型的结果差异。另外,研究结果揭示了不同移速生长方程及其对应的机载LiDAR点云生物量估算模型,二者在生物量估算中的不一致性。进而,在森林生物量估算误差的定量评估中,应使用误差传播理论[21]全面考虑整个过程的误差,包括野外测量误差、异速生长方程误差、遥感数据误差、生物量估算模型误差等[22-24]。

5 结论

选取福建省龙岩市的亚热带森林为研究对象,构建多种异速生长方程和生物量估算模型,利用机载LiDAR数据和样地调查数据对样地上的生物量进行监测,结果表明:在异速生长方程的选择上,分省分树种的方法在样地生物量估算上更为准确,中国森林主要群系的方法效果最差;在基于机载激光雷达的森林生物量估算模型中,随机森林的方法精度最高,BP神经网络的方法精度最低。

对生物量估算模型的直接比较(如R2)而不考虑异速生长方程误差的差异是不合适的,未来需要更多地研究森林生物量估算过程中的误差,了解相关误差的组成及其传播方式。

猜你喜欢
样地生物量树种
基于高分遥感影像的路域植被生物量计算
仁怀市二茬红缨子高粱的生物量及载畜量调查
额尔古纳市兴安落叶松中龄林植被碳储量研究
基于GC-MS流苏树种子挥发性成分分析
基于角尺度模型的林业样地空间结构分析
福建将乐杉木生物量相容性模型分析
轮牧能有效促进高寒草地生物量和稳定性
树种的志向
辽东地区不同间伐强度对水曲柳林分生态效益的影响
不同NPK组合对芳樟油料林生物量的影响及聚类分析