吴思敏,孙 华,林 辉
(1.中南林业科技大学 林业遥感信息工程研究中心,长沙 410004;2.林业遥感大数据与生态安全湖南省重点实验室,长沙 410004;3.南方森林资源经营与监测国家林业与草原局重点实验室,长沙 410004)
林分平均高是计算森林蓄积量的重要参数,传统的方法主要依靠人力进行实地调查获取林分平均高信息,此方法耗费大量的人力、物力和财力。传统林分平均高测算工作迫切需要一种能快速地、多时态、多维度、多尺度、高精度地获取这一参数的方法[1-4]。
随着遥感技术的发展,激光雷达(Light Detection and Ranging,LiDAR)作为一种新型的主动遥感技术,可以获取高度信息,为森林垂直结构参数提取提供了一种新的思路。LiDAR具有强度高,抗干扰能力强,对物体位置的探测精度高等特点,通过将激光雷达布设飞行器上,能快速地实现森林结构信息获取[5-9]。
国内外对激光雷达获取森林垂直结构参数进行了大量研究,而激光雷达数据应用于林分平均高提取的方法主要有两种:
1)通过LiDAR点云数据构建的冠层高度模型(Canopy height model,CHM)提取林分平均高。该方法首先对激光雷达点云进行滤波,分离地面点云与地物点云,通过地物点云与地面点云生成数字高程模型(Digital elevation model,DEM),与数字表面模型(Digital surface model,DSM)相减得到冠层高度模型(CHM)。CHM是生态系统模型的重要参数,是森林垂直结构参数提取的重要因子,对于森林的碳储量和生物量估测有着重要作用[10-14]。林分平均高与CHM有所差异,CHM并不等同于林分平均高,故有学者提出了基于CHM的均值提取与低值阈值去除等方法来获取林分平均高,此方法胜在操作简单容易实现,但提取效果并不理想[15]。为了进一步提高提取精度,又有学者提出基于CHM进行单木分割的林分平均高提取方法,如,分水岭算法、多项式拟合法[16-18]。此方法试图去分析真实的林木空间分布,使得精度有所提升,但不同的阈值对于树顶种子点的选定对提取精度有着较大的影响。
2)通过LiDAR点云数据直接进行单木分割提取林分平均高。点云的单木分割在三维空间结构参数的利用上相较于CHM的单木分割更多,得到的单木分割精度也更高,但缺点是算法复杂多样,时间成本较高[19]。
CHM数据是由三维的点云数据向二维转换而来,损失了部分三维的结构信息变为二维的平面数据,存在的一些不自然的高度畸变与凹坑对林分平均高的提取存在较大影响[20],而不同的树种有着不同的冠型特征,会导致相异的凹坑畸变,故不同树种对于林分平均高提取精度的影响值得探讨。同时,CHM产品的分辨率差异对于林分平均高的提取效率与精度也会产生影响,若CHM产品分辨率较低,精度是否能保证,若CHM产品的分辨率较高,时间成本会提高。所以,如何找到一个较为适合的分辨率,目前少有相关研究。为探究这一系列问题,本研究提出结合自适应阈值与峰值的方法来提高林分平均高的提取精度,以及此方法在不同的树种中林分平均高提取的精度情况。
研究区位于广西国有高峰林场,林场占地随高峰岭走势,从东北覆盖至西南,共有13个分场,经营面积130多万亩,研究主要区域为高峰林场核心区域的界牌分场与东升分场,占地面积为50km2,主要地形为低山与丘陵,主要树种为桉树(Eucalyptusrobusta),杉木(Cunninghamialanceolata),以及少量阔叶树种。
根据林场提供的历史调查数据,参考林分林龄,森林类型,树种分布等,结合研究目的,采用分层随机抽样方法,在研究区内布设84块桉树样地,53块杉木样地,64块其它树种样地(主要是作为防火林带经营的阔叶树种),样地分布如图1所示。
图1 样地分布图
样地调查时间为2018年1月。样地大小为:20m×20m,25m×25m,30m×30m,25m×50m。调查时,样地内开展每木检尺,并使用激光测高仪测量树高,计算出样地的林分平均高作为真值。同时,每块样地的中心点采用实时动态差分技术(Real-time kinematic,RTK)进行定位。
研究采用有人机搭载Riegl LMS-Q680i LiDAR传感器获取数据。飞行高度600m,速度65m/s,光束发散角0.5mrad,光斑直径约0.3m,返回波形记录的时间采样间隔1ns(约15cm),脉冲发射频率200kHz,扫描频率80Hz,最大扫描角60°。数据获取时间为2018年3月。对得到的点云进行噪声去除等预处理工作后,得到校正后的点云数据,点云密度为8.7pts/m2。
采用布料模拟算法得到地面点云以及地物点云[21],进行TIN三角网构建得到数字高程模型DEM和数字表面模型DSM,通过DSM-DEM的差值计算得到冠层高度模型CHM,之后通过重采样得到1m分辨率的CHM。
CHM是提取林分垂直参数的重要因子,但是CHM上的高度畸变与突变的凹坑对林分平均高的提取有较大的影响[22]。为了解决这一问题,论文提出了一种结合自适应阈值与峰值探测的方法。
自适应阈值法首先需要设定一个自增长的阈值进行低值去除,并结合留一交叉验证来确定最佳阈值;峰值探测法则是先对CHM数据的样地区域进行向量化,再对向量进行峰值点提取。当样地中所有的CHM值都低于阈值或者无峰值时,该样点林分平均高设为阈值或是最高值。
CHM中地面点的高度值会对林分平均高的提取精度造成较大影响,故需对过低的高度值进行剔除,而本文提出的自适应阈值法则是先设定一个初始剔除高度h1,小于h1的高度值都被认定为过低点,对于剩余的高度值取平均值得到样地林分平均高H1。对所有样地都进行阈值剔除并以得到的结果与真实值进行留一交叉验证,得到模型的均方根误差RMSE。再对阈值高度h进行等距增加,迭代计算每一次的RMSE,在设定好阈值自增长迭代次数i后,取所有RMSE中最小值时的剔除高度hk作为最佳阈值提取林分平均高。如图2所示,正方形代表样地CHM,不同的颜色分别代表大于或小于高度阈值hi的CHM值,对样地进行迭代剔除低值点后,进行林分平均高的提取。
图2 自适应阈值法示意图
峰值法则是对样地区域的CHM按照东西向或南北向进行向量化,对高度值进行峰值判定,当某个点的高度值皆高于周围高度值时,认定此点为树冠顶点,保留此高度值。样地林分平均高则为所有峰值点的平均值。
采用6种方法进行精度分析:(a)中心点提取法[23]、(b)均值提取法[24]、(c)自适应阈值法[25]、(d)峰值探测法[26]、(e)阈值_峰值法(先进行自适应阈值去除后进行峰值探测)、(f)峰值_阈值法(先进行峰值探测后进行自适应阈值)。为评价不同方法的精度,对样地林分平均高提取值与实测值进行精度评价,采用的评价指标为决定系数R2,均方根误差RMSE(m)、相对均方根误差rRMSE(%)[27]。
以1m分辨率CHM为基础,采用不同方法提取林分平均高,分树种计算林分平均高提取精度评价表,残差分布图,残差绝对值显著性检验,最后生成了研究区林分平均高反演图。
对1m分辨率的CHM分别进行6种方法的林分平均高提取,得到提取值与实测值,结果如表1所示。
表1 各样本精度评价
由表1可知,以1m分辨率CHM为基础,不同林分平均高提取方法在不同树种中的精度评价差异较大。就提取方法而言,总样本中心点法精度最低(R2=0.48,RMSE=4.47m,rRMSE=31.72),其余5种方法精度较高(R2=0.70~0.75,RMSE=2.44~3.80m,rRMSE=17.32~26.96);桉树样本中心点法精度最低(R2=0.50,RMSE=5.19m,rRMSE=33.71),其余5种方法精度较高(R2=0.71~0.78,RMSE=2.83~4.15m,rRMSE=18.39~26.92);杉木样本在结合自适应阈值的3种方法精度(R2=0.70~0.79,RMSE=1.50~2.04m,rRMSE=10.98~14.92)优于中心点法、均值法与峰值法(R2=0.29~0.48,RMSE=1.92~4.14m,rRMSE=14.05~30.27);其它树种除中心点法精度(R2=0.45,RMSE=4.45m,rRMSE=34.96)稍低,另5种方法精度(R2=0.72~0.75,RMSE=2.44~3.58m,rRMSE=19.15~28.15)都比较优秀。就树种之间而言,其它树种与桉树样本最佳,在5种方法中R2都在0.70以上;杉木样本次之,在结合自适应阈值的3种方法中,R2均在0.70以上。
对6种方法得到的林分平均高提取值与真值进行残差计算,结果如图3所示。其中横轴为胸径(cm),纵轴为残差(提取值-真值)。
图3 6种方法提取林分平均高残差图
由图3可知,就所有树种而言,中心点法最差,残差分布离散,但过低估计现象减缓,趋势性减缓;均值法的过低估计并未出现,且分布情况更为平均;单独进行阈值法与峰值法对分布情况有所改善,但峰值法出现了低值高估与高值低估;结合自适应阈值与峰值探测的两种方法表现依旧较优,绝大部分落在-3m~+5m区间内。就不同树种而言,其它树种样本表现依旧最佳,整体分布均匀;杉木样本分布依旧集中,仍存在趋势性;桉树样本表现有所提升,分布均匀。
对6种方法的残差绝对值进行显著性检验,得到显著性检验P值,结果如表2所示。
表2 残差绝对值显著性检验P值结果
由表2可知,结合了阈值和峰值的两种方法显著优于中心点法、均值法、阈值法、峰值法,且存在显著性差异(p<0.05)。
以CHM为基础,分别生成6种方法得出林分平均高反演结果图,结果如图4所示。中心点法与均值法对CHM反演结果都不理想,出现大面积的过低估计。阈值法和峰值法对于过低估计的情况有较大改善,但是对于林分平均高的差异情况,峰值法比阈值法的展现更加细致与合理,但两种方法都难以体现出整个区域的林分平均高差异。结合了自适应阈值与峰值探测的两种方法则在消除过低估计的基础上,进一步呈现了整个区域的林分平均高差异,林分的轮廓与边界展现得更为细致。随着自适应阈值及峰值方法的加入,反演效果有非常大的提升。原本反演结果趋同的区域,展现出了更多的林分平均高差异的细节,林分间的道路等高度差异较大的区域都能详细刻画。
图4 基于1m分辨率CHM产品研究区域林分平均高反演图
研究以广西省南宁市国有高峰林场人工林为研究对象,借助机载LiDAR数据,构建不同分辨率的CHM,结合地面实测数据,提出一种结合自适应阈值与峰值探测提取林分平均高的方法,并与其他方法进行比较;同时讨论了不同的CHM分辨率与树种对林分平均高提取精度的影响。研究结果表明:
1)不同树种的林分平均高提取精度存在差异。杉木提取的精度最高(杉木R2=0.79,RMSE=1.84m,rRMSE=13.46%),桉树与其它树种次之(桉树R2=0.78,RMSE=4.15m,rRMSE=26.92%;其它树种R2=0.75,RMSE=3.04m,rRMSE=23.91%)。
2)研究提出的结合自适应阈值与峰值方法较其他方法精度表现更为优秀,R2的平均水平均在0.7以上,RMSE在2m左右,rRMSE在20%以下,且经过显著性检验,具有显著性差异。此方法的稳健性相较于其他方法更好,对于不同树种都有较强的适应性。
3)阔叶树种与针叶树种对不同的方法有敏感性差异。桉树及其他树种等阔叶树在先进行自适应阈值再进行峰值提取的方法中取得了最优精度;杉木作为针叶树种则在先进行峰值提取后进行自适应阈值的方法中取得了最优精度。
研究借助LiDAR数据进行了林分平均高的提取方法与反演结果的比较。从提取精度与反演结果上能看出还存在问题需要解决:研究中同样作为阔叶树种的桉树与其它树种取得了相似的提取精度,但是桉树与其它树种的残差分布差异较大,需要做进一步的研究。