基于林业遥感的树种分类应用分析与展望

2020-08-08 01:49马鸿伟姚顺彬
林业资源管理 2020年3期
关键词:数据源树种光谱

马鸿伟,刘 海,姚顺彬,周 蔚

(国家林业和草原局华东调查规划设计院,杭州 340019)

林业承担着森林及湿地生态保护、生物多样性保护、荒漠化治理等国家重大任务,同时也肩负着保护资源环境以及维护生态安全的责任。森林是陆地生态系统中的重要组成部分,具有巨大的固碳功能,使得林业在维护生态平衡中起着决定性作用,并且在维护生态安全、应对气候变化中发挥着特殊作用[1]。遥感技术已被广泛应用于各个领域,而林业遥感技术作为其中一个不可或缺的组成部分,不仅可以获取林业资源管理的数据,更能进一步揭示林业经营管理的生态影响。伴随合成高光谱、热红外、激光雷达、孔径雷达等新兴高分辨率遥感设备和技术的快速发展,遥感在林业生物生态属性上的定量和定性测绘方面发展十分迅速,随着精细光谱分辨率及主动遥感的迅速发展、树种识别技术的不断改进,遥感能在更精细的尺度上识别森林的各项属性[2]。树种分类对于林业可持续管理、生物多样性研究和生态环境的保护都具有重要意义,而森林里的植物物种本身具有很高的多样性,使得大尺度范围的树种分类仍具有较大挑战。本文从遥感数据源、树种分类流程及方法对树种分类的研究进行分析了比较,提出应用于生产实践中面临的问题以及对前景的展望。

1 多源遥感在树种分类的应用

1.1 基于传统可见光 多光谱等高分遥感的树种分类

可见光是指电磁波谱中波长范围约在0.38~0.76μm间的部分,因人眼可以感知而得名,一般具有红绿蓝3个波段,是航空遥感和测绘研究中最基本也是最常用的工作波段。虽然可见光数据包含的光谱信息较少,但随着高分卫星,特别是国产高分民用卫星的发射,以及无人机行业的兴起,使得其获取更加方便、空间分辨率也更高[3],加上数据处理技术相对成熟,可见光成为最常见的林业遥感数据源。

多光谱数据则是通过多波段探测器对目标表面亮度等进行光谱信息获取,一般有几个到几十个波段,波长范围比可见光大,其获取成本相对高光谱、激光雷达等数据源较低一些,满足同时也可以满足高时效性的要求。

1.2 基于高光谱及中红外/热红外的树种分类

高光谱数据是目前林业遥感树种分类中应用最多的数据。通过对2000年以来有关应用遥感数据研究植物物种分类与识别的文章,进行统计分析,发现在120个研究案例中,超过1/3的研究都使用了高光谱数据[3]。高光谱遥感数据大多是指在电磁波谱的可见光/近红外(450~970nm)、短波红外波段(970~2 500 nm)范围内,获取的许多非常窄的连续光谱的影像数据,可包含几十到上百个光谱波段信息。这2个波段是研究植物分类的重要波长区域,利用这2个波段的光谱信息可用来计算各类植被指数,为更精确的树种分类提供了可能。常用的植被指数有归一化植被指数(NDVI)、光化学反射率指数(PRI)、优化的土壤调节植被指数(OSAVI)、归一化红外指数(NDII)、归一化水指数(NDWI)等。中红外和热红外作为机载或星载高光谱的补充波段,则可通过便携式的红外光谱仪进行地面补充调查获得。

这类数据通过对不同树种的物化特性、含水量、形态学等方面的巨大差异进行分类,在研究领域效果相对较好,但是成本相对较高。同时,光谱数据常见的“同物异谱”、“异物同谱”、受气象环境影响较大等问题,并不能得到完全的解决,大尺度范围的获取和应用,目前条件还不够成熟。

1.3 基于激光雷达 合成孔径雷达等主动对地遥感的树种分类

激光雷达(LiDAR)是一种发射激光束探测目标的位置、速度、形状等特征量的主动遥感系统,其数据星载、机载、地面设备均可获取,树木的信息由点云数据体现。通过对点云数据的处理,可以提取树高、冠幅等信息,地面激光雷达还可以获取枝干、枝叶的纹理特性。但由于其获取成本、数据处理周期相对较长及点云密度对研究结果的影响,在树种识别领域作为光谱识别的补充或者辅助较多,研究结果也相对较好。单一靠激光雷达数据进行树种分类,虽然也有一定的探索结果,但实用性还有待进一步研究。

合成孔径雷达(SAR)也是一种主动对地观测的遥感系统,数据大多通过搭载在卫星或飞机平台上进行获取,具有一定的地表穿透能力,受气象条件影响相对较小。获取物种信息时,主要途径是通过树木的冠层结构、含水量、表面水分对SAR信号产生影响,进而对树种进行分类。作为在树种识别领域新兴的数据源,相关研究还在逐步探索中,具有一定前景。

2 林业遥感树种分类的一般流程及主流算法

2.1 树种分类的一般流程

一般情况下,完整的树种分类流程如图1所示,包括数据获取、数据预处理、单木分割、特征提取、样本标注、执行分类、精度及稳定性检验这几个步骤。

图1 树种分类的一般流程

数据获取,一般包括了遥感数据的获取和林业调查数据两个部分。数据预处理,则根据数据源及处理方法的不同,常见的有校正配准、异常数据处理、无关项剔除等。单木分割则是树种分类的关键步骤,对后续分类结果有直接并且明显的影响,而单木分割的效果本身也受诸多因素的影响,因此难度也从易到难差距非常大。相对而言,地形简单树种单一的人工林,单木分割效果较好,而地形越复杂,树种越多样,自然生长情况越杂乱,单木分割面临的挑战越大,有效而又广泛适用的分割方法还有待于进一步探究。特征提取,是根据研究方法的不同,对数据进行相应特征的提取,有些还要经过特征融合或者加工以便分类的进行。样本标注是一个相对繁琐的过程,也有部分研究提出了半自动或者自动的树种识别方法,也就是机器学习中的半监督或者无监督学习方法,对所需标注的样本量进行了缩减。执行分类,作为树种分类的主要部分,根据相应的算法进行分类,主要分为基于像元和基于对象两类,而具体算法则在机器学习的介入后,层出不穷。精度及稳定性检验是分类结果的直接体现,通常采用交叉验证的方式,或者使用混淆矩阵,得到其各类精度、Kappa系数等指标,虽然不能直接评价方法的优劣,但是可以作为同种方法下不同算法的比较。

2.2 树种分类的主流算法及特点比较

2.2.1基于假设检验的树种分类算法

作为分类识别中的一支,树种分类算法的发展与数理统计领域是紧密相连的。因此,树种分类的主流算法从假设检验的角度来看可以分为无监督分类和监督分类(半自动分类,可以认为是对两者具有结合性或者融合性的使用)。

1) 无监督分类算法。在早期比较常见,如K-均值聚类算法、EM算法等,其优势在于不需要对数据进行先验假设处理,也不需要大量的训练数据集,甚至可以减少样本标注过程,但树种分类精度相对较为一般,因此使用相对越来越少。

2) 有监督分类算法。如KNN算法、最大似然估计算法等,其特点是数据要经过先验假设,并且根据不同的需求,要求不同数量的训练样本。

2.2.2基于参数估计的树种分类算法

作为数理统计的另外一个角度,参数估计上来看,树种分类又可以分为带参数的分类算法和非参数的分类算法。

1) 带参数的分类算法。如线性回归、感知机算法、Logistic回归算法等,因其快速并且所需数据量相对较少,也有不少的运用,但是欠拟合的情况会较为常见,并且稳定性也相应较差。

2) 非参数的分类算法。如决策树算法、SVM算法、随机森林算法、神经网络算法等,则随着时代的发展,逐渐在主流算法里扮演着中流砥柱的角色。其特点是可拟合性强、分类精度相对较高,但数据需求量也相应较大,耗时也会相应增长,容易出现过拟合,可解释性也较差。

值得注意的是,在同样的研究环境和方法上,对不同算法可以从精度、稳定性、耗时等方面进行衡量和比较,但在面向不同的研究对象、地点、数据源等差异下,不同算法是不具有直接可比性的。大多数树种分类的研究表明,在不同的条件下,往往数据本身,对算法效果的影响是更为直接的。

3 理论研究应用实践面临的问题及展望

3.1 语义分割与实例分割在树种分类上的应用

1) 虽然树种分类从研究对象的角度来说,已经遍布了从亚寒带到热带,并且参与树种分类的树种已经多达40多种,而且分类精度从一开始的55%提升到某些研究中的95%甚至更高,但不可忽视的是,分类精度越高的研究,往往局限性也越大,并且研究成本应用与实际生产应用成本上也具有巨大的差异,因此生产应用中切实有效可行的方法还相对较为缺乏。

2) 树种分类的理论是建立在图像分类识别的基础上的,因此在广泛的树种识别研究均无法满足我国现有的复杂环境,并且在羸弱的林业生产基础现状无法足够支撑理论研究转化实际下,或许可以追根溯源,转换角度去思考林业遥感在树种分类的应用,而不是仅仅着眼于研究层面的,算法上的改进和优化。

3) 受精细化分类浪潮的影响,现有树种分类方法大多建立在实例分割的基础上,即能分类出“树a是树种1,树b是树种2,树c是树种1,树d是树种3”,但实际上需要的树种分类满足“1树种的有a和c,2树种的有b,3树种的有d”即可,也就是语义分割的程度。相对而言,语义分割的工作量会比实例分割要小,而且从林业实际应用的角度来说,即便是语义分割也完全满足现有的管理和使用需求,因此或许这样的改变能解决一些现有方法从研究走向应用的瓶颈。

3.2 多源遥感数据的整合与硬件设备的发展

多源遥感数据在树种分类研究中的融合越来越常见[5],光谱信息在反映树木理化特性和水平层面上的优势,点云信息在反映垂直结构上的优势,相互融合,日趋成为树种分类发展的热门[6]。随着国产高分民用卫星的发射以及无人机行业的迅猛发展,数据的来源更加广泛。与此同时,在各类光谱仪器和雷达仪器的发展过程中,也在进行着融合[7],不仅满足不同分辨率或者密度的要求,更能快速直接地获取到整合到一起的信息,为后续的应用研究打下良好的基础。

猜你喜欢
数据源树种光谱
基于三维Saab变换的高光谱图像压缩方法
高光谱遥感成像技术的发展与展望
基于GC-MS流苏树种子挥发性成分分析
树种的志向
树种的志向
常绿树种在新疆的应用现状
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
星载近红外高光谱CO2遥感进展
基于真值发现的冲突数据源质量评价算法