刘玥伶,舒清态,黄金君
(西南林业大学 林学院,云南 昆明 650233)
森林是地球上最大的陆地系统,同时也是最主要的可再生资源,被称为“地球之肺”,是人类得以生存和发展的保障,为人类活动提供了丰富的物质资源,同时也是维持生态过程和全球生物圈中最重要的一环[1]。想要合理的利用和保护森林资源,需要对森林树种进行正确有效的识别[2]。传统的树种识别方法主要依靠人力资源在森林里展开野外调查,或是通过大比例尺的航片来进行分类。这些方式耗时耗力且效率不高。在过去的研究中,大多是采用分辨率较低的多光谱影像数据,可以提取利用的信息量十分有限,只能将森林类型简单的划分出来,并不能准确的提取出单木信息。对单棵的树木进行精细识别存在很多困难,不能满足实际生产应用的需求[3-5]。20世纪80年代兴起的高光谱遥感打破了光谱分辨率的局限性,与多光谱遥感数据相比能够区分出细微的光谱差距,很大程度上避免了“异物同谱”的现象。相较于多光谱遥感数据,高光谱遥感数据具有更强的森林树种识别的能力[6],为获得更准确的森林资源信息提供了强有力的手段。高光谱遥感数据所获取的光谱信息的波长范围在400~2 500 nm内,光谱分辨率一般优于10 nm,高光谱图像包含丰富的空间信息和光谱信息,每个像元可以记录下瞬时视场角内几十乃至上百个连续波段[7],这样的特质使得高光谱影像数据能够把不同物质的光谱特征有效区分出来[8]。
高光谱遥感数据波段多、分辨率高等特性使得高光谱数据越来越广泛运用于林业资源监测应用中,已成为主要获取应用的遥感信息之一。本文以高光谱技术为基点,简要介绍了高光谱在树种识别方面的研究与应用,从不同的研究应用方法上进行阐述,为高光谱遥感技术在森林树种调查上提供参考与借鉴。
目前较常使用的高光谱数据源可大致分为两类。一种是国内外公开的高光谱遥感卫星数据,另一种是由无人机搭载高光谱传感器在低空域小片区飞行所获取的影像数据。由卫星获得的高光谱影像数据更齐全,尺度更广,而无人机的特点则是更高效便捷,且受大气因素干扰的影响较小,在小区域调查中具有较好的应用前景。
许多国外数据库都有公开的遥感卫星数据供用户下载使用,诸如美国国家航空航天局(NASA)、欧洲航天局(ESA)等。NASA于2000年11月21日发射新千年计划的观测一号卫星[9](EO-1)是NASA的第一颗对地观测卫星。NASA在EO-1卫星上搭载了3种传感器,分别是高光谱成像仪Hyperion、高级陆地成像仪ALI以及大气校正仪LEISA,Hyperion则是全球第1台民用星载高光谱图谱测量仪。欧洲太空局发射的Proda卫星主载荷CHRIS仪器(PROBA-1)是ESA“通用支持技术计划(GSTP)”的技术演示卫星,于2001年10月22日发射。部分典型的星载高光谱载荷参数可见表1。
表1 部分典型的星载高光谱载荷参数Tab.1 Partly typical spaceborne hyperspectral sensors
中国自2008年发射了国内首颗高光谱成像仪卫星HJ-1A卫星,由中国发射的搭载高光谱传感器的卫星观地系统也得到了长足的发展,其中高分系列卫星自2013年起陆续发射,目前已有高分一号至高分五号5颗卫星。高分五号(GF-5)卫星是中国高分辨率对地观测计划中的第五颗卫星,于2018年5月9日发射,该卫星搭载了一台先进高光谱成像仪(AHSI)载荷,是目前国际上最先进的高光谱卫星,同时也是中国光谱分辨率最高的卫星,包括150个V-NIR波段(光谱分辨率为5 nm)与180个SWIR波段(光谱分辨率为10 nm),一共有330个波段,可见光近红外150个波段,中红外180个波段[10]。资源一号02D卫星于2019年9月12日发射,其高光谱传感器也是AHSI,共166个波段,其中V-NIR波段76个,SWIR波段90个。中国的高光谱遥感卫星相关参数见表2。
表2 中国高光谱遥感卫星参数Tab.2 Hyperspectral remote sensing satellite parameters in China
机载高光谱是高光谱最早的应用领域,机载高光谱成像仪的应用实践更是为航天高光谱成像仪的研制工作奠定了基础。近年来,随着无人机的发展,基于无人机的高光谱成像载荷也得到快速发展,出现了一系列无人机载高光谱成像仪,这些成像设备一般可应用于地面试验研究。目前无人机载高光谱成像设备的成像方式主要被分为内置推扫式、推扫式、凝视式等,主要机载高光谱成像仪介绍见表3。
表3 主要无人机载高光谱成像仪介绍Tab.3 Main drone high-spectral imagery introduction
高光谱遥感数据进行森林树种精细分类主要表现在基于光谱匹配分类算法、基于光谱特征和基于统计分析方法的这3种方法[11]。本研究从当前应用最广的3个方向对高光谱遥感森林树种精细识别进行分析,即早期传统分类方法、多源遥感数据协同方法和基于深度学习方法。
早期的高光谱影像树种精细识别主要基于影像的光谱信息,像元级分类主要关注特征工程和分类器训练。其中特征工程方法包括特征选择和特征提取,其目的是对高光谱数据进行降维,从中提取最具辨别力的波段或特征,将特征输入到分类器中实现分类。最常用的分类器有随机森林、支持向量机(SVM)、最近邻值(KNN)法、神经网络等。分类后得到的图像能够较为准确的反映出各种真实地物的信息,实现了自动化、智能化识别地物信息的目的。
宫鹏等[12]利用实测高光谱数据识别6种美国加州主要针叶树种,在计算一阶微分值前先对简单处理过的数据进行对数变换或归一化处理,其分类精度达94%,且得出针叶树种最佳识别波段为20 nm或以下;肖海燕等[13]在地面调查基础上,结合决策树和高光谱分析方法提取了红树林群落信息;于丽柯等[14]基于线性波谱分离方法和波谱角填图法对大兴安岭塔河林区进行树种分类,线性波谱分离方法的总体精度为72.0%,优于波谱角填图法。
为提高树种识别与分类精度,光谱信息结合空间信息、波段组合信息等共同参与树种识别的相关研究取得了一系列进展。陈尔学等[15]以EO-1 Hyperion高光谱遥感数据为基础,采用结合空间上下文信息和光谱信息的分类算法,有效提高了树种识别的精度;苗宇宏等[16]综合了降维后的光谱特征、提取的空间纹理特征以及植被指数特征,构建了高光谱影像多维特征,并通过SVM分类器进行分类,精度可达99.6%;尚坤等[17]结合原始光谱特征、纹理特征及对植被理化参量敏感的光谱指数特征,构建植被特征库并进行优化,提高了植物类别间的可分性和分类效率;赵鹏等[18]对高光谱图像光谱维和空间维的特征数据进行融合后,使用SVM复合核函数对树种进行分类,有效提高了树种的分类精度。李哲[19]等以高分二号影像为数据源,将不同特征选择(多时相)和分类器进行组合,得出良好的特征优选结果对分类结果的影像较大,支持向量机分类器的整体表现更为稳定比平均森林平均高出1.37%。
在识别算法中,运用较广且识别精度较高的是支持向量机和随机森林算法,随着计算机分类算法的研究深入,目前基于模型驱动识别算法因参数精度的限制精度渐渐达到天花板,难以突破[20],深度学习算法和多分类器融合算法成为研究热点。深度学习(Deep Learning)来源于人工神经网络,其实质是通过构建多层网络模型和海量的训练数据,来学习更有用的特征,从而提升分类或预测的准确性。目前,卷积神经网络(Convolutional Neural Networks,CNN)是最具代表的深度学习算法之一,它的基本结构主要由输入层、卷积层、池化层、全连接层以及输出层所构成。它的网络为权值共享结构,与输入图像的契合度高,可以更好的完成图像特征的提取和分类工作[21]。基于深度学习的数据驱动型识别算法可以基于大量数据自行挖掘隐含特征进行分类反演,成为推动遥感图像识别进一步发展的契机[22]。CNN算法的权值共享和局部连接特征能够很好的挖掘高光谱数据丰富的空间和光谱信息,在高光谱影像识别领域取得一定成就。Hu等首次将卷积神经网络应用于高光谱数据分类,但仅利用光谱信息进行分类[23];闫苗等构建3类样本集对不同CNN模型高光谱数据分类的可行性进行探究,证明 CNN 模型高光谱数据识别具有较高的准确率和可行性[24];刘玉珍等提出结合超图和卷积神经网络的分类算法,构建空谱特征样本进行卷积神经网络分类,证明空谱联合信息能够更好的表征地物特征,提高分类精度[25]。大量研究联合高光谱数据空间和光谱信息能够有效提高影像分类精度。
大量训练样本的获取成为制约深度学习方法在遥感影像分类中应用的关键问题之一,如何使用有限的样本训练出高效的模型也是目前研究关注的热点。相较于CNN模型而言,Chen等提出能够同时提取空间和光谱信特征的3D-CNN模型,并利用dropout和正则化等优化策略提高模型泛化能力,有效的提高了高光谱分类精度[26];李竺强等[27]利用三维卷积神经网络模型(3D-CNN)对公共高光谱数据集的测试结果表明,3D-CNN算法不仅可以实现高光谱影像的光谱—空间特征提取,并且它的泛化能力强、收敛速度快,总体精度可达98%,优于其他高光谱影像分类算法。赵霖等[28]基于3D-CNN得出的森林树种总体分类精度达98.38%,且小样本训练情况下,总体精度仍可达95.89%。
多源数据协同是利用不同传感器数据之间信息的互补性,以此得到相关对象更全面的数据。多源数据融合成为主流,其中使用最多的是机载高光谱数据与激光雷达数据融合。
光学数据只能探测到冠层表面信息而云层的覆盖又会影响到高光谱数据的采集,限制了树种识别的精度,而机载LiDAR能够获取单株木三维结构特征,这对于森林类型识别、森林结构特性以及冠层理化特征提取均具有明显优势[29]。因此高光谱数据协同LiDAR数据在树种识别领域也有了较为广泛的运用。
LiDAR数据分点云数据和全波形数据,其中点云数据应用广泛。通常使用Tarroslid等工具对原始点云数据进行滤波,获得地面点和非地面点,由地面点可以内插生成数字高程模型(Digital Elevation Model,DEM),由非地面点可以生成数字表面模型(Digital Surface Model,DSM)。从数字表面模型中减去数字高程模型即可得到冠层高度模型(Canopy Height Model,CHM)[30]。CHM表达了林木高度和冠层的空间分布状态。树高是反映材积和立地质量的重要参数,因此获得森林单木的垂直信息对单木提取具有重要意义[31],全波形数据则主要通过采用波形分解来获得直接、高效的获取森林植被三维结构信息。
由于LiDAR数据可获得森林空间冠层空间结构,在表达三维空间结果上的优势,使得近年来研究者们对于LiDAR数据的研究应用更加深入。Hollaus等[32]研究使用LiDAR数据提取奥地利阿尔卑斯山西部地区的树高,得出的单树高度和平均高度的验证显示出良好的相关性。庞勇等[31]在利用LiDAR数据进行提取中国山东地区平均树高的试验,其总体平均精度为90.59 %,其中阔叶树精度高于针叶树。Mitchell等[33]使用LiDAR数据估测灌木丛的冠层参数,并比较了树高和冠幅的相关性,发现树高的估测结果优于冠幅,但密度较高的区域所得结果并不理想。赵旦[34]利用高密度LiDAR点云数据和高分辨率高光谱数据,通过优化后的CHM可提取森林树种的单木参数,其中优势树种的识别率大于90%。Matsuki等[35]在对日本的森林进行分类时,通过结合光谱信息和LiDAR数据的冠层结构特征,对 16 种森林树种的分类精度达82%。Sankey等[36]在无人机上同时搭载激光雷达和高光谱相机,将两种数据结合在一起用于识别分类多种树种,取得良好效果。证明了激光雷达数据和高分辨率图像结合的方法用于树种组成识别、分类比单一传感器数据更有效果。吴艳双[37]等利用机载高光谱影像和LiDAR数据进行面向对象的树种分类,结果表明加入CHM信息后,提升了树种分类精度,两种数据源的结合是有效的。
机载激光雷达只能得到森林垂直空间结构信息,在水平方向上及冠层层面的信息不够全面。而高光谱影像数据则能够提供充足的光谱信息,但影像数据的获取比较困难。因此LiDAR数据和高光谱影像数据的结合能够实现多源优势互补,在树种识别的领域发挥出巨大优势。
高光谱遥感以其自身特有的优势,已经广泛地应用于森林树种识别,其识别分类效果比常规遥感有了显著的提高。每个新兴的研究领域都存在诸多有待完善的方面,从上述对高光谱遥感在树种识别领域的应用中不难发现,可获得的数据信息在载荷仪器性能的发展下已经能满足矿产调查、环境监测和农林估产等需求。如何在不同应用场景下选择最佳的识别方法以及分析算法的优化,无疑将是今后研究中的重点。
利用机器学习的方法进行树种分类都少不了数据降维这一步,但高光谱影像中包含大量连续的窄波段,对高光谱影像进行降维处理后反而不能发挥其优势。其次,机器学习在目前算法及分类精度上已经达到天花板,很难再从其它角度进行优化。通过对不同特征优选方法和分类器组合进行比较可以选择应用前景和分类精度更高的分类器,可所得到的结果也只是一个相对概念,其会随着使用目的及客观条件的变化而发生改变,故在生产实践中还需根据自身的需求和条件确定最优组合。总体来说传统的机器学习方法运用的时间较长且有较丰富的文献研究记载,但并不能完全发挥出高光谱影像的优势,因此在今后的高光谱影像分类应用上的发展前景不佳。
星载高光谱数据受空间分辨率的限制,很难满足森林树种精细研究的应用要求,再加上星载高光谱数据还需要编程订购,时间周期长,数据量大,遥感作业效率较低,也在一定程度上限制了它的应用。
与传统的分类框架相比,基于深度学习的数据驱动型识别算法由于可以基于大量数据自行挖掘隐含特征进行分类反演而无需人为进行特征选取。这在遥感图像识别领域具有优势,但同时在实际应用中也存在一些问题。首先,深度学习方法所需的训练样本大且对标注数据的质量要求高,使得在实际应用中受到限制,同时大量的参数在训练过程中可能会带来模型过拟合问题,造成模型泛化能力不足。其次,在提取空谱联合特征上需要考虑到空间邻域大小,网络的规模,结构及复杂程度,输入数据空间大小对模型分类能力具有较大影响:适当增加输入数据空间大小有助于提高分类精度,过大的区域则可能产生额外噪声。尤其当像元位于一个类别的角落或边缘时,会导致精度下降,至今在方法的选择上相关记载文献不足。随着高光谱研究的深入,结合高光谱数据特点研究基于深度学习的识别算法将是未来高光谱识别的重点,需要更加深入的研究。
本文回顾了高光谱技术在树种识别领域的研究进展,高光谱技术在树种识别上已取得了许多创新性成果但目前仍处于发展与提升阶段。随着高光谱遥感技术的进步,无论是利用多源遥感数据源协同还是通过优化模型算法挖掘其光谱空间信息,都是未来提高森林树种识别精度的主要研究方向。降低高光谱数据获取、处理、信息提取与应用方面的门槛仍是高光谱技术亟待解决的科学问题。相信在未来的研究应用中,高光谱遥感技术会在森林资源勘测中有更长远的发展。
多源数据结合在树种识别方面与单一数据源相比具有一定的优势,特别是在国产遥感卫星不断发展的现在,进行多源遥感数据协同的应用具有十分重要的意义。现利用多源遥感数据进行空间信息和光谱信息联合已经有较多的研究内容,未来研究的重点将放在如何得出在不同的应用场景下的最佳协同方法和组合方式且发挥不同数据源的优势,是研究者们亟待解决的问题。
随着人工智能技术的发展,人们对于树种进行识别和分类的需求越来越高,深度学习的方法可以进一步提高树种识别的精度,但在实际操作中获取大量已标记的遥感图像数据十分困难。无人机搭载高光谱传感器可以高效获取小片区的遥感图像,经过优化和参数设置的卷积神经网络模型可以在小数据量的条件下对遥感图像进行识别和分类。无人机遥感影像结合深度学习进行小片区树种精细识别是今后的研究应用热点,同时如何减少其在大场景应用下的局限性,使其在更大尺度下开展森林健康监测且减少模型训练的时间是研究的重要方向。