魏智海张乐艺李霞
(1.国家林草局西北规划设计院,陕西 西安 710048;2.长安大学地球科学与资源学院,陕西 西安 710064;3.长安大学土地工程学院,陕西 西安 710064)
森林地上生物量(以下简称生物量)指除地下树根外,所有地上树干、枝、叶去除水分后的总重量,是表征森林固碳能力的重要指标,也是研究区域森林碳平衡、了解气候系统演变的重要参数[1,2]。开展生物量的准确估算和评估,在森林生态系统、全球气候变化及碳循环研究中具有重要意义[2,3]。
生物量的研究方法包括传统测量方法和遥感监测。1876年,Ebermeryer就开始对生物量进行研究。20世纪50年代以后,各国学者开始逐步进行生物量估算的研究,最初采用的是实地调查的传统方式,主要以样地实测为主,统计分析为辅。传统方法得到的树高、胸径和冠幅等森林参数,可以用于建立及验证估算模型,精度高,但是传统方法调查破坏性强、历时长、工作量大、人力物力投入大、误差干扰因素多,仅适用于小范围区域,难以满足森林资源开发利用和监测的要求。20世纪末,逐渐发展成熟的遥感技术有效弥补了传统野外调查方法的不足,以无破坏性、快速、覆盖广、易获取的特点,为大范围高精度多时相估算生物量提供了大量的影像资源和有效的技术手段,得到了广泛应用[4,5]。
随着遥感大数据时代的到来,以卫星、航天飞机及无人机等平台搭载的光学、合成孔径雷达(Synthetic Aperture Radar,SAR)和激光雷达(LiDAR)3类传感器获取的不同分辨率和波段的数据,为生物量的估算研究提供了有力的数据支撑。本文总结了光学数据、SAR数据、LiDAR数据以及多传感器数据估算生物量研究现状,讨论了尺度问题、植被自身复杂性及模型精度与适用性等问题,从发展机理模型、林地分类、林业大数据与多源数据协同等角度对生物量估算进行展望。
在可见光至近红外波段,植物的反射光谱曲线具有显著的特征,但是不同类型植物之间反射光谱存在一定的差异,即使同一种植物,也会由于其生长状态的不同而发生变化,这一光谱特征可以用来监测其生长状况和估算生物量[6]。目前在生物量估算研究中的光学数据主要为多光谱和高光谱2类。
1.1.1 多光谱遥感估算生物量
Landsat、GF系列、Worldview、Quickbird、IKONOS等多光谱数据已被广泛应用于生物量估算研究中,在各种估算方法中最常用的是统计回归的方法,即基于波谱特征因子(植被指数、波段和波段组合)、地形特征因子、纹理特征因子及主成分变换、缨帽变换等得到的参数,使用多元逐步回归、偏最小二乘法、多元线性回归等参数化方法[7-9]和随机森林(RF)、支持向量机(SVM)、BP神经网络、K最近邻(KNN)、人工神经网络(ANN)等非参数化方法[9,10],建立与实测生物量间的模型。Zhang[11]等采用SVM、BP神经网络、KNN和RF 4种回归算法,对提取的Landsat-7的波谱参数进行生物量估算,研究结果显示,BP神经网络和SVM在生物量估算模型R2均高于0.9。黄金龙等[12]基于e-Cognition面向对象分类方法,使用光谱和空间信息融合后的IKONOS影像提取单木树冠阳性冠幅(PoCA)信息建立针叶林和阔叶林生物量估算模型R2分别为0.62和0.56。
在森林郁闭度和蓄积量较高的区域,遥感数据会出现过饱和的情况,导致仅利用波谱因子估算生物量降低。有研究得出,结合灰度差分矢量(Gray Level Difference Vector,GLDV)、差直方图(Sum and Difference Histogram,SADH)及灰度共生矩阵(Gray Level Co-occuremce Matrix,GLCM)等方法提取的影像纹理特征可以在一定程度上避免同物异谱和异物同谱的影响,对提高生物量估算模型的估测精度有一定的贡献[8,9,13,14]。
1.1.2 高光谱遥感估算生物量
多光谱缺乏足够的光谱信息,而高光谱数据可以获得多种不同时间和空间尺度的生物物理和化学特征、精细的光谱分辨率带和丰富的光谱信息,其提取的窄带植被指数可以减少大气和水分吸收以及宽带植被指数饱和的影响。Luo[15]和申鑫[16]利用机载高光谱数据提取的波谱因子分别采用偏最小二乘法回归法和多元逐步回归法估算生物量,取得较好的成果。但高光谱数据光谱特征易受森林覆盖度影响,空间分辨率相对低,难以获得森林内部细节信息,而且地形细碎区域不同组分形成的混合光谱分解模型与端元提取有待深入研究。另外,相对于多光谱数据,其空间分布有限,并且由于波段数的增加,数据产生冗余,增大降维和去噪的工作量。
综上,光学遥感数据种类较多,且最早被用于估算生物量,在生物量估算中应用较为广泛,但光学传感器易受天气影响,主要获取光谱信息,仅用于提供森林水平分布的详细信息,很难提供垂直分布的信息,且受森林密度影响而导致饱和性,故在应用中存在一定的局限性。
SAR能与树叶、树干和树冠发生作用,成像受云雨影响小,可快速获取大区域、全覆盖的影像,对生物量敏感,在生物量估算方面具有很大潜力。当前,SAR估算生物量的技术主要是后向散射系数、干涉SAR(InSAR)、极化干涉SAR(Pol InSAR)、层析SAR(TomoSAR)等。
1.2.1 后向散射系数估算生物量
利用后向散射信息(纹理和极化分解特征)可以对地表参数进行反演,进而通过地表参数来估算生物量[17]。后向散射强度与生物量呈正相关,但当达到一定生物量水平时,后向散射会出现饱和的问题,该水平的生物量称为饱和点,而且饱和点随波长增加而上升[18]。已有研究表明,不同波段的后向散射系数对生物量的敏感性是不同的,后向散射系数对生物量的敏感性随着波长的增加而增加,长波段雷达后向散射与生物量相关性较显著,一般认为L波段最适合估算生物量[3,18]。而同一波段的不同极化方式对生物量的敏感性也不同,HV极化对生物量最为敏感,VV极化敏感性较差[19]。
在后向散射系数估算生物量的研究中,主要利用不同传感器、不同波段和不同极化方式的后向散射系数与森林地上生物量间的模型估算生物量,包括不同极化方式的后向散射系数、局部空间后向散射强度反映的纹理信息和利用极化分解的特征参数3个方面[20]。除常用的经验模型外,还包括密歇根微波散射模型[21]和三维森林雷达后向散射模型[22]等机理模型。机理模型能够充分考虑森林的不同散射机理,关联具有物理意义的森林参数,但由于其原理复杂且参数多而难以定标,目前很少有直接将机理模型用于生物量的估算研究。此外,还有介于经验模型与机理模型间的半机理模型,主要是水云模型及衍生的半机理模型,该类模型具有一定的物理意义,需要对模型的参数进行训练。已有研究虽然在估算方法上并未有所创新,但在提高精度方面进行了尝试,研究发现,SAR的多波段联合[23]、多时相数据结合[24]均可以提高估算精度。
后向散射系数估算生物量面的局限性主要集中在饱和性问题,而且后向散射系数影响因素较多,与波长、雷达入射角、林木结构、水分及地形有关[3],其中复杂地形因素更易引起估算误差,消除多因素对后向散射系数的影响是该类研究的热点和难点。
1.2.2 InSAR/Pol InSAR估算生物量
InSAR包括相干强度信息以及丰富的地物信息的干涉相位信息。Pol InSAR兼具InSAR地表森林散射体的空间分布和极化SAR森林散射体形状和方向敏感的特性,还具有从数据中分解得到不同散射机制的特征分量的能力[4]。故很多学者将InSAR和Pol InSAR引入到生物量估测的研究中,主要有2种类型。
1.2.2.1 基于相干强度信息估算
一般直接建立相干强度信息与生物量间的统计模型和半机理模型。统计模型即基于地面样地数据建立干涉相干性与生物量之间的参数化回归模型和非参数化的机器学习模型。半机理模型以Askne等[25]在水云模型的基础上提出的干涉水云模型最常见,但该模型需要训练多个参数来确定未知参数。Cartus[20]用自动训练干涉水云模型结合BIOMASAR算法,基于ALOS PALSAR双极化数据反演了美国北部地上生物量。然而基于相干强度信息的估算也存在饱和的情况,相干强度与生物量之间的关系受气候和成像环境影响,导致精度变低。
1.2.2.2 基于干涉相位估算
一般先估算与生物量有关的森林树高等间接参数,然后通过与生物量间的异速生长方程得到生物量[26,27]。通过高度和生长方程估算生物量时未考虑林分密度、林层垂直分布等空间结构的因素,也存在饱和现象,从而导致估算精度降低。对此,有学者采用极化相干层析(PCT)技术提取林分层析测量高或相对反射率等,构建特征参数与实测生物量的模型,可提高估算精度[28]。基于干涉相位的方法较相干强度估算而言更稳健,不容易达到饱和点。然而生物量的大小除了与树高有关,还与胸径、林分密度等有关,目前森林高度和生物量的异速生长关系的模型相对较少,导致利用树高估算生物量的研究较少。
1.2.3 TomoSAR估算生物量
森林垂直结构直接影响生物量,利用层析技术获取后向散射垂直分布信息,挖掘与生物量相关的特征,建立生物量估算模型。TomoSAR是利用不同冠层高度的散射强度来得到森林垂直结构参数[29]。而森林垂直结构的参数需要在层析剖面中得到,层析剖面一般通过单基线的极化干涉层析法[30]和多基线的谱分析法[29]2种方法获得。在提取森林参数的研究中主要有2种方法:提取层析剖面得到几何参数建立估算模型;提取层析剖面上的相对反射率特征,分析反射率特征与森林参数间的关系进而建立估算模型。目前基于TomoSAR的生物量估算研究较少,在该类研究中,散射机制的分离与地面散射机制的消除是一个难点,目前已有的方法尚未充分利用TomoSAR获取的三维剖面信息。
总体来看,SAR在大区域快速获取数据和生物量估算中具有优势。但SAR数据处理较为复杂,受地形影响较大,后向散射系数估算存在饱和性,而InSAR/Pol InSAR和TomoSAR对数据要求较高,在Pol InSAR和TomoSAR技术应用研究方面,目前依赖国外共享的机载试验数据,数据处理与参数不清晰,SAR相关的技术和方法大多仍处在研究阶段,较少进行大范围的应用和推广。
LiDAR能准确获取森林的垂直结构信息,在森林参数反演及生物量估算领域具有很好的应用前景。LiDAR估算生物量的方法可分为,建立利用LiDAR数据获取的点云高度、密度、分布、强度与生物量的模型[31];利用点云或波形信息获取森林结构参数,建立森林参数与生物量之间的模型估算生物量[32]。当前在估算生物量研究中的LiDAR数据根据激光脉冲的孔径大小可分为大光斑和小光斑2类。
1.3.1 小光斑LiDAR估算生物量
小光斑LiDAR数据估算森林地上生物量的尺度可分单木和样方2个水平。小光斑LiDAR数据估算单木生物量的研究较少,主要通过建立单木结构参数与实测生物量的相关关系来实现。树高、冠幅等单木结构参数可通过冠层高度模型(Canopy Height Model,CHM)、原始点云中分割识别单木和将点云投影到体元空间识别单木特征来获取[33]。其中,单木识别主要是从图像分割和滤波2方面得到局部最大值,进而确定树冠顶部的高度及位置,其关键是确定图像分割尺度和滤波窗口大小[32]。而单木冠幅的识别方法包括从多尺度分割中提取树冠多边形和根据树冠顶部与其周边像元值变化的规律来确定冠幅[32,34,35]。更多的是着眼于样方尺度的估算,主要通过单木集成和林分回归来实现。单木集成法是将区域内基于LiDAR点云估算得到的各单木生物量相加获得森林样方生物量[32]。林分回归法是建立区域内激光脉冲统计量和实测样方尺度的冠层结构参数的回归模型来估算样方或较大区域的生物量[31,36]。
1.3.2 大光斑LiDAR估算生物量
1.3.2.1 机载LiDAR估算研究
目前用于估算生物量的机载大光斑LiDAR系统主要有植被冠层激光雷达回波扫描成像仪SLICER(Scanning LiDAR imager of Canopies by Echo Recovery)、激光植被成像传感器LVIS(Laser Vegetation Imaging Sensor)、无人机LiDAR系统、Riegl、Optech等公司的商用机载LiDAR及多测高波束试验激光雷达(Multiple Altimeter Beam Experimental LiDAR,MABEL)[33]。其中,基于SLICER数据估算生物量的研究中,主要利用冠层材积、平均冠层高度及其二次方根等波形指标;而基于LVIS数据估算生物量的研究中,主要利用相对于地面峰值的波形半能量高、波形分位数、平均及最小冠层高等指标。
1.3.2.2 星载LiDAR估算研究
波形LiDAR系统ICESat/GLAS(Ice,Cloud and land Elevation Satellite/Geoscience Laser Altimeter System)发射能量高、持续时间长,通常能够穿透冠层,较好地反映森林垂直结构及其分布信息。目前基于GLAS数据的生物量估算方法可分为,基于波形特征参数估算生物量,Boudreau等[37]基于GLAS波形数据提取波形长度、起波点与第一高斯分量峰值之间的角度及从SRTM数据中提取的地形指数建立了森林地上生物量模型(R2=0.59);基于森林冠层高度估算生物量,邢艳秋等[38]以此为研究对象,将GLAS波形长度和地形指数建立了长白山林区最大高度模型,发现在0°~5°坡度范围内,R2达0.9,但随坡度增大,R2逐渐下降。地形坡度会降低GLAS估算冠层高度的精度,进而影响生物量的估算精度。
光子计数LiDAR系统ICESat-2/ATLAS(Ice,Cloud and land Elevation Satellite/Advanced Topographic Laser Altimeter System)采用光子计数技术,其发射的信号时间短、能量低、频率高,能够记录所有返回光子的坐标信息,数据密度高、直径小,能够准确记录探测目标的垂向信息,可降低地形对提取森林冠层参数的影响,但由于信号弱,易受噪声影响,导致提取冠层较困难[39],故ICESat-2/ATLAS光子点云数据的去噪、分类处理以及提取、选择最优的光子点云特征参数在森林冠层参数提取和生物量估算模型建立过程中较为关键。虽然光子计数技术已相对成熟,但在对地观测领域才刚进入实际应用阶段,光子点云去噪和分类等数据处理算法还不完善,故基于ICESat-2的生物量估算研究还不多。
GEDI(Global Ecosystem Dynamics Investigation)使用多波束激光雷达仪器测量垂直高度和树叶剖面等森林结构,用于获取地上生物量和亚冠表面高程,其采样模式(8条样带,跨轨间距约600m)足以提供准确的数据。目前基于GEDI的生物量估算研究较少,Qi等[40]通过模拟DEDI轨迹来提取GEDI相对湿度指标,使用生物量激光雷达校准模型估计新罕布什尔州白山国家生物量,研究发现,温带混交林、针叶林、热带雨林的生物量估算精度分别为0.59、0.52、0.37,与机载LiDAR估算的生物量之间的拟合精度分别为0.9、0.58、0.75。
综上,与光学遥感和SAR相比,LiDAR的优势在于不仅能够获取森林的垂直结构信息,而且还克服了信号饱和的局限性,在应用中也存在一些不足:小光斑LiDAR数据获取易受天气影响,成本较高,具体模型方法受研究区域限制;在样方尺度估算研究中,林分回归法需要采集大量的野外数据,花费人力时间,而单木集成法精度与点云滤波、单木分割准确率及单木识别的准确率有关,不确定性较大;大光斑LiDAR数据光斑内信息丰富,且能提供完整的波形数据,处理相对简单,但在空间上采样不连续,无法达到无缝覆盖,影响波形数据准确度的因子较多,波形受林下地形和树木空间结构影响较大;缺乏历史数据,基于LiDAR的生物量的多时相动态监测难以实施。
LiDAR数据一般只有三维垂直信息,缺少光谱信息,与光学遥感数据提供的水平结构光谱信息,两者结合可以提高树种识别能力,往往可以提高估算精度。该原理是通过建立统计模型或者物理模型反映波谱信息与波形、点云特征之间的关系,来进行生物量的估算,并利用光学数据扩展LiDAR的估算区域,实现空间连续。Clark等[41]将机载小光斑LiDAR数据和高光谱数据联合,建立热带雨林森林地上生物量估测模型,模型的R2为0.9。Chen等[42]结合LiDAR与Quickbird影像,利用支持向量回归方法进行森林高度、生物量和蓄积量估算,精度(R2=0.76)远远高于传统多元线性回归。Nancy等[43]分别建立Landsat OL数据、TM数据、ICESat-2数据以及联合Landsat OL和ICESat-2数据的草本、灌木及森林总生物量估算模型,对比发现,联合Landsat OL和ICESat-2数据建立的各估算模型均比单种数据模型精度高(R2分别为0.65、0.71、0.66)。庞勇等[44]建立GLAS森林参数与MERIS数据的像元值及植被指数等信息的相关关系(R2=0.7),结合GLAS森林地上生物量估算数据和MERIS数据完成了湄公河次区域生物量连续制图。
光学数据只能获取平面冠层信息,且易受天气云层影响,而SAR数据穿透能力强,可获得垂直结构信息。利用光学与SAR 2种数据融合进行生物量估算,有3种形式,将SAR的后向散射系数和光学数据的波谱信息、植被指数或纹理等直接运用到回归模型中,但该方式缺乏从机理上对2种数据的协同与融合,未在大范围生物量估算中得到应用;分别提取SAR和光学数据的参数,然后构建估算模型,但大部分研究采用的是统计回归法,并未涉及到在物理机理上的参数协同;将获取的SAR和光学数据参数作为机理模型的输入参数,目前大多采用较为简单的机理模型,如水云模型等[4]。Suman等[45]利用TM数据和ALOS PALSAR L波段数据建立印度次大陆热带落叶混交林的生物量估算模型,发现使用单种数据的估算模型精度(R2分别为0.295、0.868)比同时使用光学和SAR时精度低(R2=0.892)。潘磊等[46]基于Sentinel-1雷达数据的后向散射系数、纹理特征和Sentinel-2光学数据的波段信息、植被指数与纹理特征,采用多元线性逐步回归模型建立与实测生物量的模型(R2=0.575)。
SAR数据穿透能力强,不受天气影响,但易受地形影响,而且在生物量较高时容易饱和,LiDAR克服了SAR的不足,但不具有成像能力,且不能够获取空间连续分布的生物量制图,与SAR数据联合可实现高精度连续分布的生物量制图。LiDAR在与SAR联合估算将LiDAR作为参考数据时,主要由于LiDAR在生物量估算中的精度较高和实测数据较少2个原因。Olivier等[47]利用LiDAR数据获取更多可靠的生物量参考数据,并协同SAR数据完成大区域的生物量估算。在联合估算中还可将LiDAR作为输入变量应用至估算模型中,Erik等[48]把LiDAR获取的地面高度信息和InSAR获取的DSM(Digital Surface Model)信息结合进行地上生物量估算,发现估算效果比InSAR的DSM信息与DEM数据结合估算地上生物量好。
综上,随着研究的不断深入,单一类型传感器数据往往难以满足高精度的生物量估算需求。当前,将LiDAR数据与其它光学或SAR数据融合进行森林结构参数及生物量估算研究是热点,具有很大的发展潜力。未来可协调不同遥感数据源之间的差异性,结合不同区域森林类型,采用机器学习方法建立多特征变量的训练样本,寻找最优模型和算法。
总体而言,光学数据、SAR数据和LiDAR数据各有优势,在生物量估算中广泛应用,本文讨论了3类数据在生物量估算中的研究进展,总结了多源数据结合在估算研究中的现状,但在实际应用中也存在一些问题。尺度问题。不同的遥感数据源时空尺度存在差异,森林生态系统不同尺度上的空间异质性导致生物量估算结果的不可比性,遥感数据与调查数据的尺度也造成了估算的不确定性;植被自身复杂性。森林植被自身复杂性,包括森林的不同类型三维结构及不同类型森林的季节时相变化等,忽略这些因素会造成一定的反演误差;模型精度与适用性。目前各种估算模型及其使用的参数并不一致,可移植性差。
综合存在的一些问题及研究现状,有几点展望。发展机理模型。该模型基于电磁波与植被的相互作用机制,存在模型精度与描述参数和计算复杂度之间的矛盾,通用性强,对植被的生理过程有详细地阐述,需要从反演的角度出发,关联具有物理意义的参数,建立合适的机理模型;固定样地与林地分类。一般遥感数据中森林类型间存在差异和混合像元等,不同的类型波谱及纹理特征不同,其后向散射系数和森林结构参数也存在差异,可集成光学数据如高光谱和高分辨率数据、SAR或LiDAR数据进行森林类型分类,布设永久样地,用来测量主要碳库生物量的变化,样地需覆盖所有森林类型,分样地结合机理模型估算生物量;林业大数据与多源数据协同。空天地从不同平台不同尺度上获取海量的周期性的光学和SAR数据、三维激光数据、地面定点采集的信息、移动LiDAR采集的数据等构成了林业大数据,各类数据互相补足,在格式、类型、时空尺度、分辨率上存在差异性。将不同传感器、不同时间、不同空间分辨率、不同光谱分辨率的遥感数据有机地结合,选择最优信息估算生物量,充分发挥多源数据的优势。