王馨慧, 邢艳秋, 黄佳鹏, 尤浩田, 常晓晴
(1.东北林业大学 森林作业与环境研究中心,哈尔滨 150040;2.桂林理工大学 测绘地理信息学院,广西 桂林 541004)
森林生态系统与其他生态系统相比,具有分布面积最大、生产力最高、生物量积累最多的特点。森林生物量数据是研究许多林业问题和生态问题的基础,也是碳储量、碳循环研究的重要参考[1-2]。目前,在全球气候变暖大环境背景下,森林生物量研究更是趋显重要。因此,如何准确、高效地完成森林生物量估算已成为当前研究热点。
利用遥感技术估算森林生物量相较传统森林调查方法具有速度快、周期短、时效性强、经济效益高等优点,可以在短时间内和大空间尺度下对森林生物量快速、准确、无破坏地估算,对生态系统进行宏观监测。目前,利用遥感技术估算生物量的研究有很多,从研究数据方面看,分别通过光学遥感数据[3]、SAR 数据[4]、激光雷达数据[5]进行森林生物估测。从研究方法看,大多采用多元回归、BP 神经网络等方法建立遥感信息与实测生物量之间的关系,从而对生物量进行估测,而且利用遥感估测的生物量大多为地上生物量[6-8]。星载大光斑激光雷达(ice,cloud,and land elevation satellite,ICESat)所搭载的地球科学激光测高仪系统(geoscience laser altimeter system,GLAS)可以弥补大多数遥感系统的不足,获得森林垂直结构信息。段祝庚等[9]归纳总结了利用GLAS 数据估算树高及生物量的研究,得出由于GLAS 光斑点呈条带状分布的特征,使其必须与其他数据联合以估测区域树高和生物量的观点。中分辨率成像光谱仪(moderate resolution imaging spectrora-diometer,MODIS)光学遥感数据相对于其他光学遥感数据具有光谱范围广、更新频率高、单幅影像覆盖面积大的优点,从而在数据质量、稳定性和空间尺度方面更适用于科学研究。黄国胜等[10]利用MODIS 数据对东北地区生物量进行了估算,但由于MOIDS 数据分辨率较低而导致估测生物量的精度偏低[10]。王成等[11]已将GLAS 数据与MODIS 数据结合使用,建立了BP 神经网络模型以估测东北三省区域植被高度,但在精度验证方面未达到较好效果,且没有进行生物量的计算。当前学者所建立的生物量异速生长模型大多是以树高和胸径为变量[12],这些模型能较好地实现对林木生物量的估算,但是依靠目前的技术水平,还无法在大区域尺度下获得准确的树木胸径。
因此,为了解决上述问题,本研究以黑龙江省伊春市带岭区为研究区,将GLAS与MODIS 数据联合使用,共同估算区域内森林平均冠层高度,弥补仅使用一种数据而导致的不足,利用野外调查数据,建立森林平均冠层高度与生物量之间的联系,实现区域内森林生物量(地上和地下)的连续、高精度估测,解决无法获取大范围林木胸径参数的难题,从而探索利用遥感信息与地面调查相结合,快速、准确、连续计算区域森林生物量的方法,同时对运用遥感数据进行东北地区大范围的生物量估测起到一定的参考和借鉴作用。
带岭区位于黑龙江省伊春市,小兴安岭南部,地理坐标为128°37′42″W~129°17′38″W,46°51′03″N~47°21′32″N,属北温带大陆性季风气候,冬季干燥寒冷,夏季湿热多雨,年平均温度1.4 ℃,极端最低温度-40 ℃,极端最高温度37 ℃,年平均降雨量661 mm,年降雨量最大值836.5 mm,多集中在7—9月的3个月份,全年无霜期为110~120 d。带岭区拥有丰富的自然资源,森林资源得天独厚,主要种类有红松、云冷杉、水曲柳、白桦等。土壤类型主要为暗棕壤,少量分布草甸土、沼泽土和泥炭土。
1)野外调查数据。本文使用的研究数据是于2014年9月在带岭地区采集得到的。野外调查采用的方法为分层随机采样法,选取了105 个对应GLAS 光斑点的地面作为标准样地参与森林平均冠层高度模型的构建。在林地森林平均冠层高度-生物量估测模型中共选择了279个样地,其中,有146个针叶林样地、95个阔叶林样地和62 个混交林样地。测量因子包括样地中心坐标、林地类型、优势树种、树高、胸径、冠层高度、叶面积指数、郁闭度和冠幅等。
野外调查的样地需要计算样地生物量和样地平均冠层高度,以作为建立森林平均冠层高度-生物量模型的基础数据。样地生物量表示为样地内所有林木树干生物量、树枝生物量、树叶生物量、树根生物量四者相加的和,计算见式(1)。生物量计算所用到公式参照陈传国研究出的适用于东北地区的生物量异速生长模型[12],具体见式(2)和式(3)。样地的平均冠层高度采用Lorey’s的平均高度,如式(4)所示。
(1)
式中:Wt为样地森林生物量;WSi为第i株林木的树干生物量;WBi为第i株林木的树枝生物量;WFi为第i株林木的树叶生物量;WRi为第i株林木的树根生物量;n为样地内林木株数。
W=a(D2H)b
(2)
W=aDb
(3)
式中:a,b是模型参数;D为胸径;H为树高。
(4)
式中:HL为第L(L=1,2,…,n)个样方的冠层平均高度;hi为第i株单木的冠层高度;gi为第i株单木的胸高断面积;n为样方内单木株数。
2)ICESat-GLAS波形数据。ICESat 是第一个用于全球大气观测、冰盖高程变化监测、陆地高程和地表植被覆盖观测的星载激光雷达传感器[13]。ICESat-GLAS 提供15种数据产品(GLA01,GLA02,GLA03,…,GLA15),GLA01产品包含完整的波形数据,GLA14 产品包含地面高程以及经纬度等信息,头文件中的索引号和光斑号将2种数据产品进行匹配[14]。为了使得数据采集时间尽可能一致,并减少时间差异引起的误差,本研究选择了2007—2009年的GLA01 和GLA14数据产品,数据获取网址为http://nsidc.org/data/icesat/。
GLAS 数据预处理的目的是为了提取波形长度W和地形坡度参数TS,用以建立GLAS 平均冠层高度模型。首先将GLAS数据转换成电压值格式;然后进行标准化、高斯平滑与分解处理。经过平滑与分解后的波形数据可提取W和TS,提取方法参照邱赛等[15]的研究。其中,W为波形起波点与止波点之间的垂直距离,起波点与止波点由背景噪声阈值确定,背景噪声阈值的设置参考了以前的研究,并使用前100帧波形数据的平均值和4倍的标准偏差之和[16]。波形长度W的计算如式(5)所示。
W=(sigend-sigstart)×binsize
(5)
式中:sigstart为波形起波点;sigend为波形止波点;binsize为每帧数据代表的真实距离,对陆地而言,binsize取值为0.15 m。研究通过提取地形坡度参数TS以校正地形坡度对波形造成的波形展宽的影响[17],TS 是对应于地面回波的高斯分量的波形长度Wgf与光斑直径D的比值反正切[15],计算方法如式(6)所示。
(6)
式中:Wm为波形被加宽的值。Wm的计算按照Mahoney等[18]在2014年提出的公式,如式(7)所示。
Wm=4.689+0.759A
(7)
式中:A表示地面回波峰值能量值。
3)MODIS数据。研究所使用的遥感数据为美国地质调查局(United States Geological Survey,USGS)提供的EOS/MODIS的陆地产品MOD09A1,该数据空间分辨率为500 m,是8 d合成图像,数据格式为EOS-HDF[19]。MODIS表面反射产品(MOD09)是陆地2级标准数据产品,空间分辨率为500 m,包括的主要数据为MODIS1-7 波段的反射率数据和其他一些辅助数据,比如太阳天顶角和波段质量数据等[20]。该产品通过大气校正消除了大气吸收和散射的影响,并能够实现地面光谱反射估计。MODIS的8 d反射率产品是在每天的反射率产品的基础上合成得到的,8 d内的最佳观测值由总像元质量和观测覆盖范围决定。
MODIS 数据预处理的目的是为了得到每个波段的光谱信息,为建立GLAS 与MODIS 联合估测区域树高的模型提供数据。由于MOD09A1为二级标准数据产品,已经过几何校正和辐射校准,但因其为标准的HDF-EOS格式,投影采用球面正弦投影。为方便后续计算,研究首先通过MODIS专业处理软件MRT(MODIS reprojection tool)对MODIS数据中7个波段反射率数据进行文件格式转换,并进行了重新投影、地图投影和分辨率重采样的批处理操作,使输出投影为WGS-84,空间分辨率为500 m的MODIS数据7个波段反射率数据的TIFF图像[21];然后使用ENVI软件中的FLAASH大气校正模块工具进行MODIS光谱数据的大气校正,并通过ARCGIS软件的掩膜处理工具提取研究区的边界,以得出研究区域的MODIS图像,去掉研究区域外的图像信息,以方便后续的数据处理;最后通过ArcGIS软件用于根据经纬度值提取MODIS数据图像每个波段的光谱信息。
4)其他辅助数据。除上述数据外,研究还使用了2013年的森林资源二类调查数据,数据来自于带岭林业局。森林资源二类调查数据为带岭地区森林资源清查数据,主要包括林地类型、优势树种、林龄、树高、胸径、冠层高度、郁闭度和冠幅等数据,可以提供带岭地区准确的森林类型分布,是建立3种林分类型的森林平均冠层高度-生物量模型的基础。同时,二类调查数据在本研究中还被用来验证生物量估算的精度。
首先建立基于GLAS波形数据的森林平均冠层高度估算模型,计算研究区内所有GLAS光斑覆盖点的平均林冠高度;然后结合GLAS数据和MODIS数据建立区域森林平均冠层高度BP(back propagation)神经网络估测模型,将GLAS光斑点覆盖的森林平均冠层高度从对应的MODIS数据中提取的7个波段信息组成样本数据集,通过初始化BP神经网络模型的参数,不断调整和修改模型的隐层值,根据模型的评价参数确定最佳模型效果,并使用测试集数据来测试已建立模型的泛化能力,得到最优BP神经网络估测模型,将整个研究区域的MODIS数据的波段信息导入BP神经网络模型作为输入,计算整个研究区域的平均冠层高度;最后建立了基于实测数据的生物量-森林平均冠层高度模型,以获得整个研究区域的生物量信息。
利用野外实测样地生物量和实测林分的冠层平均高度,通过Matlab分别建立针叶林、阔叶林、针阔混交林3种林分的回归估测模型W=aHb(其中,a、b为模型参数)。通过分别构建3种林分样地生物量与冠层平均高度之间的相关模型,找出对应关系,确定林分模型中a和b的值,进而得到区域的生物量信息。
相比较大范围获取森林胸径参数,森林平均冠层高度参数更容易获得。因此,本研究建立了基于GLAS波形数据的森林冠层平均高度估算模型,并利用该模型计算研究区所有GLAS光斑点的平均林冠高度。
研究表明,地形坡度会导致GLAS波形展宽,这是影响森林冠层高度估计精度的重要因素[22]。由于地形坡度和光斑大小的影响,波形长度W与真实森林平均冠层高度H之间存在误差。当局部斜率为α时,波形的最大展宽,即最大估计误差为Dtanα。本研究从GLAS波形数据中提取地形坡度参数TS,以此最小化坡度对精度的影响[15]。拟建立的平均冠层高度H与波形长度W、地形坡度参数TS的回归GLAS森林平均冠层高度估算模型如式(8)所示。
H=aW+bDtanTS+c
(8)
式中:a、b、c为各项对应系数。
GLAS光斑点分布呈条带状,不能覆盖整个研究区域。因此,本研究将GLAS波形数据与MODIS多光谱数据相结合。首先利用GLAS波形数据建立GLAS森林平均冠层高度估算模型,获得研究区域的所有GLAS光斑点的森林平均冠层高度;然后基于BP神经网络算法,利用GLAS估算的森林冠层高度和MODIS多光谱数据处理后得到的7个波段信息组成样本数据集。样本数据依次划分为训练集、测试集和验证集。其中,为了防止模型构建过程中由于过度拟合现象引起的严重失真,样本数据集被分成比例为3∶1∶1的训练集、测试集和验证集,建立了一个基本的单隐层网络区域连续森林平均冠层高度估算模型。采用Levengerg-Marquardt(缩写为L-M)作为BP神经网络的训练算法,模型训练目的是最小化样本输出和预期输出之间的偏差,从而建立区域连续森林平均冠层高度的BP神经网络估算模型[23]。该模型弥补了GLAS光斑分布特征的不足,实现了区域连续森林平均冠层高度的估算,获得了研究区内连续的森林平均冠层高度,并得到森林平均冠层高度分布图。
为得出研究区内林分生物量分布信息,利用MODIS数据提取的研究区内波段信息,通过基于GLAS数据和MODIS数据建立的森林平均冠层高度估算模型,获得研究区森林连续的平均冠层高度,并将其应用于基于实测数据建立的生物量-森林平均冠层高度估算模型,估算整个区域的生物量信息,进而得出研究区域的生物量分布图。
为了验证GLAS森林平均冠层高度估算模型、联合GLAS和MODIS的森林平均冠层高度估算模型、生物量-森林平均冠层高度估算模型的准确性及评估模型的质量,研究采用决定系数R2、均方根误差RMSE作为评价指标。
基于W和TS所建的GLAS森林冠层平均高度估测模型的表达如式(9)所示。
H=0.076×W-0.210×DtanTS+13.27
(9)
研究所建立的GLAS森林平均冠层高度估测模型,模型决定系数R2=0.801,RMSE=0.614,决定系数大于0.8,且均方根误差较小,证明该模型具有良好的拟合效果。为了对森林平均冠层高度估测模型进行模型验证,选取未参与建模的数据点进行验证分析。图1显示了GLAS森林平均冠层高度估算模型的验证结果,横坐标为森林平均冠层高度实测值,纵坐标为森林平均冠层高度估测值,得出验证模型决定系数R2=0.802,RMSE=0.974。结合图1可知,整体估测森林平均冠层高度效果良好,精度较高。同时,依据模型评价参数分析可知,该模型得出的表达式符合估测精度需求,可以实现高精度林分平均冠层高度的估测。
图1 GLAS森林平均冠层高度估算模型验证结果
经过反复尝试,联合GLAS和MODIS建立的森林平均冠层高度BP神经网络模型的隐含层神经元的数量确定为10。模型结果和误差统计见表1。
表1 森林平均冠层高度BP神经网络建模结果
根据表1,可以看出使用训练集数据(78个随机选择的样本)构建BP神经网络模型,决定系数R2高达0.886 7,均方根误差RMSE为0.794;校正集数据用于校正模型的每一层网络之间的权重和阈值,决定系数R2达到0.936 1,校正集的均方根误差RMSE为0.443;测试集的回归效果图显示,林冠平均高度的实测值和估测值之间的相关系数R2为0.797 0,均方根误差RMSE为1.520。图2为最终获得的森林冠层平均高度的BP神经网络训练集和校正集的回归效果图,横坐标是通过林冠平均高度的实测值,纵坐标是通过BP神经网络模型获得的森林平均冠层高度的估测值。
图2 森林平均冠层高度BP网络建模结果
从表2可以看出,研究区森林的平均冠层高度为5~25 m,平均约14 m,研究区的西北部和西南部森林平均冠层高度较高,中部以及东南部分地区的森林冠层高度较低。中部以及东南地区森林冠层高度较低是由于此处多分布落叶松以及阔叶树种,而采集的多光谱数据在9月份,此时落叶松和阔叶树种叶片开始发黄,光谱信息出现误差,因此,导致估测的森林冠层高度偏低。不过整体森林平均冠层高度分布较为均匀,分布较为合理,且结合BP神经网络验证结果分析,研究建立的模型在估测森林平均冠层高度上是可行的,可以满足林业应用需求。
表2 森林各区域平均冠层高度估测值
研究利用野外实测样地生物量、森林平均冠层高度分别的建立阔叶林、针叶林、混交林森林平均冠层高度-生物量估测模型及结果见表3。
表3 森林平均冠层高度-生物量估测模型建模结果
从表3可以看出,研究所建立的3种森林平均冠层高度-生物量估测模型效果均很好,针叶林森林平均冠层高度-生物量估测模型决定系数R2=0.802,RMSE=0.731;阔叶林森林平均冠层高度-生物量估测模型决定系数R2=0.826,RMSE=0.613;混交林森林平均冠层高度-生物量估测模型决定系数R2=0.794,RMSE=0.334。3种模型的决定系数R2均在0.8左右,说明该模型拟合3种林分的森林平均冠层高度与生物量的效果较好,证明该模型适用于当前数据的应用场景,达到建模要求。
图3依次显示了针叶林、阔叶林、混交林森林平均冠层高度-生物量模型的回归分析,横坐标表示森林平均冠层高度,纵坐标表示林分生物量。
图3 森林平均冠层高度-生物量模型回归分析
从图3可以看出,模型数据点均匀分布在预测回归线的两侧,变迁没有残差值过大的异常点,整体样本点的分布大致满足预测回归线的走势,呈现指数分布。利用森林资源二类调查数据(2013年)计算的森林生物量数据,验证模型的准确性。从其散点图(图4)可见,针叶林生物量精度R2为0.761,阔叶林生物量R2为0.692,混交林生物量R2为0.781,模型精度总体比较满意。结合表2模型评价参数,说明模型拟合效果良好,因此,研究中建立的3种森林平均冠层高度-生物量估测模型可用于估算本研究区内的森林生物量,得到带岭各区域森林生物量估测值如表4所示。
图4 研究区森林生物量精度验证
表4 森林各区域生物量估测值
由表4可以看出,研究区森林生物量为47.40~190.66 t/hm2,全区域平均值在90 t/hm2左右,在研究区的西北部和西南部森林生物量较高,而在中部以及东南部的地区生物量较低与森林平均冠层高度分布类似。由生物量分布图上整体可以看出,生物量分布较为均匀,过渡自然符合正常生物分布规律。综上可知,本研究建立的生物量估测模型具有较高可行性,可以实现对研究区内连续生物量进行较高精度的估测。
为了弥补仅使用GLAS数据无法估算区域内连续森林平均冠层高度的缺陷,提高估算森林生物量的准确性,研究联合GLAS波形数据和MODIS多光谱数据,从GLAS波形数据中提取波形参数W和TS,结合样地实测森林平均冠层高度,建立GLAS森林冠层高度估算模型,进而联合MODIS数据,基于BP神经网络算法建立区域连续森林平均冠层高度估算模型,对没有GLAS光斑覆盖点的区域进行平均冠层高度估算,同时基于野外实测数据建立了区域生物量-森林平均冠层高度估算模型,实现连续生物量估算。通过分析,得出以下结论。
1)基于波形长度W和地形坡度参数TS的GLAS森林平均冠层高度估算模型能够有效减少地形指数计算引起的误差,提高模型的准确性。模型决定系数R2=0.801,RMSE=0.614,模型验证的决定系数R2=0.802,RMSE=0.974。
2)联合GLAS波形数据和MODIS多光谱数据建立的基于BP网络算法的森林平均冠层高度估算模型,弥补了GLAS数据因光斑点分布离散且呈条带状而无法估算连续平均林冠高度的不足。模型决定系数R2为0.886 7,均方根误差RMSE为0.794,模型验证的决定系数R2为0.797 0,均方根误差RMSE为1.520。
3)利用野外实测样地生物量、实测平均冠层高度分别建立针叶林、阔叶林、混交林的森林平均冠层高度-生物量估算模型,实现研究区内不同林分类型的连续生物量估算。针叶林、阔叶林、混交林的生物量模型决定系数R2分别为0.802、0.826、0.794,RMSE分别为0.731、0.613、0.344,验证的决定系数R2分别为0.761、0.692、0.781。
研究联合GLAS和MODIS数据建立森林平均冠层高度模型,解决GLAS光斑点条带分布的问题,实现森林平均冠层高度的连续估算;选择森林平均冠层高度与森林生物量建模,可以解决常用异速生长模型中胸径参数在较大区域内难以获取的问题,对运用遥感数据进行东北地区大范围的生物量估测起到一定的参考和借鉴作用。
由于实验采用的数据类型较多,导致不同数据之间存在无法消除的时间差,并且研究区内生物量的估测也是经过多个模型综合计算的结果,因而会产生一定的误差,影响结果的准确性,后续将综合考虑多种因素对生物量估算的影响,进而使得研究区内的生物量估算更加准确。