城市森林生物量遥感估测中DN值分层抽样的应用*

2018-10-23 11:15庞恩奇徐丽华张茂震徐慧锋
西南林业大学学报 2018年5期
关键词:方根反射率样地

庞恩奇 徐丽华 张茂震 徐慧锋

(1. 浙江农林大学亚热带森林培育国家重点实验室,浙江 杭州 311300;2. 浙江农林大学环境与资源学院,浙江 杭州 311300;3. 浙江农林大学风景园林与建筑学院,浙江 杭州 311300)

城市森林是森林生态系统的重要组成部分,具有重要的生态、社会和经济价值[1]。生物量是森林生态系统运行的能量基础和营养来源,是研究生物净生产力、碳储量及碳循环的基础,并在森林的经营、监测与评价中起到重要的作用[2]。遥感技术凭借其快捷、准确和无破坏性的优势,已逐渐成为获取森林地上生物量的重要途径[3],其中最常见的方法是通过遥感像元信息和样地生物量信息建立回归模型,实现全局生物量估算[4]。提高遥感影像的质量、选择具有代表性的实测样地以及采用合适的建模方法是建立高精度生物量遥感估算模型的基础和保障。随着遥感技术的进步,光学遥感影像的质量逐渐从低分辨率往高分辨率发展[5],在遥感数据估算模型研究上也有许多进展,随机森林、神经网络、K最近邻算法等已广泛得到应用[6]。然而,在实测样地的选择方法上鲜有研究和突破。

城市森林作为森林的一种特殊类型,与自然森林有所差别,普遍表现为稀疏种植的单株树木或小面积的人工绿化群落,具有破碎度高、斑块不规则、树种繁多等特点[7-8]。在城市环境下的森林生物量遥感估算精度也往往低于在自然森林环境下的估算精度[9-10],因此对城市森林生物量进行遥感估算时,需要所设样地对研究区内的森林特征具有更好的代表性。目前,生物量遥感估算中常用的抽样方法有简单随机抽样和分层抽样。简单随机抽样操作简便,但对于复杂的总体,容易漏掉数据分布边缘的点,样本的代表性难以保证[11]。分层抽样将总体分成若干个相互独立的层,在各层中分别进行简单随机抽样,可以降低总的抽样误差,提高抽样效率[12]。但如果分层的依据不科学,同样也会使抽样精度降低[13],在生物量遥感估算中一般分层抽样通常将研究区域按照树种、林龄、用地类型等属性进行分层抽样[14-15]。基于以上研究区属性进行的分层抽样能够在一定程度上提高抽样效率,但是通常所分层数量有限且分层难度较大。为了从优化样地选择的角度进一步提高生物量遥感估测的精度,国内外学者开始研究直接利用遥感数据进行分层抽样的方法,但目前相关研究进展较少,仅有少量利用LiDAR数据进行分层抽样实践的研究[16-18]。如何利用其他遥感数据来优化生物量遥感估算中的样地选择,值得进一步的研究。

DN (Digital Number) 值是地物特征在遥感影像中的反映,相近地表覆盖类型其所对应的DN值也相近,因此根据DN值区间来进行分层抽样能够有效提高抽取样地的代表性,且易于操作。本研究以杭州市西湖区为研究区,分别用简单随机抽样、一般分层抽样和DN值分层抽样3种方法进行模拟抽样,利用标准误差和平均绝对误差比较各方法抽取样地的精确性和稳定性。再分别使用3种方法地进行实地抽样,获取样地数据。运用线性回归方法分别建立回归模型,对3个模型精度进行比较分析。本研究可为城市森林生物量遥感估测中的实测样地选择提供一种新的抽样方法。

1 研究区概况

研究区为浙江省杭州市西湖区,位于东经119°56′~120°10′,北纬30°02′~30°23′,南北长约为28.5 km,东西宽约为14 km。地处亚热带季风性气候区,四季分明,光照充足,雨量充沛,春秋较短,冬夏较长。研究区属于亚热带常绿阔叶林带,主要植被类型为常绿阔叶林。由于冬季存在短暂低温,喜热植被不利于生长,因此在西湖分布较多常绿耐寒的植被,形成较多的常绿阔叶林或落叶与落叶阔叶林混交林,还有亚热带针叶林、针叶混交林以及竹林等[19-20]。研究区内城市森林分布特点为中部森林面积大,南北大片城市区域内有不同程度的带状与块状乔木绿地。

2 材料与方法

2.1 数据来源

2.1.1遥感影像数据

遥感数据为Landsat7影像,条带号为119,行编号39,中心经纬度坐标为东经120°1′25.32″,北纬30°18′4.32″。影像成像时间为2015年4月28日,当天云量为0.56%。2003年5月31日,Landsat7 ETM + 机载扫描行校正器 (SLC) 故障,导致此后获取的图像出现了数据条带丢失,因此,本研究在对影像进行预处理时,首先采用自适应局部回归算法利用相近时间的ETM + 影像对条带进行填充修复,将去除条带处理后的遥感影像进行辐射定标、大气校正、几何校正以及地形校正等预处理过程,得到地面反射率。

2.1.2样地数据

研究区的样地数据来自2015年5月至6月组织调查小组对杭州市西湖区城市森林的生物量进行调查,样地调查内容为样地坐标、乔木树种、树高、胸径、冠幅、灌带高度、地径、面积、草地面积,样地分布按照不同的抽样方法预先在影像上设定。参考相关研究样地数量的设定以及考虑到对比3种抽样方法时的便利性,本研究将样本数量定为100个。样地大小设置为30 m × 30 m,与Landsat7遥感影像分辨率相同。

2.2 抽样方法

2.2.1基于DN值分层抽样法

基于DN值的分层抽样方法是以遥感影像DN值为研究区域的属性值,来进行分层抽样的方法。DN值是遥感影像像元亮度值,是地物的电磁波反射在传感器中的记录值,因受到太阳位置、角度条件、大气条件、地形以及传感器本身的性能影响,传感器所记录的DN值并不是地物真正的光谱值,但其代表了地物反射电磁波的能力,具有分辨地物的功能。因此可根据不同的DN值对遥感影像进行分层抽样,提高抽取样地的代表性。

本研究使用的数据为Landsat7遥感影像,其近红外波段对绿色植物类别差异最为敏感,利用ArcGIS 10.2中的Reclassify工具将遥感影像近红外波段DN值进行分层。分层抽样的目的是尽可能将统一类型的单位归入一层,使层内差异小,具有同质性;使层间的差异比较大,具有异质性。通过观察影像DN值的分布情况以及考虑具体分层的可操作性,将研究区共分为16层。按照每层面积比例确定权重和抽样数量,在各层内分别进行随机抽样得到100个样地,具体样地设置见图1。

2.2.2随机抽样法和一般分层抽样法

本研究中,随机抽样是在西湖区研究范围内随机产生成100个样地点,具体样地设置见图2。一般分层抽样是将西湖区研究范围根据遥感影像覆被情况进行目视解译,将用地类型分为林地、湿地、绿地、耕地、建筑用地和水域6类,然后分别在其中按照面积等比例随机抽样生成相应的样地点,生成100个样地点,具体样地设置见图3。

2.2.3抽样效果评价方法

运用标准误差和平均绝对误差分别对抽样方法的稳定性和精确性进行评价,具体计算方法见公式 (1)~(2)。标准误差越小说明该方法在100次的重复抽取实验中保持的稳定性越高;平均绝对误差越小说明该方法抽取样地对应的各波段反射率与遥感影像真值的偏差越小,则该方法的抽样精确性越高。

图1DN值分层抽样示意
Fig.1 Diagram of stratified sampling for Digital Number

图2随机抽样示意
Fig.2 Random sampling diagram

图3一般分层抽样示意
Fig.3 General stratified sampling diagram

(1)

(2)

式中:σ为标准误差;β为平均绝对误差;xi为第i块样地对应的反射率值;μ为样地对应反射率的平均值;y为影像所有像元的反射率平均值;N为抽样次数。

2.3 生物量遥感估测方法

2.3.1样地实测生物量

本研究中森林生物量 (B) 仅指活立木及灌木带生物量,并未包括森林生态系统中的草本木、落叶层、枯死木等其他存在形式的生物量,将乔木生物量和灌木生物量相加计算得到样地内总生物量。根据研究区内森林生物量类型的情况分为硬阔、软阔、马尾松 (Pinusmassoniana)、杉木 (Cunninghamialanceolata)、竹类和灌木6大类,参考相关文献中的单株生物量模型根据胸径 (DBH)、树高 (H) 来计算研究区内的生物量,具体模型见公式 (3)~(6)。

硬阔生物量计算方法[21]:

B=0.246 0DBH2.080+0.007 36DBH2.840+

0.000 546DBH3.20+0.082 80DBH2.220

(3)

软阔生物量计算方法[22]:

B=0.135 (DBH2×H)0.802 0

(4)

杉木生物量计算方法[23]:

B=0.000 001 5 (DBH2×H)1.763 2+

0.000 000 27 (DBH2×H)2.030 4+

0.033 6 (DBH2×H)0.707 3

(5)

马尾松生物量计算方法[24]:

B=0.097 7DBH2.520 6

(6)

竹类生物量计算方法[25]:

B=0.015 189DBH0.630 5×H2.068 7

(7)

灌木生物量计算方法[26]:

B=0.409 759DBH1.061 5×H0.542 7

(8)

2.3.2建模方法

在生物量遥感估测中回归模型是常用的估算方法,本研究主要目的为对比3种抽样方法在生物量遥感估测中对模型精度的影响。在比较样地生物量与各波段地面反射率的相关性后,选用相关性最高的波段地面反射率为自变量,建立生物量线性回归模型。在100个样地中,随机抽取80%的样地作为建模数据,剩余的20%作为检验数据,采用线性回归方法进行建模。

2.3.3模型精度检验

通过均方根误差 (RMSE) 和相对均方根误差 (RMSEr) 对生物量估算模型精度进行评价。具体计算方法见公式 (9)~(10):

(9)

(10)

3 结果与分析

3.1 抽样方法效果比较

不同抽样方法下样地各波段地面反射率标准误差和平均绝对误差计算结果见表1~2。

由表1可知,DN值分层抽样、随机抽样和一般分层抽样的平均标准误差分别为0.009 7、0.017 1和0.016 8。因此,在抽样稳定性上从优到劣依次为DN值分层抽样、一般分层抽样、随机抽样。DN值分层抽样相对于简单随机抽样和一般分层抽样在稳定性上分别提高了43.3%和42.3%,可见DN值分层抽样在抽样稳定性方面有明显的优势。由表2可知,DN值分层抽样、随机抽样和一般分层抽样的平均绝对误差分别为0.018 8、0.047 1和0.038 5。因此,在抽样精确性上从优到劣依次为DN值分层抽样、一般分层抽样、随机抽样,其中DN值分层抽样相对于随机抽样和一般分层抽样在精确性上分别提高了60.1%和51.2%。

表1 不同抽样方法下样地各波段地面反射率标准误差Table 1 Standard error of ground reflectivity in different sampling methods

表2 不同抽样方法下样地各波段地面反射率平均绝对误差Table 2 The mean absolute error of ground reflectivity in different sampling methods

综上所述,在城市森林生物量遥感估测中利用DN分层抽样进行实测样地的抽取能够增加样地抽取的稳定性与精确性。在抽样数量有限的情况下,尽可能使各种波段特征均有与之对应的样地,降低数据被遗漏的可能性。相比于简单随机抽样和一般分层抽样能够有效提高抽取样地的代表性。

3.2 模型精度比较

为了进一步比较在遥感估侧中的3种抽样方法的实际效果,本研究运用随机抽样、一般分层抽样和DN值分层抽样3种方法进行生物量建模精度比较。用3种方法分别抽取100个样地,进行实地测量;建立线性回归方程,对模型精度进行比较;将实地测量得到的样地生物量与对应的遥感影像各波段地面反射率进行相关性分析,结果见表3。基于DN值分层抽样得到的样地,在与遥感影像各波段地面反射率的相关性上优于随机抽样和一般分层抽样得到的样地。

表3 样地生物量与遥感影像波段反射率的相关性Table 3 Correlation between biomass and spectral reflectivity of remote sensing image

注:**表示极显著相关 (P< 0.01)。

选取相关性最高的Green波段的地面反射率作为自变量,运用线性回归方法分别建立回归方程,所建立的具体模型见公式 (11)~(13)。

DN值分层抽样法回归模型:

B=66 050.437-66 344.534Green

(11)

简单随机抽样法回归模型:

B=74 428.350-77 445.364Green

(12)

一般分层抽样法回归模型:

B=72 611.170-72 698.974Green

(13)

式中:B为研究区生物量,Green为研究区遥感影像绿色波段值。

通过均方根误差(RMSE)和相对均方根误差(RMSEr)对生物量估算模型精度进行比较,结果见表4。

表4 模型精度评价Table 4 Models accuracy evaluation

由表4可知,均方根误差方面,DN值分层抽样相对于简单随机抽样和一般分层抽样,由25.29 t/hm2和22.32 t/hm2下降到了18.01 t/hm2,可见DN值抽样法能够有效降低遥感估测中样地抽取时的抽样误差。相对均方根误差方面,DN值分层抽样相对于简单随机抽样和一般分层抽样,由22.79%和19.68%下降到了16.23%,有效提高了模型估算的精确性。

4 结论与讨论

本研究提出一种基于DN分层抽样的方法,以提高在城市森林生物量遥感估测中的抽样精度。利用标准误差和平均绝对误差将DN值分层抽样与简单随机抽样、一般分层抽样等方法在精确性和稳定性两方面做比较。并且根据简单随机抽样、一般分层抽样和DN值分层抽样3种方法分别进行样地实测构建回归模型,通过均方根误差和相对均方根误差对生物量估算模型进行精度评价。结论如下:DN值分层抽样相对于简单随机抽样和一般分层抽样在稳定性上分别提高了43.3%和42.3%,在精确性上分别提高了60.1%和51.2%。基于DN值分层抽样的回归模型均方根误差为18.01 t/hm2,相对均方根误差为16.23%,相对于其他2种方法有了明显的提高。

简单随机抽样对研究区内每一个样本抽取是完全随机独立的,很容易遗漏掉一些代表性用地,所以在城市森林这样复杂的情况下,需要更大的样本容量才能保证其抽样的可行性。一般分层抽样相对于随机抽样在效果上有所提高,但是总体优化的幅度不是很高,并且按照用地类别对研究区进行分层抽样还需要繁琐的分类过程。DN值分层抽样是直接基于遥感数据的分层抽样方法,能够便捷地对研究区域进行粗分类,确保每一个DN值区间段中都有等比例的样地点,提高在城市森林复杂的地表覆盖情况下样地抽取的代表性。由于DN值分层抽样的方法提高了在城市森林环境下的抽样效果,在样本量相同的情况下,基于DN值分层抽样得到样本抽样误差更低,从而与遥感影像对应的地面反射率有更好的相关性,得到精度更高的回归模型。可见,DN值分层抽样是一种快捷、稳定、准确的城市森林样地抽取方法。目前,在生物量遥感估算中直接利用遥感数据进行分层抽样的实践并不多,且主要集中在利用LiDAR数据来进行生物量估算的研究中。Hawbaker等[27]在利用LiDAR数据进行生物量估算时,将研究区域根据平均LiDAR高度分成10个区间进行分层抽样,并与随机抽样方法进行对比。结果显示基于LiDAR数据分层抽样的估算模型相比于随机抽样的估算模型,均方根误差降低了约31%。本研究在利用Landsat7数据进行生物量遥感估算时,基于DN值分层抽样的模型相比于随机抽样的估算模型,均方根误差降低了约29%。由于两项研究在遥感数据、分层数量、样地数量、样方大小以及研究区环境等方面存在明显差异,其结果无法直接比较。但均体现出在生物量遥感估算中,利用遥感数据来进行分层抽样能够较大幅度地提高抽样效果。

本研究采用的DN值分层抽样方法将研究区按照 “0~15、16~31、32~47、48~63……224~239、240~255” 共分为16组。研究区内已显示出较好的分层效果,但由于分层区间的设定对DN值分层抽样的效果有一定的影响,对于其他研究区域的应用,需要进一步的研究。本研究采用的遥感影像为Landsat7遥感影像,其DN值范围为 “0~255”,而不同的遥感影像产品,DN值区间范围有所区别。针对不同的遥感数据,制定合适的DN值分层抽样方案有待进一步研究。

猜你喜欢
方根反射率样地
近岸水体异源遥感反射率产品的融合方法研究
商品条码印制质量检测参数
——缺陷度的算法研究
具有颜色恒常性的光谱反射率重建
额尔古纳市兴安落叶松中龄林植被碳储量研究
基于角尺度模型的林业样地空间结构分析
15 年生鹅掌楸林分生长差异性研究
我们爱把马鲛鱼叫鰆鯃
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
均方根嵌入式容积粒子PHD 多目标跟踪方法
数学魔术——神奇的速算