基于偏最小二乘的森林生物量遥感估测1)

2014-07-27 07:59刘琼阁彭道黎涂云燕李艳丽高东启
东北林业大学学报 2014年7期
关键词:密云县样地生物量

刘琼阁 彭道黎 涂云燕 李艳丽 高东启

(北京林业大学,北京,100083)

基于偏最小二乘的森林生物量遥感估测1)

刘琼阁 彭道黎 涂云燕 李艳丽 高东启

(北京林业大学,北京,100083)

利用密云县2006年TM遥感影像和国家森林资源清查资料,以乔木林为研究对象,通过探讨森林生物量与影响森林生物量因子之间的关系,建立森林生物量估测模型。通过相关性分析,发现所选自变量间存在多重相关性,影响模型稳定性与估测精度。针对自变量间多重共线性问题,采用偏最小二乘法建立密云县森林生物量遥感估测模型,并与主成分回归方法建立的模型进行对比,用预留的样本对模型进行检验。结果表明:预测值与实测值相关系数为0.718,精度高达90.1%。运用模型反演,密云县森林乔木生物量估测值为893.388万t。

森林生物量;遥感和地形因子;多重相关性;偏最小二乘;主成分回归

Journal of Northeast Forestry University.-2014,42(7).-44~47

With TM remote sensing image and National Continuous Forest Inventory data of Miyun County in 2006, we studied the relationship between tree forest biomass and influencing factor, and established the forest biomass estimation model. Forest biomass remote sensing estimates were influenced by remote sensing factors and topographic factors. By the correlation analysis, the presence of multiple correlation between selected variables affected the stability and accuracy of the model. In order to solve the problem of multicollinearity among variables, we used partial least squares method to establish remote sensing of forest biomass in Miyun County estimation model, and used principal component regression model to compare the models with control samples. The correlation coefficient between predicted and observed values was 0.718 with the accuracy of 90.1%. By examining the model with inversion forest trees in Miyun County, the estimated biomass was 8.934 million tons.

Keywords Forest biomass; Remote sensing and topographical factors; Multicollinearity; Partial least squares; Principal component regression

森林生物量是森林在一定时期所积累的干物质的总量,是维持森林生态系统正常运行的能量和营养物质基础,也是评价森林生态系统生产力和陆地生态系统功能的重要指标[1]。森林生物量在全球陆地生态系统中占90%,对全球碳循环及全球气候变化研究具有重要意义。

20世纪50年代,美国、日本等一些国家为研究森林生产力对森林生物量进行了大量调查,70年代后期我国开始研究森林生物量。根据实测数据分树种建立森林生物量的相对生长方程,进而推算大尺度上的森林生物量[2],这种森林生物量的估算方法具有较高的精度。但是,这种估测方法模型的建立和精度检验,需要全树采伐获得实测数据,造成对森林生态环境的严重破坏。近年来,遥感技术和地理信息系统等先进技术手段的发展,为解决这一问题提供了可能。

国内外很多学者对森林生物量的遥感估测进行了大量研究。最常用的建模方法有多元线性回归、描述非线性关系的KNN法和人工神经网络模型[3-4]。常用的算法有多元逐步回归、岭估计、主成分分析和偏最小二乘。徐天蜀等[5]针对多重相关性,采用主成分分析,提取了波段光谱值、植被指数和地学因子等13个因子的5个主成分,建立了主成分与地面生物量的回归模型。范文义等[6]采用黑龙江长白山地区TM图像和143块森林资源连续清查固定样地数据,分别采用逐步回归分析法和偏最小二乘回归法,建立了黑龙江长白山林区森林生物量遥感估测模型。

本文针对研究区的具体情况,提取样地的遥感和地学因子,分析其与地面样地生物量的相关关系,采用偏最小二乘回归建立遥感估测模型,并与主成分回归估测方法进行对比,探讨基于遥感和地学信息的森林生物量遥感估测方法。

1 研究区概况

密云县位于北京市东北部,地理坐标为116°39′33″~117°30′25″E,40°13′7″~40°47′57″N)。总面积2 229.45 km2。属暖温带半湿润半干旱大陆性季风气候,四季分明,年平均气温10 ℃,平均降水量660 mm,降水主要集中在6—9月份。其植被属于针阔混交林森林植被带,现存植被主要为人工林和次生植被类型。森林覆盖率76.23%。主要树种有:侧柏林(Platycladusorientalis)、杨树(Populusspp.)、油松林(Pinustabulaeformis)、栎林(Quercusspp.)、刺槐(Robiniapseudoacacia)、桦木(Betulaspp.)、核桃楸(Juglansmandshurica)、五角枫(Acermono)等。

2 研究方法

2.1 影像处理

获取2006年7月12日覆盖密云县的北京市TM影像,空间分辨率为30 m,利用TM影像头文件的相关信息和ERDAS Imagine9.2,选择23个控制点进行几何校正,校正误差控制在0.3个像元内。利用配准后密云县行政边界裁剪得密云县TM影像,影像上直接读取的是像元灰度值(DN),必须对不同时相的影像进行归一化性质的辐射校正,以提高分类的精度[7]。利用头文件信息与USGS网站的文献中给出的标准的行星反射率计算公式和相关参数取值表,将影像灰度值转换为真实地表反射率[8]。

辐射亮度:Lλ=Ga·DN+Bi。

(1)

行星反射率:ρ=(π·Lk·d2)/(ES·cosθ)。

(2)

式中:DN为图像的灰度值,无量纲。Ga是增益,Bi是偏置,其单位与辐射亮度一样(W·m-2·sr-1·um-1)。d为日地距离参数,ES太阳光谱辐射量,θ为太阳天顶角(90°-太阳高度角)。

在ERDAS 9.3的Model Maker中,按公式(1)、公式(2)对图像进行代数运算,完成图像的辐射校正。

获取北京市DEM数据,裁剪出密云县DEM图,如图1所示。在Arcgis中利用DEM影像提取研究区坡向和坡度影像。

图1 密云县海拔分布

2.2 数据处理

样地数据来源于国家森林资源连续清查固定样地数据,同时包括密云县野外调查补充样地实测数据。根据样地实际GPS坐标,在Arcgis中将样地点展绘。根据地类信息剔除异常样地后共选定样地85个。根据样地每木检尺数据,针对研究区情况,运用树木相对生长方程计算样地的乔木生物量[9-11]。

试验中,选取的85个一类调查测树点均匀分布。采用基于聚类的分层抽样,抽取60个样地用于建模,25个样地作为独立检验样本。在前人研究的基础上[12-14],选取可能影响生物量的各类因子进行相关性和自变量间共线性分析。

2.3 偏最小二乘回归

偏最小二乘回归(PLS)是由伍德和阿巴诺[15-18]于1983年首先提出的。主要是应用主成分的思想,把主成分分析与典型相关分析有机结合的多元统计分析方法。克服了传统自变量间多重共线性问题。其基本思路:设已知单因变量Y和自变量[x1,x2,…,xn],样本个数为n,在X与Y相关矩阵中提取第一主成分t1,Y与X对t1进行回归,采用交叉有效性原则,确定提取的主成分个数,将这些主成分作为自变量表达为Y对原始变量X的回归方程。

2.4 主成分分析

主成分分析(PCA)方法能很好的简化自变量信息,消除自变量之间的共线性,且在不丢失自变量信息的条件下,剔除冗余信息。用主成分作为新的自变量进行回归分析,使得构建的回归方程及参数估计更加可靠。选用主成分分析构建模型与偏最小二乘构建的模型进行对比分析能更好的突出偏最小二乘方法的优劣。

2.5 模型检验

为了对模型的适用性和精度进行有效的验证,将预留检验样本代入预测模型,进行配对样本T检验,对实测生物量数据和模型预测值之间是否存在显著性差异作出评价,从而实现对反演模型的适用性进行检验。运用精度公式对模型的精度进行检验,其公式为:

3 结果与分析

3.1 偏最小二乘回归模型

SPSS18.0对数据进行相关性分析,结果见表1。从表1可知,待选自变量与生物量都存在一定相关性,从方差扩大因子知遥感各波段间存在严重多重相关性。其中,B4/B2的波段组合的相关性最高,海拔、RVI、(B4+B5-B2)/(B4+B5+B2)等次之,垂直植被指数和中红外植被指数的相关性最低。将以上待选自变量强制选入模型中,可根据构建模型的R2不断调整自变量组合,在综合考虑相关性大小和模型显著性的基础上,结合自变量之间的多重相关性,最终确定选择自变量B1、B2、B3、B4、B5、NDVI、RVI、DVI、B4/B2、B3/B1、(B4+B5-B2)/(B4+B5+B2)、B3/B5、SL、海拔(E)、坡度(Sl)、坡向(As)共16个因子,采用偏最小二乘回归估测的方法进行建模。

表1 变量因子的相关性

注:** 在0.01水平(双侧)上显著相关;*在0.05水平(双侧)上显著相关。方差扩大因子大于10,说明存在较强的相关性,方差扩大因子大于100,说明存在极强的相关性。

运用Matlab2008a编程实现回归过程,运行提取出的建模样地数据,通过交叉有效性分析确定最佳成分个数为2,获得偏最小二乘回归模型为:

Y=2.999 5-590.570 2B1-676.037 3B2+133.998 0B3+4.180 6B4-1.078 0B5+0.041 5E+0.115 8As-0.217 4Sl-32.630 5NDVI+2.852 9RVI-9.304 8DVI+12.781 0B4/B2+84.827 9B3/B1+62.209 5(B4+B5-B2)/(B4+B5+B2)+16.886 0B3/B5-6.697 4SL。

将预留的25个检验样本带入预测模型进行配对检验,相关系数0.718,P<0.05,配对相关性显著。样地生物量实测值与预测值的拟合曲线(如图2)。通过对预测值与实测值的精度分析比较,生物量实测平均值为5.13 t,模型预测平均值为5.64 t,精度为90.1%。因此,模型在适用性与精度上都满足要求。

3.2 主成分分析模型

在SPSS 18.0中,利用降维因子分析模块进行主成分分析,按累积方差贡献率≥85%的准则,建立了前k个主成分(见表2)。由表2可知,当主成分提取到前三个时,样本方差累积贡献率达到87.747%>85%,原则上已涵盖了原始变量的主要信息,符合主成分提取要求。以生物量作因变量,前四个主成分累积的贡献率为92.986%,考虑取前四个主成分进行森林生物量估测,代替原始变量,保存前四个主成分因子作为自变量构建模型。

图2 样地生物量实测值与偏最小二乘预测值的拟合曲线

成分特征值方差/%方差累计/%19.55850.30550.30525.36028.21378.51831.7539.22987.74740.9955.23992.986

利用统计软件SPSS拟合得到主成分多元线性回归模型:

Y=68.460+18.051P1+2.694P2-6.347P3+5.646P4。

(3)

其中:Y为森林生物量(t);P1~P4为提取的前四个主成分。

模型经方差分析,F值为2.792,Sig.=0.035,表明了因变量和自变量之间线性关系显著;模型拟合数据显示多元线性模型的复相关系数(R)0.411,拟合情况良好。

将预留的25个检验样本带入预测模型进行配对检验,相关系数0.530,P<0.05,配对相关性显著。样地生物量实测值与预测值的拟合曲线(如图3),对预测值与实测值的精度分析比较,生物量实测平均值为5.13 t,模型预测平均值为4.43 t,精度为86.42%。因此,模型在适用性与精度上都满足要求。

3.3 生物量估测结果

基于TM影像和DEM图像生成16个自变量的栅格图像,在ERDAS Imagine软件中用Model maker模块,利用构建好的偏最小二乘回归模型,将通过样本配对检验与精度检验的模型反演到整个区域,通过林地掩膜去掉非林地数据后,得到密云县森林生物量遥感预测图(如图4)。图层中的每一个像元值即是等面积森林生物量值。根据像元统计信息得到研究区森林生物量估测值为893.388万t。

图3 样地生物量实测值与主成分分析预测值的拟合曲线

图4 密云县森林生物量等级分布

4 结论

通过对遥感因子、地形因子与生物量进行相关性分析,选取了16个因子作为自变量,建立了森林生物量估测的偏最小二乘模型,用预留样本对其进行样本配对与精度检验,得到实测值与预测值存在显著相关性,精度达到90.1%。利用偏最小二乘法既解决了自变量多重相关性问题,又能提取出对因变量解释高的信息。

将通过检验的模型在反演到整个研究区,得到森林乔木生物量估测值为893.388万t,与同类型研究比较[19-20],得到的结果具有一定的参考价值。

结合TM影像和森林资源一类调查数据,利用偏最小二乘回归估测区域尺度上的森林地上生物量获得较好的预测结果。对于开展全国范围的生物量估算、森林生物量的动态监测和定量评价具有借鉴作用。

[1] 赵敏,周广胜.基于森林资源清查资料的生物量估算模式及其发展趋势[J].应用生态学报,2004,15(8):1468-1472.

[2] 张志,田昕,陈尔学,等.森林地上生物量估测方法研究综述[J].北京林业大学学报,2011,33(5):144-150.

[3] Tomppo E, Nilsson M, Rosengren M, et al. Simultaneous use of Landsat-TM and IRS-1C AWiFS data in estimating large area tree stem volume and aboveground biomass[J]. Remote Sensing of Environment,2006,82(1):156-171.

[4] 王臣立,牛铮,郭治兴,等.基于植被指数和神经网络的热带人工林地上蓄积量遥感估测[J].生态环境学报,2009,18(5):1830-1834.

[5] 徐天蜀,张王菲,岳彩荣.基于PCA的森林生物量遥感信息模型研究[J].生态环境,2007,16(6):1759-1762.

[6] 范文义,张海玉,于颖,等.三种森林生物量估测模型的比较分析[J].植物生态学报,2011,35(4):402-410.

[7] 游先祥.遥感原理及在资源环境中的应用[M].北京:中国林业出版社,2003.

[8] Chander G, Markham B. Revised landsat-5 TM radiometric calibration procedures and postcalibration dynamic ranges[J]. Geoscience and Remote Sensing, IEEE Transactions on,2003,41(11):2674-2677.

[9] 陈传国,朱俊凤.东北主要林木生物量手册[M].北京:中国林业出版社,1989.

[10] 冯宗炜,王效科,吴刚.中国森林生态系统的生物量和生产力[M].北京:科学出版社,1999.

[11] 刘琪璨.嵌套式回归建立树木生物量模型[J].植物生态学报,2009,33(2):331-337.

[12] 国庆喜,张锋.基于遥感信息估测森林的生物量[J].东北林业大学学报,2003,31(2):13-16.

[13] 郭志华,彭少麟,王伯荪.利用TM数据提取粤西地区的森林生物量[J].生态学报,2002,22(11):1832-1839.

[14] 范文义,李明泽,杨金明.长白山林区森林生物量遥感估测模型[J].林业科学,2011,47(10):16-20.

[15] 张正健,刘志红,郭艳芬,等.偏最小二乘在遥感监测西藏草地生物量上的应用[J].草地学报,2009,17(6):735-739.

[16] 吴开亚,王玲杰.生态足迹及其影响因子的偏最小二乘回归模型与应用[J].资源科学,2006,28(6):182-188.

[17] 杜晓明,蔡体久,琚存勇.采用偏最小二乘回归方法估测森林郁闭度[J].应用生态学报,2008,19(2):273-277.

[18] 王惠文,吴载斌,孟洁.偏最小二乘回归的线性与非线性方法[M].北京:国防工业出版社,2006:97-127.

[19] 董宇.基于遥感信息估测将乐县森林生物量的研究[D].北京:北京林业大学,2012.

[20] 王光华,刘琪璟.基于TM影像估算北京山区乔木林生物量[J].福建林学院学报,2012,32(2):120-124.

Estimating Forest Biomass by Partial Least Squares Regression/

Liu Qiongge, Peng Daoli, Tu Yunyan, Li Yanli, Gao Dongqi(Beijing Forestry University, Beijing 100083, P. R. China)//

1) “十二五”农村领域国家科技计划课题(2012AA102001-5);国家级林业推广项目(201145)。

刘琼阁,女,1987年9月生,北京林业大学林学院,硕士研究生。E-mail:qionggeliu@126.com。

彭道黎,北京林业大学林学院,教授。E-mail:dlpeng@bjfu.edu.cn。

2013年6月30日。

S757.2

责任编辑:王广建。

猜你喜欢
密云县样地生物量
森林资源监测地面固定样地优化研究
额尔古纳市兴安落叶松中龄林植被碳储量研究
昆明市主要绿化树种阈值测定与分析
基于角尺度模型的林业样地空间结构分析
轮牧能有效促进高寒草地生物量和稳定性
基于灰色关联度分析的生态清洁小流域影响因子研究
——以北京市密云县为例
生物量高的富锌酵母的开发应用
全力抓好学校体育工作促进学生健康幸福成长
基于SPOT-5遥感影像估算玉米成熟期地上生物量及其碳氮累积量
北京市密云县轮状病毒和杯状病毒腹泻流行特征分析