涂云燕,彭道黎
(北京林业大学, 北京100083)
基于PCA与SPOT-5的森林碳储量估测
涂云燕,彭道黎
(北京林业大学, 北京100083)
以北京市延庆县为研究对象,利用遥感和地学数据,分析其与地面碳储量的相关关系,探讨基于遥感和地学信息的森林碳储量遥感估测。利用森林资源二类调查数据和2004年SPOT-5遥感影像,选取B1、B2、B3、B44个单波段,IDVI、 IRVI、INDVI3种植被指数以及海拔、坡度共9个因子,对这9个因子进行降维,并提取主成分,建立基于主成分回归的森林碳储量估测方程。结果表明:模型复相关系数为0.892; 用30个独立样本检验模型的可靠性与精度,相关系数为0.769,精度达到91.60%。该方程可用于森林地上部分碳储量估测。
森林;遥感信息;森林碳储量;主成分回归法; 估测
森林生物量对评价森林生态系统生产力和陆地生态系统功能的都有重要的指标性意义,准确估算森林生态系统生物量对研究陆地生态系统碳循环及全球气候变化研究具有重要意义[1-2],森林生物量监测技术有传统的样地实测法(直接收获法,生物量转换因子法,生物量转换因子连续函数法)[3-5]与以遥感技术和地理信息系统等先进手段估测森林生物量的遥感信息模型法。遥感信息模型方法有遥感信息参数与生物量拟合关系法、遥感数据与过程模型融合方法、基准样地法、人工神经网络模型法[6]。估算森林碳储量的方法主要有生物量法、蓄积量法、涡度相关法、箱式法及遥感估算法等。本文应用遥感估算的方法,即通过卫星获得监测区的遥感信息,结合地学信息,并与森林碳储量进行相关性分析的基础上,通过建立两者的拟合方程来估算森林碳储量。大大提高了碳储量估算的准确性和快捷性,且不会对生态系统产生不必要的干扰及扰动。在碳储量定量评价中有线性回归估测,非线性的KNN与神经网络法[7-8]。线性模型主要解决自变量间共线性问题,非线性系统应用相对复杂。主成分回归方法能有效解决自变量间共线性问题。本文以北京市延庆县为研究对象,选取SPOT-5影像,在主成分分析的基础上,利用多元线性回归建立碳储量遥感估算模型,对延庆县乔木林地上部分碳储量进行定量估测。
延庆县地理坐标为 N40°16′~ 40°47′,E115°44′~116°34′。东临怀柔,南连昌平,西、北两面与河北怀来、赤诚接壤,西南是官厅水库,三面环山,一面临水,是连接内蒙、河北坝上以及北京平原地区的过渡地带,是华北地区五大风廊之一,也是风沙进入北京城的咽喉要道。该县总面积1 992.7 km2,属于大陆性季风气候,是暖温带与中温带、半湿润与半干旱气候的过渡带,年平均气温8.8℃,年平均降水量为493 mm。地势平坦宽阔,局部有低山和丘陵。山区多为中山,平均海拔1 000 m。原始植被类型为暖温带落叶阔叶林和温带针叶林。该地区广泛分布着以侧柏Platycladus orientalis(Linn.)Franco、刺槐 Robinia pseudoacacia L.、油松Pinus tabuliformis、柞树Xylosma racemosum、杨树Populus spp.等为建群种的森林。
选取2004年5月23日SPOT-5遥感影像数据,该数据多光谱分辨率为10 m,全色波段分辨率为2.5 m。用1∶5万的地形图对其进行几何精校正,校正误差范围在0.5个像元以内,并利用延庆县行政区界进行不规则剪切得到延庆县2004年SPOT-5影像。将GPS定位样点与DEM、SPOT-5多光谱影像及三种植被指数影像进行叠加,提取样地的遥感与地学因子。其中地形因子包括坡度、海拔,光谱因子包括 IDVI、IRVI、INDVI及 B1、B2、B3、B44个原始波段值。
利用二类调查样地的每木检尺数据和相对生长式[9]计算树干、树枝、树叶、树根生物量,最后,得出地面样地每公顷生物量。用不同树种中的碳密度与生物量相乘可以得到不同树种的碳含量,实现生物量与碳密度及碳储量之间的转换,即可以将现有数据转变成森林植被碳储量,从而得到样地地上部分的每公顷碳储量[10-11]。利用2005年北京市延庆县森林资源二类调查样地数据,采用系统抽样抽取60个样地,用遥感与地学因子为自变量,碳储量为因变量建立主成分回归模型。用30个样地数据作为独立检验样本。
首先进行碳储量与自变量间相关性分析,坡度、海拔、IDVI、IRVI、INDVI及 B1、B2、B3、B4与碳储量都存在较好的相关性。但各自变量间存在共线性。由于线性回归中自变量系数是Xi的每单位增量而引起的因变量均值的变化。如果自变量间存在多重共线性,回归系数对样本数据的微小变化将变得非常敏感,如利用这9个因子直接建模,会存在严重多重相关性,不仅使模型稳定性变差,还会出现病态特征[12]。但直接剔出显著相关的变量,可能会造成信息损失,建立模型精度会受影响。因此,需要利用相关性对这些变量加以“改造”,用为数较少的新变量来反映原变量所提供的大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析能很好地消除自变量之间的共线性,且在不丢失自变量信息的条件下,剔除冗余信息,将原始自变量转化为互相独立的几个新变量。
在SPSS18.0环境下,导入用于建模的60个样地数据。利用因子分析模块进行主成分分析,按累积方差贡献率≥85%的准则,建立前k个主成分[13]。
表1 主成分矩阵及方差Table 1 Principal component matrix and variance
由表1可知,前3个主成分累积的贡献率为92.125%,涵盖了原始变量的主要信息,符合主成分提取要求。由因子载荷分析表明,第一主成分主要是反映了遥感信息,第二、三主成分主要反映坡度与海拔信息。
保存前3个主成分的得分值,将其因子得分值作为自变量,碳储量作为因变量引入模型。利用统计软件SPSS拟合得到主成分多元线性回归模型:
Y=23.127+0.783X1-2.225X2+4.438X3。 (1)式(1)中:Y森林碳储量 (t/hm2),X1~ X3分别为3个主成分值(PCA1, PCA2, PCA3)。相关统计数据结果表明:模型经方差分析,F值为189.641,SSig.f=0.001,证明了因变量和自变量之间线性关系的存在,回归效果显著;模型拟合数据显示主成分回归模型的复相关系数(R)是0.892,拟合情况好,可用于延庆县森林碳储量估测。
对模型的可靠性检验采用F检验[14]。
F检验是用实测值与预测值组成成对值,建立线性回归方程y=a+bx,如果模型拟合的很好,常数项(a)和回归系数(b)就分别趋近于0和1。随机抽取30个独立样地计算林分地上部分碳储量并将其作为自变量,本研究建立的模型所计算出来的碳储量为因变量,建立二者的线性回归方程:y=0.763+0.854x,相关系数R2为0.802,拟合效果好。通过F检验,SSig.f=0.000小于0.01,结果表明:在α=0.01可靠性条件下,模型估测林分蓄积量理论值与外业调查实测值无显著差异。
精度=1-[实测值-估测值]/实测值。碳储量拟合值为25.51 t/hm2,实测的碳储量为27.85 t/hm2,估测精度为91.60%。
在相同条件下用所抽取的60个样地进行逐步回归,得到的判读模型为:
Y=-6.832+1.903B3+3.091INDVI+1.216H海拔高。(2)式(2)中:Y森林碳储量(t/hm2)。相关统计数据结果表明:模型经方差分析,SSig.f=0.001,证明了因变量和自变量之间线性关系的存在,回归效果显著;模型拟合数据显示主成分回归模型的复相关系数(R)是0.719,拟合情况较好。对逐步回归模型的可靠性与精度进行验证,其可靠性与精度都没有主成分回归模型的好。
在ERDAS里把处理好的图层与DEM模型、IDVI、IRVI、INDVI叠加,采用目视解译提取常绿阔植被图层,提取前3主成分图像。利用已建立的主成分方程,在ERDAS的model里进行代数运算从而对延庆县2004年的SPOT-5影像进行反演,计算每个像元碳储量,把所有像元相加得到延庆县地上部分碳储量估测值。
以延庆县森林为研究对象,选取与森林碳储量相关的多个遥感及样地因子进行主成分分析,提取主成分,再利用主成分值与森林碳储量建立估测模型,既消除了原始变量的共线性,还起到了降维与简化模型的作用,是估测碳储量的一种有效方法。利用SPOT-5数据和森林资源清查资料结合建立的森林碳储量估测模型,用随机抽样的30个样本检验了模型的适用性,验证了模型的精度。结果表明模型的适用性强,精度达到91.60%。用该模型对延庆县碳储量进行反演,有效地解决了大区域森林碳储量估测。
由于SPOT-5遥感影像不能穿透植被提取林下植被及土壤信息,因此本研究的森林碳储量估测只是针对乔木林的碳储量。对于土壤、地下植被的碳储量李素敏等采用传统实测法对杨树林生态系统植被和土壤碳贮量及其空间分布进行了定量研究,得到了杨树人工林生态系统的碳贮量及其空间分布的规律[15]。伴随国家对林业工程的投入,更高分辨率、更广泛的遥感数据将引入林业应用中,森林整个生态系统碳储量估测有望从传统的实测法转向大面积的遥感估测。
[1] 李海奎,雷渊才.中国森林植被生物量和碳储量评估[M].北京:中国林业出版社,2010.
[2] Brown S, Sathaye J, Canell M, et al. Mitigation of carbon emission to the atmosphere by forest management[J].Common For. Review, 1996, 75(1):80-91,109,111-112.
[3] 曹 娟,田大伦,闫文德,等.喀斯特城市刺槐梓木混交林生物量与碳储量研究[J].中南林业科技大学学报,2011,5(3):135-139.
[4] Brown S, Lugo A E. Biomass of tropical forests :A new estimate based on forest volumes [J].Science,1984,223:1290-1293.
[5] Brown S L, Schroeder P, Kern J S. Spatial distribution of biomass in forests of the eastern USA[J].Fr. Ecol. Man.,1999,123:81-90.
[6] 徐新良,曹明奎.森林生物量遥感估算与应用分析[J].地理信息科学,2006,8(4):122-128.
[7] Fazakas Z,Nillsson M, Olsson H. Regional forest biomass and wood volume estimation using satellite data and ancillary data[J].Agricultural and Forest Meteorology,1999,99: 417-425.
[8] 王淑君,管东生.神经网络模型森林生物量遥感估测方法的研究[J].生态环境,2007,16(1):108-111.
[9] 冯宗炜,王效科,吴 刚.中国森林生态系统的生物量和生产力[M].北京:科学出版社,1999:117-129.
[10] 吴庆标,王效科,段晓男,等.中国森林生态系统植被固碳现状和潜力[J].生态学报,2008,2(28):517-524.
[11] 王让会,衣怀峰,宁虎森,等.基于NDVI的人工植被碳储量估算[J].遥感技术与应用[J].2011,4(22):399-404.
[12] 王力宾,顾光同.多元统计分析模型、案例及SPSS应用[M].北京:经济科学出版社,2010.
[13] 何晓群.多元统计分析第二版[M].北京:中国人民大学出版社,2008: 161-162.
[14] 余坤勇,林 芳,刘 健,等.基于RS的闽江流域马尾松林分蓄积量估测模型研究[J].福建林业科技,2006,1(33):16-23.
[15] 李素敏,田大伦,闫文德,等.喀斯特地区城市杨树人工林碳贮量及其空间分布[J].中南林业科技大学学报,2011,5(31):140-145.
Forest carbon storage estimation based on PCA and SPOT-5
TU Yun-yan, PENG Dao-li
(Beijing Forestry University, Beijing 100083, China)
∶ A study of remote sensing estimation of aboveground forest carbon storage was conducted in Yanqing county of Beijing by using the remote sensing and geo-science data, and the relationship between remote sensing and geosciences information and the ground forest carbon storage was analyzed, investigate forest carbon storage estimation method based on remote sensing and geosciences information. By using forest resource inventory data and SPOT5 images taken in 2004, and selecting 9 factors, which included 4 multispectral bands of B1,B2,B3,B4, 3 vegetation indexes of IDVI, IRVI, INDVI, and slope and elevation, firstly the dimension reduction of the 9 factors were executed, then the principal components were extracted out, and finally a forest carbon storage model based on the analysis and the SPOT5 images was set up by regression method. The results show that the multiple correlation coefficient R2was 0.892;the reliability and accuracy of the model were examined with 30 independent samples, the correlation coefficient was 0.769,the accuracy reached 91.60%。The model can be used to estimate forest carbon stocks in aboveground. Under the same conditions,principal component regression is superior to stepwise regression estimation.
∶ forest; information of remote sensing; forest carbon storage; principal component regression method; estimation
S718.55
A
1673-923X (2012)06-0101-03
2012-01-10
国家“十一五”林业科技支撑计划(2006BAD23B05)
涂云燕(1986—),女,贵州省仁怀人,硕士研究生,主要从事森林资源监测与评价研究; E-mail:yunyantu@163.com
彭道黎(1963—),男,湖南衡阳人,教授,博士研究生导师,主要从事森林环境监测与评价研究;E-mail:dlpeng@bjfu.edu.cn
[本文编校:文凤鸣]