黄兴召,王泽夫,徐小牛
(安徽农业大学 林学与园林学院,安徽 合肥 230036)
生物量转换因子连续函数的拟合方法比较
黄兴召,王泽夫,徐小牛
(安徽农业大学 林学与园林学院,安徽 合肥 230036)
利用生物量转换因子连续函数估算森林生物量已成为普遍使用的方法,使用不同的拟合方法提升生物量转换因子连续函数的计算精度成为当前的研究热点之一。以安徽省和福建省2个区域的杉木Cunninghamia lanceolata人工林为研究对象,选择不同年龄序列的典型杉木人工林,分别在2个区域设置0.06 hm2的样地53块,得出每个样地杉木林分生物量、林分蓄积量和生物量转换因子(fBEF)均存在显著差异(P<0.01)。使用最小二乘法、非线性混合模型法和贝叶斯分层法分别拟合生物量转换因子连续函数,决定系数(R2)分别为0.643,0.802和0.804;平均偏差(dMD)分别为0.376,0.233和0.228。通过F检验比较3种方法的拟合效果,最小二乘法的拟合效果与非线性混合模型法和贝叶斯分层法之间有显著差异;非线性混合模型法的拟合效果和贝叶斯分层法之间无显著差异。估算林分生物量时,使用非线性混合模型和贝叶斯分层方法可以显著提升林分生物量的估算精度。图1表3参37
森林经理学;杉木;最小二乘法;非线性混合模型法;贝叶斯分层法
Abstract:Biomass equations for the biomass expansion factor (fBEF) have been widely applied for accurate stand biomass estimations.The question here is how to improve the fitting precision of these biomass expansion factor (fBEF) equations by using different methodologies.Stand biomass data were obtained from 53 permanent sample plots located in Cunninghamia lanceolata plantations of Anhui and Fujian Provinces across China.The least squares approach,the nonlinear mixed model approach,and the hierarchical Bayesian approach were applied to establish BEF equations so as to test the effect of regions.Split-plot design with regions of Anhui and Fujian Provence and sample plots as replications.Results showed significant differences between Fujian and Anhui Provinces for stand biomass,volume,and fBEFat different ages.The R2and mean deviation (dMD)values for the least squares approach was R2=0.643,dMD=0.376;for the nonlinear mixed model approach was R2=0.802,dMD=0.233;and for the hierarchical Bayesian approach was R2=0.804,dMD=0.228.Also,there were highly significant differences in fitted results between the least squares and the nonlinear mixed model approaches,as well as between the least squares and the hierarchical Bayesian approaches (P < 0.01).However,no significant differences were found between the nonlinear mixed model approach and the hierarchical Bayesian approach (P=0.547).Thus,both the mixed model approach and the Bayesian hierarchical approach were effective methods for estimating stand biomass at the regional scale. [Ch,1 fig.3 tab.37 ref.]
Key words:forest management;Cunninghamia lanceolata;least squares approach;nonlinear mixed model approach;hierarchical Bayesian approach
如何精准估算和预测森林生物量以及碳储量成为当前的研究热点[1]。生物量转换因子(fBEF,biomass expansion factors)是林分生物量与木材蓄积的比值,因它可以利用森林资源清查数据计算,已广泛用于林分生物量的估算。 BROWN 等[2-5]和 FANG 等[6-9]利用不同森林类型生物量转换因子的平均值乘以相应森林类型的总蓄积,得到不同森林类型的生物量。FANG等[8-11]利用生物量转化因子连续函数,提升了森林生物量的估算精度。生物量转换因子连续函数fBEF=a+b/V,其中a和b为参数,fBEF为生物量转换因子,V为林分蓄积。该方程符合林分的生长规律,具有普遍适用性[10]。利用生物量转换因子连续函数估算森林生物量已成为普遍使用的方法,在拟合方法上均是使用经典统计学方法。贝叶斯统计学认为未知参数为随机变量,应用一个概率分布去描述未知参数的未知分布,这个概率分布是在抽样前就有的关于未知参数的先验信息的概率描述,并利用后验分布检验先验信息。贝叶斯统计已被广泛应用于林业的研究中, 如林木的径阶分布规律[12-13]、 立木胸径和树高生长模型[14]、 立木生物量模型[15-17]。 利用贝叶斯统计学的方法拟合生物量转换因子连续函数尚未见报道。另一方面,以往研究均是利用固定的生物量转换因子连续函数估算某一类型森林生物量,尚未考虑区域对该类型森林生物量的影响。混合模型和贝叶斯分层在拟合生物量转换因子连续函数时,可以解决区域对某一类型森林生物量的影响。混合模型既可以反映总体平均变化趋势,又可反映个体(区域)之间的差异[18-19],因此特别适用于多层次(区域)的数据[20]。杉木Cunninghamia lanceolata是中国南方重要用材树种。根据第8次全国森林资源调查,杉木天然林面积居第9位,人工林面积居首位[21]。本研究以不同区域杉木人工林生物量数据为基础,分别使用经典统计学方法、混合模型方法和贝叶斯分层法拟合生物量转换因子连续函数,比较3种方法的预估精度,阐述区域对林分生物量的影响,以期为森林生物量的精准估算提供技术支撑。
以安徽省六安市马鬃岭林场和福建省建瓯市东安林场2个区域的杉木人工林为研究对象。马鬃岭林场位于 31°10′~31°30′N, 115°31′~115°50′E, 属于北亚热带季风气候, 年均气温为 13.5 ℃, 年降水量为1 200.0 mm。 林地土壤为山地黄棕壤, 土层厚达 50 cm, pH 5.5~6.3。 东安林场位于 26°30′~27°20′N,118°00′~119°20′E,属于亚热带季风气候,年均气温为18.8℃,年降水量为1 700.0 mm。林地土壤为红壤,土层厚达40 cm,pH 5.2~6.0。
2014年7-9月,选择不同年龄序列的典型杉木人工林,分别在2个区域设置0.06 hm2的样地53块(马鬃岭林场26块,东安林场27块)。在样地调查的基础上,按照胸径分布(8,10,12,…)选择样木2~3株·径级-1伐倒测量,共计57株样木(马鬃岭林场28株,东安林场29株)。在生物量调查中,为了提高样木生物量的测定精度,采用 “分层切割法”测定样木的树干、树皮、树枝、树叶(地上部分)的鲜质量,并分别取样品测定。各器官分别取样后将样品带回实验室,在105℃下进行30 min的杀青处理,然后将烘箱的温度调到80℃烘干至恒量,测出各组分样品的含水率,然后根据样品含水率推算出各组分的生物量。在样地每木检尺和立木地上生物量测定的基础上,根据立木的生物量(y)方程y=a(D2H)b(D和H分别为胸径和树高,两区域参数a和b的值分别是6.30×10-2和2.47,7.40×10-2和2.39);根据立木材积(V)方程 V=aDbHc(两区域参数 a,b 和 c 的值分别是 5.18×10-5,1.85 和 1.02,5.20×10-5,1.78和1.03),计算出样地的林分生物量和蓄积(表1)。根据公式fBEF=B/V(B为林分生物量,V为林分蓄积量)计算生物量转换因子。
1.3.1 生物量转换因子连续函数 FANG等[8-11]利用倒数方程来表示生物量转换因子和林分蓄积之间的关系。方程表达式为fBEFi=a+b/Vi。其中:fBEFi为第i块样地的生物量转换因子,Vi为第i块样地的林分蓄积,a和b为方程参数。当林分为成熟林(蓄积量很大)时,fBEF趋向稳定;当林分为幼龄林(蓄积量很小)时, fBEF很大[10]。
1.3.2 转换因子连续函数拟合方法 ①最小二乘法。经典统计学通常使用最小二乘法。本研究使用最小二乘法拟合式(1)。最小二乘法通过误差的平方最小化求解参数,其公式为:
表1 不同区域的杉木林样地信息Table 1 Descriptive statistics of Cunninghamia lanceolata plots sampled at difference regions
通过生物量转化因子的实测值fBEFi与估计值a+b/Vi两者之差的平方和最小,求出参数a和b。②非线性混合模型方法。非线性混合模型是通过考虑回归函数依赖于固定和随机效应的非线性关系拟合方程[22]。非线性混合模型在式(1)中的表现形式如下:
式(3)中:p定义为概率分布(密度函数)。在经典统计学中通过最小二乘法计算参数θ的值,不同的θ有不同的分布;在贝叶斯统计中为利用概率分布p计算参数θ的值,θ为同一种的分布[23]。就是根据参数向量θ的先验信息推算其先验分布为π(θ)。没有样本信息时,只能根据先验分布对θ进行推算。在已知实测数据x的情况下,依照p(x,θ)对参数θ进行计算。计算公式:
式(4)称为贝叶斯公式的密度函数形式,即在实测数据x已知情况下,θ的条件分布π(θ|x),定义为θ的后验分布。基于后验分布π(θ|x)对θ进行统计,可以排除与θ无关的信息,使得推断更为有效合理。2个区域杉木人工林生物量转换因子和林分蓄积数据含有嵌套:包含区域间和样地间,这样的数据类型称之为分层数据[24]。本数据分为2层,第1层是区域间的生物量转换因子和林分蓄积数据,第2层为每个区域内样地的生物量转换因子和林分蓄积数据。利用贝叶斯分层模型估计异速生物量方程的参数时,首先要对参数a和b给出第2层(区域内)的先验π2(a,b)先验分布(通常为为信息的先验分布),使得参数a和b的后验分布π(a,b|d)在d给定下为以正常分布[25]。由贝叶斯定理计算参数θ及a和b的联合后验分布:
θ为参数a和b的先验分布。式(6)和式(7)计算θ的条件后验部分:
本研究使用2个区域杉木人工林生物量转换因子数据。分别使用最小二乘法、混合模型和贝叶斯分层方法拟合生物量转化因子连续函数。同时,使用决定系数(R2)和平均偏差(dMD)对拟合效果进行评价。R2和dMD的计算方法如下:
式(10)和式(11)中:yi为实际观测值,为样本平均值,y^i为模型预测值,n为样本数。采用F统计检验两两比较最小二乘法、非线性混合模型和贝叶斯分层方法之间的差异。F统计检验计算公式[26]:
式(12)中:STSSA,fdfA和STSSB,fdfB为两两比较时拟合的残差平方和及自由度。通过F值的大小来判定最小二乘法、混合模型和贝叶斯分层方法之间之间是否存在差异,为是否需要建立适用于区域的杉木生物量转化因子连续方程做出判断。数据统计分析及绘图使用R 2.14.0软件完成,其中非线性混合模型使用NLME程序包、贝叶斯分层方法使用R2WinBUGS程序包[27]。
图1表明:林分生物量、林分蓄积和fBEF随林龄呈现规律性变化。林分生物量和林分蓄积随林龄的增大而增加,fBEF随林龄的增大而降低。从12年生到31年生,林分生物量和林分蓄积的年平均增长率分别为5.33%和6.31%;fBEF的年平均减少率为5.22%。同时,比较不同区域各林龄(12年生、23年生、31年生)间林分生物量、林分蓄积和fBEF的差异,结果表明:不同区域间杉木林分生物量、林分蓄积和fBEF均存在显著差异(P<0.01)。因此,拟合生物量转换因子连续函数时,必须考虑区域因子对方程的影响。
图1 不同区域林分生物量、林分蓄积和生物量转换因子的比较Figure 1 Compared the stand biomass,volumes and fBEFat difference regions
分别使用最小二乘法、非线性混合模型法和贝叶斯分层法等3种方法拟合生物量转换因子连续函数,结果如表2所示:3种方法都可以拟合生物量转换因子连续函数(P<0.01)。其中非线性混合模型参数βa和βb为参数a和b的固定效应值,σ和σ为参数的区域随机效应值,σab为参数的区域随机效应的协方差值。贝叶斯分层方法对生物量转换因子连续函数进行拟合时,通过设置迭代次数由马尔科夫蒙特卡洛链的收敛效果评估参数a和b的后验分布。本研究利用贝叶斯分层方法拟合时均设置10 000次迭代,贝叶斯分层方法使用3条马尔科夫蒙特卡洛链(迭代有3个颜色),在500开平稳始迭代,且演进过程也比较稳定,可以断定参数值可以较好的收敛。表2中a1和b1,a2和b2分别代表福建和安徽2个区域生物量转换因子连续函数的参数值。
表2 生物量转换因子连续函数的不同方法拟合结果Table 2 BEF-stem volume equation fitted results of different approaches
使用3种方法拟合生物量转换因子连续函数,拟合结果如表3。最小二乘法、非线性混合模型法和贝叶斯分层法的决定系数R2分别为 0.643,0.802和 0.804;平均偏差分别为0.376,0.233和0.228。从R2和平均偏差初步得出非线性混合模型法和贝叶斯分层法拟合效果相似。使用F检验两两比较拟合效果,结果表明:最小二乘法的拟合效果与非线性混合模型法和贝叶斯分层法之间有显著差异,非线性混合模型法和贝叶斯分层法之间无显著差异。非线性混合模型法和贝叶斯分层法均考虑了区域因子,可以显著提升生物量转化因子连续函数的拟合效果。
表3 不同方法的拟合效果比较Table 3 Comparing the fitted results at different approaches
本研究偏重拟合方法研究,利用非线性混合模型和贝叶斯分层方法拟合生物量转化因子连续函数时,以区域设置为随机效应消除其对林分生物量估算的影响,可以显著提升生物量转化因子连续函数的拟合效果。参照曾伟生[28]利用混合模型估算立木生物量的方法,以区域为随机效应利用混合模型拟合生物量转换因子连续函数,进一步证实区域对生物量转换因子(fBEF)的估算存在显著影响。符利勇等[29]利用混合模型估算马尾松Pinus massoniana立木生物量,证实不同起源的马尾松立木生物量存在差异,并且区域和起源对立木生物量的影响存在交互作用。贝叶斯分层方法是通过迭代[30]把一系列复杂的高维问题转化为简单的低维问题,由1条或几条收敛的马尔科夫链蒙特卡罗链[31]拟合生物量转化因子连续函数。本研究中的贝叶斯分层方法产生3条马氏链即可达到一个平稳状态。相对于经典统计方法利用渐进方差估计建模过程的精确性,贝叶斯原理则利用马氏链的平稳分布和收敛来估计[32-33],因为在平稳分布中抽取的样本包含许多不确定的信息,这些不确定信息对建模过程产生的影响归于马氏链是否真正平稳分布与收敛,而不是在估计中运用样本产生的方差来断定[34-35]。
对于立木生物量的拟合方法的研究中,MAURICIO等[15]利用先验信息的贝叶斯方法可以减少样本量。ZHANG等[16]比较了最小二乘法、没有先验信息的贝叶斯方法和有先验信息的贝叶斯方法3种方法。结果表明:先验信息在立木生物量的拟合中发挥重要作用。黄兴召等[17]证明在立木样本量小于50株时,有先验信息的贝叶斯方法的拟合精度明显高于最小二乘法。这些算法的比较其样本均来自同一个区域。CHEN等[36]在大区域尺度拟合立木生物量时,发现贝叶斯分层方法显著优于有先验信息的贝叶斯方法,但是,在大区域拟合生物量中,尚未见非线性混合模型和贝叶斯分层之间的差异研究。
本研究基于不同区域杉木人工林生物量和林分蓄积量数据,系统地介绍如何利用最小二乘法、非线性混合模型法和贝叶斯分层方法拟合生物量转换因子连续函数,并证实非线性混合模型法和贝叶斯分层方法可以显著提升杉木人工林生物量的估算效果,为大尺度估算林分生物量提供理论参考。通过F检验,比较3种方法的拟合效果,发现以区域为随机效应和分层基础的非线性混合模型法和贝叶斯分层法可以显著提升林分生物量的预估精度。区域之间的地理位置、气候条件、土壤条件等均不相同,这些是造成生物量差异的主要因子[37]。区域作为随机效应可以很好地解释林分生物量差异的原因,进一步区分哪种因素造成了生物量的差异,已成为今后研究的重要内容之一。
[1] TOMPPO E,GSCHWANTNER T,LAWRENCE M,et al.National Forest Inventories:Pathways for Common Reporting[M].New York:Springer,2010:23.
[2] BROWN S L,LUGO A E.Aboveground biomass estimates for tropical moist forests of the Brazilian amazon [J].Interciencia,1992,17(1):8-18.
[3] SCHROEDER P,BROWN S,MO Jiangming,et al.Biomass estimation for temperate broadleaf forests of the United States using inventory data [J].For Sci,1997,43(3):424-434.
[4] BROWN S L,SCHROEDER P E.Spatial patterns of aboveground production and mortality of woody biomass for eastern U.S.forests [J].Ecol Appl,1999,9(3):968-980.
[5] BROWN S L,SCHROEDER P E,KERN J S.Spatial distribution of biomass in forests of the eastern USA [J].For Ecol Manage,1999,123(1):81-90.
[6] 方精云,刘国华,徐嵩岭.我国森林植被的生物量和净生产量[J].生态学报,1996,16(5):497-508.FANG Jingyun,LIU Guohua,XU Songling.Biomass and net production of forest vegetation in China [J].Acta Ecol Sin,1996,16(5):497-508.
[7] FANG Jingyun,WANG G G,LIU Guohua,et al.Forest biomass of China:an estimation based on the biomass-volume relationship [J].Ecol Appl,1998,8(4):1084-1091.
[8] FANG Jingyun,CHEN Anping,PENG Changhui,et al.Changes in forest biomass carbon storage in China between 1949 and 1998 [J].Science,2001,292(5525):2320-2322.
[9] FANG Jingyun,OIKAWA T,KATO T,et al.Biomass carbon accumulation by Japan’s forests from 1947-1995 [J].Glob Biogeochem Cycl,2005,19(2).doi:10.1029/2004GB002253.
[10] FANG Jingyun,WANG Zhangming.Forest biomass estimation at regional and global levels,with special reference to China’s forest biomass [J].Ecol Res,2001,16(3):587-592.
[11] FANG Jingyun,GUO Zhaodi,PIAO Shilong,et al.Terrestrial vegetation carbon sinks in China,1981-2000 [J].Sci China Ser D Earth Sci,2007,50(9):1341-1350.
[12] GREEN E J,ROESCH F A,SMITH A F M,et al.Bayesian estimation for the three-parameter Weibull distribution with tree diameter data [J].Biometrics,1994,50(1):254-269.
[13] BULLOCK B P,BOONE E L.Deriving tree diameter distributions using Bayesian model averaging [J].For Ecol Manage,2007,242(2/3):127-132.
[14] CLARK J S,WOLOSIN M,DIETZE M,et al.Tree growth inference and prediction from diameter censuses and ring widths [J].Ecol Appl,2007,17(7):1942-1953.
[15] ZAPATACUARTAS M,SIERRA C A,ALLEMAN L.Probability distribution of allometric coefficients and Bayesian estimation of aboveground tree biomass [J].For Ecol Manage,2012,277(4):173-179.
[16] ZHANG Xiongqing,DUAN Aiguo,ZHANG Jianguo.Tree biomass estimation of Chinese fir (Cunninghamia lanceolata) based on Bayesian method [J].PLoS One,2013,8(11):e79868.doi:10.1371/journal.pone.0079868.
[17] 黄兴召,陈东升,孙晓梅,等.基于异速参数概率分布的立木地上生物量估算[J].林业科学,2014,50(6):34-41.HUANG Xingzhao,CHEN Dongsheng,SUN Xiaomei,et al.Estimation of above-ground tree biomass based on probability distribution of allometric parameters [J].Sci Silv Sin,2014,50(6):34-41.
[18] GELMAN A.Analysis of variance:why it is more important than ever [J].Ann Stat,2005,33(1):39-42.
[19] GELMAN A,HILL J.Data Analysis Using Regression and Multilevel/Hierarchical Models[M].New York:Cambridge University Press,2007:46.
[20] KERY M.Introduction to WinBUGS for Ecologists:A Bayesian Approach to Regression,ANOVA,Mixed Models and Related Analyses [M].Amsterdam:Elsevier,2010.
[21] 贾治邦,张建龙,汪绚,等.中国森林资源报告:第7次全国森林资源清查[M].北京:中国林业出版社,2014:52-89.
[22] BAAYEN R H,DAVIDSON D J,BATES D M.Mixed-effects modeling with crossed random effects for subjects and items [J].J Mem Lang,2008,59(4):390-412.
[23] GILKS W R,THOMAS A,SPIEGELHALTER D J.A language and program for complex Bayesian modeling [J].J Roy Stat Soc,1994,43(1):169-178.
[24] FINLEY A O,BANERJEE S,CARLIN B P.An R Package for univariate and multivariatem hierarchical point-referenced spatial models [J].J Stat Softw,2007,19(4):1-24.
[25] GREEN E J,STRAWDERMAN W E.A comparison of hierarchical Bayes and empirical Bayes methods with a forestry application [J].For Sci,1992,38(2):350-366.
[26] BATES D M,WATTS D G.Non-linear regression analysis and its applications [J].J Mark Res,1988,60:856865.doi:10.1002/9780470316757.
[27] STURTZ S,LIGGES U,GELMAN A.R2WinBUGS:a package for running WinBUGS from R [J].J Stat Softw,2005,12(3):1-16.
[28] 曾伟生.全国立木生物量方程建模方法研究[D].北京:中国林业科学研究院,2011:28-42.ZENG Weisheng.Methodology on Modeling of Single-Tree Biomass Equations for National Biomass Estimation in China [D].Beijing:Chinese Academy of Forestry.2011:28-42.
[29] 符利勇,曾伟生,唐守正.利用混合模型分析地域对国内马尾松生物量的影响[J].生态学报,2011,31(19): 5797-5808.FU Liyong,ZENG Weisheng,TANG Shouzheng.Analysis the effect of region impacting on the biomass of domestic masson pine using mixed model[J].Acta Ecol Sin,2001,31(19):5797-5808.
[30] CLARK J S,GELFAND A E.Hierarchical Modeling for the Environmental Sciences:Statistical Methods and Applications [M].England:Oxford University Press,2006:135-142.
[31] HADFIELD J D.MCMC methods for multi-response generalized linear mixed models:the MCMCglmm R package[J].J Stat Softw,2010,33(2):1-22.
[32] BROOKS S P,GELMAN A.General methods for monitoring convergence of iterative simulations [J].J Comput Graph Stat,1998,7(4):434-455.
[33] PAAP R.What are the advantages of MCMC based inference in latent variable models? [J].Stat Neerland,2002,56(1):2-22.
[34] BOOTH J G,HOBERT J P.Maximizing generalized linear mixed model likelihoods with an automated Monte Carlo EM algorithm [J].J Roy Stat Soc Ser B Stat Methodol,1999,61(1):265-285.
[35] LELE S R.DENNIS B,LUTSCHER F.Data cloning:easy maximum likelihood estimation for complex ecological models using Bayesian Markov chain Monte Carlo methods [J].Ecol Lett,2007,10(7):551-563.
[36] CHEN Dongsheng,HUANG Xingzhao,SUN Xiaomei,et al.A comparison of hierarchical and non-hier archical Bayesian approaches for fitting Allometric larch (Larix spp.) biomass equations [J].Forests,2016,7(1):18.doi:10.3390/f7010018.
[37] BARRIO-ANTA M,BALBOA-MURIAS M A,CASTEDO-DORADO F,et al.An ecoregional model for estimating volume,biomass and carbon pools in maritime pine stands in Galicia (northwestern Spain) [J].For Ecol Manage,2006,223(1/3):24-34.
Comparison of fitting approaches with biomass expansion factor equations
HUANG Xingzhao,WANG Zefu,XU Xiaoniu
(School of Forestry&Landscape of Architecture,Anhui Agricultural University,Hefei 230036,Anhui,China)
S718.5
A
2095-0756(2017)05-0775-07
2016-11-28;
2017-02-20
国家重点研发计划资助项目(2016YFD0600304-03)
黄兴召,从事森林培育和生态系统管理研究。E-mail:xingzhaoh@163.com。通信作者:徐小牛,教授,博士,博士生导师,从事森林培育和地球物质化学循环等研究。E-mail:xnxu2007@ahau.edu.cn