梁文业,贺 鹏,肖前辉
(1.西藏林业调查规划研究院,拉萨850000; 2.国家林业局中南林业调查规划设计院,长沙 410014)
利用度量误差模型和分段建模方法建立云南云杉相容性立木材积和地上生物量模型
梁文业1,贺 鹏2,肖前辉2
(1.西藏林业调查规划研究院,拉萨850000; 2.国家林业局中南林业调查规划设计院,长沙 410014)
以云南云杉实测立木材积和地上生物量数据为例,利用度量误差模型方法和分段建模方法建立相容性的一元和二元立木材积和地上生物量模型。结果表明,无论常规模型还是分段模型二元立木材积模型的相关统计指标得到了大幅度的改进,而二元地上生物量模型的相关指标与一元模型相比差异不大;常规二元立木材积模型在小径阶下存在明显的偏差,分段模型从整体上能够有效地解决系统偏差问题;所建的分段一元立木材积模型和地上生物量模型的平均预估精度分别到了90%和95%,同时分段二元立木材积模型和地上生物量模型的平均预估精度均到了97%。
立木材积;地上生物量;度量误差模型;分段建模
在开展全国森林生物量和碳汇监测和评估的大背景下,建立合适通用性立木生物量模型已成为必然趋势。这种通用性不仅指模型适用区域范围的大小,同样也需要求模型在各个径阶下预估精度能够保持基本稳定,即模型在各个径阶下不能存在明显的偏差。
依托全国生物量调查建模项目,国家林业局中南林业调查规划设计院2011年负责采集的云南云杉的建模样本数据,严格按照立木生物量建模方法技术规程的要求,采用度量误差模型和分段建模的方法分别建立一元和二元与材积相容的地上生物量模型,并对两种方法建立的模型进行对比分析,以期为云南云杉建立合适的通用的与材积相容的地上生物量模型,为科学评价云南云杉植被群落生产力和森林质量和制定云南云杉生物量计量标准,以及为监测云南云杉林固碳释氧能力提供依据。
按照立木生物量建模样本采集技术规程[1]的要求采集样本,以云南省境内2011年6月至9月采集的152株云杉为样本。按照2,4,6,8,12,16,20,26,32,38cm以上共10个径阶;每个径阶至少取15株样木,且每个径阶组内的样本量按3个树高级均匀分布。根据云南省云杉的分布范围状况,按东、西、南、北、中均匀抽取,并且综合考虑立地条件、龄组结构等因素,确保所采集的样本具有充分的代表性。经内业数据处理后的立木数据基本统计情况如表1。
表1云杉(地上部分)建模样本数据基本统计情况表胸径D/cm树高H/cm材积V/dm3地上生物量DS/kg平均值16 5211 41 311 32 172 89最大值43 9032 602248 621044 25最小值1 601 800 710 40标准差12 017 61490 97238 68变动系数/%72 6966 64157 71138 06
一般回归模型都假定模型中自变量的观测值不含误差,而因变量的观测值含有误差。这种误差可能源于抽象误差、测量误差等,一般称其为度量误差。当自变量和因变量的观测值都含有度量误差时,通常的回归模型估计方法就不再适用了,而必需采用度量误差模型[2]。
非线性度量误差模型(及非线性度量误差联立方差组)与通常的回归估计方法的区别在于,它对模型系统的参数同时进行估计。其模型的向量形式为:
(1)
式中:xi是q维无误差变量的观测数据,yi是p维误差变量的观测数据,f是m维向量函数,yi是Yi的未知真值,误差的协方差矩阵记为cov(ei)=σ2ψ,ψ是ei的误差结构矩阵,σ2为估计误差。
地上生物量大部分来源于树干生物量,因此地上生物量与立木材积高度相关,在森林蓄积监测的基础上进行森林生物量监测,应该充分考虑与材积的相容性。设计与材积相容的二元生物量系统如下:
V=a0Da1Ha2
(2)
M=b0Db1Hb2
(3)
M=f(D,H)V=c0Dc1Hc2V
(4)
式中:V为立木材积(dm3);M为地上生物量(kg);D为直径(cm);H为树高(m);f(D,H)相当于立木材积与地上生物量之间的转换函数(也可以称为生物量转换因子BCF);a0,a1,a2,b0,b1,b2,c0,c1,c2为模型的参数,其中模型参数之间满足如下函数关系:
c0=b0/a0,c1=b1-a1,c2=b2-a2
(5)
采用10个径阶的建模样本数据建立立木材积模型和地上生物量模型可能存在明显的系统偏差,如小径阶的立木的材积和地上生物量的估计值存在较大偏差。如果所建的材积和地上生物量模型存在较大的系统偏差时,应采用分段建模的方法来消除这种偏差[3-4]。
根据已有的相关研究结果[3-4],材积和地上生物量模型一般在最小的4个径阶(2,4,6,8cm)存在明显的偏差。一般兼顾科学性和实用性,选择6cm作为分段建模的节点。因此需要分两段来建立相容性立木材积和生物量模型:
V1=a11Da12Ha13(D≥6cm)
(6)
M1=b11Db12Hb13=c11Dc12Hc13V1(D≥6cm)
(7)
V2=a21Da22Ha23(D<6cm)
(8)
M2=b21Db22Hb23=c21Dc22Hc23V2(D<6cm)
(9)
为了保证在节点处无缝对接,上述模型参数之间应该满足以下条件:
(10)
(11)
上述模型中只给出了二元模型的结构,一元模型的结构只需在二元模型的结构中移除含有H的项。
由于生物量和材积数据普遍存在着异方差性,在利用度量误差模型方法进行拟合时还要采取措施消除异方差的影响[5]。常用的方法有采用对数回归或者加权回归,由于地上各分项相容的模型系统无法采用对数回归的方法,所以文中均采用非线性加权回归的方法。关于权函数的选择,本文根据立木材积和地上生物量独立拟合方程的方差建立一元回归方程,权函数结构为w=1/f(D)2,D为直径。在采用ForStat 2.0软件按度量误差模型方法求解参数时,对每个方程两边乘以权重变量g=1/f(D)的方法进行处理。
根据曾伟生[6]的研究结果,采用检验样本进行适用性检验的做法不可取,应该利用全部样本(不分建模样本和检验样本)来建立模型,这样能够充分利用样本信息,使模型的预估误差最小。所以本文中采用所有样本建立生物量模型,并采用6个指标来对模型进行评价和检验。R2(确定系数),SEE(估计值的标准差),TRE(总相对误差),MSE(平均系统误差),MPE(平均预估误差)和MPSE(平均百分标准误差),其详细计算公式参见文献[7]。
这些指标中,R2和SEE是回归模型的最常用指标,反映了模型的拟合优度;TRE和MSE是反映拟合效果的重要指标,二者都应该控制在一定范围内(如±3%或者±5%),趋于0时效果最好;MPE是反映平均生物量估计值的精度指标;MPSE是反映平均单株林木生物量估计值的精度指标。另外,再进行分径阶检验时,以TRE和MSE两个指标来衡量在该径阶下是否存在明显的系统偏差。同时,相对残差分布图(相对残差是指模型残差乘以权重后的值)也是一个重要的评价方法。
表2和表3分别表示了常规模型和分段模型的参数估计值和相关的统计指标。从表3中可以看出,无论是常规模型还是分段模型从一元模型提高到二元模型时,立木材积模型的相关指标得到了较大幅度的改进。如确定系数R2从0.85左右提高到了0.99,估计值的标准差SEE下降了约75%,平均预估误差也大幅下降了7个百分点,二元模型的平均预估精度达到了97%以上。
从常规模型与分段模型对比来看,无论一元模型还是二元模型,模型的相关指标,如R2和SEE及MPE的差异很小。但是TRE和MSE两个指标,分段模型有较大幅度的改进,尤其是常规二元立木材积模型的MSE达到了17.84%,表明常规二元立木材积模型存在着明显的系统偏差。而分段二元立木材积模型的MSE大幅下降了约13个百分点,同样分段二元地上生物量模型的MSE下降了约4个百分点,这表明分段模型能够有效地解决模型存在明显系统偏差的现象。
为了进一步展现分段模型在消除系统偏差的优势,分别对立木材积和地上生物量常规模型和分段模型进行分径阶检验,具体结果如表4和表5。结果表明,常规模型中无论是一元立木材积模型还是一元地上生物量模型在2cm径阶下存在着明显的偏差,材积模型的TRE和MSE分别为34.07%和42.73%,地上生物量模型的TRE和MSE分别达到了17.47%和33.76%;而分段模型在此2cm径阶下无论是一元立木材积模型还是一元地上生物量模型TRE和MSE均得到了大幅度地下降,有效地消除了2cm径阶下的系统偏差。常规二元立木材积模型在2cm、4cm和6cm下存在着明显地的系统偏差,尤其是在2cm径阶下,二元立木材积模型的TRE和MSE分别高达64.41%和104.24%;而分段二元立木材积模型均有效地消除了系统偏差。同样常规二元地上生物量模型在2cm径阶下TRE和MSE分别高达27.72%和51.03%,而分段二元地上生物量模型在2cm径阶下有效地消除了系统偏差。
表4 相容性立木材积常规模型和分段模型分径阶检验%径阶/cm一元立木材积模型二元立木材积模型常规模型分段模型常规模型分段模型TREMSETREMSETREMSETREMSE 234 0742 73-1 550 8864 41104 24-11 361 6541 471 983 083 2928 2737 903 7211 756-13 22-13 532 982 5712 5218 3712 2017 278-11 54-12 652 160 918 9411 749 4912 1612-14 05-13 48-5 70-4 982 884 793 224 9716-2 67-2 132 503 14-0 840 90-0 501 07203 203 235 695 76-1 650 07-1 370 16260 02-0 66-0 99-1 69-1 18-1 04-1 10-1 1432-6 40-6 94-9 86-10 39-0 17-1 13-0 33-1 41≥3813 5114 076 146 760 03-1 03-0 06-1 19
表5 相容性地上生物量常规模型和分段模型分径阶检验%径阶/cm一元地上生物量模型二元地上生物量模型常规模型分段模型常规模型分段模型TREMSETREMSETREMSETREMSE 217 4733 760 9112 0527 7251 03-0 7514 164-9 35-10 19-9 88-10 71-1 89-1 88-9 43-9 206-9 06-7 89-3 02-1 81-1 740 83-1 211 488-4 23-3 091 132 401 584 182 385 2212-4 08-5 29-0 70-1 950 63-0 271 320 5316-2 55-1 96-0 69-0 06-1 38-0 67-1 10-0 30203 212 944 063 792 792 892 903 13263 133 032 632 522 802 782 963 0232-2 59-2 82-4 09-4 32-2 17-2 61-1 90-2 31≥383 132 990 400 29-0 78-1 26-0 99-1 47
为了更加直观的反应分段二元立木材积模型能有效地消除小径阶下系统偏差的现象,分别绘制了常规和分段的二元立木材积模型的相对残差分布图,如图1和图2。从图1可以看出常规二元立木材积模型相对残差绝大部分均分布在±50%之间,且在直径小于10cm时,存在着明显的偏差,绝大部分残差为正值,说明在小于10cm的径阶下,立木材积的估计值明显偏小。而从图2可以看出分段二元立木材积模型相对残差基本服从随机分布,且绝大多数的相对残差值均分布在±20%之间。
图1 常规二元立木材积模型相对残差分布图
图2 分段二元立木材积模型相对残差分布图
以云南云杉为对象,采用度量误差联立方程组方法和分段建模方法分别建立了一元和二元相容性的立木材积模型和地上生物量模型以及生物量转换函数模型,并对常规模型和分段模型进行了对比分析,得到如下结论:
1) 利用度量误差联立方程组方法能有效解决立木材积方程和地上生物量方程之间不相容的问题,并可同时建立立木材积方程、地上生物量方程及其转换函数,确保了相互之间估计结果的协调一致性。但是,这种常规模型有可能出现在小径阶下存在明显系统偏差的现象,影响模型的通用性。
2) 通过对常规模型和分段模型的对比分析,结果表明以直径6cm作为临界直径进行分段建模,无论材积模型还是地上生物量模型均有效地消除了在小径阶下存在系统偏差的现象。
3) 所建立的云南云杉一元相容性立木材积和地上生物量模型,其平均预估精度分别达到了90%和95%以上;而二元相容性立木材积模型预估精度得到较大幅度地提高,平均预估精度达到了97%以上,相对于一元模型提高了7个百分点;二元地上生物量的平均预估精度也达到了97%。
[1] 国家林业局森林资源管理司.立木生物量建模样本采集技术规程[S].2010.
[2] 唐守正,郎奎建,李海奎.统计和生物数学模型计算:ForStat教程[M].北京:科学出版社,2009.
[3] 张连金,曾伟生,唐守正.用带截距的非线性方程和分段建模方法对立木生物量估计的比较[J].林业科学研究, 2011,24(4):453-457.
[4] 党永峰,王雪军,曾伟生.用分段建模方法建立东北落叶松立木材积和生物量方程[J].林业科学研究,2012,25(5):558-563.
[5] 曾伟生,骆期邦,贺东北.论加权回归与建模[J].林业科学,1999,35(5):5-11.
[6] 曾伟生,唐守正.立木生物量模型的优度评价和精度分析[J].林业科学,2011,47(11):106-113.
UsingMeasurementErrorModelingMethodandSegmentedModelingMethodtoEstablishCompatibleSingle-TreeBiomassModelSystemforSpruceinYunnan
LIANG Wenye1,HE Peng2,XIAO Qianhui2
(1.Forest Inventory and Planning Institute of Tibet Autonomous Region, Lhasa 850000 ,Tibet, China; 2.Central South Forest Inventory and Planning Institute of State Forestry Administration,Changsha 410014,Hunan,China)
Based on the tree volume and above-ground biomass data of spruce in Yunnan ,compatible single-tree biomass model systems of one-variable and two-variables were constructed respectively by using the error-in-variable simultaneous equations and segmented modeling method in this paper.The results showed that: 1) The regressions of volume equations improved significantly when tree height was used together with diameter at breast height (DBH) for both conventional model and segmented model, while the regressions of biomass equations improved slightly; 2) There were obvious system bias at small diameter classes in conventional two-variable model, the segmented model could effectively resolve this problem; 3) The prediction precision of volume and above-ground biomass segmented one-variable model were more than 90% and 95% respectively, the prediction precisions of volume and above-ground biomass segmented two-variable model were more than 97%.
volume;above-ground biomass;error-variable-model;segmented modeling
2013—12—16
2014—03—03
梁文业(1978—),男,河南许昌人,工程师,主要从事森林资源监测工作。
S 718.55+6; S 758
A
1003—6075(2014)01—0008—05