张冬燕,王冬至,李 晓,高雨珊,李天宇,陈 静
(1.河北农业大学 林学院,河北 保定 071000;2.河北农业大学 经济管理学院,河北 保定 071000)
树高和胸径不仅是用来预测林分蓄积量[1]、生物量[2]、立地生产力[2-3]及林分结构[4]的重要变量,而且是森林资源调查及经营效果评价的重要因子。在标准地调查过程中,树高测量难度较大且观测成本高,其观测误差也相对较大,给精准林业质量提升带来了一定困难[2,4],而胸径观测方便且精度较高。因此,根据标准地调查数据,建立树高与胸径关系预测模型,可降低调查成本,提高预测精度[5],这对于森林质量精准提升具有重要意义。当前林业研究多采用线性或非线性树高与胸径关系模型来模拟预测两者之间的关系,其参数估计方法多采用最小二乘法来模拟,然而最小二乘法是基于均值回归,利用变量均值来拟合模型参数[6],该方法要求调查数据需满足独立正态同分布等条件。在林业调查中,树高与胸径观测数据不能满足该要求,而分位数回归对调查数据没有严格要求[7],利用变量条件分位数来建模[6],对具有尖峰、厚尾、异方差显著的数据拟合效果更加稳健[8-10]。分位数回归理论框架是由KOENKER[11]提出,已在医学[12]、经济学[13]、教育与政策[14-15]及自然资源管理等领域进行了研究与应用。在林业相关研究中,分位数回归被应用于模拟林分自疏边界线[16]、直径分布规律[17]、林分密度指数[18]及森林病虫害[19]等方面研究。ÖZÇELIK等[20]基于分位数回归建立了树高与胸径关系模型,高慧淋等[21]采用此方法建立了长白落叶松Larix olgensis人工林最大林分密度线模型,提高了模型预测精度及适用性。然而在华北暖温带针阔混交林中,如何基于一个分位数回归模型,预测不同树种树高与胸径关系是亟待解决的科学问题。在混交林中为了描述树种结构对树木生长影响,部分学者[22-25]采用哑变量方法构建了不同间伐方式、不同地域树高曲线及生长量预测模型。然而基于包含哑变量的非线性分位数回归方法来构建不同树种树高与胸径关系模型的研究较少。因此,本研究以河北省塞罕坝华北落叶松Larix principisrupprechtii与白桦Betula platyphylla针阔混交林为研究对象,基于哑变量方法和分位数回归相结合方法,构建混交林不同树种分位数回归模型,为精确描述树高与胸径的关系提供依据。
河北省塞罕坝机械林场(41°22′~42°58′N,116°53′~118°31′E)位于河北省最北部,地势北高南低,属华北暖温带立地类型区,林场总面积约9.2×104hm2,总蓄积约8.1×106m3。土壤类型以褐色森林土、棕色森林土及风沙土等为主;成土母质主要为坡积物、残积物及洪积物等;极端最高气温为33.4 ℃,最低气温-43.3 ℃,年均气温-1.3 ℃,年均无霜期64 d,年均降水量460.3 mm,是典型的半干旱半湿润寒温性大陆季风气候。研究区植被类型丰富,主要乔木树种有华北落叶松、白桦、樟子松Pinus sylvestris、云杉Picea asperata等,主要灌木树种有山刺玫Rosa daverica、胡枝子Lespedeza bicolor、沙棘Hippophae rhamnoides等,主要草本植物有地榆Sanguisorba offcinalis、唐松草Thalictrum aquilegifolium、曼陀罗Datura stramonium等。
在北曼店、大唤起、阴河、千层板和第三乡等5个林场设立了83块标准地(30 m×30 m),对标准地内各林分因子(林分密度、平均高、平均胸径、树种断面积、林分总断面积、优势高等)和立地因子(海拔、坡度、坡向、坡位、土层厚度等)进行调查,共调查立木10 104株(华北落叶松5 258株,白桦4 846株),林分年龄分布为24~45 a,不同标准地混交度分布为0.39~0.62。研究过程中,分树种将观测数据分别按3∶1分为建模数据(62块标准地)和检验数据(21块标准地),基本信息如表1和表2所示。
表1 模型建立数据Table 1 Data of establishment model
表2 模型检验数据Table 2 Data of test model
在描述树木生长及树高与胸径关系的近百种不同模型中,Richard方程不但具有可解释的生物学意义,而且具有易收敛且灵活性高等特性。部分研究基于Richard方程构建了不同林分类型树高与胸径关系的预测模型,均取得了较好的预测结果[18,20,26-29]。因此,本研究以Richard方程作为构建华北落叶松与白桦针阔混交林树高与胸径关系基础模型,模型表达如式(1)所示。
式(1)中:Hij为第i个样地第j株树的树高(m);dij为第i个样地第j株树的胸径(cm);a、b、c为基础模型的参数;εij为误差项。
为了解决模型预测精度的影响,可以在模型中加入哑变量[23,30-32]。包含哑变量的树高与胸径关系预测模型,不仅可以实现模型对不同树种相容性,而且在一定程度上可以提供模型预测精度及适用性,包含哑变量的树高与胸径关系预测模型表达如式(2)所示。
式(2)中:Mi为哑变量,当M1=1、M2=0时为华北落叶松,当M1=0、M2=1时为白桦;ai、bi、ci为模型参数;εij为误差项。
由于分位数回归对模型误差不需要严格假设条件,因此本研究基于Richard方程,选取5个分位点(τ=0.1、0.3、0.5、0.7、0.9)构建不同树种的树高与胸径关系预测模型,利用加权最小一乘法可以得到不同分位点参数估计值,具体见式(3)。
式(3)中:S为不同分位点估计值;τ、Hij分别为第i个样地第j株树在不同分位点τ树高预测值与树高值(m);dij第i个样地第j株树胸径(cm);τ为分位点。
统计分析均基于SPSS 24.0和SAS 9.4中的PROC NLIN和PROC NLP完成,基于模型确定系数(R2)、平均差(MD)、平均绝对误差(MAD)对模型拟合精度及适用性进行评价与比较。
式(4)~(6)中:Hij、和分别为树高观测值、预测值和平均值;m为标准地数量;n为标准地株数。
图1为不同树种胸径与树高的关系。华北落叶松和白桦的树高分别为4~18和6~16 m,胸径分别为6~32和6~28 cm。
图1 不同树种胸径与树高分布Figure 1 Height-diameter distribution of different tree species
从表3可见:在华北落叶松与白桦针阔混交林中,基于分位数回归的不同树种不同分位点确定系数均大于传统回归方法,平均差及平均绝对误差均小于传统回归方法。在确定的5个分位点中,当分位点τ=0.7时,华北落叶松与白桦的树高与胸径关系预测模型精度最高。基于不同分位点预测模型建立了不同树种在各分位点残差分布图(图2),确定当分位点位为τ=0.7时,华北落叶松与白桦树高与胸径关系模型能够更好描述两者之间的关系。
表3 基础模型和分位数回归模型拟合与评价Table 3 Fitting and evaluation of basic model and quantile regression model
图2 不同树种各分位点残差分布Figure 2 Residual distribution of each quantile of different tree species
基于不同分位点预测模型,分别对华北落叶松和白桦的树高与胸径关系进行了模拟(图3)。不同树种在不同分位点树高与胸径关系预测趋势及范围基本一致,表明包含哑变量的分位数回归模型预测效果较好。
图3 不同分位点树高与胸径的关系Figure 3 Relationship between tree height and DBH of different quantiles
在描述树高与胸径关系的多种线性和非线性预测模型中,通常采用具有生物学意义且灵活性较高的Richard方程来研究不同林分类型树高与胸径的关系[26,33],因此,本研究将Richard方程作为构建华北落叶松与白桦混交林树高与胸径关系基础模型。对红松Pinus koraiensis人工林、土耳其松Pinus brutia和黎巴嫩雪松Cedrus libani混交林的研究[20,26-28]表明:Richard方程是描述其树高与胸径关系的最优模型。
在构建树木生长及生物量预测模型中,包含哑变量模型具有更高的预测精度[22,25,31-32]。本研究在华北落叶松与白桦针阔混交林中,基于非线性分位数回归构建的包含哑变量树高与胸径的关系模型,其精度高于传统回归预测模型,这与人工林最大密度线确定[21]及树高与胸径关系模型[20]的研究结论相一致,表明非线性分位数回归较传统回归方法更加稳定,可用于人工林和混交林立地潜在生产力的评价。
本研究以塞罕坝华北落叶松与白桦针阔混交林调查数据为基础,确定Richard模型为描述不同树种树高与胸径关系的基础模型,在基础模型中构造一个表示树种的哑变量,并利用分位数回归在一个模型中同时估计不同树种及不同分位点的树高与胸径关系模型参数,经过检验不同树种分位数回归模型均能较好反映树高与胸径的关系,当分位点τ=0.7时,分位数回归模型预测精度最高,拟合效果最好。