基于Cox 比例风险函数及混合效应的落叶松云冷杉混交林林木枯损模型研究

2020-07-20 07:10李春明
林业科学研究 2020年3期
关键词:林分胸径样地

李春明

(中国林业科学研究院资源信息研究所 北京 100091)

林木的枯损是森林生长过程中十分重要的组成部分,但又是一个知之甚少的森林动态过程[1-3]。对林木枯损进行准确的预测是森林生长收获预估系统中十分重要的工作[4]。最早预测林木的枯损是通过建立枯损与协变量的回归方程来预测枯损概率,之后一些学者也采用此方法估计林木的枯损概率[5]。由于林木的枯损是典型的二分量数据,只包括是否枯损两种结局,因此此类方法的模拟效果并不理想。Logistic 回归分析方法对于二分量数据具有先天的优势,Hamilton[6]和Monserud[7]引入了此方法来模拟林木的枯损,目前已被广泛应用[8-10]。但是上述方法在模拟林木枯损时,缺乏把树木枯损的时间特性、假设检验、删失数据的观测和协变量的影响同时考虑[11]。即不能够给出树木具体的生存或死亡时间,也不能预测未来林木的发展趋势[12]。林木枯损数据的这些特性使得利用传统的统计方法处理具有困难,但是忽略它们将降低模型估计的准确性[13]。

生存分析方法既考虑观测对象的事件结局“生存”或“死亡”,又能够考虑观测对象的生存时间长短,可为构建新的林木枯损模型提供支撑。是唯一考虑删失数据,并且包括时间协变量,另外能够处理非正态分布数据的一类方法[11]。Waters[14]第一次建议利用生存分析方法来描述林木的枯损问题,但仅限于同龄林分。随着统计学和计算机技术的快速发展,生存分析方法逐渐地被用到分析和构建林木的枯损模型中。例如,Woodall 等[11]采用生存分析方法中的生命表法(lifetime table),Fan 等[15]利用Kaplan-Meier 方法,von Gadow 等[16]利用服从Weibull 时间分布的参数方法,Uzoh 等[17]利用Cox 比例风险函数模型来分析上层林木的枯损。这些学者把林木的枯损和生存时间结合起来,取得了很好的模拟和预测结果。

在构建枯损模型时,很多数据都是基于永久性固定样地的多次定期观测,每个林分包括多个样地,每个样地包括多株枯损树木,这些数据存在着多层嵌套结构。另外林木在生长过程中,受竞争及干扰等诸多因素的影响,导致了林木枯损具有很高的时空变化性[18]。在利用生存分析方法构建枯损模型时,忽略这些问题将会造成大的误差。生存分析方法结合混合效应模型方法是一种新的思路,可解决上述诸多问题,并且能够提高模型的模拟精度。目前把两者结合起来构建林木枯损的模型还未见诸于文献。

本研究以1986 年在吉林省汪清林业局金沟岭林场设置的20 块落叶松云冷杉样地数据为例,利用生存分析方法中的半参数Cox 比例风险函数模型来进行林木的枯损及生存模拟,并采用逐步回归方法把对枯损具有重要影响的林分因子和立地因子作为协变量加入到林木枯损模型中去,选择Schoenfeld 残差方法(Schoenfeld residuals)分析模型的适应性,在适应的模型基础上考虑样地的随机效应。并对传统方法与考虑样地随机效应的模拟结果进行比较分析。最后按对枯损有影响的协变量的不同情况,预测不同时间内林木的生存率。

1 材料和方法

1.1 研究区概况

本研究选择了位于吉林省汪清林业局金沟岭林场境内的1986 年设置的20 块落叶松云冷杉混交林为研究对象,优势树种主要包括长白落叶松(Larix olgensis Henry)、云杉(Picea jazoensis Nakai)和冷杉(Abies nephrolepis (Trautv.)Maxim)等,其他伴生树种包括红松(Pinus koraiensis Siebold et Zuccarini)、白桦(Betula platyphylla Suk.)、枫桦(Betula costata Trautv.)和水曲柳(Fraxinus mandshurica Rupr.)等。所有样地从1987 年开始,分别在1988、1990、1992、1994、1997、1999、2002、2004、2006、2008、2009 和2012 年进行了调查。调查的样地因子包括坡度、海拔、坡向、土壤类型、土层厚度等内容。调查因子包括每木检尺(胸径>5 cm)、林木枯损情况、枯损时间、枯损原因、林下更新及林下植被等。其中2 块样地在1987 年和1993 年进行了2 次间伐,其余18 块只在1987 年进行了间伐,因此只选择了18 块样地,共3 477 株树木进行分析。外业调查结束后,对林分平均直径、公顷株数、公顷断面积、大于对象木断面积(BAL)、公顷蓄积量和直径比等指标进行了计算。其中大于对象木断面积的定义为具体一个样地内,任意一株树木,胸径大于它的所有树木的断面积之和。从1987—2012 年整个观测期间,共有1 352 株树木发生枯损。1987 年伐后调查的样地因子概况见表1。

1.2 研究方法

1.2.1 生存分析方法简介 生存分析方法的基本概念可参考文献Allison[19]和Lawless[20],常用概率密度函数( f(t)) 、生存函数( S(t))以及风险函数( h(t))等3 个函数来描述生存过程。这3 种函数在数学上是等价的。如果给定其中一种函数,另两种函数即可推导得出。在构建林木的枯损模型时,生存时间虽为定量指标,但往往不服从任何规则分布,要在这种情况下确定林木的枯损时间和各风险因素之间的定量关系,就不能够采用参数方法来达到目的。Cox 比例风险函数模型可直接建立终点事件的发生风险与这些影响因素之间的函数关系[21]。本研究采用Cox 比例风险函数模型和样地水平的随机效应,对应的风险函数可以表示为式(1):

h0(t)是仅与时间有关的风险函数,其分布没有明确的假设,是模型的非参数部分, exp (βxT)是在h0(t)效应基础上产生作用的,估计值不受时间影响,是模型的参数部分。 bi为 样地( i= 1,2,···,18)间截距的随机效应值,服从均值为0,方差为 σ2的正态分布。

在进行生存分析时,影响林木枯损的因子是作为协变量加入到模型中去。影响林木枯损的因子很多,本研究只考虑立地因子和调查初始林分因子对林木枯损的影响。林分因子主要包括树种本身的特性、林分密度、林分结构及林木间的竞争等[22-24]。本研究主要选择的林分因子包括单木初始胸径、单木初始胸径与林分平均胸径的比值、大于对象木断面积、初始林分公顷株数、初始林分公顷断面积、初始林分公顷蓄积、初始林分平均胸径等指标因子。立地因子影响森林环境中光照、温度、水分、土壤等的分布,进而影响林木的枯损状况[25]。本研究主要选择坡度、坡向及海拔等因子对林木枯损的影响[26]。

表1 样地1987 年基本情况Table 1 The characteristics of experimental stands established plot

1.2.2 模型评价方法 在选择Cox 半参数方法进行林木枯损及生存模拟时,首先要判断实验数据是否满足Cox 比例风险函数模型的假设。拟合优度检验方法是十分普遍的方法[27],其主要思想是首先计算待检验变量的Schoenfeld 的残差,然后对非删失数据的生存时间排秩,最后利用残差图来检验Schoenfeld 残差与时间秩的相关性。如果两者存在关联性则认为该数据不满足Cox 比例风险假设。具体的Schoenfeld 残差公式见式(2):

其中, xik为在ti时刻发生枯损的林木的第 k个协变量的实际取值, xmk为 ti时刻尚在风险集里的林木 m的第 k个协变量取值, pm为风险集中林木 m在 ti时刻发生枯损的概率。

在采用Schoenfeld 残差图判断是否可以用Cox 比例风险函数后,本研究采用Wald 指标来评价模型本身的模拟效果。在比较不同模型的拟合效果优劣时,采用AIC 信息准则(Akaike information criterion,AIC)、BIC 信息准则(Bayesian Information Criterion,BIC)和-2*对数似然值(-2*Loglikelihood,-2LogL)这3 个值。这3 个值越小,说明模型的模拟效果越好[28-30]。LRT 卡方检验被用来比较模型之间的差异显著程度[31]。

2 结果和分析

把所有备选的林分因子和立地因子作为协变量加入到Cox 比例风险函数模型中去,利用SAS9.4软件进行模拟。考虑各因子之间存在的多重共线性(VIF<5)和显著影响( α < 0.05)情况下,结果最后只有单木初始胸径、大于对象木断面积和初始林分公顷株数等林分因子对林木的枯损具有重要的影响。而立地因子的3 个具体因子对林木的枯损均没有显著影响,具体模拟结果见表2 的模型1(M1)。利用Schoenfeld 残差分布图来判断实验数据及协变量是否满足Cox 比例风险函数模型的条件假设,结果见图1。从图1 的3 个残差图可以看出,单木初始胸径与观测时间不呈线性关系、大于对象木断面积、初始林分公顷株数与观测时间不呈线性关系,说明本次研究采用的数据完全符合Cox 比例风险函数的条件假设,可以选择Cox 比例风险函数来构建林木的枯损模型。Wald 指标表明,在考虑了3 个协变量后,3 个模型的模拟效果差异均极度显著(p<0.000 1),能够满足模型的精度要求。进一步在Cox 模型的基础上,考虑样地的随机效应,本研究只考虑了样地的截距效应,结果为模型的AIC、BIC 和-2LogL3 个值均比不考虑随机效应值小,LRT 卡方检验表明,差异达显著水平(见表2 的模型2)。由于考虑了样地的随机效应后,大于对象木断面积和初始林分公顷株数两个协变量差异不显著(p>0.05),因此去掉了这两个协变量,然后重新模拟,结果见表2 的模型3(M3)。最后结果表明,当考虑样地水平的随机效应后,去掉大于对象木断面积和初始林分公顷株数两个协变量后,模型精度并没有降低,两者之间没有显著差异(LRT=4.2, p > 0.05)。

表2 Cox 比例风险函数模型模拟结果Table 2 The result of Cox proportional hazard model

图1 各协变量与观测时间的残差分布Fig.1 The residual figure between estimate and measure result of covariate variable

从表2 的结果可以看出,单木的初始胸径与林木枯损的风险率呈反比,与生存率呈正比,初始胸径大的林木,枯损的风险低于胸径小的林木,进而生存率高于胸径小的林木。这与利用logistic 方法模拟枯损的结论基本一致[32]。

3 讨论

在实际林分中,胸径小的树木在林分中处于竞争的劣势,对水、肥、气、热等资源的竞争处于不利地位。而胸径大的树木处于竞争的优势,更加有利于争夺林分中的营养。因此,胸径小的树木更容易发生枯损。为了直观的表述初始胸径与林木枯损的关系,进一步选择初始胸径为10、15 和20 cm的3 株树木,在初始林分密度均为2 000 株·hm-2的林分内,在不考虑其他因子影响的前提下,利用Cox 比例风险函数模型来估计其生存率,并绘制生存曲线,见图2。从图中可以看出,随着时间的推移,胸径大的树木其生存率始终高于胸径小的树木,这和上述模拟的结果一致。在同一林分内,一般初始胸径小的林木其大于对象木断面积值就大,因此与初始胸径相反,大于对象木断面积与林木枯损的风险率呈正比,与生存率呈反比。

林分公顷株数是一个重要的影响因子,属于林分层次,反映了林分的密度情况。本研究中初始林分公顷株数与林木枯损的风险率呈正比,与生存率呈反比。这说明,林分密度越大,林木枯损的风险越大,生存率越低,越容易枯损[8,26]。为了更直观的表示林分公顷株数对枯损的影响,进一步选择胸径为15 cm 的树木在初始林分密度为1 000,1 500和2 000 株·hm-2的3 个林分情况下,在不考虑其他因子影响的前提下,利用Cox 比例风险函数模型来计算其生存率,并绘制生存曲线,见图3。

图2 10、15 和20 cm 初始胸径树木生存率(S (t))趋势Fig.2 Thesurvival curve of tree of initial diameter with 10, 15 and 20 cm

图3 初始林分密度为1 000,1 500 和2 000 株·hm-2 的林木生存率(S (t))趋势Fig.3 The survival curve of tree with initial stand density of 1 000, 1 500 and 2 000 trees·hm-2

从图3 可以看出,胸径为15 cm 的树木,在整个测量区间,随着时间的推移,初始林分密度大的林分,林木的枯损概率逐渐增大并且生存率较初始密度小的林分快速降低。这充分说明,同一株林木,初值密度越大,对资源的竞争越激烈,与初始林分密度小的林分相比,林木的生存率越低。

立地因子对林木的枯损没有任何影响,造成这一原因可能是选择的20 块落叶松云冷杉样地分布在一个林场内,坡度、坡向和海拔本身的差别小,难以体现在对枯损的影响上。

从图2 和图3 可以看出,林木在观测15 a 至16 a 之间生存率有一个明显的下降。从数据本身来看,从1986—2012 年整个观测期内共枯损1 352株树木,而在1999—2002 年观测期间就枯损了405 株,差不多占整个枯损量的三分之一。造成这一期间大量枯损的原因可能是极端气候引起的(干旱,霜冻),由于本研究没有考虑气象因子对枯损的影响,因此无法获得确切的原因,今后需要进一步考虑。

Cox 比例风险函数在考虑了样地的随机截距效应后,模型的模拟精度显著提高,并且差异达显著程度。但是初始林分密度和大于对象木断面积的影响差异并不显著,在去掉这两个协变量重新模拟后发现模型的模拟效果并没有降低。因此,初始胸径是最重要的影响林木本身枯损的指标[33-34]。

4 结论

本研究利用Cox 比例风险函数描述落叶松云冷杉林木的枯损情况,并考虑了样地的随机效应,取得了很好的效果。林木初始胸径、大于对象木断面积及初始林分公顷株数对林木的枯损具有重要的影响。在考虑样地的随机效应后,模型的模拟效果显著提高,说明样地的枯损存在着明显的高可变性和随机性。在实际中,林木初始胸径是不容易控制的指标,但是初始林分密度可通过科学的采伐来调节。如果想降低林木的枯损率,可适当降低林分的密度,进而能够促进林木本身胸径的生长。本研究基于生存分析方法为林木的枯损研究提供了可借鉴的新思路。Cox 比例风险函数模型的使用,使得森林经营者在制定森林采伐方案及采伐时间上提供了很好的科学依据。

猜你喜欢
林分胸径样地
森林资源监测地面固定样地优化研究
赤松纯林胸径结构对枯梢病发生的效应
武汉5种常见园林绿化树种胸径与树高的相关性研究
额尔古纳市兴安落叶松中龄林植被碳储量研究
五常水曲柳变异分析及优良家系的早期选择
昆明市主要绿化树种阈值测定与分析
基于角尺度模型的林业样地空间结构分析
抚育间伐对油松林下灌木多样性的影响
4种人工林的土壤化学性质和酶活性特征研究
4种阔叶混交林的持水特性研究