李晓炜,赵 刚,于秀波,于 强
(1.中国科学院地理科学与资源研究所陆地水循环及地表过程重点实验室,北京 100101;2.中国科学院地理科学与资源研究所生态系统网络观测与模拟重点实验室,北京 100101;3.中国科学院大学,北京 100049)
火灾是造成森林生态系统结构和机能长期波动的主要干扰之一。生态环境因子对一个地区的火灾分布特征有决定性的影响[1]。研究人员发现,生态环境因子与森林火灾的关系在不同地区有不同的表现[2]。
目前有很多统计方法被用于研究生态影响因子与火灾之间的关系,Peng和Schoenberg将火灾发生率与温度、降雨、可燃物湿度和火灾历史进行分析,发现前次火灾距今时间间隔对当前火灾发生与否的影响很大[3]。鉴于Logistic回归模型基于多变量对指定事件的预报能力,并且模型对输入数据无正态分布的要求[4],Logistic回归模型是火险模拟中应用较为广泛的一种方法[5]。二元Logistic回归模型被用于分析着火概率与3个自变量之间的关系[6]。这类方法虽然对模拟易波动的数据功能强大,但对于分析各个变量对火灾影响的强弱差别,却有其不足之处[7]。近几年来,利用无参数和半参数Logistic回归模型,以火灾影响因子为自变量,火灾影响因子与火险概率之间的关系得到了深入分析[8]。
我国森林生态系统火灾研究起步较晚[9]。1987年大兴安岭森林火灾之后,在1988年,国家启动了森林防火灭火研究开发基金项目,林火研究工作得到了进一步的发展[10],在利用卫星资料监测提取火点、过火区、林火实时监测或灾后损失评估等方面,已取得了很好的研究成果及应用[11]。但是,对全国范围内不同植被气候区生态影响因子和森林火灾之间的非线性关系,仍缺少精细和基础分析[12]。
虽然人类活动是森林火灾的一大成因,但是生态环境确是森林火灾蔓延开来的先决条件和辅助因素,人类活动对火灾的影响往往是通过易发生火灾的生态环境条件而被强化。所以,本研究重点研究和分析导致森林火险的生态环境因素和条件,对生态影响因子在不同区域的火险预报能力进行的深入的分析和评估。
因此,本研究中,在广义加性Logistic模型中,引入可以反映数据时间性的自变量,并引入描述空间特征的自变量(经纬度)和同时描述时空特征的自变量(生态影响因子),在模型中加入矢量化空间位置变量,应用非参数化滤波方法,来评估变量间潜在的非线性关系,分析了森林火灾生态影响因子在中国四个不同植被气候区(华北落叶阔叶林、东北冷温带松林、东南常绿阔叶林、西南热带雨林地区)与火险的非线性关系,研究和分析导致森林火险的生态成因。建立了以最优生态影响因子及时空变量为自变量的半参数Logistic回归模型,分析了该模型预报火灾着火及蔓延概率的适用性。本研究为进一步分析森林生态系统与火灾之间的动态关系、展开生态系统火灾干扰研究提供了理论基础。
根据植被气候类型分类系统,本文将中国主要森林火灾地区划分为四个区域:东北冷温带松林地区(西伯利亚冷空气团主导的冷温带及寒带气候)、华北落叶阔叶林地区(太平洋季风主导的温带气候)、东南常绿阔叶林地区(东亚季风主导的湿润亚热带及热带气候)和西南热带雨林地区(印度洋季风、东南季风主导的热带及亚热带气候)(图1)。
图1 研究区分布图Fig.1 Distribution of study areas and weather stations used for this study
本研究应用归一化植被指数NDVI来分析各地区植被覆盖及生长状况对火险的影响,每月的环境数据数据由研究单元每天的数据计算而得,并生成两种数据,一种为月平均数据,另一种为月最高值数据。表1列出了植被指数、环境数据及火灾数据的来源及其描述。
本文应用3种火险概率作为森林火险的量化方法来进行分析:着火概率(p1)、有条件大火蔓延概率(p2)和无条件大火蔓延概率(p3)。在研究区域,以1×1经纬度区域为研究单元,每月为时间间隔,进行火灾数据和气象数据提取。其中,着火概率(p1)表示在所研究的1×1经纬度的区域内,所研究月份发生至少一次火灾的概率。有条件大火发生概率(p2)表示在所研究的1×1经纬度的区域中,所研究月份中,当有火灾发生时,火灾发展为大面积火灾的概率。无条件大火发生概率(p3)表示在所研究的1×1经纬度的区域内,所研究月份中,发生大面积火灾的概率。这里提到的大面积火灾,可以根据不同的研究需要来设定,本文中,大面积火灾代表面积大于400hm2的火灾[13]。虽然可以直接对p3进行计算,但考虑到自变量与p1和p2的关系各不相同,先对p1和p2进行分别计算,再计算p3。应用半参数Logistic回归模型[8]来分析各研究区生态影响因子与着火概率、有条件大火蔓延概率的关系,应用自变量对因变量的部分效应来分析变量间非线性关系。自变量与因变量之间的非线性曲线是所有自变量共同作用背景下生成的。自变量对因变量的部分效应由GAM模拟得出的splines公式作图得出。模型公式如下:
表1 数据来源及描述Table 1 Data collection and description
式中,k为1×1经纬度/月的标记数字;p为着火概率或有条件大火蔓延概率;(lon,lat)代表所研究的1×1经纬度的区域的中心经纬度坐标;month为研究月份;Xn代表所选取进行研究的各个自变量(例如:各生态影响因子,反映植被物候变化的指数NDVI等)。在公式中,gi()和hn()分别为无参滤波函数,在计算中,g1为thin plate splines[14]函数,因为可以通过薄板样条函数对火险概率的空间分布特点进行分析,用来模拟经度和纬度对火灾的空间影响。g2为periodic splines函数,因为可以通过周期平滑函数来分析火险概率的年内季节周期,用来模拟年内月份对火灾的作用和影响。hn()应用B-splines函数,主要是为了对生态影响因子和火灾概率logit值之间的非线性关系进行分析和描述,例如,火灾发生概率或蔓延概率与温度的关系往往呈非线性,在描述变量间非线性关系这方面,无参滤波函数优于参数化的函数。应用AIC对各个自变量进行选择,找出对火灾概率模拟提供信息最优的自变量[15]。在每个研究区,为了对比分析不同生态影响因子在预测火灾概率时的优劣,使用AIC指标对以单一生态影响因子为自变量的概率模型进行评估,对计算得出的AIC值进行对比,AIC值越小,代表概率模型所使用的单一生态影响因子的火险预报能力越好。为了便于直观图解和应用,各概率模型命名如下:
仅以时间和空间变量为自变量的概率模型——历史概率模型(B),历史概率模型可以模拟出不同地理位置及月份间的火险概率差异,但不反映年与年之间的差异。历史概率模型为分析火险预报极值点提供依据。B模型(历史概率模型)公式如下:
以时间和空间变量及单一生态影响因子为自变量的概率模型——以生态影响因子命名和代表。在这里,所使用的生态影响因子包括:植被指数的月均值(NDVIspot、NDVIgimms)、日最高温度的月均值(MaxT)、日最高温度的月最大值(MaxTX)、日平均温度的月均值(AvgT)、日平均温度的月最大值(AvgTX)、日降雨量的月均值(PT)、日降雨量的月最大值(PTX)、日平均风速的月均值(WS)、日平均风速的月最大值(WSX)、日相对湿度的月均值(RH)、日相对湿度的月最大值(RHX)。在每个研究区,经过AIC计算及对比,在显著水平<0.05的生态影响因子中,选出火险预报能力好的因子,以时空变量和所选生态影响因子为自变量,建立回归模型,并应用研究年份之外的数据对研究年份的着火概率(p1)和有条件大火发生概率(p2)进行模拟。p3通过计算而得:p3=p1×p2。文中的统计计算和分析使用R语言程序及其程序包完成,其中,概率模型由程序包mgcv 中的 gam[16]和 predict.gam 语句完成[17],其中的 family 使用 binomial语句,link 使用 logit语句,各无参滤波函数调用splines完成;AIC自变量选择应用R语言程序中的程序包stats中的AIC语句完成;自变量对因变量的部分效应由GAM模拟得出的splines公式调用plot.gam语句完成。
为了对最终建立的概率模型进行评估,使用Hosmer和Lemeshow提出的评估方法[18],将观测与模拟数据生成散点图。因为利用同一数据集进行模型验证会得到比实际情况好的拟合结果,所以使用十字交叉法进行数据处理。具体如下:应用研究年份之外的数据对研究年份的火险概率进行模拟,通过实际观测数据和模型模拟数据生成散点图,其中,实际观测数据根据研究需要,以不同的分类方式进行分类,应用同类数据实际观测平均值与其对应的模拟数据平均值进行对比和作图。由于研究数据是(0,1)的形式,所以需要对观测数据按照某一标准进行归类聚合,在每一归类的集合中,将火灾发生的比例与火险概率预报平均值进行比较,从而实现对模型预报能力的评估。将拥有相同或相似(相互间差异在1%范围内)无条件大火发生概率模拟值的数据归为一类,对模型持续性预报能力进行分析。文中,利用GIS软件,生成火险概率预报图。
对4个不同植被气候区域1996—2008年的火灾季节变化特征进行了分析(图2)。
图2 研究区月均火灾数量及面积Fig.2 The average monthly burnt areas and number of fires
在东北冷温带松林地区,火灾季节为3月中旬至6月中旬,(图2)。虽然3—5月降雨量比11—2月大,由于之前干旱季节对土壤及植被含水量的影响,每年3—5月,着火次数不断增加,10月至翌年2月,火灾数量呈不稳定变化,这主要是因为春季雪融后,森林中草本层和凋落物层的可燃性会变得非常高。该林区存在大量杂草及次生林,成为高可燃度的主要因素。中国东南常绿阔叶林地区,火灾季节为9月至翌年4月,较湿润的5—8月,火灾很少,但6月较特别,火灾次数很多(图2)。在湿润月份,由于温度高,使森林生态系统的蒸发散增多,从而抑制了该时期降雨对随后火灾的影响。该林区植被可燃性低于中国北方针叶林。在华北落叶阔叶林地区,着火季节为6—7月(图2)。春季植被处于休眠状态,受火灾破坏程度较小,秋季由于植被还未进入冬眠,同时火灾扩散慢、燃烧时间长,植被极易受破坏。本地区火灾发生次数的年际变化呈周期性,与该地区土壤湿度的年际变化有很大关联。在中国西南热带雨林地区,12月至翌年5月,降雨少,较干旱,随着干旱度的累加,火灾发生次数逐月升高(图2)。
通过生成自变量与因变量之间的非线性曲线图,分析了着火概率模型和有条件大火概率模型中,每个自变量与因变量之间的非线性关系(图3,图4)。在4个地区,AvgT均与着火概率呈现出非线性关系,在华北、东北、东南地区,NDVI与着火概率呈非线性关系,在西南地区,MaxT与着火概率和有条件大火蔓延概率均呈现出非线性关系。使火险概率高于正常水平的各生态因子的阈值在4个地区各不相同(表2)。
图3 研究区基于生态因子的着火概率模型中各个自变量对因变量的部分效应图Fig.3 Estimated partial effects of significant variables on the probability of fire ignition in(a)NC
图4 研究区基于生态因子的有条件大火蔓延概率模型中各个自变量对因变量的部分效应图Fig.4 Estimated partial effects of significant variables on the probability of large fire event
表2 4个研究区火险概率高于正常水平的自变量临界值及参数Table 2 The threshold value of the selected factors as the probabilities of fire risk higher than average in the 4 regions
在4个研究区,通过AIC分析,选出的作为最终着火概率模型及有条件大火概率模型自变量的生态影响因子,见表3,由表可以看出,对于着火概率模型,所选的自变量均为生态影响因子的月均值,所有因子的月最大值均未入选为模型自变量。对于有条件大火蔓延概率,在常绿阔叶林区和热带雨林区,部分因子的月最大值入选为模型自变量。在冷温带松林、落叶阔叶林、常绿阔叶林地区,NDVI对着火概率有明显作用,在4个地区,海拔对火灾发生有显著影响,在4个研究区,日平均温的月均值均被选为着火概率模型自变量,在落叶阔叶林、常绿阔叶林、热带雨林地区,降雨量和日最高温的月均值对着火概率有明显作用,在冷温带松林、常绿阔叶林和热带雨林地区,日相对湿度的月均值被选为着火概率模型的自变量,日平均风速的月均值仅对落叶阔叶林、热带雨林地区的着火概率影响明显。在常绿阔叶林地区,NDVI未被选为有条件大火蔓延概率模型的自变量,日平均风速月均值对有条件大火蔓延概率的影响只在常绿阔叶林地区明显。降雨量对有条件大火蔓延概率的影响在四个地区均不显著。
表3 着火概率模型及有条件大火蔓延概率模型所选的自变量Table 3 The selected factors in the regression models for the probabilities of fire occurrence and large fire event in the 4 regions
图5为对实际观测及模型模拟数据所做散点分析图(虚线为模拟结果95%置信区间)。华北落叶阔叶林、东北冷温带松林地区大部分观测值落在了模拟结果95%置信区间之内。其他两个区域部分实际观测数据落在了模拟结果95%置信区间范围之外。华北落叶阔叶林、东北冷温带松林、东南常绿阔叶林、西南热带雨林区最终模型的概率模拟范围分别是0—0.95、0—0.96、0—0.87、0—0.94。在概率模拟研究中,概率模拟范围越大,模型模拟能力越好。
列出了2003年9—12月的火险概率图,图6中,第一列为着火概率图,第二列为有条件大火蔓延概率图,第三列为无条件大火蔓延概率图,并将对应月份的实际有火灾发生和大火发生的1×1经纬度研究单元标示了出来。通过该图,我们可以了解生态因子概率模型在不同月份模拟时的具体效果,并可以对模型在不同区域的火险预报能力有一个直观的掌握。对于同一个地区,不同月份所展现出来的火险概率的高低有所不同。这从一个侧面反映出了不同月份植被及气象因素的变化。图中实际发生火灾及大火的1×1研究单元多数位于火险概率较高的区域,但也有少数落在火险概率较低的区域,这样的情况可能是由火灾的其他成因引起的,例如人为因素。
在东北地区,2003年9、10、11月份的着火概率及无条件大火蔓延概率高于12月份,9月份东北北部着火概率及无条件大火蔓延概率高于东北南部,11月份东北北部着火概率及无条件大火蔓延概率低于东北南部,而实际着火数据也反映了这一特征。4个月份有条件大火蔓延概率均呈现出较高的水平,这一结果与该地区9至12月植被及气候状况相符,在东北地区,降雪往往导致折断凋落的植被凋落物增多,增加了火点蔓延的可能性;在华北地区,2003年10、11、12月份3种火险概率均高于9月份,同一月份内存在着空间差异,中部比其他区域火险概率高;在东南地区,2003年11、12月份的火险概率高于9、10月份,对于着火概率,东南地区的北部边缘、南部边缘及中部地区要高于其他地区。对于有条件大火蔓延概率及无条件大火蔓延概率,东南地区北部高于南部。实际的火灾发生情况也显示出了这一特点。在西南地区,2003年11、12月份的火险概率高于9、10月份,西南地区北部火险概率要高于南部地区,多数实际着火火点位于该地区模拟值较高的地区。西南地区有条件大火发生概率普遍较高,无条件大火发生概率在中北部较高,实际发生的大面积火灾多集中在西南地区的中北部。
图5 4个研究区实际观测的无条件大火蔓延概率和模型模拟概率散点对比图Fig.5 Observed versus estimated probabilities grouping by similar estimated probabilities(within 1%of each other)for the final regression model of the large fire event probabilities in NC,NE,SE and SW
在本研究中,应用半参数Logistic回归模型中的自变量对因变量部分效应,分析了中国4个植被气候区生态影响因子与着火概率、有条件大火蔓延概率之间的非线性关系。建立了火险概率模型,分析研究区域森林火灾的时空分布特征及对生态因子的响应机制。半参数Logistic回归模型引入了表示模型误差或其它系统误差的非参数分量,从而使模型既含有参数分量,又含有非参数分量,综合了参数回归模型和非参数回归模型的优点,在实际问题中,比单纯的参数回归模型和非参数回归模型有更大的适应性,而且有更强的解释能力[8]。在4个地区,AvgT均与着火概率呈现出非线性关系,在华北、东北、东南地区,NDVI与着火概率呈非线性关系,在西南地区,MaxT与着火概率和有条件大火蔓延概率均呈现出非线性关系。使火险概率高于正常水平的各生态因子的阈值在4个地区各不相同。对于着火概率模型,多数生态影响因子月平均值的模拟能力优于月最大值。在4个地区,有条件大火蔓延概率模型所选作为自变量的生态影响因子数量比着火概率模型的少。对于有条件大火蔓延概率模型,部分生态影响因子月最大值的模拟能力优于月平均值。各气候区模型所选生态影响因子各不相同。在4个研究区,着火概率模型和有条件大火蔓延概率模型所选作为自变量的生态影响因子各不相同。当分析实际观测数据与模型模拟数据散点图时,落叶阔叶林、冷温带松林、热带雨林地区的模型模拟结果比常绿阔叶林地区好。研究表明,在中国不同生态区,应用时空变量、生态影响因子、植被指数建立半参数化logistic回归模型模拟火险概率具有可行性。概率模型自变量的部分效应是分析生态影响因子与火险概率非线性关系的有效途径。
图6 研究区2003年每月着火概率(p1)、有条件大火蔓延概率(p2)、无条件大火蔓延概率(p3)分布图(9—12月)(基于生态因子的火险概率模型)Fig.6 Fire risk maps with estimated fire occurrence probability(p1),estimated conditional probability of a large fire event(p2),estimated large fire events probability(p3)and observed fire and large fire events(dots)for each month in 2003
在冷温带松林、落叶阔叶林、常绿阔叶林地区,NDVI对着火概率作用明显,反映出植被生长的年内变化对火灾影响显著。近年来,在其他国家和地区,研究者也常常会发现这种情况[19]。在热带雨林地区,NDVI对有条件大火蔓延概率作用不显著,这在一定程度上反映出,年内植被生长变化对该地区大火蔓延的作用较小。在4个地区,海拔对火灾发生有显著影响,并且这种影响有一定的普遍性,这种情况与其他研究者的报道结论相符[6]。海拔对火灾的影响有可能是由于人类活动或闪电等间接的因素导致的[20]。模型自变量的选择反映出土壤湿度及植被含水量在落叶阔叶林、常绿阔叶林、热带雨林地区对着火概率影响显著。有条件大火蔓延概率模型自变量的选择反映出,在常绿阔叶林地区,年内植被生长变化对大火蔓延的作用较小。土壤湿度对大火蔓延的作用较小。4个地区不同因子对火灾发生和火灾蔓延的影响各不相同。对于同一气候区,影响着火概率的因子不一定影响大火蔓延概率,有些因子对火灾蔓延影响显著,但对火灾发生无影响。落叶阔叶林、冷温带松林、热带雨林地区的模型模拟结果比常绿阔叶林地区好,导致这一结果的原因有可能是:在常绿阔叶林地区,相较其它3个地区,火灾数量较少,特别是大面积火灾数量较少。在火险研究中,对于研究生态因子与火灾之间的非线性关系,点对点的生态因子与火灾发生数量的相关性分析有可能不是最有效的方法。很多研究表明,点对点的时间相关统计分析对于研究火险因子与火险之间的非线性关系来说,略显劣势[21]。火灾数据一般为小数量数据,以0和1居多,所以利用时间相关统计分析来研究火灾数据,有一定的弊端。通过研究结果可以看出,本研究中使用的半参数化Logistic回归模型,在中国的四个气候区,都能够有效的分析生态因子与火灾概率之间的关系,在其他国家或地区,使用半参数化Logistic回归模型模拟火险概率也得到了很好的结果[8]。显示出该模型对定量化评估火险概率有很好的应用性。
[1] Brown P M,Heyerdahl E K,Kitchen S G,Weber M H.Climate effects on historical fires(1630—1900)in Utah.International Journal of Wildland Fire,2008,17(1):28-39.
[2] Turner D,Lewis M,Ostendorf B.Spatial indicators of fire risk in the arid and semi-arid zone of Australia.Ecological Indicators,2011,11(1):149-167.
[3] Peng R,Schoenberg F.Estimation of wildfire hazard using spatial-temporal fire history data.Los Angeles:Statistics Department,University of California,2001.
[4] Legendre P,Legendre L.‘Numerical Ecology.’2nd English edn.Amsterdam:Elsevier Science BV,1998.
[5] Keane R E,Drury S A,Karau E C,Hessburg P F,Reynolds K M.A method for mapping fire hazard and risk across multiple scales and its application in fire management.Ecological Modelling,2010,221(1):2-18.
[6] Moreira F,Catry F X,Rego F,Bacao F.Size-dependent pattern of wildfire ignitions in Portugal:when do ignitions turn into big fires?.Landscape Ecology,2010,25(9):1405-17.
[7] Chuvieco E,Allgöwer B,Salas J.Integration of physical and human factors in fire danger assessment//Chuvieco E.Wildland Fire Danger Estimation and Mapping The Role of Remote Sensing Data.Singapore:World Scientific Publishing.2003:197-218.
[8] Brillinger D R,Preisler H K,Benoit J W.Probabilistic risk assessment for wildfires.Environmentrics,2006,17(6):23-33.
[9] Di X Y,Wang H L,Yao S R.Forest fire forecast.Harbin:Northeast Forestry University Publishing Company,1993.
[10] Hu H Q.Forest fire ecology and management.Beijing:China Forest Press,2005.
[11] Shu L F,Xiang A M,Tian X R.3S in forest fire management.Forest Science,1998,24(1):46-51.
[12] Shu L,Zhang X,Dai X,Tian X,Wang M.Forest fire research(Ⅱ)-fire forecast.World Forestry Research,2003,16(4):34-37
[13] Li D Q.A Brief Talk On Characteristics Of Forest Fire In Our Country.Forestry Science and Technology Information,2011,43(1):4-5.
[14] Wood S N.Thin plate regression splines.Journal of Royal Statistical Society Series B,2003,65(1):95-114.
[15] Sakamoto Y,Ishiguro M,Kitagawa G.Akaike Information Criterion Statistics.D.Reidel Publishing Company,1986.
[16] Hastie T,Tibshirani R.Generalized Additive Models.London,UK:Chapman & Hall,1990.
[17] R Development Core Team.R:a language and environment for statistical computing.R Foundation for Statistical Computing:Vienna,Austria.2010.
[18] Hosmer D W,Lemeshow S.Applied Logistic Regression.NewYork:Wiley,1989.
[19] Gianelle D,Vescovo L,Mason F.Estimation of grassland biophysical parameters using hyperspectral reflectance for fire risk map prediction.International Journal of Wildland Fire,2009,18(7):15-24.
[20] Mma.Madrid,Spain:Area de Defensa Contra Incendios Forestales,Ministerio de Medio Ambiente,2007.
[21] Roads J,Fujioka F,Chen S,et al.Seasonal fire danger forecasts for the USA.International Journal of Wildland Fire,2005,14(1):1-18.
参考文献:
[9] 邸雪颖,王宏良,姚树人.林火预测预报.哈尔滨:东北林业大学出版社,1993.
[10] 胡海清.林火生态与管理.北京:中国林业出版社,2005.
[11] 舒立福,向安民,田晓瑞.3S集成技术在林火管理中的应用研究.火灾科学,1998,24(1):46-51.
[13] 李德全.浅谈我国森林火灾发生的特点.林业科技情报,2011,43(1):4-5.