一种基于聚类分析的由林分因子估算地表可燃物载量的方法

2011-12-22 03:11朱霁平贾敬蕊周建军张林鹤
火灾科学 2011年2期
关键词:兴安樟子松落叶松

武 军,朱霁平,贾敬蕊,周建军,张林鹤

(中国科学技术大学火灾科学国家重点实验室,安徽合肥,230026)

一种基于聚类分析的由林分因子估算地表可燃物载量的方法

武 军,朱霁平*,贾敬蕊,周建军,张林鹤

(中国科学技术大学火灾科学国家重点实验室,安徽合肥,230026)

地表可燃物载量的确定,是实现森林地表火蔓延预测的前提。已有火蔓延模型中,假定同一林分中可燃物分布是均匀的,不能准确描述可燃物载量的复杂空间分布。基于聚类分析方法,建立了一种根据易获取的几种林分因子来估算地表可燃物载量的方法。首先,对大兴安岭地区35块兴安落叶松林样地和21块樟子松林样地的树龄、郁闭度、胸径、树高等林分因子采用重心法进行系统聚类分析,分别将兴安落叶松林和樟子松林分为5类和7类。然后,计算得出每类可燃物的类中心,并以每类包含所有样地的可燃物载量的平均值来表示该类中心的载量,并由此建立可燃物载量与林分因子的对应关系。对聚类分析与线性回归预测模型从平均绝对误差AAD、标准误差SEE、模型预测稳定性指标SIE三方面进行对比,结果表明聚类分析模型要优于线性回归分析模型。

森林地表可燃物载量;林分因子;聚类分析

0 引言

森林地表火占森林火灾的90%以上。地表火蔓延预测模型一直是林火研究中的一项重要内容,而对地表可燃物载量的确定是其前提和关键。

前人对森林地表可燃物载量的研究已经很多,主要有以下几种方法:(1)通过野外调查设置标准样地,对地表可燃物载量与林分因子进行回归分析建立地表可燃物载量模型[1-7];(2)利用遥感技术进行森林可燃物载量的研究[8-10];(3)图片对比法,利用照片与标准地对比法确定地表可燃物载量[11,12]。遥感技术适用于对大尺度范围的可燃物载量估测,对林区冠层载量估测较准,但对地表细小可燃物的载量难以进行准确估计。图片对比法主观性较强,也难以定量化地与地表火蔓延预测模型相结合。目前,回归法在建立面向地表火蔓延预测的可燃物模型中得到广泛应用。在著名的BEHAVE程序中,地表可燃物划分为13种,每种可燃物由不同组分的1小时时滞、10小时时滞、100小时时滞可燃物以及灌木可燃物混合构成,各类可燃物的载量通过回归法确定。这种可燃物模型简单易用,使BEHAVE程序得到广泛应用。但是,森林地表可燃物的载量及其在空间上的分布是非常不均匀的,有其独特的空间分布格局[13]。由回归法建立的地表可燃物载量模型的误差较大,也难以表征载量在空间分布上的差异。

聚类分析在森林可燃物模型的划分[14,15]、林型火险等级划分[16]以及火险天气指数的校正[17]等方面已有应用。然而,采用对林分因子进行聚类分析的方法来研究同一种林分内地表可燃物的载量分布,相关文献很少。本文利用树龄、郁闭度、胸径、树高等非常容易获取的几个林分因子,分别对大兴安岭地区兴安落叶松林和樟子松林进行了聚类分析,并与文献[1]中的多元线性回归方法进行了对比,结果表明聚类分析模型要优于线性回归分析模型。

1 研究区域与数据

本文采用与文献[1,5]相同的可燃物样本数据。分别为1990年5月,1992年4月和2002年5、6月份在大兴安岭塔河林业局、加格达奇林业局、呼中林业局境内野外采样获得的35块落叶松林和21块樟子松林样地的数据。

2 分析方法

2.1 基于聚类分析的可燃物载量估算方法

聚类时选取的林分因子包括林龄A、郁闭度 C、树高 H和胸径D,记为 S={A,C,H,D}。首先对原始数据进行标准化处理。假设变量取值为 x,变量取值范围为[a,b],则标准化后变量取值 x′=(x-a)/(b-a)。采用SAS软件系统聚类过程中的重心法。首先根据伪F统计量PSF确定样本数据的最佳聚类数,然后根据上述最佳聚类数得到聚类结果。若聚类分析得到n个类,将每类中心表示为SCi={ACi,CCi,HCi,DCi}(i=1,2,……n),每类包含的成员数量记为 mi。

当根据不同林分因子 Sk={Ak,Ck,Hk,Dk}对地表可燃物载量进行估算时,首先计算Sk到各类中心SCi的距离dki(i=1,2,……n),然后找出其中最短距离min(dki)所对应的类 l,则该林分可以归为类 l,其可燃物载量

2.2 基于多元线性回归的估算方法

胡海清对上述兴安落叶松林和樟子松林通过多元线性回归得到的载量模型如下:

兴安落叶松:显著水平为0.05时,对 L100、LS、LT的回归分析不显著,L1、L10公式如下

樟子松林:显著水平为0.05时,对LS的回归分析不显著,其余计算公式如下

文献[3-5]中所用方法类似,仅回归参数与上述公式有很小的差别。

2.3 结果分析方法

采用平均绝对误差AAD、标准误差 SEE、模型预测稳定性指标SIE对本文提出的聚类分析法与上述线性回归的两种模型的结果进行对比。计算公式分别如下:

其中yi为第i个观测值,^yi为第i个预测值。

3 结果与讨论

3.1 聚类分析结果

(1)最佳聚类数的确定

表1 聚类分析历史记录Table 1 Cluster history

最佳聚类数可由伪F统计量的局部最大值处选定,由表1,兴安落叶松林和樟子松林的最佳聚类数分别为5和7。

(2)聚类分析结果

通过重心法系统聚类过程将35个兴安落叶松林样本数据和21个樟子松林样本数据分别聚为5类和7类,每一类所包含的样地,聚类中心及平均载量分别如表2、3所示。

表2 兴安落叶松聚类分析结果Table 2 The result of cluster analysis for Larix gmelinii

表3 樟子松林聚类分析结果Table 3 The result of cluster analysis for Pinus sylvestris

3.2 结果分析

兴安落叶松林和樟子松林聚类分析和线性回归分析对比结果分别如表4和表5。

由表4,对兴安落叶松林,线性回归分析只能对L1和L10进行有效预测,而聚类分析法可以对所有分类载量进行估算。同时,用聚类分析进行预测的平均绝对误差、预测标准误差、模型预测的稳定性指标均要优于线性回归分析。图1表示不同样地兴安落叶松林L1两种方法的预测值与观测值。由图1,对35个兴安落叶松林L1的预测值中,有16个样本数据聚类分析的预测值更加接近真实值,要优于线性回归分析方法;有10个样本数据线性回归分析的预测值优于聚类分析;剩余9个样本数据聚类分析和线性回归分析的预测值相同或相近。因此,总体上对兴安落叶松林L1的预测,聚类分析要优于线性回归分析。

表4 兴安落叶松林聚类分析和线性回归分析结果对比Table 4 Comparison of cluster analysis and multiple linear regressions for Larix gmelinii

表5 樟子松林聚类分析和线性回归对比Table 5 Comparison of cluster analysis and multiple linear regressions for Pinus sylvestris

由表5,对樟子松林,线性回归分析不能对L100进行有效预测。除对L10以外,用聚类分析进行预测的平均绝对误差、预测标准误差、模型预测的稳定性指标均要优于线性回归分析。但是,由图2可见,采用线性回归法对L10的预测出现了负值,这是很不合理的。同样的情况也出现在对LS的预测中。综上可见,聚类分析法在预测的有效性、精确性上都优于线性回归法。

图1 兴安落叶松1-h时滞可燃物载量预测Fig.1 Prediction of 1-h fuel load of Larix gmelinii

图2 樟子松10-h时滞可燃物载量预测Fig.2 Prediction of 10-h fuel load of Pinus sylvestris

4 结论

通过树龄、郁闭度、平均高、胸径等林业调查容易获取的林分因子建立的地表可燃物载量模型能够反映地表可燃物载量空间分布的不均匀性。与多元线性回归法相比,本文基于聚类分析提出的估算方法,不仅能够全面估测各种类地表可燃物载量,避免预测负值的出现,且模型的平均绝对误差AAD、标准误差SEE、模型预测稳定性指标SIE均优于线性回归法。该方法的输入参数容易获取,为火蔓延预测中可燃物载量估算提供了一种简便准确的算法, 具有重要的应用价值。

[1]胡海清.利用林分特征因子预测森林地被可燃物载量的研究[J].林业科学,2005,41(05):96-100.

[2]邸雪颖,王宏良,等.大兴安岭森林地表可燃物生物量与林分因子关系的研究[J].森林防火,1994(02):16-18.

[3]刘晓东,王军,等.大兴安岭地区兴安落叶松林可燃物模型的研究[J].森林防火,1995(03):8-9.

[4]单延龙,张敏,等.大兴安岭地区樟子松林地表可燃物模型[J].东北林业大学学报,2005,33(02):74-75.

[5]陶宏伟,常禹,等.大兴安岭呼中林区森林死可燃物载量及其影响因子[J].生态学杂志,2008,27(1):50-55.

[6]Marsden-SmedleyJB,Cathpole WR.Fire Behavior Modelling in Tasmanian Buttongrass MoorlandsI. Fuel Characteristics[J].International Journal of Wildland Fire,1995,5(4):203-214.

[7]Robin MR,John EL,Vanessa AB.Spatial models for estimating fuel loads in the Black Hills,South Dakota,USA[J].International Journal of Wildland Fire,2004,13(01):119-129.

[8]Brands K,Jacobson C.Estimation of vegetative fuel loads using Landsat TM imagery in New South Wales,Australia[J].International Journal of Wildland Fire,2003,12(02):185-194.

[9]Saatchi S,Halligan K,et al.Estimation of Forest Fuel Load From Radar Remote Sensing[J].Ieee Transactions on Geoscience and Remote Sensing,2007,45(06):1726-1740.

[10]Scott K,Oswald B,et al.Fuel loading prediction models developed from aerial photographs of the Sangre de Cristo and Jemez mountains of New Mexico,USA[J].International Journal of Wildland Fire,2002,11(01):85-90.

[11]Scott J H,Burgan RE.Standard Fire Behavior Fuel Models: A Comprehensive Set for Use with Rothermel’s Surface Fire Spread Model[R].USDA For.Serv.Gen.Tech,2005.

[12]Burgan RE,Rothermel RC.BEHAVE:Fire Behavior Prediction and Fuel Modeling System-FUEL Subsystem[R].USDA For.Serv.Gen.Tech,1984.

[13]He H S,Shang BZ,Thomas RC,et al.Simulating forest fuel and fire risk dynamics across landscapes-LAND IS fuel module design[J].Ecological Modelling,2004,180(01):135-151.

[14]Dimitrakopoulos AP.Mediterranean fuel models and potential fire behavior in Greence[J].International Journal of Wildland Fire,2002,11(02):127-130.

[15]单延龙,关山,廖光煊.长白山林区主要可燃物类型地表可燃物载量分析[J].东北林业大学学报,2006,34(6):34-36.

[16]徐丽华.地被可燃物与林型火险等级划分[J].辽宁林业科技,2001(06):3-6.

[17]Dymond CC,et al.Components of the Fire Weather Index System in Malaysia and Indonesia[J].Environmental Management,2005,35(04):426-440.

Forest surface fuel load estimation by stand factors based on cluster analysis method

WU Jun,ZHU Ji-ping,J IA Jing-rui,ZHOU Jian-jun,ZHANG Lin-he

(State key laboratory of fire science,University of Science and Technology of China,Hefei 230026,China)

Forest surface fuel load is one of the most important factors for forest fire spread prediction.In existing fire spread models,fuel load is usually assumed to be uniform in a region with the same forest type,although its spatial distribution is complex even in one kind of forest with different forest stand factors.In this article,a method for surface fuel load estimation by the forest stand factors is established based on the cluster analysis method.The stand factors used in cluster analysis include forest age,canopy density,average tree height and diameter at breast height which are all easy to be obtained.35 Larix gmelinii plots and 21 Pinus sylvestris plots of Da Hinggan Mountains forests were used to carry on centroid cluster analysis and in result they were divided into 5 and 7 clusters,respectively.The center of each cluster was calculated and its corresponding fuel load was represented by the average load of the plots grouped in this cluster.Finally,three statistical indicators,including the mean absolute error of the estimate,MAE,the standard error of the estimate,SEE,and the stable indicators of the estimate,SIE,were used to contrast the fitting errors of the cluster analysis method and the multiple linear regressions method.The results show that the cluster analysis method is better than the latter one.

Forest surface fuel Load;Forest stand factors;Cluster analysis

S762

A

1004-5309(2011)-0099-06

2011-03-03;修改日期:2011-03-30

国家自然科学基金资助项目(30972380);国家科技部林业公益性行业科研专项重点项目200704027

武军(1987-),男,中国科学技术大学火灾科学国家重点实验室硕士研究生.主要从事森林火灾研究。

朱霁平,高级工程师,E-mail:jpzhu@ustc.edu.cn.

猜你喜欢
兴安樟子松落叶松
落叶松病虫害防治措施探讨
山西落叶松杂交良种逾10万亩
祝福你兴安
兴安四月树
长白落叶松离体再生体系的建立
追梦兴安
神奇的落叶松提取物
塞罕坝樟子松幼林抚育与管理
初探北方樟子松栽培关键技术
我眼中的樟子松