SVM模型在森林火灾判断中的应用

2014-04-29 05:34陈海燕张伟邱兆文
安徽农业科学 2014年12期
关键词:气象因子

陈海燕 张伟 邱兆文

摘要根据支持向量机(SVM)原理,通过大兴安岭地区1990~2009年20年间森林火灾数据,得到该地区森林火灾预测模型,并利用此模型对2010~2012年3年间的火灾数据进行验证,发现总判对率为84.5%,着火案例判对率为81.4%,说明该回归模型较符合实际情况,具有较好的预测效果,能够为当地林业部门制定防火策略提供参考。

关键词SVM;森林火险;气象因子

中图分类号S762.1文献标识码A文章编号0517-6611(2014)12-03684-01

基金项目黑龙江省留学归国人员基金项目(LC2012C06)。

作者简介陈海燕(1989-),女,山东菏泽人,硕士研究生,研究方向:软件服务与应用工程。*通讯作者,副教授,博士,硕士生导师,从事信息检索和机械学习研究。

森林火灾是破坏性极大的自然灾害,黑龙江省是我国林业大省,有着丰富的林业资源,同时森林火灾频繁发生,其中大兴安岭地区是森林火灾发生的重灾区[1]。各科研院所根据大兴安岭地区的实际情况,制定出适合的森林防火预测方法,如多因子相关概率火险天气预报、“801”森林火险天气预报系统、多因子综合指标森林火险预报等[2]。这些方法在实际应用中取得了很好的效果。为此,笔者在此基础上根据黑龙江省大兴安岭市地区林业局1990~2009年20年间火灾资料以及气象数据,利用支持向量机(Support Vector Machine,SVM)模型对森林火险进行判断及预测,能够为当地林业部门制定火灾防治策略提供参考。

1研究区概况

大兴安岭林区是我国最北且面积最大的林区,也是我国少有的原始林区之一[3]。大兴安岭地区属于寒温带季风区,并且有着明显的山地气候特点。冬季寒冷且长,夏季炎热而短,且大部分地区基本无夏。由于受寒冷干燥的内蒙古高压影响降水较少,每年11月到次年4月降水量不到全年的10%,相反,在暖季的时候,东南季风活跃,促使这一时期的降水量可以达到全年降水量的85%~90%,这对林木生长十分有利[4]。相对湿度为70%~75%,全年降水量为350~500 mm。林内雪深30~50 cm,积雪期可达150 d。年日照时间2 560 h,≥10 ℃積温1 500~1 700 ℃,降水集中在夏季,春秋次之,冬季最少,最少为316.5 mm,最多可达714.8 mm,年平均降水量为428.0 mm。大风天气主要集中在春季,以4、5月份最多,冬季、春季、夏季较少,风速最大可达7级,持续时间3 d[5]。

2SVM模型原理

SVM是一种结构风险最小化原理的机器学习方法,最初于20世纪90年代由Vapnik提出[6],其基本思想为最大化分类间隔。当样本线性可分时,SVM算法通过构造线性最优分类超平面w×x+b=0,将两类样本完全精确地分开。当样本线性不可分时,通过非线性映射,将原样本映射到高维特征空间,即定义映射:x∈Rm→(x)∈Rp(p>m),定义核函数K(x,y)=(x)*(y),其中常见的核函数有高斯径向基、二层神经网络与多项式等[7]。

3森林火险判断模型的建立

3.1影响森林火灾的气象因素的选取参考大兴安岭地区多因子相关概率火险天气预报、“801”森林火险天气预报系统、多因子综合指标森林火险预报等方法对气象因素进行选取,选取以下气象因素:x1当日的最高气温,x2当日的最大风速,x3当日的最小相对湿度,x4当日的日照时间,x5当日的平均气温,x6当日的平均风速,x7当日的平均湿度,x8前3 d的平均气温,x9前3 d的平均风速,x10前3 d的平均湿度。

3.2样本的选取根据黑龙江省大兴安岭地区林业局1990~2009年20年间火灾资料以及气象数据,发现大兴安岭森林火灾发生时间主要集中在4~10月。因此,从20年来森林火灾发生时间在4~10月的着火案例中随机选择100个作为着火样本,在4~10月的非着火案例中随机选择100个作为非着火样本[8]。

3.3模型建立及分析使用LIBSVM数据包对森林火灾发生进行判断。在这里选取使用范围广泛的RBF (Radius Basis Function)核函数,也称为高斯核函数。对核参数σ2及惩罚因子C的搜索范围定义为[2-10,210],利用网格法进行搜索,结果表明,LIBSVM的效果很好,平均正确率达到了82.084%。

猜你喜欢
气象因子
胶东半岛地区气象因子对冬小麦产量影响的研究
遵义烤烟种植区气候因子分析
随机森林在棉蚜虫害等级预测中的应用
橡胶产量与气象因子的灰色关联性及逐步回归分析研究
杨树叶纹斑病与气象因子的关系