基于智能决策树和无线传感网的林火预警模型研究

2019-04-23 02:59高德民
森林防火 2019年4期
关键词:基尼火险林火

辛 洁,高德民,张 朔,孙 权

(南京林业大学信息科学技术学院,江苏 南京 210037)

1 引言

森林火灾是一种突发性强、破坏性大、处置救助较为困难的自然灾害。林火不只烧毁成片的森林植被,伤害林内动物,引起空气污染,影响森林演替,破坏森林在小气候涵养水源上的作用,甚至导致生态环境失去平衡,同时也给人类的生存和生命财产造成了极大的威胁[1]。据统计,2003-2016年我国共发生森林火灾10万余次,过火面积254.37万hm2,损失折人民币超过21亿元[2]。

林火产生的偶然性大,原因复杂多变。但是,从林火火源类型来看,天然火源如雷击火等占比重极小,更多的是人为火源,其中以烧荒烧炭、野外吸烟和上坟烧纸为主[3]。目前我国林火监测措施主要是地面巡护、近地面监测、航空监测和卫星监测。由于地面巡护和近地面监测耗费大量人力物力且不能避免疏漏,也不能保证巡护人员的安全;航空监测工作时间受限,只能用于扑救时监测燃烧趋势;卫星监测的监测时间同样受限,同时受云层的影响较大,数据精确度不高[4]。目前林火预测预警仍然面临着很大的挑战。

随着机器学习和物联网技术不断发展,其应用的领域越来越广。物联网将现实世界数字化,为森林防火行业低成本优化策略提供更好的解决方案[5]。国家林业局在2015年发布《中国智慧林业发展指导意见》。林火是林业最大的威胁之一,预测和预警势在必行。鉴于传统林火监测措施存在很多不足,新技术也在快速发展,本文介绍的森林火灾预测预警系统将机器学习和物联网技术用到数据处理当中,达到更好林火预测和预警效果。

2 相关文献

到目前为止,林火预测和预警研究历经百年,国内外研究机构和学者进行了大量研究。美国的森林火灾扑救指挥系统,兼备指挥、行动、计划、后勤及行政管控五项功能[6]。加拿大林火危险等级系统是世界上被广泛应用的火险系统之一[7]。在国内,除最原始的地面巡护和瞭望塔监测外,红外线技术借助于红外热成像原理和无线传输技术最先开始用于森林火灾的报警中[8]。遥感技术和地理信息系统、无人机等也陆续开始用在林火监测中[9,10];随着物联网技术的不断发展,也逐渐被用于林火的预测预警[11]。

物联网是以互联网、传统电信网等信息承载体,让所有能行使独立功能的普通物体实现互联互通的网络。机器学习是计算机科学的一个分支,以人类智能相似的方式做出反应的智能方式。随着物联网和机器学习技术不断发展,应用领域不断扩大,技术逐渐出现在林火预测预警方面。决策树(Decision tree)是一类常见的机器学习方法,决策树学习的目的是为了产生一颗泛化能力强,即处理新的示例能力强的决策树,其基本流程遵循简单而直观的“分而治之”策略。

目前,大部分林火监测系统是用传感器采集数据,用低功耗、低成本、近距离的ZigBee传输数据[11]。由于ZigBee传输距离太短,本文所介绍的系统数据传输采用LoRa技术。LoRa是一种基于扩频技术的远距离无线传输技术,具有远距离、低功耗、多节点、低成本的特性。在空旷环境下Lo-Ra通信距离可达15 km,采用自适应数据速率策略,使其接收电流低达10 mA,休眠电流小于200 nA,从而使电池寿命有效延长[12]。供电能源采用太阳能,绿色环保且可持续,同时也避免了频繁更换电源等问题。

3 系统模型设计

3.1 系统监测

由于森林火险等级是通过处理终端采集的大量气象数据所得到的,数据的采集、传输和数据的正确性对于林火预测预警极为重要。本系统主要包括数据采集模块、数据传输模块和数据处理模块3部分。数据采集模块负责获取温度、湿度、风速、日降水量等气象数据;数据传输模块负责由服务器向终端发送命令和将终端获取的数据返回服务器;数据处理模块将返回的数据进行处理并预测当前林火发生情况。系统的工作流程如下:

1)服务器对终端节点发出数据采集命令;

2)终端节点的传感器获取当前时刻气象数据;

3)传输设备将数据返回到服务器;

4)服务器对返回的数据进行处理,根据决策树模型得出当前的火险等级。

系统采用太阳能电池供能。太阳能是可再生和无污染的资源。实验结果表明,一个节点即使不充电,也可以一次工作超过15天。

3.2 火险气候指数

加拿大森林火险等级系统(CFFDRS)是当前世界上发展最完善、应用最广泛的系统之一,加拿大森林火险气候指数(FWI)系统是CFFDRS的重要组成部分。FWI系统以时滞—平衡含水率理论为基础,将气象条件和可燃物含水率有机地联系起来,通过天气条件的变化计算可燃物含水率的变化,然后再根据不同大小或位置的可燃物含水率确定潜在火险等级[13]。

FWI系统所需数据包括4个气象因子(温度、相对湿度、风速、降雨量)。系统由6个部分组成:3个湿度码代表可燃物湿度,包括细小可燃物湿度码FFMC,粗腐殖质湿度码DMC和干旱码DC;2个中间子指数代表火灾蔓延速率和可燃物的消耗率,即初始蔓延指数ISI和累积指数BUI;1个最终指数代表火险气候指数,即FWI。FWI的结果分为五级,级数越大,表示火险越高。

3.3 决策树模型

Scikit-learn决策树算法类库内部实现是使用了调优过的CART决策树算法,本文以CART决策树算法为例对表1中的示例数据进行分析。

表1 气象数据详细信息

CART决策树使用基尼指数来选择划分属性。假定当前样本集合D中第k类样本所占的比例为pk(k=1,2,…,||y),则D的纯度可用基尼值来度量:

直观来说,Gini(D)反映了从数据集D中随机抽取两个样本,其类别标记不一致的概率。因此,Gini(D)越小,则数据集D的纯度越高。

以表1中气象数据为例,该数据集D包含12个训练样例。显然, ||y=3,在决策树学习开始时,根节点包含D中的所有样例,其中于是,根据(1)式可计算出根结点的基尼值为:

假定离散属性a有V个可能的取值{a1,a2,…,av},若使用a来对样本D进行划分,则会产生v个分支结点,其中第v个分支结点包含了D中所有在属性a上取值为av的样本,记为Dv。我们可根据上式计算出Dv的基尼值,再考虑到不同的分支结点所包含的样本数不同,给分支结点赋予权重,即样本数越多的分支结点的影响越大。于是,属性a的基尼指数定义为:

在候选属性集合A中,选择使得划分后基尼指数最小的属性作为最优划分属性。

假定平均气温低于8°为低温,高于25°为高温,其余为中温;相对湿度低于20为干燥,高于70为潮湿,其余为适中;风速低于10为微风,高于20为大风,其余为强风;日降水量小于10 mm为小雨,大于25 mm为大雨,其余为中雨。此时,表1可转化为表2。

计算当前属性集合{温度,相对湿度,风速,日降水量}中每个属性的基尼指数。以温度为例,它有可能的3个取值:{低温,中温,高温}。若使用该属性对D进行划分,则可得到3个子集,分别记为D1(温度=低温),D2(温度=中温),D3(温度=高温)。子集D1包含2个样例,其中包含4个样例,其中个样例,其中计算出温度划分之后获得的3个分支结点的基尼值为:

表2 气象数据等级信息表

类似地,我们可计算出其他属性的基尼指数:

Gini_index(D,相对湿度)=0.306

Gini_index(D,风速)=0.440

Gini_index(D,日降水量)=0.593

显然,属性相对湿度的基尼指数最小。所以,它被选为划分属性。图1给出了基于相对湿度对根结点进行划分的结果,各分直接点所包含的样例子集显示在结点中。

图1 基于相对湿度划分的部分决策树

决策树学习算法将对每个分支结点做进一步划分,过程同上。最终得到的决策树结果,如图2所示。

图2 基于相对湿度划分的完整决策树

4 系统分析

以2015年南京的气象数据(图3)和FWI系统生成的火险等级为学习样本,用Python实现决策树算法,最终生成的决策树分类散点图如图4所示。

在此说明:图3(a)是温度变化折线图,结果显示南京夏季温度高,冬季温度低。图3(b)是相对湿度折线图,说明南京一年四季湿度较高。图3(c)是风速折线图,反映了南京风速变化与季节无关。图3(d)是日降水量折线图,图中明显看出夏秋两季降水远远多于春冬两季。南京夏季气温高降水量大,冬季则刚好相反,春秋两季相对湿度低,即春季和秋季森林火灾的概率高于夏季和冬季。这与我们的认识是一致的。

图3 2015年南京市气象数据折线

图4 (a)是由温度和相对湿度绘制的散点图,从图中可以看出相对湿度对火险等级的影响比温度的影响要大,湿度与火险等级呈负相关。图4(b)说明风速对火险等级的影响比温度大,风速与火险等级呈正相关。图4(c)刚好验证了图4(a)和图4(b)的结果。图4(d)说明日降水量对火险等级的影响比温度大,且日降水量与火险等级呈负相关。图4(e)说明日降水量与相对湿度正相关。图4(f)说明风速对火险等级的影响比日降水量大。

图4 每两对参数绘成的决策树散点图

FWI系统的火险等级分为5级,但2015年未出现“极度危险”等级。由图4我们可以看到,火险的影响因素较多,仅凭两个因素并不能准确地判断火险等级。总体来说,温度越高、风速越大、日降水量和相对湿度越低,火险等级越高。

我们利用学习的结果来预测测试数据,结果如表3所示。

表3 系统预测结果

在实际的使用过程中,1表示低级火险,2表示中级火险,3表示较高级火险,4表示高级火险,5表示极其危险和发生火灾。基于此我们可以每天对学习数据进行添加和修正,提高系统预测结果的准确度。

5 结论

本文提出了一种基于无线传感网和决策树模型的森林火灾预测方法。在无线传感网中采集气象数据使用传感器,数据传输采用LoRa技术,以2015年南京的气象数据为例对系统进行了简单的介绍和证明,最后将系统的预测结果与FWI所预测的结果进行了对比,验证了系统的正确性。实践表明,系统还可满足对海量数据的分析和预测,与传统监测方法相比,减少了人力物力的投入,具有实用价值。为了通过最大限度地减少误差和提高统计测量率来改善决策树算法,建议培训和测试所需的年数也要增加。

猜你喜欢
基尼火险林火
无锡惠山区坚持“六抓六强” 构建林火防治铜墙铁壁
驻马店市高森林火险天气气候特征分析
Wimbledon Tennis
林火监测系统在森林防火中的应用与发展
半边天
卷入选战的布基尼
强制“脱衫”
防火迟到
10种国内森林火险计算方法的相似性研究