基于加权VHSD-EM模型的森林火灾风险评估

2023-01-16 02:51王亚男陈飞飞王新建
广西林业科学 2022年6期
关键词:林业站年份权重

王亚男,李 勇,陈飞飞,王新建

(1.中国消防救援学院 基础部,北京 102202;2.中国消防救援学院 消防工程系,北京 102202;3.黑龙江省森林消防总队哈尔滨支队,黑龙江哈尔滨 150028)

森林资源的健康持续发展对于保障国家木材安全、维护生态系统平衡及推进生态文明建设意义重大[1-2]。森林火灾作为全球发生最频繁的自然灾害之一,严重危害森林资源的健康发展。据应急管理部相关数据显示,2014—2020年,我国共发生森林火灾17 872起,受害森林面积超过10万hm2。在全球气候日益变暖的大环境下,我国森林防火、灭火工作面临严峻考验。森林火灾的发生受自然条件、经济社会水平及人类活动等因素影响[3]。实现对森林火灾风险的科学评估,对防范森林火灾发生,降低森林火灾损失,具有重要的指导价值和现实意义。

在森林火灾风险评估的研究中,国内外学者主要围绕评估模型的选择展开研究。研究者们采用信息扩散理论[1]、卷积神经网络[4]、加权贝叶斯网络[5]、突变级数法[6]和Logistic模型[7]等展开森林火灾风险评估。这些研究主要采用小样本,信息量不足;对图像识别与信息提取、风险因子依赖性等问题进行探讨,但未能将各样本的差异特征纳入评估过程,不能很好地兼顾时间因素和个体信息量的共同作用,忽略防火管理及投入对森林火灾风险的影响。本研究采用加权VHSD-EM森林火灾风险评估模型,兼顾森林火灾风险评估中时间因素和个体信息量,为森林火灾风险研究提供新思路。

1 森林火灾风险评估体系

森林火灾的发生受到多种因素的综合影响。参考国内外文献[8-10]及近几年的森林火灾案例,结合现行标准引发森林火灾的因素,在遵循代表性、科学性和可得性的基础上,基于经济水平、自然环境、管理水平、防火投入和历史灾情5个维度,选取26个基本指标构建森林火灾风险评估指标体系(表1)。

表1 森林火灾风险评估指标体系Tab.1 Forest fire risk assessment index system

经济水平代表一个地区的经济发展程度,可在一定程度上影响当地人民群众的综合素质。人均GDP和人均可支配收入可反映当地人民群众的富裕程度,人口密度可反映当地人民群众的居住环境,人口受教育水平可反映当地人民群众的文化程度,公路里程(二级公路)可反映当地的交通通达程度。自然环境是森林火灾发生的基础条件,主要包括气温、降水和可燃物等。年均降水量、年均相对湿度和年均气温可反映当地的气候条件,森林蓄积量和森林覆盖率可反映当地的可燃物情况。林业站的管理水平也在一定程度上影响着森林火灾的发生。林业站个数、乡村护林员数量可反映当地对林业管理的重视程度,林业站管理人员受教育程度、林业站管理人员专业技术水平、林业站站长再培训情况和林业站站员再培训情况可反映当地林业站的人才队伍建设水平。防火投入是预防森林火灾发生的必要条件。林业站投资总额、森林防火与森林公安投资水平可反映当地当年内防火资金的投入水平,通讯设施完善度、信息化硬件服务水平、信息化软件服务水平可反映当地基础设施的完善程度,防火宣传水平可反映当地对森林防火的舆论宣传力度。历史灾情可在一定程度上反映当地森林火灾发生的可能性。森林火灾次数、火场总面积、受害森林面积和其他损失折款可反映当地因森林火灾造成的直接或间接损失。

2 VHSD-EM模型

VHSD-EM模型是“纵横向拉开档次法-熵值赋权法(Vertical and Horizontal Scatter Degree method and Entropy Method)模型的简称[11]。该模型基于研究事物的客观特征,从已有的统计数据提取事物影响因子的信息量,同时融合时间因素,充分体现被评测对象的差异特征,实现对研究事物的定量测度。目前,VHSD-EM模型已被广泛应用于经济管理领域[12-13],较好地实现对研究事物的客观评价。

2.1 VHSD模型的基本原理

VHSD模型基本原理为对于某一系统,涉及T个年份,m个被评价对象和n个基本指标,先将这些指标按照年份先后顺序排列成时间综列数据(表2)。表中,ui为第i个样本的具体名称;x(ijtT)为第i个样本在第T年的第j项指标的数值。

表2 时序立体数据表Tab.2 Time series stereoscopic data table

为保证测算结果的科学性,首先采用极值法对所有数据进行无量纲化处理[14]。对正向指标的处理公式为:

对逆向指标的处理公式为:

式中,yij为经处理后的标准化值,其取值介于[0,1];Nij为数据所在列中的最小值;Mij为数据所在列中的最大值。形成标准化数据矩阵记为Yijk,k=1,2,…,T。

取Yijk的转置矩阵记为Y'ijk,计算Y'ijk×Yi(jkHk),得到各年份的对称矩阵。依据VHSD原理,采用总离差平方和的方法,以最大化体现各样本间的差异,其中:

式中,σ为指标权重矩阵;Z(it)为样本i在第t年的综合评估值;H=为对称矩阵,在限定δ'δ=1的情况下,取矩阵H的最大特征值对应的特征向量时,σ2取得最大值。此时,对该特征向量进行归一化处理得到权重矩阵δ。

2.2 EM模型的基本步骤

对每一年度的数据采用计算各指标熵值的方法体现其内含的信息量。令vijk表示第i个评估对象在第k年第j项指标下的特征比重。

式中,yijk为第i个评估对象在第k年第j项指标的标准化值。计算第j项指标的熵值,记为Eik。

其中,当vijk=0或1时,令vijkln(vijk)=0。设指标的差异系数为Djk,Djk越大,表示指标j内含的被评估对象的信息量越大,越应赋予其较大权重,该指标在评估体系中越为重要。

由此可确定各年份各指标的熵值权重为:

在得到VHSD法确定的权重δj和EM法确定的各指标各年份的权重Wjk后,计算对应指标的二者权重算术平均值,得到每个基本指标的最终权重τjk。采用线性加权法计算得到各研究对象在各年份的综合分值,记为Pmk。

各年份的计算结果构成以各省(自治区、直辖市)为行、年份为列的矩阵,即:

由于VHSD-EM模型计算的结果是对以往各年份火灾风险的测算,评价具有时滞性。为更好地反映各地区森林火灾发生的潜在风险,引入对以往各年份赋权的方法,构造森林火灾风险评估指数,以更好地对各地区的森林火灾风险进行推测。

以“1”作为基准量对其进行T等分,按照“由远及近”的原则,确定各年份的权重,即距离现在最远的年份赋权为,次远的年份赋权为,依次类推,直至最近年份权重值赋权为1。计算各地区的森林火灾风险指数(Pm),公式如下:

所得的指数值越大,表明该地区发生火灾的风险越大;反之,该地区发生火灾的风险越小。

3 实例分析

3.1 数据来源及处理

以2014—2020年我国29个 省(自治区、直辖市)为例,依据加权VHSD-EM模型展开森林火灾风险评估。经济水平、自然环境和历史灾情的数据源于2015—2021年的《中国统计年鉴》。人口密度为辖区内常住人口数与辖区面积的比值,人口受教育水平为辖区内大专以上学历人口数与6岁以上人口数的比值。

管理水平和防火投入的数据源于2014—2020年的《中国林业统计年鉴》。林业站管理人员受教育程度为林业站大专以上学历人数与总人数的比值,林业站管理人员专业技术水平为高级技术人员占总人数的比值。通讯设施完善度为通讯设备站数,信息化硬件服务水平为计算机站数,信息化软件服务水平为林业信息化投资额。

3.2 计算过程

将29个省(自治区、直辖市)1所考察的省(自治区、直辖市)包括北京、天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、安徽、福建、江西、山东、河南、湖北、湖南、广东、广西、重庆、四川、贵州、云南、陕西、甘肃、青海、宁夏和新疆。其他地区部分数据缺失,未纳入。各年份的26个基本指标数据,按照年份和指标的先后顺序排列成时序立体数据表。得到标准化的数据矩阵记为yk,其中k代表年份,k=1,2,…,7,具体为:

求出yk的转置矩阵ykT,并计算各个hk,即:h1=Hk=∑hk。根据公式(3),求出Hk的最大特征值及其对应的特征向量,并对该向量进行归一化处理,可得VHSD确定的各指标权重矩阵δk26×1,结果为:

针对每年的标准化数据,按照公式(4)~(7)的计算方法通过Matlab(R2016a)软件求出各年份数据的EM权重,记为Wk26×1,k=1,2,…,7,具体为:

然后,对各年份的δk26×1和Wk26×1取算术平均值,可得各指标在各年份的权重值,记作τk26×1。

利用线性加权法求得各年份的综合分值,记为Pk。

具体结果为:p1=[0.379,0.440,…,0.431]T,p2=[0.384,0.455,…,0.455]T,p3=[0.397,0.447,…,0.399]T,p4=[0.412,0.450,…,0.440]T,p5=[0.382,0.442,…,0.430]T,p6=[0.439,0.490,…,0.388]T,p7=[0.430,0.456,…,0.438]T。

4 结果与分析

4.1 模型的稳健性检验

为保证测算结果的科学性与稳定性,采用斯皮尔曼相关性检验法对测算结果进行验证[11]。用该系数对样本评估排序的一致性进行检验,即分别将VHSD-EM模型所得分值与其基准模型进行比较(表3)。

表3 2014—2020年斯皮尔曼相关性检验结果Tab.3 Spearman correlation test results from 2014 to 2020

各年份的斯皮尔曼相关系数基本上均大于0.5且均相关性显著,说明与基准模型相比,VHSD-EM模型能保证测算结果的一致性,并集合各单一模型在指标权重确定中的优势。本研究构建的VHSDEM模型具有较强的稳定性。

4.2 森林火灾风险指数结果分析

森林火灾风险排名前五的地区为内蒙古(2.348)、四川(2.214)、山西(2.113)、广西(2.085)和黑龙江(2.027),表明这些地区发生森林火灾的可能性高于其他地区。原因为这些地区的经济水平与发达地区相比仍存在较大差距,在林业防火管理方面缺少必要的技术人才,防火投入力度有待提升;这些地区的森林蓄积量普遍较大,一些省份的年降水量偏少。如四川省,其森林蓄积量在2020年达186 099万m3,受自身所处地理位置和自然条件的制约,年均气温较高,火灾隐患较严重。这一研究结果与李艳梅等[15]、苏丽娟等[1]的研究结论不完全一致。可能的原因在于研究的年限和采用的数据不同,且本研究采用动态测算模型并进行改进。

5 结论与讨论

森林火灾的发生严重威胁森林资源的持续发展[16-17]。构建科学有效的评估模型对森林火灾风险进行评估,有助于推进森林防火、灭火工作的顺利开展[15,18-19]。本研究从经济水平、自然环境、管理水平、防火投入和历史灾情5个维度出发,选取26个基本指标构建森林火灾风险评估体系,采用加权VHSD-EM模型确定森林火灾风险评估指数。VHSD-EM模型是动态评价方法与静态评价方法的有机结合,本研究通过对时间赋权的方法确定森林火灾风险指数,能将时间因素纳入森林火灾风险的评估过程中,是对以往森林火灾研究中静态评估方法的突破。以我国各省(自治区、直辖市)2014—2020年数据为样本,采用加权VHSD-EM模型展开森林火灾风险评估,并对模型的稳健性进行检验。结果显示该模型能够较好地实现对各地森林火灾风险的监测评估,稳健性良好,可操作性与实用性较强。

森林火灾风险评估是森林防火、灭火工作的重要内容,本研究的开展为森林火灾风险研究提供一种新思路。考虑各地区在地形、林木种类等方面的差异,本研究在指标数据的选取上对结构化数据的依赖性较大。遥感信息技术的发展为半结构化和非结构化数据的获取提供新方法,是未来用于森林火灾风险体系指标数据获取的重要途径。在数据处理过程中,指标间的相关性也是值得考虑的问题,未来在评估方法的构建上可采用适当方法降低因评估指标相关性产生的影响。

猜你喜欢
林业站年份权重
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
特殊的一年
乡镇林业站在林业建设方面发挥的作用
权重常思“浮名轻”
充分发挥基层林业站作用推进现代林业建设
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
基层林业站林业发展策略之浅析
什么是闰年?
一样的年份