李 博,冯俏彬,戚克维
(1中共中央党校(国家行政学院)公共管理教研部,北京 100091;2.国务院发展研究中心,北京 100010)
一直以来,台风灾害对国民生命财产安全造成非常大的损失。有学者统计,台风灾害(包括飓风)造成的全球经济损失每年约260亿美元[1]。中国是世界上最易受台风影响的国家之一,自中华人民共和国成立以来,每年平均有7次左右的台风登陆中国,比如从1984—2015年,在北太平洋和南海产生的817个台风中,有249个对中国造成重大经济损失[2]。
中国广东省濒临南海,是台风登陆中国的主要地区,1988—2018年约有112个台风影响广东省[3]。其中,2010—2017年,对广东造成的直接经济损失约达1 500多亿元人民币[1]。随着全球气候变化的背景和影响,极端天气气候事件的发生将会愈发明显。在我国沿海地区,特别是粤港澳大湾区,台风灾害所造成的影响将会不断增加。因此,深入分析台风灾害经济影响,并对台风灾害经济损失的预测进行研究对整体气象灾害损失评估,乃至完善应急减灾救灾体系的建设具有重要意义[4-6]。
近年来,在气象灾害评估和统计的研究方面,中国学者有一些开拓性进展。李建利等[7]基于投入产出模型,对广东省台风灾害所造成的间接经济损失进行了评估,该研究利用广东省投入产出表,通过台风灾害直接经济损失对农业、交通运输仓储业和食品制造等行业的间接损失进行评估。周蕾等[8]在一般投入产出模型的基础上引入MRIO模型,利用区域间投入产出表分析“一带一路”典型国家气象灾害间接经济损失。林江豪等[3]基于BP神经网络和VSM模型对台风灾害经济损失进行评估,结果显示:基于BP神经网络模型和VSM模型方法对台风灾害经济影响的评估取得了一定的效果。然而,目前对气象灾害经济影响的研究方法仍然基于单一模型方法,并没有对模型本身进行改进,这可能造成气象灾害经济评估的结果不够准确。因此,本文提出一种基于遗传算法(GA)改进的BP神经网络模型,即GABP神经网络模型来预测台风灾害直接经济影响,结果表明GA-BP神经网络模型可以有效拟合台风灾害直接经济影响,该方法的适用性可为今后持续开展气象灾害经济影响评估提供参考与指引。
BP神经网络是人工神经网络的一种算法模型,属于人工智能范畴。BP神经网络可模拟人脑神经元对外部激励信号的反应过程,然后建立多层感知机制,再利用自身的学习机制,通过多次迭代学习后构建出处理非线性信息的智能化网络模型。由于BP神经网络具有结构简单、可塑性强、数学意义及学习算法步骤比较明确等优势,已被广泛应用于函数逼近、模式识别以及经济预测和评估等领域[9]。
BP神经网络模型的结构由3部分组成,分别为:输入层、隐含层和输出层。该模型算法的主要思想为:输入样本数据,通过训练,得到一组输出的样本数据。计算网络训练输出的样本数据与实际期望的输出样本数据的误差,然后修正网络的权值和阈值,尽量减小彼此之间误差[10]。BP神经网络结构如图1所示。
图1 BP神经网络结构
假设输入数据为P,输入层的神经元有r个,隐含层内的神经元有s1个,节点转移函数为f1,输出层内的神经元个数为s2个,其对应的节点转移函数为f2,输出层为a,输出的目标矢量用t来代表。信息与数据的正方向传递,隐含层当中第i个神经元的输出为:
式中:b代表神经元的阈值;w代表神经网络的权值。输出层第k个网络神经元的输出为:
式中:b代表神经元的阈值;w代表网络的权值。其中 k=1,2,…,S2;i=1,2,…,S1;j=1,2,…,r;
对于f1为对数S型节点转移函数:
对于f2为节点转移函数:
在确定了误差函数之后,利用梯度下降法求取权值变化以及误差的反方向传播,进行权值的调整和阈值调整,最终达到最优输出。
虽然BP神经网络在使用上有很多优点,但是在实际的应用中BP神经网络也同样暴露出了自身的一些弱点,比如算法学习效率不够高、存在局部最优解以及网络结构的设定需要根据经验来选取[11]。因此,需要对 BP神经网络进行优化和改进。
遗传算法(GA)是一种模拟自然界的遗传机制和生物进化论而形成的一种并行的随机优化搜索方法。染色体编码方法、个体适应度函数、遗传操作和遗传算法运行参数是遗传算法的4个基本要素。编码就是把某一个问题的可行解从它的解空间转换到遗传算法所能够处理的搜索空间的一种转化方法;个体的适应度值是通过适应度函数计算出来的,其选择要根据目标矢量来确定,然后将得出的结果转换成选择概率进行选择操作。适应度值的高低影响着每个个体遗传到下一代的概率的大小;遗传算法的操作过程包含3个步骤,分别为选择、交叉、和变异来对个体进行筛选,然后适应度值较好的个体被保留,适应度较差的个体则会被淘汰,新的群体中的个体不但保留了上一代个体的信息,而且又优于上一代个体。如此经过反复的循环后,直至满足条件[12]。
遗传算法运行参数的操作步骤分3步:
①将一定数目的个体进行某种编码,产生初始的种群的大小;
②按照适者生存和优胜劣汰的理论,逐代进化来产生出好的近似解。在每一代的进化中,需要分别计算每个个体的适应度值,若结果收敛于最优解,则遗传计算结束,并且输出最优解;
③若结果不收敛于最优解,则根据遗传算子分别进行选择、交叉和变异操作,产生出新的种群后,再重复迭代计算每个个体的适应度值,直到求得最优解或者达到最大进化代数停止[13]。
遗传算法作为一种全局性的搜索算法,能够同时搜索整个解空间中的多个点。遗传算法优化BP神经网络在本质上就是利用该算法的全局性搜索特点,最终选取出最优的网络初始连接权值和节点阈值。本文将遗传算法和BP神经网络相结合,利用遗传算法优化BP神经网络的初始权值和阈值,形成GA-BP神经网络模型,充分发挥两者的优势,模型流程如图2所示。
图2 GA-BP神经网络模型流程框图
本文台风样本数据来源于2005—2018年中国气象局主编的《中国气象灾害年鉴》,将《中国气象灾害年鉴》中影响中国广东省的各次台风按照编号顺序进行排列,并将台风所造成的的直接经济损失、受灾人口数量、转移安置人数量和农作物受灾面积以及台风最大风级、台风最大风速等因素取出作为GA-BP神经网络的模型数据。经过统计共收集到53个台风样本数据。由于整体数据较多,不便于全部列举,因此本文只列出2005—2008年的数据,如表1所示。
《中国气象灾害年鉴》中记录的气象灾害直接经济损失是气象灾害发生年份所有行业直接经济损失的总和。各年份之间的统计数据没有考虑地区生产总值的变化和物价水平的变化。如果直接运用未经处理的数据进行经济损失分析,可能会造成结果不准确,进而降低可参照性和可比性。因此,本文参照2019年《广东统计年鉴》中各年份地区生产总值、商品零售价格指数和居民消费指数,将广东省台风灾害直接经济损失按照1988年物价水平进行调整,如表2所示。
表1 台风样本数据
表2 物价调整前后广东省台风灾害直接经济损失 亿元
本文将收集到的53个台风数据作为GA-BP神经网络模型的样本数据,分为2组,一组数据作为训练集用于训练GA-BP神经网络模型,共有43个台风数据;另一组作为测试集,用于检验GA-BP神经网络模型的准确性,共有10个台风数据。根据《中国气象灾害年鉴》中记录的有关台风灾害致灾因子,每组数据中确定台风最大风力、台风最大风速、受灾人数、转移安置人数和农作物受灾面积5种致灾因子变量,并作为GA-BP神经网络输入数据进入输入结点,将直接经济损失作为最终输出结果数据,放入输出结点。
本文利用MATLAB软件编写GA-BP神经网络模型程序,按照5种变量致灾因子设计GA-BP神经网络模型结构,即出入层结点数为5,输出层结点数为1。由于隐含层节点数目,GA算法初始种群数目以及迭代次数的确定方法目前并没有定论,只有通过实验中的实际情况进行调整和确定[14]。经过试验结果对比,本文确定隐含层节点为11,因此BP神经网络模型的基本结构为5-11-1,GA算法的初始种群数目为50,迭代次数为100。
为了充分验证模型的可行性,本文给出2种对比实验。第1种是分别利用单一BP神经网络模型和GA-BP神经网络模型,就物价调整前直接经济损失进行预测,如图3所示,然后就2种方法的预测结果进行对比;第2种是在物价调整后,同样分别利用GA-BP神经网络模型与单一BP神经网络模型就直接经济损失进行预测,并对预测结果进行对比,如图4所示。
图3 物价调整前神经网络模型输出结果
图4 物价调整后神经网络模型输出结果
图3、4中的“期望输出”曲线为测试集中10个台风样本的实际直接经济损失值。可以看出,无论是物价调整前还是物价调整后的直接经济损失预测,GA-BP神经网络模型的预测结果都要优于单一BP神经网络模型,这表明利用GA优化BP神经网络模型的效果是明显的。另外,尽管GABP神经网络模型和单一BP神经网络模型都存在一定程度的误差,但2种方法的整体预测趋势是正确的,都同步随实际直接经济损失值进行波动。
为了进一步考量物价调整的有效性,将物价调整前后GA-BP神经网络模型和单一BP神经网络模型的预测结果取出,并计算误差值。由于预测结果不在同一物价水平上,因此,采用相对误差值衡量误差情况,如表3所示。可以看出,在10个测试台风样本中,无论在物价调整前后,GA-BP神经网络模型的预测结果都达到最优,即相对误差值最小。再结合图4,可以推断GA-BP神经网络模型在台风直接经济损失预测中整体效果良好,且部分台风样本的直接经济损失预测值和真实值基本重合。
表3 2种神经网络模型预测结果相对误差
此外,在物价调整后单一BP神经网络模型的预测结果仍然优于物价调整前GA-BP神经网络模型的预测结果,这表明按照统一物价水平调整直接经济损失值的重要性。
需要特别指明2点:一是图4中第7个台风样本的预测值与真实值的绝对误差相对较大。这是由于在实际的直接经济损失统计中,出现了突发点(即在相似的致灾因子下,统计结果出现异常增大的情况,当然也不排除实际统计工作有误),但预测趋势并没有受到影响,这也表明即便出现异常值,GA-BP神经网络模型的预测结果也具有很强的参考性;二是表3中第9个台风样本的相对误差值较大。这是由于该台风所造成的实际直接经济损失值较小,细微的误差都可能使相对误差值波动较大。但由于绝对误差值很小,因此并不影响预测结果的可参考性。
利用遗传算法改进BP神经网络,形成GA-BP神经网络模型,将近年来广东省台风最大风力、台风最大风速、受灾人数、转移安置人数和农作物受灾面积5种变量作为致灾因子及GA-BP神经网络模型输入数据对台风灾害直接经济损失进行预测,经对预测结果分析后,得出如下结论:
1)气象灾害统计数据中的台风灾害直接经济损失是根据台风发生年份地区生产总值和物价指数进行统计的,各年份之间的数据不处在同一物价水平上,没有直接可比性。实验表明,将台风灾害直接经济损失数据放入神经网络模型中得到的预测结果准确性不高。但若对物价进行统一调整之后,直接经济损失预测结果大大改善。因此,在涉及到气象灾害经济损失评估的研究中,一定要充分考虑地区经济发展相关指标情况,尤其是地区生产总值和物价水平等因素。
2)GA-BP神经网络模型预测结果明显优于单一BP神经网络模型,特别是在台风灾害经济损失值根据物价水平调整之后,拟合性较好,整体预测结果和发展趋势都趋近于真实值。在气象灾害发生后,有关部门可尝试采用与本文类似方法对灾害直接经济损失进行评估并作为实际参考。因为在现实中,对各行业进行灾损统计周期较长,不利于政府在应急财政投入方面迅速作出反应[15-16]。而GA-BP神经网络模型是基于历史数据建立的人工智能学习机制,仅需将基本致灾因子统计出来进行输入,就可得出具有很强参考价值的灾损数据。这极大提升了政府在灾情统计方面的时效性。
3)尽管GA-BP神经网络模型效果良好,但仍有需要改进的地方。比如遇到极端数据的情况时,预测准确度会有所下降。在今后的研究中,可探索尝试2个方面的改善,一是考虑更多致灾和孕灾因子进入到神经网络模型中进行训练,增强神经网络的学习能力,进而提高预测精确度;二是尝试利用多种模型同时进行训练,形成集成性的神经网络模型,整体提高学习能力和预测结果准确性。