基于GA-SVR-C的城市暴雨洪涝灾害危险性预测

2021-09-18 13:11符洪恩高艺桔冯莹莹黄婕茵刘祖发
人民长江 2021年8期
关键词:危险性向量暴雨

符洪恩 高艺桔 冯莹莹 黄婕茵 刘祖发

摘要: 为了准确评估暴雨事件对人类社会带来的影响,需充分考虑暴雨序列的不确定性特征。运用云模型对城市暴雨灾害进行危险性评估能够很好地解决暴雨灾害评估中的不确定性问题。选取深圳市4种暴雨致灾因子历史序列(2002~2012年)作为评价指标,运用组合赋权法计算各因子权重,通过云模型算法得到历史危险性评估结果。使用基于遗传算法参数优化的支持向量回归机模型(GA-SVR)预测2013~2016年各致灾因子值,并结合云模型(GA-SVR-C)预估预测年份的危险性等级,并与SVR(支持向量回归机模型)及BP人工神经网络的预测结果进行对比分析。结果表明:GA-SVR-C模型在评价因子的预测精度上整体要优于其他两个模型,得到的危险性评估结果与实际结果基本一致,很好地反映了城市暴雨灾害的风险水平。

关 键 词: 暴雨洪涝灾害; 危险性分析; 云模型; 支持向量机; 遗传算法

中图法分类号:  P333

文献标志码:  A

DOI: 10.16232/j.cnki.1001-4179.2021.08.003

0 引 言

近年来,随着中国城市化进程不断加快,以暴雨为典型的极端降雨事件在中国各大城市频繁发生[1-2],对社会经济造成了巨大的损失。国内学者对城市暴雨灾害事件风险评估做了大量的研究,如张玉华等[3]提出了一种以模糊数学为理论依托的模糊综合指标评价体系,能够科学地对风险因素的模糊性进行量化分析;彭健等[4]基于体积淹没算法,利用CLUE-S等空间模型来模拟不同土地利用以及不同致灾因子危险性情境下茅洲河流域的洪涝风险程度。但是这些传统的暴雨灾害评估方法没有全面考虑暴雨这一自然灾害事件的不确定性属性,往往只是从确定性或者模糊性、随机性等单一不确定性角度去解决问题,无法较好地对含有多种不确定性的复合系统进行评估。

云模型(Cloud Model,C)算法耦合了概率统计和模糊理论,综合考虑了随机性和模糊性,是实现定量数值与定性概念不确定性转化的有效工具[5]。在暴雨灾害评估方面,云模型能够很好地处理在降水测量过程中出现的系统误差以及人为误差等随机性成分,且在灾害等级划分时可充分考虑灾害风险程度界定中亦此亦彼的模糊性。近年部分学者将云模型理论用在了水文气象灾害评估领域,如金菊良等[6]借助云模型对自然序列不确定属性的优良展现能力,分析了安徽省干旱时空分布均匀性及稳定性特征;万昔超[7]、石晓静[8]等均利用云模型算法确定研究区域的洪涝灾害风险等级,并使用ArcGIS风险分析功能分析区域风险等级分布以及变化情况;王贺等[9-10]选取了若干影响雨洪灾害的指标,并使用云模型构建了城市极端降雨灾害风险评价模型,在此基础上使用云推理算法提出了洪灾动态预警模型,研究成果能够为防洪排涝规划提供有效参考和依据。

在2004年,冯汉中等[11]首次用支持向量机(Support Vector Machine,SVM)解决气象问题,此后,大量学者陆续将SVM引入降水预报的研究中[12]。支持向量回归机(Support Vector Regression,SVR)是SVM用以处理回归预测问题的拓展模型。为了解决极端降水预测这一随机性较强的问题,学者们提出了粒子群、遗传算法(Genetic Algorithm,GA)、模拟退火等智能算法对SVM的参数进行优化选取。GA算法因具有强大的并行运算能力和寻找全局最优值的搜索能力[13],从而能有效提升SVM的泛化能力和预测精度。唐娟[14]、王寻[15]等在极端降水预测研究中采用了遗传优化算法对支持向量机的参数进行择优,均取得了良好的预测结果。但目前较少有研究将云模型算法与基于遗传算法的支持向量回归机(GA-SVR)模型结合应用于洪涝灾害风险评估领域。

致灾危险性是风险评估最基本和重要的环节,构建云模型作为暴雨洪涝危险性评估工具,有着适应性强、不受地域限制等优点,具有普遍的参考价值。结合对极端降水有良好预测能力的GA-SVR模型和云模型构建风险预估模型(GA-SVR-C)用以预测深圳市暴雨灾害危险性未来走势,在保证精度良好的前提下,能够为城市防洪方案的制定、防洪工程的建设提供参考依据。本文首先根据各评价因子历史数据构建云模型,从而对历史暴雨洪涝灾害危险性进行等级评估;其次,构建GA-SVR预测模型对各个评价因子进行预测;最后,将每个因子的预测值带入构建好的云模型中即构建GA-SVR-C模型来评估未来暴雨灾害危险性等级。

1 基本原理和方法

1.1 云模型

1.1.1 云模型原理

云模型是自然语言值表征的某个定性概念C与其定量数值之间的不确定性转换模型,也是云的具体实现方法。设U是一个数值论域,C是U上的定性概念,若任意x∈U为对应于概念C的一次随机实现,且均存在一个具有稳定倾向的随机数μ(x)∈[0,1]作为x对C的确定度,则称x在论域U中的分布为云模型,简称为云[16]。每个x与其确定度构成的二维数值称作一个云滴。

云模型中包含3个参数:期望Ex、熵En、超熵He,如图1所示。这3个参数也称作云的数字特征,其能够整体上反映出概念C的定量特性。期望值Ex是最能代表定性概念的数据点,是论域的中心值;熵En是定性概念模糊性和隨机性的度量,En越大,云滴的取值范围越大,离散程度越大,反之则越小;超熵He是熵的熵,表征熵的不确定性程度,在云图中是云厚度的反映。

1.1.2 云数字特征的计算方法

设第i(i=1,2,…,n)个评价因子对应第j(j=1,2,…,m)个评语的上下限值为Lijmax和Lijmin,则云模型3个数字特征值计算公式[17]可表示为

Exij=(Lijmax+Lijmin)/2Enij=(Lijmax-Lijmin)/6Heij=k×Enij   (1)

本文假定En与相应的He存在线性关系,取k=0.1来控制云层的厚度。

1.1.3 云发生器

产生云滴并实现概念C的云分布是通过云发生器(Cloud Generator,CG)来实现的,云发生器是一种产生云的一系列算法。其中正向云发生器和逆向云发生器是云模型最基本的算法,计算方法可见文献[18]。

在云模型中,还可以根据不同的目的和已知的条件运用不同的云发生器。设有论域U,C为U对应的概念,若给出U中的特定数值x,将其代入云发生器计算得到该数值对于C的确定度,则称该云发生器为x条件云发生器(见图2)。

x条件云发生器详细算法:① 根据已知的云参数En、He生成En′=NORM(En,He);② 根据得到的En′并输入Ex与特定值x计算出μ=e-(x-Ex)2/2En′2。

1.1.4 云模型搭建方法

本文以4种致灾因子数据集作为评价因子集,将评价因子集依照数据大小划分若干区间,设定“安全”至“高危险”危险性等级作为评语集以表征这些区间所对应的风险状态并给出评语。图3展示了云模型的评估流程。

1.2 支持向量回归机

Vapnik等[19]根据统计学理论提出了支持向量机(Support Vector Machine,SVM)模型,该模型遵循结构风险最小化的原则,在控制训练误差和模型结构复杂度之间做出了权衡,使得真实风险达到最小,确保模型训练误差较小的同时提升了其泛化推广能力。

SVM模型最初用来解决模式识别[20]、分类问题等,其能够将复杂的高维寻优问题转化为二次规划求解问题,理论上可以得到全局最优解,而且对处理小样本、非线性、高维度等问题也有很好的效果[21-22]。随着ε不敏感损失函数的引入,SVM经过拓展产生了SVR模型可用来解决回归问题,详细算法可见文献[23]。

1.3 遗传算法对支持向量回归机的优化

SVR的预测性能会受到惩罚因子C、RBF核参数g以及不敏感损失函数ε这3个参数取值大小的

影响,为了能够搜索得到这3个参数的最佳组合从而提升SVR的回归精度以及泛化能力,本文选取了遗传算法[24]作为SVR参数的优化算法。遗传算法基于自然选择和遗传学原理,是一种模拟生物适者生存优胜劣汰进化演变规律的智能优化算法。该算法能够快速地找到全局最优解,降低基于经验选择的不确定性[25],提高模型的预测精度。利用GA算法对SVR参数寻优的具体步骤如下[26]:

(1) 设定C,g以及ε参数的实际可能取值范围。

(2) 将这些SVR参数进行二进制编码,并随机产生初始种群。

(3) 选定适应度函数来评估个体的适应度大小,本文选取的适应度函数为均方误差。

(4) 采用轮盘赌法使得适应度较大的个体可以较大概率作为父代进行复制繁衍。

(5) 以一定概率对种群进行交叉、变异操作,产生下一代种群。

(6) 重复以上步骤直到种群满足给定的优化准则,这里选取最大进化代数作为优化准则,若满足则输出最佳的SVR参数组合。

2 历史暴雨洪涝灾害危险性等级评估

本文所用数据为国家气象中心提供的深圳市1960~2016年57 a间的降雨数据。将该降雨数据集通过整理计算得到暴雨洪涝评价因子数值论域:年降雨量U1、年暴雨日数U2、平均暴雨量U3和最大日降雨量U4。本文将灾害危险性等级分为1~5级,V=(V1,V2,V3,V4,V5):安全、趋于安全、趋于危险、危险、高危险。Ui(i=1,2,3,4) 中的各要素值在V中每一危险性等级下的确定度都可以用一朵云来表示。本章将2002~2012年的Ui(i=1,2,3,4)值作为云模型的输入数据,用以评估这些年份的危险性等级。

2.1 评估等级限值的确立

采用经典水文频率曲线法来计算评估等级的上下限值。选取水文频率通用函数P-Ⅲ型分布函数作为理论频率函数[27],选定与各序列经验点数据拟合效果最好的理论频率曲线作为适用曲线,根据设计频率查询对应要素限值。参考文献[28]中的水灾害等级设计频率,表1给出了指定设计频率下的评价因子各等级限值。

2.2 云数字特征值的计算

通过上文了解到,可以用云定量刻画各个评价指标对于不同危险性等级的定性概念,而确定云参数是实现云的首要步骤,根据公式(1)求得云参数的结果如表2所列。

2.3 单因子云隶属度的计算

将2002~2012年的4种致灾因子数据代入x条件云发生器中分别计算各个等级下的确定度1 000次,取期望值作为最终隶属度,得到历史单因子危险性隶属度矩阵 F ij(i=1,2,…,55;j=1,2,3,4)。表3展示了2012年暴雨洪涝单因子隶属度等级分布。

2.4 确定评价指标的权重

为了确保权重对评估结果的影响最小,本研究结合层次分析法与熵权法即主客观组合赋权的方式来确定权重。计算公式[29]为

wi= di×ei  4 i=1 (di×ei) ,i=1,2,3,4 (2)

式中: D , E , W 分別为层次分析法、熵权法以及组合赋权法的权重矩阵。

根据式(2)计算得到的最终权重为

W =(0.072 7,0.240 4,0.124 1,0.562 7)T (3)

通过式(4)将单因子隶属度矩阵 F 与权重矩阵 W 进行模糊变换得到综合隶属度矩阵 A 。利用矩阵 A 得到历史暴雨洪涝灾害危险性隶属度分布如图4所示。

A = F × W  (4)

2.5 历史暴雨洪涝灾害危险性评估结果分析

从图4中可见:整体上这11 a中隶属度较大的灾害危险性等级基本位于1~3级,多数年份隶属于4~5级的确定度较低。2011年的“安全”等级以及2003年的“趋于安全”等级隶属度属于中高水平(0.5~1.0),除此之外其他年份各危险等级的确定度为较低水平(<0.5)。

根據最大隶属度原则,从每一年份的各危险性等级隶属度中选择最大隶属度所对应的等级作为最终的危险性评估等级,深圳市历史暴雨洪涝灾害危险性等级评估结果如图5所示。

2002~2012年间,暴雨洪涝灾害危险性等级为“趋于安全”的年份最多,共有5 a,其次是处于“安全”等级的年份,共有3 a。危险性等级较高的年份均集中在2005~2009年间,其中2005年以及2009年属于“趋于危险”等级,而2008年的危险

性等级高达第4级“危险”等级,在评估年份中危险性最高。这11 a的危险性评估结果与《深圳市水利志》以及深圳市水务局网站的历年暴雨洪涝灾情

统计信息情况基本符合,等级确定较为合理。如《深圳市水利志》等资料记载:2008年“6·13”特大暴雨事件降雨强度超50 a一遇,深圳多处内涝严重,但水库、堤防防洪成效显著,无险情,也没有产生群死群伤等重大损失,所以危险性形势比较符合该年份第4级“危险”等级。

3 GA-SVR-C模型结果分析

将深圳市1960~2016这57 a的年降雨量U1、年暴雨日数U2、平均暴雨量U3、最大日降雨量U4序列分别构建GA-SVR模型,取前53 a数据作为模型训练样本,后4 a数据用以验证模型预测效果。

3.1 评价因子预测结果分析

为了能够更加客观地分析GA-SVR对暴雨洪涝致灾因子序列值预报的准确性,根据同样的输入样本构建无参数优化算法的SVR模型以及BP人工神经网络(BP-network)模型来进行对比验证,各模型对评价因子预测结果如图6所示,模型预测效果采用平均相对误差来衡量,结果如表4所列。

采用灰色关联度分析方法[30]来比对模型的预测结果与原始值的关联性大小,计算得到GA-SVR、SVR、BP-network模型评价因子的预测结果与原序列值的平均关联度为0.685 4,0.635 9,0.577 0,可知GA-SVR的预测序列与原序列的几何形状相似程度最高,整体态势最接近,表明 GA-SVR对于暴雨序列这种复杂的问题仍然具有较强的学习能力以及良好的泛化能力。

从表4中可以看出:3个模型的平均相对误差都控制在30%以内,其中GA-SVR以及SVR模型的预测误差均控制在20%以内,而BP-network模型对年降雨量以及年暴雨日数的预测误差均大于20%,相较于BP-network,SVR模型体现出了其处理小样本以及非线性等问题的优势。GA-SVR每个评价因子的平均相对误差均比其他两个模型对应误差低,可见经过参数优选的GA-SVR模型的预测性能相较于未经过参数优选的SVR模型有一定的提升。

3.2 危险性等级预测结果分析

将各模型评价因子预测结果代入云模型评估系统中得到预测年份的危险性等级如表5所列。从表中观察到2013,2015,2016年暴雨洪涝危险性等级较低,且3个模型对于这些年份的预估等级基本符合深圳市出现暴雨洪涝风险程度较低的真实情况。在2014年深圳市经历了多场大暴雨,造成大面积的交通受阻以及出现多达200个内涝点,暴雨洪涝灾害的危险程度较高,支持向量回归机-云模型(SVR-C)以及BP人工神经网络-云模型(BP-network-C)对于该年份的危险性等级预测结果均为“趋于安全”,这显然不符合实际深圳市的受灾情况,而GA-SVR-C的预测结果与原始结果一致,均为“危险”等级,充分反映了该年份灾害风险的真实水平,证明了该模型对于暴雨洪涝灾害危险性等级预测是精确可靠的。

4 结 语

在深圳市暴雨洪涝灾害危险性评估中,本文使用云模型作为历史灾害的评估方法。云模型充分考虑了暴雨这一自然要素序列分布的随机性以及区间归属的模糊性,将暴雨灾害危险性这一定性概念与定量数值进行不确定性转换,得到的评估结果更加客观合理。为了能够预测未来灾害的危险性走势,还提出了GA-SVR-C预测模型,实例证明该模型能够充分学习暴雨致灾因子历史序列并从复杂的非线性问题中挖掘出较多的预测信息,得到的预测效果优于SVR以及BP人工神经网络模型且与真实情况基本一致,是十分有效可行的危险性预测工具。

云模型中描绘定性概念的3个参数值的计算目前没有完整的理论依据,往往依靠经验公式进行确定,难以论证其反映定性概念的程度。如何在保证预测精度良好的情况下将GA-SVR-C模型更简便地应用在评估结构复杂、评价因子繁多的评估工作中还需要进一步探究。

参考文献:

[1]  翁莉,马林,徐双凤.城市暴雨灾害风险评估及防御对策研究:以江苏省南京市为例[J].灾害学,2015,30(1):130-134.

[2] 孔锋.透视变化环境下的中国城市暴雨内涝灾害:形势、原因与政策建议[J].水利水电技术,2019,50(10):42-52.

[3] 张玉华,蔡甜.城市暴雨内涝灾害风险模糊综合评价体系构建研究[J].水利规划与设计,2019(11):103-107.

[4] 彭建,魏海,武文欢,等.基于土地利用变化情景的城市暴雨洪涝灾害风险评估:以深圳市茅洲河流域为例[J].生态学报,2018,38(11):3741-3755.

[5] 蒋嵘,李德毅,陈晖.基于云模型的时间序列预测[J].解放军理工大学学报(自然科学版),2000(5):13-18.

[6] 金菊良,李辉,李靖,等.基于云模型的安徽省干旱时空分布特征分析[J].水电能源科学,2017,35(4):1-5.

[7] 万昔超,殷伟量,孙鹏,等.基于云模型的暴雨洪涝灾害风险分区评价[J].自然灾害学报,2017,26(4):77-83.

[8] 石晓静,查小春,刘嘉慧,等.基于云模型的汉江上游安康市洪水灾害风险评价[J].水利水电科技进展,2017,37(3):29-34.

[9] 王賀,刘高峰,王慧敏.基于云模型的城市极端雨洪灾害风险评价[J].水利经济,2014,32(2):15-18.

[10]  王贺,刘高峰,王慧敏.基于云模型的城市极端雨洪灾害预警研究[J].水利经济,2014,32(4):59-62.

[11] 冯汉中,陈永义.处理非线性分类和回归问题的一种新方法(Ⅱ):支持向量机方法在天气预报中的应用[J].应用气象学报,2004(3):355-365.

[12] 罗芳琼.支持向量机在降水预报中的应用综述[J].广西科技师范学院学报,2017,32(2):113-116.

[13] ROUSHANGAR K,KOOSHEH A.Evaluation of GA-SVR method for modeling bed load transport in gravel-bed rivers[J].Journal of Hydrology,2015,527:1142-1152.

[14] 唐娟,万定生,程习锋.一种极端降水预测方法研究[J].信息技术,2014(4):19-23.

[15] 王寻,万定生,唐娟.基于组合模型的极端降水预测方法[J].计算机仿真,2015,32(12):354-359.

[16] 刘常昱,李德毅,潘莉莉.基于云模型的不确定性知识表示[J].计算机工程与应用,2004,40(2):32-35.

[17] 徐征捷,张友鹏,苏宏升.基于云模型的模糊综合评判法在风险评估中的应用[J].安全与环境学报,2014,14(2):69-72.

[18] 吕辉军,王晔,李德毅,等.逆向云在定性评价中的应用[J].计算机学报,2003(8):1009-1014.

[19] VAPNIK V.The nature of statistical learning theory[J].Machine Learning,2005,20(1):273-297.

[20] 谢昊伶,彭国华,郭满才,等.基于改进的SVR模型在年降水量预测中的应用[J].数学的实践与认识,2017,47(18):154-161.

[21] 杜树新,吴铁军.用于回归估计的支持向量机方法[J].系统仿真学报,2003,15(11):1580-1585,1633.

[22] 祁亨年.支持向量机及其应用研究综述[J].计算机工程,2004,30(10):6-9.

[23] 栗然,李广敏.基于支持向量机回归的光伏发电出力预测[J].中国电力,2008,41(2):74-78.

[24] HOLLAND J.Adaptation in natural and artificial systems[M].Ann Arbor:The University of Michigan Press,1975.

[25] ZHU X,MA S,XU Q,et al.A WD-GA-LSSVM model for rainfall-triggered landslide displacement prediction[J].Journal of Mountain Science,2018,15(1):156-166.

[26] 吴景龙,杨淑霞,刘承水.基于遗传算法优化参数的支持向量机短期负荷预测方法[J].中南大学学报(自然科学版),2009,40(1):180-184.

[27] 宋松柏.水文频率计算研究面临的挑战与建议[J].水利与建筑工程学报,2019,17(2):12-18.

[28] 刘登峰,王栋,丁昊,等.城市水灾害风险等级的RBF-C评估方法[J].人民黄河,2014,36(1):8-10.

[29] ZHANG S,XIANG M,XU Z,et al.Evaluation of water cycle health status based on a cloud model[J].Journal of Cleaner Production,2019,245(12):118850.

[30] 孙芳芳.浅议灰色关联度分析方法及其应用[J].科技信息,2010,2(17):780-782.

(编辑:谢玲娴)

引用本文:

符洪恩,高艺桔,冯莹莹,等.

基于GA-SVR-C的城市暴雨洪涝灾害危险性预测:以深圳市为例

[J].人民长江,2021,52(8):16-21.

Hazard prediction of urban rainstorm and flood disasters based on

GA-SVR-C model:case study of Shenzhen City

FU Hongen1,GAO Yijie1,FENG Yingying2,HUANG Jieyin2,LIU Zufa1,2

( 1.School of Civil Engineering,Sun Yat-sen University,Zhuhai 519082,China; 2.Department of Resources and the Urban Planning,Sun Yat-sen University,Guangzhou 510520,China )

Abstract:

To accurately assess the impact of rainstorm events on human society,it is significant to consider the uncertainties of the rainstorm sequence.The assessment on urban rainstorm hazards by cloud model can better qualify the uncertainty and is regarded as a more effective assessment tool.The historical series of four kinds of disaster-inducing factors of rainstorm (2002~2012) of Shenzhen City were selected as the evaluation index,and the weight of each factor was calculated by using the combined weighting method,then the assessment results on historical rainstorm hazard were obtained through the cloud model.Support vector regression model based on genetic algorithm parameter optimization (GA-SVR) was used to predict the values of four disaster-inducing factors from 2013 to 2016.The GA-SVR combined with the cloud model (GA-SVR-C) was used to predict the hazard levels in the predicted year.Meanwhile,the prediction results from the SVR and BP-network model were used for comparative analysis.It was proved that the GA-SVR-C model performed better than the other two models in terms of the prediction accuracy.The hazard assessment results of GA-SVR-C model are basically consistent with the real facts,which can reflect the hazard levels of urban rainstorm disaster well.

Key words:

rainstorm and flood disaster;hazard analysis;cloud model;support vector machine;genetic algorithm

猜你喜欢
危险性向量暴雨
向量的分解
危险性感
危险性感
暴雨突袭
暴雨袭击
暴雨过后房屋渗漏,接水“神器”们责无旁贷
城市地质灾害危险性评价研究
机械加工工艺危险性控制研究
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线