基于水贫困指数及MSCS-SVM模型的云南省水安全评价

2018-10-24 03:09蒋汝成顾世祥
水利经济 2018年5期
关键词:鸟巢适应度云南省

蒋汝成,顾世祥

(云南省水利水电勘测设计研究院,云南 昆明 50021)

水安全是指一个国家或区域在一定时期、一定技术水平和经济社会发展条件下,水资源、水环境能够支撑经济社会持续发展、维护生态系统良性循环的状态。近年来,随着城市化水平不断提高,城市规模、人口数量逐渐扩大,随之而来的水资源短缺、洪涝灾害、水污染、水土流失等问题已对水安全和生态安全构成严重威胁,成为影响国家经济、社会可持续发展和长治久安的重大战略问题[1]。由于水安全与区域经济社会发展的特殊相关性,科学评价区域水安全状态尤为重要。目前开展区域水安全评价主要存在两方面问题:①没有统一或得到普遍认同的水安全评价指标体系。水安全评价研究起步于20世纪70年代,虽然起步较早,但由于评价区域在水资源禀赋、经济社会发展水平、生态环境压力、水资源供给能力等方面存在差异,致使影响水安全状态的关键因子不同,从而导致各评价区域间水安全评价指标体系的差异。②缺乏科学客观的评价方法。目前用于水安全评价的方法有层次分析法[2]、物元分析法[2]、神经网络法[3]、模糊集对分析法[4]、投影寻踪法[5]、逻辑斯蒂曲线法[6]等,虽然取得了一定的评价效果,但也存在一些不足:层次分析法指标权重确定的主观随意性;物元分析法需要构造较多的评价函数,且函数设计无规律可循;神经网络法网络结构确定的随意性和网络训练易出现“过拟合”现象;模糊集对分析法模糊隶属度值及相异度系数合理取值困难;投影寻踪法最佳投影方向向量难以选取;逻辑斯蒂曲线法公式参数优化困难等。

本文针对水安全评价方法的不足,基于水贫困指数(water poverty index,WPI)指标,提出多策略布谷鸟搜索(Multi Strategy Cuckoo Search,MSCS)算法与支持向量机(Support Vector Machines,SVM)相融合的区域水安全评价模型,以云南省近10年水安全评价为例进行实例研究。

1 基于水贫困指数的水安全评价指标体系

表1 基于WPI的区域水安全评价指标体系及分级标准

2 MSCS-SVM模型的构建与背景

2.1 布谷鸟搜索算法

布谷鸟搜索(CS)算法通过模拟自然界布谷鸟孵卵寄生性繁衍后代的方式来求解最优化问题,在搜索过程中基于3条理想规则:①布谷鸟1次只产1颗蛋,并随机选择1个鸟巢进行孵化。②最好的蛋所在的鸟巢将会被保留到下一代。③鸟巢的数量n是固定的,鸟巢中外来蛋被发现的概率是pa∈[0,1]。一旦宿主发现外来蛋,可能移除或放弃鸟巢,另寻新位置重建鸟巢[11-13]。在寻优过程中,首先在搜索空间随机初始化n个鸟巢位置,则D维搜索空间中第t代第i个鸟巢位置可表示为

每个鸟巢最优位置为

群体中鸟巢全局最优位置为

鸟巢位置的更新公式为

(1)

(2)

(3)

(4)

2.2 多策略布谷鸟搜索算法

标准CS算法中,根据随机数r是否大于pa=0.25来决定对鸟巢位置的更新。研究表明,pa取值越小,更新的鸟巢数越多,CS算法全局搜索能力越好;pa取值越大,更新的鸟巢数越小,局部搜索能力越好。为有效提高CS算法的全局搜索与局部搜索平衡能力,参考相关文献[14],提出多策略改进标准CS算法,利用pa来决定鸟巢位置更新算子,以平衡CS算法的全局搜索与局部搜索能力:

(5)

式中:ω为pa的增加或降低率;pm为控制参数,为rand(0,1)上的随机数。

如果pa=abs(pm-ω),采用式(6)更新鸟巢位置,以获得更好的全局搜索能力:

(6)

如果pa=(pm+ω),采用式(7)更新鸟巢位置,以获得更好的局部搜索能力:

(7)

式中:r、η为均匀分布的随机数;J为概率变量,J∈[0,1];H(·)为Heaviside函数。

2.3 支持向量机

利用SVM进行预测分类的基本思想是寻找一个最优分类面,使得所有训练样本离该最优分类面误差最小。设含有l个训练样本的集合为{(xi,yi),i=1,2,…,l},xi(xi∈Rd)为第i个训练样本输入列向量,yi∈R为对应输出值[15-16]。则在高维特征空间中建立的线性回归函数为

f(x)=wΦ(x)+b

(8)

式中:Φ(x)为非线性映射函数;w为超平面的法向量;b为超平面的偏移量。

(9)

式中:ε为线性不敏感损失函数。

最终回归函数为

(10)

目前常用的核函数有线性核函数、多项式核函数、径向基核函数和两层感知核函数等。核函数可以看成是实际问题的特征提取过程,合理选取核函数有助于提高模型精度。本文选择径向基核函数作为SVM的核函数。研究表明,惩罚因子B、核函数参数g和不敏感系数ε的合理选取决定着SVM性能。B值小,对样本数据惩罚就小,则训练误差较大;B值大则训练误差小,但B值过大会导致模型的泛化能力变差。g代表RBF带宽,g值小则拟合误差小,训练时间长,但g值过小会导致模型过拟合;ε值用于控制模型的预测能力,ε值小易导致模型欠拟合,ε值大则易导致模型过拟合[17]。

2.4 MSCS-SVM模型构建

利用MSCS-SVM模型进行区域水安全评价的基本思想是:利用训练和检验样本构造适应度函数,通过MSCS算法搜寻一组SVM的B、g和ε向量(B,g,ε),使适应度函数的均方误差最小。模型实现步骤如下。

步骤1 依据表1,在评价指标标准阈值间随机生成训练样本和检验样本,并对样本进行一致性处理。

步骤2 设定B、g和ε的搜寻范围,选取式(11)为参数优化适应度函数:

(11)

步骤3 随机初始化n个鸟巢,搜索空间维数D,最大迭代次数T,Lévy飞行尺度a0、发现概率pa的增加或降低率ω、概率变量J,设置当前迭代次数t=1。

步骤6 执行寄生鸟巢主人发现外来蛋操作。利用式(5)计算pa,如果pa=abs(pm-ω),采用式(6)更新鸟巢位置;否则采用式(7)更新鸟巢位置。

步骤7 利用新更新的鸟巢位置及式(11)计算的适应度值,并与前代鸟巢位置对应的适应度值进行比较,保留适应度值更好的鸟巢位置。

步骤8 令t=t+1,判断算法迭代终止条件是否满足,如果满足,转向步骤9;否则,执行步骤5~8。

步骤9 输出最优适应度值minf(B,g,ε)及对应的鸟巢位置(B,g,ε)。

步骤10 对云南省2006—2015年及2020年水安全指标数据及分级标准阈值进行一致性处理,利用获得的最佳参数(B,g,ε)代入SVM模型对云南省2006—2015年水安全进行评价,并利用Man-Kendall秩次相关检验法对其变化趋势的显著性进行分析。

τ=4P/N(N-1)-1

(12)

(13)

M=τ/στ

(14)

式中:P为序列所有对偶观测值;N为序列个数。取置信度α=0.05,相应的临界值Mα=1.96。若|M|>Mα,则序列发生显著的趋势性变化。

3 实验仿真与分析

为验证MSCS算法的优化性能,选取6个典型测试函数Sphere函数、Rastrigin函数、Ackley函数、Levy函数、Griewank函数和Rosenbrock函数进行仿真测试,并与基本CS算法进行性能对比。Sphere函数、Rastrigin函数、Ackley函数、Levy函数、Griewank函数和Rosenbrock函数变量取值范围分别为[-100,100]、[-5.12,5.12]、[-32,32]、[-10,10]、[-600,600]、[-10,10],维度均为30维,理论最优解值均为0。其中,Rastrigin函数、Ackley函数、Levy函数、Griewank函数为多峰函数,存在许多局部极值,用于测试算法逃离局部极值的能力和全局探索能力;Sphere函数、Rosenbrock函数为单峰函数,用于测试算法的收敛速度和寻优精度。算法参数设置:MSCS算法最大迭代次数T=200,鸟窝位置数n=25,Lévy飞行尺度a0=0.1,发现概率pa的增加或降低率ω=0.5、概率变量J=0.3。CS算法最大迭代次数T=200,鸟窝位置数n=25,发现概率pa=0.25。

算法基于Matlab 2010a M语言实现,分别对6个测试函数独立运行20次,并统计平均最优适应度值和标准差的结果,见表2。平均最优适应度值反映算法达到最大迭代次数时的求解精度,标准差反映算法收敛稳定性能。

表2 函数测试对比结果

从表2可以看出:对于多峰Rastrigin函数、Griewank函数,MSCS算法收敛到全局最优解0,寻优精度远远优于CS算法,表现出较好的逃逸局部极值能力;对于单峰Sphere函数,MSCS算法寻优精度高于CS算法91个数量级以上,具有快的收敛速度和较高的寻优精度;对于多峰Ackley函数、Levy函数,MSCS算法寻优精度高于CS算法14个数量级以上,展现出较好的全局寻索能力;对于病态单峰Rosenbrock函数,MSCS算法表现出较好极值寻优能力,在最大迭代次数仅200次时,其平均最优适应度值达到4.12×10-7,高于CS算法8个数量级以上。同时,MSCS算法也表现出较好的收敛稳定性能。

综上,无论单峰还是多峰函数,MSCS算法表现出较好的收敛速度、极值寻优能力和全局搜索性能,表明基于发现概率pa的鸟巢多策略位置更新算子可以有效平衡CS算法的全局搜索与局部搜索能力,获得较理想的寻优效果。

4 应用实例

4.1 研究区概况

云南省地处我国西南边陲,辖昆明、曲靖、玉溪等16个州(市),国土面积39万km2,分属长江、珠江、红河、澜沧江、怒江、伊洛瓦底江6大水系,多年平均降水量1 280 mm,水资源总量2 220亿m3,仅次于西藏、四川两省区,居全国第三位,湖泊静贮水量近300亿m3,从邻近省区入境水量1 625亿m3,从缅甸、越南、老挝入境水量25亿m3,出境水量3 835亿m3,水资源总量相对丰富。近10年来,随着云南省经济社会的迅猛发展,以水利为主要内容的水安全建设为促进云南省经济、社会、环境和谐发展提供了重要支撑和保障。云南省水资源总量虽然丰富,但由于开发利用难度大、成本高、边际效益低,气候条件复杂多变,加之水资源分布与土地资源、经济布局不相匹配的矛盾突出,水资源短缺、水污染、洪涝灾害、水土流失等问题日益突出,水安全问题面临着严峻挑战。因此,科学评价云南省近10年来的水安全状态,对于云南省“因地制宜、因域施策”地提出水安全保障应对措施,提高水安全保障能力,实现云南省水资源永续利用和经济社会的可持续发展具有重要意义。本文研究数据来源于历年云南省水资源公报、云南省统计年鉴及《云南省“十三五”水利发展规划》等。基于WPI的云南省水安全评价指标数据见表3。

表3 基于WPI的云南省水安全评价指标数据

表4 模型训练及检验结果

4.2 模型训练及检验

a. 构造样本。基于表1,在各评价指标分级阈值间随机生成20个数据样本,5级共获得100个数据样本,随机选取60个作为训练样本,余下的40个作为检验样本,并将5、4、3、2、1分别作为非常安全/Ⅰ级、安全/Ⅱ级、临界/Ⅲ级、不安全/Ⅳ级和危险/Ⅴ级5个等级的对应输出。对于越大越优型指标利用式(15)进行归一化处理;对于越小越优型指标,对其取倒数后再利用式(15)进行归一化处理:

(15)

b. 参数设置。SVM惩罚因子B、核函数参数g和不敏感系数ε的搜索空间分别设置为0.1~1 000、0.1~1 000和0.001~1。

c. 建立模型。基于MatlabR2011b环境编程构建20输入1输出的云南省区域水安全MSCS-SVM、CS-SVM评价模型,分别利用所构造的样本对2种模型进行训练及检验。2种模型独立运行20次,分别统计平均最优适应度值、标准差,训练样本平均相对误差绝对值、标准差和检验样本平均相对误差绝对值、标准差,见表4。

d. 结果分析。从表4可以看出,MSCS-SVM模型20次独立运行获得的平均最优适应度值、训练样本平均相对误差绝对值和检验样本平均相对误差绝对值完全优于CS-SVM模型;标准差除训练样本为2.22×10-16外,其余均为理论最优值0,远优于CS-SVM模型,再次验证了MSCS算法具有较好的收敛精度、极值寻优能力和收敛稳定性能。

4.3 云南水安全评价及结果与析

按式(12)对表3数据及表1中各指标分级阈值进行归一化处理,利用经训练及检验的MSCS-SVM模型对云南省2006—2015年、2020年水安全进行评价,并将指标分级阈值输出值作为水安全评价等级划分的依据,结果见表5及图1。

表5 MSCS-SVM模型评价结果

图1 云南省各评价年度水安全评价雷达图

从表5和图1可以得出以下结论:

a. 云南省2006年水安全评价为不安全,2007—2015年评价为临界,2020年评价为安全。从图1可以直观看出,云南省2020年水安全评价值最大,为3.516 1,2006年最小,为2.265 9。利用式(12)~式(13)对2006—2015年MSCS-SVM模型输出结果进行计算。经计算,Kendall统计量|M|为3.12,大于置信水平为0.05时的相应临界值1.96,表明云南省水安全随时间呈提升趋势,且提升趋势显著。

b. 云南省2006—2015年水安全评价值总体呈增加趋势,但2010—2012年MSCS-SVM模型输出值从3.083 6下降到3.006 6,连续3年呈下降趋势,这主要受云南省2010—2012年3年连续干旱的影响,表明由降水引起的水资源系统随机变化对年度水安全评价具有一定影响。

c. 除受自然因素如降水的影响外,区域水安全受经济社会发展、生态环境治理保护力度、用水效率效益影响较大。“十三五”期间,云南省通过持续推进节水型社会建设、加大水源工程和水利基础设施建设、强化水污染防治措施、落实最严格水资源管理制度,以及加快城镇化进程步伐、持续改善民生福祉等举措,在有效灌溉面积率、蓄水工程供水率、供水量模数、水功能区达标率、生态环境用水率、城镇化率、第一产业占GDP比例等指标方面得到明显改善,水安全水平得到进一步提升,从现状的临界提升至安全状态,但受人均COD环境容量、人均水资源量、人口增长以及降水量等因素的制约,云南省水安全提升空间有限。

5 结 论

a. 针对云南省近10年来经济社会发展给水安全带来的挑战,利用MSCS-SVM模型对云南省2006—2015年和2020年水安全状态进行评价。结果显示:云南省2006年水安全状态为不安全,2007—2015年为临界,2020年为安全,近10年水安全随时间呈提升趋势,且提升趋势显著。该评价结果可为云南省科学提出水安全保障应对措施,提高水安全保障能力提供参考。

b. 针对水安全评价指标选取缺乏依据的问题,将国际上通用的WPI引入水安全评价中,依据WPI构建区域水安全评价指标体系,并提出样本构造方法、水安全评价指标分级标准阈值确定方法等。

c. 针对基本CS算法存在早熟收敛、易陷入局部极值等不足,提出多策略布谷鸟搜索(MSCS)算法。选取6个典型测试函数对MSCS算法进行仿真验证及对比。结果表明MSCS算法有较好的寻优精度、逃离局部极值能力和收敛稳定性能,通过鸟巢多策略位置更新算子可以有效提高基本CS算法的寻优能力。

猜你喜欢
鸟巢适应度云南省
改进的自适应复制、交叉和突变遗传算法
民国初期云南省议会述论
对云南省“农危改”工作若干问题的思考
鸟巢
重回鸟巢
鸟巢大作战
一种基于改进适应度的多机器人协作策略
云南省瑞丽市老年大学之歌
近31年来云南省潜在蒸散量的时空演变
基于空调导风板成型工艺的Kriging模型适应度研究