李 杰,崔东文
(1.云南省水利水电勘测设计研究院,云南 昆明 650000;2.云南省文山州水务局,云南 文山 663000)
水资源空间均衡是指在一定经济社会发展和生态环境空间条件下,区域经济社会发展与水资源、水生态、水环境承载能力相适应的一种相对稳定状态。“十三五”以来,随着经济社会的快速发展,云南省水资源空间分布与经济社会发展不匹配、不均衡问题十分突出,已成为云南省经济社会高质量发展的最大瓶颈。“节水优先、空间均衡、系统治理、两手发力”的治水思路,突出强调了新时期治水必须始终坚守“空间均衡”重大原则[1],因此,开展云南省水资源空间均衡的评价对于指导水资源管理和区域经济社会高质量发展具有重要意义。近年来,国内学者通过构建各类模型对水资源空间均衡进行了探索和评价,如杨亚锋等[2]基于可变集原理及偏联系数方法提出水资源空间均衡评价模型,并将该模型应用于2017年中国31 个省级行政区的水资源空间均衡评价,结果表明该模型具有较好的评价效果;金菊良等[3]基于联系数和耦合协调度方法提出水资源空间均衡评价模型,并通过安徽省对该模型进行检验,结果表明该方法评价结果较为合理;黄锋华等[4]提出均衡系数法对广东省2006-2018年水资源空间均衡进行评价,结果显示广东省2006-2018年水资源空间均衡等级为Ⅳ级,属于中度失衡;金菊良等[5,6]基于联系数和洛伦兹曲线提出水资源空间均衡评价模型,并通过安徽省对该评价方法进行验证,结果表明该模型具有较好的适用性;吴成国等[7]提出有序联系度熵的水资源空间均衡评价模型,并以安徽省不同地市2009-2018年水资源空间均衡评价进行验证,结果表明该模型评价结果合理有效;刘睿佳等[8]提出区间直觉模糊TOPSIS水资源空间均衡评价模型,并利用山西省2015-2019年水资源空间均衡评价实例进行验证。
当前,水资源空间均衡评价研究仍处于初期发展阶段,评价方法或模型仅限于基尼系数、空间均衡系数、集对分析联系度、可变模糊集、TOPSIS法等,鲜见于人工智能或神经网络模型应用于水资源空间均衡的评价。近年来,随着人工智能和深度神经网络的快速发展,双向门控循环单元(Bidirectional Gated Recurrent Unit,BIGRU)、双向长短时记忆(Bidirectional Long Short-Term Memory,BILSTM)网络已在各行业领域得到广泛应用,但鲜见于水资源空间均衡状态评价。为科学评价区域水资源空间均衡状态,本文利用两种新型群体智能算法——社交网络搜索(Social Network Search,SNS)算法、登山队优化(Mountaineering Team-Based Optimization,MTBO)算法优化BIGRU、BILSTM 网络超参数,提出SNS-BIGRU、MTBO-BIGRU、SNSBILSTM、MTBO-BILSTM 水资源空间均衡评价模型,并构建基于支持向量机(SVM)的NS-SVM、MTBO-SVM 模型、未经优化的BIGRU、BILSTM 模型作对比分析,通过云南省2006—2022年及2025年水资源空间均衡评价实例对模型进行检验。
云南省地处我国西南边陲,水资源总量虽然丰富(多年平均水资源总量2 220 亿m3,位列全国第三),但面临水资源时空分布不均、供需矛盾突出、用水效率不高、水资源开发利用难度大等问题,已成为云南省经济社会高质量发展的最大瓶颈。因此,开展云南省水资源空间均衡评价研究对于指导云南省水资源管理和经济社会高质量发展具有重要意义。2006-2022研究数据来源于历年云南省水资源公报、云南省统计年鉴等;其中2025年评价指标来源于《云南省“十四五”经济社会发展规划》《云南省“十四五”水安全保障规划》,其中产水量模数、降水量采用多年平均值。限于篇幅,指标数据从略。
由于水资源空间均衡评价涉及水资源、水生态、水环境以及经济社会等诸多领域,加之各区域间经济经社发展不平衡,因此,我国水资源空间均衡评价研究仍处于初期发展阶段,其相关概念、内涵、理论等尚未得到统一,也未形成普遍认同的水资源空间均衡评价指标体系和等级标准。笔者参考文献[1-8],以云南省2006-2022年和2025年水资源空间均衡评价为例,从水资源支撑、水资源压力、水资源调控力3 个方面遴选15个指标构建由目标层A、准则层B和指标层C组成的3级水资源空间均衡评价指标体系和等级标准,并结合云南省2006-2022年各指标历史数据,合理确定水资源空间均衡评价等级标准阈值和等级判定标准,见表1。
表1 云南省水资源空间均衡评价指标体系及等级标准Tab.1 Evaluation index system and grade standards for spatial equilibrium of water resources in Yunnan Province
SNS 算法是TALATAHARI S 等人于2021年提出一种新型元启发式优化算法。该算法灵感来自于社交网络中用户表达意见时的模仿、对话、争论和创新行为,并通过优化操作符模拟这些行为进行位置更新来达到求解优化问题的目的[9]。SNS数学描述如下:
(1)初始化。SNS是一种基于种群的优化算法,该算法基于下式随机生成均匀分布的种群个体位置X0。
式中:X0为用户初始化位置;rand(0,1)为介于0和1之间的随机数;UB、LB为搜索空间上、下限值。
(2)行为1:模仿。在社交网络中我们会关注一些朋友和一些喜欢的名人。对于大多数人而言,当被关注者发布一些新的活动时,我们通常会努力模仿他们。SNS算法中,模仿行为数学描述为:
式中:Xi,new为第i个新用户位置;Xj、Xi分别为第j个和第i个用户位置,j≠i;rand(-1,1)为介于-1和1之间的随机数;其他参数意义同上。
(3)行为2:对话。在社交网络中,用户可以进行虚拟交互,并就不同的问题进行交谈。对于同一个问题有不同的见解,即别人的见解可能和我们相同或是相反。SNS 算法中,对话行为数学描述为:
式中:Xk为随机选择的一个交谈对象位置;sign(·)为sign 函数;fi、fj分别为第i个和第j个用户位置的适应度值;其他参数意义同上。
(4)行为3:争论。争论是一种很正常的社交网络行为。争论用户向其他人解释他对事件的看法并捍卫他的观点。在社交网络中,大家会选择在评论区争论,或是建群吸人争论。SNS算法将随机数量的用户视为评论者或群组成员,并对这种行为进行数学建模,描述为:
式中:M为评论区用户位置的平均值;AF为许可因子,为用户对某一事件的赞同程度,其值为1或2;其他参数意义同上。
(5)行为4:创新。当用户思考一个特定的问题时,也许可以用一种新颖的方式来看待这个问题,并且能够更准确地理解这个问题的本质,或者找到一种完全不同的观点。SNS算法中,创新行为数学描述为:
MTBO 算法是FARIDMEHR 等人于2023年受登山队员登山过程中协作登顶行为启发而提出的一种新型元启发式优化算法。该算法通过模拟登山队员协作登山、灾害威胁、协调防御、队员更新实现队员位置更新来求解待优化问题[10]。MTBO数学描述如下:
(1)初始化。登山队由多名登山队员组成,并有一位经验丰富的专业队长领队,其目标是征服该地区山顶,山顶被认为是待优化问题的最优解。与其他基于种群的优化算法类似,MTBO也是从种群初始化开始:
式中:Xi为第i个登山队队员位置;Uj、Lj为优化问题的第j维上、下限值;rand 为介于0 和1 之间的随机数;N为登山队队员种群规模;D为优化问题维度。
(2)协作登山。在登山队中,最有经验的成员往往被选举为队长,登山队在队长的协调和组织下登山,并最终征服山顶。MTBO 算法在每次迭代之后,队员位置将从最好到最坏进行排序,每个队员都通过队长和前面队员的引导。该阶段队员的位置更新数学描述如下:
式中:Xnewi为第i个登山队队成员新位置;XLeader为登山队队长位置;Xii为受前面队员引导的其他队员位置。
(3)灾害威胁。雪崩或跌落悬崖的发生可能威胁到登山队员的生命,从而阻止登山队到达山顶,即迫使算法陷入局部最优状态。MTBO中,在随机发生雪崩等灾害的情况下,登山队队员通过下式来拯救自己,即避免算法陷入局部最优,并朝着最佳队员位置移动。该阶段队员的位置更新数学描述如下:
式中:XAvalanche为随机发生雪崩等灾害情况下的登山队队员位置;其他参数意义同上。
(4)协调防御。在登山过程中,当发生雪崩等灾难时,整个登山队都会尽力营救被困队员,以防止队员死亡。该阶段的灵感就是来自于团队为拯救被困队员而做出的协作和努力,该阶段队员的位置更新数学描述如下:
式中:XTeam为所有登山队队员的平均位置;其他参数意义同上。
(5)队员更新。不幸的是,登山队员可能会因雪崩等灾害而丧生,上述任何阶段都无法挽救登山队队员的生命。MTBO考虑了这一灾难的发生,即从登山队队员中删除该队员,并随机生成新队员。
LSTM 为一种特殊的RNN 网络,主要通过输入门(Input Gate)、遗忘门(Forget Gate)实现单元状态c状态的控制,并通过输出门(Output Gate)来控制单元状态ct有多少输出到LSTM 的当前输出值ht。设输入序列为(x1,x2,…,xT),隐含层状态为(h1,h2,…,hT),则在t时刻有[11-16]:
式中:it、ft、ot分别为输入门、遗忘门和输出门;ct为cell 单元;Wh为递归连接权重;Wx为输入层到隐含层权重;bi、bf、bc、bo分别为各函数的阈值;σ(·)、g(·)分别为sigmoid 函数和tanh 函数;”·“表示向量内积。
为使LSTM满足预测目的,需加上一个线性回归层,即:
式中:yt为最终预测结果的输出;bo为线性回归层的阈值。
LSTM 网络依据时间序列由前至后单向进行传播,忽略了反向数据变换对模型预测性能的影响。为考虑数据正反向的信息规律,BiLSTM 网络应运而生。BiLSTM 由正向传播和反向传播的双向循环神经网络构成,与单向LSTM 相比,BiLSTM 同时考虑前后数据的变化规律[17],可以更好地挖掘数据的时序特征。
BiLSTM的网络结构表达式如下:
GRU 在LSTM 基础上进行了简化,得到只包含重置门和更新门的网络结构,减少网络复杂度的同时提高了计算效率。相比于LSTM,其结构更加简单、训练参数更少,因此收敛速度也就更快[18-20]。
GRU的迭代公式如下:
式中:下标t为t时刻;z为更新门;r为重置门;W为权重矩阵;σ为sigmoid函数;h为输出值;*为哈达玛积(Hadamard product)。
同LSTM 网络类似,GRU 网络依据时间序列由前至后单向进行传播,忽略了反向数据对模型预测性能的影响,因此提出了BIGRU 网络。BIGRU 由正向传播和反向传播的双向循环神经网络构成,与单向GRU 相比,BIGRU 同时考虑前后数据的变化规律[17],可以更好地挖掘数据的时序特征。BILSTM/BIGRU网络结构如图1所示。
图1 BILSTM/BIGRU 网络结构示意图Fig.1 Schematic diagram of BILSTM/BIGRU network structure
在实际应用中,BILSTM/BIGRU 网络学习率、隐含层神经元数等超参数主要通过人工调试确定,费时费力且效果不佳。目前,鲸鱼优化算法[21]、麻雀搜索算法[22]、天鹰优化算法[23]等已在优化BILSTM/BIGRU 超参数中得到应用。本文利用SNS、MTBO算法优化BILSTM/BIGRU 网络学习率l、隐藏层1 的神经元数m1、隐藏层2 的神经元数m2三个超参数,以期提高BILSTM/BIGRU网络性能。
步骤一:依据表1,利用线性插值法在评价指标和等级标准阈值间生成20、40、80 组数据样本,分别共生成100 组(样本一)、200 组(样本二)、400 组(样本三)3 种数据样本;随机选取70%作为训练样本,剩余30%作为预测样本;对于负向指标,对其取倒乘100后再与正向指标一同作归一化处理。
步骤二:利用训练样本预测等级与实际等级构建优化BIGRU、BILSTM超参数的适应度函数:
式中:A为正确识别的样本数量;Z为错误识别的样本数量;m1为隐藏层1 的神经元数输入延时阶数;m2为隐藏层2 的神经元数;l为学习率。
步骤三:设置SNS、MTBO 种群规模为10,最大迭代次数为50,其他采用算法默认值;本文搭建具有两个隐含层的BIGRU、BILSTM 网络,激活函数采用tanh函数,隐含层m1、m2搜索范围设置为[2,30],学习率l搜索范围设置为[0.000 1,1],最大训练次数MaxEpochs=100。初始化用户或登山队队员位置。
BIGRU、BILSTM 超参数采用试算法确定,最大训练次数MaxEpochs=100;SNS-SVM、MTBO-SVM 模型算法部分参数同上,SVM超参数搜索空间设置为[0.001,100]。所有模型的原始数据均采用[0,1]进行归一化处理。
步骤四:计算所有用户或登山队员适应度值,确定全局最佳用户位置Xbest或最佳登山队队员位置XLeader。令当前迭代次数t=1。
步骤五:对于SNS,基于式(2)~式(5),随机选择模仿、对话、争论、创新四种行为中的一种进行位置更新;对于MTBO,在0和1 之间生成随机数r,若r<“协作登山”阶段概率Li,则利用式(7)更新登山队队员位置;若r<“雪崩发生”概率Ai,则利用式(8)更新登山队队员位置;若r<“被困队员”发生概率Ai,则利用式(9)更新登山队队员位置;删除具有最差位置的队员,并随机生成新队员。
步骤六:计算位置更新后的所有用户或所有登山队队员的适应度值,若当前最优适应度值优于前代最优适应度值,则保存当前最佳用户位置Xbest或最佳登山队队员位置XLeader,否则保存前代最佳用户位置Xbest或最佳登山队队员位置XLeader。
步骤七:重复步骤五~步骤七直至满足算法终止条件。
步骤八:输出最佳用户位置Xbest或最佳登山队队员位置XLeader,该位置即为BIGRU、BILSTM 最佳超参数向量。利用该向量建立SNS-BIGRU、MTBO-BIGRU、SNS-BILSTM、MTBOBILSTM 模型对各样本进行识别,并利用识别精度对各模型性能进行评估。
为验证模型的识别精度,分别随机选取样本一、样本二、样本三总量的70%作为训练样本,其余样本作为预测样本对SNS-BIGRU、MTBO-BIGRU、SNS-BILSTM、MTBO-BILSTM 模型的识别性能进行检验,并与MTBO-SVM、MTBO-SVM、BIGRU、SNS-BILSTM 作对比。模型连续运行10 次,分别统计其识别精度,见表2;随机选取各模型在样本二情形下某次训练及预测混淆矩阵,见图2。
图2 各模型在样本二情形下的混淆矩阵图Fig.2 Confusion matrix diagram of each model in the case of sample 2
表2 各模型10次运行平均识别精度%Tab.2 Average recognition accuracy of 10 runs of each model
依据表2和图2可以得出以下结论:
(1)无论是训练样本还是预测样本,SNS-BIGRU、MTBOBIGRU、SNS-BILSTM、MTBO-BILSTM 模型的识别精度均在99.0%以上,具有较高的识别精度和稳健性能,在不同样本容量、随机选取训练样本和连续10次运行的情形下均能获得较好的识别效果,其中SNS-BIGRU、MTBO-BIGRU 模型的识别效果要略优于SNS-BILSTM、MTBO-BILSTM 模型。
(2)与SNS-SVM、MTBO-SVM 模型相比,SNS-BIGRU、MTBO-BIGRU、SNS-BILSTM、MTBO-BILSTM 模型的识别精度提高了9.1 个百分点以上,表明BIGRU、BILSTM 网络在模式识别中具有较好的识别效果。
(3)与BIGRU、BILSTM 模型相比,在样本一情形下,SNSBIGRU、MTBO-BIGRU、SNS-BILSTM、MTBO-BILSTM 模型的识别精度提高了23.1 个百分点以上;在样本二情形下,识别精度提高了22.2 个百分点以上;在样本三情形下,识别精度提高了10.1 个百分点以上,表明SNS、MTBO 能有效优化BIGRU、BILSTM网络超参数,大大提高模型的识别精度。
(4)BIGRU、BILSTM 模型的识别精度随着样本容量的增加而提高,而样本容量大小对SNS-BIGRU、MTBO-BIGRU、SNSBILSTM、MTBO-BILSTM 模型的识别精度影响较小,可见,超参数的合理选取是提升BIGRU、BILSTM模型识别精度的关键。
利用SNS-BIGRU 等4 种模型、SNS-SVM、MTBO-SVM 模型和模糊综合评价法对云南省2006-2022年、2025年水资源空间均衡进行评价,结果见表3。
表3 云南省水资源空间均衡评价结果及对比Tab.3 Evaluation results and comparison of spatial equilibrium of water resources in Yunnan Province
从表3可以得出以下结论:
(1)SNS-BIGRU、MTBO-BIGRU、SNS-BILSTM、MTBO-BILSTM 模型对云南省2006-2011年水资源空间均衡评价为“不均衡”,2012-2013年评价为“较不均衡”,2014-2018年评价为“临界均衡”,2019-2022年评价为“较均衡”,2025年基本可达到“均衡”水平。与SNS-SVM、MTBO-SVM 模型在2013年、2018年和2025年存在1 个等级的差异;与模糊综合评价法在2012年、2013年和2019年存在1个等级的差异。
(2)2006-2011年期间,由于云南省经济社会发展水平不高,水利工程建设滞后,供水保障不足,加之2009-2011年云南省发生持续干旱,导致这一期间的水资源调控能力差、水资源压力大,水资源空间均衡评价为“不均衡”符合客观实际;2012-2013年,随着云南省旱情的结束以及供水保障能力的持续改善,水资源空间均衡水平提到一定提升,评价为“较不均衡”合理;2014-2018年期间,云南省经济社会得到较大发展,用水效率、供水保障能力得到较大提升,水资源空间均衡水平也从“较不均衡”提升至“临界均衡”;2019年以来,在习近平生态文明思想的指引下,中国生态文明建设发生了历史性、转折性、全局性的变化,蓝天保卫战、长江保护修复攻坚战、水源地保护攻坚战等相继开展,云南省水资源调控能力也得到了大幅提升,水资源压力得到了质的改善,2019-2022年云南省水资源空间均衡评价为“较均衡”较合理;在实现云南省“十四五”经济社会发展规划和水利发展规划目标的前提下,2025年云南省水资源空间均衡水平将达到“均衡”状态,但城镇化率、人口密度等指标将进一步制约云南省水资源空间均衡等级的提升。
(1)基于水资源支撑、水资源压力、水资源调控力三大子系统提出云南省水资源空间均衡评价指标体系和等级标准;提出SNS、MTBO 算法优化的SNS-BIGRU、MTBO-BIGRU、SNS-BILSTM、MTBO-BILSTM 水资源空间均衡评价模型,拓展了水资源空间均衡评价方法,为相关水资源综合评价研究提供参考。
(2)通过在各等级标准间采用线性内插和随机选取的方法构建不同容量大小的样本,并构建适应度函数对SNS-BIGRU、MTBO-BIGRU、SNS-BILSTM、MTBO-BILSTM 模型的识别精度和稳健性能进行检验。结果表明:①SNS-BIGRU 等4 种模型具有较高的识别精度和稳健性能,识别效果优于SNS-SVM、MTBO-SVM 模型和BIGRU、BILSTM 模型,其中SNS-BIGRU、MTBO-BIGRU 模型的识别效果最好;②SNS、MTBO 能有效优化BIGRU、BILSTM 网络超参数,大大提高模型的识别精度;③本容量大小对SNS-BIGRU、MTBO-BIGRU、SNS-BILSTM、MTBOBILSTM 模型的识别精度影响较小,而对BIGRU、BILSTM 模型的识别精度影响较大。
(3)SNS-BIGRU 等4 种模型对云南省2006-2011年水资源空间均衡评价为“不均衡”,2012-2013年评价为“较不均衡”,2014-2018年评价为“临界均衡”,2019-2022年评价为“较均衡”,2025年基本可达到“均衡”状态。