基于PSR-PCA-ANFIS模型的保定市中心城区水资源安全评价

2022-02-23 05:55李明然寇利卿
中国农村水利水电 2022年2期
关键词:保定市聚类城区

张 彦,李明然,寇利卿

(河北省保定水文勘测研究中心,河北保定071000)

0 引言

水资源作为基础的自然资源和战略性经济资源[1],其安全问题与粮食安全、生态环境安全关系、经济安全紧密相连,是国家生存和发展的战略性问题[2]。随着社会经济的发展,水资源短缺、水生态恶化等水资源安全问题日趋严重,已成为社会关注的热点问题。科学评价水资源安全对城市水资源合理开发利用和社会经济的可持续发展具有十分重要现实意义。

目前,国内外学者对水资源安全的评价方法进行了大量研究。常见的方法有PSR 模型法[3]、层次分析法[4]、集对分析模型[5]、人工神经网络法[6]、系统动力学法[7]、多层次多目标模糊优选法[8]、熵权及模糊物元模型法[9]、模糊综合评价法[10]等。由于影响水资源安全的因素众多,评价指标的选取目前还没有统一标准,主观性比较强,指标间信息的易重叠,而且选取的指标间具有复杂的非线性关系,单一的评价方法并不能很好地解决上述的问题,在综合考虑以上影响因素后,本文尝试以保定市中心城区为例,结合多种方法建立水资源安全评价标准,并对其水资源安全状况进行综合评价和分析,以期得出比较客观的评价结果,为保定市中心城区的水资源的合理配置及其社会经济的可持续发展提供科学的参考依据和技术支持,也为其他地区的水资源安全评价提供借鉴。

1 水资源安全评价指标体系的构建

1.1 基于压力-状态-响应模型的评价指标初选

压力-状态-响应(Pressure-State-Response,PSR)模型最初是由加拿大统计学家David J.Rapport 和Tony Friend 提出[11],主要用于研究压力、现状与响应之间的关系。后经欧洲经济合作与发展组织(OECD)对其修改后用于环境问题报告[12]。20世纪80年代末至90年代初,欧洲经济合作与发展组织(OECD)和联合国环境规划署(UNEP)对其共同发展后用于环境问题框架体系研究[13]。

对水资源安全评价指标利用PSR 模型框架选取具有很好的逻辑性,人类的经济活动、社会发展造成的水资源压力作用于生态环境,生态环境承压后又呈现出状态的改变,进而影响人类通过政策、行为的变化对生态环境状态的改变产生响应,如此往复循环,就形成了人类活动与生态环境之间的相互作用、相互制约的关系,即压力-状态-响应关系。依据此模型框架,借鉴相关水资源安全指标分级标准研究成果[1,3,14-18],并结合保定市中心城区水资源特点和经济社会发展实际状况,遵循指标的代表性、科学性、可量化性,数据的易获取性原则,从压力、状态、响应3 个方面选取24 个指标初步构建了保定市中心城区水资源安全综合评价指标体系,同时根据指标对水资源安全的影响属性,划分为正向指标和负向指标,详见表1。初选指标确立后,收集2009-2018年保定市中心城区相关数据,数据来源于《保定经济统计年鉴》、《保定市水资源公报》以及保定市人民政府官方网站等。

表1 水资源安全评价指标体系初选Tab.1 Primary selection of evaluation index system of water resources security

1.2 评价指标精简

初步选取的评价指标间可能存在一定的相关性、冗余性,将对评价结果产生叠加的影响效应,因此需要对相关性显著的指标进行约简。本文采用相关性和主成分分析法结合的方法对初选指标进行精简。

1.2.1 相关性分析指标筛选

应用IBM SPSS Statistics 24软件,分别计算各准则层内的各指标间的皮尔逊相关系数,选出相关系数绝对值大于0.9[19]的指标进行分析取舍。

表2压力指标准则层中的城镇化率、人口密度、农田灌溉用水比例3个指标之间的相关系数绝对值均大于0.9,而农田灌溉用水比例更能直接反映农业活动的用水压力,因此删除与之相关的另外两个指标。状态指标准则层中人均水资源量和综合缺水率两个指标相关系数绝对值大于0.9,考虑到人均水资源量是国际常用的反映水资源量短缺状态的指标,因此删除综合缺水率指标。最后,分别在表1 第5 列用“相关性分析删除”标出。

表2 准则层内指标间的相关性矩阵Tab.2 Correlation matrix among indicators in the criterion layer

1.2.2 主成分分析指标筛选

各准则层中指标经过相关性分析筛选之后,再应用主成分分析分别对各准则层中剩余指标再次筛选。主成分分析应用IBM SPSS Statistics 24软件进行处理,主成分提取条件为初始特征值大于1,初始特征值方差累积百分比大于85%。指标选取的原则是:选取各准则层内的第一主成分的因子载荷系数绝对值大于0.9[19]的指标,以及其他提取的主成分因子载荷系数绝对值最大的指标。

依据以上原则,分别带入各准则层中指标对应的数据进行主成分分析,各准则层主成分方差贡献率结果见表3,主成分因子载荷系数表和主成分分析筛选结果见表4。

表3 主成分方差贡献率 %Tab.3 Variance contribution rate of principal component

表4 主成分因子载荷系数Tab.4 Load coefficient of principal component factor

1.3 评价指标分级

各准则层内指标经过约简后最终确定评价指标,对确定的指标需要制定水资源安全分级评价标准,依据优先选用国际、国内或地方水资源安全标准,其次参考相关研究成果、规划目标,在没有相关标准或文献可供参考的情况寻求专家经验值。依据以上原则,同时在结合本地区水资源特点、社会、人口和经济发展的实际情况的基础上,将保定市中心城区的水资源安全评价等级划分为安全、较安全、临界安全、不安全和极不安全5个等级,分别用1、2、3、4、5 表示,等级越高表示越不安全,具体的水资源安全分级标准范围见表5。

表5 水资源安全评价指标等级划分标准Tab.5 Grading table for evaluation index of water resources security assessment

1.4 基于减法聚类的自适应模糊神经网络评价模型的建立

1.4.1 减法聚类

减法聚类(Subtractive Clustering,SC)算法[20]是一种用来自动估计一组数据中的聚类个数以及位置的快速单次算法。该算法将每个数据点作为潜在的聚类中心,并计算其密度指标,然后将密度指标最大的点作为聚类中心,同时排除此数据点附近的数据成为聚类中心的可能;然后从剩下的可能作为聚类中心的数据中再找到最大的密度指标作为下一个聚类中心。依次循环,直到所有剩余数据作为聚类中心的可能性低于设定阈值。通过减法聚类算法可以确定模糊规则和输入变量对应的隶属度函数个数,并初始化前件参数。

由于最终确定的水资源安全评价指标较多,如果不预先合理划分输入空间,而采用网格分割方法划分,将会产生大量的模糊规则,可能引起“组合爆炸”问题。而采用减法聚类,可以有效避免规则膨胀[21],因此本文采用减法聚类来确定模糊系统的初始结构。

1.4.2 自适应模糊神经网络模型网络结构与算法

自适应模糊神经推理系统(Adaptive Neuro-Fuzzy Inference System,ANFIS)最初是在1993年由学者J.-S.R.Jang 提出的[22]。ANFIS 综合了模糊规则的可解释性和神经网络自适应的优点,将神经网络的自学习机制贯穿到模糊推理系统中,通过自动修正隶属度函数的参数以及自动生成模糊规则等,使模糊推理系统具备了自学习、自适应的能力,极大地提高了这个系统应用范围[23,34]。

本文的ANFIS 模型采用的是最常用的TaKagi-Sugeno(TS)型[25]模糊推理系统。假设一个具有两条规则的简单T-S型,x和y为两个输入变量,f为一个输出变量,其对应的T-S 模糊推理模型是一阶的,结构如下:

规则1:IfxisA1andyisB1thenf1=p1x+q1y+r1;

规则2:IfxisA2andyisB2thenf2=p2x+q2y+r2。

式中:Ai和Bi(i=1,2)是输入变量对应的语言值模糊集;pi、qi、ri(i=1,2)为规则后件的线性参数。

与之相对应的ANFIS 模型网络结构如图1。ANFIS 模型从网络结构上属于多层前馈神经网络,共分为五层,前四层称为前件网络,最后一层称为后件网络。设Oji为j层第i个节点的输出值,各层介绍如下:

图1 ANFIS模型网络结构图Fig.1 Network structure diagram of ANFIS model

第一层:输入变量模糊化。本层将输入变量模糊化,输出对应模糊集的隶属度。该层每个节点均为自适应节点。式中O1i表示第一层第i个输出,μAi(x)、μBi-2(y)分别是输入变量x、y所相对应的隶属度函数。

第二层:规则适应度的计算。该层每个节点输出的是所输入信号的积,结果为这条规则的适应度值,代表该条规则的激励强度,用ωi表示。

第三层:适应度的归一化。对第二层得到的每条规则适应度进行归一化处理。

第四层:去模糊化处理。应用该层中每个节点中自带的节点函数计算每条规则的输出。

第五层:系统总输出层。将上层计算得到的各条规则输出的总和作为整个模糊系统的总输出。

本文ANFIS 网络结构中各层可调节的参数采用最小二乘估计法和反向传播算法相结合的混合算法。其具体步骤是:首先输入信号沿前件网络正向传递直到第四层,固定前件参数不变,运用最小二乘估计算法更新规则后件参数;然后计算输出层的结果与期望值的误差,此时固定后件参数,将误差信号由输出层沿前件网络反向传播,用反向传播算法更新前件参数,重复上述过程,直至满足设定的误差指标要求,迭代终止。

1.4.3 水资源安全评价模型的建立和训练

Matlab(R2016a)软件中提供了模糊逻辑工具箱,本文的ANFIS 建模和仿真都是应用工具箱中提供的图形化编辑工具完成。

输入、输出的确定。评价指标最终精简为12 项,因此AN⁃FIS 模型的输入项为12 项,与之对应的水资源安全等级作为输出项,用1,2,3,4,5 分别代表水资源安全的5 个级别,即输出项为1 项。为了实验样本充足并具有普遍适用性,本文用unifrnd函数在评价指标相应级别之间进行随机插值,每个分级区间随机生成200个样本,共生成1 000组的典型的输入样本。将水资源安全等级作为理论输出值,因此共生成1 000 个输出样本。随机抽取700 组数据作为训练样本,剩余300 组数据作为验证样本。应用mapminmax 函数将训练样本和验证样本归一化到[-1,1]。

初始化模糊推理模型。输入Anfisedit命令函数调出图形编辑界面,导入训练集。选用减法聚类法进行模糊区间划分时,需要对Range of influence、Squash factor、Accept ratio 和Reject ratio 这4 个参数进行初始设置,由于前两个参数对训练误差影响显著[26],因此本文只对前两个参数组合进行参数寻优,后两个参数采用系统默认值,经过多次训练,最终确定Range of influence 设置为0.4,Squash factor 设置为0.45,Accept ratio 设置为0.5,Reject ratio 设置为0.15,得到聚类数为29个,模糊规则为29条,隶属度函数选择常用的高斯函数。

ANFIS 模型训练与检验。训练算法选择hybrid 混合算法,为了防止过度拟合,允许误差设定为0.001,训练步数设定为200 步。经过训练134 次,训练误差达到设定阈值,训练终止,训练误差变化曲线见图2。模型训练完成后,导入验证样本进行网络预测性能的验证。ANFIS模型网络拟合值和目标值对比见图3,最终验证误差为0.007,说明99.3%验证输出与期望输出吻合,由此可以证明此模型的泛化能力很强,用其进行水资源安全评价是实用有效的。

图2 训练误差变化曲线图Fig.2 The variation curve of training error

图3 ANFIS模型拟合值和目标值对比图Fig.3 Comparison of ANFIS model fitting value and target value

2 实例分析

2.1 研究区域概况

保定市位于河北省中部地区,与北京、天津成三角之势,素有“京畿重地”、“都南屏翰”之称,是国家历史文化名城、国家园林城市,也是京津冀地区中心城市之一。本次所研究区域为保定市的中心城区,2015年4月,中心城区进行了区划调整,在原来的主城区的基础上将周边的满城县、清苑县、徐水县撤县建区并入其中,中心城区面积由原来的312 km2增加到2 531 km2,人口由119.4 万人增加到280.6 万人。中心城区的规划调整,拓展了城市的发展空间,增强了城市的承载能力,有利于更好地承接首都功能疏解和产业转移。但与此同时,由于中心城区水资源极度匮乏,水资源供需矛盾十分突出,水资源安全面临巨大的挑战。因此,开展保定市中心城区的水资源安全评价研究具有十分重要的现实意义。研究区概况图见图4。

图4 研究区域概况图Fig.4 Overview of the study area

2.2 结果评价与分析

2.2.1 水资源安全综合评价

将保定市中心城区2009-2018年各评价指标值应用map⁃minmax函数进行归一化处理,再将归一化后的值带入到保存的ANFIS网络里进行计算,对得到的输出结果反归一化,可得到保定市中心城区2009-2018年的水资源安全综合评价等级,评价结果见图5。由图5 可知,保定市中心城区的水资源安全等级无明显的变化趋势,其中主城区水资源安全等级2009年和2014年为临界安全,其余年份均为较安全,满城区和徐水区除2017年安全等级为较安全外,其余年份均处在临界安全,而清苑区一直处于临界安全等级。综上所述,2009-2018年期间,保定市中心城区水资源安全状况无明显变化趋势,除主城区处于较安全外,其他区的水资源安全状况主要处于临界安全状态,形势不容乐观。

图5 2009-2018年保定市中心城区水资源安全等级Fig.5 Water resource security level of Baoding central city from 2009 to 2018

2.2.2 水资源PSR安全综合评价

参照保定市中心城区水资源安全综合评价模型的建立和训练方法,分别建立保定市中心城区的水资源压力安全、状态安全、响应安全的综合评价模型,将2009-2018年3 个准则层的指标数据带入各自训练好的ANFIS 网络,最终分别得出保定市中心城区的水资源压力安全、状态安全、响应安全综合等级,见图6~8。

图6 2009-2018年保定市中心城区水资源压力安全等级Fig.6 The security level of water resource pressure in Baoding central city from 2009 to 2018

由图6可知,2009-2018年保定市中心城区的4个区的压力安全情况不尽相同,其中主城区的压力安全情况良好,除2018年为较安全外,其他年份压力安全等级均为安全;满城区压力安全情况相对较好,除2009年、2012-2013年为临界安全外,其他年份压力安全等级保持在较安全及以下;清苑区压力安全情况不容乐观,2009-2017年中除2010年压力安全等级为较安全外,其他年份均为临界安全,2018年为不安全,需要引起高度重视;徐水区的压力安全等级由2009年的临界安全转为2017-2018年的安全。

由图7 可知,2009-2018年保定市中心城区状态安全情况比较严峻,其中主城区除2012年状态安全等级为临界安全外,其他年份均为不安全或极不安全;满城区、清苑区和徐水区状态安全等级均为不安全或极不安全。这与评价区域的水资源量匮乏,水资源供需矛盾突出的实际现状相符合。

图7 2009-2018年保定市中心城区水资源状态安全等级Fig.7 The security level of water resource status in Baoding central city from 2009 to 2018

由图8可知,2009-2018年保定市中心城区的4个区水资源的响应安全等级均有不同程度的好转,其中主城区响应安全等级由较安全转为2016-2018年的安全;满城区由临界安全转为2013-2018年的较安全(2017年为临界安全);清苑区由临界安全转为2013-2018年的较安全;徐水区由临界安全等级转为2014-2018年的较安全(2015年为临界安全)。

图8 2009-2018年保定市中心城区水资源响应安全等级Fig.8 The security level of water resource response in Baoding central city from 2009 to 2018

综上所述,在2009-2018年期间,水资源的状态安全是影响保定市中心城区水资源安全的最主要因素。保定市清苑区水资源的压力安全等级处于临界安全或不安全状态,其他区压力安全状况较好,中心城区水资源的状态安全等级多处于不安全或极不安全状况,中心城区水资源的响应安全状况较好,均有好转趋势。

3 结论与讨论

(1)PSR 模型为分析城市社会经济发展和水资源之间相互影响构建了一个框架。基于PSR 模型框架并结合相关性分析和主成分分析所精简的评价指标更加准确、有代表性,所建立的评价指标体系具有科学性和可行性。应用基于ANFIS 的水资源安全评价模型,建模方便,方法有效,评价结果客观、易懂。

(2)从水资源安全综合评价结果得出,2009-2018年保定市中心城区水资源安全状况无明显变化趋势,除主城区处于较安全状态外,其他区的水资源安全状况主要处于临界安全状态,形势不容乐观。

(3)从水资源PSR 安全综合评价结果得出,水资源的状态安全是影响保定市中心城区水资源安全的最主要因素。保定市清苑区的水资源压力安全状况处于临界安全或不安全状态,其他区压力安全状况较好,中心城区水资源状态安全状况多处于不安全或极不安全状态,中心城区水资源响应安全状况较好,均有好转趋势。

(4)本文对水资源安全评价采用的是量化分级标准,其对评价结果至关重要,而目前尚未有统一的评价标准,因此,合理确定评价指标分级标准仍需继续深入研究;在ANFIS 评价模型中,减法聚类的4个参数的设置、隶属度函数的类型选择和训练次数的设定都会影响模型训练和预测的精度,因此,在构建ANFIS模型时,对上述参数的设置的优化组合有待进一步研究。□

猜你喜欢
保定市聚类城区
长沙市望城区金地三千府幼儿园
新建城区消防安全管理体系的完善措施
基于数据降维与聚类的车联网数据分析应用
广州市增城区松丁山遗址出土石器
基于模糊聚类和支持向量回归的成绩预测
河北省保定市:太行深处秀美花田
If I were a mayor
Advantages of reading
Reading and Life
基于密度的自适应搜索增量聚类法