金菊良 ,杨通竹 ,郦建强,陈梦璐 ,宁少尉 ,张浩宇
(1.合肥工业大学 土木与水利工程学院,安徽 合肥 230009;2.合肥工业大学 水资源与环境系统工程研究所,安徽 合肥 230009;3.水利部水利水电规划设计总院,北京 100120)
区域水资源承载力[1]是以维护区域经济、社会和生态环境良性发展为原则,以当地当下的经济、技术和社会发展水平,对供水和需水经过合理的双向调控后所能支撑该区域最大经济社会规模的能力[1-2],是衡量区域可持续发展的重要指标。区域水资源承载力的影响因子众多,将诸多影响因子以一定的计算规则定量地刻画其大小,是水资源承载力评价的重点也是难点。目前,广泛运用的评价方法有模糊综合评价法、主成分分析法、灰色关联法、云模型和集对分析法等。为解决水资源承载力评价指标高维、非线性、非正态的问题,本文构建了基于最大信息熵的投影寻踪水资源承载力评价方法。处理高维数据的传统观念是假定样本总体服从正态分布,但实际上,许多高维数据并不满足高维正态分布的假设。此外,当维数超过3 维时,不能绘制出直观可视的分布图,而且计算量随着维数的增加也明显增大。有限的样本点对比庞大的高维空间,相对地就会变得稀疏,难以看出其分布规律。投影寻踪方法[3-5]的核心是找出最能反映待评价问题综合指标特征的投影方向,将高维数据线性投影到低维空间上(1~3 维),从而多指标问题被转换为易进行分析的单指标问题。这样处理既能有针对性地克服高维数据点稀疏分布所造成的“维数祸根”困难,还能消除一些干扰较少的变量,在尽量保留有用信息的情况下,找出数据的内在规律。投影寻踪法与其他优化方法结合处理多指标评价问题在许多领域的综合评价问题中开始得到成功应用[6-9]。
熵是度量随机变量不确定性的参数,熵值达到最大的时候,随机变量最不确定,所受的约束和假设最少,以此作出的选择,是唯一不偏不倚的[10-11]。在传统投影寻踪方法中,求解投影方向时存在全局搜索能力较差、提前收敛或收敛慢等问题,搜索到真正的最优解并不容易。而加速遗传算法[12-14]是一种高效、并行、全局搜索的求解最优化问题的智能方法,是通用性好、适用性强的优化方法,已在动态规划、多峰函数优化问题、多目标函数等优化问题中得到广泛应用。
本文在水资源承载力与投影寻踪方法相关研究的基础上,将投影寻踪方法运用于区域水资源承载力空间分布与动态评价中。首先,根据评价指标体系,收集并处理指标数据。然后,将处理好的样本数据代入该方法中计算,得到投影特征值。最后,以评价等级标准样本点的投影特征值作为阈值,划分新的等级标准,确定待评价样本的等级。在此基础上,将动态评价结果与灰色GM(1,1)模型[15-17]结合,对区域水资源承载力进行短期预测,并就结果展开分析。
在综合考虑区域水资源、经济、生态和环境等影响要素的同时,遵循指标选取的4 个基本原则[10],确定评价指标体系。该体系包括3 个子系统,分别为水资源支撑力、压力及调控力子系统。每个子系统下又包括相应的评价指标[18-20],对各个评价指标的权重确定则采用基于加速遗传算法的模糊层次分析法[13]。
区域水资源承载力状态分为可载(Ⅰ级)、临界超载(Ⅱ级)、超载(Ⅲ级)3 个等级[18,20],相应等级下的水资源承载状态见表1[18-20]。
表1 水资源承载力状态等级[18-20]Tab.1 Status of water resources carrying capacity[18-20]
基于最大信息熵的投影寻踪方法,其具体步骤如下:
步骤1:评价指标样本数据无量纲化处理。
步骤2:线性投影,计算投影特征值[6-9]。
式中:z(i) 为第 i 个样本的投影值;w( j)是第j 项指标的权重;m 为指标个数;a( j)(j=1~m)为投影方向。
步骤3:构造投影指标函数。投影指标函数由3 个部分组成:
(1)在整体上,为了最大限度地提取到样本数据中的有效信息,投影点之间需尽可能地分散,用投影值z(i)的标准差Sz达到最大表示[4-6,8],即:
(2)在局部,投影点尽可能地聚集。一般采用局部密度Dz表示[4-6,8]:
(3)投影方向a 信息熵值最大[8,10-11]。
式中:a(j)(j=1~m)为投影方向。
综上,投影指标函数可构造为[8]:
步骤4:优化投影指标函数。通过加速遗传算法(Accelerated Genetic Algorithm,AGA)对式(9)进行求解,确定最佳投影方向。在后面的实例应用中,AGA 加速循环30 次,种群规模为300,优秀个体数目为20。
安徽省属华东地区,横跨江淮分水岭,其气候具有明显的区域特征,水资源在时空分布上存在明显差异。与之相对应的是,安徽省经济人口分布也存在一定的地区差异。经济发展方面整体上皖南快于皖北,人口方面皖北地区人口、特别是农村人口较皖南地区偏多,同时皖南地区多山区丘陵地带、人口密度较北方地区偏小。目前安徽省区域水资源开发利用过程中尚存在一些不足,仍需完善水资源优化配置的合理措施,部分地区地表水缺乏拦蓄、污染严重、水资源利用困难,皖北一些地区存在地下水过度开采情况,水资源供需矛盾较为尖锐。因此,对安徽各市分别进行水资源承载力评价是开展水资源合理开发利用保障工作的重要组成部分。
参考《安徽省水资源公报》和《安徽省统计年鉴》数据,对2015 年安徽全省所有地级市进行水资源承载力评价,基于李辉等[19]的研究,确定本文研究所用的评价指标体系和等级标准及各指标权重(表2)。
将各待评价地级市的样本点与临界超载的2 个评价标准等级样本点代入式(1)~(9)中得到最佳投影方向为:a = (0.006 2,0.068 6,0.010 0,0.236 1,0.269 7,0.001 4,0.145 3,0.438 9,0.269 9,0.008 2,0.438 5,0.435 9,0.005 6,0.059 8,0.440 7),并以标准等级样本点的投影值划分新的评价等级,当投影值大于0.066 5 时,为可载,等级为Ⅰ级;投影值小于0.050 0 时,为超载,等级为Ⅲ级;否则为Ⅱ级的临界超载。并据此对安徽省2015 年16 个地级市展开评价(见图1),同时与文献[19]有关结果进行分析比较。
表2 水资源承载力空间分布评价指标体系及等级标准[19]Tab.2 Evaluation index system and grade standard of spatial distribution of water resources carrying capacity[19]
由图1 可知:安徽省境内全部地级市水资源承载力具有较大的差异,评价结果中Ⅰ至Ⅲ级均有分布,且分布有明显的地域属性,自北向南具有一定规律。各评价指标与区域地理位置、气候、经济、人口等影响因素有关,如皖南地区,黄山、宣城等地,其人均水资源量、植被覆盖率、生态用水率等占比重较大的效益型指标值,较北方地区的大;而在皖北地区,一些成本型指标值,如万元工业增加值需水量、人口密度、城市化率、农田灌溉定额等均大于皖南地区。承载力评价结果在整体上表现为自北向南由劣转优。
将本文所得的研究结果与文献[19]中已有研究成果相比较,其结果整体上基本一致,但局部区域,如滁州市(本文方法评价等级为Ⅲ,文献[19]评价等级为Ⅱ)及铜陵市(本文方法评价等级为Ⅰ,文献[19]评价等级为Ⅱ),仍存在一定差异。分析原因可能为两地的地理位置属南、北方的过度地带,对投影方向的选取敏感程度较大。所以,对于该类型地区的评价结果具有一定的差异性是合理的。
以安徽省作为动态评价对象,时间尺度为2005—2015 年,并与灰色GM(1,1)模型相结合,对短期内全省水资源承载力变化情况进行预测,具体评价过程同上。
灰色GM(1,1)模型是短期内系统变动趋势关联度预测模型[15-16]。该模型只含1 个变量,且对样本序列长度、数据量要求低,计算过程简便,预测精度较好,在许多领域得到了运用。本文利用投影寻踪方法将水资源承载力多指标评价转化为单指标评价,因此可将该单指标作为GM(1,1)模型的变量输入,进行短期内的水资源承载力趋势预测。具体模型精度等级见表3。
图1 安徽省水资源承载力分布Fig.1 Distribution of water resources carrying capacity in Anhui Province
参照上述评价过程,由式(1)~(9)得最佳投影方向为:a=(0.123 9,0.045 0,0.496 9,0.002 9,0.075 0,0.091 4,0.143 0,0.008 5,0.443 0,0.096 7,0.033 7,0.591 9,0.071 4,0.110 5,0.356 1)。新的等级标准如下:当投影值大于0.148 1 时,为可载,等级为Ⅰ级;投影值小于0.085 2 时,为超载,等级为Ⅲ级;否则为Ⅱ级的临界超载。2005—2015 年动态评价与模拟结果,见表4。
表3 灰色GM(1,1)预测模型精度等级[15-16]Tab.3 Precision grade of grey GM(1,1) prediction model[15-16]
表4 安徽省2005—2015 年动态评价与预测结果Tab.4 Dynamic evaluation and forecast results of Anhui Province from 2005 to 2015
根据表4 可知,2005—2015 年间,全省均为临界超载(Ⅱ级)状态;但承载力呈逐年好转趋势,向可载状态发展,如图2 所示。
将2005—2015 年评价的投影特征值代入灰色GM(1,1)模型作为预测的原始序列x(0),得到响应函数x(k+1)=3.570 3exp(0.0287 9k)−3.469 4,生成模拟序列,经还原计算即得预测序列。为验证模型的可靠性,将2016 和2017 年的投影特征值0.150 9 和0.146 9 作为验证组,代入预测模型后得到的模拟预测值为0.143 1 和0.147 3,相对误差分别为:−5.17%和0.27%。该预测模型的小误差概率P =100%>95%,后验比C=0.18<0.35,相对误差的绝对值平均为1.83%<10%,故模型预测精度为1 级。2018—2020 年投影特征值预测为x(2)=(0.151 6,0.156 0,0.160 6)。可见,2018—2020 年的安徽省水资源承载力预测结果为可载。
图2 评价及预测结果Fig.2 Evaluation and prediction result
(1)本文在已有水资源承载力评价相关研究的基础上,根据评价指标数据高维、非线性特征,构建了基于最大信息熵的投影寻踪评价方法。该方法中采用信息熵原理修正投影指标函数,使投影方向更有效地反映高维数据结构特征,并采用加速遗传算法求解最佳投影方向,解决了投影寻踪方法中投影方向不确定和不稳定问题,使评价结果更加合理可靠。
(2)安徽省水资源承载力相关研究结果表明:2015 年安徽省水资源承载力空间分布状况在地理位置上表现为皖南地区可载、皖中地区临界超载、皖北部分地区超载的分布规律;2005—2015 年安徽省全省水资源承载状况逐年好转,但基本处于临界超载(Ⅱ级)状态;基于2005—2015 年的评价结果,引入灰色GM(1,1)模型,预测2018—2020 安徽省水资源承载力为可载。从预测的结果来看,随着各项水政策的执行,在未来几年,安徽省水资源承载力保持良好上升的态势,总体向可载(Ⅰ级)状态发展。
(3)对比安徽省水资源承载力评价的相关文献,与本文中基于投影寻踪的水资源承载力评价方法所得结果比较一致,这表明该方法可用于区域水资源承载力的评价。