闫 宝 伟,江 慧 宁,霍 磊,杨 文 发,张 俊
(1.华中科技大学 土木与水利工程学院,湖北 武汉 430074; 2.长江水利委员会 水文局,湖北 武汉 430010)
水资源安全关乎人类生存,关系到生态安全、粮食安全和能源安全,是影响经济与社会可持续发展的关键因素[1]。目前,我国的水资源安全面临诸多潜在威胁,洪旱灾害频繁发生,水资源供需矛盾日益突出,水生态环境趋于恶化,总体形势不容乐观。从水量的角度来讲,水资源安全是指水资源能够满足国民经济和社会可持续发展所需要的数量,且没有出现因水多、水少而致灾的状态。在我国现阶段水情下,加强水文水资源的监测、提高水资源安全的预警能力以及尽量降低因水资源不足或过多而造成的社会经济损失,是新形势下实现水资源高效有序管理的一个有效途径。
大致可以将水资源安全预警的方法分为以下两类。
(1) 通过构建水资源安全系统的指标体系,采用层次分析法[2]、模糊评价法[3]、主成分分析法[4]、集对分析法[5]和投影寻踪评价法[6]等,对指标体系进行降维或分析权重,并构建综合指标对系统所处状态进行综合评价,称之为指标型。
(2) 运用系统动力学方法[7-8],通过物质、信息的输入输出,使水资源各个子系统之间相互联系,形成多重反馈结构,并通过情景仿真,分析系统状态变量的变化趋势;或采用人工神经网络[9-10]、遗传算法[11-12]等智能算法来模拟系统状态的演化趋势,称之为模拟型。
上述两类方法中,指标型方法相对而言简单灵活、计算量较小,但存在指标体系难统一、指标间的相关性难消除等问题;模拟型方法可以采用非线性方程来模拟变量间复杂的相依关系,但对基础数据的数量和质量要求较高,对部分参数的敏感性较强,可能会导致不合理的模拟结果。
水资源安全预警的关键是水资源系统临界状态的确定。本文在预警指标体系的基础上,提出了一种基于主成分分析和支持向量机的临界状态解析方法,运用其中的主成分分析可以消除指标间的相关性,而采用支持向量机则可以进行水资源系统临界面的划分,进而可以根据临界状态的发展趋势实现水资源的预警。
水资源系统的临界状态是指水资源系统相变时的状态,即水资源由安全发展到不安全乃至致灾时的过渡状态。单从水资源量的角度来分析,随着水资源量的变化,水资源系统将经历以下几个状态。
(1) 当水资源的经济社会需求和生态环境需求都能得到充分满足时,水资源系统将处于供需安全状态,是水资源管理的理想状态;在该阶段,生态环境、社会环境和经济环境三者可以协同高效发展,整个社会将以稳定的速度逐步前进。
(2) 当水资源量不能同时满足经济社会和生态环境需求时,两者间会出现竞争性用水,势必有一方的用水量得不到满足,经济社会和生态环境的协调发展因此会遭到破坏,此时的水资源系统将处于缺水状态。
(3) 介于供需安全和缺水状态之间,水资源量虽能满足经济社会和生态环境的用水需求,但并不富裕,两者对水资源量的敏感程度非常高,水资源的脆弱性非常强,一旦出现动荡,水资源系统就将转化为缺水状态,此时的水资源系统将处于临界安全状态。
(4) 当水资源量较少,处于缺水状态时,经济社会的发展受到限制,生态环境质量降低,但尚不致灾;随着水资源量的减少,缺水程度进一步加重,农作物减产甚或绝产,部分地区的居民饮水困难,生态环境恶化,旱灾形成,此时的水资源系统将处于灾变状态。
(5) 介于旱灾和缺水状态之间,随着水资源量的减少,经济社会和生态环境缺水量逐渐增加,旱象初显,农作物和生态环境缺水将达到极限,若不采取措施,农作物和生物群落将会枯死且不可逆转;若能及时采取措施,适当补水,损失将大大减少,此时,水资源系统将处于临界旱灾状态。
(6) 当水资源量过多时,会远远超过江河湖库的蓄滞能力,洪水泛滥,农作物被淹导致减产或绝产,甚至造成了人员伤亡,严重破坏社会秩序和经济稳定甚或危及到国家安全,此时的水资源系统也将处于灾变状态。
(7) 介于供需安全与洪灾状态之间的为临界洪灾状态,此时,江河湖库的水位达到保证水位,蓄滞能力接近饱和。在这种情况下,应及时采取措施,提高洪水防御能力或分调洪水减轻流域压力,避免对生命财产造成不可挽回的损失。
由此,随着水资源量由少到多,水资源系统共经历了旱灾、临界旱灾、缺水、临界安全、供需安全、临界洪灾和洪灾7种状态,其主要特征如表1所列。在这7种状态中,共包括了临界旱灾、临界安全和临界洪灾3种临界状态,若能准确辨识出水资源系统所处的这3种临界状态,将为水资源的安全预警提供重要依据。当水资源系统趋近于临界状态时,系统会呈现出临界慢化现象,即系统的扰动恢复速率变慢、自相关系数增加、方差增加,这也是任何一个临界状态都具有的典型特征[13]。例如,对于临界旱灾,由于长期缺水,农作物和生态系统濒临崩溃,即便有少许降水,也很难使系统迅速恢复到正常状态;当地的水资源量呈现出减少的趋势,且越来越依赖于上一时刻的值,距离正常态也越来越远,导致自相关性增强,方差增加。
同样,对于临界洪灾,由于前期水资源量已经非常丰富,江河湖库甚至整个流域都接近蓄满状态,稍有扰动,便有可能出现漫堤、溃堤等险情发生;由于当前水资源量已接近极限值,下一时刻的水资源量在很大程度上取决于当前时刻的水资源量,致使状态变量的自相关性和方差增加。而对于临界安全,水资源量刚刚能满足经济社会和生态环境用水,水资源系统恰能处于供需平衡状态,缺水量为零,稍有扰动,系统便可能会出现失衡,经济社会或生态环境的正常用水遭到破坏,使其恢复速率变慢;当前缺水量会受到前期缺水量的影响,导致其自相关系数和方差增加。
上述3种临界状态虽是根据水资源量的多寡进行判断的,但同时还与持续时间有关,例如,旱灾是较长时间的缺水累积而形成的,时间尺度一般为旬、月或年;而洪灾则是短时间的洪水暴发引起的,时间尺度一般为小时或日;水资源短缺一般是指某一特定时段内水资源供给量不能满足需求量,时间尺度多为月、年或多年。因此,描述这3种临界状态的指标也不尽相同,详情如表1所列。
表1 水资源安全状态及指标体系Tab.1 Water resources security state and index system
对于水资源系统的临界状态,可以采用单一指标法进行判别,比如,临界旱灾状态的干旱指数SPI、PDSI等,临界安全的人均水资源量、水资源开发利用率等,以及临界洪灾状态的警戒水位、临界雨量指标等。水资源系统是一个多维动态的复杂系统,单一指标法或有一定物理含义,或有一定的统计意义,但一个指标仅能反映水资源系统某一方面的特征,过于片面。指标过多,则又可能因选取的指标具有相关性而过多地强调了水资源系统某一方面的特征,从而忽略了其他重要特征。为此,需去除因指标相关而产生的冗余信息,避免因选取的指标过多包含了某一方面的信息而赋予该特征过高的权重,从而导致部分信息失真而不能真实地表征水资源系统的特征属性。
主成分分析可以在力求数据信息丢失最少的原则下,通过对高维的变量进行空间降维,将多个实测变量转换为少数几个不相关的综合变量,即主成分,从而去除信息冗余和噪声。为此,可以采用主成分分析方法对特征指标集合进行降维处理,确定水资源系统特征的主成分。主成分分析方法的基本思想是通过研究变量相关系数矩阵的内部结构,找到几个可以代表原始影响因素的主成分,以达到从指标体系中提取最重要指标的目的;通过计算数据矩阵的协方差矩阵,得到协方差矩阵的特征值和特征向量,选择特征值最大(即方差最大)的k个特征所对应的特征向量组成的矩阵,这样就可以将数据矩阵转换到新的空间当中,以实现数据特征的降维。
与传统的人工神经网络不同,支持向量机具有坚实的理论基础和清晰、明确的几何表达,在处理分类问题、判别分析等模式识别问题时具有独特的优势。支持向量机的机理是寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能使超平面两侧的空白区域达到最大化[14]。以下为2个指标时支持向量机辨识临界状态的例子:每个点的位置均由所选取的2个指标唯一确定,支持向量机的分类原则是试图找到一条直线来分割这些数据点,并使这些点与平面间的距离尽可能大。如果这些点是线性可分的,那么超平面可以描述为
WTXi-b=0
(1)
式中:W为超平面的法向量,b为位移项。样本点与超平面的间隔为(2/‖W‖),尽可能使其最大。由此,最优超平面应当满足:
(2)
式中:C>0为惩罚参数,C的引入可以使误分类点的个数尽可能少;ξi≥0为松弛变量,ξi的引入可以降低离群点对分类模型的影响。
为了解决这个约束最优化的问题,引入拉格朗日乘子法,将该优化问题转换为与之对应的对偶问题,并采用序列最小优化算法进行求解,即可得到上述最优超平面方程[15]。在线性可分的情况下,将训练数据集中与分割超平面距离最近的样本点称为支持向量,即图1中虚线上的点,将支持向量所在的超平面称为间隔边界。对于水资源安全系统而言,间隔边界以外的点要么处于供需安全状态,要么处于缺水状态;或者是要么处于未致灾状态,要么处于致灾状态。因此,从统计意义上来讲,该超平面方程即为临界安全或临界致灾的临界面,也就是说,该临界面上的点处于临界安全或临界致灾状态。
图1 支持向量机的分类原理Fig.1 Classification principle of support vector machines
应用支持向量机进行模式分类时,首先应根据预警对象,遵循科学性、全面性和实用性等原则,建立相应的指标体系,比如洪水预警指标体系、干旱预警指标体系、水资源供需安全指标体系等。这些指标间存在着一定的相关性,会导致支持向量机在模型训练时出现多元变量共线性的问题,并将使得某个指标的权重远远高于其他指标,其噪音的影响也会相应增加,从而降低模型的分类精度。为此,本文采用主成分分析方法,对上述指标体系进行降维、去噪,并提取包含样本数据信息的主成分,再以降维后的主成分作为相应预警系统的特征指标,进一步采用支持向量机进行是否安全或致灾的二元分类,从而得出相应的临界超平面和预警指标的临界阈值组合,具体的技术路线如图2所示。
图2 技术路线Fig.2 Technical route
降维后的主成分物理含义不够明确,无法直接获取。为此,实时预警时,可以先将实测指标换算成主成分,再根据主成分组成的样本点到临界超平面的距离来判断是否预警。
采用该方法解析水资源安全系统的临界状态,需要事先知道观测样本的状态;对于干旱和洪水是否致灾,可以根据当地年鉴是否有洪旱灾害的记录来确定,对于水资源是否安全,则可以根据水资源安全的评价方法来确定样本是否处于安全状态。
以汉江月河流域为例,采用上述方法推求其洪水预警的临界雨量。降雨量和土壤含水量是影响洪水的2个最主要因素,因此,选取这2个指标作为洪水预警指标体系。根据该流域1980~1990年的雨洪摘录资料,共选出了87场洪水,在每场洪峰前24 h的降雨量中选取了最大6 h降雨量作为降雨量指标,并将这个最大6 h降雨量发生时刻的前5 d的累积降雨量作为该场洪水的前期雨量,前期雨量在一定程度上反映了土壤含水量的大小,因此将其作为土壤含水量的表征指标。根据实测洪水流量资料,以1 000 m3/s作为预警流量,将实测洪水样本分为超警和未超警2类。由于指标较少,而且两者的相关性不大,因此可以直接采用支持向量机进行洪水样本的分类。
以87场洪水所对应的最大6 h降雨量和前期雨量作为训练数据集,建立线性核函数的二分类支持向量机模型,根据实测样本的属性进行分类训练。结果表明,分类正确率达到了93.7%,如图3所示,并可进一步确定出分类直线的方程为
图3 实测洪水样本分类结果Fig.3 Classification of measured flood samples
2.190 6x+0.599 2y-76.554 3=0
(3)
式中:x,y分别代表前期雨量和6 h的临界雨量。
这种分类直线即为统计意义上的临界方程,由此确定的雨量即为临界雨量。可以看出,随着前期雨量的升高,土壤含水量逐渐增加,所需的最大6 h成灾雨量逐步减小。根据临界方程,可以求出不同前期雨量时所对应的最大6 h降雨量,即为山洪预警所对应的6 h临界雨量,从而可以根据前期雨量以及降雨实时资料来判断洪水是否超警,实现基于临界雨量的山洪预警。
以汉江上游石泉断面以上区域为例,采用上述方法进行干旱预警的应用研究。文献[15]根据研究区域1987~2015年的实测资料,选取干旱历时、降水距平百分率、径流距平百分率、日平均蒸发量和最小枯水流量这5个指标建立干旱指标体系,按照一定的选取原则,共选取了107个潜在干旱样本,采用主成分分析对原特征指标进行降维,前3个主成分的方差累计贡献率达到了89%,因此,选取这前3个主成分作为综合指标以替代原指标体系。根据各地年鉴旱灾记录情况,将上述107个样本的致灾情况进行标注,采用支持向量机分类模型,将含有这3个综合指标的107个样本中的前79个样本用于模型训练。结果表明,分类正确率达到了88.6%,如图4所示,得到的最优分割平面方程如下[15]:
图4 干旱样本分类结果Fig.4 Classification of drought samples
0.664 4x+2.307 7y+0.514 9z-0.002 3=0
(4)
式中:x为第一主成分,y为第二主成分,z代表第三主成分。3个主成分皆可由指标实测数据换算而成。
利用这种临界平面方程可以进一步确定各个干旱特征指标的阈值组合,理论上,该阈值组合不唯一。由于水资源的状态演化是一个连续的、动态的过程,因此在实际应用中,可以根据样本点到临界平面方程的距离来判断致灾程度,以此实现干旱的实时预警。
以汉江上游的十堰市为例,基于上述方法进行水资源安全预警的应用研究。文献[16]根据2002~2017年水资源公报和社会经济年鉴数据,分别从水资源状况、供水设施状况、利用效率、利用能力和生态环境5个方面共选取了23个指标,构建了十堰市水资源安全评价指标体系。其中:
(1) 表征水资源状况的指标有地表水资源量、地下水资源量、人均水资源量、亩均水资源量以及大中型水库需水总量;
(2) 表征供水设施状况的指标有年供水量、农业用水量以及城市用水普及率;
(3) 表征利用效率的指标有万元GDP用水量、万元工业增加值用水量、农田亩均灌溉用水量、城镇人均生活用水量、农村人均生活用水量、城区供水管网漏失率以及工业用水重复利用率;
(4) 表征利用能力的指标有人均GDP居民消费水平、第一产业比重和第三产业比重;
(5) 表征生态环境的指标有废污水达标排放率、河流水质良好程度、废水排放量以及城市污水处理率。
由于选取的水资源安全指标较多,不同的指标之间存在一定的相关性,在该研究成果的基础上,运用主成分分析法去除因子间的冗余信息,得出前4个主成分的累积贡献率达到了85.1%,因此,取前4个主成分作为新的综合指标。结合十堰市2002~2017年水资源安全评价结果[16],建立了支持向量机模型,将16 a的数据全部作为模型的训练集,用来训练模型参数,对其进行分类,结果表明,分类准确率达到了100%,并得到了四维的临界超平面,如图5所示。图5中的“*”表示水资源不安全,该临界超平面即为水资源安全预警的临界方程:
图5 水资源安全状态分类结果Fig.5 Classification results of water resources security state
-1.341 1x-0.810 4y+1.183 9z+0.300 5w+1.221 6=0
(5)
式中:x为第一主成分,y为第二主成分,z为第三主成分,w为第四主成分。
同样地,可以根据样本点到临界超平面的距离来判断水资源系统是否安全,以达到水资源安全预警的目的,可为相关部门提供决策依据。
水资源安全预警的关键是水资源安全临界状态的确定,随着水资源量由少到多,水资源系统共经历了旱灾、临界旱灾、缺水、临界安全、供需安全、临界洪灾和洪灾7种状态,其中,临界旱灾、临界安全和临界洪灾这3种临界状态的准确辨识,对于水资源安全预警而言有着重要的意义。
基于主成分分析和支持向量机原理,提出了一种水资源安全临界状态的解析方法。研究表明:
(1) 采用主成分分析对反映水资源系统特征属性的多重指标进行降维处理,去除因指标相关性而产生的冗余信息;降维后,新生成的综合指标可以综合反映水资源系统的多属性特征,从而可以提高临界状态的识别精度。
(2) 借用支持向量机最优分割超平面的概念,提出了水资源系统的临界面。该临界面具有明显的统计意义和几何含义,位于该临界面上的样本点即处于临界安全或临界致灾状态,进一步可以根据样本点到该临界面的距离来判断系统是否处于安全或致灾状态,最终实现水资源安全或致灾的预警。
(3) 将本文提出的方法分别应用于洪水预警、干旱预警和水资源安全预警实践,预警准确率分别达到了93.7%、88.6%和100%,精度较高,从而可以实现水资源安全或致灾临界状态的辨识和预警。