柳江流域多时间尺度的降雨径流模拟分析

2017-03-21 02:04李泽峰陈洋波
中国农村水利水电 2017年12期
关键词:柳江降雨量径流

李泽峰,陈洋波,李 雪

(中山大学地理科学与规划学院,广州 510275)

降雨和径流都是水循环的一部分,降雨对径流的产生有着深远的影响。而径流作为水文水资源系统的主要组成部分之一,其变化不可避免的影响着水文水资源系统的变化[1]。由于水文水资源系统本身具有复杂性,加上人类活动和全球气候变化的影响,使得径流变化有着多时间尺度和非线性等特征[2]。这些特征也导致了传统的研究理论和方法在进行径流分析时面临着诸多困难[3]。变化环境下,开展流域降雨径流模拟分析对合理进行水资源开发利用和管理有重要意义。从实际应用上看,无论是水库调度、防汛抗旱、还是航运等方面,对径流模拟预测精度的要求越来越高[4]。因此,如何进一步提高径流预测的精度也是水文研究领域的热点和难点。近年来,随着计算机技术以及多学科交叉的发展,人工智能和数字信息化与水文研究的融合,高新技术如神经网络、遥感技术、地理信息技术等在水科学领域得到了越来越多的应用。水文模拟手段的变革,使模拟预测的精度得到较大的提高。在此背景下,黑箱模型作为一种分析输入和输出的时间序列但忽略流域物理过程的研究方法,在降雨径流模拟中得到了广泛的应用。其中,支持向量机(Support Vector Machine,简写即SVM)就属于可以应用于非线性问题的新技术理论,目前已有众多应用于水文序列的模拟预测的研究[5,6]。已有研究表明,与传统的回归分析方法和人工神经网络方法相比,支持向量机可以取得更高精度的降雨-径流预测值[7]。在此基础上,众多学者在模拟预测精度上进行了有益的探索,采用优化算法优选参数,以克服常见的模型稳定性和精准度不高的问题[8,9]。

柳江是珠江流域西江水系的第二大支流,跨越黔、桂、湘3省(自治区)。近年来,变化环境下,流域地带降雨不均化加剧,汛期洪水频繁发生,对流域社会经济造成了极大的损失。已有一些围绕柳江流域降雨径流展开的研究[10-12],研究发现柳江流域致洪暴雨主要发生于6-7月,20世纪90年代后柳江致洪暴雨的发生频率和强度都有增加的趋势[10]。而目前柳江流域降雨径流过程的模拟研究还相对较少,尚缺乏不同时间尺度下的降雨径流模拟研究。本文利用基于优化算法遗传算法(GA)和粒子群算法(PSO)的支持向量机模型方法,从年降雨径流、汛期、枯水期、主汛期不同尺度开展柳江流域降雨径流模拟研究,旨在更好地为流域防洪减灾和综合管理提供科学依据。

1 资料与方法

1.1 研究区概况

柳江干流全长773.3 km,处于东经107°30′~110°15′,北纬24°25′~26°30′,跨越黔、桂、湘3省(自治区),是珠江流域西江水系的第二大支流,流域面积达到58 270 km2。柳江东临桂江和资水,东南面及南面与红水河相伴,北靠长江流域。整体地势大致为东南部和南部偏低,西北部和北部相对较高,而中上游主要是高山峡谷地形,占流域面积的47%。柳江干流的天然落差达到1 306 m,平均比降大约为1.68‰(图1)。

图1 柳江流域数字高程图

柳江流域属于典型的亚热带季风气候,年平均温度在18~20 ℃,雨量充沛,年降雨量可达1 400 mm左右。作为柳江径流的主要补给来源,流域降雨时空分布不均,主要集中在汛期的4-9 月份,占全年的80%左右,因此,流域汛期易发生洪水灾害,尤其是从1988年以来的近20年间洪水频发。如1996年7月柳州发生百年一遇以上的特大洪水,其洪峰水位超出警戒水位10.93m,市区受淹面积达到建城区面积的91.5%,直接带来的经济损失为52.11亿元[13]。此外,1988年8月、1994年6月和2004年7月分别发生了20~50年一遇的大洪水,在2000年6月也发生了一次10~20年一遇的较大洪水等。近年来,柳江流域暴雨洪涝频发给流域社会造成了严重损失。

1.2 数据来源

(1)水文数据。本文收集了广西柳州(二)水文站的日流量数据,时间为1982年4月21日到2006年10月1日。水文站处于柳江流域下游区域,数据具有一定的代表性。本文4个时间尺度上的径流量数据通过每日径流量累加得到。

(2)气象数据。收集柳江流域的24个站点降雨数据,数据来源于广西水文水资源局,时间为1982年4月21日到2006年10月1日。针对个别站点个别数据缺失情况,通过临近站点同时期数据比拟解决。其中,年降雨量数据23年,汛期降雨量(4-9月)和枯水期降雨量(10-次年3月)24年,主汛期降雨量(6-8月)时间年份为25年。本文通过基于ArcGIS平台的泰森多边形方法计算得到相应站点的权重,然后在各个站点的年降雨、汛期降雨、枯水期降雨和主汛期降雨数据的基础上,分别加权得到相应的面降雨数据。

1.3 研究方法

1.3.1 支持向量机(SVM)的原理

支持向量机(SVM)[14]是由Vapnik等学者提出的一种机器学习方法,目前常用于分类和回归分析。本质上是用某一实现选好的非线性函数将训练集数据映射到一个高维线性特征空间,在这个维数可能是无穷大的线性空间中构造最优分类面[14]。其理论基础是结构风险最小化原则,在合理地选用函数子集和其相应的判别函数的前提下,使得学习机器的实际风险降至最小,从而确保经过训练得到的误差分类器在对检测样本进行检测时,误差仍然较小。同时它也引入了间隔的概念,用原空间的核函数取代了高维特征空间的点积运算,避免计算繁杂的情况。操作的基本思路是[14,15]:对于给定的样本数据集{(xi,yi)|i=1,2,…,k},xi为输入向量,yi为输出向量,要求拟合的函数形式为:

f(x)=[ω,φ(x)]+b,ω∈Rn,b∈Rn

(1)

引入非负的松弛变量ξi,ξ*i支持向量机的回归问题等价于解决一个二次规划问题:

(3)

式中:C为调节训练误差和模拟复杂度之间折中的正则化函数,即误差惩罚参数;ε为不敏感损失函数。这是一个凸二次规划,求解其对偶形式可得:

f(x)=∑sv(aj-a*i)K(xi,xj)+b

(4)

式中:K(xi,xj)为核函数,在应用中,常见的核函数有4种,线性核函数、多项式核函数、径向基核函数和Sigmoid核函数。由于径向基核函数训练出的模型比其他核函数训练出的模型在总体性能上更好[16],是各个领域比较通用的核函数,所以本文选用径向基核函数K(x,xi)=exp(-γ|x-xi|2)。

1.3.2 基于支持向量机的模型构建

(1)相关性分析。径流预报的首要环节是挑选预报因子,本文主要利用相关系数法挑选预报因子,从而作为模型的输入样本。相关系数是一种用来描述两者之间相互变化的方向以及密切程度的指标,通常用r表示。本文选取Pearson相关法和Spearman相关法对降雨径流进行相关性分析。考虑到相关性检验一般要求数据服从或近似服从正态分布,所以在进行相关性检测前,先对数据进行正态性分析。本文采用K-S检验法,在0.05的显著性水平下完成对数据正态性检测的需求。把挑选好的预报因子作为支持向量机的输入样本,径流量作为输出。

(2)样本归一化处理。为了消除各个因子量级不同带来的影响,训练和模拟之前需要对数据进行规范化预处理,通过归一化方法使各个因子包括输出项均归一化到[0~1]之间,本文采取的预处理的归一化方法如下:

(5)

式中:xmin是所有数据中的最小值;xmax是所有数据中的最大值;n为数据的总个数。

(3)优化算法优选参数。支持向量机模型的主要参数有核函数参数γ、惩罚参数C和损失参数ε,其取值是影响支持向量机模型性能的关键。惩罚参数C过大或小,都会使得模型泛化能力变差;损失参数越小,支持向量数目就多,估计的函数精度就越高,合适的参数才能使得模型得到较好的模拟效果。目前,常采用经验选择法、交叉验证法和实验试凑法等方法进行参数的选取,耗时长且带有一定的主观性,极大制约了支持向量机模型预测精度和泛化能力的提高[17]。为了获取核函数参数γ、惩罚参数C和损失参数ε的合理取值,本文采用遗传算法(GA)和粒子群算法(PSO)对相应的参数进行优选。其中,遗传算法(GA)[18]是由美国的J. Holland 教授于1975年提出的优化算法,从优化搜索的角度来说,就是通过遗传操作,使问题的解一代又一代地得到优化,并趋近最优解。粒子群算法(PSO)[19]是1995年由Eberhart和Kennedy博士共同提出,其工作原理是通过对初始化时的随机粒子(随机解)进行不断的迭代操作,从而找到里面的最优解。本文利用优化算法优选参数以加快参数优选的速度,使得SVM模型训练模拟结果更客观、可信。

2 结果与分析

2.1 降雨径流的相关性分析

开展多时间尺度的降雨径流模拟之前,对不同时间尺度的降雨径流进行相关性分析。考虑到相关性检验一般要求数据服从或近似服从正态分布,首先采用K-S检验法对数据进行正态性检验。检测结果如表1,由表1可以看出,年、汛期(4-9月)、枯水期(10-次年3月)和主汛期(6-8月)降雨量的显著性水平P值都大于0.05,表明相应数据组的分布符合正态分布的要求。四组径流深的显著性水平也都大于0.05,正态性检验结果与降雨量一样,相应数据组服从正态分布。因此,在相关性分析中可以使用Pearson相关系数法,此外还应用了Spearman非参数检验法对结果进行验证。

表1 降雨、径流深的正态性检验

利用Pearson相关系数法和Spearman相关系数法对年降雨量和年径流深、汛期降雨量和汛期径流深、枯水期降雨量和枯水期径流深、主汛期降雨量和主汛期径流深进行相关性分析。由相关分析结果(表2)可以看出,通过两种方法得出的相关系数中,年降雨量和年径流深、汛期降雨量和汛期径流深、主汛期降雨量和主汛期径流深表示的相关性基本一致,都有明显的相关性,通过了99%的显著性水平检验,其中年降雨量和年径流深的平均相关系数0.765、汛期降雨量和汛期径流深0.906、主汛期降雨量和主汛期径流深0.946;而枯水期降雨量和枯水期径流深没有明显的相关性,枯水期降雨量和径流深的平均相关系数为-0.041。观察不同时间尺度下的降雨量和径流深的线性关系(图2)。由图2同样可以看出,降雨量和径流深的相关性在主汛期最高,汛期次之,枯水期最差。主汛期径流受降雨控制最为严重,两者之间相关最为密切,而枯水期径流受降雨变化影响小,即降雨的波动在径流上反映不明显。这主要是由于目前柳江流域水资源利用开发程度较高,如现阶段分布于全流域的中小型水库700多座,且干支流还建有中型电站,如麻石、拉浪和洛东等水电站,枯水期径流多依靠水利工程的补水调节作用,而不是降雨。因此枯水期降雨径流的相关性表现微弱。

表2 不同时间尺度相关性分析

注:**表示在置信度(双侧)为0.01时,相关性是显著的,无*表示相关程度很弱,或者不相关。

图2 降雨量和径流深的线性关系

2.2 降雨径流序列的模拟分析

2.2.1 基于支持向量机的降雨径流模拟

根据相关分析结果可知,年降雨量和年径流深、汛期降雨量和汛期径流深、主汛期降雨量和主汛期径流深都有明显的相关性,因此在降雨径流序列的模拟分析中可以采用降雨作为预报因子,而枯水期径流的主要来源不是枯水期的降雨,建立其相应的降雨径流回归模型没有理论意义,因此只构建了年、汛期和主汛期各自的降雨径流回归模型。回归模型采用以径向基函数为核函数的支持向量机模型,分别对柳江流域年降雨径流、汛期降雨径流和主汛期降雨径流时间序列进行模拟分析,时间序列分别为1983-2005年、1983-2006年和1982-2006年,都统一以后5年数据作为检测数据,剩余时段数据为训练数据。由于降雨和径流的量级相差甚远,为了消除各个因子量级不同带来的影响,模拟前对数据进行归一化处理,通过归一化方法使所有数据归一化到[0~1]之间,然后基于MATLAB应用libsvm-3.1-Faruto Ultimate工具包进行SVM建模,并对模型中的关键参数利用遗传算法和粒子群算法两种方法进行优选比较。

通过对年降雨径流序列、汛期降雨径流序列和主汛期降雨径流序列进行训练,分别得到流域不同时间尺度下基于遗传算法和粒子群算法的参数优选结果(表3)。其中,核函数参数γ在本文应用的libsvm -3.1 -FarutoUltimate中用字母g代替。

表3 不同时间尺度遗传算法和粒子群算法的优选参数值

在两组优选参数的条件下,通过模型的训练和检测,分别得到年降雨径流序列、汛期降雨径流序列和主汛期降雨径流序列的SVM模拟结果(图3)。由图3中可以看出,三个时间尺度的训练期和验证期径流模拟效果都比较好,由遗传算法和粒子群算法优化得到的参数可以提高支持向量机模型模拟精度和泛化能力。

图3 训练期和验证期径流模拟结果

2.2.2 模拟效果评价

对不同时间尺度的降雨径流序列训练和检测值的模拟效果进行评价,模拟效果见表4。由表4可以看出,在遗传算法对年降雨径流序列的训练结果中,除了3个数据的相对误差超过20%外,其他均低于20%,其中在10%以内的有11个,占所有数据的61%。检测结果中,相对误差均在10%以内,其中5%以内的有3个,占所有数据的60%。粒子群算法的训练结果中,相对误差超过20%有4个,在10%以内的有10个。检测结果中,相对误差也都在10%以内,其中5%以内的有4个,占检测数据的80%。在中长期模拟预测的标准下,两者效果都相对准确。考虑到SVM模型特点,在精确度相当的情况下,参数C和ε越小,模型泛化能力越好,所以,从这个层面来说,粒子群算法优选的参数要比遗传算法更好,这从两者各自的模拟值和实测值的对比图中可以进一步看出,粒子群算法优选的参数模型的逼近效果相对来说更好一些。对汛期和主汛期降雨径流序列训练和检测值的模拟效果不再赘述,就预测的稳定性来说,在汛期和主汛期径流的模拟预测问题上,遗传算法优选出的参数模拟预测效果更好。总之,在中长期模拟预测的标准下,两种方法优选出的参数的模拟效果都是相对准确的。由此可知,基于遗传算法或粒子群算法优选参数构建的SVM模型,对柳江不同时间尺度降雨径流序列模拟都是可行的。

表4 不同时间尺度基于不同算法的SVM模拟效果

支持向量机可以利用有限的数据得到最优解,克服了传统的回归分析方法精度不高和人工神经网络方法易陷入局部极小、不稳定的缺点,在柳江流域模拟中,通过遗传算法和粒子群算法优选参数,模拟结果拟合效果比较好,精度可行。通过遗传算法和粒子群算法在不同时间尺度上的应用对比,流域年径流量的模拟中,粒子群算法优选的参数得到的SVM模型泛化能力更好;汛期径流和主汛期径流的模拟中,遗传算法优选的参数得到的SVM模型更平稳一些。两种算法优选的参数在柳江流域上都是适用的,无论是在年、汛期或者主汛期尺度的降雨径流模拟中均可以得到较好的效果。因此,在一些缺乏资料的地区,可以尝试采用支持向量机,利用遗传算法或粒子群优化算法,以降雨为输入项,推求相应的径流量,为流域防灾减灾及综合管理提供支撑。

3 结 语

本文通过收集了柳江流域的24个气象站点降雨数据和重要水文站流量数据,采用Pearson相关系数法和Spearman相关系数法对年降雨量和年径流深、汛期降雨量和汛期径流深、枯水期降雨量和枯水期径流深、主汛期降雨量和主汛期径流深进行相关性分析。并利用支持向量机模型开展多时间尺度下的流域降雨径流模拟研究,基于遗传算法和粒子群算法两种优化算法优选参数,对比不同时间尺度降雨径流模拟结果。结果表明:

(1)通过两种方法得出的相关系数中,年降雨量和年径流深、汛期降雨量和汛期径流深、主汛期降雨量和主汛期径流深表示的相关性基本一致,都有明显的相关性,通过了99%的显著性水平检验。降雨量和径流深的相关性在主汛期最高,汛期次之,枯水期最差。主汛期径流受降雨控制最为严重,两者之间相关性最为密切,而枯水期降雨径流的相关性表现微弱,这主要与枯水期径流多依靠水利工程的补水调节作用有关。

(2)支持向量机模型在柳江流域的年径流量、汛期径流量和主汛期径流量的模拟中,通过遗传算法和粒子群算法优选参数有效提高模型预测精度和泛化能力,两种方法优选出的参数的模拟效果都是相对准确的。在柳江流域年径流量的模拟中,粒子群算法优选的参数得到的SVM模型泛化能力更好,而在汛期径流和主汛期径流的模拟中,遗传算法优选的参数得到的SVM模型更平稳一些。两种算法优选的参数在柳江流域都是适用的。

[1] 胡浩云, 王 锋, 李宗华,等. 不同时段气候变化对径流的影响研究——以漳河上游浊漳干流流域为例[J]. 中国农村水利水电, 2015,(8):102-104.

[2] 苏念良, 马文进, 蔡文彦, 等. 窟野河水文特性分析[J]. 水资源与水工程学报, 2007,18(2):65-68.

[3] 杨贵羽, 周祖昊, 秦大庸, 等. 三川河降水径流演变规律及其动因分析[J]. 人民黄河, 2007,29(2):42-44.

[4] 孙天青. 秃尾河流域径流变化规律及预测研究[D]. 陕西杨凌:西北农林科技大学, 2010.

[5] 张兰影, 庞 博, 徐宗学, 等. 基于支持向量机的石羊河流域径流模拟适用性评价[J]. 干旱区资源与环境, 2013,27(7):113-118.

[6] 孙传文, 钟平安, 万新宇, 等. 考虑季节因子的支持向量机径流预测模型[J]. 中国农村水利水电, 2014,(4):101-104.

[7] Zhou C, Yin K, Cao Y, et al. Application of time series analysis and PSO-SVM model in predicting the Bazimen landslide in the Three Gorges Reservoir, China[J]. Engineering Geology, 2016,204:108-120.

[8] 汪丽娜, 李粤安, 陈晓宏. 基于支持向量机的降雨-径流预测研究[J]. 水文, 2009,29(1):13-16.

[9] Chen Y B, Li J, Xu H. Improving flood forecasting capability of physically based distributed hydrological model by parameter optimization[J]. Hydrology & Earth System Sciences Discussions, 2016,12(10):10 603-10 649.

[10] 朱雪梅. 柳江流域“2010.6”暴雨洪水特性分析[J]. 广西水利水电, 2010,(6): 21-24.

[11] 贾显锋, 丁治英, 刘国忠. 柳江致洪暴雨及其影响系统统计特征分析[C]∥ 广西气象学会学术年会,2006:14-17.

[12] 丁 红, 吴德敏, 荣杰. BP神经网络在柳江径流预测中的应用[J]. 广西科技大学学报, 2013,24(3):78-83.

[13] 王建芳, 包世泰. 柳江流域防洪减灾综合对策[J]. 广西师范学院学报(自然科学版), 2002,19(3):52-56.

[14] 卢 敏, 张展羽, 冯宝平. 支持向量机在径流预报中的应用探讨[J]. 人民长江, 2005,36(8):38-39.

[15] 李 佳, 王 黎, 马光文, 等. LS-SVM在径流预测中的应用[J]. 中国农村水利水电, 2008,(5):8-10.

[16] 姜成玉. 基于支持向量机的时间序列预测[D]. 辽宁大连:辽宁师范大学, 2010.

[17] 代兴兰. 遗传算法与最小二乘支持向量机在年径流预测中的应用[J]. 水资源与水工程学报, 2014,(6):231-235.

[18] 陈顺财. 基于支持向量机的时间序列预测研究[D]. 兰州:兰州理工大学, 2008.

[19] 杨易华, 罗伟伟. 基于KPCA-PSO-SVM的径流预测研究[J]. 人民长江, 2017,48(3):44-47.

猜你喜欢
柳江降雨量径流
格陵兰岛积雪区地表径流增加研究
基于SWAT模型的布尔哈通河流域径流模拟研究
来安县水旱灾害分析与防灾措施探讨
德州市多年降雨特征分析
降雨量与面积的关系
雅鲁藏布江河川径流变化的季节性规律探索
柳江水域疍民的历史往事
近40年来蒲河流域径流变化及影响因素分析
降雨量
“编读零距离”柳州、柳江见面会散记