赵文刚 刘晓群 宋雯 石林 马考义
摘要:为建立因子少、预报周期短、预报精度高的西洞庭湖控制性水文站南咀站的月平均径流量预报模型,通过对松滋-太平水系控制性水文站安乡、澧水控制性水文站石龟山站月平均水位、流量以及沙湾站月平均水位进行相关性、因子贡献率分析,确定输入因子,借助PSO-BP神经网络对南咀站1956年1月至2005年12月各月平均径流量进行训练,获取网络结构及参数进而预测2006年1月至2008年12月各月径流量。结果表明:①石龟山、安乡站水位对南咀站月平均径流量影响最显著;②汛期、非汛期的划分一定程度上可提高南咀站月平均径流量预报精度;③以安乡、石龟山站月平均水位、流量以及沙湾站月平均水位作为输入因子,PSO-BP神经网络预报效果最好,合格率77.8%,预报等级为乙级;④基于相关性、因子贡献率分析,将安乡、石龟山站作为输入因子,预报合格率降为61.1%,预报等级降为丙级,但仍满足预报要求。
关键词:径流预报;因子贡献率;PSO-BP神经网络;西洞庭湖
中图法分类号:P33
文献标志码:A
DOI:10.16232/j.enki.1001-4179.2019.03.022
河道径流量的预测、预报作为河道防洪、水资源管理以及水环境与水生态演变规律探讨的重要依据与关键因素,具有重要的现实意义。目前,常见河道径流量预测主要集中在基于数理统计的回归分析、SWAT模型、水量平衡模型、类比合成法、神经网络、支持向量机等方法,但缺乏通用、有效的方法,各预测方法均存在不同问题。水量平衡模型对基础资料要求较高,模型演算过程中未考虑人类活动影响,使其在实践中难以推广;SWAT模型需要输入研究区域土壤类型、地形等资料,地形随时间发生变化,参数难以确定,进而影响模拟精度;传统的回归分析法在径流受到人为蓄、泄水影响下,无法进行还原计算;类比合成法假设时间序列中典型模式不断重复,通过选择若千个与已知参考模式相近的模式并利用其延拓来建立参考模式的一个预测,其模式选择对模拟精度起决定性影响神经网络、支持向量机等方法在保证模拟精度的情况下,缺乏明确的物理意义。但是,对于短期的径流预报(特别是洪水期间),神经网络由于因子少、预报周期短、预报精度可靠,此方法比较适用。神经网络方法涵盖BP,Elman,RBF,GRNN等。Elman算法网络泛化能力差;RBF算法易陷入局部最大值;传统BP神经网络学习收敛速度慢,易限入局部极值。而PSO算法具有实现容易、精度高、收敛快优点。
本次研究是为了寻求因子少、预报周期短、预报精度可靠的方法,采用PSO算法优化传统BP神经网络,通过相关性分析、因子贡献率分析,避免利用传统试错法确定输入因子,在保证预测精度下降不显著的情况下,寻找最少输入因子,建立南咀站月径流量预测的优化模型,进而为南咀站及西洞庭湖区防洪、水资源调度提供参考。
1 研究概况
1.1 研究区域
西洞庭湖位于常德市以东,涵盖目平湖、七里湖、珊泊湖等湖泊,總面积443.0km2,耕地面积22.3km2,总人口304万,是全国重要的商品粮基地。湖区堤垸多、地势平坦、河床较高且河流众多,大小河流432条,洞庭湖流域四大水系中的沅水、澧水流经,长江入洞庭的松滋、太平、藕池三口部分汇入,导致其极易受到洪水威胁。自20世纪90年代以来,连续在
1995,1996,1998,1999年发生特大洪涝灾害。研究区具体位置如图1所示。
1.2 气候特征
研究区域年平均气温16.79C,年降水量1200~1900mm,无霜期272d,适宜水稻、棉花、油料等作物生长。受地形影响,该地气候呈现非地带规律。西部山区东部比西部略低,石门东山峰农场年平均气温9.2C,而石门等澧水河谷地带年平均气温16.8C。中部丘陵区、太浮山与太阳山对峙形成向北敞开的簸箕形盆地,致使临澧桃源一带冬季易受冷空气袭击。
2 数据来源
本次研究选取西洞庭湖区控制性水文站点南咀站作为预测站点,选取澧水控制性水文站点石龟山站、松滋-太平水系控制性水文站点安乡站和目平湖控制性站点沙湾站作为输入站点。依托长江水利委员会荆江水文水资源勘测局湖南省水文局获取了1956~2008年石龟山站(月平均流量、月平均水位)、安乡站(月平均水位、月平均流量)、沙湾站(月平均水位)、南咀站(月平均流量)的水文资料。其中,缺测数据通过对邻近数据多元回归进行插值补齐。具体水文站点分布见图1。
3 研究方法
3.1 长时间序列径流突变与趋势分析
利用M-K趋势检验和M-K突变检验对南咀站点月平均流量序列进行趋势性分析以及时间变异性研究。
3.2 相关性及贡献率分析方法
利用非线性相关系数法研究变量间的相关性,经相关性分析后,对较强相关性的变量因子采用累积量斜率变化率比较法分析其对月平均径流量变化的贡献率。综合二者分析结果,确定PSO-BP模型输入因子对月平均径流量预测。
其中,累积量斜率变化率比较法假设物理量(各因子、预测值)累积值与年份呈线性关系,因拐点存在斜率分为前后两个时期,即K,K:,K,Ke,则因子对预测值的贡献率C;为
公式
3.3 PSO-BP算法
BP神经网络是基于误差反向传播算法的多层前向神经网络。PSO算法即粒子群算法,基于鸟类群体协作机制规律提出的智能全局优化算法122。PSO-BP神经网络是通过粒子群算法优化BP的算法。其主要过程为:①确定BP神经网络拓扑结构,即隐含层、神经元个数、模型精度、迭代次数等参数;②确定权值阈值规模;③引入PSO算法初始化权值、阈值,计算适应度,确定最优权值、阈值;④优化权值、阈值代入BP训练、预测。
3.4 评价方法
为考察算法预测的有效性和精确度,选取6项误差作为评价指标,分别为均方根误差(RMSE)、平均绝对误差(MAE)、平均相对误差(ARE)、决定系数(R?)以及《中华人民共和国国家标准-水文情报预报规范》(GBT22482-2008)规定的流量预报合格率、预报等级。
4 资料分析与模型预测
4.1 趋势性与变异性分析
西洞庭湖控制性站点南咀站1956~2008年平均流量、突变情况如图2~3所示。图2(a)为月径流量序列,其平均值为2032.6m'/s,变异系数0.8,属于中等强度变异,月平均径流量在年内变化幅度较大,以1996,1998,1999年年内变化幅度最为剧烈。从图3(a)M-K突变分析及趋势性发现,月径流量呈0.3m/s减少趋势,突变主要发生在2个时期:1960年5月至1963年11月、1971年4月至1986年12月。
以年平均径流序列(图2(b)、图3(b))为研究对象,其均值为24391m'/s,变异系数0.1,总体走势平稳,呈50.6m'/(s·a)减小,但2006年变化幅度较大;年径流在1976,1978,1984,1988,1990,1997,1999年发生突变。
综合图2~3不难发现,径流序列的变化主要是由流量年内分配不均造成的;年、月径流量突变均发生在2003年以前,主要受河道自身调整影响,导致径流量发生突变;除2006年长江流域发生大面积、长时间干旱导致南咀站年流量大幅减少之外,2003年后未发现显著的月径流突变点,因此三峡水利工程的运行对南咀站径流无显著性影响,径流预测模型建立时1956~2008径流序列可以作为长序列训练(23]
4.2 月平均径流量预测因子分析
基于上述月平均径流量趋势性和突变分析可知,月径流系列在年内分布具有很大的差异性。为探讨其產生的原因,将安乡站月平均流量、水位,石龟山站月平均流量、水位,沙湾站月平均水位分别与南咀站月径流量系列进行相关性分析,结果如表1所示。从表1中可以看出,各站点水位、流量与南咀站月平均流量相关系数均大于0.8,均具有较好的相关性,且安乡站月平均水位与南咀站月平均流量相关性>石龟山站月平均水位与南咀站月平均流量相关性>安乡站月平均流量与南咀站月平均流量相关性>石龟山站月平均流量与南咀站月平均流量相关性>沙湾站月平均水位与南咀站月平均流量相关性。其中,同一站点情况下,水位相关性大于流量相关性,这可能一方面因为水位、流量同一变化幅度下,水位变化对南咀站流量影响更大;另一方面,水位从上游安乡、石龟山到下游南咀站受地形等因素影响存在楔形,导致水位差增大,进而增大了对流量的影响。
通过相关性分析,不难看出,各站点水位、流量与南咀站的流量具有较好的相关性,为进一步分析南咀站月平均径流量变化的影响因素,分别对各站点做累
积距平分析(图4)。从图4中可以看出,除沙湾站水位累积距平值呈先减小后增大再减小的趋势,其他站点与南咀站流量累积距平值基本大于0,趋势吻合度高,且均呈先增大后减小趋势,特别是沙湾站水位、石嘴山站流量局部变化趋势与南咀站流量变化趋势一致。各站点流量、水位累积值随年、月份增加呈增大趋势,除石龟山站流量、水位、安乡站水位累积线随时间有明显的变化外(图5),其余累积线均随时间无明显变化。
根据南咀站流量距平波动情况,将南咀站流量、其他站点水位、流量累积值序列随年-月变化分成5个时段:1956年1月至1958年11月,1959年12月至1962年5月,1962年6月至1991年8月,1991年9月至2006年5月,2006年6月至2008年12月,进行线性拟合,获取其斜率(表2)。从表2可以看出:B与A时段相比,南咀站月平均流量的累积线斜率减小395.9m/s,减小率17.9%。同时段相比,安乡站月平均流量累积线斜率减小14.5m'/s,减小率1.0%,对南咀站流量减小的贡献率为5.6%;安乡站月平均水位累积线斜率减小0.4m/月,减小率1.2%,对南咀站流量减小的贡献率为6.9%;石龟山站月平均流量累积线斜率减小38.5m'/s,减小率3.7%,对南咀站流量减小的贡献率为20.5%;石龟山站月平均水位累积线斜率增加0.1m/月,增加率0.3%,对南咀站流量减小的贡献率为-1.7%;沙湾站月平均水位累积线斜率减小0.2m/月,减小率0.7%,对南咀站流量减小的贡献率为3.7%。B与A时段相比,石龟山站月平均流量对南咀站月平均流量变化影响最大;C与A时段相比,安乡站月平均水位贡献率为32.8%,影响最大;D与A时段相比,石龟山站月平均水位对南咀站月平均流量影响显著;E与A时段相比,安乡站月平均水位贡献率最大;C与B时段相比,石龟山站月平均流量影响最大;D与B时段相比,石龟山站月平均水位影响最大;E与B时段相比,安乡站月平均水位影响最大;D与C时段相比,石龟山站月平均水位贡献最大;E与C时段相比,安乡站月平均水位贡献最大;E与D时段相比,安乡站月平均水位贡献最大。
综合相关性分析、贡献率分析,不难看出南咀站月平均流量主要受安乡站月平均水位、石龟山站月平均水位影响。
4.3 模型建立
综合考虑南咀站月平均流量年内分配不均现状、湖南省汛期持续时间以及安乡、石龟山、沙湾站相关性,设置4种输入模式:①安乡、石龟山、沙湾站水位、流量5因子(5x);②划分汛期、枯水期安乡、石龟山、沙湾站水位、流量5因子(5x+2t);③安乡、石龟山水位2因子(2x);④划分汛期、枯水期安乡、石龟山水位2因子(2x+2t)。网络结构分别采用:5x5x1,5x5x1,2x5x1,2x5x1,迭代次数100次,种群规模30,学习因子1.49,利用1956年1月至2005年12月数据进行网络训练,获得网络模型参数,然后利用2006年1月至2008年12月数据进行网络测试,建立预测模型,预测结果如图6所示,整理分析得到模型预测误差的主要特征,见表3。
4.4 结果分析
图6中可以看出4种输入模式预测效果差异不大,主要预测误差均出现月径流量的极值点。从预测统计值分析,将安乡站月平均径流量、月平均水位、石龟山月平均流量、月平均水位、沙湾站平均水位作为输入变量预测南咀站月平均径流,平均绝对误差196.2m'/s,平均相对误差18.2%,预报合格率61.1%,预报等级为丙级;考虑径流量年内分配不均,分汛期(4~9月)、非汛期期(1~3,10~12月)预测,平均绝对误差下降至161.3m3/s,平均相对误差减小至13.5%,预报合格率提升16.7%,预报等级提升为乙级,说明汛、非汛期划分,一定程度上能提高预测的精度,但效果有限。通过安乡站月平均径流量、月平均水位、石龟山月平均流量、月平均水位、沙湾站平均水位与南咀站月平均流量相关性、贡献分析,安乡站月平均水位、石龟山月平均水位作为输入变量预测南咀站月平均径流,一定程度上会降低南咀站预测精度:考虑汛、枯期预测的平均绝对误差200.9m'/s,增大39.6m3/s,增大24.6%,平均相对误差19.6%,增大6.1%,预报合格率减小16.7%,预报等级降为丙级;单一系列预测的平均绝对误差257.0m'/s,增大60.8m'/s,平均相对误差20.6%,增大2.4%,预报合格率减小13.9%,预报等级降为丙级。
5 结论
径流过程是比较复杂的随机过程,影响因子众多,但并非所有因子对径流变化起决定性作用。本研究通过相关性、因子贡献率分析,实现输入因子的降维过程,剔除冗余信息,在保证预测精度变化不大情况下,建立了月径流预测优化模型。通过该模型在南咀站径流预报中的应用及结果分析,得到以下初步结论。
(1) 南咀站月平均径流量主要受安乡、石龟山站月平均水位影响。
(2) 区分非汛期、汛期预报在一定程度上能提高预报精度。
(3) 区分非汛期、汛期安乡站月平均水位、流量、石龟山站月平均水位、流量以及沙湾站月平均水位作为输入因子的PSO-BP预测南咀站月平均流量精度最高,合格率高达77.8%,预报等级为乙级。
(4) 基于相关性、因子贡献率分析将输入因子降维,通过安乡、石龟山站月平均水位预测南咀站月平均流量,RMSE增大了39.6m3/s,ARE增大了6.1%,合格率降低16.7%,预报等级降为丙级,但仍满足预报精度。
PSO-BP算法在水文预报中的应用还涉及其它一些问题,如区间取排水、普适性等,还需要进一步研究。
参考文献:
[1]唐道来.水利工程建设与生态环境可持续发展的相关性[J].水利技术监督,2015,23(5):36-37.
[2]王福振.人工神经网络结合SWAT模型在河道径流量预测中的应用[J].水资源开发与管理,2017(8):67-70.
[3]刘勇,王银堂,陈元芳,等.丹江口水库秋汛期长期径流预报[J].水科学进展,2010,21(6):771-778.
[4]Toole G A,Singh A K,Piechota T C,et al. Long lead-time forecasting of US streamflow using partial least squares regression]J]. Journal of Hydrologic Engineering,2007,12(5):442-451.
[5]陈瑜彬,杨文发.基于水量平衡的月水资源量長期预测方案探讨[J].人民长江,2013,44(11):9-13.
[6]陈果,尚松浩,雷志栋.类比合成方法在干旱区内陆河径流量预报中的应用[J].干旱区地理,2004,27(3):287-292.
[7]席东洁,赵雪花,张永波,等.基于经验模态分解与Elman神经网络的月径流预测[J].中国农村水利水电,2017(7):112-115.
[8]黄巧玲,栗晓玲,杨家田.基于小波分解的日径流支持向量机回归
预测模型[J].西北农林科技大学学报:自然科学版,2016,44(4):211-217.
[9]杨易华,罗伟伟.基于KPCA-PSO-SVM的径流预测研究[J].人民长江,2017,48(3):44-47.
[10]聂敏,刘志辉,刘洋,等.基于PCA和BP神经网络的径流预测[J].中国沙漠,2016,36(4):1144-1152.
[11]李佳,王黎,马光文,等.LS-SVM在径流预测中的应用[J].中
国农村水利水电,2008(5):8-10.
[12]张秀玲,赵文保,李少清,等.基于人工蜂群算法的Elman网络板形预测[J].沈阳大学学报:自然科学版,2012,24(3):38-42.
[13]杨洁.基于GA优化的RBF网络算法[J].广西科学院学报,2013,29(4):262-264.
[14]吕艳.“后三峡时代”西洞庭湖防汛抗灾形势与对策[J].现代农业科技,2015(14):201-202.
[15]吴定宪.西洞庭湖区的洪灾成因及治理对策[J].中国防汛抗旱,2000(1):14-15.
[16]石林,曾光明,刘卡波,等.复杂河网平原地区的防洪调度决策一基于洪水灾害时空模拟的西洞庭湖冲柳地区案例研究[J].自然灾害学报,2010(2):28-31.
[17]高彦春,王金凤,封志明.白洋淀流城气温、降水和径流变化特征及其相互响应关系[J].中国生态农业学报,2017,25(4):467-477.
[18]韩敏,魏茹.基于相空间同步的多变量序列相关性分析及预测[J].系统工程与电子技术,2010,32(11):2426-2430.
[19]王隨继,闫云霞,颜明,等.皇甫川流城降水和人类活动对径流量变化的贡献率分析——累积量斜率变化率比较方法的提出及应用[J].地理学报,2012,67(3):388-397.
[20]柳烨,赵文刚,杨珮珮,等.基于湿度的ETO估算模型应用研究[J].灌溉排水学报,2016,35(2):35-39.
[21]金修鹏,李春生.PSO-BP神经网络在多输出水利定额编制中的应用[J].人民长江,2018,49(5):84-88.
[22]王小川.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.
[23]洪卫,廖鸿志.2006年长江流域抗旱的反思与对策[J].人民长江,2007,38(8):61-63.
引用本文:赵文刚,刘晓群,宋雯,石林,马孝义.基于PSO-BP神经网络的西洞庭湖南咀站径流预测[J].人民长江,2019,50(3):124-130.
Preliminary study on runoff forecast at Nanzui Station in West Dongting Lake based on PSO-BP neural network
ZHAO Wengang',LIU Xiaoqun',SONG Wen',SHI Lin',MA Xiaoyi73
(1. Hunan Water Resources and Hydropower Research Institute,Changsha 410007,China;2. College of Water Resources and Architectural Engineering,Northwest A&F University,Yangling 712100,China;3. Key Laboratory of Agricultural Soil and WaterEngineering in Arid and Semiarid Areas,Northwest A&F University,Yangling 712100,China)
Abstract: To establish a monthly average runoff forecast model for Nanzui station in West Dongting Lake with less factors,short forecast periods and high forecasting accuracy,we analyzed the relationship between the monthly average water level and runoff at Anxiang Station(Songzi-Taiping water system controlling hydrological station) and Shiguishan Station(Lishui Rivercontrolling hydrological station),and the monthly average water level at Shawan Station(Muping controlling hydrological station). Furthermore,the factor contribution rate to monthly average runoff was calculated and the input factor was determined ac-cording to the calculated correlation coefficients and factor contribution rates. Based on the above analysis,we used the PSO-BPneural network to train the average monthly runoff from 1956. 1 to 2005. 12 at Nanzui Station to obtain the network structure and parameters for forecasting monthly runoff from 2006. 1 to 2008. 12. The results showed that:①The water level of Shiguishan and Anxiang station had the most significant effect on the monthly average runoff of Nanzui station;②The division of non-flood and flood seasons could increase the forecast accuracy of the monthly average runoff of Nanzui Station to some extent;③Importing the variables,including the monthly average water level and runoff at Shiguishan station and Anxiang station,and the monthly aver-age water level at Shawan station,the PSO-BP neural network had the best forecast effect with 77.8% qualified rate and B fore-cast grade.④Importing the monthly average water level of Anxiang and Shiguishan stations and by correlation and factor contribution rate analysis,the forecasting qualified rate was reduced to 61.1%,and the forecasting level was degraded to C level,but the forecasting requirements were still met.
Key words:runoff prediction;factor contribution rate;PSO-BP neural network;West Dongting Lake