姬战生 章国稳 黄薇
摘要 针对平原河网地区河道水位预报的不确定性特征,以京杭运河代表站拱宸桥站为例,提出了一种基于在线支持向量机的河道水位预报方法。根据拱宸桥站河道水位影响因子,选取京杭运河2008—2013年11场典型洪水过程的1 500组水文数据作为样本,分别构建了固定式、在线增量式和在线剔除式SVM水位预测模型。定性定量比较了不同预见期下3种模型的预测数据,结果表明在线剔除式SVM模型的预报精度要高于其他2种模型。该方法可为研究平原河网地区河道水位过程实时预报提供参考。
关键词 支持向量机;在线剔除式;平原河网地区;水位过程预报
中图分类号 TV 124 文獻标识码 A 文章编号 0517-6611(2021)14-0191-05
Abstract Due to the uncertainty characteristics of forecasting river water level of plain river network, this paper took the representative station Gongchenqiao Station of Jinghang Canal as an examples and proposed a forecasting method of river water level based on online support vector machines(SVM). According to the influencing factors of the water level at Gongchenqiao Station, 1 500 sets of hydrological data from 11 typical flood processes on the Jinghang Canal from 2008 to 2013 were selected as samples and fixed, online incremental and online elimination SVM water level prediction models were constructed. The forecast data of the three models under different forecast periods were qualitatively and quantitatively compared. The results showed that the prediction accuracy of the online elimination SVM model was higher than that of the other two models. This method could provide references for studying the realtime prediction of the water level process in the plain river network.
Key words Support vector machines;Online elimination;Plain river network regions;Water level process forecasting
基金项目 国家自然科学基金项目(51705114);浙江省自然科学基金项目(LQ16E080009);浙江省教育厅一般科研资助项目(Y201430581);杭州市科技发展计划项目(20191203B72);浙江省水利科技计划项目(RC1807,RC1901)。
作者简介 姬战生(1980—),男,河南洛阳人,高级工程师,硕士,从事水文预报和钱塘江涌潮预报研究。
收稿日期 2020-10-28
平原河网地区多为经济发达地区,城市化速度较快,导致降水汇流时间减少、洪峰出现时间提早、洪峰流量变大,使原有的河道防洪能力已不能满足要求,洪涝灾害问题愈加突出[1]。水文预报是流域防洪减灾的基础,是防洪决策的主要依据,及时、准确、可靠的洪水预报可对平原河网地区防洪排涝带来巨大的经济效益和社会效益。笔者探究适用于平原河网地区的河道水位过程实时预报方法,为区域防灾减灾提供科学决策依据,促进经济社会的健康发展。
目前,平原河网地区河道水位预报方法主要包括经验分析法和水文模型法。经验分析法主要依据历史资料建立经验预报模型进行水位预测,但无法充分考虑河道变化、人类活动等因素对水位的影响,存在预报精度不高、预见期短等问题,且一般只能预报洪峰水位,不宜用于预报水位过程。水文模型法是将复杂的水文过程概化,用近似的数值模型模拟的科学方法。随着人们研究的不断深入,全世界诞生了很多概念性水文模型、分布式水文模型,但这些概化模型并不能真正代表实际的水文过程[2],尚无法用理论模型精确描述水文过程的所有影响因素,其水文预报的精度有待进一步提高[3-5]。
随着人工智能等新一代技术的迅速发展,水文预报方法得到了进一步丰富。目前使用较多的人工智能算法有神经网络、支持向量机(SVM)等。但神经网络在实际应用时存在收敛速度慢、泛化能力差等问题,往往无法达到模拟精度要求[6-9]。支持向量机是近年来提出的一种全新的机器学习方法,因其优越的学习能力、很强的泛化能力,有效解决了其他方法所不能解决的小样本问题,在河道水位预报方面得到了越来越多的应用[10-14]。但是,不同的降雨过程存在不同的特性,并且随着时间的推进,流域的水文、气象、地理等条件也在不断变化,如果采用固定式支持向量机模型对水位进行预测,随着时间的推进其预测效果会不断变差。笔者以京杭运河代表站拱宸桥站为例,采用在线式支持向量机递推预测河道水位过程。根据拱宸桥站水位影响因子选取样本数据,构建拱宸桥站在线支持向量机水位预测模型,解决平原河网地区河道水位过程实时预报问题。
1 研究区域
京杭运河杭州段是贯穿杭州城区的一条人工河,自三堡排涝泵站起,往西经中山北路大桥后向北流,其间汇入东河、中河、余杭塘河、西湖等来水,经左家桥汇入运河。杭州市境内长度31 km,流域面积766 km2。
京杭运河流域范围内设有拱宸桥、塘栖、临平下3个国家基本水位站,常年观测河道水位,附近的长系列国家基本雨量站有拱宸桥、闸口、七堡。以上测站观测年限长,资料均经水文部门逐年整编,精度可靠,可用于计算分析。拱宸桥水位站设立于1929年,连续资料系列达68年,观测项目有水位、降水量、水温、地下水位等。主要测站基本情况见表1,研究范围和测站位置见图1。
2 支持向量机
2.1 支持向量回归机
支持向量回归机首先通过非线性映射将输入数据转换到高维特征空间进行线性表示,接着在高维空间中完成线性回归。对训练样本( xi,yi)进行线性拟合如下:
核函数和损失函数的参数 ε 是支持向量回归机中影响预报效果的2个主要因素。目前支持向量机中常用的核函数有RBF、线性、多项式及Sigmoid[15],不同的核函数预测能力不同。损失函数的参数 ε 用于描述训练中的回归误差, ε 越大则拟合误差越大,支持向量越少,反之拟合精度越高,但有可能会出现过拟合问题,影响模型泛化能力。
2.2 SVM在线式学习算法
目前支持向量机以固定式学习算法为主,即采用固定训练样本得到预测模型。如果可以在预测过程中利用新的实测样本及时更新预测模型,即采用在线式学习算法,预测精度会有明显提高。
2.2.1 在线增量式学习算法。
当训练样本逐个增加时,适合采用在线增量式学习算法。对于在线增量式学习算法,训练样本随着时间的推进而不断增加,即在训练过程中不断增加新样本,用于更新预测模型,直到最后一次更新包含了所有样本,其算法流程如图2所示。该算法充分利用了最新的实测数据及时更新预测模型,降低了固定式学习算法的计算复杂性,提高了模型的预测精度。
2.2.2 在线剔除式学习算法。
区别于在线增量式学习算法,在线剔除式学习算法的训练样本是窗口式移动的,即在增加新样本的同时会剔除一个旧样本,训练样本的个数始终保持不变,其算法流程见图3。该算法能及时学习系统的新特性,降低相关性较差的旧样本对计算精度的影响,且能降低模型的计算负担,提高计算效率,以保证预报模型具有较强的实时性。
3 实例分析
3.1 影响因子选择
预测模型影响因子的选择很大程度决定了模型预报精度。根据各影响因素对拱宸桥站的影响特性,确定影响因子如下。
3.1.1 起涨水位。即预测时刻拱宸桥站的水位,直接影响未来时刻水位。
3.1.2 附近河网水位。拱宸桥站同一流域的运河干流附近水位和支流代表站水位反映了整个运河河网水位的变化,间接体现了运河河网内小型闸泵水量交换的结果。将运河干流拱宸桥附近的塘栖水位和河网内代表支流禾丰港临平下水位作为2个影響因素。
3.1.3 降水量。降水是引起河道水位变化的一个关键因素,将拱宸桥雨量、闸口雨量、七堡雨量、塘栖雨量作为4个影响因素。
综上所述,采用拱宸桥雨量、闸口雨量、七堡雨量、塘栖雨量、拱宸桥起涨水位、临平下水位和塘栖水位作为影响因子输入到预测模型中,输出为拱宸桥水位。
3.2 样本构建
根据拱宸桥站河道水位影响因子,选取京杭运河2008—2013年11场典型洪水过程的水文数据,包括各国家基本雨量站(拱宸桥、闸口、七堡、塘栖)降雨量及各国家基本水位站(拱宸桥、临平下、塘栖)水位,共计1 500组数据作为样本。将样本数据划分为1 000组训练样本和500组验证样本,前者用于模型构建,后者用于评估模型预测能力。
不同特征量的量纲不同且数值差异较大,不利于模型参数的优化,因此在分析前通常需要将特征集的数据预处理,使得所有特征量处于同一数量级。采用常用归一化方法对样本数据进行处理:
3.3 参数优选
模型对训练样本自身的拟合好坏不代表其预测能力、泛化能力,模型的参数和核函数的选择对预测结果影响较大。
以算法精度、计算效率为判定指标,经过多次试验发现,模型核函数选择线性函数、损失函数参数 ε 取0.1时具有较好的预测结果,因此该研究建模采用上述核函数及参数 ε 。
3.4 模型输出对比
结合拱宸桥站训练样本数据,分别构建固定式(样本始终保持不变)、在线增量式和在线剔除式SVM模型。选取不同的预见期(1、3、6、12 h),将500组预测样本分别输入到3种模型中,得到各模型输出的河道水位,将其与拱宸桥站实测水位数据进行对比,结果见图4~7。
从图4~7可以看出,在不同预见期下,与固定式SVM模型相比,在线增量式和在线剔除式SVM模型具有较为明显的优势,预测效果更好。同时,预见期的选择对模型预测结果也会产生较大的影响,预见期越长,模型对样本拟合的越差。
根据《水文情报预报规范》(GB/T 22482—2008)相关规定,结合实际应用经验,水位预报许可误差取0.16 m。统计不同预见期下3种模型的预测成果,与实测数据进行对比,计算不同模型的绝对误差均值、确定性系数DC和预报合格率QR。不同预见期下3种模型精度的对比见表2。
由表2可知,不同预见期下,模型绝对误差均值从小到大依次为在线剔除式、在线增量式、固定式SVM模型。从确定性系数来看,不同预见期下固定式SVM模型的确定性系数均小于0.5,而在线增量式SVM模型预报精度均达到乙级标准,在线剔除式SVM模型在预见期为1和3 h时已达到甲级精度,预见期为6和12 h时也达到乙级精度。从预报合格率来看,不同预见期下,固定式SVM模型在预见期为1和6 h时达到甲级精度,预期期为3和12 h时达到乙级精度,而在线增量式和在线剔除式SVM模型预报精度均达到甲级标准。综合绝对误差均值、确定性系数和预报合格率,在线增量式、在线剔除式SVM模型预报精度均高于固定式SVM模型,其原因是固定式SVM模型未考虑降雨和下垫面时空异质性的影响,样本数据始终保持不变,随着时间的推进,预测结果会不断变差;在线剔除式较在线增量式SVM模型具有更高的精度,其原因是在线剔除式SVM模型在学习过程中会不断剔除相关性较差的旧样本,保留与当前预报点相关性较高的新样本,通过迅速训练、滚动预报的方式不断提高模型的预报精度。
4 结论
在前人研究的基础上,笔者提出了一种基于在线SVM的河道水位预报方法。采用京杭运河代表站拱宸桥站相关水文数据,分别构建了固定式、在线增量式、在线剔除式SVM水位预测模型。对比不同预见期下3种模型的预测数据,结果表明在线剔除式SVM模型具有更高的预报精度,为平原河网地区的河道水位过程实时预报提供了一种解决思路。
参考文献
[1] 方正杰.感潮河口城市防洪计算方法研究[D].南京:河海大学,2005.
[2] 陈仁升,康尔泗,杨建平,等.水文模型研究综述[J].中国沙漠,2003,23(3):221-229.
[3] MCCUEN R H.A guide to hydrologic analysis using SCS methods[M].New York:PrenticeHall,Englewood Cliffs,1982.
[4] 张小琴,包为民,梁文清,等.考虑区间入流的双向波水位演算模型研究[J].水力发电,2009,35(6):8-11.
[5]黃薇,张欣,孙映宏,等.无调控小水库群对寿昌江流域洪水预报的影响[J].水电能源科学,2019,37(6):51-53.
[6] 蔡煜东,姚林声.径流长期预报的人工神经网络方法[J].水科学进展,1995,6(1):61-65.
[7] SONG X M,KONG F Z,ZHAN C S,et al.Hybrid optimization rainfallrunoff simulation based on Xinanjiang model and artificial neural network[J].Journal of hydrologic engineering,2012,17(9):1033-1041.
[8] 王日莲,董曼玲.人工神经网络在水文预报中的应用[J].水利水电科技进展,2002,22(5):33-34,37.
[9] 鞠琴.基于人工神经网络的水文模拟研究[D].南京:河海大学,2005.
[10] 丁海蛟.基于LS-SVM的河道洪水预报研究[D].昆明:昆明理工大学,2016.
[11] 刘艳伟.支持向量机方法在感潮河段洪峰水位预报中的应用[D].杭州:浙江大学,2010.
[12] SUYKENS J A K,VANDEWALLE J.Least squares support vector machine classifiers[J].Neural processing letters,1999,9(3):293-300.
[13] 张俊,程春田,申建建,等.基于蚁群算法的支持向量机中长期水文预报模型[J].水力发电学报,2010,29(6):34-40.
[14] 丁海蛟,车文刚.最小二乘支持向量机在洪水预报中的应用[J].安徽农业科学,2015,43(23):350-353.
[15] LIU L J,SHEN B,WANG X.Research on kernel function of support vector machine[M]//HUANG Y M,CHAO H C,DENG D J,et al.Advanced technologies,embedded and multimedia for humancentric computing.Netherlands:Springer,2014:827-834.