黄巧玲,粟晓玲,杨家田
(1 西北农林科技大学 水利与建筑工程学院,陕西 杨凌 712100;2 重庆大学 土木工程学院,重庆 400045)
基于小波分解的日径流支持向量机回归预测模型
黄巧玲1,粟晓玲1,杨家田2
(1 西北农林科技大学 水利与建筑工程学院,陕西 杨凌 712100;2 重庆大学 土木工程学院,重庆 400045)
[摘要]【目的】 将小波变换与支持向量机结合,构建小波支持向量机回归模型(WSVR),并用其对日径流进行预测,为水库调度提供参考依据。【方法】 利用径流时间序列中包含的大量信息,通过小波变换将径流时间序列分解成不同分辨率水平的子序列和近似序列,通过相关性分析选取有效子序列与近似序列相加得到的新序列作为支持向量机回归模型的输入,建立小波支持向量机回归耦合模型,以泾河流域张家山站的日径流为研究对象,利用均方根误差(RMSE)、平均绝对误差(MAE)、确定性系数(DC)、相关系数(R)及相对误差(RE)作为评价指标对模型预测精度进行评价。【结果】 利用所建立的小波日径流支持向量机模型对张家山站日径流的预测结果显示,该模型在检验阶段的RMSE、MAE、DC、R及RE分别为26.05 m3/s,8.26 m3/s,0.826,0.910,-13.3%,与仅使用支持向量机回归模型(SVR)相比,耦合模型预测精度明显提高,且非汛期预测效果优于汛期。【结论】 建立了小波支持向量机回归耦合模型,该模型可有效模拟和预测日径流,为日径流预测提供了新的途径。
[关键词]日径流预测;小波变换;支持向量机;张家山水文站
日径流预测对库容小、调节性能较弱的水库和径流式水电站的管理与运行具有重要的现实意义,是正确制定水库优化调度运行方式和水电站发电计划的重要依据,直接影响着水库的运行方式和效益发挥。径流预测方法大致分为2种类型:一类是基于影响径流大小的相关因素来预测,另一类是以历史径流序列资料为基础进行预测。近年来,人工神经网络在径流预测中的应用越来越多[1-4],神经网络具有很好的非线性逼近能力,但其存在易陷入局部最优、不易收敛、泛化能力低和预测精度难以保证等缺点。而Vapnik[5]根据VC维理论和结构风险最小原理提出的一种全新机器算法——支持向量机(简称SVM)具有很好的泛化性能,预测精度高。周秀平等[6]将支持向量机应用于西江流域梧州站的径流预测中,结果表明其预测精度要高于人工神经网络模型。卫太祥等[7]对支持向量机加以改进,提出了一种基于惩罚加权支持向量机回归的径流预测模型并应用于某水文站,与BP 神经网络和标准支持向量机模拟的结果相比,该模型预测精度更高。叶碎高等[8]利用微粒群(PSO)算法的全局寻优特性进行支持向量机(SVM)的参数辨识建立模型,以长江宜昌站为例,验证了该模型的有效性。王宏伟等[9]、于国荣等[10]也对支持向量机在径流预测中的应用进行了研究,均取得了比较好的结果。
由于日径流序列表现出较强的非线性、 强相关性和多时间尺度变化特性,所以利用单一的数学模型准确地进行日径流预测尚有一定的难度[11]。小波变换具有时频多分辨率功能,而且在时间域和频率域都具有表征信号局部特征的能力,是一种窗口大小不变而时间窗和频率窗都可以改变的分析方法,被誉为“数学显微镜”。利用小波变换对于获取复杂时间序列的变化规律以及分辨时间序列在不同时间尺度上的演变特征等是非常有效的[11-13]。因此,将小波变换与单一算法相结合建立耦合模型为时间序列预测提供了新思路。近年来,有人将小波变换和支持向量机结合应用于风速、轨道交通客流预测[14-15]等研究,取得较好结果。但尚未见其组合模型应用在日径流预测中的研究报道。本研究以泾河流域张家山水文站日径流序列为依据,将小波变换与支持向量机相结合对其日径流进行预测,并分析该预测方法的精确性,以期为日径流量的准确预测提供支持。
1研究方法
1.1小波变换
设f(t)是一个平方可积函数(即f(t)∈L2(R)),Ψ(t)为基本小波或母小波,则其连续小波变换为:
(1)
对于离散信号f(n·Δt),离散小波可变换为:
(2)
式中:Δt为采样时间间隔,n为样本序列数,N为样本总数。当a较小时(高频部分),对频域的分辨率低,对时域的分辨率高;当a增大时(低频部分),对频域的分辨率高,对时域的分辨率低。
在实际分析计算中,一般的时间序列是离散的。对于原始时间序列c0,可以使用Mallat算法[16],它是在多分辨分析基础上提出的一种快速小波变换方法,包括分解算法和重构算法两部分。
Mallat小波快速分解算法为:
(3)
Mallat重构算法为:
cj=Hcj+1+Gdj+1,j=J-1,J-2,…,0。
(4)
式中:H为低通滤波器,G为高通滤波器,J为尺度数;c0通过式(3)可以将其分解为d1,d2,…,dJ和cJ,其中cJ和dj分别称为原始序列的低频部分(近似部分)和高频部分(细节部分)。
1.2支持向量机回归算法
支持向量机(SVR)回归问题实际上是一个函数拟合问题,其基本思想是用一个非线性函数将原样本空间中的非线性回归问题转化为高维特征空间中的线性回归问题。对于给定样本训练集{(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn)}(其中xi为输入向量,yi为实际值)的线性回归问题,设SVR函数为:
f(x)=wφ(x)+B。
(5)
式中:φ(x)为非线性函数,w为权值向量,B为偏置。
根据结构风险最小化原理,函数估计问题可通过最小化风险函数来求得,即:
(6)
(7)
式中:‖w‖2为描述函数,反映模型的复杂度;lε(yi-f(xi))为不敏感损失函数,反映训练误差的经验风险;ε为不敏感损失系数,当实际值与预测值之间的误差不超过ε,则误差为0;C为误差惩罚因子,是常数,C>0表示对超出误差ε的样本的惩罚程度,用于控制模型复杂度和逼近误差的折中。
考虑允许的拟合误差,引入2个松弛变量ξ和ξ*,则式(6)可改写为:
(8)
(9)
(10)
再利用Karush-Kuhn-Tucker(KKT)条件求得偏置B,最后代入原方程得支持向量机回归方程为:
(11)
式中:K(x,xi)为核函数,其值等于向量xi在特征空间中φ(x)和φ(xi)的内积。
核函数必须满足Mercer条件,目前常用的核函数有径向基函数、多项式核函数、线性函数等。本研究选用比较通用的径向基函数(RBF)作为核函数,径向基函数的表达式为:
(12)
式中:σ为核参数,表示核函数的宽度。
1.3基于小波分解的支持向量机预测模型(WSVR)
日径流序列内不同的周期成分所包含的有效信息能大大提高径流预测的精度。对原始径流时间序列,基于小波分解的支持向量机预测模型的建立主要分为以下三步:(1)用小波变换将原始日径流序列分解并重构成不同频率的子序列(dS)和近似序列(c);(2)通过对原始径流序列与各子序列的相关性分析,剔除与原始序列相关性不好的无效子序列,选取有效序列并将其与近似序列相加得到新序列;(3)将新序列的径流数据作为输入,建立小波支持向量机回归耦合模型,对日径流进行预测。
1.4模型效果评价
本研究采用均方根误差(RMSE)、平均绝对误差(MAE)、确定性系数(DC)、相关系数(R)以及相对误差RE等指标来判别模型预测的精度。其计算公式分别为:
(13)
(14)
(15)
(16)
2实例应用
本研究以泾河流域张家山水文站1999-01-01至2004-12-31的实测日径流(m3/s)作为样本,其中前5年的数据作为训练样本,后1年的数据作为检验样本。对所选样本依据Mallat算法用正交不对称的db4小波做四层小波分解,得到低频项和高频项,样本分布及小波分解后各子序列分布如图 1所示,其中横坐标表示时间(d),纵坐标表示小波序列的系数。在日径流序列小波分解与重构的基础上,对张家山站日径流序列与分解后的子序列之间的相关性进行分析,以确定张家山站日径流序列的主要影响因素。从表1可以看出,高频部分d1和d2与原始序列c0的相关性很差,在预测模型中不予考虑,视为无效序列,d3和d4与原始序列的相关性显著,为有效的子序列,将其与近似序列(c4)相加得到的新序列作为SVR模型的输入。
图 1 张家山水文站日径流分布及小波分解后各子序列分布示意图
在相关性分析的基础上,选取张家山水文站前6 d的径流量来预测当日的径流量,在Matlab R2010a平台下进行编程,调用svm工具箱,模型的输入采用前6 d每天的实测径流量,输出为当天的预测径流量。采用基于交叉验证技术的网格搜索参数寻优方式[17],以达到寻优目的。经过多次测试,得到WSVR模型精度最高时的参数为:C=90,σ=2.828,ε=0.001。为了定量分析预测的结果,本研究采用均方根误差RMSE、平均绝对误差MAE、确定性系数DC、相关系数R及相对误差RE等指标来判别预测的精度,并与单一支持向量机模型进行了比较,2种方法的预测结果和精度比较见表2和图2。从表2可以看出,WSVR模型在训练阶段和检验阶段的精度比单一SVR模型都高,其中检验阶段WSVR模型的RMSE、MAE、DC、R及RE分别为26.05 m3/s,8.26 m3/s,0.826,0.910,-13.3%,除RE外,其余指标明显优于单一SVR模型。根据水文情报预报规范(SL 250-2000)[18],当0.7 表 2 张家山水文站SVR和WSVR模型日径流预测结果的精度比较 图 2 检验阶段张家山水文站SVR和WSVR模型日径流值与实测预测值的对比 模型Model汛期FloodseasonRMSE/(m3·s-1)MAE/(m3·s-1)DCRRE/%非汛期DryseasonRMSE/(m3·s-1)MAE/(m3·s-1)DCRRE/%SVR91.2528.280.0560.240-6.85.404.910.180.78256.1WSVR36.9615.920.8450.921-11.92.741.800.790.931-18.4 3结论 利用小波变换的多分辨功能将径流时间序列分解成不同分辨率水平的低频项和高频项,分解之后的子序列的特征比原始序列更加明显,本研究充分利用不同分辨率水平的水文序列的信息,建立了基于小波变换的支持向量机回归模型,并且在相关分析的基础上确定有效的影响因子来预测日径流。将该模型应用于泾河张家山水文站的日径流预测中,结果表明,基于小波变换的支持向量机回归模型(WSVR)的精度远高于单一支持向量机回归模型(SVR),且非汛期的预测精度高于汛期的预测精度,说明该模型可有效地预测日径流,尤其是非汛期,预测结果可为制定水库运行计划及水电站的发电计划提供更为科学的依据。 在本研究中,小波基采用的是Daubechies小波,在以后的工作中,可以尝试选取其他的小波基函数,而且研究中未考虑径流形成的物理机制以及降雨等影响因素,使得汛期的预测精度低于非汛期,这些还有待深入研究。 图 3检验阶段张家山水文站SVR和WSVR模型日径流预测值与实测值的散点图 Fig.3Scatterplots of measured daily runoffs and prediction results at Zhangjiashan Station of SVR and WSVR models in test period [参考文献] [1]杨道辉,马光文,刘起方,等.基于粒子群优化算法的BP网络模型在径流预测中的应用 [J].水力发电学报,2006,25(2):65-68. Yang D H,Ma G W,Liu Q F,et al.Runoff prediction by BP networks model based on PSO [J].Journal of Hydroelectric Engineering,2006,25(2):65-68.(in Chinese) [2]缪益平,邓俊.基于BP人工神经网络的枯水径流预报方案研究 [J].水文,2008,28(3):33-36. Miao Y P,Deng J.Research on low-flow forecasting scheme based on BP artificial neural network [J].Journal of China Hydrology,2008,28(3):33-36.(in Chinese) [3]崔东文.多重组合神经网络模型在年径流预测中的应用 [J].水利水电科技进展,2014,34(2):59-63. Cui D W.Application of multiple combined neural network model in annual runoff prediction [J].Advances in Science and Technology of Water Resources,2014,34(2):59-63.(in Chinese) [4]王义民,张珏.基于混沌神经网络的径流预测模型 [J].西北农林科技大学学报:自然科学版,2010,38(6):200-204. Wang Y M,Zhang J.Run-off prediction model based on the chaotic and BP network [J].Journal of Northwest A&F University:Natural Science Edition,2010,38(6):200-204.(in Chinese) [5]Vapnik V.The nature of statistical earning theory [M].New York:Springer,1995. [6]周秀平,王文圣,黄伟军.支持向量机回归模型在径流预测中的应用 [J].水电能源科学,2006,24(4):4-6. Zhou X P,Wang W S,Huang W J.Application of support vector machine regression in runoff forecast [J].Water Resources and Power,2006,24(4):4-6.(in Chinese) [7]卫太祥,马光文,黄炜斌.基于惩罚加权支持向量机回归的径流预测模型 [J].水力发电学报,2012,31(6):35-43. Wei T X,Ma G W,Huang W B.Runoff forecast based on weighted support vector machine regression model [J].Journal of Hydroelectric Engineering,2012,31(6):35-43.(in Chinese) [8]叶碎高,彭勇,周慧成.基于PSO参数辨识SVM的中长期径流预测研究 [J].大连理工大学学报,2011,51(1):115-120. Ye S G,Peng Y,Zhou H C.Research on support vector machine parameter identification method for mid and long-term runoff forecast based on particle swarm optimization algorithm [J].Journal of Dalian University of Technology,2011,51(1):115-120.(in Chinese) [9]王宏伟,张鑫,邱俊楠,等.基于GA-SVR的中长期径流预报 [J].西北农林科技大学学报:自然科学版,2012,40(2):201-206. Wang H W,Zhang X,Qiu J N,et al.Mid-long term runoff forecast based on GA-SVR [J].Journal of Northwest A&F University:Natural Science Edition,2012,40(2):201-206.(in Chinese) [10]于国荣,夏自强.混沌时间序列支持向量机模型及其在径流预测中的应用 [J].水科学进展,2008,1(1):117-119. Yu G R,Xia Z Q.Prediction model of chaotic time series based on support vector machine and its application to runoff [J].Advances in Water Science,2008,1(1):117-119.(in Chinese) [11]李辉,练继建,王秀杰.基于小波分解的日径流逐步回归预测模型 [J].水利学报,2008,39(12):1334-1339. Li H,Lian J J,Wang X J.Stepwise regression model for daily runoff prediction based on wavelet decomposition [J].Journal of Hydraulic Engineering,2008,39(12):1334-1339.(in Chinese) [12]王秀杰,练继建,费守明,等.基于小波消噪的混沌多元回归日径流预测模型 [J].系统仿真学报,2007,19(15):3605-3608. Wang X J,Lian J J,Fei S M,et al.Chaotic multivariate autoregressive model of daily runoff prediction based on wavelet denoising [J].Journal of System Simulation,2007,19(15):3605-3608.(in Chinese) [13]Partal T,Kisi O.Wavelet and neuro-fuzzy conjunction model for precipitation forecasting [J].J Hydrol,2007,342(1/2):199-212. [14]张华,郁永静,冯志军,等.基于小波分解与支持向量机的风速预测模型 [J].水力发电学报,2012,31(1):208-212. Zhang H,Yu Y J,Feng Z J,et al.Wind speed forecasting model based on wavelet decomposition and support vector machine [J].Journal of Hydroelectric Engineering,2012,31(1):208-212.(in Chinese) [15]杨军,侯忠生.基于小波分析的最小二乘支持向量机轨道交通客流预测方法 [J].中国铁道科学,2013,34(3):122-127. Yang J,Hou Z S.A wavelet analysis based LS-SVM rail transit passenger flow prediction method [J].China Railway Science,2013,34(3):122-127.(in Chinese) [16]Mallat S G.A theory for multi resolution signal decomposition:The wavelet representation [J].IEEE Trans Pattern Anal Mach Int,1989,11(7):674-693. [17]Wu C H,Fang I C,Wu C H,et al.A novel parallel cross-validated support vector machine on patent classification system [C].Oregon USA,Portland:PICMET 2009 Proceedings,2009:633-641. [18]水利部水利信息中心.SL 250-2000水文情报预报规范 [S].北京:中国水利水电出版社,2001. Water Resources Information Center of the Water Resources Ministry.SL 250-2000Standard for hydrological information and hydrological forecasting [S].Beijing:China Water Power Press,2001.(in Chinese) Wavelet based support vector machine regression model for daily runoff prediction HUANG Qiao-ling1,SU Xiao-ling1,YANG Jia-tian2 (1CollegeofWaterResourcesandArchitecturalEngineering,NorthwestA&FUniversity,Yangling,Shaanxi712100,China;2CollegeofCivilEngineering,ChongqingUniversity,Chongqing400045,China) Abstract:【Objective】 The wavelet support vector machine (WSVR) regression model was established by integrating wavelet with support vector machine for forecasting runoff to provide reference for better reservoir operation.【Method】 Original time series were decomposed into subseries of different resolution levels and approximate sequence using wavelet techniques,and effective subseries were finally selected through correlation analysis.Then wavelet support vector machine regression model (WSVR) was constructed using the new series that adding approximate sequence with effective subseries as input.The model was applied to forecast daily runoff at Zhangjiashan Station of Jinghe River,and root mean square error (RMSE),mean absolute error (MAE),deterministic coefficient (DC),correlation coefficient (R) and relative error (RE) were calculated to evaluate the model.【Result】 From the daily runoff forecast at Zhangjiashan Station,the established WSVR model had RMSE,MAE,DC,R and RE of 26.05 m3/s,8.26 m3/s,0.826,0.910,and -13.3%,respectively.The accuracy of coupled model was much higher than that of support vector machine (SVR) model. The WSVR model was more accurate in flood season than in dry season.【Conclusion】 The established WSVR model could be applied to forecast daily runoff effectively,which provided a new way for runoff forecast. Key words:daily runoff;wavelet transforms;support vector machine;Zhangjiashan Station DOI:网络出版时间:2016-03-1408:4510.13207/j.cnki.jnwafu.2016.04.028 [收稿日期]2014-08-19 [基金项目]水利部公益性行业科研专项(201301016);“十二五”国家科技计划项目(2012BAD08B01);西北农林科技大学中央高校基本科研业务费科技创新重点项目(QN201168) [作者简介]黄巧玲(1988-),女,湖北随州人,在读硕士,主要从事流域水文模拟及预报研究。 [通信作者]粟晓玲(1968-),女,四川开江人,教授,博士生导师,主要从事水资源规划、流域水文模拟及预报研究。 [中图分类号]TV121 [文献标志码]A [文章编号]1671-9387(2016)04-0211-07 网络出版地址:http://www.cnki.net/kcms/detail/61.1390.S.20160314.0845.056.html E-mail:huangqiaoling1988@163.com E-mail:suxiaoling17@126.com