基于EMD-FBI-ELM模型的径流预测研究

2022-07-02 09:45张亚杰崔东文
人民珠江 2022年6期
关键词:径流权值分量

张亚杰,崔东文

(1.云南省玉溪市易门县水利局,云南 玉溪 651100;2.云南省文山州水务局,云南 文山 663000)

水文时间序列预报是揭示水文自身演变规律性的一种有效而可靠的方法,同时是水文预报研究领域的重要内容之一。提高水文时间序列预报精度对区域水资源开发利用、防洪抗旱规划、水资源管理保护、水库优化调度等具有重要意义。由于受气候变化、人类活动、土地利用及植被覆盖等多重因素的影响,月径流时间序列表现出高噪声、非线性、非平稳性和多尺度等特征,回归类模型[1]、BP神经网络[2]、支持向量机(SVM)[3]、随机森林(RF)[4]、长短时记忆神经网络(LSTM)[5]等单一模型难以获得满意的预测效果。当前,基于“分解-预测-重构”思想的多种方法组合预测模型广泛用于径流时间序列预测,如桑宇婷等[6]利用互补集合经验模态分解(CEEMD)方法和BP神经网络建立组合预测模型,将其应用于汾河上游月径流预测;刘祖发等[7]利用小波分解(WD)方法和秩次集对模型建立组合预测模型,将其应用于马口站年总径流量预测;王丽丽等[8]融合奇异谱分析(SSA)方法、灰狼优化算法、回归支持向量机模型,提出SSA-GWO-SVR月径流组合预测模型;吕晗芳等[9]建立变分模态分解(VMD)-最小二乘支持向量回归机(LSSVM)耦合模型,将其应用于上静游站等多个水文站月径流预测;李继清等[10]将极点对称模态分解(ESMD)方法与Elman神经网络相结合,建立ESMD-Elman模型对长江干、支流8站的年、月径流进行预报。

上述径流预测[6-10]体现了“分解-预测-重构”方法的适用性。当前,常用于时间序列分解的算法主要有经验模态分解(EMD)、集合经验模态分解(EEMD)、小波分解(WD)、变分模态分解(VMD)、奇异谱分解(SSA)等;常用于月径流时间序列预测的预测器主要有BP、SVM、LSTM等,但均存在缺点与不足,如BP神经网络存在设置参数多、易陷入局部最优等缺点;SVM模型存在对参数敏感、大容量样本预报中表现不佳等不足;LSTM模型预测性能较好,但存在内存资源消耗大、运行时间长等缺陷。极限学习机(extreme learning machine,ELM)是近年兴起的一种隐层前馈神经网络(SLFNs)学习算法,由于具有预测精度高、学习速度快、参数少等优点,已在各行业领域及径流预测[11]中得到应用。相比于其他方法,ELM克服了梯度下降学习算法需要多次迭代的缺点,在满足精度要求的同时提高了学习速度[12]。但在实际应用中,ELM输入层权值、隐含层偏置的随机选取对ELM预测性能影响较大。目前,遗传算法(GA)等传统智能算法[13-15]、生物地理学优化(BBO)算法[16]、花授粉算法(FPA)[17]、差分进化(DE)算法[18]等尝试用于ELM输入层权值和隐含层偏置优化,并取得较好的优化效果。法务侦查(Forensic-Based Investigation,FBI)算法是2020年提出的一种新型元启发式优化算法[19],其灵感来源于警察对嫌疑犯采取的调查-定位-追捕过程,与传统群智能算法相比,FBI收敛速度快、寻优精度高,具有较好的探索和开发能力,鲜见于ELM输入层权值和隐含层偏值优化及径流预测研究。

为有效提高径流时间序列预测精度,结合径流时间序列多尺度、非平稳性等特点,研究提出经验模态分解(Empirical Mode Decomposition,EMD)-FBI算法-ELM径流时间序列预测模型,旨在验证EMD-FBI-ELM模型应用于月径流时间序列预测的可行性。内容如下:①利用EMD将径流时间序列数据分解成多个更具规律的子序列分量;②基于重构输入向量建立ELM模型,利用FBI算法优化ELM输入层权值、隐含层偏置,建立EMD-FBI-ELM径流预测模型,并构建EMD-FBI-SVM、FBI-ELM、FBI-SVM作对比预测模型;③通过云南省姑老河站年径流预测实例对EMD-FBI-ELM、EMD-FBI-SVM、FBI-ELM、FBI-SVM模型进行检验及对比分析。

1 EMD-FBI-ELM预测建模方法

1.1 EMD原理

EMD最早提出于1998年,其原理是将相同的非平稳信号分解为不同频率的信号,从而得到由不同尺度信号组成的序列,称为本征模函数(Intrinsic Mode Function,IMF)。IMF满足2个条件:①数据序列中穿越极值点与零点的数量必须相等或最多相差一个;②信号上任意一点的局部极大值和局部极小值平均值为零[20-22]。

EMD 步骤如下:由时序数据x(t)的局部极大极小值确定其上包络线和下包络线;利用x(t)减去均值包络线得到第一个IMF序列分量c1(t);将剩余分量作为新的时间序列,重复采用EMD方法获得各个IMF子序列和1个残余序列。表达式如下:

(1)

式中cn(t)——第n个IMF序列分量;rn-1(t)——第n-1次采用EMD方法分解后的剩余分量;res(t)——最终残余分量。

1.2 法务侦查(FBI)算法

FBI算法灵感来源于警察对嫌疑犯采取的调查-定位-追捕过程。算法分为侦查(A阶段)、追捕(B阶段)2个阶段,分别由侦查组和追捕组执行[19]。FBI算法数学描述简述如下。

a)侦查阶段。侦查组通过分析、评估信息,初步确定嫌疑人可疑位置,并对嫌疑人每个可疑位置进行调查。嫌疑人可疑位置数学描述如下:

(2)

侦查员将每个可疑位置的概率与其他可疑位置的概率进行比较,以确定最可能的可疑位置,并做进一步调查。嫌疑人XAi可疑位置概率Prob数学描述如下:

Prob(XAi)=(pAi-pmin)/(pmax-pmin)

(3)

式中 Prob(XAi)——嫌疑人新可疑位置概率;pAi——嫌疑人可疑位置概率;pmax、pmin——嫌疑人可疑位置概率的最大、最小值。

(4)

(5)

式中Xmin——嫌疑人最有可能的可疑位置;a——影响XAij搜索的可疑位置数量;α——有效系数;XAbj、XAdj——嫌疑人第b个、第d个随机可疑位置;rand——[0,1]范围内随机数;其他参数意义同上。

b)追捕阶段。在接到侦查组最有可能的嫌疑人位置报告后,追捕组所有警察协同接近目标,追捕嫌疑人。根据式(6),每个警察Bi接近可能性最高的嫌疑人位置;若新接近的嫌疑人位置比前代嫌疑人位置的可能性更大,则更新该位置。数学描述如下:

(6)

rand4·(Xmin-XBrj)

(7)

rand4·(Xmin-XBij)

(8)

式中XBrj——第r个特工随机位置;rand3、rand4——[0,1]范围内随机数;其他参数意义同上。

1.3 极限学习机(ELM)

极限学习机(ELM)是一种广义的单隐层前馈神经网络,具有较快的学习速度和良好的泛化能力。给定M个样本Xk={xk,yk},k=1,2,…,M,其中xk为输入数据,yk为真实值,f(·)为激活函数,隐层节点为m个,ELM输出可表示为[13-14]:

(9)

式中oj——输出值;Wi——输入层节点与隐含层节点的连接权值;bi——输入节点和隐含层节点的偏值;λi——隐含层节点与输出节点的连接权值。

1.4 EMD-FBI-ELM建模流程

EMD-FBI-ELM预测实现步骤如下。

步骤一利用EMD方法将实例径流原始数据分解得到3个IMF分量和1个剩余分量。利用自相关函数法(AFM)、虚假最邻近法(FNN)确定各分量的最佳延迟时间和最佳嵌入维数k,即利用前k个月的月径流量来预测当月月径流量,并合理划分训练样本和预测样本。

步骤二利用训练样本均方误差构建优化目标函数:

(10)

步骤三设置种群规模N、最大迭代次数T和算法终止条件;随机初始化嫌疑人位置Xi(i=1,2,…,N),XAi=XBi=Xi,令当前迭代次数t=1。FBI算法优化流程见图1。

图1 FBI优化流程

步骤四执行侦查任务,利用式(3)更新嫌疑人可疑位置概率;利用式(5)生成嫌疑人可疑位置;更新XAi,计算并保存侦查阶段最优适应度值fA及最佳位置Xbest,A。

步骤五执行追捕任务,利用式(6)—(8)生成警察新位置,更新XBi,计算并保存追捕阶段最优适应度值fB及最佳位置Xbest,B。

步骤六比较侦查阶段和追捕阶段适应度值,保存最优适应度值和当前全局最佳位置Xbest。

步骤七判断终止条件,输出Xbest,算法结束;否则返回步骤四。

步骤八利用ELM最佳输入层权值和隐含层偏值矩阵Xbest构建FBI-ELM模型,利用FBI-ELM模型对各IMF分量和剩余分量进行预测,预测结果叠加即得到实例径流预测的最终结果。

步骤九模型评估。利用MAPE(%)、MAE(m3/s)、纳什系数(NSE)对模型性能评估。

(11)

2 实例应用

2.1 数据来源

姑老河站位于南汀河干流下游,系南汀河干流控制站,控制径流面积4 186 km2,为国家重要水文站。南汀河发源于临沧市临翔区博尚镇永泉村,国境内径流面积8 097 km2,河长264 km,落差2 090 m,平均比降4%,流域内河网水系发育较差,河网密度0.4,流域形状0.16,主要支流有南捧河、西河、盘河、河底岗河等。本文数据来源于姑老河站1960—2013年实测年径流序列,见图2。

图2 1960—2013年年径流变化曲线

2.2 EMD分解

利用EMD将实例年径流时序数据分解得到3个不同尺度的模式分量IMF1—IMF3和1个剩余分量res,见图3。

a)IMF1

2.3 相空间重构

采用自相关函数法(AFM)、虚假最邻近法(FNN)分别确定模式分量IMF1—IMF3和剩余分量res的最佳延迟时间和最佳嵌入维数k,见表1。同时选取1960—2007年年径流实测数据作为训练样本,2008—2013年作为预测样本。

表1 各IMF分量和剩余分量res延迟时间及嵌入维数

2.4 参数设置及预测分析

2.4.1参数设置

a)EMD-FBI-ELM模型。设置FBI最大迭代次数T=200,种群规模N=30;ELM模型激活函数选择sigmoid函数,输入层权值和隐含层偏置搜索范围[-1,1],设置IMF1、IMF2、IMF3、res隐含层节点数分别为14、19、13、5,输入数据均采用[-1,1]进行归一化处理。

b)FBI-ELM模型。设置FBI最大迭代次数T=200,种群规模N=30;ELM模型激活函数选择sigmoid函数,输入层权值和隐含层偏置搜索范围[-1,1];设置原径流序列隐含层节点数为13,输入数据均采用[-1,1]进行归一化处理。

c)EMD-FBI-SVM、FBI-SVM模型。设置FBI最大迭代次数T=200,种群规模N=30;核函数选择径向基核函数,惩罚因子、核函数参数搜索范围设置为[10-3,103],不敏感系数搜索范围设置为[0.000 1,1]、交叉验证折数设置为5。所有输入数据均采用[-1,1]进行归一化处理。

2.4.2各IMF分量和剩余分量res预测比较

利用EMD-FBI-ELM、EMD-FBI-SVM模型对EMD分解各IMF分量和剩余分量res进行训练及预测,效果见图4,结果见表2。

a)IMF1

c)IMF3

表2 实例径流序列各IMF分量和剩余分量res拟合-预测相对误差

从图4、表2可以看出,EMD-FBI-ELM模型对径流序列IMF1、IMF2、IMF3分量及剩余分量res预测的平均相对误差分别为86.200%、22.900%、2.120%、0.004%,相对误差较EMD-FBI-SVM模型分别降低了15.0%、51.5%、79.0%、94.3%,具有更高的预测精度和泛化能力。

2.4.3年径流预测及比较

将EMD-FBI-ELM、EMD-FBI-SVM模型对实例各IMF分量和剩余分量res预测结果进行叠加获得实例年径流最终预测结果。对于原径流序列,采用AFM和FNN法确定其延迟时间为1,嵌入维数为7,利用FBI-ELM、FBI-SVM模型进行训练及预测。预测结果见表3,效果见图5、6。

表3 年径流拟合及预测结果对比

图5 实例年径流拟合与预测相对误差

图6 实例年径流拟合与预测效果

依据表3及图5、6可以得出以下结论:①EMD-FBI-ELM模型预测的MAPE、MAE分别为3.97%、2.92 m3/s,MAPE分别较EMD-FBI-SVM、FBI-ELM、FBI-SVM模型的预测结果降低了53.9%、81.7%、86.5%;MAE分别较EMD-FBI-SVM、FBI-ELM、FBI-SVM模型的预测结果下降了50.7%、81.4%、85.5%,具有更高的预测精度和更强的泛化能力,表明EMD能科学将径流序列数据分解成多个更具规律的分量序列,FBI算法能有效优化ELM输入层权值和隐含层偏值,将EMD-LSTM-ANFIS模型用于径流预测是可行的;②从NSE来看,EMD-FBI-ELM模型拟合、预测的NSE分别为0.921 3和0.910 0,优于EMD-FBI-SVM模型,远优于FBI-ELM、FBI-SVM模型,表明EMD-FBI-ELM模型具有较高的可信度;③EMD-FBI-ELM模型对实例训练样本拟合的相对误差在-16.10%~8.49%、预测样本预测的相对误差值在-5.20%~4.63%,与其余3种模型相比稳定性和预测精度均较高,从图5、6来看,EMD-LSTM-ANFIS模型对实例拟合、预测误差更小,更接近实测值。

3 结论

a)采用EMD对实例年径流时间序列进行分解,可以弱化复杂环境对径流时间序列的影响,降低预测复杂度,有效提高预测精度。

b)EMD-FBI-ELM对实例预测的平均相对误差分别较EMD-FBI-SVM、FBI-ELM、FBI-SVM模型的预测结果降低了53.9%、81.7%、86.5%,平均绝对误差分别较EMD-FBI-SVM、FBI-ELM、FBI-SVM模型的预测结果下降了50.7%、81.4%、85.5%,拟合、预测的纳什系数均在0.9以上,模型具有更小的预测误差和更高的预测精度。EMD-FBI-ELM模型用于径流预测是可行的。

c)通过实例验证表明,FBI算法能有效优化ELM输入层权值和隐含层偏值,通过EMD、FBI和ELM相融合建立的EMD-FBI-ELM模型能有效提高年径流预测精度。模型及方法可为相关径流时间序列预测研究提供借鉴。

猜你喜欢
径流权值分量
格陵兰岛积雪区地表径流增加研究
流域径流指标的构造与应用
一种融合时间权值和用户行为序列的电影推荐模型
基于SWAT模型的布尔哈通河流域径流模拟研究
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
人工降雨下三种屋面径流过程环境质量比较
财务风险跟踪评价方法初探