基于WD-COA-LSTM模型的月降水量预测

2022-08-30 05:55王文川杨静欣臧红飞

水资源与水工程学报 2022年4期

王文川，杨静欣，臧红飞

(华北水利水电大学水资源学院，河南郑州 450046)

1 研究背景

降水预测是水文预报领域的一项重要研究内容，降水量异常是诱发旱灾、洪涝灾害的直接因素之一，因此，对其准确预测具有重要意义。近年来许多专家学者对降水量预测进行了大量探索，主要的研究方法有自回归模型[1-2]、支持向量机[3-5]、神经网络[6-8]等。其中长短期记忆(long short-term memory，LSTM)神经网络模型能精准地预测时间序列，有效解决了一些神经网络中出现的梯度爆炸问题，成为近年来的研究热点。如Kumar等[9]采用递归神经网络(recurrent neural networks，RNN)模型和长短期记忆(LSTM)神经网络模型对印度不同区域降水量进行了预测，结果表明LSTM模型比RNN模型预测精度更高；殷兆凯等[10]通过对比分析新安江模型与LSTM模型在不同预见期下对锦江高安雨量站日降水量的预测结果，发现LSTM模型在不同预见期下的日降水量预测精度均优于新安江模型；刘新等[11]利用LSTM等5种神经网络模型分别进行中长期降水对比预测，发现LSTM模型预测精度整体优于其他几个神经网络模型。

虽然LSTM模型在时间序列预测方面表现出了良好的适用性，但由于降水时间序列的非平稳性，以及预测模型参数确定困难，使得数据驱动模型推广应用受到限制，因此仍需进一步改进以提高预报精度。在以往的研究中，通常有两种策略来提高预测精度：一是数据预处理技术，通过数据预处理可以减少时间序列数据的非平稳特征，提取隐藏在数据中的有效信息[12]；二是采用优化算法对模型的超参数进行优化[13]。因此，近年来许多学者在时序预处理和模型参数优选方面进行了大量探索。小波分解(wavelet decomposition，WD)作为一种数据预处理技术，已在水文预报中得到广泛应用, Kim等[14]采用小波分解算法对区域和分类降水量数据进行分解，并通过与单一的数据驱动模型对比，发现经小波分解后的时间序列对于雨量的预测精准度更高；赵然杭等[15]采用基于时间序列分解的神经网络模型，首先对时序数据进行预处理，然后选取随机率定的神经网络参数对降水数据进行挖掘和预测，预测结果达到了精度要求。另外许多研究通过优化算法来优化LSTM模型的超参数，如Kala等[16]使用人工藻类算法(artificial algae algorithm，AAA)对LSTM模型进行参数寻优，提高了LSTM模型的预测精度；胡玉杰等[17]采用经粒子群优化算法(particle swarm optimization, PSO)参数率定后的AdaBoost-C4.5模型按降水等级对时序数据建立模型，在一定程度上提高了降水量预测的泛化能力。但上述研究只注重时间序列的分解或模型参数的优化，均属于单一的研究方法。

基于以上分析，本文将时间序列预处理与模型参数优化相结合，首先利用小波分解(WD)方法，将径流数据分解为不同频率的时间序列，在降低序列非平稳性的同时达到提高数据预测精度的目的，然后运用郊狼优化算法(coyote optimization algorithm, COA)筛选出LSTM模型最优的超参数，最后，建立WD-COA-LSTM耦合模型。采用LSTM、COA-LSTM、WD-LSTM 3个降水预测模型对河南省洛阳市栾川县白土镇和洛宁县故县镇两个雨量站进行预测和对比，验证了WD-COA-LSTM预测模型的可靠性。

2 数据来源与研究方法

2.1 研究区域概况

河南省洛阳市栾川县白土镇和洛宁县故县镇的两个雨量站点均位于洛河流域的中上游，该流域起源于龙潭泉[18]，流域覆盖面积近2 000 km2，两个雨量站点所处地区四季分明，年均降水量为600 mm。

2.2 数据来源

分别选取白土镇雨量站和故县镇雨量站1966-2016年的月降水实测数据作为研究对象，训练样本均采用前36 a的月降水数据，验证样本均采用后15 a的月降水数据。LSTM作为数据驱动模型，其时间滞时的选择对于时间序列的预测精度具有重要影响，因此运用自相关系数法[19]来选取合适的滞时。图1和图2分别为白土镇和故县镇原始月降水序列的自相关函数(autocorrelation function，ACF)图和偏相关函数(partial autocorrelation function，PACF)图，由图1、2可以看出，白土镇雨量站降水数据的ACF值在11～14时达到极值，且在14以后PACF的预测值落在95%置信带内；故县镇雨量站降水数据的ACF值在11～13时达到极值，且在13以后PACF的预测值落在95%置信带内。通过综合考虑气候、水文环境、地理位置等因素的影响，分别选用14和13作为白土镇和故县镇的时间滞时来对两个雨量站的降水量进行滚动预测。

图1 白土镇月降水序列的ACF与PACF图图2 故县镇月降水序列的ACF与PACF图

2.3 研究方法

2.3.1 小波分解(WD) 小波分解是通过提取原始数据内的不同信息，将其分解得到高频、低频序列两部分，以此类推，通过多级分解后有效提高了频率的分辨率[20]。

原始序列与各子序列关系式为：

(1)

式中：ak为低频序列；di为高频序列；k为分解层数。

2.3.2 郊狼优化算法(COA) 郊狼优化算法 (COA)[21]是一种基于种群的算法，其灵感来自于郊狼这一犬种[22]。与许多其他MHS(MinHash)[23]方法不同的是，在COA中，狼被分为子群体并组成总群体，每个狼群由一定数量的郊狼和一个alpha个体组成。alpha狼代表狼群中最优秀的郊狼。此外，COA算法关注郊狼的社会结构和行为的共享。在第n个时刻，第n个狼群中的第c只狼的社会状况用向量soccp,t=(x1,x2,…,xDimension)表示。COA优化算法步骤如下：

步骤1：计算郊狼的适应能力。某个郊狼对环境的适应能力表现为fitcp,t∈R(优化过程中目标函数的值)，与其他智能算法一样，初始社会条件是在郊狼种群中随机设定的。COA根据来自郊狼的信息计算狼群的文化倾向，假设每个郊狼都为狼群的生存做出贡献。第p组狼的文化倾向(cultjp,t)计算公式为：

(2)

式中：Op,t为第t瞬间第p组狼的社会适应能力排名情况。根据公式(2)，狼群的文化倾向是由狼群中狼的社会状况来表示的。

步骤2：选择狼群中的alpha郊狼。

alphap,t={socp,t|argc={1,2,…,Nc}minf(soccp,t)}

(3)

步骤3：更新狼群的社会状况。在COA算法中，族群间的文化相互作用用δ1和δ2表示。δ1和δ2分别为alpha效应和pack效应：

δ1=alphap,t-socp,tcr1

(4)

δ2=cultp,t-socp,tcr2

(5)

式中：cr1和cr2代表随机选择的郊狼。利用δ1和δ2更新的新的郊狼社会状况公式为：

new_soccp,t=soccp,t+r1·δ1+r2·δ2

(6)

式中：new_soccp,t为郊狼新的社会地位(适应度值)；r1和r2为[0,1]范围内随机生成的权重系数，分别表示alpha和pack效应。

如公式(7)所示，如果郊狼新的社会地位比以前更好，它将被狼群接受；否则，将被拒绝。

(7)

步骤4：郊狼的诞生和死亡过程。新郊狼的出生是父母与社会环境的结合，是随机选择的。在这个过程中，环境影响也被考虑在内。新郊狼的出生模型计算公式为：

(8)

式中：w1和w2为随机选择的郊狼；j1和j2为随机选择的郊狼基因；Ps和Pa为分散和关联的可能性，建立以支持郊狼文化多样性：Ps=1/Dimension和Pa=(1-p)/2。

步骤5：更新狼群的年龄。

2.3.3 长短期记忆神经网络长短期记忆(LSTM)神经网络是由Hochreiter等[24]提出的，弥补了传统神经网络在处理长时依赖时的不足，解决了长期时间序列中的梯度消失问题，并且对于时间序列当中间隔或者延迟很久的关键性事件能够快速预测。LSTM记忆单元结构如图3所示。

图3 LSTM记忆单元结构示意图

输入数据通过LSTM记忆单元的具体过程如下：

步骤1：通过遗忘门筛选出有效信息，剔除无效信息。

ft=σ(Wf·[ht-1,xt]+bi)

(9)

步骤2：经输入门选择需要储存在单元中的新信息。

it=σ(Wi·[ht-1,xt]+bi)

(10)

(11)

步骤3：通过输出门处理更新后的参数。

(12)

ot=σ(Wo·[ht-1,xt]+bo)

(13)

ht=ot·tanh(Ct)

(14)

式中：ht-1为上一时刻数据输出；xt为当前数据输入；ft、it、ot分别为经过3个门层的输出；ct为隐藏层状态变量；ht为ot与ct结合后得到的最终输出； tanh、σ分别为双曲正切函数和Sigmoid函数。

2.3.4 预测实现步骤 WD-COA-LSTM模型建立流程如图4所示，具体步骤如下：

图4 WD-COA-LSTM模型构建流程图

步骤1：利用小波分解将本文研究的降水序列分解后得到1个低频子序列a3和3个高频子序列d1、d2、d3。

步骤2：将4个子序列分别用COA-LSTM模型进行预测，得到4组预测值A3、D1、D2、D3。

步骤3：将4组预测值叠加得到最终的预测结果。

3 结果与分析

利用小波分解中db4 小波基函数[25]对降水量数据进行分解，根据本文实际研究序列的变化规律将降水时间序列分解为a3、d1、d2、d34个子序列，两个雨量站分解结果如图5所示。

图5 1966-2016年白土镇和故县镇雨量站月降水量小波分解图

在WD-COA-LSTM模型中，COA优化算法中的种群规模、最大迭代次数分别设为100、400；COA优化LSTM参数时隐藏层数H、最大循环次数E以及学习率η的寻优范围分别为[0,400]、[200,400]和[0.001,0.1]。

为检验WD-COA-LSTM模型的预测效果，建立LSTM、COA-LSTM、WD-LSTM模型作为对照试验，并选取4 个评价指标：均方根误差RMSE、平均绝对误差MAE、纳什系数NSE、相关系数R对预测结果进行评价，具体计算公式见文献[26]。

两个雨量站2002-2016年验证期不同模型月降水量预测结果对比如图6 所示，各模型评价指标结果如表1、 2 所示。

表1 白土镇雨量站降水量预测模型评价指标结果

由图6可以看出，在验证期LSTM、COA-LSTM、WD-LSTM、WD-COA-LSTM 4个模型与实测降水序列的拟合精度依次逐渐提高。单一的LSTM模型的预测值与实测降水序列相比，离散程度最大，在极值点的预测值总体大于实测值，预测效果不佳；经COA优化后的LSTM模型有效提高了实测降水序列的拟合度，且其预测的峰值误差远小于单独LSTM模型预测的峰值误差，可见经COA算法优化后的LSTM模型预测精度得到了一定程度的提升；经WD分解后的LSTM模型与实测降水序列的波动趋势较为接近，由此可以看出WD分解能精确捕捉降水时间序列的变化趋势，提取时序数据的有效信息，从而提升模型预测精度。

图6 白土镇和故县镇雨量站2002-2016年验证期不同模型月降水量预测结果对比

表2 故县镇雨量站降水量预测模型评价指标结果

分析表1、2可以得出：白土镇雨量站COA-LSTM模型验证期的RMSE、MAE、NSE和R值较LSTM模型的误差分别减少了9.22%、16.78%、58.21%和8.25%；WD-LSTM模型验证期的RMSE、MAE、NSE和R值较COA-LSTM模型的误差分别减少了37.04%、21.64%、104.03%和42.46%；WD-COA-LSTM模型验证期的RMSE、MAE、NSE和R值较WD-LSTM模型的误差分别减少了39.39%、39.59%、21.18%和10.14%。故县镇雨量站COA-LSTM模型验证期的RMSE、MAE、NSE和R值较LSTM模型的误差分别减少了0.60%、2.59%、2.71%和1.04%；WD-LSTM模型验证期的RMSE、MAE、NSE和R值较COS-LSTM模型的误差分别减少了16.66%、3.73%、66.65%和39.03%；WD-COA-LSTM模型验证期的RMSE、MAE、NSE和R值较WD-LSTM模型的误差分别减少了60.52%、60.06%、76.81%和21.27%。

上述预测结果与分析表明，WD-COA-LSTM模型对于洛河流域月降水量趋势的拟合程度明显高于其他几个单一模型，说明WD-COA-LSTM模型相比于单一的预测模型具有更好的预测精度。

4 讨论

本文对洛河流域月降水量的预测结果表明，WD-COA-LSTM模型与原始降水序列的拟合程度最高，与实测值的波动趋势大体一致，WD-COA-LSTM模型整体优于与其相比较的其他3个模型。主要原因在于：首先LSTM作为深度学习模型可以克服传统RNN模型面临的梯度消失和梯度爆炸问题，其次降水时间序列表现出高度非线性，起伏变化较大，应用WD分解技术能够提取时间序列中隐含的复杂有效信息，从而降低序列的非线性和降水时间序列预测的难度，提升预测的精度。另外，选择适当LSTM模型的超参数可有效提高模型的预测精度，郊狼优化(COA)算法具有良好的全局搜索能力，应用郊狼算法优化LSTM模型参数能够打破人为参数选择的局限性，提升模型参数选择的效率和准确性。因此，经过分解技术与参数优化技术相结合的WD-COA-LSTM模型，首先经过WD分解将月降水时间序列分解为几个子序列，并消除月降水时间序列中潜在的多尺度现象。然后每个子序列由LSTM模拟，经COA进行超参数优化，克服了人为确定参数的不足。本文提出的WD-COA-LSTM模型相比于前人所采用的单一组合模型泛化能力更加突出，具有更高的预测精度和稳定性，能够在很大程度上弥补单一模型的缺陷。

5 结论

(1)本文提出了WD-COA-LSTM月降水量预测模型，其针对月降水数据的复杂性和非线性特征，采用小波分解方法进行数据预处理，提取实测降水序列中隐含的有效信息，分出低频和高频序列，提高了时间序列的平稳性，能够更加全面地捕捉到降序时序数据的变化趋势。并通过运用具有较强全局探索能力和局部开发能力的COA优化算法平衡搜索性能，从而提高了LSTM模型参数优选的效率。

(2)在洛河流域两个不同雨量站的降水量预测中，单一的LSTM神经网络模型的预测值与实测值之间均存在较大误差，经COA算法优化后的LSTM模型的预测精度虽有所提高，但经时间序列预处理和参数优化后的WD-COA-LSTM模型的预测结果在几个预测模型中具有更明显的优势，拟合效果最佳，能够最大程度降低降水序列的复杂性，提高模型精度。

(3)本文所提出的WD-COA-LSTM预测模型，在月降水量预测中表现出了良好的准确性和有效性，为月降水量预测提供了一种新的思路。虽然COA优化算法相比其他传统优化算法具有较强的全局探索能力，但有时也会陷入局部最优，因此未来可尝试将COA优化算法进行改进后用于径流预报的研究。