基于人工电场算法优化的大型灌区径流预测模型研究

2022-08-30 06:20王肖鑫岑威钧李昭辉吴光华
水资源与水工程学报 2022年4期
关键词:带电粒子径流电场

王肖鑫, 岑威钧, 李昭辉, 吴光华

(1.河海大学 水利水电学院, 江苏 南京 210098; 2.河南省赵口引黄灌区二期工程建设管理局, 河南 周口 466623)

1 研究背景

径流预测作为水文预报中的一项重要环节,其预测结果对预防洪旱灾害、合理配置水资源具有指导意义[1-2]。然而,大型灌区的径流量随时间的变化规律相对复杂,具有非线性和非平稳性等特点[3],且径流序列所表现出来的这种特性普遍存在于空间尺度上。对此,国内外许多学者开展了径流预测方面的相关研究[4-6]。目前,径流预测主要有两类:过程驱动预测和数据驱动预测。其中,建立基于过程驱动的径流预测模型考虑的是径流的实际形成过程[7-8],由于受到气候、地貌特征、人类活动等多因素影响,构建一个较为完善的过程驱动预测模型需要大量的数据支撑。相比之下,基于数据驱动的径流预测模型的建立仅需要对“少量”的时间序列数据进行分析,且随着人工智能和机器学习的不断发展,基于深度学习的径流预测模型已成为目前的主要预测方法之一。王佳等[9]采用经验模态分解法将径流序列分解成多个分量和趋势项,将非稳定序列转化为稳定序列,并用BP神经网络进行预测后重构径流序列,结果表明数据序列稳态化能够提高预测精度。包丽娜等[10]提出基于小波分解的径流预测模型,并采用粒子群算法对预测模型进行寻优,减小了突变数据对预测结果的影响。孟二浩等[11]引入降雨量和蒸发量作为气象因子,改进了基于遗传算法优化的支持向量机径流预测模型,有效提高了模型的预测性能。周有荣等[12]采用同热传递搜索算法进行参数优化,并通过多个标准测试函数进行了验证,结果表明该算法能够较好地解决模型的“欠拟合”问题。

近年来,许多基于自然现象的启发式优化算法被提出,如Sajwan等[13]提出一种新型优化算法——人工电场算法AEFA,并采用15个单目标优化问题对该算法进行了验证,将其与现有的一些优化算法进行了比较,同时,还计算了多种自适应参数。结果表明,在大多数标准测试函数上,人工电场算法比其他优化算法效果更为显著。相较于现有的优化算法,人工电场算法在解决优化问题时具有自适应参数少、收敛稳定、收敛速度快、泛化能力强、预测精度高等优点,目前该算法已应用于一些实际问题的优化求解。Houssein等[14]采用人工电场算法求解燃料电池的优化问题,验证了该算法在燃料电池参数优化上的优越性。Naderipour等[15]建立了基于人工电场算法的风力发电多目标模型,显著减小了发电机组的功率损耗和电压偏差。Niroomand等[16]将人工电场算法用于装配线平衡规划,较好地解决了任务运行时间和设备采购成本的方案制定问题。基于此,本文将人工电场算法(AEFA)应用于LSTM神经网络的参数优化,建立灌区径流预测模型,并以赵口大型灌区玄武站实测年径流量作为样本数据进行应用验证,通过与GA-LSTM模型和PSO-LSTM模型的比较,表明本文所建模型在径流预测中具有更高的预测精度。

2 算法原理

2.1 人工电场算法(AEFA)

人工电场算法(artificial electric field algorithm,AEFA)是受到库伦定律的启发,通过模拟粒子在静电场中受其他粒子的作用力而移动,从而将其转化为随机搜索最优解的过程[17]。AEFA忽略带电粒子的排斥力,只考虑粒子之间的相互引力。在整个搜索域中,每一个带电粒子表示一个可行解,具有最大电荷量的粒子吸引其他所有电荷相对较低的粒子,其他带电粒子都向该粒子靠近,使算法向最优解收敛。AEFA的具体实现过程如下:

设带电粒子种群数量为N,在d维搜索域内,第i个粒子的位置为:

(1)

在d维搜索域内,t时刻第i个带电粒子的最优空间位置根据下式确定:

(2)

(3)

式中:Qi和Qj分别为作用带电粒子i和被作用带电粒子j的电荷量;ε为一个极小的常量;K(t)为t时刻的库伦常数;Rij(t)为t时刻带电粒子i和带电粒子j的欧式距离。

库伦常数K(t)表示的是当前迭代次数和最大迭代次数的函数,为了保证算法具有较高的搜索精度,采用指数递减,具体计算公式如下:

(4)

式中:K0为初始库伦常数值;α为常数;iter为当前迭代次数; maxiter为最大迭代次数。

两粒子之间的欧式距离Rij(t)的具体计算公式如下:

Rij(t)=‖Xi(t),Xj(t)‖2

(5)

(6)

式中:rand为[0,1]之间的随机数,N为带电粒子总数。

(7)

(8)

式中:Mi(t)为t时刻第i个带电粒子的质量。

在每一次迭代过程中,带电粒子i会更新所在的位置和速度,更新计算公式如下:

(9)

(10)

2.2 长短期记忆(LSTM)算法

长短期记忆(long short-term memory,LSTM)算法在循环神经网络的基础上引入了3种门结构和细胞状态,从而克服了参数膨胀和梯度消失等问题,目前该算法已经成功应用于大坝变形预测、航船运动仿真等各类研究[18-20]。图1展示了LSTM算法的内部结构。

图1 LSTM算法内部结构

LSTM算法的具体计算公式如下:

(11)

3 基于人工电场算法优化的径流预测

人工电场算法优化的径流预测模型流程如图2所示。

图2 人工电场算法优化的径流预测模型流程

径流预测模型具体流程:首先选取样本数据进行标准化处理,采取min-max标准化对原数据序列{y1,y2,…,yn}进行变换,将原始值通过标准化映射成在区间[0,1]中的标准化值,具体计算公式如下:

(12)

按照一定的比例将样本划分为训练集和测试集,确定LSTM模型的结构后,将预测结果的均方误差MSE最小值作为人工电场算法寻优的目标函数,对模型参数(神经元个数m和学习率lr)进行迭代寻优。根据实测径流量和最终预测结果计算平均绝对误差MAE、均方误差MSE、均方根误差RMSE评价AEFA-LSTM模型的预测效果。

4 实例应用

赵口引黄灌区二期工程位于河南省黄河南岸豫东黄淮平原,地理位置位于北纬33°40′~34°54′,东经113°58′~115°48′之间,土地面积为2 174 km2,耕地面积为14.7×104hm2。灌区全部位于淮河流域,灌区内河流均属于淮河流域涡河水系,主要河流有涡河、惠济河、铁底河、涡河故道等。

涡河玄武水文站作为赵口灌区二期工程的代表水文站,控制流域面积4 014 km2,该水文站的观测精度较高,水文气象资料已经过复核,符合国家标准和精度要求。选取1983-2018年共计36 a的实测年径流量作为样本数据,具体样本数据见表1。

表1 涡河玄武水文站实测年径流量 108 m3

对涡河玄武水文站实测年径流量时间序列数据进行归一化处理,将原始值通过标准化映射成为区间[0,1]中的标准化值。对样本数据进行划分,将1983-2010年的样本数据作为训练集,2011-2018年的样本数据作为测试集。

设置人工电场算法(AEFA)的最大迭代次数maxiter=100,粒子种群规模为N=30,神经元个数m的寻优区间为[1,30],学习率lr的寻优区间为[0.0001,0.01]。通过AEFA对神经元个数m和学习率lr进行迭代寻优,并将均方误差(MSE)作为算法寻优的目标函数。为了验证AEFA优化的径流预测模型的可行性和准确性,选取遗传算法GA(genetic algorithm)和粒子群算法PSO(particle swarm optimization)与其相比较。通过逐步试算法确定下文验证的3个模型(AEFA-LSTM、GA-LSTM、PSO-LSTM)的LSTM三层架构为1-10-1。

利用MATLAB建立LSTM模型,分别采用人工电场算法AEFA、遗传算法GA、粒子群算法PSO对LSTM模型进行迭代寻优, 得到各算法优化下的径流量预测结果和对应的相对误差RE,如图3所示。

图3 3种算法优化下的径流量预测结果及其相对误差

由图3可以看出,3种模型预测的2011-2018年年径流量整体波动趋势大体上与实测数据一致,AEFA-LSTM模型预测结果波动特征与实测值波动特征的吻合度明显高于GA-LSTM模型和PSO-LSTM模型,其预测结果的相对误差较为稳定,相对误差的最大值为5.82%,出现在2011年,其余序列年的相对误差均小于5%,相对误差的最小值为2.71%。GA-LSTM模型预测结果相对误差的波动性较大,在2014-2016年连续年份的相对误差出现了明显的起伏,相对误差的最大值达到17.64%,出现在2015年。PSO-LSTM模型预测结果相对误差的波动性也较大,尤其是在2014-2015年,相对误差由不到6%变为整个序列年的最大值14.90%。比较结果表明,AEFA-LSTM模型预测结果的相对误差明显小于GA-LSTM模型和PSO-LSTM模型,除个别序列年外(2016年)PSO-LSTM模型各序列年的相对误差均小于GA-LSTM模型。计算得到AEFA-LSTM模型、GA-LSTM模型和PSO-LSTM模型的平均相对误差分别为4.06%、11.65%和9.28%,平均相对误差大小排序:AEFA-LSTM模型

计算得出的3种模型年径流量预测结果的平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)见表2。整体而言,AEFA-LSTM模型的预测精度高于GA-LSTM模型和PSO-LSTM模型的预测精度,能够更准确地预测序列的变化规律,降低预测误差,保障预测结果的精度。

表2 3种模型的年径流量预测精度对比

图4为3种模型年径流量预测结果相比实测值的泰勒图。图4中包含3种预测模型的相关系数、均方根误差和标准差,其中点划线为相关系数轴线,实线为标准差轴线,虚线为均方根误差轴线。坐标原点到所建模型对应标记点之间的距离表示标记点与参考点的标准差之比,其值越接近于1,说明预测效果越好;标记点与参考点之间的距离为均方根误差,标记点越靠近参考点,说明均方根误差越小;相关系数则根据标记点的方位角位置来确定,标记点越靠近横轴,说明预测结果序列与实测值序列的相关性越强。由图4可知,在3种模型中,AEFA-LSTM模型预测结果与实测值的相关系数最高,标准差和均方根误差最小。

图4 3种模型年径流量预测结果相比实测值的泰勒图

5 讨 论

从3种模型的预测结果可以看出,人工电场算法优化下的长短期记忆神经网络能够较好地对非平稳径流时间序列进行预测,更准确地模拟序列的变化规律。该算法具有较强的数据泛化能力和高精度预测性能,能够对实际问题进行有效的优化求解,这与其他学者的相关研究相符[13,21]。

本文针对径流时间序列提出了一种新型优化算法预测模型,仅从参数优化、智能算法的角度讨论了如何提高径流预测的准确性,实际上径流受到诸多气象因子的影响。梁浩等[22]基于“分解-合成”的思想,构建了融合大气环流异常因子的混合预测模型,其研究表明,考虑了气候因素的改进径流预测模型具有较高的预测精度且径流极值预测效果提升显著。范宏翔等[23]引入基准期,确定了流域径流的主要影响因素,建立了窗口期为10 d的气象-径流预测模型,训练模型预测结果的纳什系数均超过0.9,预测序列较好地体现了径流的短期波动和局部突变。董林垚等[24]探究了太阳黑子和厄尔尼诺现象对径流、水位等的影响,结果表明在不同时间尺度下两者对于区域水文过程均会产生直接影响,能够在一定程度上改变降水分布特征和水文循环过程。目前全球气候多变,极端降水和干旱事件频发,给径流预测带来了更多的不确定性,在今后的研究中应对影响径流的气象因子进行深入探索,以期构建基于多源数据融合的高精度径流预测模型。

6 结 论

本文将人工电场算法AEFA与LSTM神经网络相结合,建立了一种基于AEFA-LSTM模型的径流预测模型,并将其应用于某大型灌区的径流预测,主要结论如下:

(1)针对非平稳径流时间序列,AEFA-LSTM模型预测结果的相对误差较为稳定,其值在2.71%~5.82%之间,预测结果的整体波动趋势与实测数据基本一致。

(2)相较于GA-LSTM模型和PSO-LSTM模型,AEFA-LSTM模型的平均相对误差分别减小了7.59%和5.22%,且平均绝对误差MAE、均方误差MSE、均方根误差RMSE均为最小。所建立的AEFA-LSTM模型能够准确地进行径流预测,且较其他传统模型有更高的预测精度。

猜你喜欢
带电粒子径流电场
格陵兰岛积雪区地表径流增加研究
基于SWAT模型的布尔哈通河流域径流模拟研究
巧用对称法 妙解电场题
求解匀强电场场强的两种方法
雅鲁藏布江河川径流变化的季节性规律探索
近40年来蒲河流域径流变化及影响因素分析
带电粒子在磁场中的运动检测题
电场强度单个表达的比较
带电粒子的奇幻之旅
带电粒子的秘密花园(续)