基于VMD－TCN 模型的渭河流域月径流量预测研究

2023-10-07 11:07张上要罗军刚石国栋连亚妮左岗岗

人民黄河 2023年10期

张上要，罗军刚，石国栋，景鑫，连亚妮，左岗岗

（1.西安理工大学西北旱区生态水利国家重点实验室，陕西西安 710048；2.陕西省渭河生态区保护中心，陕西西安 710004）

在变化环境影响下，径流变化逐渐呈现出非线性、非平稳性特征，传统的线性时间序列模型预测精度不高且模型方法的改进空间有限［1－2］。随着人工智能的发展，机器学习领域的非线性模型开始应用于径流预测，并且取得不错的效果。同时，信号分解技术能够将水文时间序列分解成若干相对稳定的固有模态分量（IMFs），将其与径流预测模型相耦合能够显著提升径流预测的精度［3］。为克服径流序列非平稳性导致预测精度差的问题，周婷等［4］将小波分解（WD）与支持向量机（SVR）进行耦合并应用于径流预测，研究表明WD 能够有效提升径流预测的精度。张金萍等［5］将自回归滑动平均模型（ARMA）与完全集合经验模态分解（CEEMDAN）结合，发现CEEMDAN 能够显著提高ARMA 的拟合优度。桑宇婷等［6］将CEEMDAN 与BP神经网络进行耦合，并用于汾河流域的月径流量预测，预测结果显示CEEMDAN－BP 模型在模拟期和验证期的径流预测精度都达到甲级。包苑村等［7］将变分模态分解（VMD）与卷积－长短期记忆神经网络（CNNLSTM）结合开展月径流量预测，结果表明VMD－CNNLSTM 模型对径流序列的峰值和谷值拟合更优。He等［8］将VMD 与深度神经网络（DNN）进行耦合，用于渭河流域张家山水文站的日径流量预测，其预测结果表现良好。Zuo 等［9］采用一种两阶段分解集成水文预测方法，解决信号分解过程中未来信息的引入导致模型预测结果失真的问题。

鉴于上述研究背景，笔者将变分模态分解（VMD）与时间卷积网络（TCN）相结合构建了VMD－TCN 耦合预测模型，将其应用于渭河流域咸阳和华县水文站的月径流量预测。通过与其他3 种模型（TCN、EEMDTCN、ARIMA）对比，验证VMD－TCN 的预测性能，同时分析VMD－TCN 在不同预见期的预测表现。

1 研究方法

1.1 变分模态分解（VMD）

VMD 是在2014 年首次提出的一种新型信号处理算法，该信号分解算法具有自适应和完全非递归的特点［10］。VMD 分解对噪声具有良好的鲁棒性，特别适用于复杂度高且非平稳时间序列的预处理，并且能够有效避免出现模态混叠的问题［11］。将原始径流序列f（t）分解成k个模态分量ui（t）（i＝1，2，…，k），考虑到径流序列使用VMD 分解的各个分量所具有的特性，需要构造出以下变分问题：

求解式（1）需要引入二次惩罚函数α和拉格朗日乘子λ（t）将其转换成无约束的优化问题，具体的公式如下：

将交替方向乘子算法（ADMM）［12］与傅里叶等距变换结合对式（2）进行优化，优化后得到如下方程：

1.2 时间卷积网络（TCN）

时间卷积网络（TCN）是一种新型的时间序列预测模型，它是在卷积神经网络（CNN）的基础上进行改进的，其模型架构包括因果卷积（causal convolution）、空洞卷积（dilated convolution）和残差模块（residual block）。TCN 的梯度稳定使其能够有效避免模型训练过程中发生梯度消失或梯度爆炸导致模型训练失败的问题，同时具有灵活的感受野［13］。

TCN 模型卷积结构的层与层之间都是相互依赖的，后一层的输出依赖上一层的输入，每一层都间隔神经元对上一层进行信息提取，通过间隔采样的形式，逐层膨胀系数以2 为指数增长，以便使用更少的层数获得更大的感受野。为保证每一层的信息不丢失，需要对每一层的边缘进行填充。TCN 模型梯度稳定的原因是引入残差模块，残差模块的引入可以保证在进行特征提取时信息相对完整，保证模型预测准确［14］。

1.3 VMD－TCN 预测模型构建

本研究将VMD 分解与TCN 模型相结合构建VMD－TCN 模型用于月径流量预测，使用贝叶斯优化算法进行超参数调优。开展径流预测主要分3 个阶段，分别是数据集划分阶段、预测样本生成阶段和径流预测阶段，具体流程见图1。VMD－TCN 模型在进行序列分解时将验证集数据逐一添加至训练集中能够有效避免模型训练引入未来信息。同时采用直接法生成预测样本能够提高模型的预测效率，节省计算资源［9］。

图1 VMD－TCN 模型预测流程

1.4 模型性能评价指标

本文使用4 种模型性能评价指标用于评估模型的预测能力，分别是纳什效率系数（NSE）、标准均方根误差（NRMSE）、平均绝对百分比误差（MAPE）和峰值预测性能指标（PPTS）。

NSE 反映预测结果所含信息量占预测目标所含信息量的比重，其值越接近1 表示模型的预测效果越好。NRMSE 是对预测结果均方根误差的归一化，适用于多模型对比，其值越接近0 则预测效果越好。MAPE 直接反映模型的预测误差，越接近0 表示模型的预测性能越好。PPTS 能够评价不同比例峰值的预测效果，越接近0 表示峰值预测性能越好。按照《水文情报预报规范》（GB/T 22482—2008）规定，NSE≥0.9，预测精度为甲级；0.7≤NSE＜0.9，预测精度为乙级；0.5≤NSE＜0.7，预测精度为丙级。

2 实例分析

2.1 试验环境搭建

本试验采用python3.7 环境，VMD 的附加分解使用python 的vmdpy 库进行，TCN 模型采用keras2.8.0搭建，超参数优化框架采用keras－tuner1.1.0。

2.2 研究区域概况及数据资料

渭河流域面积为134 766 km2，其中陕西省境内流域面积为67 108 km2。渭河干流全长818 km，是黄河最大的支流，多年平均径流量高达75.7 亿m3，多年平均降水量550 mm。咸阳水文站控制面积为4.7 万km2，多年平均径流量为37.298 亿m3，是渭河中游的控制站。华县水文站控制面积为10.6 万km2，多年平均径流量为63.768 亿m3，是渭河下游主要控制站。本研究选用咸阳水文站和华县水文站1953 年1 月至2018 年12 月共66 a 的月径流量数据，按7 ∶3 的比例划分训练集和验证集。

2.3 月径流量数据预处理

2.3.1 月径流量序列VMD 分解

采用附加分解方式对月径流量序列进行VMD 分解，分别将咸阳站和华县站的训练数据进行分解。将两个水文站的训练数据分别进行VMD 分解预试验，两站在k＝8 时分解效果最好，且恰好不出现模态混叠现象，图2 为咸阳站训练数据分解之后的IMF1与IMF8图，IMF2～IMF7图略，华县站同理。

图2 咸阳站月径流量序列（1953－01—1998－12）VMD 分解模态分量

2.3.2 特征序列滞后长度确定

采用直接法生成径流预测样本前，需要确定每一个特征序列输入的滞后长度，以确定t时刻的流量与其前期流量的相关性［15］。考虑到完整原始径流序列存在以12 个月为周期的规律性，将未分解的TCN 模型特征序列输入的滞后长度设为12。采用自相关函数法（ACF）和偏自相关函数法（PACF）确定VMD 分解后各个模态分量的滞后长度，具体方法见文献［16－17］。

2.4 VMD－TCN 预测结果分析

2.4.1 不同模型预测结果对比分析

径流序列分解并确定特征序列滞后长度后可构建径流预测样本，将预测样本输入TCN 模型可开展径流预测。为充分验证模型的预测性能，将TCN、EEMDTCN、ARIMA 与VMD－TCN 进行对比，其中EEMDTCN 模型同样使用附加分解以避免未来信息引入。图3、图4 分别为咸阳站预见期1 个月的多模型实测与预测径流量折线图和散点分布图，华县站同理。表1 为两站多模型预测性能评价指标对比。

表1 多模型预测性能评价指标

图3 咸阳站多模型实测与预测径流量折线分布

图4 咸阳站多模型实测与预测径流量散点分布

以咸阳站为例，由图3、图4 可知：1）相对TCN、EEMD－TCN 和ARIMA，VMD－TCN 对实测序列的拟合效果最好，特别是峰值的拟合，散点分布更加集中，理想拟合线与线性拟合线的夹角最小，说明VMD－TCN 模型的预测值与实测值具有高度的一致性。2）EEMD－TCN模型的拟合效果次之，但较VMD－TCN 对峰值的拟合不佳，散点更为分散。3）单一的TCN 和ARIMA 模型拟合效果不佳，TCN 与ARIMA 模型对峰值的拟合有明显的滞后且难以预测高峰值，说明单一TCN 和ARIMA 难以预测峰值的到达时间及量值。

结合表1 咸阳站的预测性能评价结果可知：1）VMDTCN 模型的预测效果最好，NSE 在0.9 以上，预测精度达到了甲级。VMD－TCN 模型与单一的TCN 模型相比，NSE 提升了318%，NRMSE、MAPE 和PPTS 分别下降了67%、40%、85%。采用VMD 分解之后的TCN 模型预测性能有了极大的提升，主要原因是VMD 分解能够得到平稳的信号分量，从而有效降低径流序列中噪声对预测的影响，进而提升预测的精度。2）EEMDTCN 模型相比TCN，NSE 提高了205%，NRMSE、MAPE和PPTS 分别下降了35%、26%、55%，说明EEMD 分解能对非平稳时间序列起到一定的降噪作用并提升预测精度。采用附加分解的EEMD－TCN 的NSE 只有0.67，预测精度只有丙级，主要原因是EEMD 在分解过程中避免了未来信息的引入，预测精度有所降低但更可靠，同时EEMD 分解会出现模态混叠现象，较VMD分解效果更差。3）使用分解之后的TCN 预测效果远高于TCN 和ARIMA，由PPTS 指标可以看出使用信号分解的模型峰值的预测效果更好。分析华县站预测结果可得到与上述相同的结论。

总体上，4 种月径流量预测模型预测性能的高低排序如下：VMD－TCN ＞EEMD－TCN ＞TCN≈ARIMA。耦合信号分解算法的组合模型预测效果高于单一模型，上述分析结果说明了VMD－TCN 对复杂非线性的径流序列的处理和预测是可行的。

2.4.2 不同预见期预测结果分析

为进一步验证VMD－TCN 模型在不同预见期下的预测性能，以华县站为例，针对预见期分别为1、3、5、7个月开展径流预测研究。图5 为华县站VMD－TCN 模型在预见期为1、5 个月的预测与实测径流量折线图及散点分布图，表2 为不同预见期预测性能评价指标对比。

表2 不同预见期VMD－TCN 模型预测性能评价指标

图5 华县站不同预见期实测与预测径流量折线及散点分布

不同预见期下，模型的预测能力会有所变化，由图5 可知：1）预见期为1 个月时，实测值折线与预测值折线能够很好地贴合，对预测序列的峰值和谷值的拟合效果较好。从散点图也可以看出，线性拟合线与理想拟合线的夹角较小，说明预见期为1 个月时实测值与预测值的一致性较高。2）随着预见期增大，实测值与预测值之间的拟合误差增大，线性拟合线和理想拟合线的角度增大，说明VMD－TCN 模型的预测能力会随着预见期的增大而降低。

结合表2 不同预见期的预测性能评价指标可知：1）预见期为1 个月时，NSE 在0.9 以上，预见期不断增大NSE 值逐渐减小，当预见期为7 个月时NSE 接近0.8，说明随着预见期增大，VMD－TCN 模型的预测精度会下降，但依旧保持着较好的预测能力。2）随着预见期增大，NSE 逐渐减小而NRMSE、MAPE 和PPTS 总体上逐渐增大，说明预见期增大而预测精度降低，部分原因是模型的峰值预测能力下降。预见期增大而模型预测能力降低的原因是随着预见期的增大，预测值与目标值的相关性逐渐降低，模型无法获得更为准确的信息进行精确预测。

综上所述，VMD－TCN 模型的预测性能会随着预见期的增大而降低，特别是在峰值的预测上。预见期为1 个月时，预测效果最好，预测精度达到甲级；预见期为7 个月时效果较差，但预测精度仍达到了乙级。可见，VMD－TCN 在不同预见期的径流预测也是可行且有效的。

3 结论

1）VMD 对径流序列进行预处理并耦合TCN 模型能够显著提升月径流量预测的精度，同时VMD 采用附加分解方式能够避免模型预测过程中未来信息的引入，预测结果更为可靠。

2）VMD－TCN 与EEMD－TCN 较之单一的TCN 和ARIMA 模型的预测表现更佳，且EEMD 分解会出现影响预测精度的模态混叠问题，VMD 分解能够通过预试验确定模态分量的个数从而有效避免模态混叠问题，VMD－TCN 预测精度高于EEMD－TCN。

3）随着预见期的增大，构建的径流预测样本所包含的信息会有所损失，预测因子与预测目标的相关性逐渐降低，VMD－TCN 模型的预测性能会逐渐下降。