基于KNN-TCN模型的蒸发皿蒸发量预测研究

2024-01-01 00:00:00谢育珽郑翔天史俊才等
人民黄河 2024年6期

关键词:蒸发皿蒸发量;时间卷积网络;K-近邻算法;空间因素

中图分类号:P426;TP183 文献标志码:A doi:10.3969/ j.issn.1000-1379.2024.06.019

引用格式:谢育珽,郑翔天,史俊才,等.基于KNN-TCN 模型的蒸发皿蒸发量预测研究[J].人民黄河,2024,46(6):113-118,125.

陆地水量平衡的3 个基本要素包括降水、蒸发和径流[1] 。蒸发是水分子从液态转化为气态的相变过程,是自然界水循环过程中的主导因素之一,能综合反映水分和热量,是水量平衡的重要影响因素[2] 。蒸发皿蒸发量是估算大气蒸发量的重要指标之一。

蒸发过程具有高度复杂的物理和非线性性质,利用传统经验公式法很难对其进行精确预测[3] 。随着深度学习方法的快速发展,加之其操作的简便性和良好的泛化性,为蒸发皿蒸发量的预测研究提供了新思路。Afshin 等[4] 在印度喜马拉雅中部地区,采用多层感知器神经网络(MLPNN)、协同神经模糊推理系统(CANFIS)等对蒸发皿蒸发量进行了预测研究,结果表明基于萤火虫算法的MLPNN 模型是Astara气象站的蒸发皿蒸发量预测的最佳模型。塔布里兹大学将支持向量机(SVM)模型和K-近邻(KNN)算法和随机森林(RF)模型、高斯过程回归(GPR)用于伊朗地区4 个气象站的蒸发皿蒸发量预测研究,结果表明输入气象参数气温、风速、日照的高斯过程回归(GPR)对蒸发皿蒸发量的预测最为准确[5] 。齐建东等[6] 引入注意力机制,对LSTM 模型进行优化,提出AT-LSTM 模型,对盐池县的蒸散发量进行精确预测,并将AT-LSTM 模型与ELM、SVM 两种模型进行对比,验证AT-LSTM 模型的性能,证明了注意力机制对LSTM 模型优化效果明显。

利用深度学习模型对蒸发皿蒸发量预测进行建模有一定的优势,实现起来较为简单,且适用性较强。但是国内外大多数研究仅考虑气象参数的时序特征,是基于观测站单站点的研究,并没有考虑到蒸发皿蒸发量的区域空间相关性,这样会导致预测结果有一定的片面性,预测精度不高[7] 。因此,本文综合了国内外研究现状,将其中具有代表性的神经网络模型、长短期记忆网络模型和近年来提出的时间卷积网络TCN 模型用于对中国地面国际交换站的蒸发皿蒸发量进行预测,探究模型的适用性,并引入K-近邻算法对TCN 模型进行优化,构建预测混合模型。从时间和空间两个方面充分获取特征,对区域蒸发皿蒸发量进行全面和准确的预测,探寻稳定、可靠的蒸发皿蒸发量预测模型,以期为相关研究提供参考。

1研究区概况

本文的研究站点位于我国北方,遍布5 个省、1 个自治区和1 个直辖市,共计14个中国地面国际交换站,站点的地理位置见图1(其中大同-53487、太原-53772为本文的预测目标站点,城市名称后5 位数字为中国地面国际交换站区站号)。这14 个站点均属于温带季风气候区,夏季高温多雨,冬季寒冷干燥,四季分明。其中大同、太原、介休、原平、运城、榆林和延安地面国际交换站位于黄土高原地区,海拔较高,受夏季风影响较弱,空中水汽较少,降水较少,气温年较差大;郑州、安阳、石家庄、济南和北京地面国际交换站位于华北平原地区,海拔较低,距离海洋较近,空气中水汽丰富,降水量较多;呼和浩特地面国际交换站所处中温带大陆性季风气候区,日温差较大,春季干旱多风,夏季短暂,秋季降温迅速,冬季漫长,为典型的蒙古高原大陆性气候区;怀来地面国际交换站位于燕山地区,属于中温带半干旱区,光照充足,雨热同季,昼夜温差大[8-10] 。

2数据来源与研究方法

2.1数据来源

本文数据源于国家气象科学数据中心发布的中国地面国际交换站气候资料日值数据集(V3.0)。选取了数据集中的7 类气象参数,分别为气温、气压、相对湿度、降水量、蒸发量、风速和日照时数。研究中将1960 年1 月1 日至2019 年12 月31 日共计21 914 组日值气象数据按照时间排序,然后利用滑动窗口的方法构建时间序列,设置时间步为6,即将连续6 d 的气象数据作为一个最小时间序列,最终获得了21 909 个时间序列数据。于是,把6 个时间节点的7 类气象参数作为输入项构成21 909×6×7 的矩阵,以下一个时间节点的蒸发皿蒸发量为输出项构成21909×1×1 的矩阵。选取研究站点80%的数据作为训练集,20%的数据作为测试集。

2.2研究方法

膨胀卷积是基于因果卷积改进而来的。由于原始因果卷积在处理较长的时间序列问题时,会导致网络层数变多,模型结构变得很深,影响模型的预测效果,因此,膨胀卷积应运而生,引入膨胀因子,可以在有限的模型深度条件下,保持较大的感受野,同时也缓解了梯度消失或梯度爆炸的问题。

TCN模型引入残差结构起到补充信息作用。其中,每个残差结构由两层一维膨胀卷积组合而成,并加入跨层连接的恒等映射,将原始输入信息与经过膨胀卷积提取的信息相加,从而起到信息补充的作用;同时,残差块的引入使得浅层网络很容易扩展为深层网络。

TCN模型在时序预测问题上具有结构上的优越性,本文将该模型应用到蒸发皿蒸发量的预测上,探究TCN 模型的适用性。

2.2.2K-近邻算法

K-近邻(K-Nearest Neighbors,KNN)算法是一种较为简单的监督分类算法[12] 。KNN 算法的总体思想是将分类目标与现有样本进行距离度量,找分类目标与样本之间距离最近的K 个样本点,K 个样本中哪个类别的数量最多,此样本的类别为分类目标的类别,其中分类目标可以是一维、二维或多维。

假设数据集有两类不同的样本数据,分别用黄色的小正方形和绿色的小三角形表示(见图2)。图2 正中间红色的圆点代表分类目标点,不同的样本分别对应特征空间中的一个点。

KNN 算法中K 值的选择直接影响到分类精度。假设K=3,红色圆点的最邻近的3 个点分别是2 个绿色小三角形和1 个黄色小正方形,少数从属于多数,判定红色的分类目标点属于绿色的三角形一类;K=5,红色圆点的最邻近的5 个点分别是2个绿色小三角形和3 个黄色小正方形,同样少数从属于多数,判定红色的分类目标点属于黄色的正方形一类。因此,K 值的选择影响到分类的结果。

KNN 算法能够对时间序列进行距离度量,并作为区域内序列时间相似性的分类算法,为空间因素的筛选提供依据。常见的距离度量方法有欧氏距离(Eu⁃clidean Distance)、曼哈顿距离(Manhattan Distance)和切比雪夫距离(Chebyshev Distance)3 种,本文所使用的为欧氏距离。

表1、表2 是基于欧氏距离对目标站点大同-53487、太原-53772的空间因素的筛选结果,K 值越大,所需的空间因素个数就越多。依据筛选结果,本节设置了两个目标站点26 组对比试验,探究最优K 值,从而得到最佳TCN 预测模型,预测结果见表3。不同欧氏距离(K 值)对应的均方根误差如图3所示。

由表3、图3 可知,随着空间因素的增多(即空间相关性站点数量增多),TCN 模型预测的判定系数有所升高,平均绝对误差和均方根误差有所降低。当K =4时,目标站点太原-53772 的预测效果最好,平均绝对误差、均方根误差、判定系数分别为0.33651 mm/ d、0.693 80 mm/ d、0.880 43;当K >4 时,TCN 模型的判定系数小幅降低。因此,K = 4 时为预测目标站点太原-53772 站最优模型;同样,K = 6 时为预测目标站点大同-53487站最优模型,平均绝对误差、均方根误差、判定系数分别为0.59967mm/ d、0.90201mm/d、0.84464。

本文将最优K 值的KNN-TCN 模型与LSTM 模型和TCN 模型做对比,预测目标站点太原53772 站模型预测结果分析见表4。由表4 可知,KNN-TCN 模型利用区域空间因素,比基础KNN 模型对蒸发皿蒸发量的预测效果提升十分明显,KNN-TCN 模型的判定系数相较于TCN 和LSTM 模型提升了2.52%和4.60%、平均绝对误差相较于TCN 和LSTM 模型降低了0.239 73mm/d 和0.261 82 mm/d、均方根误差相较于TCN 和LSTM 模型降低0.130 60mm/d 和0.18556 mm/d。

KNN-TCN模型的预测效果较好原因为:一是加入了空间因素,二是空间因素的筛选利用欧氏距离进行度量较为合理。在此绘制目标站点观测值与预测值的拟合图(见图4)、回归图(见图5),将预测结果进行可视化。

由图4 可知,蒸发量的变化具有明显的周期性和季节性,在年变化中,具有明显的单峰趋势,整体的蒸发量变化呈现夏季偏高、冬季偏低的特点。从宏观预测效果来看,3个预测模型均能较好地拟合蒸发皿蒸发量的变化趋势;从局部拟合效果来看,KNN-TCN模型对峰值和谷值的拟合效果最好,预测效果明显优于LSTM 和TCN模型。

由图5可知,红色虚线Y=X是预测结果回归的“完美直线”,即模型预测值完全等于站点观测值。若模型预测值无限接近于站点观测值,那么所绘制的点数据就无限靠近Y =X 直线,总体呈现离散点少且绘制点的离散距离近的特点。在区间[0,2]中,3种模型的预测效果均不错,离散点较少,离散距离较近。随着蒸发皿蒸发量的数值增大,预测效果变差,离散点较多,且绘制点偏离Y =X直线的距离越来越大。从整体可以看出,KNN-TCN模型的离散点个数最少,相较于LSTM 和TCN 模型,KNN-TCN模型预测结果更加接近Y =X 直线。

综上可知,3种预测模型均能较好地拟合蒸发皿蒸发量,其中KNN-TCN 模型对峰值和谷值的拟合效果最好,明显区别于其他模型;同时,KNN-TCN 模型的离散点最少,即模型预测值与观测值无限接近。

4结论

1)TCN 模型仅仅在单站点的时间序列中对蒸发量预测效果较好。KNN 作为较好的分类算法,将蒸发量的空间因素进行了有效筛选,在时间和空间双因素作用下,TCN 模型的蒸发皿蒸发量预测效果提升明显。

2)TCN 模型的膨胀卷积和恒等映射是时序问题中有效保留了历史信息的重要手段。

3)在太原地面国际交换站的蒸发皿蒸发量的预测试验中,KNN-TCN 模型的平均绝对误差、均方根误差和判定系数分别为0.336 51 mm/ d、0.69380mm/d、0.880 43,预测结果明显优于LSTM 模型,同时相较于基础TCN 模型, 在3 项评价指标上分别优化了23.97%、13.06%、2.52%;在空间因素的距离度量试验中,欧氏距离的筛选结果较好。KNN-TCN 模型充分利用了蒸发皿蒸发量的时间因素和空间因素,对蒸发皿蒸发量的预测效果提升明显。