蒋松谕,何贞铭,周再文
(长江大学地球科学学院,湖北 武汉 430100)
随着人类活动的加剧和社会的不断发展,气候变化带来的影响越来越明显,海平面不断上升、飓风及干旱等直接或间接地影响着人类的生活,对人类健康、粮食安全和经济稳定构成重大风险。如果能对气温做出准确预测,就可为农业、交通、能源、公共卫生及应急管理等领域带来极大的便利。因此,挖掘气温变化的潜在规律,对于科学准确地预测气温变化具有重要意义。
如今,计算机技术的飞速发展和海量气象数据的积累给气温预测带来了新的可能,其中,较为广泛使用的机器学习方法主要包括支持向量机(SVM)[1]、反向传播神经网络(BPNN)[2]、径向基函数(RBF)[3]等,但这些方法在拟合非平稳、非线性的数据时表现欠佳。近些年,深度学习的方法快速进入时间序列预测领域,例如循环神经网络(RNN)、长短期记忆神经网络(LSTM)[4]和卷积神经网络(CNN)等,但随着对预测精度要求的不断提高,单个模型逐渐无法满足挖掘数据隐藏特征的需求,因此为了综合各个模型的优点,越来越多的混合模型开始出现。例如,马栋林等人[5]提出一种基于图卷积网络和门控循环单元的气温预测模型(GCN-GRU),更好地提取了气温变化的时空特征并获得了较高的精度。陶晔等人[6]将随机森林(RF)和LSTM 进行结合,在获得较高精度的同时也获得了较强的泛化性。陈岚等人[7]将灰色关联、卷积长短期记忆网络和双向长短期记忆网络相结合,极大的增强了时空特征提取能力。虽然这些方法取得了越来越高的预测精度,但模型的复杂度和计算量也越来越庞大。气温作为一种随时间明显变化的天气现象,具有非常强的时间相关性,寻找更好的方法提取其潜在的时间变化特征也是提高预测精度的关键。因此,该文结合信号处理领域的分析方法CEEMDAN 和更为先进的时间序列预测模型TCN,采用分解-集合的思想,选取气象站点的日平均气温作为分析数据,以实现模型训练和其短期预测。
自适应噪声完备集合经验模态分解(CEEMDAN)是一种基于经验模态分解(EMD)改进的分解方法,可以将复杂的信号分解为多个具有不同尺度特征的本征模态(IMF),更容易提取数据中的潜在特征,其主要过程如下:
⑴将不同幅度的高斯白噪声加到待分解信号得到新信号,对新信号EMD分解并平均得到第一个本征模态分量;
⑵计算去除第一个模态分量后的残差,在残差中加入正负成对高斯白噪声得到新信号,以新信号为载体进行EMD分解,由此得到第二个本征模态分量;
⑶计算去除第二个模态分量后的残差,重复上述步骤直至获得残差信号为单调函数,算法结束。
TCN 是一种新型的时间序列预测算法,其主要结构包含膨胀因果卷积和残差模块。TCN 的特点是可以并行计算,相较于LSTM 等模型具有训练内存要求底和训练速度更快等优点。当输入一维序列x∈Rn,卷积核f:{0,…,k-1} →R,对该序列元素s经过膨胀因果卷积F的计算为:
其中,d为膨胀系数;k为卷积核大小;“*d”代表卷积运算。
TCN 中另一个核心模块是残差块,可以有效解决网络较深产生的梯度消失问题。假设x是残差块的输入,残差块的输出计算为:
其中,Activation()为激活函数,F(x)为残差。
鲸鱼优化算法是一种模仿座头鲸捕猎方式的元启发式优化算法。其迭代公式为:
其中,Xt是鲸鱼位置向量,Xrand由当前鲸鱼位置决定,随着迭代,向量a从2 到0 线性减小,向量r在0 到1之间随机变动,C为由向量r确定的系数矩阵,A是由a决定的系数矩阵。
开始迭代时,由于a向量值较大,|A|值将大于1,从而保证寻求最优解的可靠范围;当 |A|值小于1 时,包围猎物的过程开始,此时的计算公式为:
其中,为当前最佳位置,b为常数,用来确定鲸鱼捕猎的螺旋路径,L为螺旋系数;p是0到1之间的随机数。
该文构建了一种用于气温预测的分解-集合模型CEEMDAN-WOA-TCN,图1 显示了模型的流程图。首先对原始的气温数据进行分析和预处理,然后采用CEEMDAN 方法将数据分解为多个本征模态,对每个本征模态以均方误差(MSE)作为适应度函数,采用WOA-TCN 进行训练。随着参数不断更新,适应度函数的值也越来越小,由此得到最优的TCN 模型参数,使用最优模型参数进行预测即可得到每个IMF 的最优预测值,最后将所有预测值线性集合得到最终的预测结果。
本文选取了北京54511、上海58362 和广州59287三个气象观测站点2001 年1 月1 日至2020 年12 月31日的日平均气温作为分析对象,数据均来自中国地面国际交换站气候资料日值数据集(V3.0)。选取这三个气象站点的原因在于它们都是我国的一线城市,在经济发展与应对气候变化方面具有引领作用,而且他们分别地处我国北部、中部和南部,在空间上具代表性,三个站点的基本信息和描述性统计如表1 所示。从表1可以看出,随着维度的不断升高,气温的最小值和均值也在逐渐上升,气温变化的标准差也越来越小。下面该文以北京54511 站点的气温数据为例,说明模型预测的基本过程。
为了更好地模拟气温变化的波动,保证数据的连续性,首先删除数据中的极值,因为这些极值通常由观测错误或仪器故障导致,然后再用插值重采样的方式将数据缺失位置进行填充。由于气温不仅会随着季节变化和早晚变化有明显的周期性,还会受到重大事件或相关政策等的影响,所以接下来就要提取数据中不同尺度下的潜在信息,以此达到提高预测精度的目的。
CEEMDAN 作为一种分析复杂、非平稳和非线性数据的强大工具,具有自适应降噪和使用灵活等诸多优点。如图2 所示,北京站点数据经过CEEMDAN 分解后,原始数据被分解为10 个本征模态。其中IMF-0到IMF-4 体现了气温在小尺度上的复杂变化,虽然不产生长期影响,但是伴随着剧烈的波动,表现出高频低幅的特征;IMF-5 到IMF-8 则反映了气温的季节性变化或外部环境、重大事件、相关政策影响产生的中长期变化;IMF-9作为趋势项,描述了气温变化的整体性趋势。经CEEMDAN 分解后,每个模态的数据阈值也随着分解而变小,尤其是较难预测的高频数据,这在一定程度上降低了较大误差产生的可能。
针对分解后的10 个模态,本文采用带有WOA 优化器的TCN 模型对其进行训练和预测,选取TCN 中卷积层过滤器的数量、卷积核大小、残差块的堆栈数、两个全连接层的神经元个数以及训练次数六个参数进行优化。为了判别优化程度,选取MSE 作为整个优化过程的适应度函数。最后,由于电脑计算性能限制,设置鲸鱼种群数量为5,最大迭代次数为10,通过不断更新策略改变鲸鱼的位置,得到TCN 的最优模型参数和结果。以其中一个模态数据为例,图3 展示了IMF-5 在进行WOA 寻优过程中的适应度曲线变化。随着迭代次数的增加,适应度函数值越来越小,对TCN 参数起到了很好的寻优效果。在进行TCN 模型训练和预测过程中,为了防止梯度爆炸、梯度消失和过拟合现象的发生,在使用Adam 优化的同时,还引入学习率动态调整和早停机制,进一步提高模型训练的效率。
图3 北京站点IMF-5的WOA优化适应度曲线
经过上面的预测后,均已得到各个模态的预测结果,而由于CEEMDAN 是一种完全分解,分解后不存在残差,所以将所有模态的结果线性集合即为最终的日平均气温预测结果。图4展示了北京站点测试集单步预测下最终的预测效果。
图4 北京站点测试集单步预测最终结果
为了评估模型的预测效果,本文采用了一些度量函数对结果进行评价,其中包括确定系数(R2),平均绝对误差(MAE),均方根误差(RMSE),它们的数学表达式如式⑺至⑼,其中,表示预测值,yi表示原始真实值,n是预测的总数,是原始值的平均值。
为了验证所提出模型的可靠性,本文又建立了在时间序列预测中常用的LSTM 模型作为对比模型,并对CEEMDAN-WOA-TCN 进行消融实验,分析每个模块在预测模型中的重要作用,最终在三个气象站点t+1 步、t+2 步和t+3 步上进行预测,并使用R2、MAE、RMSE作为评价指标,表2显示了北京54511站点的评价结果,上海58362 站点和广州59287 站点的评价结果如图5和图6的雷达图所示。
图5 上海站点相关模型精度评价雷达图
图6 广州站点相关模型精度评价雷达图
通过不同模型对各站点测试集的预测结果可以发现:①随着预测步长逐渐增大,预测精度呈下降趋势,这是由于时间序列步长越长,越不易捕捉之前时刻数据的相关性;②虽然LSTM 和TCN 两种单个模型在预测精度上非常相近,但在实验中TCN 的训练时间会比LSTM 更短,效率更高,这与TCN 模型的并行运算有很大关系;③引入WOA 优化算法对TCN 模型参数优化后,其预测精度比未优化的单个模型有了一定程度的提高,表明WOA 优化算法的有效性;④采用CEEMDAN 分解方法,引入分解-集合的思想后,预测精度有了最为明显的提升,表明分解-集合思想下CEEMDAN 在时间序列预测中具可靠性,是处理非平稳、非线性复杂数据的有力工具。
自从全世界齐心协力应对气候变化问题以来,虽然当前气候已经发生了一些积极的变化,但这依然是一个长期的问题,未来仍有可能面临更大的挑战。如果能对气温变化进行较为准确的预测,将对各个领域产生很大的影响,作为重要的辅助决策依据。本文采用Python3.6 及各个模块,提出了一种CEEMDANWOA-TCN 气温预测模型,通过CEEMDAN 对原始数据的有效分解和TCN 模型的高效预测,获得了相比单个模型更小的预测误差。本文在预测过程中只考虑了单个站点和日平均气温单个变量,在接下来的工作中,将考虑多个站点之间的空间位置关系和其他气象要素对气温的影响,进一步提高预测的准确性。