基于一种新型的EMD-LSTM-ARIMA 算法的超短期电力负荷预测

2023-03-04 05:25:40梁浩彬
现代工业经济和信息化 2023年10期
关键词:分量负荷预测

梁浩彬

(广州大学经济与统计学院, 广东 广州 510006)

0 引言

电力负荷预测是现代电力系统发展中不可或缺的一部分,它可以利用过去的负荷信息去预测未来的负荷值。然而,电力负荷的预测存在很多挑战和困难,比如受到天气、经济等因素的影响,呈现出非线性和周期性的特点,这给预测带来了极大的影响。

近年来,电力负荷预测是学者们研究的热点话题。查阅了相关领域的研究文献,目前电力负荷预测方法主要可以被划分为两类:单一预测模型和混合预测模型。单一预测模型既包括传统的时间序列模型,也包括了近年流行的机器学习模型和神经网络模型。在单一预测模型中,随机森林(Random forest,RF)[1]、时域卷积网络(Temporal convolutional network,TCN)[2]、长短期记忆网络(Long short-term memory neural network,LSTM)[3]以及差分整合移动平均自回归模型(Autoregressive integrated moving average,ARIMA)[4]等模型都曾被用于电力负荷预测。但是,电力负荷易受到多种因素的影响,因此,采用单一预测模型进行预测可能会存在一定的误差。

为了提高预测模型的准确性,混合预测模型被研究人员广泛使用。这类模型综合了多种单一预测模型的优点,克服了单一模型存在的缺陷,可以更好地适应电力负荷的复杂特性。张子阳等人[5]提出了一种通过麻雀搜索算法(Sparrow search algorithm,SSA)和灰色关联算法(Grey relation analysis,GRA)改进最小二乘支持向量机(Least squares support vector machine,LSSVM)参数的电力负荷预测模型。龙干等人[6]提出了一种将改进多元宇宙算法(Multi-verse optimizer,MVO)与极限学习机(Extreme learning machine,ELM)相结合的新电力负荷预测模型。龚钢军等人[7]提出了一种将最大信息系数和融入了多头注意力机制(Attention mechanism)的LSTM网络相结合的预测模型。韩雅萱等人[8]提出了一种通过差分进化算法的自适应变异因子和自适应交叉因子优化LSTM 网络的电力负荷预测模型。但是在现实中,电力负荷序列往往呈现出非线性和非平稳的特点,给预测带来了重重困难,使得预测结果不理想。Xian 等人[9]发现分解算法对于处理非线性时间序列是有效的,它可以将复杂的时间序列分解为平滑的时间序列,使得预测模型更加容易识别。

马玉轩等人[10]提出了一种将变分模态分解算法(Variational mode decomposition,VMD)、TCN 模型以及注意力机制相结合的电力负荷预测算法。杨海柱等[11]提出了一种利用互补式集合经验模态分解算法(Complementary ensemble empirical mode decomposition,CEEMD)对电力负荷预测进行分解,并利用SSA优化LSSVM预测分量序列,最后将其相加得到最终预测结果的混合预测算法。徐岩等[12]提出了一种将VMD 算法与门控循环单元(Gated recurrent unit,GRU)相结合的预测算法,并通过粒子群优化算法(Particle swarm optimization,PSO)优化GRU 模型的参数。

为了进一步提高预测效果,研究者对分解算法得到的分量序列进行了更加深入地研究与分析。李飞宏等人[13]利用经验模态分解算法(Empirical mode decomposition,EMD)对原始序列进行分解,并将所得到的分量划分为低频分量和高频分量,在高频分量中利用TCN 模型构建预测模型,而在低频分量中利用ELM构建预测模型,最后将它们的预测结果相加得到最终的预测模型。方娜等人[14]也提出了类似的算法,其利用VMD 算法对原始序列进行分解,将分量划分为低频和高频分量,在高频分量中利用ARIMA 模型构建预测模型,而在低频分量中利用深度信念网络(Deep belief network,DBN)构建预测模型,并通过PSO 算法优化模型参数,最后将它们的预测结果相加得到最终的预测模型。

在时间序列预测任务中,使用滑动窗口方法是一种常见的预处理手段。当滑动窗口方法设置了窗口大小之后,原始时间序列将被分割为多个固定大小的窗口数据。这些窗口数据包含了原始时间序列的局部信息特征,其如图1 所示。

图1 窗口数据

但是现有的研究并没有对窗口数据进行了更深入的研究, 因此本文提出了一种新型的EMD-LSTM-ARIMA 混合预测算法。所提算法可以充分利用窗口数据的信息,并结合了EMD 算法、LSTM网络和ARIMA 模型的优点。

1 方法介绍

1.1 经验模态分解算法

经验模态分解(EMD)算法由Huang 等人[15]在1998 年所提出,它主要被用于非平稳以及非线性序列的处理与分析。EMD 算法的主要步骤如下:

1)求出原始序列x(t)的局部极大值和局部极小值,利用样条插值法拟合原始数据的上包络线u(t)和下包络线l(t),最后由公式(1)计算出上、下包络线的平均值:

2)令h(t)=x(t)-m(t),检查h(t)是否满足IMF 的要求。如果h(t)满足IMF 的要求,则认为h(t)是x(t)的第一个IMF。

3)如果h(t)不满足IMF 条件,则令x(t)=h(t)为原始数据,重复步骤(1),直到h(t)满足IMF 条件,则h(t)为x(t)的IMF1。

4)将IMF1 与x(t)分离,令r1(t)=x(t)-(IMF)1,然后将r1(t)视为新的原始信号,并重复上述步骤直到获得(IMF)n分量。当rn(t)变成单调函数时,EMD 算法分解结束。所有IMF 分量和残差分量的总和是原始信号,即:

1.2 长短期神经网络(LongShort-TermMemory,LSTM)

循环神经网络(recursive neural network,RNN)是一种由传统的前馈神经网络发展而来的神经网络结构,它能够处理时间序列数据。然而,在实践中,Bengio[16]和Le[17]等人发现它在处理长期序列的时候存在一些问题。例如,它存在着梯度消失和梯度爆炸的问题。

LSTM网络被认为是一种改进的RNN 网络,它由Hochreiter 等人[18]于1997 年提出,经过后来学者的不断改善,最终形成了现在的网络框架。LSTM网络改善了RNN 网络在长序列训练过程中“梯度消失”的问题。

LSTM网络框架如图2 所示。它通过门(遗忘门、输入门和输出门;Graves 等人)[19]机制有效地缓解了RNN 神经网络中的“梯度消失”问题。

图2 LSTM 网络单元结构

1.3 所提算法

本文提出了一种从滑动窗口方法的角度出发,将EMD 分解算法、LSTM 网络以及ARIMA 模型相结合的超短期电力负荷预测算法(见图3)。所提出算法的步骤如下:

图3 所提算法框架

1)利用EMD 分解算法将原始序列分解成多个分量序列;

2)采用滑动窗口方法对分量序列进行处理,并设定窗口大小将其划分成多个窗口数据,并对窗口数据利用线性回归计算其决定系数,取其决定系数平均值作为衡量该分量序列的线性系数;

3)设置阈值,当分量序列的线性系数大于该阈值时,使用ARIMA 模型对其进行预测,否则使用LSTM网络进行预测,最后将它们的预测结果相加得到所提算法的最终预测结果。

1.4 评估指标

实验通常会采用真实值与预测值之间的差值来评估模型的预测性能。本文使用均方根误差(RMSE)和平均绝对误差(MAE)作为评价指标。它们定义如下:

2 实验分析

2.1 数据来源与预处理

为了验证所提算法的有效性与可行性,本文选取了第九届“中国电机工程学会杯”全国大学生电工数学建模竞赛提供的电力负荷数据集进行分析。选取了时间跨度从2009 年4 月1 日至2009 年4 月30 日的电力负荷数据(见图4),采样周期为15 min,即总共选取了2880 个数据。将原始电力负荷数据集前80%的数据作为训练集,剩余的20%数据作为测试集,并从训练集中随机抽取20%数据作为验证集。为了神经网络快速收敛,本文使用min-max 公式对原始电力负荷数据进行归一化,即将原始电力负荷数据的大小映射到[0,1]:

图4 原始电力负荷

式中:x*为数据归一化后的值,xmin和xmax分别为原始电力负荷序列中的最小值和最大值。

2.2 EMD 算法分解结果以及分析

对原始电力负荷序列应用EMD 算法,得到了7个不同频率的IMFs 和1 个残差分量。图5 展示了通过EDM分解算法获得的分量序列,可以看出,先得到的分量序列其频率越高。

图5 EMD 算法分解效果

分量序列的线性趋势与所设置的滑动窗口大小密切相关。不同大小的窗口会得到不同的线性系数,因此可以根据实际任务需求来选择合适的窗口大小。本研究采用一天的样本长度进行滑动窗口处理,即滑动窗口大小设置为96。通过计算可得从IMF1到残差分量序列的线性系数分别是0.014、0.035、0.079、0.305、0.740、0.887、0.959 以及0.999。本实验将阈值设置为0.8,即IMF6、IMF7 以及残差分量序列使用ARIMA 模型构建预测模型,其余分量序列使用LSTM网络构建预测模型。

2.3 结果及其分析

根据表1 可知,直接使用原始电力负荷进行预测时,TCN 模型的预测精度最高,其MAE 和RMSE 值分别为27.53 和35.36。与表现第二好的LSTM模型相比,TCN 模型在MAE 和RMSE 指标上分别降低了1.54(5.30%)和1.46(3.97%)。而使用了EMD 算法的TCN 和LSTM模型,其预测精度与未使用分解算法的模型预测精度相比,均有所提高。EMD-TCN 模型表现最优异,其在MAE 和RMSE 指标上分别降低了2.63(9.55%)和1.66(4.69%)。同时,EMD-LSTM模型的表现也非常出色,在MAE 和RMSE 指标上分别降低了3.86(13.28%)和1.71(4.64%)。以上结果表明,通过使用EMD 分解算法将原始时间序列分解成多个分量序列,并利用这些分量序列构建预测模型,对于提高模型预测效果是有效的。根据表格1 的结果,可以看到本文提出的EMD-ARIMA-LSTM 模型表现最好。相较于EMD-TCN 模型,EMD-ARIMA-LSTM 模型在MAE 和RMSE 指标上分别降低了1.64(6.59%)和1.56 (7.60%)。此外,相较于EMD-LSTM 和EMD-TCN 模型,EMD-ARIMA-TCN 和EMD-ARIMA-LSTM模型的预测精度也有所提高。总的来说,本文提出的算法在预测精度方面相比于其他算法表现更优异。例如,与LSTM 和EMD-LSTM 模型相比,EMD-ARIMA-LSTM模型在MAE 和RMSE 指标上的值均更小,即EMD-ARIMA-LSTM 算法的预测效果更佳。

表1 各个算法的预测精度

另外,根据表1 的结果可以看出,TCN 和EMDTCN 模型的预测效果优于LSTM 和EMD-LSTM 模型。然而,EMD-ARIMA-TCN 模型的预测效果却不如EMD-ARIMA-LSTM模型。这可能说明,ARIMA 模型与LSTM 网络的协同效应比ARIMA 模型和TCN 的协同效应更好。

2.4 结果可视化

为了更清晰地展示不同算法的预测效果,本文进行了可视化处理,如图6 所示。

图6 不同算法的预测效果

从图6 中可以看出,在大多数时间序列的时间点,各种算法的预测效果都比较接近真实值。然而,当序列在峰值点时,算法之间的预测精度差异变得更加明显。预测效果较好的算法可以更接近真实值,而预测效果一般的算法则可能会产生更大的误差。

3 结论

针对电力负荷预测的重要性以及挑战性,本文从滑动窗口方法的角度出发,提出了一种将EMD 分解算法、LSTM 网络以及ARIMA 模型相结合的混合电力负荷预测算法。为了检验所提算法的可行性与有效性,本文利用第九届“中国电机工程学会杯”全国大学生电工数学建模竞赛提供的电力负荷数据集进行实证分析。实证结果表明所提算法是有效与可行的,它可以提高模型的预测精度。不足之处在于,本文只针对EMD 算法进行了研究,后续的工作可以进一步研究其他分解算法对电力负荷预测的影响。

猜你喜欢
分量负荷预测
无可预测
黄河之声(2022年10期)2022-09-27 13:59:46
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
帽子的分量
一物千斤
智族GQ(2019年9期)2019-10-28 08:16:21
论《哈姆雷特》中良心的分量
分量
不必预测未来,只需把握现在
防止过负荷时距离保护误动新判据
主动降负荷才是正经事