赵星宇,吴泉军,朱威
(上海电力大学数理学院智慧能源数学研究中心,上海 201306)
准确的短期电力负荷预测,不仅可以保障电网系统运行的安全与稳定,还能为电网调度和电网检修计划等工作提供重要依据,从而有效地减少地区的发电成本,达到提高地区经济效益和社会效益的目的[1-2]。
目前,短期电力负荷预测方法大致可以分为三类,第一类为数理统计方法,主要有线性回归法[3]、卡尔曼滤波[4]、指数平滑法[5]等。这一类方法的优点在于模型结构简单、计算成本低和预测速度快,但同时也存在对具有非线性关系的数据映射能力不足,往往会造成模型的鲁棒性和泛化性能较差。第二类为机器学习方法,主要代表有支持向量机回归[6]、随机森林[7]和长短期记忆网络[8](long short-term memory network,LSTM)。其中支持向量机回归和随机森林这一类模型对负荷数据间的时序关系不敏感,因此在针对负荷数据的预测研究上难以取得较高的预测精度。而以循环神经网络为变体的LSTM网络通过引入门控机制可以实现对长时间序列中的时序特征进行提取,相比前者拥有更高的预测精度,但该类循环神经网络架构模型的局限性在于需要人为的来构建特征关系,否则就难以充分提取数据中非连续特征间的有效信息[9-10]。
机器学习方法虽然相比数理统计方法对非线性数据有着更好的拟合能力,模型的鲁棒性和预测精度往往都优于数理统计模型,但机器学习方法的预测效果在一定程度上取决于数据的质量[11]。然而在实际的生活中,负荷数据往往容易受到温度、电价等因素的影响,导致使用单一的预测方法难以对于此类含有高噪声的负荷数据实现精确预测[12]。因此第三类方法:组合预测法,逐渐被学者们用于短期电力负荷预测的研究中,其主要包含有权值分配法和负荷分解法。文献[13]通过误差倒数法将LSTM和极端梯度提升(extreme gradient boosting,XGBoost)组合来进行负荷预测,取得了较好的预测效果。然而,这一类权值分配法的可拓展性往往较差,即难以保证在其他负荷数据集上也能取得同样的预测效果。而对于负荷分解法来说,常见的有VMD(variational mode decomposition)分解[14-16]和EEMD(ensemble empirical mode decomposition)分解[17-18],而VMD分解在处理序列时容易发生边界效应,同时其序列分解的个数取决于模态数K,模态数K选取的不同往往也容易导致分解结果上的差异,这使得该方法具有一定的主观性。对于EEMD分解来说,该分解方法有效地解决了EMD分解存在模态混叠的问题,可是由于该算法在处理序列时加入的白噪声很难对其完全进行消除,因此会导致其分解将带来比较大的重构误差,进而影响预测的精度。针对上述问题,文献[19-20]运用了CEEMDAN分解方法对负荷数据进行预处理,并运用相关方法对分解后的短期电力负荷数据进行预测,取得了较好的预测效果,证明了该分解方法的有效性。运用CEEMDAN分解虽然操作简单、分解完备,但分解后对多个分量单独预测的方式也增加了后续的计算量,因此应考虑简化模型以降低整体计算体量。
鉴于以上研究的局限性,提出一种基于自适应噪声完备集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)分解、排列熵(permutation entropy,PE)和时间卷积网络-长短期记忆网络(temporal convolutional network-long short-term memory network,TCN-LSTM)的短期电力负荷预测模型,简称为CEEMDAN-PE-TCN-LSTM模型。该方法首先使用CEEMDAN将负荷序列分解为多个相对平稳的子序列,以此改善原始数据的质量。并通过计算子序列排列熵的方式将序列按照其复杂程度进行重组,从而降低后续预测的计算量。最后,将重组序列输入到TCN-LSTM混合网络中进行学习和预测,通过TCN模型充分挖掘序列间潜在特征,再运用LSTM模型进行预测。通过将本文开发的预测模型应用于真实负荷数据的预测任务中,验证其具有比其他常用预测模型更高的预测精度。
在气温、日期类型和其他因素的作用下,电力负荷数据往往具有较强的非平稳性和非线性,这使得传统的预测算法较难对其做出精确地预测。而CEEMDAN是一种具有自适应特点的数据预处理算法,该算法的特点在于它可以将负荷数据分解成频率从高到低的一组本征模态函数(intrinsic mode function,IMF)及残差分量(residual,RES),分解得到的各IMF分量分别体现了不同时间尺度上原始负荷数据的特征。因此,通过将负荷序列进行CEEMDAN分解,可以实现对负荷序列的各局部特征进行单独的预测,从而达到降低预测难度的效果。CEEMDAN算法理论参考文献[21]。
排列熵是一种用来评价序列复杂度的算法,它可以对含有噪声的序列进行定量地检测,且具有原理简单、鲁棒性好和计算速度快等特点,适用于经过CEEMDAN分解后的负荷数据的复杂度分析,其计算过程如下。
步骤1记经CEEMDAN分解后的分量为s(i),i=1,2,…,N对其进行相空间重构处理,得到矩阵X,可表示为
(1)
式(1)中:t、m分别为延迟时间和嵌入维数;j=1,2,…,K;K=N-(m-1)t。
步骤2将矩阵X的行向量定义为重构向量x(g),并将其元素值由小到大排列。
x(g)={j1,j2,…,jm}
(2)
式(2)中:g=1,2,…,K,K≤m;j1,j2,…,jm为x(g)每个元素的列序号。
步骤4由香农熵的计算公式,可将时间序列s(i)的排列熵定义为
(3)
步骤5实际应用中为了方便,一般采用归一化后的排列熵值,可表示为
H=Hp/lnm!
(4)
式(4)中:H的取值范围为[0,1],H越小表示序列越简单,随机程度越低;反之,则表示序列越复杂,随机程度越高。
时间卷积网络(temporal convolutional network,TCN)是一种新型的、可以对时间序列数据进行处理的神经网络架构,与传统的卷积神经网络相比,它可以更有效地提取时序数据的特征。TCN通过卷积神经网络(convolutional neural network,CNN)变化而来,它由多个残差单元构成。为了提高学习能力,TCN通过加入残差连接模块,使得该模型可以将信息以跨层的方式来进行传递,进而使模型的反馈和收敛速度进一步提升。图1为TCN模型的单个残差单元。
图1 TCN网络残差单元
在残差单元中一维扩张因果卷积发挥着重要作用,一维扩张因果卷积通过卷积系数来控制对输入的采样间隔,使得TCN网络只需要通过很少的层,就能够拥有较长的感受野。同时和CNN不同,TCN中的因果卷积不是双向,而是单向的,即模型中t时刻的输出只由前一层中t时刻及t时刻以前的输入来决定,这样避免了模型不会丢失掉历史信息及受到未来信息的影响,这也使得TCN模型变成了一种严格的时间约束模型。
长短期记忆网络在循环神经网络(recurrent neural network,RNN)的基础上改进而来,它有效克服了RNN在处理长序列时容易发生梯度爆炸及消失的缺陷。LSTM可以根据自身内部的结构特点,来学习数据间较长距离的依赖信息,从而有效提高预测精度,它是目前应用最广泛及最成功的RNN架构,所以非常适用于短期电力负荷预测。图2为LSTM模型的总体结构。
Xt和ht-1分别为当前时刻输入和上一时刻的输出;Ct-1为上一时刻的记忆单元;bt为当前时刻的候选状态;ht为当前时刻的输出;tanh、σ分别为tanh函数和sigmoid函数
LSTM通过引入输入门it、遗忘门ft和输出门ot来控制网络中信息的传递。LSTM模型虽然对时序数据具有强大的非线性映射能力,但需要人为的来构建特征关系,否则就难以充分提取非连续特征间的有效信息,因此需要考虑与特征挖掘网络相结合来提高对负荷特征的挖掘能力。
负荷数据由于容易受到诸多复杂因素的影响,往往会具有一定的非平稳性和随机性。因此,为了减少原始负荷数据质量对预测精度的影响,利用负荷分解算法与神经网络模型相结合的方法实现对短期电力负荷的有效预测,采用CEEMDAN将原始负荷数据进行完备分解,得到不同时间尺度上多个相对平稳的子序列。同时所提模型针对现有基于模态分解的短期电力负荷预测模型的不足做了以下改善,首先针对模态分解后导致后续预测规模大的问题引入了排列熵算法将序列重组,形成新的复杂度差异显著的新序列,不仅降低了后续的预测规模,且避免了多次预测带来的误差叠加;其次通过利用特征挖掘网络TCN与长短期记忆网络LSTM相结合的方式对重组序列进行学习和预测,实现更充分地挖掘数据间非连续特征的有效信息,使最终的预测结果更加可靠。
相比于卷积神经网络,TCN具有更快的收敛速度和特征挖掘能力[22],而TCN-LSTM混合模型兼顾了TCN模型和LSTM网络模型特点,将TCN模型提取到的特征作为输入数据输入到LSTM模型中去充分学习数据的内在规律,并得到未来预测值,以达到更好地挖掘出数据间潜在关系的效果。将两者进行结合构造了TCN-LSTM组合模型,如图3所示。
图3 TCN-LSTM模型结构
所提CEEMDAN-PE-TCN-LSTM模型的计算步骤如下,其结构如图4所示。
图4 CEEMDAN-PE-TCN-LSTM模型结构
步骤1通过CEEMDAN算法对负荷数据进行数据预处理,将其分解成一系列相对平稳的本征模态函数和1个残差分量。
步骤2通过引入排列熵算法计算出分解后得到的各序列复杂度信息,并将子序列按照复杂度相似性进行重组。
步骤3将新序列输入到多个经过参数调优的TCN-LSTM网络中进行学习和预测。
步骤4得到每个网络的预测值后,将其叠加获得完整的负荷预测结果。
为了合理地评估预测效果,本算例用平均绝对误差(mean absolute error,MAE)、均方根误差(root mean square error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE)来衡量各预测算法的准确率,其计算方法分别为
(5)
(6)
(7)
MAE、RMSE和MAPE的值越小,则表示模型的预测效果更好。
考虑到电力负荷数据具有以日、星期、月、年为周期的准周期特性,时间跨度较短的数据集进行训练不能学习到这一类准周期特性。因此,为了更合理地验证所提算法的有效性,数据集选取了欧洲某地2018年1月—2019年3月的负荷数据,其采样间隔为1 h,每日共24条数据。混合预测模型中的LSTM采用双层结构,设置参数epoch为300,滑动窗口为24,并使用“早停法”降低模型过拟合概率,Adam算法作为网络的优化器,其他参数通过多次训练模型进行调整,以确定最优预测模型。同时采用前文所提到的评价指标,将本文算法与其他常见的预测算法进行对比。
原始负荷序列中往往含有大量噪声,大大增加了模型的预测难度,因此通过CEEMDAN方法对其进行分解,得到了频率从高到低的11组IMF分量和1组RES分量,分解结果如图5所示。可以看出,各个IMF分量的频率较为稳定,且没有发生模态混叠的现象。
图5 负荷数据的CEEMDAN分解
由图5可知,相邻IMF分量的波动情况较为相似,可以考虑对具有相近复杂度的分量进行合并计算。因此为减小后续的预测体量,对分解后的各分量进行PE值的计算,进而对其进行合并重组。各分量对应的归一化后的PE值如表1所示,可以看出,IMF分量的PE值在依次变小,说明其随机程度也在依次降低。通过比较归一化后序列熵值间的接近程度,将各序列归一化排列熵值相差在0.1以内的序列进行合并重组。由表1可知,IMF1、IMF3和IMF11序列的PE值均与其他分量的PE值都相差较大,所以将这3个分量单独设为一组,而余下的IMF4~IMF10这7个分量的PE值都相对接近,因此将这一类复杂程度相近的序列直接叠加成一组。剩下的IMF2序列和残差项RES的PE值仅相差0.043,于是将其合并为一组。综上,可以得到5组重组序列,后续模型的预测次数也从12次降低到了5次,提高了模型整体的计算效率。将5组重组序列分别记为序列L1、L2、L3、L4和L5,序列合并结果如表2所示。
表1 各分量归一化后的排列熵值
表2 各分量合并结果
将重组序列L1~L5按照滑动窗口迭代预测的方式进行构造,设定其滑动窗口大小为24,即将前24 h的24条数据作为特征,而下一小时的电力负荷数据作为标签。其中各子序列的训练集为2018年数据,测试集为2019年1—3月的数据。在将训练集输入TCN-LSTM混合网络中进行学习训练后,利用其对测试集数据做出连续的负荷预测。
为体现所提预测算法(CEEMDAN-PE-TCN-LSTM算法)的优越性,将该算法所得的预测值和其他常见的单一预测算法及组合预测算法所得的预测值进行对比。其中单一预测算法为支持向量回归(support vector regression,SVR)、随机森林(random forest,RF)、TCN和LSTM模型,组合预测算法为:①卷积神经网络-长短期记忆网络(convolutional neural network-long short-term memory network,CNN-LSTM)模型,即运用CNN-LSTM混合模型进行预测,简称为CL;②TCN-LSTM模型,即运用TCN-LSTM混合模型进行预测,简称为TL;③CEEMDAN-TCN-LSTM模型,即先对负荷数据进行CEEMDAN分解,再运用TCN-LSTM混合模型进行预测,简称为CTL。
图6为本文算法与单一预测算法和组合预测算法在某一天上的预测结果对比。可以看出,8种预测算法均具有较好的预测效果,但本文模型的预测曲线与其他算法相比更贴近真实的负荷数据变化曲线,且在序列极值点周围的拟合效果更好。
图6 所提模型与其他预测模型的预测结果对比
表3为所提算法与其他短期负荷预测算法在随机单独1 d和3个月内进行连续日前短期负荷预测的MAE值、RMSE值和MAPE值,可以看到所提算法的MAE值、RMSE值和MAPE值无论在单独1 d上还是3个月内都要明显低于其他预测模型,即所提算法具有最高的预测精度。
表3 各模型预测误差对比
与单一预测模型SVR、RF、LSTM和TCN相比,所提模型的MAE、RMSE和MAPE评价指标值明显更低,预测精度得到了明显提升。其次,在当前负荷数据上TCN-LSTM模型预测效果要好于CNN-LSTM的预测效果,即TCN模型能更充分地挖掘出负荷序列间潜在时序特征,这表明以时间约束模型TCN作为特征挖掘网络来进行特征提取的有效性。且通过将CTL和TL算法的预测效果进行对比可知,利用CEEMDAN对负荷序列进行平稳化处理后,预测模型的性能得到了进一步的提升,这证明了进行CEEMDAN分解对提升模型预测效果有着较大帮助。同时所提算法与不引入排列熵的CTL算法在随机1 d和3个月上的预测效果相比,其MAE、RMSE和MAPE分别降低了2.976、7.949、0.152%和2.59、1.245、0.168%,原因在于引入排列熵算法避免了多次预测造成的误差累积,说明本文方法对提升模型整体精度同样具有一定的作用。综上所述,所提出的短期电力负荷预测方法取得了较好的预测效果,本文算法具有一定的优越性。
针对短期电力负荷数据随机性强,从而导致预测精度不高的问题,提出一种基于CEEMDAN分解和TCN-LSTM混合模型的短期负荷预测方法,通过理论分析和实例验证得出以下结论。
(1)通过将负荷数据进行CEEMDAN分解,能够降低原始负荷数据的非平稳性,从而改善后续模型输入数据的质量。
(2)引入排列熵算法将具有相近排列熵值的子序列进行分类组合以形成复杂度差异显著的新序列的方法,不仅有利于后续模型进行区分学习训练,也降低了预测规模,减少了多次预测造成误差叠加。
(3)将重组序列输入到兼顾TCN和LSTM优势的TCN-LSTM模型中进行预测的方法,避免了单一的LSTM网络对非连续数据间的潜在有效特征不能充分提取的问题,提高了整体的负荷预测精度。
(4)预测结果表明本文算法与其他常见的预测算法相比能更准确地预测实际负荷数据的变化,且各项评价指标均优于其他预测方法,可为电力部门提高电能调度效率和制定检修计划等工作提供及时有效的依据。