刘 杰,金勇杰,田 明
(哈尔滨理工大学测控技术与通信工程学院 哈尔滨 150080)
短期电力负荷预测是指以分、小时、天、周为单位的负荷预测[1-3]。现阶段的短期电力负荷预测模型主要分为时间序列模型和特征学习模型两大类。时间序列模型中自回归差分滑动平均模型(autoregressive integrated moving average, ARIMA)已经用于很多负荷预测中,包括中长期电力负荷预测[4];特征学习模型主要为神经网络模型,包括BP 神经网络[5]、长短时记忆网络(long short-term memory, LSTM)[6-7]和支持向量机(support vector network, SVM)等[8]。BP 神经网络存在网络结构简单、预测精度低等问题;支持向量机在小数据集上表现良好但仍存在预测准确性较低等问题,且上述两种网络均未考虑到数据之间相关性,难以表征时域特征。现实生活中过早的电力负荷数据会造成预测训练数据过少,难以用于目前的电力负荷预测,使得LSTM 等模型训练难度较大且训练精度较低[9]。文献[10]提出了时域卷积网络(temporal convolutional network, TCN),在小数据集上训练效果和训练时间相较于传统方法有着更为理想的表现。
现阶段很多学者考虑到了负荷数据存在随机性、周期性、非线性等特点。利用经验模态分解(empirical mode decomposition, EMD)将负荷数据分解成多组分解数据再进行预测,可提升预测的准确度[11]。但是该算法易出现模态混叠等问题,造成后续预测精度的降低。变分模态分解(variational mode decomposition, VMD)的提出,不仅可以解决模态混叠,还可以有效解决负荷数据存在随机性和非线性等问题。通过将VMD 与LSTM 相结合的方法对短期电力负荷进行预测,降低了数据的复杂度,解决了数据存在随机性、非线性等特点,但是小样本上训练精度仍可以提升[12]。文献[13]在TCN 的基础上对时间和空间尺度上提出了多尺度时域卷积网络(multi-temporal-spatial-scale temporal convolutional network, MTCN),该方法使得网络可以更好地表征时域上的特征并提升预测精度,但当数据复杂度过高时,预测精度不够,且网络中仍存在可优化的部分。因此本文构建了一种VMDMTCN-COSA-FC 的电力负荷预测方法,利用VMD将电力负荷数据进行分解,将分解的分量送入TCN 网络中利用不同的时间尺度进行训练,同时在TCN 网络训练时利用余弦退火衰减优化算法(cosine annealing, COSA)优化神经网络训练中的学习率参数,最后利用全连接网络(fully connected networks, FCN)对每个分解信号的预测结果进行训练融合,获得最终的预测结果。
多尺度的变分模态预测方法是指通过变分模态分解将原始数据分解为多个模态,并对分解的多个模态利用不同尺度进行训练预测。VMD-MTCNCOSA-FC 网络系统框图如图1 所示。原始负荷数据经过VMD 分解后,获得K个模态分量;将K个模态分量分别送入TCN 网络,并采用K种尺度进行训练,降低负荷数据复杂度,解决数据中存在随机性和非线性等问题;对训练网络的学习率采用余弦退火进行优化,输出K个模态分量对应的K个预测结果,防止网络陷入局部最优解,这样不仅能缩短训练时间还可以提升预测精度;K个预测结果作为全连接网络的输入,通过全连接网络对模态进行融合,获得最终预测结果输出,使得预测结果能够考虑模态之间的相关性及各模态自身的重要性,进一步提升预测准确率,最终实现对原始数据的预测。
图1 VMD-COSA-MTCN-FC 网络系统框图
VMD 算法常用于处理非平稳信号[14-15],可有效地提取出电力负荷数据的特征。
对于输入信号,VMD 算法由此产生约束的变分问题为:
式中,uk{={u1,u2,···,u}k}为分解出来的K个模态分量;wk=w1,w2,···,wk为各模态的中心频率;“∗”表示卷积运算;∂t表 示对函数求时间的导数; δ(t)表示单位脉冲函数。
引入二次惩罚项a和拉格朗日算子 λ,将有约束算法转变为无约束的变分问题:
式中,τ 为信号的噪声容忍度。通过反复迭代直到满足收敛条件或达到最大迭代次数即停止,收敛条件为:
本文采用电力负荷数据包含每一天的使用数据、整体电力负荷使用趋势以及数据的随机波动,通过VMD 对数据进行分解,降低数据复杂度,解决原始数据存在的随机性和非线性等问题,提升后续每一次训练预测的准确度。
TCN 是一种用于解决时间序列问题的网络,能够有效提取出数据之间的关联性[16-17],并对后续数据进行预测,TCN 主要结构为膨胀因果卷积。
膨胀卷积通过跳过部分输入的方式,将卷积核作用于更大的区域。膨胀卷积通过改变膨胀系数来调整感受野的大小,使网络能够灵活的调整输出所接收到的历史信息量。对于一维序列的输入x∈Rn和滤波器f:{0,1,···,k−1}→R,卷积核可以通过滤波器系数k和膨胀系数d将感受野扩张,膨胀卷积运算为:
式中,d为膨胀系数;s−d·i为输入序列中的历史数据;k为滤波器系数。
膨胀因果卷积如图2 所示,从图中可以看出输出序列中YT点的感受野大小通过k和d来调整,且该点输出只受之前的历史数据影响。本文使用的TCN 网络采用膨胀系数d=1,2,4,8,滤波器系数k=3 的膨胀因果卷积。通过灵活的调整感受野,充分的考虑电力负荷数据中的时域特征,根据输入时间尺度的不同,调整输出结点记忆的长短,能够较好地解决传统方法中存在的对历史数据遗忘的问题,更适用于短期电力负荷预测。
图2 膨胀因果卷积
余弦函数值随着X的增大,先缓慢降低再加速下降最后再缓慢下降,因此可以通过余弦函数实现在网络初步训练时先用较大学习率加快模型收敛并跳出局部最优解;再用较小学习率帮助模型贴近全局最优解。余弦退火的原理如下:
式中,ymin和ymax分别表示学习率最小值和最大值;Tcur表 示当前迭代次数;Ti表示总迭代次数。
本文采用VMD 对原始数据进行分解,分解获得多个子序列,且后续针对每个子序列采用不同的时间尺度进行训练,增加网络训练时间。通过引入余弦退火算法对网络内部的学习率参数进行优化,加快模型收敛减少训练时间。其中本文采用的余弦退火衰减如图3 所示,通过余弦退火先将学习率上升至0.01,再经过2 000 次迭代更新后,从大学习率0.01 降到小学习率0.000 1。
图3 余弦退火衰减
本文采用电工数学建模竞赛负荷预测数据集,数据为某地区3 年内的日需求负荷数据,以天为采样频率,共1 106 天,包括最高、最低、平均温度、相对湿度、降雨量以及日需求负荷这6 维数据。由于湿度、气温和降雨等随机因素会提升负荷预测的复杂度,且增加了数据维度,因此本文实验仅采用电力负荷数据进行预测,选取其中1 000 组数据,以8:2 划分训练数据和测试数据,并选取训练集中的5%作为验证。评价指标选用均方根误差(RMSE)、平均绝对误差(MAE)和R2对实验结果进行评估。其公式分别为:
式中,m为样本数量;yi为真实值;为预测值;为真实值的平均值。
本文实验环境为Intel Core i5-7400 CPU,NVIDIA GeForce GTX 1050 的4 GB 和8 GB RAM。采用深度学习框架为tensorflow-gpu 和keras。
为了降低原始负荷数据的随机性和非线性问题带来的影响,需要对原始负荷数据进行VMD 分解,分解后的结果如图4 所示,取其中200 组分解结果如图5 所示,观察图5中的模态4 和模态5,其中心频率已经相近,当选取K>5 时,后续中心频率十分接近,判断为过度分解。
图4 原始数据VMD 分解
图5 200 组分解结果
本文通过计算分解子序列重组后信号与原始信号之间的失真程度来确定分解参数,其中经VMD分解后数据失真程度如表1 所示。通过表1 中实验1、2、3 的失真程度对比可以确定模态数K选取为5;根据实验4、5、6、7 确定在分解后失真程度相近时选取更大的惩罚函数α=900;根据实验6、8、9 确定在失真程度相近时,选取更小的噪声容忍度τ=0.3,以确保信号在数据不失真的情况下尽可能分解,降低数据的复杂度。
表1 VMD 分解数据失真程度
本文采用VMD-COSA-MTCN-FC 网络对负荷数据进行预测。网络主要由VMD 分解模块、COSA-MTCN 网络训练模块和FC 模态融合模块3 部分组成。输入负荷数据通过VMD 分解模块获得K个模态分量。在COSA-MTCN 模块中,对应每一个模态分量,选取对应其中心频率的时间尺度a、b、···、k,并根据各模态分量各自对应的时间尺度送入TCN 网络中进行训练,对学习率采用余弦退火优化,最后输出K个模态分量的预测结果。模态分量的预测结果将输出到FC 模态融合模块中,FC 网络将K个预测结果作为输入层进行训练,通过隐层后在输出层输出训练结果,即为对原始负荷数据的负荷预测。
电力负荷数据存在随机性和周期性,本文通过实验确定每一种网络的最优时间长度。共选择10 种方法与本文方法(VMD-MTCN-COSA-FC)进行对比实验:1) 反向传播神经网络(BP);2) LSTM;3) 门控循环单元(GRU);4) SVM 中的支持向量回归(SVR);5) TCN;6) 基于经验模态分解的时域卷积网络(EMD-TCN);7) 基于变分模态分解的时域卷积网络(VMD-TCN);8) 基于变分模态分解和余弦退火优化的长短时记忆神经网络(VMD-LSTMCOSA);9) 基于变分模态分解和余弦退火优化的时域卷积网络(VMD-TCN-COSA);10) 基于变分模态分解和余弦退火优化的多尺度时域卷积网络(VMD-MTCN-COSA)。
每种方法的隐层参数、时间尺度以及激活函数的选取如表2 所示,本文TCN 膨胀系数采用[1,2,4,8],网络优化器均采用Adam,Dropout 取0.1,学习率选择0.001,采用余弦退火优化的网络学习率范围为0.01~0.000 1,网络训练轮次均为300,SVR 中其他参数采用Scikit-learn 中默认参数。
表2 实验参数
将实验数据送入网络中进行训练和预测,并用3 种评价指标RMSE、MAE、R2 进行评价,其实验结果如表3 所示。为了说明各结构的优越性,将表3 中后6 种方法EMD-TCN,VMD-TCN,VMDLSTM-COSA,VMD-TCN-COSA,VMD-MTCNCOSA 以及本文方法的预测结果进行图表分析,并对各实验进行误差分析。由表3 的实验结果可以看出,采用TCN 方法进行预测相较于其他4 种传统预测方法(BP,LSTM,GRU,SVR),RMSE 和MAE 的误差有一定程度的下降,说明TCN 网络预测效果更好。
表3 实验结果
1) VMD 分解结构预测结果
将 表3 中TCN、EMD-TCN 和VMD-TCN 的实验结果进行对比,可以发现采用VMD 方法对原始数据进行分解,其RMSE 下降明显。图6 为不同分解方法的预测结果,可以看出经VMD 分解预测结果更贴近真实值,说明VMD 分解可有效降低数据的随机性及非线性的影响,提升预测精度。
图6 不同分解方法的预测结果
2) 余弦退火优化结构预测结果
对表3 中的VMD-TCN 和VMD-TCN-COSA方法的实验结果进行对比,发现采用余弦退火优化方法的预测结果MAE 下降了26%,R2 提升0. 3%,图7 为网络经COSA 优化后预测结果,可以看出,经过COSA 优化的方法预测曲线拟合度更高,验证了采用余弦退火对TCN 网络进行优化,网络能够收敛于更优解。
图7 COSA 优化后预测结果
3) 多尺度结构预测结果
对表3 中的VMD-TCN-COSA 和VMD-MTCNCOSA 方法的实验结果进行对比,可以看到利用多尺度进行预测其预测结果RMSE 下降了13%;图8为单一尺度和多尺度预测结果,观察图8 可看出多尺度的预测误差相较于单一尺度更小,说明多尺度的TCN 网络有着更强的非线性表征能力,能够更有效地拟合输入和输出数据之间的非线性关系,更好地表征时域上的特征。
图8 不同尺度预测结果
4) 全连接融合结构预测结果
对表3 中传统方法(VMD-LSTM-COSA)以及VMD-MTCN-COSA 的实验结果与本文方法(VMDMTCN-COSA-FC)的实验结果进行对比,可知本文方法相较于传统方法RMSE 下降了40%,曲线拟合程度提升1.1%;相较于未全连接融合的方法表现也更为优异。图9 为全连接融合以及传统方法的预测结果,由图9 可知本文方法相较于其他两种方法能够更好的拟合真实的曲线,验证了通过全连接网络对多尺度预测结果进行加权融合,预测结果能够考虑到模态在融合时的相关性以及各自模态的重要程度,能够进一步降低预测误差;说明了本文方法相较于传统预测方法预测表现更为优异。
图9 全连接融合与传统方法预测结果
为了进一步对比表3 中后6 种实验方法,随机选取连续的15 个预测点计算平均预测误差,如图10所示,本文方法的平均预测误差为0.332%,传统方法平均预测误差为1.35%,说明本文方法有更高的预测精度,大多数预测点的预测误差相较其他方法更小。预测曲线的拟合程度更高,也说明了本文所提结构用于短期电力负荷预测中可有效降低预测误差。
图10 各实验预测误差
为了验证本文方法有较强的泛化性能,更换一个更大的家庭用电数据集,该数据集以分钟为采样频率,共7 维20 万组数据,包括有功功率、无功功率、电压等属性,选取其中的10000 组有功功率数据进行预测实验。分别采用传统方法(VMDLSTM-COSA)和本文方法(VMD-MTCN-COSA-FC)进行预测,实验结果如表4 所示。从表4 中可以看出本文方法相较于传统方法RMSE 降低了23%;MAE 降低了20%;R2 提升1.1%。家庭用电数据集预测结果如图11 所示,通过图11 可以看到本文方法相较于传统方法可以更好地拟合真实曲线,说明本文方法对不同时间尺度的特征都有较好的表征能力,对不同时间尺度和不同数据量的数据集都有较高的预测精度,较强的泛化能力及较好的预测结果。
表4 家庭用电数据集实验结果
图11 家庭用电数据集预测结果
本文提出了一种基于变分模态分解和时域卷积网络的多尺度短期电力负荷预测方法。利用变分模态分解电力负荷数据,可以有效降低数据的复杂度,解决数据的随机性和非线性等问题。并且构建多尺度的TCN 网络用于子序列的训练,通过TCN网络充分考虑时域特征,灵活调整记忆长短,再利用多尺度进行训练,学习数据之间的非线性映射关系,更好表征时域特征,在此基础上引入余弦退火优化,提升模型精度。最后利用全连接的新型融合结构,充分考虑子序列之间的相关性以及自身序列的重要程度,实现对电力负荷预测精度的提升。通过多组对比实验以及不同的数据集,验证了本文方法具有较高的预测精度,相较于传统方法提升了曲线拟合程度,降低了预测误差。
后续还可以将该研究方法应用在更高数据维度或更多领域上,也可以利用其他优化算法对网络以及分解的参数进行优化,从而减少训练时间,降低模型复杂度。