基于核极限学习机的负荷多粒度预测模型

2022-02-25 14:11:38文玉兴余永胜欧钰瞧谷紫文

重庆大学学报 2022年1期

崔娇，文玉兴，余永胜，欧钰瞧，陈蒙，谷紫文

(1. 云南电网有限责任公司昆明供电局，昆明 650011；2. 湖南大学电气与信息工程学院，长沙 410082)

准确的负荷预测是保障电网稳定、解决电量偏差、节约能源的有效途径[1]。随着存储技术和数据采集技术的发展，通过历史数据搭建预测模型进行负荷预测的方式广受关注[2]。传统的时间序列预测方法主要包括最小二乘回归法[3]、回归分析法[4]等，由于负荷数据的非线性、非平稳性和自相关性等特征[5-6]，这些方法难以达到电力市场的精度要求。神经网络算法具有较强的非线性特征提取能力，能够有效提高预测模型的精度。目前，已有大量的神经网络算法应用在负荷预测模型中，主要包括BP神经网络[7]、支持向量机(support vector machine，SVM)[8]、长短期记忆神经网络(long short-term memory，LSTM)[9]、极限学习机(extreme learning machine，ELM)[10]、极限梯度提升(extrme gradient boosting, XGBoost)[11]等。文献[12]针对风电功率的随机性和波动性特征，建立了基于遗传算法优化后的核极限学习机预测模型，具有较好的泛化性能与预测精度。文献[13]针对负荷数据不确定性动态特征，提出了一种基于约束并行长短期记忆神经网络分位数回归的短期电力负荷概率预测模型，该模型有效提高了预测效率和预测精度。文献[14]提出了一种基于贝叶斯深度学习的多任务概率预测模型框架，通过群集池化的方式增加该框架处理数据的多样性和数量，不仅解决了过拟合问题，还改善了预测性能。

1 基本理论

1.1 混沌时间序列分析

混沌理论对原始数据进行重构，将原始数据扩展到高维空间，以高维的方式将非线性系统中隐含的特征信息表现出来[16]。根据混沌学Takens的延迟嵌入定理，时间序列可以通过相空间重构恢复到原系统。对于单变量时间序列X∈{x1,x2,…,xn}，通过嵌入维度d和延迟时间τ进行相空间重构，拓扑结构为

X={xi,xi+τ,…,xi+(d-1)τ},i∈[1,n] 。

(1)

进行相空间重构时需要对嵌入维度d和延迟时间τ进行求解，其中交互信息法和虚假近邻法是计算这2个参数的有效方法。

1.1.1 交互信息法求解延迟时间

交互信息法是一种通过信息论和遍历论求解非线性系统混沌时间序列延迟时间τ的一种有效方法。对于时间序列X∈{x1,x2,…,xn}，延迟时间τ的交互信息公式为

I(τ)=H[x(i)]+H[x(i+τ)]-H[x(i),x(i+τ)] ，

(2)

式中：I(τ)为x(i+τ)对于x(i)的依赖程度。当I(τ)为0时，说明x(i+τ)和x(i)完全不相关，而I(τ)的第1个极小值表示x(i+τ)和x(i)的最大可能不相关，相空间重构时I(τ)的第1个极小值为最优的延迟时间。

1.1.2 虚假近邻法求解嵌入维度

虚假近邻法在相空间重构方面是计算嵌入维数的有效方法。随着嵌入维度的增大，混沌运动轨迹逐渐打开，低维空间相邻的2个数据在高维可能相距很远，那么这2个点便是虚假近邻点。针对时间序列X∈{x1,x2,…,xn}，令a(i,d)代表维度变换距离之差：

(3)

如果a(i,d)(典型值为[10,50])，则认为这2个数据是由于高维混沌吸引子中2个不相邻的数据投影到低维空间中变成虚假近邻点。嵌入维数从2开始，随着嵌入位数d的增大，直到虚假临近点的数量少于某一值或者虚假临近点的数量不再改变时，此时的嵌入维度d便是最小嵌入维度。

1.2 变分模态分解

变分模态分解算法(variational mode decomposition，VMD)能够将原始非平稳信号S分解为k个具有不同中心频率和有限带宽的相对平稳子信号{μ1,μ2,…,μn}。每一个子信号作为原始信号的一种带限固有模态分量(band-limited intrinsic mode function，BLIMF)[15]，能够反映原始信号在不同时间尺度下的结构特征。

(4)

μi(t)=Ai(t)cos(φi(t))，

(5)

式中：Ai表示模态分量μi的幅值；φi表示模态分量μi的相位。

文中将原始负荷数据经VMD分解为不同模态分量，考虑不同模态分量的自相关性强弱不同，针对每一模态分量建立各自的预测模型，以提高预测精度。文中模型用于短期负荷预测，在短时间内温度波动幅度较小，温度分解对短期预测模型的预测精度影响较小，故不对温度数据进行VMD分解，以减小模型的复杂度。

1.3 核极限学习机

极限学习机是一种高效的单隐含层前馈神经网络，广泛应用在预测回归和分类领域。极限学习机的输入为[x1,x2,…,xn]，输入层与隐藏层之间是全连接。若隐藏单元的个数是m，则隐藏层的输出矩阵为

H(x)=[h1(x),h2(x),…,hk(x)] 。

(6)

隐藏单元的输出是输入节点乘上隐藏节点的权值w加上偏差b，经过一个非线性函数将所有输入节点求和得：

(7)

其中：g是激活函数，常用的有Sigmoid函数、Gaussian函数等。

从隐藏层到输出层也是全连接，输出层的结果为

(8)

1.4 预测质量评价指标

(9)

式中，RMSE的范围是[0，+∞]，该指标越小，说明预测值越贴近真实值。

(10)

式中，MAE的范围是[0，+∞]，该指标越小，说明预测值越贴近真实值。

(11)

2 负荷多粒度预测模型

2.1 负荷预测中的时间窗大小取值问题

负荷作为一种时序数列，具有较强的自相关性。此外，用户用电过程中受温度因素的影响，导致负荷与温度之间存在潜在的互相关性。针对多变量单值预测模型，其数学模型为

yt+m=f(X,Z) ，

(12)

X={xt,xt-1,…,xt-kx} ，

(13)

Z={zt+h,zt+h-1,…,zt+h-kz} ，

(14)

式中：t表示时刻；m表示预测步长；f表示预测模型；X表示历史负荷数据；Z表示预测温度数据；y表示预测负荷。

由式(12)所代表的负荷预测模型可知，预测质量不仅与预测模型拟合的函数f有关，还与输入数据的时间窗大小kX和kZ有关。文中分析负荷数据的自相关性以及负荷数据与温度数据之间的互相关性，研究输入数据的时间窗大小对模型预测精度的影响。

选择核极限学习机作为预测模型，采用1.4节中的评价指标衡量模型的预测质量。当预测步长较小时，负荷数据的自相关性对预测模型影响较大。设置预测步长大小为1，预测温度时间窗kZ大小为24，预测质量与输入负荷时间窗大小的关系曲线如图1所示。由图1可知，当输入负荷时间窗大小为25时，模型的预测质量最高，说明合适的负荷时间窗大小能够提高模型的预测精度。

图1 预测质量与输入负荷时间窗大小的关系曲线Fig. 1 Relationship between the prediction quality and the size of the input load-time window

当预测步长较大时，负荷数据与温度数据之间的互相关性对预测模型影响较大。设置预测步长为5，预测负荷时间窗kX大小为25，预测质量与输入温度时间窗大小的关系曲线，如图2所示。由图2可知，当输入温度时间窗为26时，模型的预测质量最高，说明合适的温度时间窗大小能够提高模型的预测质量。

图2 预测质量与输入温度时间窗的关系曲线Fig. 2 Relationship between prediction quality and the size of input temperature-time window

2.2 负荷多粒度预测模型

文中提出的基于MG-KELM的负荷预测模型的总体框架，如图3所示，该模型包括3个阶段：信号分解阶段、时间窗求解阶段和多粒度预测阶段。

图3 基于MG-KELM的多粒度预测模型的总体框架Fig. 3 Framework of the prediction model based on MG-KELM

第1阶段：信号分解阶段。与其它时序信号比较，台区负荷的频率分量相对较少。为此，将负荷信号X分解为3个中心频率递增的子信号：主要特征信号XL，细节特征信号XM和随机特征信号XH。可根据经验得到负荷信号分解的个数，实验发现分解个数为3比较合理。如果原始信号最优的分解个数为2或者4，则需相应建立数量为2或者4的子信号预测模型，文中模型作相应修改即可。

第2阶段：时间窗求解阶段。通过混沌时序分析，利用嵌入维度和延迟时间求解每个模态在进行预测时的时间窗。

1)混沌特性分析。在进行相空间重构时，延迟时间τ和嵌入维度m由于数据时间长度有限导致求解时不存在。此外，混沌系统具有对初始值的极端敏感性，即2个差别很小的初值经过混沌系统处理后产生的差距将越来越大，并且呈现指数级分离，Lyapunov指数是描绘这一现象的方法。只要最大Lyapunov指数大于0便可判定该系统存在混沌特性。因此，一个系统是否具有混沌特性可以从2个方面判断：在一定条件下延迟时间和嵌入维度是否可解，最大Lyapunov指数是否大于0。

2)时间窗求解。在数据Xi处，理想时间窗的窗内数据与之时序相关，窗外数据与之时序无关。根据数据是否具有混沌特性，时间窗的计算方法分为2种情况。

情况一：数据具有混沌特性。在单变量相空间重构过程中，延迟时间τ和嵌入维度m使得{xi,xi-τ,…,xi-(m-1)τ}中，数据之间保持相互独立但又不完全随机。由于时间窗的大小与延迟时间和嵌入维度有关，由混沌时间序列中延迟时间τ和嵌入维度m，得到混沌时间序列中数据之间最大不相关的时间尺度T的最终表达式为

T=(m-1)τ。

(15)

情况二：数据不具有混沌特性。对于不具有混沌特性的系统，无法进行相空间重构，说明该数据系统的时序相关性较弱。若数据不具有混沌特性，则将时间窗大小设为定值24。

第3阶段：多粒度预测阶段。针对每个模态建立不同时间窗大小的KELM预测模型，再对各个预测模型进行累加求和，最终反标准化得出预测负荷数据。多粒度预测阶段的目的是针对不同频率的模态分量，建立不同时间窗大小的KELM预测模型，基于KELM的单一模态分量预测模型，如图4所示。

Step1:构建多粒度数据。根据上一阶段时间窗求解方法，分别计算主要特征分量XL、细节特征分量XM、随机特征分量XH和温度数据的时间窗大小kXL、kXM、kXH和kZ。因此，多粒度训练数据的结构为

yt+m=[xt,…,xt-kx,zt+h,…,zt+h-kz] 。

(16)

Step2:多粒度训练。根据Step1中的多粒度训练数据，建立各个模态分量的KELM训练模型。由于ELM只需设定隐藏层节点个数和激活函数类型，参照文献[17]的方法进行设置。

Step3:多粒度预测。累加各个模态分量的KELM模型的输出值，通过反标准化得出最终预测结果。

图4 基于KELM的单一模态分量的预测模型Fig. 4 Prediction model of single-mode function based on KELM

3 案例分析

着重考虑负荷自相关性和非平稳性对于预测模型精度的影响，选取欧盟互联电网(europe electricity transmission system operator，ENTSO)公布的台区负荷数据作为案例，验证文中模型的有效性。数据类型包括负荷数据和温度数据，采样时间为2015年1月1日至2017年5月1日，采样间隔为1 h。训练数据的样本规模为15 000，测试数据的样本规模为2 000。

3.1 时间窗有效性分析

为了验证时间窗大小对预测精度的影响，各个模态分量通过不同大小的时间窗，以MG-KELM模型进行预测实验。表1为原始数据以及VMD分解后各个模态分量的混沌特性分析，根据最大李雅普诺夫指数判断，都具有混沌特性。因此，以延迟时间和嵌入维度求解的时间窗进行负荷预测。

表1 数据混沌特性分析

时间窗大小与模型预测精度关系，如图5所示，图中蓝色曲线为不同时间窗大小时模型的预测结果，红色五角星是使预测模型预测质量最高时的时间窗大小，黑色圆圈是根据混沌时序分析预估的时间窗大小。从图5可知，最佳时间窗大小使得预测精度最高，在图中表现为RMSE、MAE和R2的极值点，说明时间窗大小能够影响模型的预测精度。

当时间窗过大，模型提取时序特征存在冗余；当时间窗较小，模型提取时序特征较不完整。此外，各个模态分量的最佳时间窗大小不同，说明数据中不同模态分量的时序特征不同，表达其时序特征所需的序列长度也不同。对比表1可知，根据混沌相时序分析求解的时间窗取值接近最佳时间窗,说明文中方法能够有效预估时间窗的大小。

图5 时间窗大小与模型预测精度关系Fig. 5 Relationship between the size of the time window and model prediction accuracy

3.2 预测模型对比

为了验证文中模型的有效性，采用长短期神经网络(LSTM)作为对比实验。根据原始负荷是否通过VMD分解，设立如表2所示的4种对比试验。其中，与ELM相关的预测模型的隐藏层数量设为100，激活函数设置为径向基函数(RBF)类型；与LSTM相关的预测模型的隐藏层单元数量设置为100，梯度阈值设置为1，迭代次数设置为150，激活函数设置为S型函数(Sigmoid)类型。为了消除随机因素的影响，所有预测模型进行20次仿真实验，去除各自实验结果中最坏和最好的情况后，以平均值作为最终的预测结果。

表2 实验对照组

当预测步长为1时，各个模型预测结果的评价指标如表3所示，滑动预测24 h的结果如图6所示。由表3可知，MG-ELM在所有预测模型中的RMSE指标值和MAE指标值最小，说明文中模型的单点预测值与实际值最为接近；MG-ELM在所有预测模型中的R2系数最大，说明文中模型的整体拟合度最高。观察图6中各个模型预测数据形成的曲线形态，所有模型在进行单步预测时均能较好地拟合出原始负荷数据的曲线形态，但在9:00、16:00、24:00等时刻ELM和LSTM的预测值与原始值存在较大差异。

图6 预测步长为1时各个模型的预测结果Fig. 6 Prediction results of each model when the prediction step is 1

表3 预测步长为1时的预测评价指标对比

当预测步长为7时，各个模型预测结果的评价指标如表4所示，滑动预测24 h的结果如图7所示。由表4可知，随着预测步长的增大，各个模型的预测精度均有下滑，但是MG-LELM和MG-LSTM均保持较好的预测质量。观察图7中各个模型预测数据形成的曲线形态，ELM与原始负荷数据形态差异最大；LSTM与原始负荷数据虽然形态相似，但是各个时刻的负荷值相差较大；MG-ELM和MG-LSTM不仅与原始负荷形态相似，所预测的负荷大小也与原始负荷大小相近。表明通过变分模态分解算法和混沌时序分析方法，针对负荷数据进行多粒度的时序特征处理，能够提升原有模型的多步长预测精度。

表4 预测步长为7时的预测评价指标对比

图7 预测步长为7时各个模型的预测结果Fig. 7 Prediction results of each model when the prediction step is 7

4 结束语

文中MG-KELM模型通过变分模态分解建立时间多粒度的极限学习机进行短期负荷预测，考虑负荷数据存在时序数列的自相关性，通过混沌时序分析方法计算时间窗的大小。不同模态分量的中心频率不同，不同模态的自相关性强弱也不同，针对每一种模态分量进行混沌相空间时序分析，建立各自的预测模型。这种多粒度的负荷预测模型，可以提高所有模态的拟合程度，最终提升对原始负荷数据的预测精度。结果表明，通过变分模态分解的方法进行多粒度时序预测可以提升原始预测模型的精度，通过混沌时序分析方法可以估算最佳时间窗，提高各个模态的预测精度。