基于随机森林算法和粗糙集理论的改进型深度学习短期负荷预测模型

2024-01-06 10:10:06封钰宋佑斌金晟冯家欢史雪晨俞永杰黄弦超

发电技术 2023年6期

封钰，宋佑斌，金晟，冯家欢，史雪晨，俞永杰，黄弦超

（1.国网江苏省电力有限公司苏州供电分公司，江苏省苏州市 215004；2.国网浙江省电力有限公司杭州市钱塘区供电公司，浙江省杭州市 310000；3.华北电力大学电气与电子工程学院，北京市昌平区 102206）

0 引言

短期电力负荷预测对保障电力系统安全经济运行具有重要意义[1-3]。近年来，随着全球电力市场不断发展，现货市场和日内交易制度不断完善，对负荷预测精准度的要求也越来越高[4-8]。影响负荷的因素多种多样，常见的有天气因素(温度、湿度、日照强度等)和时间因素(工作日、节假日、当前具体时间等)[9]。同时，一些政策性因素也会导致负荷规律发生变化，如疫情管控导致工厂减产、停工，造成用电负荷下降；对电动汽车的鼓励性政策导致用电负荷增加。以上因素使得短期负荷预测呈现出极强的非线性和随机性特点。

到目前为止，短期负荷预测方法主要有传统预测方法和启发式预测方法2类[10-14]。传统预测方法包括时间序列法和回归分析法等，缺点在于数学模型较为简易，预测的精准度有待提高[13-14]。启发式预测方法包括支持向量机法和神经网络法等，因具有一定的自适应能力，近几年在非线性预测领域被广泛使用[10,12]。然而，支持向量机法存在过于依赖核函数的局限性；神经网络法的训练效果往往取决于网络结构，目前通过神经网络进行负荷预测的研究大多采用经验法选择大量特征量作为输入，而没有进行特征量的评判精简，导致神经网络结构复杂、训练费时[15-16]。因此，如何准确地选择神经网络输入特征量十分重要。

随机森林(random forest，RF)算法是一种基于决策树的自学习算法，能够进行数据的分类和回归，在电气工程等领域应用广泛[10-12,17-18]。文献[18]将随机森林算法和神经网络相结合，进一步提高了预测的精准性，但未对预测结果进行修正，且评价模型全部聚焦在整体，既未对局部预测点的误差进行研究，也没有将负荷预测中的突变点纳入研究范围。

综上所述，为进一步完善研究，本文提出一种基于RF 算法和粗糙集理论(rough set theory，RST)的改进型深度学习(deep learning，DL)短期负荷预测模型(RF-DL-RST)。该模型引入政策因素，与时间、天气因素一起建立负荷预测特征集，将关键特征量和历史负荷值作为深度学习的输入、输出项进行训练，并通过粗糙集理论修正预测结果。最后，以苏州某地区电网为例，对该模型的有效性进行仿真验证。

1 随机森林算法的特征量提取原理

1.1 随机森林算法简介

随机森林算法示意图如图1 所示。随机森林算法的关键在于决策树，通过对每棵决策树的预测结果采用投票或者加权平均等方式得到预测或回归结果。

图1 随机森林算法示意图Fig.1 Schematic diagram of RF algorithm

关于决策树的形成，国内外研究者提出了很多种决策树算法，如ID3、C4.5、分类回归树(classification and regression tree，CART)这3 种算法都是采用从顶部出发、自上而下形成决策树的方法[19-20]。在决策树形成过程中，每一个新的节点都需要选择新的属性作为分裂的依据，这3 种决策树算法不同点在于生长过程中叶子分裂的抉择判据。其中，CART 对回归树使用最小均方差作为分裂的属性度量，对分类树使用基尼指数(Gini index，GI)作为分裂判据[19-20]。当运用随机森林算法进行分类时，采取投票的方式确定最终结果，当运用随机森林算法进行回归时，采用取均值的方式得到预测结果。此外，为了降低过拟合、随机误差对预测结果的影响，一般将原始数据分为训练集和测试集，而后利用bootstrap 方法进行训练集抽取，接着采用CART 算法从上到下逐个对每一棵决策树进行训练，直到满足要求。

1.2 特征量提取

如何选择数据集中的关键特征量对降低模型复杂度、缩短运算时间十分重要。随机森林算法进行关键特征量提取时，一般采用基尼指数或袋外数据错误率进行评价[19-22]。采用袋外数据错误率提取特征量的算法详见文献[21-22]，本文采用基尼指数的方式进行研究，原理如下。

假设数据集有J个特征量(X1,X2,X3,…,XJ)，C个类别，I棵决策树，则节点m的基尼指数为

特征量Xj在节点m的重要性评分采用节点m分枝前后的基尼指数变化量表示：

式中Gl和Gr分别为节点m分枝后2 个新节点l、r的基尼指数。

设定特征量Xj在第i棵树中出现的节点集合为M，则特征量Xj在第i棵树的重要性表示为

综上，特征量Xj在RF中的重要性可表示为

由此，可以对数据集中的各个特征量进行重要性排序，提取重要特征量。

2 深度学习原理

深度神经网络(deep neural network，DNN)是深度学习的一种框架，它是一种具备至少一个隐含层的神经网络。与传统BP神经网络相比，两者有着相似的结构，但DNN 隐含层的层数一般较多，并采用了layer-wise 的训练机制，克服了BP神经网络训练中的梯度扩散问题。与传统的求解方法相比，训练好的DNN具有较高的计算效率和计算精度[23]。

典型的DNN 网络结构如图2 所示，首尾分别为输入、输出层，中间层都是隐含层，各层间是全连接关系(前一层的任一节点一定与后一层的任一节点连接)。假设第i-1层有g个节点，则第i层的第j个节点的输出表示为

图2 DNN示意图Fig.2 Schematic diagram of DNN

式中：σ(·)为激活函数，用于对某一节点的输入求和并进一步增强；为第i-1层的第k个节点到第i层的第j个节点的权重系数；为第i-1层的第k个节点的输出；为第i层的第j个节点的偏差系数。

本文采用均方差损失函数，表示如下：

式中：P为训练样本数；yp，t为t时刻p样本的期望值；为DNN输出的预测值；T为预测时段数。

同时，本文对损失函数引入L2正则化，目的在于限制权重参数在一定范围，以适应异常值和噪声，表达式[23]如下：

式中：α为正则化超参数；ω为权重向量。

设定参数的学习率为μ，通过式(7)反复更新隐含层参数，直至预测精度收敛[23-24]。

3 预测修正模型

粗糙集理论是一种处理不确定性和模糊问题的数学工具，能够对不一致、需要误差修正或有数据丢失的缺陷信息进行有效修正和分析[25-26]。

利用粗糙集理论建立负荷预测修正模型[25-26]：

式中：yt+1和分别为t+1时刻预测值和修正值；st为尺度因子。

要求解尺度因子st，需构建一个信息系统。本文假设粗糙集理论所依的信息系统为K=(U，A)，其中：论域U为DNN 输出的预测值集合；A=C∪S为属性集，S={st}代表决策属性，条件属性C为数据集特征量的集合，基于已有的研究结果[25-26]，此处定义C={a，b，c}。其中：

至此，通过式(9)—(12)可对负荷预测值进行修正。

4 预测结果评价模型

本文设置均方误差(mean square error，MSE)和最大绝对误差(maximum absolute error，MAE) 2个指标对预测结果进行评价。预测负荷和真实负荷的均方误差用于评价整体预测效果；预测负荷和真实负荷的最大绝对误差用于评价局部点的预测效果。MSE和MAE分别表示如下：

式中：N为预测点的数量；yn为第n个预测点的真实值；为第n个预测点的预测值。

5 RF-DL-RST预测模型

RF-DL-RST 模型框架如图3 所示。本文的目标是对电力负荷进行短期预测，输入的特征量包括天气、时间等多种因素，与预测结果(即负荷数据)存在量纲、单位等差异，需要对预测数据进行预处理，具体方法见文献[26]。

图3 RF-DL-RST模型示意图Fig.3 Schematic diagram of RF-DL-RST model

影响地区用电负荷的因素非常多，有天气、时间和政策等因素，然而DNN的预测精度并不与输入项呈正相关，当输入项过多时，不仅会造成网络结构复杂，还有可能劣化模型精度。

参照文献[18]，本文建立负荷预测的特征集。不过，本文认为其时间因素中的周日期和工作日、节假日构成重复，故剔除周日期特征量。同时，考虑到近几年疫情封控对社会用电方式的影响，本文将该日是否封控也作为一个特征量进行研究。此外，本文还补充了平均温度、平均风速、日出时间、日落时间等天气因素作为特征量。具体预测特征量见表1。

表1 预测特征量Tab.1 Prediction characteristic variables

6 算例分析

本文使用苏州某地区电网2022 年10 月28 日至2023 年2 月4 日的负荷数据对RF-DL-RST 预测模型进行仿真验证。为验证RF-DL-RST模型的优越性，设置2 个对比模型，其中：对比模型1 是RF-DL 模型，无RST 修正部分；对比模型2 是DL-RST 模型，无RF 特征量筛选部分。3 个模型的相关参数选择一致。

6.1 负荷预测关键特征量提取

对表1所选取的预测特征量进行重要性排序，RF 模型中决策树数目设置为500，分裂特征数取3，训练集和测试集比例为9∶1。图4 为特征量重要性分析结果。

图4 随机森林算法特征量重要性分析结果Fig.4 Results of importance analysis of characteristic variables based on RF algorithm

从图4 可以看出，表1 中15 个特征量按重要性得分从低到高排序后，当日小时、最低温度、平均温度、天气条件、节假日、工作日、日出时间、是否封控这8 个特征量得分较高，因此将其作为DNN模型的输入项。

6.2 深度学习训练

将由RF筛选的8个关键特征量和历史负荷数据分别作为DNN 模型的输入、输出项进行训练。DNN输入层节点数为8，输出层节点数为1。设置DNN 含3 层隐含层，节点数分别为40、30 和20，激活函数为ReLU；训练集和测试集比例为9∶1，训练次数为200次。

在迭代过程中，预测值的均方误差随训练次数的变化曲线如图5 所示。可以看出，均方误差在训练次数为150 左右时开始收敛，不断趋近于975 MW2这一数值。

图5 预测值均方误差随训练次数的变化曲线Fig.5 Curve of MSE of predicted value changing with training times

6.3 RST修正

依据式(8)—(12) 分别计算条件属性C={a，b，c}，以及在t之前的决策属性S，从而得到粗糙集信息系统。鉴于粗糙集理论处理数据的要求，此处设定条件属性C={a，b，c}的编码规则[13]为

由此，可计算得到修正后的负荷预测数据。

图6为2023年2月5日的实际负荷与RST修正前后预测负荷曲线。可以看出，经RST 修正后的预测负荷曲线基本介于实际负荷曲线和未经RST修正的预测负荷曲线之间，更接近实际负荷曲线。

图6 实际负荷与RST修正前后预测负荷曲线对比Fig.6 Comparison of actual load and predicted load curves before and after RST correction

6.4 对比分析

根据式(13)、(14)可计算出预测结果的评价指标。RF-DL-RST 模型与RF-DL、DL-RST 模型的指标对比如表2所示。

表2 3个模型的指标对比Tab.2 Index comparison of three models

从表2 可以看出，与RF-DL 模型相比，RFDL-RST 模型的MSE 指标降低了30.198%，整体预测结果更接近真实值，MAE指标也从5.77%下降到4.01%，在07:00—08:00(负荷迅速增加)和22:00—23:00(负荷迅速降低)等负荷变化较大的特殊时段，预测精准度大大提高。

此外，与DL-RST 模型相比，RF-DL-RST 模型的MAE 和MSE 指标分别降低了15.221%和21.425%，且RF-DL-RST模型的DL训练时间缩短了10.186%，说明通过RF 模型精简DL 输入特征量能够提高负荷预测效果。

综合以上分析可知，RF-DL-RST 模型的预测结果明显更优，验证了本文预测模型的有效性。

7 结论

针对短期负荷预测，基于随机森林算法和粗糙集理论，提出RF-DL-RST模型。通过实例计算分析，得到如下结论：

1）通过RF 对影响负荷的因素进行重要性评估，缩短了模型运算时间，提高了预测的精准度。

2）通过RST对模型结果进行修正，并从整体和局部2 个角度建立评价模型，验证了方法的有效性，大大提高了对负荷突变点的预测精准度。