刘义卿 陈新房
(防灾科技学院,河北 廊坊 065201)
能源是人类文明存在和发展的基础,是提高人民生活水平和发展现代科学技术的重要物质基础。人类文明的发展过程可以看作是社会主要能源不断更新换代和升级,转化利用方式不断改进的过程[1]。电力预测主要是探讨电力负荷的变化规律和影响因素[2],可以帮助监控电力的生产、传输和消耗,并平衡它们之间的关系[3]。传统的电力预测方法通常基于统计模型或时间序列模型,这些模型往往需要手动选择特征和调整模型参数,对于复杂的电力系统和大规模的数据集来说,建模和训练往往非常困难。而神经网络具有强大的自适应能力和非线性建模能力,可以自动地从数据中提取特征和建模,从而更好地适应复杂的电力系统和大规模的数据集。对确保动态平衡和智能电网的稳定可靠运行、智能电网的平稳可靠运行具有重要意义。
CNN[4]包括卷积层、激活函数、池化层和全连接层(如图1)。其中,CNN通过卷积操作提取输入数据的局部特征,并通过激活函数进行非线性变换,进而实现对数据的高效处理和分类。池化操作则用于对卷积层的输出进行下采样,进一步提高模型的鲁棒性和泛化能力。池化层可以降低数据的维度,减少模型的计算量,并增强模型的不变性。全连接层则用于将卷积层的输出转化为最终的分类或回归结果。全连接层通常也会与激活函数一起使用,以实现非线性的分类和回归[5]。
图1 CNN结构
因为时序数据只沿时间轴方向延展,所以采用一维卷积层,叠加两个成倍数关系的过滤器,通过滑动窗口捕捉时间序列数据的特征。
RNN的初衷是学习对时间序列问题的长期依赖性。实践证明,RNN在处理这一问题上具有良好的性能。同时,大量实验表明,标准RNN在训练过程中会因为迭代而导致梯度消失和梯度爆炸[6]。为了解决这个问题,Hochreiter提出了LSTM。LSTM是一种特殊的RNN,适用于处理序列数据,如语音识别和自然语言处理。它具有记忆长期依赖关系的特点,这使得它能更好地处理序列数据。LSTM的核心是长期记忆单元[7],它可以记住以前的输入和输出,并根据当前输入和上一个时间步的输出来更新自身状态。这种能力使得LSTM在处理时序数据时表现出色。记忆单元由三个门(Gate)控制:输入门(Input Gate)、遗忘门(Forget Gate)和输出门(Output Gate)。输入门用于控制新输入的信息,遗忘门用于控制以前的信息是否应该被遗忘,输出门用于控制当前状态的输出。LSTM中的门由逻辑回归单元控制,其激活函数为sigmoid函数,用于将输入值映射到0到1之间。门的输出值接近1时,门完全打开;接近0时,门完全关闭。这种机制使得LSTM能够有效地控制信息的流动,从而更好地处理序列数据。
LSTM的基本网络单元如图2所示。输入、状态存储器单元和中间输出共同确定状态存储器单元的遗忘部分。在输入门中,在sigmoid和tanh函数之后确定状态存储器单元中的保留向量。中间输出由更新的和输出,计算如公式1至公式6所示[8]。
图2 LSTM基本结构图
对于时间步t,假设{xt-1,xt}{ct-1,ct}和{ht-1,ht}分别表示前一时刻和当前时刻的输入、记忆状态和隐层状态。则LSTM单元的更新公式如下:
上述公式中,sigmoid函数σ(x)=1/(1+exp(-x))为激活函数,而tanh则被用于门控制。W和b分别代表记忆单元和门控制的权重和偏置。从上述更新公式可以看出,遗忘门用于选择性地遗忘最后一次的单元状态并校正参数,输入门用于更新信息的状态,输出门用于读取、输出和校正参数。LSTM采用“门”结构来增加信息的传输和交换,解决了模型训练中的“梯度消失与爆炸”问题,可以应用于许多场景[9]。
电力消耗预测是一种重要的电力系统运营和规划任务,可以帮助电力公司预测未来的电力需求和电力价格,从而更好地制定电力调度和发电计划,CNN+LSTM组合模型可以用于电力消耗预测。
在CNN+LSTM模型中,LSTM可以用于建模时间序列数据中的长期依赖关系,从而更好地理解和预测电力消耗。LSTM可以自动地从CNN提取的特征序列中学习到时间序列数据的模式和规律,并生成预测结果。CNN+LSTM模型通过反向传播算法进行训练和调优,以最小化预测误差。在训练过程中,可以使用交叉验证等技术来评估模型的性能和泛化能力,从而选择最优的模型和参数。经过训练后的CNN+LSTM模型可用于预测未来的电力消耗,输出预测结果,从而辅助电力公司制定出更好的电力调度和发电计划,以满足未来的电力需求。
通过CNN与LSTM的实验结果发现单一的传统经典预测方法在电力消耗预测中或多或少都存在预测准确率不高、泛化能力不强的问题。又因为实际电力负荷波动随机性较强,预测时需考虑的因素较多,因此利用神经网络组合模型的优势,采用CNN卷积神经网络充分提取时间序列的特征,输入到LSTM网络进行预测,使得模型的预测准确率更高、泛化能力更强,于是结合上面两种方法,构建了CNN+LSTM模型,模型结构如图3所示。
图3 CNN+LSTM基本结构图
电力消耗的预测受到多种因素的影响,需要使用多维特征参数集,其中包含多种类型的特征参数。然而,负载具有强烈的非线性和随机波动性,从而降低了预测精度和模型的可解释性。本研究使用的数据集包含了某市2017年1月1日至2017年12月31日期间每10分钟获取的配电网历史数据。时序数据按照3:1的比例进行顺序切分,数据集的划分情况如图4所示。
图4 数据集划分
本实验采用的数据集特征向量共包含6个维度:“温度”“湿度”“风速”“一般扩散流”“扩散流”和“总功耗”。温度:温度对电力消耗有直接影响。在许多设备中,温度升高会导致电子元件的内阻增加,从而增加设备的功耗。湿度:湿度对电力消耗的影响通常是间接的。高湿度环境下,设备可能需要额外的冷却措施来保持温度稳定,例如空调系统的运行。这些额外的冷却措施可能会增加设备的功耗,导致更高的电力消耗。风速:风速可以影响设备的散热效果。使设备的温度保持在较低水平,从而降低设备的功耗。一般扩散流和扩散流:一般扩散流和扩散流是在流体力学中描述流体运动的概念。在某些设备中,例如风机或风扇,流体(通常是空气)的流动会消耗能量。因此,较大的一般扩散流或扩散流会导致设备消耗更多的电力。总功耗:总功耗是设备在特定时间内消耗的总电力。温度、湿度、风速、一般扩散流和扩散流等特征的变化可以影响设备的功耗,从而影响总功耗。这些特征的变化可能导致设备消耗更多或更少的电力。
通过相关性分析6个特征的参数均为每10min采样一次,数据分布如图5。
图5 特征数据分布与相关性热力图
从图5数据分布与相关性分析中可以发现数据拥有周期性且扩散流影响系数最低,湿度影响最大。
归一化处理是将数据按照一定比例缩放,使得数据落在特定的范围内,常用于提高模型收敛速度、防止梯度爆炸和提高计算精度。在负荷预测中,输入数据可能具有不同的量纲,不同的特征参数具有不同的特性和数量级。没有标准化的训练会削弱较低数量级数据的影响。在实验中,使用Min-Max Scaling对数据x进行线性变换,数据大小限制在[0,1]之间,计算方法如式7所示。
式中:xi是第i个采样点的原始实测数据,是归一化后的值,xmax和xmin分别是实测数据的最大值和最小值。
本文使用了时间序列分析中常见的评估指标,包括平均绝对误差(MAE)、均方根误差(RMSE)和平均百分数误差(MAPE)来衡量模型的预测表现,其计算方法如式8~10所示。
式中:yi是采样点i的实际值;yfi是采样点i的负荷预测值;N是采样点的数量。
为了确保模型的训练和预测过程具有科学性和统一性,本研究选择测试集数据作为模型预测结果的评估标准[11]。
图6分别为CNN、LSTM、CNN+LSTM各模型选取500个连续数据节点的测试拟合效果与局部预测拟合效果[12]。并局部放大了6个数据波动的点,通过测试结果很容易发现混合模型与单一模型对比,结果有明显的优势。曲线拟合较好,准确率更高,数据波动较大的情况下容易发现LSTM的预测效果强于CNN。从表1的数据来看,CNN的平均绝对误差、平均百分比误差和均方根误差均大于LSTM与CNN+LSTM。如表2所示分别为CNN、LSTM、CNN+LSTM分别在训练250、200、200轮,梯度下降方法分别采用Adam、Adam、Nadam时,学习率分别为0.0001、0.001、0.01时取得最优结果MAPE值分别为1.889、1.047、0.734。相比单一模型来说,混合模型复杂度更高,准确率相对来说也有所提升[13]。
表1 各模型最优结果数据
表2 模型最优参数结果
图6 CNN、LSTM、CNN+LSTM模型测试结果
在以上基础之上总结各个网络的优点,CNN+LSTM模型可以比单独使用CNN或LSTM模型更好地处理序列数据。CNN可以自动地从序列数据中提取特征,而LSTM可以捕捉序列数据中的长期依赖关系,从而更好地理解和预测序列数据。搭建混合模型CNN+LSTM对比CNN与LSTM结合了它们各自的优点,在数据平缓与波动较强的节点直接表现出了很好的效果,其中CNN+LSTM优于LSTM这也充分体现了LSTM适合于时序处理任务,CNN+LSTM模型相比于单独使用CNN或LSTM模型,具有更好地处理序列数据、图像和序列数据的组合、更好的泛化能力和更高的预测精度等优势,可以用于电力消耗预测[14]。
本文采用卷积神将网络、长短记忆时间以及卷积神将网络与长短记忆时间网络结合使用的方法,对某市配电网的用电量进行了预测。如图6分别为CNN、LSTM、CNN+LSTM各模型选取500个连续数据节点的测试效果。结合表1中的、RMSE、MAE、MAPE三个数值与图6的测试结果,发现混合模型相比单一模型的准确率更高。
精准的预测电力消耗是电力管理的重要组成部分。在今后的研究中,可以搭建更为复杂的网络进行预测研究。