基于CNN-LSTM混合神经网络的光伏发电量预测方法研究

2024-01-22 06:35王登海安玥馨廖晨博马家园
关键词:天气卷积发电

王登海,安玥馨,廖晨博,马家园

(1.长庆油田分公司,陕西 西安 710103; 2.长庆油田分公司 新能源事业部,陕西 西安 710103;3.长庆油田分公司 数字和智能化事业部,陕西 西安 710103; 4.西安石油大学 计算机学院,陕西 西安 710065)

引言

光伏(PV)发电作为一种清洁可再生的能源形式,已成为全球能源转型不可或缺的一部分。随着技术进步和成本降低,光伏发电的应用日益广泛。光伏发电预测是通过监测和分析光照、温度、气象等因素,预测未来阶段时间内光伏发电产量[1],对于光伏发电系统的有效运行与管理至关重要,可优化发电计划、提高效率、降低成本,对电网稳定运行和电力公司收益具有重要意义。然而,预测光伏发电产量会面临诸多困难和问题:一是受天气、季节、地理位置等多因素,使预测变得复杂且困难;二是光伏发电系统不确定性,如元件老化、故障等,会增加预测的难度。

目前,预测光伏发电最新的方法与模型有统计学方法、机器学习模型模拟和物理模型模拟。如,孟魏、郭腾炫等[2]提出的基于长短期记忆神经网络(Long Short-Term Memory,LSTM)优化的短期光伏发电预测方法,用LSTM神经网络模型进行预测;马晓玲等[3]提出的模糊聚类-BP神经网络短期光伏发电预测模型,先将数据集进行模糊聚类分析,然后对每一个聚类采用BP神经网络模型进行预测,以提高预测的准确性;Su-Chang Lim等[4]提出的基于CNN-LSTM混合模型的太阳能发电功率,是对电功率进行特定间隔时间预测。基于此,本文以直接影响电力公司收益的发电量为预测研究对象,增加了卷积神经网络(Convolu Neural Networks,CNN)卷积层语义特征提取,同时引入LSTM对不同时序序列数据的处理、分析,以应对不同地域天气时序性变化。

1 CNN-LSTM混合神经网络模型基础

1.1 卷积神经网络

CNN是一种特殊结构的神经网络,主要用于处理网格拓扑结构的数据,包括堆叠的卷积层、池化层和全连接层[5]。图1为2D-CNN的示意图。

图1 2D-CNN示意图

由图1可看出,首先卷积层(Convolutional Layer)通过给定尺寸大小的过滤器(Filter)和步幅(Stride)从每个输入数据的矩阵中提取特征图(Feature Map)。特征图通常要小于输入矩阵。然后,将特征图用作下一层的输入,下一层可以是另一个卷积层或池化层(Pooling Layer)。在经过卷积层和池化层之后,提取到的特征图将被展平(Flatten)并传递到完全连接层。完全连接层可以根据不同的输入选择激活不同的特征图。

设δ(l+1)是网络中第l+1层的误差项,J(W,b;x,y)为损失函数,其中(W,b)为误差参数,(x,y)是训练数据和标签对。如果第l层是全连接层且直接连接到第l+1层,则第l层的误差

δ(l)=((W(l))Tδ(l+1))·f′(z(l))。

(1)

其参数的梯度式分别为

∇W(l)J(W,b;x,y)=δ(l+1)(a(l))T;

(2)

∇b(l)J(W,b;x,y)=δ(l+1)。

(3)

如果第一层是卷积层和池化层,则第l层的误差

(4)

(5)

(6)

1.2 长短期记忆网络

LSTM是递归神经网络(RNN)的衍生结构,旨在解决标准RNN中存在的梯度消失问题。LSTM通过引入一种自适应门控机制,以决定是否保留之前状态的记忆以及是否存储当前数据中的信息,通过单元自身的学习来权衡信息的保留或遗忘[5]。

LSTM单元在处理信息时有3种依赖:前一个单元保留的信息,前一个单元的隐藏信息输出和当前输入的信息。隐藏信息在同一时间步被当前输入更新,在前一个时间步处于隐藏状态。LSTM网络类似于一条传输线,该传输线将模块互连。在 LSTM内部有3个门,依次为输入门(Input Gate)、遗忘门(Forget Gate)和输出门(Output Gate)。其中遗忘门用于存储旧信息的权重向量,输入门用于获取新信息的权重向量,输出门用于输出待输出的候选向量。LSTM网络可以处理长度可变的序列,并捕获其中的长期依赖性和非线性关系,已经成为一种处理序列数据的标准方法。其运算过程如图2所示。

图2 LSTM单元内部运算过程

LSTM单元由单元状态(Ct),遗忘门(ft),输入门(it)和输出门(Ot)组成。设t时的输入序列为向量Xt,输出为ht时,3个门及LSTM单元内部计算式分别为

遗忘门:

ft=σ(WfxXt+Wfhht-1+bf);

(7)

输入门:

it=σ(WixXt+Wihht-1+bi);

(8)

输出门:

(9)

Ct=ft⊗Ct-1+it⊗Ct;

(10)

Ot=σ(WoxXt+Wohht-1+bo);

(11)

ht=Ot⊗tanh(Ct) 。

(12)

2 混合神经网络模型设计

光伏发电量的影响因素来源众多,包括人为因素(设计欠佳、忽视清洁等),设备因素(光伏组件匹配度、逆变器效率、交直流线损、光伏组件安装方式等),环境气象因素(温度、天气状况、降水量等)。现设备在装机时设备因素就已确定。只要对设备定期地维护,则人为因素影响不大。抛开前二者因素外,天气情况的时序性变化会较大程度影响发电量[6]。因此用天气因素进行实验。

光伏发电影响因素的时间序列数据复杂,其同一时间序列中既有线性部分又非有线性部分,但其不同时间序列中的简单子序列模式却存在一定的相似性[7]。CNN在处理空间结构信息方面非常擅长。对于预测光伏发电量,可以使用CNN捕捉不同位置(例如不同地区)之间的空间相关性,帮助模型更好地理解天气条件等因素如何在不同地点之间变化。LSTM是一种适用于处理时间序列数据的循环神经网络,能够捕捉长期的时间依赖关系,帮助模型记住过去几天或几周的天气条件和发电情况,便于更好地预测未来的发电效率[7]。

CNN-LSTM混合神经网络模型是将CNN用于处理空间相关性,从输入光伏发电组分时间序列数据中提取空间特征,进行下采样来缩小序列。将其输入到LSTM中,以便捕捉时间序列数据的时序特征和长期依赖关系。然后,将输出合并,形成一个综合的特征表示。将此特征表示经过全连接层处理。最后用恰当的激活函数来输出连续的预测值。混合神经网络模型的预测过程如图3所示。

图3 混合神经网络模型预测过程

3 实例分析

3.1 影响要素分析

光伏电池的工作效率受到温度的显著影响。一般来说,光伏电池在较低的温度下工作效率较高,而在较高温度下效率会下降。这是因为光伏电池的电子流动速度受温度影响,高温会增加电子的能量损失[8]。因此,同时监测最高温度、平均温度和最低温度有助于了解环境温度对光伏发电效率的影响。降水量和天气状况直接影响太阳光的强度和光照时长。阴雨天气或多云天气会减少太阳光的强度,从而降低光伏电池的发电效率。因此,监测降水量和天气状况可以帮助预测光伏发电效率的波动[9]。综合考虑这些气象因素, 将其作为预测光伏发电的输入可以提供更全面的信息, 有助于建立更准确的预测模型。选取对光伏发电效率影响较大的因素:最高温度、平均温度、最低温度、降水量和天气状况等,进行关联度分析,使用皮尔逊(Pearson)相关系数和斯皮尔曼(Spearman)相关系数,两者都有分析非线性数据关系的优势。具体关联度如图4所示。

图4 关联度分析结果

由图4可以看出,除了降水量对发电效率的影响甚微之外,最高温度、平均温度、最低温度和天气等因素均对发电效率有一定的影响,其中天气的影响最大, 达到了70%以上。因此用最高温度、平均温度、最低温度和天气分别作为混合神经网络模型的输入比较恰当。

3.2 数据清洗

本文使用榆林市神木县和庆阳市庆城县两家发电厂的相同装机规模的历史光伏发电数据,并结合温度、辐照、降水量、天气状况等气象信息作为预测数据,采样时段为典型工作日6:00-18:00,采样频率为1 d/次,选取2个不同厂站2018-2022五年的历史光伏发电的3 650条数据。

在收集的数据集中难免有外界因素干扰的数据,如:人为干扰,设备故障,设备需维护等问题[10]。因此,对一些可能由外界因素导致的不规则数据进行清洗以进一步提高预测的准确性。现分别用最高温度,最低温度,平均温度与有效利用时间做二维平面分析图,剔除无效数据值。具体如图5所示。

图5 各因素与发电效率散点关系

图5中,蓝色点代表最高温度、最低温度、平均温度等这些影响因素(x轴)与预测数据有效利用时间(y轴)的二维平面关系,红色线性曲线代表散点图的趋势线,深红色数据点代表要清除的数据。结合图和实际情况,在一般情况下,光伏发电的有效利用时间不可能为0。通过原始数据集中的重要记事也可得到有效利用时间为0时设备出现了故障或人为停机,这种数据会极大地影响预测的准确性。图5中非常边缘化的数据往往也是“坏数据”。将上述的两种“坏数据”剔除,可进一步提高混合神经网络模型的准确率。

3.3 预测结果及分析

为了评估所提出的深度模型的有效性,利用收集的光伏发电数据集设计以下实验。用基于CNN-LSTM混合神经网络模型和LSTM神经网络模型分别进行光伏发电预测。模型使用基于Python 3.7的PyTorch深度学习框架作为软件平台,以及运行在3.70 GHz的Intel Core I7-12700H CPU,NVIDIA RTX 3060 GPU和16GB RAM硬件环境进行训练和测试。

在训练阶段,用2018-2021四年数据分为晴天、阴天和雨雪天作为训练集数据对模型进行学习优化,设置epochs=10 000次。数据经过9层CNN,Relu激活函数,3层LSTM和全连接层(Dense)。不断地调整学习率,使模型达到最优的状态。用2022全年数据作为测试数据集进行验证,评估模型的性能并生成预测结果[10]。实验结果如图6所示。

图6 神经网络预测结果

从图6可以看出,预测值拟合了真实日发电量的变化曲线,且无论在晴天、阴天还是雨雪天气本文提出的CNN-LSTM神经网络模型都要比LSTM网络模型要好。在此引入R2_score和MSE来客观评价基于神经网络模型的拟合程度[6]。

计算后得到的R2_score和MSE具体数值见表1。表中数值为10次实验获得的平均结果。

表1 R2_score和MSE结果值

从表1可以看出,CNN-LSTM混合神经网络模型预测的有效利用时间和真实数据的平均拟合程度为90%左右,比LSTM神经网络模型提升了约4%。本文模型用最高温度、平均温度、最低温度和天气数值预测光伏发电量的效果更佳。

4 结 论

(1)提出了基于CNN-LSTM混合神经网络模型的光伏发电量预测方法,较好地解决了不同地域和天气和天气状况导致预测精度不高和传统LSTM准确度的问题。

(2)本文提出的混合神经网络的光伏发电预测模型,既能准确预测光伏发电效率区间及变化趋势,也可适应恶劣天气下的光伏发电功率突变造成的影响,有一定的实际利用价值。

猜你喜欢
天气卷积发电
“发电”
基于3D-Winograd的快速卷积算法设计及FPGA实现
天气冷了,就容易抑郁吗?
柠檬亦能发电?
谁是天气之子
盛暑天气,觅得书中一味凉
从滤波器理解卷积
Weather(天气)
基于傅里叶域卷积表示的目标跟踪算法
摇晃发电小圆球