基于生成对抗网络的太阳辐照度预测模型

2024-01-15 05:44鹿晨东许英朝沈亚锋
厦门理工学院学报 2023年5期
关键词:辐照度太阳混合

鹿晨东,许英朝*,张 帆,沈亚锋

(1. 厦门理工学院光电与通信工程学院,福建 厦门 361024;2. 福建省光电技术与器件重点实验室,福建 厦门 361024;3. 厦门华联电子股份有限公司,福建 厦门 361101)

可再生能源取之不尽用之不竭,且几乎不会对环境或气候造成破坏,如太阳能量大且易于获取,被视为最有前景的可再生能源[1-2]。地球表面接收的平均太阳辐照度为1 367 W·m-2,全年约为1.8×1017W[3],如此巨大的能源能满足全球对电力的所有需求。然而,太阳能发电受太阳光照、湿度、气溶胶等多种自然特征因素的影响具有很强的波动性,这对维持电网的稳定安全造成了极大的影响[4]。因此,为了保障电网的安全经济运行水平,需要进一步进行光伏精确预测[5]。太阳辐照度是光伏发电中最具影响力的因素,准确预测太阳辐照量变化对光伏电力预测、光伏电网整合、供应平衡和实时调度至关重要[6]。

目前,太阳辐照度预测的主流模型可以分为物理模型、经典统计模型和现代预测模型3类。物理模型模拟大气的耦合物理方程,利用数值天气预报来预测太阳辐照度[7],它利用当前的天气信息建立数学模型,用于建立太阳辐照度与物理条件(如与大气有关的物理因素)之间的关系。然而,由于数值天气预报模型过于复杂,计算资源消耗巨大,在用于短期预测时可能会造成较大的延迟[8]。统计模型根据太阳辐照度的历史趋势预测未来的太阳辐照度,经典的统计模型有自回归移动平均[9]、多元线性回归[10]、自回归综合移动平均[11],这些模型结构简单,通常采用只有少量隐藏层的浅网络,难以拟合短期内外部环境变化引起的辐照度波动。

近年来,越来越多的现代预测模型正在被开发出来,其中最为流行的就是深度学习模型。深度学习模型具有足够的信息提取能力和非线性表示能力,因此被用于预测太阳辐照度。文献[12]总结了近20 a 来基于机器学习方法的辐照度预测的研究成果,并讨论了现有的机器和深度学习模型,结果表明,基于深度学习模型的特征提取概念在现有的太阳辐射预测研究中已经普遍存在。当前最流行的深度学习模型主要包括卷积神经网络(convolution neural network,CNN)、BP 神经网络、门控循环单元(gate recurrent unit,GRU)、生成对抗网络(generation adversarial networks,GAN)等。杨春熙等[13]将GRU应用在短期辐照度进行预测。Wen等[14]采用LSTM模型来预测太阳能负荷,预测结果存在一定的滞后问题。马景奕等[15]研究了基于RNN 及其变体对短期太阳辐照度的预测性能。黄棋悦等[16]将GAN 应用在风电爬坡功率的预测中,并验证了所提方法的可行性。考虑到前人使用的单一模型通常采用包含少量隐藏层的浅网络,其处理复杂非线性的能力有限,因此越来越多的学者开始使用综合不同预测技术的混合方法,通过组合多个单结构模型应用于时序预测来提高测量精度。Zhou 等[17]提出了一种结合注意力机制的LSTM 模型来预测光伏发电量,考虑到温度数据对光伏发电的影响,关注机制自适应地关注更重要的输入特征,预测效果优于每个时间场的比较模型。Wang等[18]提出了一种基于GAN 和CNN 的天气分类模型,由原始和生成的太阳辐照度数据组成的增强数据集训练基于CNN 的天气分类模型,结果表明,模型性能有所改进。牛宇童等[19]将WGAN和LSTM相结合应用于光伏发电预测研究中,将其预测准确性提升了33.4%。因此,多个模型组合可以发挥各自的能力,从而极大地提升预测精度。

本文延续多模型组合的预测研究,但区别于前人的组合方式,提出一种新的深度学习混合模型,将自编码器(auto encoder,AE)与条件深度卷积生成对抗网络(conditional-depth convolution generation adversarial networks,C-DCGAN)相结合,构成AE-C-DCGAN 模型。一方面,将AE 应用在太阳辐照度的预处理步骤中,通过降噪AE 提取原始数据有效特征,降低其存在的噪声,保证数据的真实度并提高鲁棒性;另一方面,将C-DCGAN 应用在辐照度的预测过程,将卷积网络引入GAN 的结构中,在更好地学到辐照度数据的特征规律的同时,自主构造短期的历史测量数据与预测数值间的映射关系,以更准确地生成接近真实场景的辐照度数据。

1 模型构建

本文所提出的短期太阳辐照度预测模型整体框架如图1 所示。首先,使用AE 对辐照度数据进行预处理,然后将处理后的数据输入到由卷积和反卷积层堆叠而成的生成对抗网络中得到预测结果。

图1 AE-C-DCGAN模型整体框架图Fig.1 Overall framework of the AE-C-DCGAN model

1.1 自编码器(AE)

图2 AE结构Fig.2 AE structure

CNN 有着较强的特征提取能力,目前已经被广泛应用到诸多领域中[20]。CNN 网络层中的隐藏层单元是由卷积层、池化层、全连接层组成的。与传统的完全连接的神经网络相比,CNN 的明显优势是由于权重共享技术,要估计的参数数量减少。因此,本文使用一维卷积神经网络作为基础模型,将其嵌入到AE中,不仅精简了混合神经网络的结构,也提升了运行效率和预测性能。

AE主要包含编码和解码2个过程,编码是将输入的辐照度数据x通过内部层级映射到中间的隐含层,解码则是将中间数据h 转化为输出的重构向量z。其通过最小化损失函数,以无监督训练来提取原始数据的降维特征。AE网络的编码过程、解码过程、损失函数的表达式为

式(1)~(3)中:sf、sg代表Sigmoid 函数;wf和wg为编码器和解码器的权重;bf和bg为编码器和解码器相对应的偏置;N为样本总数;θ={wf,bf;wg,bg}表示需要优化的参数集合;L(xi,zi)为损失函数。通过多次训练,得到最小的L,使得模型获取最多的特征信息以更好地重构高质量的原始数据。

1.2 条件深度卷积生成对抗网络(C-DCGAN)

GAN 可以学习特定的数据分布,并从相同的分布中创建新的数据。GAN 的核心思想是受两人零和博弈的启发,通过对抗性学习,同时训练生成器和判别器。生成器基于真实数据的学习分布从噪声中生成新样本,而判别器旨在区分输入数据是来自生成器还是真实样本。G 和D 在训练过程中minmax二人博弈模型可表示为

式(4)中:E(∙) 为期望值;D(G(z))为生成的数据,G(z)是D中判别为真的概率;D(x)为真实数据x在D 中判别为真的概率;噪声数据z的分布为z~P(z);P(x)为太阳辐照度的真实分布。由于原始GAN 生成目标不明确且可控性不强,有人提出了CGAN,其核心在于将条件信息y 融入生成器G 和判别器D中,y 可以是任何标签信息。基于此,本文将CGAN 的条件信息设定为历史辐照度数据y(y ∈x)。生成网络G 基于历史数据训练得到下一时刻的模拟数据,判别网络D 以y为前提条件判断输入数据是否为真实数据。

此外,本文CGAN 模型的内部网络结构参考了DCGAN 的网络结构,它采用2 个CNN 来改善传统GAN 的结构,这种结构可以通过使用矢量算术运算来降低数据处理的复杂性,不仅提高了数据样本生成的质量,也加快了收敛的速度。因此,本文结合CGAN 与DCGAN 的主要思想,构建了预测模型C-DCGAN,该模型由生成器和判别器2个神经网络组成,其训练过程如图3所示。

图3 C-DCGAN模型的训练过程Fig.3 Training process of C-DCGAN

C-DCGAN目标函数可表示为

一些离退休党员思想松懈,认为自己在职在岗时为革命、为工作兢兢业业,无私奉献是应该的,到了离退休以后,就认为自己什么都退了,不用接受思想政治教育了。思想出现老化,对在国家发展过程中出现的政治、经济和社会问题不能以发展的眼光、包容的心态去面对,对社会分配不公、党内腐败等不良现象应对消极,对党的活动和地方建设不关心、不热情、不参与,有的甚至对党和政府的领导产生悲观、怀疑的态度。

1.3 AE-C-DCGAN模型

基于以上理论,本研究构建了一个深度混合预测模型,即AE-C-DCGAN,该模型的预测总体流程见图4。由图4 可见,数据在模型中训练的具体流程为:1)输入单变量的太阳辐照度数据X;2)使用最大-最小值方法对数据进行归一化处理;3)使用AE对数据进行预处理;4)将经预处理的数据划分为训练集和测试集;5)将划分后的数据放到搭建好的预测模型C-DCGAN 中进行训练,并且通过反归一化,得到最终预测结果;6)使用评价指标对预测结果进行评估。

图4 基于AE-C-DCGAN模型的预测总体流程图Fig.4 Overall flow of prediction based on AE-C-DCGAN model

2 实验结果及分析

2.1 实验数据

本文选择了NSRDB公开网站的辐照度数据进行模型性能评估,其测量站位于西经119.32°,北纬33.68°。所采集的是美国德克萨斯州某地区的2019年1月1日至2019年12月31日的太阳辐照度数据,时间间隔为5 min。除了将原始数据集在训练前进行预处理和归一化处理外,还考虑到该地区的气候四季分明、季节性特点显著等,把一年的数据划分为春、夏、秋、冬4 个季节的数据集分别进行实验,其中每个数据集分别分为训练集(包含72 d约10 368个样本)和测试集(包含18 d约2 592个样本)。

2.2 实验装置

本文所有实验均基于高性能联想台式计算机,操作系统是Win10,CPU 为i5-13600K(5.1 GHz),GPU 为NVIDIA RTX4060Ti。程序所需的相关版本号有python3.8、torch1.12.0、torchvision0.13.0。此外,表1列出了AE-C-DCGAN模型的实验相关参数。

表1 AE-C-DCGAN模型相关参数Table 1 Required parameters in AE-C-DCGAN

2.3 评估指标

为了考察AE-C-DCGAN 模型的预测性能,本研究采用平均绝对误差(mean absolute error,MAE)、平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差(root mean square error,RMSE)对实验结果进行评估。这3个指标的计算公式分别为是模型预测的结果;n 是测试样本的总数。以上3 个误差指

式(6)~式(8)中:yi是实际测试样本值;标的值越小,模型的效果越好,所得的预测值与真实值也就越接近。

2.4 实验对比模型

本文分别选取了当前预测领域较流行的5 个单一模型(RNN、LSTM、GRU、Transformer、GAN)和2个混合模型(CEE-LSTM、CEE-GAN)与AE-C-DCGAN进行对比,由此来验证本模型的预测性能。

1)RNN。RNN的结构十分简单,它使用带自反馈的神经元,能够处理任意长度的时序数据。

2)LSTM。LSTM 是一种特殊的RNNs,为了解决RNN 长期记忆丢失的问题,LSTM 添加了门结构(遗忘门、输入门、输出门),为每个神经元提供反馈。

3)GRU。GRU是LSTM的优化结构,它由更新门和重置门组成,并混合了细胞状态和隐藏状态。

4)Transformer[21]。 Transformer 由编码器和解码器2 部分组成,是一个利用注意力机制来提训练速度的模型。

5)GAN。GAN 主要由生成器和判别器2 部分组成,是一种优秀的生成式模型,也是本研究的基础模型之一。

6)CEE-LSTM[22]。CEE-LSTM是基于CEEMDAN和LSTM结合的混合预测方法。

7)CEE-GAN。CEE-GAN是基于CEE-LSTM改进的混合方法,将LSTM换成GAN。

8)AE-C-DCGAN。AE-C-DCGAN 是本研究基于生成对抗网络改进的混合方法,将AE 与CDCGAN相结合。

2.5 结果与分析

为了验证本研究提出的AE-C-DCGAN 混合预测模型的预测能力,在同一个实验平台上与7种预测模型进行对比。所涉及的模型包括单个RNN 模型、单个GRU 模型、单个LSTM 模型、单个Transformer 模型、单个GAN 模型,以及混合CEEMDAN-LSTM(下文和图表中用CEE-LSTM 代替)模型和混合CEEMDAN-GAN(下文和图表中用CEE-GAN 代替)模型。实验分别进行了4个季节的短期预测,实验结果见图5。图5中,红线代表本研究模型的预测结果的拟合曲线,黑线代表真实辐照度的走势,其他颜色线条表示其他对比模型的拟合结果。需要特别说明的是,图5中的a、b、c、d图分别表示从春、夏、秋、冬4个季节中随机选取一天测试数据集的太阳辐照度数据预测曲线图。

图5 四季数据在不同方法下的预测结果对比Fig.5 Prediction results of four seasons data by different methods

由图5中曲线的走势可以看出,太阳辐照度的变化很快,波动较大,数据中包含了较多高低频噪声信息。在辐照度不断变化的情况下,单一模型明显较难捕捉其变化趋势,曲线很大程度上偏离了真实值曲线。而基于多模型组合的混合模型在这种情况下能取得相对较好的预测效果。从预测拟合图可以看出,所提出的AE-C-DCGAN 模型对GHI数据的各种波动在4个季节都具有良好的学习能力,不仅在整体趋势上与真实数据吻合,在数据的峰值、剧变、波动情况下也同样有准确的预测效果。

此外,表2 给出了AE-C-DCGAN 与其他7 种模型的四季评价指标的量化对比。由表2 可见,单模型的误差值较大,这表明单一模型预测效果不够理想。相比之下,较为突出的单模型结构是GAN 模型,其各评价指标的误差较低,这也是本文混合预测框架的主体预测网络之一;反之,组合模型的评估值相对较小,这表明组合模型可综合各单一模型的优势来提高预测精度。将AE-C-DCGAN 与两个组合模型相比,本文模型的评估指标仍是数值最低,效果最好。其中,将AE-C-DCGAN 和次优预测模型相比,四季的MAE、MAPE 和RMSE 分别平均降低了4.84%、8.49%、7.32%,这也进一步验证了本文提出的混合方法的有效性。

表2 AE-C-DCGAN与其他7种模型的四季预测结果评价指标对比Table 2 Evaluation indicators for four season prediction results between AE-C-DCGAN and other seven models compared单位:%

综上所述,结合图5 和表2 的实验结果,本文提出的AE-C-DCGAN 的方法能够实现最准确的预测。通过3 种不同的统计验证指标,本模型的性能优于其他基准测试模型。对比单一模型LSTM、RNN、GRU、TRANS、GAN 和混合模型CEE-LSTM、CEE-GAN、AE-C-DCGAN,可以看出,将数据经过降噪预处理再通过预测模型更有利于函数拟合和后续模型收敛。与CEE-LSTM 和CEE-GAN 相比,本文的改进混合框架有更好的预测性能。

3 结 论

为了提高太阳辐照度的预测精度,本文提出了AE-C-DCGAN 模型进行预测。该模型利用AE对单一的辐照度数据进行降噪预处理,然后将数据输入到C-DCGAN中学习数据在时间维度上的特征关系,以此探究数据的分布规律来进行预测。与7种不同的模型的对比实验结果表明,AE-C-DCGAN 模型的误差最小;与次优预测模型相比,本文模型预测结果的MAE、MAPE 和RMSE 平均值分别降低了4.84%、8.49%、7.32%。后续研究工作将考虑多变量对辐照度预测的影响,以便得到预测准确率更高的模型。

猜你喜欢
辐照度太阳混合
混合宅
一起来学习“混合运算”
油水混合
太阳几点睡觉
中国典型地区水平总辐射辐照度频次特征*
太阳模拟器辐照度修正方法的研究
夏天的太阳
太阳光辐照度概率分布参数对电网可靠性的影响
太阳花
寂静的太阳镇