常振成,游国栋,肖梓跃,李兴韫
(天津科技大学 电子信息与自动化学院,天津 300222)
由于一次能源的大量使用,全球出现能源危机。太阳能作为一种来源丰富的清洁能源,利用太阳能进行光伏发电受到各个国家的重视。2022 年全球光伏新增装机230 GW,同比增长35.3%,累计装机容量约1156 GW,同时也反映了光伏发电技术具有广阔的应用前景[1]。
按照预测时间期限的不同,光伏发电功率预测方法可分为长期预测、中期预测、短期预测、超短期预测[2]。短期预测的预测时间尺度为4~72 h,预测结果时间分辨率为15 min;超短期预测的预测时间尺度为0~4 h,预测结果时间分辨率为15 min,每15 min滚动预测。以长远发展的眼光来看,短期功率预测算法的研究不仅有助于减少光伏发电弃用量,还能够帮助优化电力系统的度与管理[3]。
按照预测原理的不同,光伏发电功率预测可划分为物理预测、统计预测及人工智能预测等方法[4]。文献[5]中提出一种基于自适应神经模糊推理系统(adaptive network-based fuzzy inference system,ANFIS)的光伏发电功率预测模型在不断变化的天气条件下预测光伏发电功率;文献[6]中提出一种基于确定性预测的概率模型对光伏电站日前逐时发电进行预测。在深度学习中,由于可以从大量的样本中挖掘出更多的规律,因此,深度学习一直是国内外研究人员关注的热点。长短期记忆网络(long-short term memony,LSTM)是循环神经网络(rerrent neural network,RNN)模型的一种变体形式,解决了RNN 模型在训练过程中容易出现梯度消失而无法继续提高模型精度的问题。
为解决电力系统中对未来发电功率的预测不准确的问题,本文提出一种基于LSTM 网络模型的光伏发电功率短期预测系统。通过对采集的数据进行预处理,利用相关系数法计算各个天气因子与光伏发电功率间的相关系数,筛选出对光伏发电功率影响较大的因子,将这些因子作为LSTM 网络模型的输入变量。
影响光伏发电功率的天气因素主要包括:光照辐度、温度、相对湿度、风速、云量和气压等。本文通过STM32 单片机采集模块,对河北某发电站2022年7 月1 日至2023 年6 月30 日的光照辐度、温度、相对湿度、风速以及太阳能电池板的光伏发电功率进行采集。光伏发电厂的输出功率和气象数据均为全天记录,采样时间间隔15 min。
利用光伏发电数据采集装置实时获取数据并记录,采集装置如图1 所示。该设备是以STM32 单片机为基础,通过搭载光照辐度、温度、相对湿度、风速传感器,可以完成对太阳能电池板周围的光照辐度、温度、相对湿度、风速等信息的数据的实时采集,并且本文采用的各种传感器相互独立,不易出现数据失真、相互干扰等问题,在接收到数据以后,STM32 单片机还可以将其进行长时间的存储。采集系统的具体工作流程为
图1 光伏发电数据采集装置Fig.1 Photovoltaic power generation data acquisition device
(1)每日从6:00~20:00,每隔15 min 进行一次数据采集,经模数转换器(analog to digital converter,ADC)变换后,存储于STM32 单片机内;
(2)通过微控制单元(microcontroller unit,MCU)对电流和电压两者数据进行相乘,从而获得光伏发电功率,并进行记录存储;
(3)将采集的数据返回至终端并在OLED 屏幕上实时显示上述数据;
(4)一天中的其他时间,系统并不工作;
(5)每次工作结束后,利用串口将STM32 单片机中的数据进行记录并存储入PC 机里。
1.2.1 数据集分析介绍
本文以河北某光伏发电厂为例,数据包含2022年7 月1 日至2023 年6 月30 日整一年的气象数据(光照辐度、温度、相对湿度、风速以及光伏发电功率等),现随机选择一天(如2022 年7 月30 日)的采集数据如表1 所示。
表1 河北某光伏发电系统运行日志Tab.1 Operation log of a photovoltaic power generation system in Hebei
1.2.2 数据归一化处理
为了消除数据计算过程中出现的维数不一致、结点饱和、数据量纲之间影响过大以及计算量较大等问题,该方法针对各项数据的特性,采用归一化处理的方法。将数据集中的所有特征变量和输出变量都统一归一化到[0,1]范围内。归一化公式为
式中:x′为各组数据的归一化处理后的结果;xmax和xmin分别为每组数据的最大值和最小值;x 为各组数据的实际值。
1.2.3 气象因素相关性分析
影响光伏发电功率的气象因素众多,若是全部都进行考虑,势必会影响到预测模型的运行速度[7],为了减少数据维度过高、统计指标过多对预测模型运行速度的影响,需要在进行LSTM 预测模型训练前先筛选出光伏发电的主要气象影响因素。
本文采用Pearson 相关系数对所得气象数据与光伏发电功率之间进行相关性分析,其中Pearson相关系数公式表示如下:
随着pxy的增大,数列x 与数列y 的关系将会变得更加密切。越趋近于1,表明两者之间的相关程度越好反之则相关程度越差。
计算各影响因子与光伏发电功率间的相关系数,计算结果如表2 所示,各因素影响趋势如图2所示。
表2 气象因素与光伏功率之间的相关系数Tab.2 Correlation coefficient between meteorological factors and photovoltaic power
图2 各因素影响趋势Fig.2 Factors influence trends
通过表2 可知,光照辐度、温度与光伏发电功率呈正相关,尤其光照辐度对光伏发电功率的影响最大,其次是温度,而相对湿度和风速与光伏功率呈负相关关系。通过对比各气象因子的相关系数,本文选择光照辐度、温度、相对湿度作为LSTM 网络模型的输入变量。
1.2.4 基于层次分析法确定权重
层次分析法是在进行定量分析时经常使用的一种客观赋权法,在进行光伏发电短期功率预测综合评价的时候,这种方法能够根据各个指标本身的离散性进行赋权,是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法,结果比较公正客观,避免了主观因素的影响[7-8]。本文使用层次分析法对几种天气情况进行权重确定,结果如表3 所示。
表3 光伏发电中气象因子的各项权重Tab.3 Weights of meteorological factors in photovoltaic power generation
通过表3 可知,本文通过层次分析法对气象因子进行权重计算,用算术平均法、几何平均法、特征值法分别得出各气象因子的权重,所得权重的平均值分别为0.4748、0.2950、0.2302。其中光照辐度所占光伏发电功率的权重影响最大,其次是温度,相对湿度所占光伏发电功率的权重影响最小。通过计算得出这3 种方法所求权重的平均值,并将其作为网络模型的更新权重。
长短期记忆网络是RNN 模型的一种变体,RNN 模型由于梯度消失的原因只具有短期记忆,无法继续提高模型精度,LSTM 网络模型通过精妙的门控制将短期记忆与长期记忆结合起来[9]。LSTM 网络模型的单元结构如图3 所示。
图3 LSTM 单元结构Fig.3 LSTM unit structure
建立LSTM 短期光伏功率预测模型有两个关键因素,一个是选取模型输入变量以及各项数据的预处理,另一个是模型参数的构建[10]。构建光伏发电短期功率预测的LSTM 网络模型,要对网络的4 个参数分别进行选择,即输入层的单元个数、输入层的时间步长数、隐藏层的数量以及输出层个数,然后对参数进行验证。
在此基础上,对已有的数据进行预处理,采用基于随机梯度的批量算法对训练得到的LSTM 算法中的权重等参数进行动态调节,最终得到损失最小的LSTM 网络模型。光伏发电功率预测LSTM 模型建立流程如图4 所示。
图4 光伏发电功率预测LSTM 模型建立流程Fig.4 Photovoltaic power generation prediction LSTM model establishment flow chart
对预测模型的评估以及对实验数据进行的定量分析,可以反映光伏功率预测的有效性。本文选择的评价指标为均方根误差(root mean square error,RMSE)、平均绝对误差(mean absolute error,MAE)和平均百分比误差(mean absolute percentage error,MAPE)。
本文采用LSTM 网络模型对晴天、多云两种不同天气条件下的光伏发电功率进行预测,并将预测结果与RNN、门控循环单元(gate recurrent unit,GRU)两种预测模型以及实际功率进行比较。本实验选择4 月11 日、4 月21 日这两天作为预测日期,天气类型为晴朗、多云。选取4 月1 日至10 日、4 月11 日至20 日的历史发电数据作为两种天气类型的训练数据。实验过程以15 min 为采样时间间隔,采样时间段为6:00~20:00,并采用滚动预测。以次日各预测点的实际输出功率与预测功率进行对比,当预测精度不满足要求时,以预测点的实际功率和实测天气数据重新作为模型输出量,下一个预测点的功率进行修正预测[11-13]。晴天与多云天气的预测结果如图5、图6 所示。预测模型误差指标数据如表4所示。
表4 预测模型误差指标数据Tab.4 Predictive model error metric data
图5 晴天天气下光伏发电模型预测曲线Fig.5 Prediction curve of photovoltaic power generation model in sunny weather
图6 多云天气下光伏发电模型预测曲线Fig.6 Prediction curve of photovoltaic power generation model in cloudy weather
在晴天天气中,光伏发电功率较大,规律性强,多云天气下,由于太阳能电池板上的光强较弱、大气温度较低且有云层遮挡,光伏系统的发电效率较低,规律性弱。但无论在晴天天气还是多云天气,LSTM预测曲线比其他两种预测模型更接近实际输出功率曲线,预测效果最好。RNN 和GRU 的预测曲线比较接近,但与实际曲线偏离较大,说明RNN 和GRU模型的预测结果较差。
由表4 可知,LSTM 网络模型的预测误差波动相对较小。与GRU 模型和RNN 模型相比,在晴天天气下,均方根误差分别降低2.508%和3.605%,平均绝对误差分别降低2.161%和2.913%,平均绝对百分比误差分别降低3.751%和5.594%。在多云天气下,均方根误差分别降低2.802%和3.872%,平均绝对误差分别降低2.479%和3.112%,平均绝对百分比误差分别降低4.628%和7.570%。且LSTM 网络模型的平均绝对百分比误差(MAPE)在不同天气下均小于5%,预测精度较高,误差较小,训练有效且符合实验需求。
针对电力系统中对未来发电功率的预测不准确的问题,本文提出一种基于LSTM 网络模型的光伏发电功率短期预测系统,并通过仿真模拟进行验证。
结果表明,利用Pearson 相关系数筛选相关度较高的因素对光伏发电功率影响较大的天气因子,为LSTM 网络模型的输入变量提供了可靠的数据支撑。对光伏发电功率影响较大的变量数据输入预测模型,并对LSTM 模型参数进行调整,提高了模型的预测精度。将RNN、LSTM、GRU 三种网络模型在晴天和多云天气下进行仿真实验,本文所提出的LSTM网络模型具有较小的误差值,得到的预测精度最高,实验符合预期结果。