许可,王珏,姚铁锤,李凯
1.中国科学院计算机网络信息中心,北京 100190
2.中国科学院大学,北京 100049
近年来,随着科学技术的不断发展,太阳能发电的综合利用已经成为新兴产业[1]。随着光伏电站装机容量的增长,光伏发电的不确定性为电网新能源消纳带来了挑战[2]。准确的预测光伏发电功率可以降低电力系统的运行成本,保证电网的电能质量,促进大规模的光伏并网发展[3]。
光伏发电是一个连续不断的过程,光伏发电数据作为一个典型的时间序列,不仅是非线性的,而且具有时间相关性[4-5],光伏发电功率每时刻的变化取决于当前时刻和过去时刻的气象特征[6]。针对时间相关性的研究,黄磊等人[7]利用支持向量回归对不同时间尺度的光伏功率序列进行分析,基于多维时间序列特征建立了光伏功率预测模型。模型在一定程度上提升了预测精度,但在功率变化强烈的情况下模型表现不佳。赵滨滨等[8]建立了基于差分整合移动平均自回归模型对功率序列进行时间相关性分析,采用二阶差分对输出功率的样本值进行预处理,计算输出功率样本值的自相关系数和偏自相关系数。研究结果表明每时刻的功率与前六个时刻的特征均相关,与前一时刻的特征具有高度相关性。江雪辰等人[9]研究出了一种基于时间管理序列的光伏发电功率模拟方法,文章所述方法极大地保留了时序特征的自相关性,并且在概率和数据统计特性上预测效果更优。
本文提出了基于分时长短期记忆神经网络(Long Short-Term Memory,LSTM)的光伏发电功率预测模型。首先利用Pearson 相关系数计算总辐照度、环境温度、环境湿度、风速等气象特征与光伏发电功率之间的相关性,选择与光伏发电功率相关度较高的历史气象特征输入到光伏发电功率预测模型中。接着从时间维度研究各个气象特征历史时刻与当前时刻功率之间的时间相关性。然后构建分时LSTM光伏发电功率预测模型。当使用传统LSTM 模型输入全部历史特征时往往会影响模型的复杂度而出现较大的误差[10],且光伏数据本身存在时间不对齐等特点,因此从时间维度对气象特征进行分析有助于提升光伏发电功率预测精度。针对真实光伏电站进行案例分析验证所述方法的有效性。
本文利用Pearson 相关系数对光伏发电功率的时序特征以及气象特征进行研究,量化气象特征对光伏发电功率的影响权重,选择与光伏发电功率相关度较高的历史气象特征作为光伏发电功率预测模型的输入。Pearson 相关系数[11]的公式如下所示。
以某真实光伏电站为案例,提取光伏电站的场站实测气象数据、数值天气预报数据以及历史光伏发电功率构建数据集。数据集中包含2018年7月1日至2019年6月13日共348 天逐15 分钟数据,其中每个时刻点数据包含场站实测气象数据中的实测总辐照度、实测直射辐照度、实测散射辐照度、实测环境温度、实测气压、实测风向、实测风速,数值天气预报中的预测时间、预测总辐照度、预测直射辐照度、预测散射辐照度、预测总云量、预测低云量、预测地面百叶箱气温、预测地面百叶箱相对湿度、预测地面10 米风速、预测地面10 米风向、预测空气质量、预测地面气压、预测逐15 分钟降水以及光伏电站功率值。
将数据集中气象特征与历史光伏发电功率输入到公式(1)中,计算得到每个气象特征与光伏发电的相关性,结果如表1 所示。
表1 气象特征与光伏发电功率的相关性Table 1 Correlation between meteorological factors and photovoltaic power
由表1 可知,光伏电站数据集中的预测总辐照度、预测直射辐照度、预测散射辐照度和实测总辐照度、实测直射辐照度、实测散射辐照度与功率呈正相关,具有强相关性。预测地面百叶箱气温、预测地面10 米风速、实测环境温度、实测风速与功率呈正相关,具有中等相关性。预测地面百叶箱相对湿度与功率呈负相关,具有中等相关性。预测总云量、预测低云量、预测地面10 米风向、预测地面气压、预测逐15 分钟降水、实测风向与功率呈负相关,具有弱相关性。预测气压与功率呈正相关,具有弱相关性。将中等相关程度以上的气象特征输入到光伏发电功率预测模型。
时间相关性是指同一时序特征在不同时刻的相关程度[12], 光伏发电功率不仅与历史时刻自身功率序列密切相关,还与不同时刻的总辐照度、散射辐照度、环境温度等气象特征密切相关。利用如下公式计算不同时刻气象特征与功率之间的相关系数,研究气象特征与光伏功率的时间相关性。
将不同时刻气象特征如预测总辐照度等代入到公式(2)中,计算不同时刻气象特征与当前时刻发电功率之间的时间相关性。选择与光伏发电功率相关度较高的历史气象特征输入到光伏发电功率预测模型中,其相关性热力图结果如下图1 所示。
图1 功率与气象特征时间相关性热力图Fig.1 Time correlation thermal map between power and meteorological factors
如图所示,不同气象特征在每时刻对功率的影响程度不同,实测气象特征与功率间的时间相关性大于预测气象特征的相关性,其中功率与历史时刻功率的相关性最强,辐照度等与功率间相关性次之,环境温度等与功率间相关性最低,这与表1 结果相符。
此外,不同时刻的光伏发电功率与历史时刻的气象特征时间相关性不同,每时刻的功率至少与前两个时刻的气象特征具有强关联。随着时间尺度的增加,气象特征与功率间的时间相关性降低。因此针对不同时刻的预测功率,光伏发电功率预测模型根据时间相关性强度确定历史时长的输入。
LSTM 主要用于处理时序数据[13]。当前时刻信息输入到LSTM 网络中时,记忆单元中的输入门用于控制信息输入,遗忘门用于更新单元历史状态,输出门用于控制信息的输出。图2 展示了LSTM 单元结构。
图2 LSTM 单元结构Fig.2 LSTM cell construction
在此基础上,本文建立了基于分时LSTM 的光伏发电功率预测模型,其步骤如下:
(1)读入光伏电站数据集,选择每天5:15-19:30逐15 分钟有光伏发电功率的时刻构成时间序列数据。
(2)将气象特征与光伏发电功率输入到公式(1)中计算相关系数,选取中等相关程度以上的气象特征作为强相关的气象特征。
(3)利用公式(2)计算每个强相关的气象特征与光伏发电功率间的时间相关性,选择强相关时刻的气象特征作为每时刻功率预测模型的输入。
(4)将选取的气象特征及功率序列按照如下公式进行归一化。
(5)利用LSTM 提取训练集中的输入时间序列与输出功率之间的非线性关系,建立光伏功率预测模型。
(6)将模型输出的预测功率进行反归一化。
(7)利用训练好的基于分时LSTM 的光伏发电功率预测模型对未来时刻的光伏发电功率进行预测。
图3 基于分时LSTM 的光伏发电预测功率Fig.3 Photovoltaic power forecasting model based on timedivision LSTM
基于分时LSTM 的光伏功率预测模型采用双层LSTM 模型逐点预测光伏功率。模型隐含层抽象为特征提取部分和特征回归部分,其中特征提取部分由LSTM 深度学习方法完成,特征回归部分由全连接层完成[17]。模型输入数据首先经过双层LSTM 网络,动态捕捉输入数据的时序特征,然后送入带有RuLU激活函数的全连接层,动态输出光伏发电预测功率。
本文所有数据均来源于某地区真实光伏电站,已在1.1 节中详细介绍。基于Tensorflow[16]实现本文提出的光伏发电功率预测模型。利用均方根误差(RMSE)和平均绝对误差(MAE)[14]评估模型输出预测功率与真实功率之间的误差。RMSE 可以衡量预测值与期望值之间的离散程度,MAE 用来反映预测误差的绝对值。式中为测试集中的样本数,和分别为功率的实际值和预测值。
分别采用本文提出的分时LSTM 模型和传统LSTM 模型[18]对光伏发电功率进行预测,验证本文所述方法的可行性。分时LSTM 模型的输入为高度相关的特征及历史时刻,传统LSTM 模型的输入为历史一天的全部气象特征。光伏发电在不同的天气类型下具有不同的曲线特征,因此分别选取晴天和阴雨天两种天气类型对分时LSTM 模型和LSTM 模型进行对比实验。图4 为预测功率与实际发电功率在不同天气类型下的对比图。
图4 光伏发电功率预测曲线Fig.4 Photovoltaic power forecasting curve
由图4 和表2 可知,在晴天和阴雨天两种天气类型下,分时LSTM 模型的预测结果均优于传统LSTM 模型,预测功率与真实功率之间的RMSE 和MAE 误差更小。晴天时,分时LSTM和传统LSTM 模型的预测精度较高,两模型间的误差较小。阴雨天的预测精度低于晴天的预测精度,这是因为晴天时光伏发电功率曲线较平滑,更易于准确预测。阴雨天时功率波动性较大,模型很难动态感知功率曲线的变化。
表2 光伏发电功率预测结果对比Table 2 Comparison of photovoltaic power forecasting results
从预测曲线来看,传统LSTM 模型对光伏功率的起止点预测效果有待提升,阴雨天时传统LSTM 模型可以预测出光伏功率的大致趋势,预测曲线较平滑且波动性不强,而在实际光伏发电中,光伏发电功率受到各种自然因素的影响而呈现较强的波动性。分时LSTM 模型针对高度相关的气象特征及历史时刻进行建模,减少了模型的复杂度。与传统LSTM 模型相比,分时LSTM模型预测误差RMSE 降低36.2%,MAE 降低39.4%,说明分时LSTM 模型应用于光伏发电功率预测的可行性和高效性。
本文结合实际问题从时间维度研究气象特征对光伏发电的影响,提出了一种基于分时LSTM 的光伏发电功率预测模型。针对不同时刻的预测功率,光伏发电功率预测模型根据时间相关性强度确定输入的历史时长,减少了模型的复杂度,解决了光伏数据时间不对齐和预测精度低的问题。算例分析结果表明,本文所述模型较传统LSTM 模型相比具有更高的精度,说明基于分时LSTM 的光伏发电功率预测模型可以满足光伏发电实时调度需求。研究光伏发电的时间相关特性对准确预测光伏发电功率具有重要的意义。
利益冲突声明
所有作者声明不存在利益冲突关系。