基于数据驱动和深度学习的超短期风电功率预测

2021-07-30 02:53苗长新
电力系统自动化 2021年14期
关键词:电功率风电场时空

苗长新,李 昊,王 霞,韩 丽,马 也,李 衡

(中国矿业大学电气与动力工程学院,江苏省徐州市 221116)

0 引言

随着风电并网规模的增加,风电的随机性、波动性和间歇性给电力系统运行的安全性、稳定性和经济性带来了巨大挑战,准确的风电功率预测是应对该问题的重要手段[1-2]。

风电功率预测的研究主要分为机理预测及数据驱动预测,两者之间存在本质区别[3-4]。机理预测建立在对大气运动刻画的基础之上,根据地形地貌、气象环境等信息,利用流体力学、热力学等物理规律建立模型,重点关注边界条件和物理求解规则的优化,建模困难、计算量大,一般适用于中长期预测[5]。数据驱动预测强调从多源、多维、多模态数据中找寻其内在规律,以数据挖掘手段和人工智能算法为基础,建立输入与目标之间的映射关系,一般更适用于超短期和短期预测[6-7]。

基于数据驱动的风电功率预测的发展背景为:人工智能、大数据、云服务等技术的发展,电网数字新基建、智能电网、能源互联网等生态的完善,数据采集与监控(SCADA)系统、数值天气预报(NWP)系统、地理信息系统(GIS)等平台采集储存的海量数据资源[8-9]。发展历程包括统计法、传统机器学习、深度学习等几个主要阶段。以时间序列法、持续法、卡尔曼滤波为代表的统计法和以人工神经网络、随机森林、支持向量机[10]为代表的早期人工智能算法,都有各自的适用场景和局限性[11-12],但共同之处在于,多采用仅反映预测对象某一特征的方法进行预测,如只对单一的风速或风电序列进行统计分析或信号分解[13-14],建模过程仅需要该风电场单维的数据。这些方法忽略了风电场分布排列、上下游效应的影响和风电功率与气象数据之间的相互耦合,一方面导致数据资源的浪费,同时也限制了预测的精度[15-16]。

风电大数据中不仅包含单一风电场自相关的时间关联,还包含气象信息与风电功率的因果关联和相邻风电场间互相关的时空关联[17-20]。随着数据密集时代的到来,传统的统计方法和机器学习算法渐渐难以满足预测任务的需求,越来越多的研究开始使用深度学习工具挖掘风电数据中的深层耦合[21-22]。文献[23]采用随机森林法评估多位置NWP 信息的重要程度,再将加权后的NWP 特征与功率一同输入门控循环单元(GRU)进行预测;文献[24]采用主成分分析法(PCA)分析风电功率的影响因素,再将降维后的特征输入长短期记忆(LSTM)网络。这类方法的特征工程依赖专家指导和人为设置条件,难以发挥深度学习特征工程自动化的优势。文献[25]先对输入的各时间序列建立GRU 并提取时间关联,再采用卷积神经网络(CNN)压缩GRU 的隐藏状态;文献[26]先采用CNN 提取多源输入的耦合特征,再通过GRU 完成预测。针对时空关联,文献[27]提出了先提取空间特征,后捕捉时间依赖的两阶段建模方法,分别采用CNN 和双向GRU 提取空间特征和时序特征,但输入仅考虑了单维的风速,特征较为单一。

综上,本文提出一种多尺度时空网络(multiscale spatio-temporal network,MSTN),它是一个集成了多层、多尺度卷积网络(multi-scale convolution network,MCNN)和GRU 的深层模型。首先,以相邻风电场的功率和气象数据构造MCNN 的多通道输入,设计并行架构的多尺寸卷积核,提取风电场不同尺度的时空特征。然后,采用1×1 卷积层对不同尺度的时空特征进行赋权、融合、降维,并根据预测目标动态调整网络对不同特征的依赖。最后,将融合特征输入GRU 来提取时序联系,输出预测结果,并基于真实数据集的仿真结果验证了所提模型的有效性。

1 风电大数据

1.1 数据概述

风电大数据包含GIS 提供的风电场地形描述等静态数据和气象单位提供的NWP 信息等动态数据,具有多源、多维、多模态的特点。地理位置信息,风速、风向、温度、气压、空气密度等气象信息,以及风电功率数据,在离散/连续、采样频率、数值大小、计量单位、物理意义上都有显著差异,但同时又存在风力、风电的因果关联和相邻风电场的时空关联。

因此,基于数据驱动的风电功率预测的关键在于既统一又差异化地把握数据间的联系和区别,抽象多源数据的耦合关系并根据预测目标筛选输入信息和构造特征向量,这也是本文基于数据驱动的MSTN 模型的关键环节。

1.2 数据关联

1.2.1 风电功率与气象数据的关联

风力发电受风速、风向、温度、气压、空气密度等多因素共同影响,各因素与风电出力的Pearson 系数绝对值见附录A 图A1。图中,Speed 指风速信息,Speed-cleaning 指数据清洗后的风速信息,清洗方法见1.3.1 节。

附录A 图A1 表明,风速是决定风电出力最直接、最根本的影响因素,同时风向也是时空关联的重要指标,因此选取风速和风向作为气象特征,与功率一同用于构造MSTN 的多通道输入。

1.2.2 相邻风电场的时空关联

本文相邻风电场的Pearson 相关系数如附录A图A2 所示,相邻风电场按位置信息编号。图A2 表明,距离较近的风电场,出力相关程度较高;而距离较远的风电场,相关程度较低,为了避免冗余和减小计算复杂度,可以适当撇弃。

1)时空关联的绝对性

风在空间内的连续性和风电场的相对位置决定了相邻风电场的出力具有时空关联:处在同一风向上的风电场,出力将会趋于一致。下游机组与上游机组的功率序列,会表现出相似的波动规律,且具有一定的延时性。

2)时空关联的相对性

风向和风电场的相对位置决定了时延的先后,风速和风电场间的距离则决定了时延的大小。一般来说,风速越快,相邻站点的时延越小;风速越慢,相邻站点的时延越大。

因此,在一定的时空范围内,可以认为时空关联是绝对的,关联程度是相对的。时空关联可以帮助克服依赖单一时间序列预测未来出力的本质性困难,上游风电场的实时出力为下游风电场的预测提供了未来知识。

1.3 数据预处理

多源输入变量的采样频率存在差异,因此,先统一采样频率至15 min。多源变量的量纲不同,数值差异也较大,需要对其分别做归一化处理。风电功率和风速采用式(1)的min-max 法归一化,风向则采用三角函数化方法归一化。

式中:x为实测值;xmin和xmax分别为x的最小值和最大值;x′为归一化值。

值得注意的是,对于多风电场,一般将它们的功率(风速)合并归一化。

1.3.1 风速清洗

额定风速是风机的重要参数,是指风机以额定功率输出的最小风速,不同类型的风机对应的额定风速不同。在实际生产中,大量存在风机满功率输出、风速溢出的场景,即当风速超过一定阈值的时候,机组达到满功率输出状态,此时风速继续爬升不再对风电出力有额外贡献。风速与风电出力的映射关系在满功率状态和不饱和状态下存在较大变化,但神经网络往往难以准确捕捉这种变化。

因此,本文把此类场景视为风电功率预测的一种异常、故障状态。从历史数据中筛选出此类场景,对风速信息进行统计,定义保证所有机组满功率输出的最小风速为满载风速,超出满载风速的数值(如图1 中紫色虚线框所示)都削平为满载风速,低于满载风速的数值保持不变。对于本文数据集,100 m高度处风速达到14.2 m/s 时,达到满功率输出。数据清洗后,风速与风电功率的Pearson 相关系数由0.934 4 上升至0.979 5。

图1 风电功率与风速相关性Fig.1 Correlation between wind power and wind speed

1.3.2 风向的三角函数归一化

风向的范围为0°~360°,从物理意义上讲,0°、360°、1°和359°对风机出力是基本等效的,但对神经网络而言,输入的数值差异却很大,因此,对风向采用三角函数化处理,即取风向的sin 值和cos 值[28]。

2 多尺度时空网络

本文所提MSTN 模型的结构如图2 所示。图中,3×3、5×5 等指单个通道特征图上的卷积核尺寸,对于多通道卷积而言,其卷积核尺寸实际为C×3×3、C×5×5,参数C的数值取决于上一层输出的特征通道数。

2.1 MCNN

2.1.1 多尺寸卷积核

如图3 所示,各风电场按纵向排列,风电时间序列按横向排列,功率、风速、风向按通道方向排列。

CNN 可通过设置不同尺寸的卷积核来获取更小或更大视野范围内的特征,例如:本文3×1 卷积核对应提取同一时刻相邻风电场的空间相关性;1×3 卷积核提取单一风电场自相关的时间相关性;3×3 卷积核提取3 个时间单位内,相邻3 个风电场的时空关联;5×5 卷积核对应的是更大时间和空间范围内的时空相关性。同理,设计3×5、3×7、5×3、5×7 等其他尺寸的卷积核,由模型端到端自主学习输入数据不同时空尺度的特征,并通过零填充(zero-padding)控制多尺寸卷积的输出具有相同的尺寸。同时,多通道卷积引入了功率与风速、风向之间的耦合关系,为预测提供了更多知识。

图2 模型结构Fig.2 Structure of model

图3 多尺寸卷积核Fig.3 Multi-scale convolution kernel

2.1.2 1×1 卷积

通道特征拼接(Concat)是深度学习中实现特征融合的经典操作,即在通道方向上对输入向量进行特征拼接[29]。1×1 卷积层进一步对多尺度时空特征进行跨通道的信息融合,并通过控制通道数量灵活调节系统运算规模。1×1 卷积层的输入为MCNN 的多通道特征,输出为其融合特征,该层的训练参数为多通道时空特征的加权系数。特征融合的过程可以表示为:

式中:YCin×L表示输入的特征,其中Cin为输入特征的通道数,L为特征向量的长度;为输出的融合特征,其中Cout为输出特征的通道数;ωCout×Cin为加权系数。

因此,1×1 卷积层输出特征的每一个通道实质上都是其输入特征在通道方向上的加权。定义输入特征通道的平均权重来衡量各个通道的重要程度,具体地,第i个通道的平均权重αi定义为:

式中:ωji为ωCout×Cin中第j行、第i列的元素。

2.2 GRU

基于循环神经网络(RNN)改进的LSTM 网络和GRU 在提取数据时序特征上有着出色表现。GRU 独特的更新门和重置门的设计,使其能有效实现对历史特征的加强与遗忘。与LSTM 网络相比,GRU 有更加简洁的网络参数及网络结构,这使得GRU 在时间成本方面更加经济。

输入时间序列长度的设置一直是GRU 的难点,序列太短会导致信息缺失,序列太长会导致GRU 难以准确捕捉输入数据的关键尺度和关键特征。MCNN 交替堆叠的卷积池化结构,具有增强模型压缩数据规模、凸显关键特征的能力。将输入向量压缩降维后再传递给GRU,可以有效提高预测准确性。值得注意的是,MCNN 特征输入GRU 前需要经扁平层(Flatten)将特征扁平化处理。

3 算例分析

3.1 数据集和误差指标

应用美国国家可再生能源实验室的公开数据集进行验证。本文多风电场的装机容量均为16 MW,地理坐标为78.594 5°~79.866 6°W,39.036 9°~40.344 5°N,数据发生时间为2012 年1 月1 日至12 月31 日,所用风速和风向均为100 m 高度处数据,气象数据和功率数据的分辨率统一设置为15 min。将全年数据划分为4 个季度,每个季度取前70 d 为训练集,后20 d 为测试集,即每组训练集和测试集分别包含6 720 个和1 920 个样本。

本文模型同时输出多个风电场的风电功率预测值,选取均方误差(MSE)作为预测结果的评价指标。单个风电场和多个风电场风电功率的均方误差εmse和εMSE的定义分别见式(4)和式(5)。

式中:T为样本个数;PMt和PPt分别为t时刻实测值和预测值的归一化功率值;N为风电场数;和分别为t时刻第n个风电场的实测值和预测值的归一化功率值。当N的值退化为1 时,εMSE反映一个特定风电场的预测误差。

3.2 实验环境和超参数设置

本文预测任务在Python3.8 环境下执行,实验硬件配置为Intel Core i5-10300H CPU/16 GB RAM/GeForce GTX 1650。超参数设置如下。

输入数据的尺寸:通道数为4,即风电功率、风速、风向sin 值、风向cos 值;单个通道特征图尺寸为5×32,即相邻5 个风电场待预测时段前8 h 的数据。

MCNN:堆叠2 个多尺度卷积单元,每个单元均含有多尺寸的卷积核,每种尺寸的卷积核数量均设置为10 个;池化方式为最大池化;后接一个小尺寸卷积层,进一步压缩特征图尺寸。设置1×1 卷积层输出的特征通道数为10。

GRU:隐藏层节点数设置为20,经全连接层同时输出多个风电场待预测时刻的功率。

3.3 基准模型

为了验证本文所提MSTN 模型的有效性,选取持续法(Persistence)、PCA-GRU、深度 CNN(DeepCNN)、CNN-GRU、GRU-CNN 作为对比实验的基准模型。其中,PCA 是机器学习领域特征分析的经典算法,CNN-GRU 和GRU-CNN 是当前深度学习在风电功率预测领域的先进算法代表。CNN-GRU 先采用CNN 提取空间联系再输入GRU提取时间联系;GRU-CNN 则先采用GRU 提取各风电场的时间自相关,再采用CNN 提取空间联系。为了保证对比性,各模型设计的层数和卷积核数量控制在相似水平。

3.4 预测结果

5 个风电场第1 季度的整体预测误差如表1 所示,5 个风电场第1 季度的单场预测误差分别见附录A 表A1 至表A5,第2、3、4 季度的预测结果见附录A表A6 至表A8。

附录A 图A3 展示了1 号和2 号风电场前400 个测试样本的16 步即4 h 预测结果。综上可得以下结论。

1)虽然持续法能够在数值上跟踪风电出力,但随着预测步长的增加,其时间延迟和偏移太大,导致了较高的预测误差。考虑相邻风电场信息的深度学习算法在多步预测中误差更小。

表1 5 个风电场第1 季度的功率预测误差Table 1 Power prediction errors of five wind farms in the first quarter

2)MSTN 模型在4 个季度的数据集上表现优于其他模型,且预测步长越长,优势越明显。在个别风电场的部分时刻,MSTN 模型的表现可能会不如GRU-CNN 模型等,这是由于MSTN 模型的训练目标是降低5 个风电场整体的预测误差,因此,对单个风电场的风电功率预测误差的控制不足。当对特定风电场的预测精度有较高要求时,可以通过修改模型训练过程的损失函数来实现,例如:赋予该风电场预测误差更大的权重,或将训练目标由全部风电场预测误差最小改为特定风电场预测误差最小。

3.5 多尺度时空特征分析

以MSTN 模型中第1 个MCNN 单元为例,对一个测试样本分别执行4、8、16 步预测时,其不同尺寸卷积下的多通道时空特征、融合特征和各通道的权重如图4 所示,可以得到如下结论。

图4 特征提取过程Fig.4 Process of feature extraction

1)1×1 卷积层可以有效降低通道数量,实现信息降维,并通过对各通道权重值的迭代训练,以高权重值突出关键通道的特征信息。如图4 所示,4 步预测中,3×7 卷积核对应的通道权重较高,表示对于第1 季度数据集的1 h 预测,每相邻3 个风电场的7 个时间单位窗口学习到的时空特征对预测结果的影响最大。

2)同一个样本在不同预测任务中提取出的特征存在差异,表示MSTN 模型能够根据不同的预测目标动态学习输入样本的特征并调整通道权重。

3)各尺度的时空特征中,都存在权重相对较高的通道,表明MCNN 对于风电场时空特征的挖掘是有意义的。

3.6 灵敏度分析

MCNN 特征通道数和1×1 卷积输出的融合特征通道数是影响模型预测精度和运算时间的关键参数,因此,有必要对它们的取值进行测试,测试结果如表2 所示。

表2 灵敏度分析Table 2 Sensitivity analysis

综上可以得出以下结论。

1)MCNN 通道数决定于卷积核数量。若卷积核太少,会降低预测的准确性;若卷积核过多,会大大增加运算耗时,且预测精度与卷积核数量非正相关。融合特征通道数取10 的条件下,当MCNN 通道数由60 增加到120 时,训练耗时增加56%,预测误差却没有明显降低。

2)超短期预测要兼顾准确性和时效性,对于本文数据集,MCNN 通道数和融合特征通道数分别取60 和10 时,MSTN 模型有较好的表现。在此结构下,模型训练平均耗时为29.2 s,预测单个样本的运算时间为0.028 2 s,满足超短期预测的要求。

4 结语

结合数据驱动和深度学习的方法在风电功率预测领域有着很大的应用潜力。风电大数据中不仅包含风电场的时间自相关,同时也存在相邻风电场间的时空关联,以及风力、风电的因果关联。本文所提MSTN 模型有如下特征。

1)在数据预处理环节,将风电场满功率输出,风速溢出的场景视为风电功率预测的异常/故障状态,并提出相应的数据清洗策略以增强风速、风电的相关性。

2)设计多通道卷积挖掘风电与气象数据之间的耦合关系;设计多尺度卷积挖掘相邻风电场不同尺度的时空特征。

3)MSTN 模型同时具备MCNN 压缩数据规模、凸显关键特征的能力和RNN 捕捉时序特征的能力。因此,在执行数据多、维度高、耦合强的基于数据驱动的风电功率预测任务时,具有一定的优势。

本文所提模型在相邻数个风电场的预测任务中表现良好,适用于新建风电场缺少历史数据或精细化调度风电场出力等场景,但电网运行往往需要关注更大空间范围、更多数量的场群出力情况,因此需要继续探索更大时空尺度下基于数据驱动的风电场群功率预测方法。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。

猜你喜欢
电功率风电场时空
基于PCC-CNN-GRU的短期风电功率预测
跨越时空的相遇
轻松上手电功率
你会计算电功率吗
镜中的时空穿梭
解读电功率
玩一次时空大“穿越”
基于PSS/E的风电场建模与动态分析
时空之门
含风电场电力系统的潮流计算