王勃,冯双磊,刘晓琳,王钊
(1. 新能源与储能运行控制国家重点实验室,中国电力科学研究院有限公司,北京 100192;2. 电力气象国家电网有限公司联合实验室,北京 100192)
短期风电功率预测可单次预测未来24~72 h 的风电功率,这为中时间尺度下的电力调度计划提供了依据。一般情况下短期风电功率预测主要依赖于数值天气预报(numerical weather prediction,NWP),通常将日前甚至更长时间跨度的数值天气预报关键气象要素,例如风速、风向、温度、湿度、气压等相关量作为人工智能算法的输入特征进行功率预测[1-7]受制于NWP 的预报精度,且随着预见期的增加,短期风电功率预测精度也会恶化,其主要原因是NWP 预报精度随预见期增加而变差。为解决NWP 预报精度的问题,常采用天气类型划分[8]、波动场景划分[9]等方法来提高精细化建模精度。
尽管日前NWP 预报具有较高精度,但是在极端甚至转折性天气过程条件下,NWP 经常存在预报偏差,这一偏差主要表现在NWP 关键气象要素,例如风速、降水、气温等预报信息在预报网格区域内存在落区范围偏大或偏小、关键气象要素预报时序超前或滞后、要素幅值偏高或偏低等情况[10-13],这些预报偏差也会给风电功率预测产生不利影响,造成风电功率序列在时序和幅值上的偏差[14]。
以往的研究大多是对NWP 特征进行聚类分型或者引入历史功率序列来提高短期风电功率预测精度,师洪涛等[15]为提升风电功率的多区间复合预测性能对功率序列的一阶差分序列进行趋势聚类,分趋势对短期风电功率进行预测,提升了多区间复合预测性能。文献[16]采用k-means 聚类方法对原始数据进行聚类分型,并将聚类后的数据进行核主成分特征降维,提高了短期风电功率预测精度。文献[17]为减小风的随机性和波动性带来的预测误差,基于摇摆窗算法识别风的波动性,采用BFSN(broad first search neighbors)算法对波动风速序列进行聚类划分,根据预测时段的风速波动过程进行匹配建模,提升了风电功率短期预测的精度。文献[18]基于最大相关最小冗余的方法,提取风电功率预测关键气象特征,并对风速波动程度进行细化分型,分波动大小分别训练模型,提升了整体预测精度。
为进一步挖掘相关信息,已有文献采用特征提取或序列分解重构的方法,文献[19]对气象因素提取多时间尺度下的统计特征、组合特征和类别特征,并基于深度学习模型进行特征排序得到最优特征组合,提高了短期风电功率预测精度。文献[20]利用 CEEMDAN (complete ensemble empirical mode decomposition with adaptive noise) 算法对风电功率序列进行分解,结合关键气象要素进行模型训练和建模,对预测序列进行重构,提升了功率预测精度。文献[21]采用鲁棒回归模型对原始数据进行预处理,并基于变分模态分解对原始功率序列进行分解后预测重构,证明了该方法的有效性。
以上的短期风电功率提升预测精度的思路大多是考虑NWP 数据特征提取或是规律性挖掘,并结合历史功率序列的方法,鲜有考虑转折性天气过程导致NWP 预报偏差所带来的风电功率预测精度变差的情况。基于以上分析,本文考虑转折性天气过程下,NWP 预报精度变差的情况,对转折性天气过程进行识别,并基于转折性天气过程识别结果采用面向对象的诊断检验方法(method for objectbased on diagnostic evaluation,MODE)进行检验;对各类转折性完整天气过程进行分天气过程单独建模的思路,采用天气过程匹配的方式对短期风电功率进行预测。
本文主要提出了一种考虑转折性天气过程识别与检验的风电功率短期预测方法,其主要分为以下4个步骤。
1) 转折性天气过程识别:首先对于NWP 大量的冗余特征采用随机森林进行特征重要性分析,得到少数几个与天气过程具有较强相关性的特征,基于特征重要性分析结果,采用门控循环单元(gated recurrent unit,GRU)神经网络对原始NWP 15 min采样间隔的样本进行逐点转折性天气时点的识别检测。
2) MODE 空间检验及评价:对转折性天气过程进行MODE空间检验并针对检验结果计算评价指标以判别NWP 在不同转折性天气过程条件下对实况场的预报能效。
3) NWP 预报规律性挖掘:基于MODE 检验结果,对不同转折性天气场景下NWP 的预报规律进行分析挖掘以得到其在不同转折性天气过程下的预报规律性以便于后续的分场景建模。
4) 分天气场景预测建模:基于NWP 预报规律性分析考虑不同转折性天气场景下NWP 的预报能效,采用不同的模型来匹配不同的天气类型以达到最佳的预测效果,对确定性转折天气过程单独训练模型用于预测时段天气类型匹配和功率预测。其主要流程如图1所示。
图1 整体研究思路流程图Fig. 1 Flow chart of overall research ideas
本文主要考虑对NWP 时点的转折性天气类型进行识别,其识别机制主要是将时点的转折性天气过程关键气象要素输入门控循环单元深度学习分类器,输出则是对应的天气过程类别,划分出对应的天气过程。
考虑到循环神经网络RNN 计及过去时刻信息的训练方法容易导致梯度消失,造成信息损失或者导致过去时刻信息占比增加,导致训练效果变差的情况,提出了长短期记忆网络来解决这一问题[22]。而GRU 在LSTM 遗忘门的基础上做了一定的简化,这一简化使得GRU 在性能上优于LSTM 网络。GRU 把内部状态向量和输出向量合并,统一为状态向量h,门控数量也减少到2 个,其分别是复位门和更新门,其可以保存很久之前的信息,并且提取相关信息,解决了梯度消失问题[23-24],其内部运行机制如式(1)—(4)所示,网络结构如图2所示。
图2 GRU网络结构Fig. 2 GRU network structure
其中重置门rt可表示为:
更新门ut可表示为:
候选隐藏层状态h͂t可表示为:
隐藏状态ht可表示为:
式中:rt、ut分别为重置门和更新门在t时刻的输出;wr和br分别为重置门的参数矩阵和残差向量;wu和bu分别为更新门的参数矩阵和残差向量;σ为激活函数,一般为sigmoid 函数;tanh 为双曲线激活函数;xt为t时刻模型的输入;ht-1为模型t- 1时刻的网络输出。
为挖掘NWP 对于各类转折性天气过程的预报规律性,对各类转折性天气过程进行MODE 检验,评估NWP 对于此类天气过程的预报准确程度,这一检验过程主要包括预报场和实况场的预报落区范围匹配度,预报场预报要素在幅值或相位上的偏差,其主要检验过程如下[10]。
1) 平滑处理:剔除诊断目标范围内的零散细碎小目标,设置卷积半径R,其作用主要是平滑掉半径小于R的目标物,减小细碎小目标对检验结果的干扰。
2) 检验要素阈值确定和掩膜场构建:由于转折性天气过程中预报要素的检验是对其某一阈值,即天气过程发展程度进行检验,这一阈值衡量了该要素的影响程度,此时设定要素阈值为T,仅对≥T的要素范围进行检验,设定阈值后对满足阈值条件的原始场进行要素重构,满足≥T的落区保留,反之剔除,从而得到掩膜场,如式(5)所示。
式中:D(x,y)为掩膜场,D(x,y) = 1表示原始场要素保留,D(x,y) = 0表示原始场要素剔除;C(x,y)为原始场检验要素。
3) 重构场生成:基于阈值设定得到掩膜场后,由于网格位置由0 或1 表示,此时为得到重构场,需要将满足阈值条件的原始场检验要素重新赋值给掩膜场得到重构场,即原始场要素与掩膜场作乘积,其表达式为:
式中F(x,y)为生成的重构场。
为验证本文所提出的计及转折性天气过程识别与检验的短期风电功率预测方法的有效性,选取吉林省2019—2021 年3 年的全网格的NWP 预报数据和实测气象数据进行算例分析,其中2019—2020年两年的数据用于转折性天气过程的识别建模与NWP 转折性天气过程的寒潮、系统性降水、冷锋过境等关键气象要素的MODE 检验,2021 年全年数据用于天气过程识别和风电功率短期预测分析。本文所使用的NWP 预报数据和实测气象数据时间分辨率均为15 min,而空间分辨率为3 km×3 km,风电场额定装机容量为149.9 MW。
3.1.1 转折性天气过程识别评价指标
由于转折性天气过程的识别可以认为是一种有监督模式的分类问题,所以本文在考虑转折性天气过程的识别时采用多分类评价指标的准确率(Accuracy)、精确率(Precision)、特异性(Specificity)、灵敏度(Sensitivity)等指标,其公式如下[25]。
式中:TP为实际为正类预测为正类的数量;FP为实际为正类预测为负类的数量;TN为实际为负类预测为负类的数量;FN为实际为负类预测为正类的数量。其中,准确率反映了所有正例和负例中完全预测正确的样本比例;精确率表示预测为正例的样本中有多少比例的样本为正例;特异性反映了真实为负例的样本中有多少比例的样本被预测为负例;灵敏度反映了真实为正例的样本中有多少比例的样本被预测为正例。这几个指标越接近1,表示预测结果精度越高,模型性能越好。
3.1.2 MODE检验评价指标
MODE 检验评估指标主要是针对检验对象所提出的用于评价NWP 预报准确程度的指标集,其主要包括:面积比、质心距离、轴角差、交集比、综合匹配度等指标,其计算方法如下[10]。
1) 面积比:表示预报场和实况场目标物面积之比,其中面积比越接近于1 则目标场与实况场匹配效果越好。
2) 质心距离:表示预报场目标物质心与实况场目标物质心之间的空间距离,其中质心距离越小,表示目标场与实况场目标单体越接近,预报效果越好。
3) 轴角差:表示预报场和实况场目标物对称轴与东西向水平轴线所成锐角之差,其中轴角差越小,表示预报场和实况场匹配效果越好。
4) 交集比:表示预报场和实况场目标物重叠部分所占比值,其中交集比越接近于1,表示预报场预报效果与实况场更接近。
5) 匹配度参数:用于衡量目标单体之间的综合匹配度,这一指标越接近于1,表示预报场预报效果与实况场更接近。
3.1.3 风电功率预测结果评价指标
本文误差评价指标有:平均绝对误差EMAE(mean absolute error,MAE)、均方根误差ERMSE(root mean square error,RMSE),其计算公式为:
式中:n为预测序列的点预测数量;Pi为实际值;为预测值;Cap为额定装机容量。
由于本文主要考虑寒潮、系统性降水、冷锋过境等转折性天气过程的识别,而天气过程识别因子与这些天气过程息息相关,考虑到寒潮天气过程常导致短时间内气温骤降,冷锋过境时温度下降同时气压上升,系统性降水则是与降水相关,同时考虑一些辅助诱因,此时将原始特征序列进行随机森林重要特征的筛选,以得出原始特征的重要性。如图3 所示,可以看出降水量、气压和温度重要性占比较大,因此考虑将气温、海平面气压、大尺度降水等作为识别转折性天气过程的识别要素。为提升寒潮以及冷锋过境等天气类型的识别准确率,对温度以及海平面气压进行一阶差分序列重构[26],得到24 h 采样间隔的一阶差分温度序列和海平面气压序列,作为辅助新增敏感特征,其计算公式如下。
图3 原始特征重要性占比Fig. 3 Percentages of importance of original features
式中:Temp为间隔24 h 的温度一阶差分值;temp,i表为实时温度值;Pressure为间隔24 h 的海平面气压一阶差分值;pressure,i为实时海平面气压值;n为序列样本数量,其中样本间采样间隔为15 min。
表1 展示了测试集3 类转折性天气过程和正常天气过程按15 min 分辨率的样本数量,可以看到,转折性天气过程出现的情况较少,仅占整个数据集的16%,其中冷锋过境天气过程占比最少,仅为1.79%。图4 展示了验证集的转折性天气过程的分类混淆矩阵图,可以看到,采用GRU 作为分类器时,寒潮天气过程识别效果最好,其余3 种天气过程均存在一定的误识别,但是总体的识别准确率达到了99.58%,其中各类天气过程识别精确率、特异性和灵敏度指标如表2 所示,可以看到各类转折性天气过程的识别结果评价指标相差不大,且处于较高的准确率范围内。图5 展示了各类天气过程识别结果评价指标的对比图,其结果不仅体现了识别精度同时也反映了模型具有较为突出的识别性能。
表1 各类天气过程样本占比Tab. 1 Percentages of samples for each type of weather process
表2 各类天气过程分类结果评估指标Tab. 2 Evaluation indicators of various types of classification results of weather processes%
图4 分类结果混淆矩阵图Fig. 4 Confusion matrix of classification results
图5 各类天气过程分类评价指标Fig. 5 Classification and evaluation indicators for each type of weather process
为突出GRU 深度学习模型的分类性能,采用极限学习机(extreme learning machine,ELM)、随机森林(random forest,RF)、长短期记忆网络(long and short-term memory,LSTM)等模型进行对比,其分类评价指标如表3所示。其中基于GRU分类器得到的识别准确率相较于LSTM 以及ELM 和RF 均要高,其中相较于LSTM 深度学习分类器准确率提升有限,但是基于传统的浅层网络的ELM以及集成学习算法的RF 准确率具有较高提升,采用GRU作为转折性天气过程的识别效果突出。
表3 各分类器的转折性天气过程识别结果Tab. 3 Results of transitional weather process identification for each classifier%
为衡量模型的预测效能,对GRU 识别结果绘制其ROC 曲线对预测模型进行综合分析。如图6所示,其中ROC 曲线在基准曲线上方所占面积越大表示模型分类准确率越高,可以看到采用GRU 深度学习分类器所得ROC 曲线面积接近于1,具有较高识别精度,满足转折性天气过程的分类准确率要求。
图6 GRU模型分类结果ROC曲线Fig. 6 ROC curve of GRU model classification results
为衡量模型的预测效能,对GRU 识别结果绘制其ROC 曲线对预测模型进行综合分析。如图6所示,其中ROC 曲线在基准曲线上方所占面积越大表示模型分类准确率越高,可以看到采用GRU 深度学习分类器所得ROC 曲线面积接近于1,具有较高识别精度,满足转折性天气过程的分类准确率要求。
由于NWP 在极端或转折性天气条件下的预报精度存在差异性,并且不同的转折性天气过程的预报性能也有所差异,通常来说,转折性天气过程的预报误差大于正常天气过程。为挖掘NWP 在不同天气过程下的预报规律性,对转折性天气过程进行MODE 检验。而本文主要是检验与风电功率强相关的NWP 关键气象要素在转折性天气过程条件下的预报偏差并挖掘其预报规律性,用于指导风电功率预测,因此在各类转折性天气过程条件下其检验要素均为风速。其中,对发生在2019 年11 月24 日的寒潮天气过程、2019 年11 月17 日的冷锋过境天气过程以及2019 年7 月29 日的系统性降水天气过程进行MODE空间检验。
2019年11月24日寒潮天气过程存在持续大风,其中NWP 预报范围内不同位置处的当日平均风速变化如图7 所示,其中可以看到吉林省西南部分区域的风速相较于整个吉林省来说偏大,其平均风速已超过10 m/s,而吉林省位于NWP 网格范围的中部,其风速值偏低,而MODE检验结果显示,在寒潮持续时间范围内,吉林省存在大风天气过程,这说明NWP 存在漏报,其预报风速幅值偏低,没能捕获到关键大风天气现象。
图7 NWP预报范围内风速日平均曲线Fig. 7 Daily average wind speed curves within the NWP forecast range
2019 年11 月17 日冷锋天气过程仍存在持续大风,其中NWP 预报范围内不同位置处的当日平均风速变化如图8 所示。此时吉林省西南部的日平均风速明显高于其余范围,但是风电场所在网格处的风速也相对较大,但是基于MODE 检验结果显示,在同一检验时间下,经过掩模场生成后,其预报场的风速总是超前于实测场,经过时间延迟得到错位时间点的MODE检验结果显示其预报场和实测场目标匹配较好,即NWP 预报序列具有超前效应。2019 年7 月29 日的系统性降水天气过程的MODE检验结果显示,这一次系统性降水天气过程中各位置处的平均风速并无明显偏大的现象,尤其是风电场所在网格处的风速如图9所示。其中图10展示了此次检验的冷锋过境天气过程下,预报风速与实际风速的在持续时间内的变化趋势,可以看到NWP预报风速在幅值上与实际风速相近,但是在相位上,NWP 风速峰值时刻显著超前于实际风速序列。
图8 NWP预报范围内风速日平均曲线Fig. 8 Daily average wind speed curves within the NWP forecast range
图9 NWP预报范围内风速日平均曲线Fig. 9 Daily average wind speed curves within the NWP forecast range
图10 冷锋过境天气过程下的预报风速与实际风速序列Fig. 10 Forecasted wind speed and actual wind speed series under cold front weather processes
图11-13 分别展示了寒潮、冷锋过境以及系统性降水天气过程MODE检验结果。其中寒潮天气过程存在明显的漏报现象,实况场第6 目标对在预报场中未被检验到,而实况场和预报场其余目标对的匹配结果显示数值天气预报基本涵盖了实况场的检验目标,在这一天气条件下,NWP 具有一定的预报效果。在冷锋过境天气过程下,预报场预报要素有超前于实况场要素的情况出现,经过将预报场时间延迟1 h 后的MODE 检验结果与实况场对比,其预报场和实况场目标对具有较好的匹配效果,说明在冷锋过境天气条件下,NWP 存在一定的预报时序偏移。在系统性降水天气过程条件下,预报场和实况场目标对匹配得较好,系统性降水天气过程对NWP得风速预报影响较小,其中表4展示了MODE检验结果的预报场和实况场的目标对匹配结果的诊断指标,可以看到寒潮天气过程除去漏报场景,其余目标对匹配效果较好,冷锋过境天气过程考虑预报时序偏差后其预报场和实况场目标对匹配结果最佳,系统性降水天气过程,其NWP 预报结果与实际结果具有较好的匹配度,说明NWP 在不同转折性天气场景下具有一定的预报能效,在实际使用NWP 时,应充分考虑不同天气场景下的预报规律。
表4 各转折性天气过程MODE检验的诊断指标Tab. 4 Diagnostic indicators for the MODE test for each transitional weather process
图11 寒潮天气过程的MODE检验结果Fig. 11 MODE test results for cold weather processes
图12 冷锋天气过程的MODE检验结果Fig. 12 MODE test results for cold front weather processes
图13 系统性降水天气过程的MODE检验结果Fig. 13 MODE test results for systematic precipitation weather processes
基于MODE 空间检验结果可知,寒潮天气过程与冷锋天气过程类似,在以上空间检验结果中显示,寒潮天气过程其预报风速在幅值上存在明显偏低的情况,这可能导致最终预测模型不收敛,此时考虑采用深度学习模型GRU 提高模型的收敛能力;而冷锋过境天气过程检验结果显示,其风速预报要素存在时序超前性,此时考虑采用BILSTM 模型挖掘时序特征进行该天气过程的功率预测;而系统性降水过程所涉及到的关键气象要素较少,对风电功率预测结果影响较小,考虑其与正常天气过程一样,采用浅层网络的ELM 进行建模和预测。
由于本文所考虑的转折性天气过程在连续时间序列上并没有同时出现的情况,在测试阶段考虑选取2019 年一年中出现转折性天气过程的离散时段进行测试,以检验本文所提出的考虑转折性天气过程识别与检验的短期功率预测方法的有效性。此时基于GRU 深度学习分类器的转折性天气过程识别结果,对每一种天气过程选取两次非连续的发生的转折性天气事件进行功率预测。
图14 显示了寒潮天气过程的功率预测结果,可以看到,寒潮天气过程下风电功率实际值较正常天气过程存在一定波动,并且其功率幅值偏大,在这一天气过程下采用GRU 深度模型结合天气过程划分的预测结果相较不划分的方法以及其余模型的预测结果,误差更低,更能拟合实际功率曲线。图15显示了系统性降水天气过程的功率预测结果,由于系统性降水天过程一次持续时间较长,两次这样的天气过程持续时间接近一周,而实际上采用上述的3 种预测方法得到的预测误差相差并不大,但是ELM 结合分天气过程的预测模式,误差相对更低。图16 显示了冷锋过境天气过程的功率预测结果,其中这一天气过程与寒潮天气过程类似,具有强风天气过程,其实际出力相较于正常天气过程偏大,采用BILSTM 其预测结果误差更低,尤其是结合天气过程划分的方法,其RMSE 值为0.039,MAE 值为0.035。图17 为其他天气过程的功率预测结果,由于其他天气过程较少受到转折性天气过程的影响,其NWP 预报精度稍微偏高,导致最后的预测序列在预测方法上要求不高,即各模型预测误差较接近,采用天气划分的方法能在一定程度上提高预测效果。
图15 系统性降水天气过程功率预测曲线Fig. 15 Power prediction curves for systematic precipitation weather processes
图16 冷锋过境天气过程功率预测曲线Fig. 16 Power prediction curves of cold front transit weather process
图17 其他天气过程功率预测曲线Fig. 17 Power prediction curves of other weather process
其中各类天气类型的不同预测方法所得到的预测结果的误差评价指标如表5 所示,可以看到寒潮和冷锋过境天气过程其各模型预测误差均偏大,尤其是不采用天气类型划分的方法,其误差相对于划分的方法高出2%~7%左右,而系统性降水天气过程以及正常天气过程由于对NWP 预报影响偏小,其与风电功率息息相关的敏感要素预报偏差较小,此时其预测误差偏低。采用天气类型划分的方法所所能减小的误差也相对有限,其中系统性降水天气过程条件下,进行天气过程划分的方法相较于不划分以及其余模型,其降低误差0.4%~2%,而正常天气过程能降低1%~3%。采用天气过程划分再分模型预测的方法能够有效降低预测误差。
表5 各类天气过程下各模型预测误差评价指标Tab. 5 Evaluation indexs of prediction errors of each model under each type of weather process
本文提出了一种计及转折性天气过程识别与检验的风电功率短期预测方法,首先是基于转折性天气过程要素进行天气过程的识别,基于识别结果采用基于面向对象的MODE空间方法对转折性天气过程进行检验,以挖掘各类转折性天气过程的NWP预报规律性,并根据规律性分析采用分天气过程建模和预测的思路对不同转折性天气过程进行风电功率预测,得出以下结论。
1) 采用GRU 深度学习分类器进行转折性天气过程识别时,不同天气过程识别准确率较高,相较于LSTM 深度学习分类器其准确率提升不大,但是相较于传统机器学习模型的ELM 以及RF 其分类准确率较高,证明本文采用GRU 作为转折性天气过程识别的有效性。
2) 基于面向对象的MODE空间检验方法对3种不同的天气过程的检验结果显示:寒潮天气过程存在风速漏报现象,冷锋天气过程NWP 风速存在时序预报偏差现象,系统性降水天气过程风速预报结果较好。
3) 考虑天气类型划分和分模型预测的方法所得到的风电功率预测误差更小,不同的模型适合不同的天气过程预测,寒潮和冷锋天气过程预测误差较大,而系统性降水和其他天气过程预测误差更小,采用本文所提及的预测模式,各天气过程下RMSE 值分别下降了3.88%、0.99%、3.88%、2.34%, MAE 值分别下降了3.54%、 1.13%、3.31%、1.85%。
尽管本文所提出的考虑转折性天气过程的识别方法具有一定的有效性,但是其识别对象主要是针对分辨率为15 min的采样点,而一个完整的天气过程应该是一段连续的时间序列,在今后的研究中将进一步考虑完整天气过程的识别与校正,并提高天气过程的功率预测精度。