徐丽娜, 申彦波, 冯 震, 叶 虎
(1.内蒙古自治区气象服务中心,内蒙古 呼和浩特 010051;2.中国气象局公共气象服务中心,北京 100081;
3.中国气象局风能太阳能资源中心,北京 100081)
我国地域辽阔,风能资源丰富,风电装机容量自2010年起跃居世界第一,风电并网消纳难题随之凸显[1]。未来,中国可再生能源将进入大规模、高比例、市场化阶段,进一步引领能源生产和消费革命的主流方向,发挥能源清洁低碳转型的主导作用,为实现“碳达峰、碳中和”目标提供主力支撑,这就对风电并网消纳能力提出了更高的要求[2-4]。
中尺度数值预报模式与统计订正方法相结合的短期风速预测作为减轻风电并网压力,提升风电场运行效率的有效手段之一,长期以来一直是国内外专家学者致力研究的课题。其中,统计订正方法也由早期的传统统计订正方法[5-7]逐渐发展到基于人工智能的机器学习方法[8-12]。张铁军等[13]基于历史资料提出一种可快速更新的风速预报误差订正方法,即利用趋势、方差和均值对风电场风速预报进行订正,取得了较好的订正效果。邓华等[14]基于主成分分析(Principal component analysis,PCA)与径向基(Radial basis function,RBF)神经网络相结合的算法对模式预报风速进行订正,相对均方根误差降低20%~30%,相对平均绝对误差降低15%~20%,有效减小了中尺度天气预报模式(Weather research and forecasting model, WRF)预报误差,改善了短期风速预报精度。张颖超等[15]分别采用极限学习机(Extreme learning machine, ELM)、反向传播(Back propagation,BP)神经网络、支持向量机(Support vector machine, SVM)算法进行模式预报风速订正得出,ELM算法将预报风速的相对均方根误差和相对平均绝对误差降低了20%~30%,明显优于BP 神经网络和SVM算法。
然而,如何评价模型的订正效果,对于短期风速预测的改进也至关重要。目前衡量模型订正效果的方法普遍采用研究周期内订正风速、模式预报风速与实况风速之间相关系数、误差等的对比,这种评估方式往往忽略了多数统计订正方法对低、高风速段订正能力有限的问题。近地层风场易受复杂下垫面和复杂湍流过程影响,具有显著的波动性和不确定性特征,当风电机组在低风速段(2~4 m·s-1)或高风速段(≥25 m·s-1)运行时,受阵风的影响,风电机组可能会频繁启停,增加风电机组损耗的同时,也加大了风电场的运行成本[16]。大规模风电机组启停,可能会由于超出电网调节能力而影响电网的有功功率供需平衡和频率稳定。因此,对于风电机组切入、切出风速段的改善能力是衡量订正模型优劣的重要指标。
本文采用随机森林(Random forest,RF)方法、相似误差订正(Analogue correction of errors,ACE)方法以及概率密度匹配方法(Probability density function matching method,PDF),分别建立风电场风速预报订正模型,在进行传统检验的同时,划分风电零发、风电低发、风电高发、风电满发及风电切出等风速等级,进行风速分级误差及准确率评判,旨在提出一种更有助于指导风电企业生产运行的检验评估方法;此外,基于不同订正方法的适用性研究,优选合理的订正模型权重,尝试开展多种模型的集成应用,为更有效地改善风电场风速预报性能提供了一种新思路。
选取内蒙古中部中节能聚隆风电场为实验风电场。该风电场位于内蒙古兴和县境内,兴和县平均海拔约1500 m,以西北气流为主导,常年风速较大,平均风速>17.0 m·s-1的大风日数[17]较多,年平均大风日数45 d,2020年该风电场测风塔70 m高度平均风速为9.0 m·s-1,风资源丰富。实验风电场测风塔位置及地形分布见图1。内蒙古属典型的中温带季风气候,具有降水量少而不匀、寒暑变化剧烈等特点。风速季节变化特征明显,表现为春季最大,冬季次之,夏季最小。刘鸿波等[18]基于台站观测资料和欧洲中期天气预报中心(ECMWF)最高时空分辨率的第五代大气再分析资料(ERA5),在1979—2018 年中国区域10 m、100 m 高度风速的气候特征及其变化趋势的研究中指出,中国近地层风速呈现出显著的区域性特征,风速大值区主要分布在内蒙古、东北地区西部、新疆北部以及青藏高原西部地区,且上述区域的风速季节差异较大。
实况数据采 用2020 年1 月1 日—2020 年12 月31日实验风电场测风塔70 m高度逐时测风资料,测风塔位于113°16′12″E,41°07′48″N(图1)。预报数据采用基于WRF的风能专业数值预报模式结合后处理输出的70 m高度风速格点预报产品,预报时效为24 h,时间分辨率为1 h。该模式主要用于内蒙古风电气象服务,模式中心坐标为112°02′24″E,43°49′48″N,预报区域设置为27 km(区域1)、9 km(区域2)的双层嵌套,9 km 模式范围为96°27′00″~127°31′48″E,37°12′00″~54°28′48″N。以0.5×0.5 NCEP GFS 资料为初始场和侧边界条件,边界层采用YSU 方案,微物理过程方案为WSM6 类冰雹方案,长波辐射为RRTM 方案,短波辐射方案为Goddard 方案,陆面过程采用Noah陆面过程方案,积云参数化方案采用浅对流Kain-Fritsch(new Eta)方案,垂直方向为55 层,采用地形追随坐标,进行近地不同层次气象要素输出。模式近地sigma 层取值与距离测风塔最近预报格点(113°18′36″E,41°08′24″N)处的模式输出高度见表1。
表1 模式近地sigma层取值与距离测风塔最近预报格点对应模式输出高度Tab.1 Value of sigma layer and the model output height of the nearest forecast grid from the wind tower
图1 实验风电场测风塔位置及地形分布Fig.1 Wind tower’s location and topography distribution of the experimental wind farm
选取与测风塔实况数据时间序列一致的测风塔周边4个格点的预报数据,预报格点经纬度依次为:113°12′00″E、41°03′00″N,113°18′36″E、41°03′00″N,113°11′24″E、41°07′48″N,113°18′36″E、41°08′24″N,水平方向采用双线性插值方法插值到测风塔位置,垂直方向采用线性插值方法插值到70 m高度。
考虑研究区风速季节特征明显,因此本文采取按季建模方式,具体为:采取以月份划分季节方式[19],即春季3—5 月,夏季6—8 月,秋季9—11 月,冬季12—次年2 月,分别建立基于RF 方法、ACE 方法、PDF 的风速预报分季订正模型,各季中前2 个月为模型构建期,最后1个月为模型验证期。
1.2.1 随机森林(RF)方法RF[20]是通过集成学习的思想将多棵决策树集成的一种算法。RF 方法[21]中定义风速预测训练集合Xi→Yi。其中,Xi为模型构建期第i时刻的影响因子{Ii1,Ii2,…, }Iin构建的特征向量,Yi为模型构建期第i时刻的实测风速。通过自助法(Bootstrap)重采样技术,完成分类模型构建,建立单棵回归决策树。在单棵决策树构建的基础上,构建整个RF,生成的RF是多元非线性回归分析模型,RF 预测值是所有决策树预测值的平均值,其优点在于能够处理具有高维特征的输入样本,可以有效地运行在大数据集上,且具有较好的准确率。本文从WRF 输出要素中筛选出70 m 风速、70 m气温、70 m相对湿度、地面气压构建特征向量,建立RF订正模型,实现70 m风速订正预报输出。
1.2.2 相似误差订正(ACE)方法ACE方法[22]的主要思想是将根据时间顺序排列的预报变换到相似空间上,以求寻找到与当前预报最相似(用具体的距离来定义)的历史预报,即通过定义合适的距离来度量历史预报和当前预报的相似程度,以期刻画出天气过程的相似度。在相似空间中,根据与当前预报的相似度对历史预报赋予相应权重,再对相似历史预报的观测值进行加权平均,得到订正预报。ACE 方法克服了一般基于时间顺序的误差订正方法的不足,可以处理由于天气系统剧烈转变引起的预报误差的快速变化。
选取WRF输出70 m风速和地面气压为订正因子,建立70 m风速预报ACE模型。通过敏感性试验确定模型参数:时间窗2t͂为2 h,风速权重为1.0,气压权重为0.1,相似预报的样本量(Na)为25。
通过计算各时次测风塔观测风速的累积概率密度以及该概率密度所对应的WRF 预报风速和测风塔观测风速,便可求得该时次的差值Δr(m·s-1),以此对各时次WRF预报风速进行订正,得到订正值WRFc(m·s-1):
1.2.4 检验方法文中采用相关系数(r)、平均绝对误差(ea)、准确率(fa)[26]及平均绝对误差提升率(Ce)对订正结果进行检验,计算公式如下:
2.1.1 全风速误差检验采取分季节检验方式,进行全风速误差检验。研究期内,即2020 年1 月1 日—2020年12月31日,样本总数为8254,有效样本率为94.2%。模型验证期各季的样本量为春季624、夏季720、秋季720、冬季744,各季有效样本率为春季84%、夏季97%、秋季97%、冬季100%。
从模型验证期的检验结果来看,3 种方法在各季对订正前WRF 风速预报具有不同程度的订正效果。以秋季的订正结果(图2)为例,可见RF方法可以有效改善WRF误差较大的问题,但同时也会带来将误差过分放大的情况,这可能是RF 方法进行回归时不能够做出超越训练集数据范围的预测,导致对某些特定噪声的数据进行建模时出现过度拟合。而ACE 方法和PDF 虽然对较大误差的改善不及RF 方法,但其较好地控制了误差过分放大的问题,尤其是PDF,模型的负回报几率明显小于其他两种方法。各季订正前后的相关系数(表2)均通过了0.01的置信度检验,RF方法订正后相关系数较订正前略有下降,这可能是由于RF在解决回归问题时,不能给出一个连续的输出,导致了相关系数的下降,而ACE方法和PDF订正后相关系数较订正前有所提升。ACE方法订正后的平均绝对误差(表2)小于RF 方法和PDF,而春、秋两季PDF 的订正效果好于RF 方法,夏、冬两季RF 方法的订正效果好于PDF。这可能与实验风电场模型构建期实测风速的概率密度分布特征有关。春、秋两季,实验风电场实测风速分布范围更广,模型模拟出的累计概率密度分布与实际较为吻合,夏、冬两季,实验风电场实测风速分布范围相对集中,模型模拟出的累计概率密度分布与实际存在一定偏差,从而导致春、秋两季的订正效果好于夏、冬两季。全年来看,RF 方法的平均绝对误差提升率为6.7%~36.7%,ACE方法的平均绝对误差提升率为11.1%~34.7%,PDF 的平均绝对误差提升率为3.7%~20.6%,在预报误差较小的夏季,3种方法的平均绝对误差提升率均较低,在预报误差较大的冬季,3 种方法对平均绝对误差也均有较大程度的提升。
表2 订正后的平均绝对误差及平均绝对误差提升率Tab.2 Average absolute error and average absolute error promotion rate after correction
图2 秋季模型验证期风速预报的订正结果Fig.2 Correction results of wind speed forecast during model validation period in autumn
2.1.2 分风速区间误差检验由于各季模型验证期强风样本数量有限,因此进行风速区间误差检验时采用全季检验方式,即将各季模型验证期的样本合并,按照实测风速区间进行分级误差检验。首先根据典型风电机组的功率曲线,按照风机出力情况将测风塔实测风速划分为[0,3)、[3,8)、[8,12)、[12,25)、[25,+∞)5 个等级,分别对应风电零发、风电低发、风电高发、风电满发及风电切出。为了更为详细地掌握不同方法的误差订正能力,同时考虑到≥25 m·s-1的样本数量太少,难以获得具有统计意义的分析结果,因此,进一步将上述风速等级细化调整为[0, 3)、[3, 5)、[5, 8)、[8, 12)、[12, 16)、[16,20)、[20,+∞)7 个风速区间。全年模型验证期各风速区间的样本数量见表3。
表3 全年模型验证期各风速区间的样本数量Tab.3 Sample numbers in each wind speed domain during the model validation periods of the whole year
图3为不同方法对不同区间风速的订正效果对比。可见,实测风速在5 m·s-1以下时,WRF 的预报误差较小(小于2 m·s-1),3 种订正方法均具有负回报;当风速≥5 m·s-1时,随着风速的增加,WRF 预报误差随之增大,此时,3 种订正方法开始产生正回报,且随风速的增加,RF 方法的平均绝对误差提升率较为稳定,ACE方法的平均绝对误差提升率略有下降,这可能是高风速区间的历史样本数量有限造成的。针对ACE方法而言,只有历史上相似状态提供的信息才能有效订正当前的预报误差,不相似的状态可能会提供错误的订正信息[27],而RF 方法在训练过程中则具有较强的抗干扰能力,对于不平衡的数据集来说,可以平衡数据集的误差,从而可以较好地维持其准确度。PDF的平均绝对误差提升率则有所上升,这与高风速模式预报表现为稳定的负偏差有关。针对不同风速区间,3 种订正方法的订正能力不尽相同,当风速<5 m·s-1时,PDF 明显优于RF、ACE 方法,当5 m·s-1≤风速<16 m·s-1时,RF、ACE 方法优于PDF,当风速≥16 m·s-1时,ACE 方法的订正能力开始下降,PDF 的订正能力有所提升。从实测风速与WRF 预报风速的概率密度分布(图4)上可以看到,实测风速与WRF预报风速均具有明显的非正态分布特征,WRF可预报风速在0~20 m·s-1之间,对低风速区间风速预报概率偏低,高风速区间风速预报能力明显不足。由于PDF 适用于误差大小对数据本身的数值范围具有较强依懒性的产品订正[24],而如图4 所示,研究期内WRF 预报普遍存在小风天气预报偏大,大风天气预报偏小的特点,当风速<5 m·s-1与风速≥16 m·s-1时,研究期内WRF 的系统性偏差特征总体较为一致,即当风速<5 m·s-1时,尤其是[0,3)风速区间下,WRF存在明显的正系统性偏差特征,平均为1.5 m·s-1;当风速≥16 m·s-1时,WRF 存在明显的负系统性偏差特征,平均为-8.7 m·s-1。因此PDF 在[0, 5)、[16, +∞)风速区间下相对于RF、ACE 方法表现出较强的订正能力,而当5 m·s-1≤风速<16 m·s-1时,WRF的正负偏差不确定,导致PDF的订正能力有限。
图3 不同风速区间的订正结果对比Fig.3 Comparison of correction results in different wind speed domains
图4 实测风速与WRF预报风速的概率密度分布Fig.4 Probability density distribution of measured wind speed and wind speed forecast of WRF
2.1.3 分风速区间准确率检验分风速区间准确率检验同样采取全季检验方式。从不同风速区间预报准确率(图5)来看,当风速<5 m·s-1时,3种订正方法的准确率均不及原始WRF 预报,当风速≥5 m·s-1时,3种订正方法的准确率均较原始WRF预报有不同程度的提升,尤其当风速≥8 m·s-1,订正后风速预报的准确率得到明显改善,当风速≥20 m·s-1时,PDF的准确率最佳。
图5 不同风速区间预报准确率对比Fig.5 Comparison of the forecast accuracy in different wind speed domains
2.2.1 分季节集成集合预报和集成预报是天气预报技术的发展方向,集成预报可以通过一种数学模型将多种相互独立的单模型预报结果或参数进行整合分析,最终得到最理想的预报结果[28]。常用的集成预报方法有权重集成、回归集成、概率集成及判别集成等[29]。
参照各季的平均误差提升率对3种方法进行分季节加权集成,集成预报(Integrating forecast,IF)的相关系数及平均绝对误差均略高于或持平于最优成员(表4)。可见,分季节对3种订正方法进行加权集成可以发挥集成成员各自的优势,从整体上改善预报性能,但是从集成前后的风速时序图(图6)上可以看到,分季节集成后并不能有效改善WRF预报在[0,3)低风速较实况偏大的情况。
图6 分季节集成前后风速时序变化Fig.6 Temporal variation of wind speed before and after seasonal integration
表4 分季节集成成员权重与集成后的相关系数、平均绝对误差Tab.4 Weight of seasonal integrated member and the results after integration
2.2.2 分风速区间集成考虑到WRF预报与3种订正模型在不同风速区间下各自的优势,利用全年验证期样本,在实测风速等级判别的前提下,将原始WRF预报、RF订正预报、ACE订正预报和PDF订正预报作为4 个成员进行集成,不同风速区间下各成员权重及检验结果见表5。
表5 分风速区间集成成员权重与集成后的相关系数、平均绝对误差Tab.5 Weight of wind speed domain integrated member and the results after integration
集成后按季进行检验:各季相关系数依次为0.80、0.60、0.81、0.74,平均绝对误差依次为2.2 m·s-1、2.1 m·s-1、2.3 m·s-1、3.0 m·s-1,优于分季节的集成方法。图7为分风速区间集成后不同区间预报风速的平均绝对误差和准确率与WRF预报之间的对比,可见,考虑风速区间的集成方法对不同风速区间下的WRF预报均具有较好的改善作用。值得指出的是,在[0,5)风速区间下,集成后空报次数由649次降至261次,由于空报次数的减小,使得分风速区间集成后的预报准确率得以有效提升,从而优于分季节集成方式。
图7 分风速区间集成后的平均绝对误差和准确率Fig.7 Average absolute error and accuracy after integration considering the wind speed domain
(1)RF、ACE方法以及PDF对WRF风速预报均具有不同程度的订正效果,RF 方法在有效改善WRF 误差较大问题的同时会带来将误差过分放大的情况,ACE方法和PDF虽然能够较好地控制误差过分放大问题,但是对较大误差的改善能力不及RF方法。
(2)当风速<5 m·s-1时,原始WRF 预报与PDF优于RF、ACE 方法,当风速≥5 m·s-1时,3 种订正方法均表现出较好的订正能力:5 m·s-1≤风速<16 m·s-1时,RF 方法和ACE 方法优于PDF;当风速≥16 m·s-1时,ACE方法的订正能力开始下降,PDF的订正能力有所提升。
(3)分风速区间的集成方法优于分季节集成方法,其对不同风速区间下的WRF预报具有较好的改善效果。
本文通过按季构建WRF 风速预报的RF、ACE方法及PDF 订正模型,进行了3 种订正方法在不同季节、风速区间的检验评估,发现订正后平均绝对误差和准确率均得以有效改善,且针对WRF预报的高值风速预报能力不足问题也具有一定的改善作用。但3 种方法的订正能力随季节、风速区间的不同明显不同,因此如何发挥预报模型各自的优势,是集成应用过程中需要解决的关键技术问题。本文提出在风速预报区间判别的前提下,进行多种预报模型的加权集成,可以较为有效地改善模型的订正能力。不足的是,本次研究的研究期仅为1 a,后续将继续深入展开研究,为风速预报的最优订正提供更为可靠的研究基础。