基于滑动窗双边CUSUM算法的风电爬坡事件检测方法

2024-02-20 01:24冯萧飞刘韬文李彬苏盛
科学技术与工程 2024年2期
关键词:爬坡出力贝叶斯

冯萧飞, 刘韬文, 李彬, 苏盛*

(1. 长沙理工大学电气与信息工程学院, 长沙 410114; 2. 国网湖南省电力有限公司, 长沙 410114)

近年来,中国电力系统中风电接入规模不断提升,“十四五”规划下,全国2022—2025年新增风电装机量预计约为300 GW,风电在中国发展十分迅速[1]。然而风电的间歇性和不确定性对电网的有功功率平衡具有极高的威胁。一方面,风电场出力受天气的影响,极易发生波动剧烈的功率爬坡事件,风机骤然切出易造成电网功率缺额,频率失稳,甚至大规模甩负荷[2-3]。另一方面,近年来极端天气如热带风暴、气旋、锋面、暴雨、阵风等情况多发,风机出力不确定性进一步提升。风电爬坡事件已在世界范围内对各国电网的运行安全及经济稳定造成了程度不一的破坏[4-5]。2008年2月26日,美国德克萨斯州风电场有功出力在15 min内从170 MW下降到0,电网被迫切除了1 150 MW的负荷,整个电网频率降低至59.85 Hz。风电爬坡事件的有效判断以及风机出力的精准预测,一方面有助于为电网调度人员提供先验信息,安排合理的调度策略,维护电网的安全稳定运行。另一方面也能够灵活调整其他能源发电机组出力,降低调控负担,提高电网运行经济效益[6-8]。

目前关于风电爬坡事件的辨识预测研究主要着眼于分析一段时间内风电出力变化特性,基于功率变化幅度,变化速率等传统特征进行辨识[9],然而风电场运行条件复杂多变,风电爬坡也并不仅仅只有上、下爬坡两种场景,传统的风电爬坡判定阈值难以适用,辨识精度较差。近年来利用数据挖掘算法和时序预测模型间接判断预测区间中的风电爬坡事件表现出较高的潜力,根据数据来源,预测方法又可划分为统计模型预测方法及物理模型预测方法[10]。其中,物理模型预测方法基于数值天气预报(numerical weather prediction,NWP)的预测数据对风电出力进行预测[11]。文献[12]对比了不同NWP模型的预测效果以及组合预测效果,发现NWP模型组合使用能够获得更高的预测精度;文献[13]通过相似性从而对预测数据进行修正,结合历史数据预测风电出力,修正之后的预测精度显著提升;统计模型预测方法则是利用天气和风电历史数据所表现的特征或组合特性对风机出力进行预测。文献[14]建立基于神经网络的区间预测模型,估计每一个预测点的概率分布,能够提供更加丰富的不确定信息,便于决策者的调度。

然而人为设定的模型参数来自经验总结,并不能开发出模型的最优性能,有必要对模型参数组合优化进行研究讨论,进一步提升模型预测性能。综上所述,现基于历史风电功率数据,分析不同爬坡场景下的风机出力变化特性,提出基于滑动窗双边CUSUM(cumulative sum)的风电爬坡事件检测方法,进而建立贝叶斯优化的LSTM(long short term memory)深度学习模型,讨论经参数优化后模型的性能提升,并在预测区间中对所提风电爬坡事件识别方法进行验证。

1 风电爬坡特性分析

1.1 风电爬坡事件

通常情况下,爬坡事件是指风力发电机组的出力在短时间内出现大幅度变化,在这一过程中功率的变化幅度超过电力系统控制策略的调节能力,由于常规火电机组的出力爬坡能力十分有限,难以应对风电短时爬坡带来的功率剧烈变化,将会引发功率不平衡,严重时甚至导致系统频率的异常波动以及甩负荷,将这一过程称之为一次爬坡事件。

电力系统中机组爬坡率通常按照每分钟调整出力最大值占额定容量的比例计算,单位为%/min,即分钟级功率变化量同机组装机容量的比例。其中,水电机组是最快的,可以达到50%/min~100%/min;燃气机组也比较快,可以达到20%/min。极端天气下风机出力爬坡速率甚至可以达到70%/min,出力的不可控性对系统中其他机组的调度产生极大的压力。尤其是在风电装机容量不断扩大,并网规模不断提升的过程中,风电出力的波动程度对电网的影响进一步到达一个新的高度。

1.2 风电爬坡定义

爬坡事件中主要关注3个关键的特征:爬坡方向,爬坡幅度变化ΔP以及爬坡持续时间Δt。后两者可归纳为爬坡速率R=ΔP/Δt,反映一段时间内风机出力变化的快慢。文献[15]提出,当1 h内整个风电场的输出功率变化幅度大于装机容量的15%时,即可判断发生了确定的爬坡事件。基于上述特征量,文献[16]中通过给定时间间隔和变化阈值对爬坡事件进行了数学定义。

(1)认为若(t,t+Δt)时间段首末端功率之差的绝对值超过阈值,则发生爬坡事件,末端功率大于首端功率则为上爬坡事件,反之则是下爬坡事件。

|Pt+Δt-Pt|>Ps

(1)

式(1)中:Pt+Δt为末端功率;Pt为首端功率;Ps为功率差阈值。

(2)认为若(t,t+Δt)时间段内功率最大值和最小值之差超过阈值,则发生爬坡事件,最大值发生时刻落后于最小值发生时刻,则为上爬坡事件,反之则是下爬坡事件。

max[P(t,t+Δt)]-min[P(t,t+Δt)]>PsM

(2)

式(2)中:max[P(t,t+Δt)]、min[P(t,t+Δt)]为区间内功率最大、最小值;PsM为最值差阈值。

(3)认为若(t,t+Δt)时间段内爬坡率超过给定阈值,则发生爬坡事件,爬坡率为增大方向,则发生上爬坡事件,反之则是下爬坡事件。

(3)

式(3)中:Psk为爬坡率阈值。

上述定义虽一定程度上描述了爬坡事件,但时间间隔Δt及变化阈值Ps的设定是影响爬坡事件识别准确率的关键因素。若时间间隔过大,阈值设定过高则易发生漏报;时间间隔过窄,阈值设定过低则易发生误报。由于风电出力的波动性和不确定性,仅选择区间内某些时刻的出力进行计算判断亦会丢失区间内的功率波动信息,也缺乏对时序之间功率波动的关联特征提取。

目前爬坡事件的数学定义尚未形成统一标准,因为爬坡事件的确认涉及不同地域环境,不同天气状况下,厂站的运行条件不同,设备运行工况也存在一定差异。不同区域各能源机组配置方案的差异也导致了系统功率爬坡能力的不同,当发生爬坡事件时应对能力也不一致,需要对风电爬坡数据进行更加深入的讨论,提取符合所在局部电网安全运行需求的爬坡事件特征[17-18]。

1.3 风电爬坡场景

为进一步研究爬坡事件发生时风电出力变化特征,提取有效辨识爬坡事件的贴切特征量,本文将风电爬坡事件细分为快速爬坡,逐步爬坡,连续反向爬坡3个典型场景。

所用历史风电出力变化数据来自南方某地区站点序列为09136的风电场,该风电场装机容量为20 MW,该数据集记录了此风电场2004年1月1日至2007年1月1日的风电出力监测数据,数据采集间隔为10 min。

如图1所示,风机出力在09:20—10:20时段内大幅上升,从低发跃升至接近满发,小时功率变化量超过装机容量的80%,发生快速上爬坡事件,爬坡事件持续时间极短而该时段风电场输出电量猛然增大,对电网将形成强烈冲击,同时系统负荷需求并无显著变化,电网需要临时退出大量其他能源机组来保证系统功率平衡。

图1 风机快速爬坡功率变化曲线Fig.1 Wind power curve of fast ramping event

4月22日14:00—18:00,风机从停机状态开始工作,机组出力持续提升直至接近满发,功率小时变化值超过装机容量40%,爬坡持续时间较长,虽对电网有一定的冲击,但是相较于快速爬坡事件,留下了更多的时间裕度来进行机组调度,如图2所示。

图2 风机逐步爬坡功率变化曲线Fig.2 Wind power curve of gradual ramping event

如图3所示,2月26日22:00至次日13:00,风机出力在短时间内进行了连续多次的上爬坡事件和下爬坡事件,并在中间状态(切出或接近满发)保持近1 h以上,近满发状态持续时间较切出状态更长,期间风速始终处于较高的水平,并偶尔超过风电机组切出极限导致停机。与单一的快速爬坡场景不同,功率的剧烈波动将引起电网频率的异常波动,对系统中机组的灵活启停能力有更高要求,不利于系统调度人员及时调整机组出力任务。

图3 风机连续反复爬坡功率变化曲线Fig.3 Wind power curve of repeated ramping event

结合上述对于风电爬坡事件不同场景风机出力的变化特征的分析讨论,可以发现目前的爬坡定义以及爬坡特征的提取较为浅薄。仅考虑某一设定时间段内功率变化并不符合爬坡事件中功率的实际变化情况,爬坡可能在一个较长的时间过程中逐步式的出现,也可能在一定时间范围内不断反复,不同时间段的风机出力之间的存在较强的联系,现有的爬坡事件检测方法存在较大的信息盲区,误报和漏保率均较高,难为调度人员提供可靠指导。

2 爬坡事件识别

为避免常规爬坡定义中采取固定时间段计算功率异常变化时存在的参数择优困难以及信息丢失等问题,现通过滑动窗的检测方法,逐时刻提取窗内功率变化的特征,并结合CUSUM,对爬坡事件的发生进一步确认。期望深入挖掘区间内的功率变化,并增强区间之间的特征耦合能力,把握更加丰富的爬坡事件信息。

基于滑动窗的双边CUSUM算法是一种有效的事件检测方法,设定合适的参数,能够根据输入的时间序列信号自动检测其中的状态变化,逻辑简单,抗干扰能力强。

如图4所示,基于风电出力时间序列P={p(k),k=6,7,…,K}内定义参考窗wm和爬坡检测窗wn,爬坡检测窗邻后于参考窗,为保证窗口内功率变化之间的耦合程度,参考窗和爬坡检测窗具有一定长度的重合部分。

图4 双边滑动窗检测爬坡事件模型Fig.4 Ramp event detection model of CUSUM algorithm

窗口长度分别为m、n,重合长度为x。考虑风电爬坡场景特性及风电出力采集间隔,设置参考窗长度m为4,爬坡检测窗长度n为4,重合长度x为2。计算两个窗口的功率均值Mm、Mn,计算公式为

(4)

(5)

式中:k为开始计算均值的采样点,位于爬坡检测窗的末端时刻。

中国对于并网风电爬坡率通常要求在装机容量PN<150 MW时,最大功率变化10 min内不超过33%PN,1 min内不超过10%PN;PN>150 MW时,最大功率变化10 min内不超过50 MW,1 min内不超过15 MW。由此可见,不同装机容量的风电场,其功率最大值与功率最小值数值差距差异极大,阈值设定过程中若单纯考虑幅值变化量,则算法泛化性将变得极差。因此应当对风机出力数据进行预处理,计算输出功率占装机容量的百分比大小,从而将判断幅值变化量转变为判断百分比变化量,增强检测方法的泛化性。进一步计算k点位置参考窗和爬坡检测窗的均值之差占参考窗计算均值的百分比Dk作为爬坡事件判断的特征量,计算公式为

(6)

风电爬坡事件分为上爬坡和下爬坡事件,需要分别考虑特征量在判断爬坡事件以及爬坡方向时的参数设定,由于均值计算特性,滑动窗求均值的方法对于时间序列数值的增大敏感,相对的当数值减小时,计算均值下降的较为缓慢。

经过数据分析,当特征量为正且两窗口差值超过参考窗计算均值的33%时,可认为该时刻爬坡检测窗末端位置发生了确定的上爬坡。而当特征量为负且两窗口差值超过参考窗计算均值的10%时,认为该时刻爬坡检测窗末端位置发生了确定的下爬坡事件。

关于爬坡持续时间的检测,根据上述风电爬坡场景分析,快速爬坡事件爬坡持续时间较短,为10 min级,逐步爬坡事件持续时间稍长,通常是30 min级。因此进一步通过累加器的方式,统计爬坡事件持续时间。

(7)

(8)

3 贝叶斯优化的LSTM模型构建

风电爬坡事件间接检测方法主要是通过时序预测模型计算未来一定时间内的风机出力变化,进而判断预测区间的爬坡情况。模型选择以及参数调优对于预测精度以及进一步的事件判断准确度具有关键影响。本文研究采用LSTM时序预测模型预测未来12 h内的风机出力变化,并研究贝叶斯优化计算更加合适可靠的模型超参数组合所带来的模型效果提升。

3.1 LSTM模型

长短期记忆神经网络(LSTM)是基于循环神经网络(recurrent neural networks,RNN)的改进模型,十分擅长处理具有长期依赖关系的时间序列,能够有效克服RNN在处理超长序列数据时由于长期依赖的误差传递,造成的梯度消失或梯度爆炸问题。因此对于序列前后存在强烈耦合关系的爬坡功率时序数据有更强大的注意力和特征提取能力[19-22]。

LSTM神经网络的基本单元如图5所示,其包含一个输入层,一个输出层以及若干隐藏层。不同于单一神经网络,隐含层中包含交互的记忆单元,存储状态信息,并沿时间轴传递。记忆单元中放置三个门控制信息的传递,分别是输入门、输出门和遗忘门[7]。

图5 LSTM单元结构Fig.5 Unit structure of LSTM

3.2 贝叶斯优化

与通常所用的网格搜索或随机搜索等调参方式通过穷举来寻找最优参数的方式不同,贝叶斯优化算法(Byesian optimation,BO)考虑采集模型训练过程中每一次参数设定及取得的结果,通过设计高效的代理函数和采集函数计算得到下一次测试的参数组合,不断循环迭代,在有限的时间中找到一个相对不错的模型参数组合。

贝叶斯优化过程如图6所示,优化模型的具体步骤如下。

步骤1采样一些参数组合X={x1,x2,…,xk},计算目标函数值observation(X)如MAE、RMSE等,初始化一个代理函数的先验分布objective.fn(·)。

步骤2计算采集函数值acquisition.fn(·),选取使得本次迭代过程中采集函数值最大的参数组合xmax。

步骤3使用新的参数组合计算目标函数值,并更新代理函数,得到其后验分布。

步骤4使用得到的后验分布作为先验分布,重复步骤2~步骤4,直至最大迭代次数。

常用的代理函数有高斯过程,Tree Parzer Estimator和概率随机森林,采集函数包括置信上界函数,概率改进函数和期望改进函数(expected improvement,EI)。现采用高斯过程作为代理目标函数的概率模型,此模型能够生成多维高斯分布,足够模拟任何目标函数,并采用EI函数作为采样函数在最可能出现全局最优解的区域(开发)和还未取样的区域(探索)进行采样,来获得模型最优超参数组合。

3.3 贝叶斯优化的LSTM模型

LSTM模型的超参数有很多种,人为选择的参数组合基于经验设定,并不一定能够反映模型参数组合对于研究对象的适用性。本文使用贝叶斯优化对LSTM网络的超参数进行优化,提高预测准确度[23-26]。主要对于LSTM网络的隐含层层数,隐含层神经单元数,以及学习率和正则化系数进行优化,优化超参数的具体信息如表1所示。

表1 LSTM模型待优化超参数信息Table 1 Operating status of LSTM

贝叶斯优化的LSTM网络模型结构流程图如图7所示,经过贝叶斯优化后,LSTM超参数组合在数学上更加具有可解释性,在当前研究对象上具有更好的模型性能[27-30]。

图7 贝叶斯优化的LSTM模型流程图Fig.7 Flowchart of LSTM based bayesian optimization

4 算例分析

为展现经过贝叶斯优化后的LSTM神经网络在短期风电功率数据预测领域的表现以及对模型预测能力的优化效果,以LSTM预测模型作为参考,比较二者之间的差异优劣。同时,为验证本文所提爬坡事件检测方法的有效性,以混淆矩阵为指标,进行多次检测实验,统计并分析实验数据来评估该检测方法的性能。

4.1 评价指标

选择均方根误差RMSE、平均绝对误差MAE作为主要指标来评价LSTM模型的预测精度和性能,其表达式为

(9)

(10)

选择混淆矩阵延伸得到的精度评价指标准确率(Accuracy)、精确度(Precision)、召回率(TPR)以及F1为主要指标对所提风电爬坡事件检测方法进行评估,其具体表达式为

(11)

(12)

(13)

(14)

式中:TP为检测结果为真阳数,即样本实际是爬坡事件、事件检测结果也是爬坡事件;TN为检测结果为真阴数,即样本实际不是爬坡事件、事件检测结果也不是爬坡事件;FP为检测结果为假阳数,即样本实际不是爬坡事件、事件检测结果却是爬坡事件;FN为检测结果为假阴数,即样本实际是爬坡事件、事件检测结果却不是爬坡事件。

4.2 短期风电功率预测仿真

本次仿真基于MATLAB仿真平台实现,仿真数据选择1.3节中所提2004—2007年的某风电场出力数据。其中,2006年5月18—19日,强台风“珍珠”接近中国广东地区并登录汕头南澳岛,期间对该地区风电场产生极大影响,导致风电爬坡事件。以台风“珍珠”经过之前的历史数据作为模型训练的数据集,来对5月18—19日台风过境下的风机出力进行预测。其中历史数据按8∶2的比例分割为训练集和测试集。

纯LSTM时序预测模型隐含层层数设置为1,隐含层中神经网络单元个数为192个,初始学习率为0.005,正则化系数设置为1.316 4×10-9,最大迭代次数设置为120次;基于贝叶斯优化的LSTM耦合模型最大优化迭代次数设置为30次,LSTM训练过程中epoch设置为40次,以经过训练后的模型对目标区间内的风电出力进行预测验证模型性能。

预测区间内,实测风电出力和LSTM模型预测结果以及经过贝叶斯优化后的LSTM模型预测结果如图8所示,评价指标计算结果如表2所示。

表2 模型预测结果对比Table 2 Comparison of model forecasting results

图8 风机功率预测结果Fig.8 Result of wind power forecasting

经过训练,模型对于短期风电功率输出预测均具有较强的性能,有效捕捉并预测了风电的爬坡特征;但即使LSTM模型经过了120次迭代训练,其预测精度仍显著低于LSTM-BO模型,贝叶斯优化的LSTM模型的RMSE和MAE相较于LSTM模型分别提升了17.1%和42.5%。最终所得LSTM模型最优超参数组合如表3所示。

表3 LSTM-BO所得最优超参数组合Table 3 Optimal hyperparameter combination of LSTM-BO

4.3 风电爬坡事件检测试验

取2005年1月1日至2007年1月1日的风电出力数据进行实验,以24 h为区间长度,选择50个包含爬坡事件的异常风电出力区间以及50个不包含爬坡事件的正常风电出力区间,用所提方法进行爬坡事件检测。统计检测结果的正确和错误。同时,以这些判断区间的前三个月风电出力数据作为训练集,分别训练LSTM时序预测模型并进行贝叶斯优化,得到这些判断区间内风机出力预测数据,进一步用所提方法进行爬坡事件检测。统计检测结果的正确和错误。

观测数据和预测数据的爬坡事件检测结果如图9所示,其评价指标计算结果如表4所示。

表4 爬坡事件检测精度Table 4 Precision of ramp events detection

图9 爬坡样本检测结果Fig.9 Results of ramp events detection

在对爬坡事件的识别过程中,所提爬坡事件检测方法对于判断区间内的爬坡事件具有良好的效果,在所选样本集中爬坡事件检测准确度达到98%,仅有个别区间内的爬坡事件检测失败,经分析认为是当爬坡速率较小时爬坡事件检测方法难以有效提取到爬坡特征,因此对于逐步爬坡事件,所提方法的有效性略有不足。而对于样本集中不含爬坡事件的区间进行检测时,所提方法能够全部识别,精确度达到100%,表现出极低的误报率,使得检测结果的可靠性得到保障。在预测区间中,由于模型预测误差,对爬坡事件检测方法产生了一定影响,所提方法的准确度有所降低,但仍然在所选样本集中达到了95%,且依然能够完全识别不含爬坡事件的样本。

5 结论

风电异常爬坡事件是影响电力系统稳定运行的不定时炸弹,随着风电规模的扩张,新能源并网进程的推进,更加合适精准的爬坡事件检测方法是电力系统及时做出应对的关键。针对目前爬坡事件定义和检测方法的不足,提出了基于滑动窗的爬坡事件识别方法,并基于某地区风电场的风电功率数据使用贝叶斯优化的LSTM时序预测模型得到预测数据进行检测方法验证,得出如下结论。

(1)分析南方某风电场历史风电出力数据,将风电爬坡分为快速爬坡,逐步爬坡,连续反向爬坡3种场景,并研究其风电出力功率变化特性。

(2)基于滑动窗分别设置参考窗和爬坡检测窗,计算爬坡检测窗与参考窗均值之差占参考窗均值百分比并作为爬坡特征量,并建立累加机制,得到爬坡事件持续时间。所提方法可有效识别爬坡事件,且能够判断上、下爬坡事件。

(3)采用贝叶斯优化算法,计算LSTM时序预测模型在风电出力功率预测中的最优超参数组合,提高短期风电出力预测精度。

(4)采用所提方法分别在观测数据和预测数据中进行爬坡事件检测,有效验证了所提方法在存在一定偏差的预测数据中的检测性能,为电网调度提供先验指导。

风电爬坡事件与天气系统特定事件的发生密切相关,而天气事件的影响往往是由局部扩散到大范围区域的多个风电场,多风电场出力的爬坡特性可能与单风电场存在明显差异,未来仍需要结合区域风电出力开展进一步的研究分析。

猜你喜欢
爬坡出力贝叶斯
陕西农民收入:一路爬坡过坎
爬坡过坎
贝叶斯公式及其应用
我国防腐木进口又现平稳“爬坡”
基于贝叶斯估计的轨道占用识别方法
风电场有功出力的EEMD特性分析
要争做出力出彩的党员干部
一种基于贝叶斯压缩感知的说话人识别方法
风电场群出力的汇聚效应分析
IIRCT下负二项分布参数多变点的贝叶斯估计