潘 超 李润宇 蔡国伟 王 典 张永会
(1. 现代电力系统仿真控制与绿色电能新技术教育部重点实验室(东北电力大学) 吉林 132012 2. 松花江水力发电有限公司吉林白山发电厂 吉林 132400)
对风场进行风速预测有利于风场安全运行及含新能源并网的电网灵活调度[1-2],但风速具有随机性及低能量密度等特点,将导致电力系统运行的可靠性降低。因此,准确的风速预测对于风电并网及电力系统的运行变得越发重要[3]。
风速预测方法按照原理可分为物理方法[4]、统计学方法[5]及人工智能方法[6]。目前,大多数的国内外学者选择BP 神经网络[7]、支持向量机[8]、极限学习机[9]等人工智能方法对风速进行建模预测。虽然都取得了有效的预测结果,但这些浅层学习算法难以对输入数据的深层特征进行挖掘,从而限制了模型的预测精度。因此,深度学习算法近年来备受关注[10]。文献[11]运用灰色关联决策分析了风速与功率的关系,并利用其灰色关联关系和风速功率曲线建立了风功率预测模型,但未考虑空间相关性对预测模型精度的影响。已有研究表明[12],卷积神经网络(Convolutional Neural Network,CNN)可有效提取风速数据中隐藏的非线性特征。文献[13]提出利用CNN 基于空间相关性提取多位置风机的空间特征,对风场多台风机进行多位置多步预测,有效地提高了预测精度。对规模化风场进行风速预测时需要考虑时空相关特性。研究表明,为提高风速预测精度需对风速空间特征提取,该过程需要依靠高维数据信息,从而加重了模型计算的负担,在效率方面存在一定弊端;现有优化算法仅适用于单次优化,不能执行多个优化控制,不能存储和排序多个优化结果。
本文对多位置多步风速预测方法进行改进,在关联分析环节提出一种风速矩阵时空关联分解重构策略,运用改进灰色关联分析风机的空间关联度及单台风机风速与功率的关联度;提出时序控制的空间关联优化算法,对风速矩阵关键信息进行优选重构。在多步预测环节改进卷积神经网络,引入记忆单元构建卷积记忆网络,进行空间特征提取及超短期预测。结合预测结果与实际数据,对所提方法的有效性进行验证。
为了研究分析机群风速在时间和空间上的分布,从而提取关键特征信息,提出一种风速矩阵时空关联分解重构方法。将风速时序波动按空间分解各时刻的风速信息,基于改进灰色关联法分析(Improved Gray Relational Analysis,IGRA)风速矩阵的空间关联性;通过时序控制的空间关联优化算法对已分解的风速空间矩阵进行重构。
将机群的风速序列按空间分解为各时刻的风速子序列,通过确定参考数据列与对比数据列的几何相似程度判断其关联性[14]。风速参考序列为
式中,v0为所选典型风机的风速序列;v0(t)为参考序列中第t时刻的实测风速值;n为时间点总数。
比较序列vij为
式中,vij为位于(i,j)位置风机的风速序列。
具体步骤如下:
1)对各序列进行初值化处理
2)求参考序列与比较序列之差的绝对值序列为
式中,min minΔ(t)、max maxΔ(t)分别为不同时刻序列Δ(t)的最小值和最大值;κ为分辨系数,且κ∈(0,1),κ越小表明分辨率越高。通过γ关联度能够计算各时刻不同风机的风速关联性。
考虑不同时刻的风向差异,为了进一步分析风速序列的关联性,改进灰色关联方法,引入风向因子评价风向差,若风向差θ>30°,则计算其风速序列关联系数(m=1);否则认为风向差较小,对风速波动相关性的影响可忽略(m=0)。定义风速序列关联系数表征其关联度为
经由上述步骤,量化分析风速参考序列和比较序列数据,得到目标v0的特征系数。
研究表明,风速预测精度受风速时间和空间两方面限制[15-16]。本文将组合时间和空间因素构建三维风速时空序列,选取单时刻的空间风速信息定义为空间风速矩阵(Spatial Wind Speed Matrix, SWSM)St,如图1 所示。其中,随机选取图1 中(i,j)位置风机为典型风机,定义其周围8 台风机为一阶邻域(邻域-Ⅰ);再外围16 台风机为二阶邻域(邻域-Ⅱ),逐层类推,确定矩阵中各风机位置序列。
图1 三维时空序列及SWSMFig.1 3-D spatiotemporal sequence and SWSM
东北地区某风场A 为研究对象(风场A 地形图见附图1),典型风机风速波动如图2 所示。随机选取A 中9×9 机群构建SWSM,利用2019 年8 月实测数据进行分析,计算典型风机与各邻域的风速关联度γ(v),结果见表1。
附图1 风场A 地形图App.Fig.1 Topographic map of wind field A
图2 目标风机风速波动图Fig.2 Target wind turbine wind speed fluctuation chart
表1 各邻域风速关联度γTab.1 Correlation coefficient γ for each neighborhood
表1 中邻域-Ⅰ与典型风机的相关性最高,邻域-Ⅱ次之,邻域阶数越高,关联度越小。风速序列空间关联的程度取决于典型风机与其邻域的距离,距离典型风机位置越远,空间关联度越低。
由此,本文的风机矩阵重构规则为保留典型风机的邻域-Ⅰ及其所在行列的风速信息,将其余位置信息归零,便于对风机矩阵进行重构。
对风电场进行风速预测的目的是为了预测风功率,进而提高新能源并网灵活性。因此,运用灰色关联分析不同风机的风速与风功率之间的关联度大小,从而选择更具代表性的风机作为典型风机。计算风电场 A 中各台风机风速-功率的关联度γ(v-P),将风速序列v作为参考序列,功率序列P为比较序列,结果如图3 所示。
图3 各风机风速-功率关联度Fig.3 Correlation coefficient γ(v-P) of each wind turbine
图3 中风机v-P关联度主要集中于[80%, 90%]范围内,对应风机均位于机群阵列中,表明这些风机受到尾流效应的影响较大导致关联度较低;少数风机位于阵列边缘,受来风向尾流的影响较小,关联度较高。
风机阵列中各风机具有不同的空间相关性,若考虑空间相关性进行风速预测需要通过局部特征扩展至全局,进而导致提取风场空间特征的复杂度增加。针对该问题,结合风速-功率关联度和风机间的互关联度,利用时序控制的空间关联优化算法(Improved Spatial Association Algorithm, ISAA)优选出代表性风机,然后根据指定规则重构风机阵列,从而降低空间信息提取复杂度,提高风速的预测效率。
结合风场地理信息,将其视为动物种群生存森林,森林树木表示各台风机位置,各动物以综合考虑风机互关联度γ(v)和风速-功率关联度γ(v-P)为原则对其进行搜索,数学模型可表示为
式中,v为二维空间变量矩阵;d为种群代数;ψ为权重系数;Lij、Uij分别为空间变量vij的上、下限。
ISAA 的主要步骤如图4 所示。
图4 ISAA 主要步骤Fig.4 ISAA flow chart
为得到契合本文实际情况的最优目标选取,根据优选概率嵌入时序控制策略。当时序节点为ϑ时,综合排序每次优化得到的目标,得到概率最高的目标。
基于时序控制的空间关联优化算法选取典型风机的思想是根据种群寻优算法改进的新型优化算法,具有较强的全局搜索能力,能够不受区域规模限制搜索并找到克服局部最优的全局最优解。因此,ISAA 更适用于对风场中的风机序列进行优选。根据优化结果对SWSM 进行重构,生成SWSM*并输入卷积记忆网络,以提高空间特征提取效率及多步预测精度。
当前多数风速预测方法由于忽略空间特征信息导致预测精度有限,且多数的浅层学习算法无法挖掘原始数据所隐含的深层特征。针对该问题,改进卷积神经网络,引入记忆单元构建卷积记忆网络(Convolutional Memory Network, CMN),模型对重构后的风速矩阵进行预测。可直接对CMN 输入多个SWSM*,而无需将二维空间信息展开为一维序列,避免了空间信息丢失。其预测过程可分为两部分,首先进行空间特征提取以实现维度压缩及深层特征挖掘,进而利用记忆单元对风速进行多步预测,本文采用反向误差传播作为CMN 的训练算法。具体结构如图5 所示。
图5 卷积记忆网络结构Fig.5 CMN structure diagram
CMN 的空间提取部分中,利用多个卷积核对输入的风速矩阵逐一进行特征提取,得到长度较小的特征图;然后在下一层中利用其他卷积核重复该步骤,直到生成的特征图可通过全连接层展开成所需特征序列。
在CMN 架构中,同一层中的神经元之间不存在连接。此外,在不同网络层中的神经元之间采用权重共享技术以简化前馈和后向传播过程。具体来说,前l-1 层中的特征映射与共享权重进行卷积,然后通过定义的激活函数来生成具有若干输出特征映射的第l层,即
通过空间提取部分完成对 SWSM*中隐藏信息的挖掘和提取,以获取空间特征中深层数据和关联规则,提高风速预测精度。
每个记忆预测单元拥有一个记忆细胞,其在时刻t的状态记为ct。对ct的读取和修改通过对输入门et、遗忘门ft和输出门ot的控制实现。ft在t时刻接收当前状态xt与上一时刻隐藏层状态yt-1,将所接收状态经由σ激活使遗忘门的输出值均在[0, 1]之间。当ft输出为0 时,表示上一状态的信息全部丢弃,当输出为1 时,上一状态信息全部保留。et的输入经由非线性函数变换后,与ft的输出叠加得到更新后的记忆单元状态ct,最后输出门根据非线性函数运算后的ct动态控制得到输出yt。各变量具体计算公式为
式中,Wxf、Wxc、Wxe、Wxo为连接输入信号xt的权重矩阵;Wyf、Wyc、Wyo、Wye为连接隐含层输出信号yt的权重矩阵;Wce、Wcf、Wco为连接神经元激活函数输出矢量ct和门函数的对角矩阵;re、rc、rf、ro为偏置参数;σ为激活函数,通常为tanh 或sigmoid函数。
选取东北风电场 A 的风机布局信息,结合其2019 年8 月的实测数据进行预测。
设计用于风速多步预测的IGRA-ISAA-CMN 组合预测方法,设置ISAA 基本参数N=25,N′=5,g=50,ϑ=9。CMN 的预测部分需确定输入层时间步数,即考虑历史序列长度,会影响模型计算复杂度及预测精度,若选用步数过大将降低模型预测性能,过小会引发预测误差较大。文献[13, 17]分别选用输入步长为15 和20,本文通过试探在15~20 之间选择步长18 为最佳,即输入前18 时刻的历史数据用于预测。特征提取部分选用三层结构,第一层设置为具有15 个3×3 卷积核的卷积层,第二层卷积层选用25 个3×3 的卷积核,第三层为全连接层,将卷积层输出的二维特征展开成一维向量输入预测部分。
评价预测结果时选取平均绝对百分比误差ε1、方均根误差ε2及日平均预测计划曲线准确率ε3,构建适用于多位置、多步风速预测评价指标为
式中,k为预测步长;v为实测风速值;y为预测风速值;a、b分别为风电场阵列中的行数和列数;N1为测试样本时间点总数;N2为总风机台数。
为避免风机位置优选的特殊性,随机选取1 个月内的9 个时刻利用ISAA 优选代表风机。定义搜索矩阵规模为5×5,对风场A 中风机阵列子区域命名区分,根据方向自北至南分为areaI~areaⅧ,从西到东分为area1~area18。初始化风机分布矩阵,矩阵元素为各风机编号,未安装风机的位置为0。结果见附表1。
考虑到γ(v)受两台风机的风速差值影响,风速差越小,关联度越大,故在选择SWSM 时需优先规避补零风机;同时,未受尾流效应影响的风机γ(v-P)较高,故ISAA 默认优先选择来风方向风场边缘的风机。因此在进行优选时,引入加权综合γ(v)和γ(v-P)的启发规则,根据附表1 中ISAA 进行9次优选排序的结果显示,矩阵area9Ⅴ为最后得到的风机矩阵。在此基础上选取5 个先锋动物(N′)在area9Ⅴ中对各台风机再次进行优选排序,得到95 号风机为典型风机,如图6 所示。将优选结果根据1.2 节中的风机矩阵重构规则进行重构,得到新的空间风速矩阵SWSM*。
附表1 优选风机位置排序结果App.Tab.1 Preferred WT position ranking results
图6 ISAA 优选结果Fig.6 The results of ISAA
选择不同组合方法进行多步预测以验证ISAA的有效性。其中,方法1 为ISAA-CMN,方法2 为CMN,预测结果见表2。
表2 中两种方法均能有效预测风机阵列的多时刻风速,其中方法1 的训练时长为309.87s,方法2的训练时长为467.15s,预测效率提高了33.7%。证明ISAA 对SWSM*的优选重构,可显著提高模型的预测效率。从预测精度来看,方法1 由于忽略了高阶邻域的风速信息,导致预测精度略微下降,其中ε1的下降幅度最高为0.07m/s,最低为0。由此可知,方法1 在提高预测效率的同时仍具有较高的预测精度。
实测数据采样间隔为10min,该月风速数据构成4 320 个SWSM,取前80%的风速样本对风速组合模型进行训练,对后20%风速进行预测。训练集及测试集中的SWSM 经重构后输入CMN 进行训练及预测。为说明CMN 的有效性,随机选取预测集中的连续时间点,对其进行0~1h、0~2h 和0~4h 的多尺度超短期风速预测,其中 0~4h 预测处理成15min 节点进行预测。将预测结果与持续法( Persistence Method, PR)、 自回归滑动模型(Autoregressive Integral Moving Average, ARIMA)及BP 神经网络进行对比。PR 直接将当前时刻的实测值作为下一点的预测值;BP 使用单隐含层网络结构,激活函数为 sigmoid 函数;ARIMA 采用ARIMA(1, 1, 1)模型进行训练与预测。不同编号风机的不同尺度预测结果如图7~图9 所示。
图7 95 号风机预测结果对比Fig.7 Comparison of prediction results of 95# wind turbine
图8 79 号风机预测结果对比Fig.8 Comparison of prediction results of 79#wind turbine
图9 129 号风机预测结果对比Fig.9 Comparison of prediction results of 129#wind turbine
由不同时间尺度的预测结果可知,四种方法的预测结果均能在一定程度上符合实际风速波动情况。其中PR 由于其单一的预测结构导致随着时间尺度的增加预测精度越来越低。ARIMA 和BP神经网络无法直接对时空数据进行输入,而需先将空间二维信息展开成一维,在此过程中将丢失大量空间相关信息,导致多数预测点与实际偏差较大。相对而言,本文所提方法不仅可直接输入三维时空信息、挖掘空间数据中隐藏的深层特征及各空间位置关联性,避免由于忽略空间信息导致预测精度下降,而且对风速的波动趋势和细节变化均可较好拟合,使大部分节点都能得到较高的预测精度。同时,其误差反向传播的训练算法也能有效减小预测误差,因此CMN 模型能取得更为准确的预测效果。
在预测效率方面,BP 神经网络的总训练时长为513.12s,ARIMA 为 437.35s,本文所提出的ISAA-CMN 为309.87s。由于本文方法通过ISAA 优选重构空间风速矩阵,降低了输入风速矩阵的空间复杂度,因此减小了CMN 的预测时长,提高了预测效率。为更好地验证本文方法的预测准确性,对风机阵列0~1h 预测结果进行误差计算,结果见表3。
表3 不同算法预测误差对比Tab.3 Contrast of prediction errors of different algorithms
结果表明,PR 的预测性能明显弱于其他三种方法,且随着预测步长的增加,其劣势越发明显。本文方法的6 步平均误差为ε1为0.57m/s,ε2为6.89%,BP 神经网络的平均误差为ε1为 0.85m/s,ε2为11.53%,ARIMA 的平均误差为ε1为0.84m/s,ε2为11.57%。因此,在总体平均性能及个体误差的控制能力上,本文方法均有较好的表现,这得益于CMN在训练过程中能够对历史风速信息选择记忆或遗忘,其反馈神经网络结构使其预测精度与其他算法相比有所提高。而BP 神经网络的方均根误差在1~2 步预测中误差小于ARIMA,在3~6 步预测中误差大于ARIMA,表明其更适用于较小步长的预测,如单步滚动预测。根据不同步长预测结果可知,随着步长的增加,误差存在一定累积,这主要是由于风速时间序列的混沌特性造成,该结论与文献[18]一致。
为避免所选地区经纬度及气候特殊性的影响,故选取南方电网某风场B(地形图见附图2)验证所提方法的泛化能力。由于所选地区为山区地形,与东北平原地区的集中式规模化风电场相差较大,该风场为依山脊走势而建的小规模机群。
附图2 风场B 地形图App.Fig.2 Topographic map of wind farm
根据风场B 的地形及规模,设置ISAA 基本参数N=9,N′=3,g=30。基于风速空间关联度γ(v)和风速-功率关联度γ(v-P)优选结果如图10 所示。对所选SWSM 进行重构、提取及预测,得到结果与不同方法对比分析,结果见表4 和表5。
图10 风电场B 优选结果Fig.10 Wind farm B optimization results
表4 风场B 两种方法结果对比Tab.4 Comparison of results of two methods wind farm B
由于风电场B 中风机分布具有较大的分散性,从而降低了风速关联度,导致在特征提取时涵盖了大部分风机的空间特征信息。因此,表4 中两种方法的误差较为接近。由表5 可知,本文所提方法的预测结果相对于对比方法更能准确地反映风速变化趋势。为证明所提方法的工程实用性,进一步对预测风速进行风功率转换。选取基于最大风速出力模型[19]进行间接转换(模型1),模型2 为直接利用本文模型预测风功率值,另外选取ARIMA 和PR 法进行对比分析,具体结果如图11 所示。
图11 风场B 阵列风功率预测对比Fig.11 Wind farm B array wind power prediction comparison
表5 风电场B 的不同算法风速预测误差对比Tab.5 Contrast of wind speed prediction errors of different algorithms for wind farm B
图11 中,模型1 的预测效果明显优于模型2,其在各步预测中得到的预测结果均更贴近于实际值;ARIMA 能大致预测风功率变化趋势;而 PR法仅在最后一个时刻值才与实际值较符合,说明该方法的预测原理并不适用于非线性序列预测。由于风功率数据中存在大量零点,从而导致直接预测模型对风速预测的准确性高于风功率预测。而通过间接法预测时可以将低于切入风速和高于切出风速的点剔除,将合格点进行风功率转换,由此改善了预测效果。同时,间接法相对于直接预测在时间复杂度方面仅增加了5.36s,符合预测标准要求。模型 1 虽然在预测步骤上稍显复杂但在精度上具有较大优势,更具有实际意义。验证了该方法不仅对平原规模化风场可达到较好的预测效果,也同样适用于丘陵地区分散式风场,具有较强的适用性和泛化能力。
基于风速关联性研究多步风速及风功率预测方法,得出以下结论:
1)提出时空关联分解策略,利用改进灰色关联法能够考虑风向因素分析风速序列在空间分布上的关联特性。
2)通过时序控制的空间关联优化算法可以对风速关联矩阵进行排序优选,并按照指定规则重构空间风速矩阵,从而降低关键信息提取的复杂度,提高运算效率。
3)风速多步预测环节采用卷积记忆网络能够直接接收三维时空信息,深入挖掘风速数据中的隐含特征;基于时空关联的卷积压缩能够避免由于忽略空间信息所导致的预测精度下降问题,对风速的随机波动性具有较好的拟合效果。在此基础上进一步预测风功率,并与实际数据对比,验证了多步预测方法的准确性与适用性。
附 录