王 娜 ,邵 霞,高云鹏,万 全
(1.湖南大学 电气与信息工程学院,湖南 长沙 410082;2.国网湖南省电力公司电力科学研究院,湖南 长沙 410007)
基于区域信息融合的风电场平均年发电量预测*
王 娜1†,邵 霞1,高云鹏1,万 全2
(1.湖南大学 电气与信息工程学院,湖南 长沙 410082;2.国网湖南省电力公司电力科学研究院,湖南 长沙 410007)
备选风电场在寿命周期内的平均年发电量是风电场宏观选址的一个重要参考判据.为了提高风电场平均年发电量的预测精度,提出了一种基于风电场附近多个气象站长期测风数据的区域信息融合的平均年发电量预测方法.首先分别建立各气象站与风电场同期小时风速之间的相关模型,应用相关模型得到多个长期小时风速预测值,再用神经网络对长期小时风速预测值进行融合处理得出最终的小时风速预测值,在此基础上进行风电场平均年发电量的估算.仿真结果表明:本文提出的区域信息融合方法对年平均发电量的预测误差比采用单一气象站数据的预测误差最高可降低11.32%.
平均年发电量;测量-相关-预测;信息融合;神经网络
风能资源评估是风电场选址的关键,其中备选风电场在整个寿命周期内的平均年发电量是一个重要的参考判据.风电场的寿命周期通常为20~25年,在此期间平均年发电量的估算受风速变化(日变化、季节变化、年际变化)影响较大,要准确地进行评估至少需要数年甚至数十年的风速观测数据,这样才能减少由于风速变化带来的不确定性[1].但是,在实际工程的规划阶段不可能用如此长的时间来收集现场数据.在缺乏备选风电场长期可靠风速记录的情况下,广泛采用测量-相关-预测算法(MCP,Measure-Correlate-Predict)来进行风资源评估,即在备选风电场址处设立测风塔进行1~2年观测,利用这个短期观测数据和风电场附近气象站20~30年的历史观测数据进行评估.
目前MCP算法主要有线性回归法[2-4]、方差比法[2]、Weibull尺度法[3]、概率函数法[5]、神经网络法[1,6]和Bayesian网络法[7]等.其中线性回归法、方差比法、Weibull尺度法、概率函数法均是利用风电场附近单一气象站的信息进行预测.实际上风电场附近可能存在多个与风电场距离较近且风速相关性较强的气象站,在这种情况下只采用一个气象站的信息势必会影响预测的精度.为了进一步提高预测精度,本文提出了基于多气象站信息即区域信息融合的平均年发电量预测算法.该算法由3部分构成,首先分别建立各参考气象站与风电场同期小时风速之间的相关模型,应用相关模型得到多个长期小时风速预测值;然后用神经网络对长期小时风速预测值进行融合处理得出最终的预测值;最后,在长期小时风速的基础上进行风电场平均年发电量的估算.与文献[1]和[7]相比,算法更加灵活,并且可以运用目前成熟的MCP算法,对年平均发电量的预测误差相比采用单一气象站数据预测方法最高可降低11.32%.
1.1 基本原理
基于区域信息融合的风电场长期平均年发电量预测方法的基本原理如图1所示.
假设风电场附近区域有n个气象站,能够提供与风电场测风塔同期(1~2年)的逐小时风速和风向数据以及连续20~30年的逐小时风速和风向数据.以参考气象站1为例,对测风塔和参考气象站1的同期风速进行相关处理,再将参考气象站1的全部小时风速和风向数据应用到此相关模型中,从而得到一组风电场的长期小时风速预测值.采用相同的方法可得到n组长期小时风速预测值.这时对每一个时间点均有n个预测值,将这n个预测值经过融合算法后得到该时间点最终的预测值,逐点处理后即可得到风电场最终的长期小时风速预测值.最后应用所得风速信息进行平均年发电量的估算.
图1 风电场平均年发电量预测示意图
这里假设风电场寿命周期内的风速特征不会发生明显改变,因此,可用长期历史平均年发电量来代表风电场在未来寿命周期内的平均年发电量.同时,由于算法中应用了气象站的长期小时风速和风向,因此该算法适用于气象站的历史数据记录比较完整的场合.
算法中有两个关键点,一是风电场和各气象站同期小时风速的相关预测算法,二是多个预测值的融合算法.本算法采用已有成熟的利用单一气象站的MCP算法作为相关模型,因此,本文重点研究预测值的融合算法.
1.2 基于粒子群优化的神经网络融合算法
BP神经网络是一种按误差逆传播算法训练的多层前馈网络,能够学习和存贮大量输入-输出模式的非线性映射关系,是广泛应用的数据融合方式.
三层神经网络结构如图2所示, 输入层信号为由单一气象站数据得到的风电场小时风速预测结果,n表示所用气象站的数量,输出信号为风电场小时风速的最终预测结果.为了提高神经网络的泛化能力,避免算法陷入局部最优,在神经网络训练完成后,再次采用粒子群算法优化网络的权值.
在粒子群优化算法中,每个粒子代表解空间的一个候选解,解的优劣程度由适应度函数决定,而适应度函数根据优化目标定义.
图2 BP神经网络结构
(1)
(2)
式中ω称为惯性权重;c1,c2为学习因子,也称加速常数;r1,r2为[0, 1]之间均匀分布的随机数.
具体训练过程为:
1)将各个气象站的同期逐小时风速和风向数据应用到相关模型,从而得到多个风电场同期小时风速预测值,将此多个风速预测值构成新的样本集,并以新的样本集作为输入,相应的风电场同期实测风速作为输出进行训练,在满足一定的精度时结束训练,将此时的权值传递给粒子群优化算法.
2)在粒子群优化算法中,粒子i的位置信息Xi即为神经网络的权值.为了能够从神经网络结束的位置继续进行优化,将粒子1的位置初始化值设置为神经网络传递过来的权值rij,而其他位置初始化为随机值,即[8]:
(3)
所有粒子的速度初始化值也为随机值.
3)以均方根误差作为适应度函数,评价粒子适应度值.将第i个粒子当前点设为最优位置pBesti,所有粒子中最优者设为种群最优位置gBest.
4)按式(1)和式(2)更新各个粒子的速度和位置,得到新的种群.
5)计算各粒子的适应度值,与其历史最优位置和种群最优位置比较,若更优,则替换,否则保持不变.
6)检查是否满足粒子群优化结束条件,满足则输出最优解,不满足则转至4).粒子群优化结束的条件有两个:一是达到最大进化代数;二是在应用验证样本进行计算时,最优粒子连续6次保持不变.神经网络和粒子群算法具有相同的训练样本和验证样本.
在风能资源评估中,需要选择一种成熟的机型初步估算风电场发电量,一般认为在扣除各种损耗 后风电场年等效满负荷小时数超过2 000 h才具备较好的开发价值,或认为容量系数大于0.3的地区将会有明显的经济效益.
在利用风电机组的功率曲线计算发电量时,厂家通常只提供有限对风速、功率点值M(vj,Pwtj),而对于风速vi(vj≤vi≤vj+1),则需要通过插值或曲线拟合来近似获取.本文采用线性插值:
(4)
其中vcut-in和vcut-out分别为风机的切入和切出风速.
已知风电场处的长期小时风速后,采用式(5)进行累加计算年发电量:
(5)
其中ρ和ρ0分别表示实际空气密度和标准环境下的空气密度.多年计算结果的平均值即为长期平均年发电量.需要指出的是,本文计算的是单台发电机组的理论平均年发电量.
为评价算法的性能,采用长期风速的均方根误差MARE和平均年发电量相对误差M两个误差评价指标,分别定义如下:
(6)
(7)
其中下标p代表预测值,m代表测量值.
3.1 数据来源及典型风电机组选择
本文应用荷兰6个气象站(S1~S6)1994年~2013年20年间的小时风速及风向序列来对所提方法进行验证,数据来自荷兰皇家气象研究所(KNMI).气象站的地理位置等基本信息如表1所示.
表1 气象站的基本信息
6个气象站风速之间的线性相关系数如表2所示,在风能资源评估中,一般需要校验风电场和参考气象站之间的风速相关性.如果相关系数太小,评估误差也会增大.
表2 不同气象站之间风速的线性相关系数
选择Vestas80-1800作为典型风机来计算平均理论年发电量.Vestas80-1800风电机组的额定功率是1 800 W,切入风速4 m/s,切出风速25 m/s,额定风速16 m/s,轮毂高度80 m.计算时首先采用如式(8)所示的幂指数方程将气象站10 m高度处的风速转化为轮毂80 m高度处的风速.
v1=(h1/h0)a·v0
(8)
式中v1为高度h1处的平均风速;v0为高度h0处的平均风速;a为风切变系数,采用幂指数方程.因缺乏不同高度的实测风速数据,取风切变系数1/7(约0.143)为近似值.
3.2 仿真过程及结果分析
仿真建模过程如图3所示,将2013年作为同期观测年,即风电场和气象站2013年的小时风速和风向均为已知.利用短时同期风速对融合算法进行训练,再将参考气象站长期小时风速和风向数据(1994年~2013年)输入到模型中,即可得出风电场的长期小时风速预测值.
在仿真中,将某些气象站作为备选风电场,将某些气象站作为参考气象站,由此得到不同的算例,本文选择如表3所示的15个算例.如在算例1中,将S1作为风电场,分别选择其附近1个(S2)、2个(S2,S4)和3个(S2,S4,S5)气象站作为参考气象站来预测S1处的长期小时风速和平均年理论发电量,并与实际值比较来评价算法的性能.当采用风电场附近的区域信息即多个参考气象站信息时,第2个参考气象站与风电场之间的风速相关系数小于第1个,第3个小于第2个,如算例1,RS2-S1>RS4-S1>RS5-S1.
图3 仿真建模过程示意图
表3 分析中所用的算例
仿真中风电场和参考气象站之间的同期风速采用方差比法进行8扇区相关处理(也可以用其他相关算法),神经网络隐含层节点20个,在matlab中采用train函数进行训练,粒子参数设置为:ω=0.9,c1=c2=2.0,种群数量30.
采用单一气象站和采用区域多个气象站信息融合的风电场长期小时风速预测均方根误差如图4所示,从图中可以看出均方根误差随着参考气象站数量的增加而减小.
算例
图5是在Vestas801800机型的基础上计算的单台发电机的理论发电量实际值和预测值,图6为平均年发电量的相对误差.
算例
从图6可以看出,区域信息融合方法的相对误差均低于采用单一气象站的方法,以算例10为例,相对误差从12.49%降到1.17%,下降了11.32%.仿真中也发现,参考气象站数量的增加并不一定使误差减小,仍以算例10为例,采用2个参考气象时的误差为1.17%,采用3个参考气象站时的误差则为1.76%,这与长期小时风速的均方根误差随参考气象站数量的增加而单调递减不同,产生这种现象的原因在于风速与风电机组的功率曲线呈现非线性关系,风电机组只有在实际风速处于切入风速和切出风速之间时才能发电,而且在功率曲线的上升阶段,风速预测误差会对发电量产生较大影响,而在风速达到额定风速之上时,其误差对发电量的影响很小甚至没有.
算例
本文建立了基于区域信息融合的风电场年平均发电量预测模型,应用6个参考气象站20年间的风速样本进行了仿真,结果表明采用区域信息融合方法能够降低平均年发电量的预测误差.根据仿真结果综合分析,在实际应用中一般采用2个或3个参考气象站的数据为宜.本文提出的算法适用于参考气象站的历史观测数据记录比较完整的场合,如果历史观测数据缺测较多,可采用文献[4]中的思路,将风电场的测风数据订正为一套反映风电场长期平均水平的代表年的逐小时风速风向数据,订正过程中仍可将多参考气象站的信息进行融合,但其精度还需要进一步验证.
[2] PEREA A R, AMEZCUA J, PROBST O. Validation of three new measure-correlate-predict models for the long-term prospection of the wind resource [J]. Journal of Renewable and Sustainable Eergy, 2011, 3(2): 1-20.
[3] ANTHONY L R, JOHN W R, JAMES F M. Comparison of the performance of four measure-correlate-predict algorithms [J]. Journal of Wind Engineering and Industrial Aerodynamics, 2005, 93(3): 243-264.
[4] 中华人民共和国国家质量监督检验检疫总局. GB/T18710-2002, 风电场风能资源评估方法 [S]. 北京:中国标准出版社, 2002.
General Administration of Quality Supervision, Inspection and Quarantine of the People's Republic of China. GB/T18710-2002, Methodology of wind energy resource assessment for wind farm [S]. Beijing: China Standard Press, 2002.(In Chinese)
[5] CARTA J A, VELZQUEZ S. A new probabilistic method to estimate the long-term wind speed characteristics at a potential wind energy conversion site [J]. Energy, 2011, 36(5): 2671-2685.
[7] CARTA J A, VEL ZQUEZ S, MAT AS J M. Use of Bayesian networks classifiers for long-term mean wind turbine energy output estimation at a potential wind energy conversion site [J]. Energy conversion and management, 2011, 52(2): 1137-1149.
Average Annual Energy Output Prediction Based on Regional Information Fusion
WANG Na1†, SHAO Xia1,GAO Yun-peng1,WAN Quan2
(1.College of Electrical and Information Engineering, Hunan Univ, Changsha,Hunan 410082 China;2.State Grid Hunan Electric Power Company Research Institute, Changsha,Hunan 410007,China)
Annual energy output of a candidate site in its life span is an important reference criterion of wind farm macro siting. A regional information fusion method, which allows the use of multiple reference wheather stations with a long history of wind speed and wind direction measurements, was proposed to improve the annual energy output prediction accuracy. Firstly, the correlation model was established between the short-term wind data of a single reference wheather station and the candidate wind farm, and the multiple long-term wind speeds of candidate site based on different reference stations were predicted by using the model. Then, the multiple prediction results were integrated by neural network to obtain the final long-term hourly wind speed data, and the annual energy output was subsequently determined on the basis of the knowledge of these wind speeds. The simulation results show that, by using the proposed method, the error reduction up to 11.32% has been achieved in the relative error of the average annual power output, with respect to the case of using a single reference wheather station method.
average annual energy output; measurement-correlate-predict(MCP); information fusion; neural network
1674-2974(2015)08-0081-05
2014-08-18
国家自然科学基金资助项目(51277055,51107035),National Natural Science Foundation of China(51277055,51107035)
王 娜(1979-),女,辽宁铁岭人,湖南大学讲师,博士研究生
†通讯联系人,E-mail:wangna_ln@126.com
TM315
A