胡 倩,陈红坤,孙志达(武汉大学电气工程学院,武汉 430072)
风电场短期风速的集成学习预测模型
胡 倩,陈红坤,孙志达
(武汉大学电气工程学院,武汉 430072)
准确的风电场风速预测对含大规模风电的电力系统安全稳定运行具有重要意义。针对时间序列法、卡尔曼滤波法、神经网络法等单一预测模型预测精度不高的问题,引入集成学习的分析方法,提出了一种基于Adaboost算法改进的支持向量机(SVM)短期风速预测方法。该算法使用多个SVM模型通过加权累加得到最终输出,弥补了单一预测模型的缺陷。同时引入隶属度函数,通过赋予历史数据样本不同的权重来突出不同时间样本在预测模型中的差异性。以内蒙古风电场的实际采集数据为算例进行测试,结果表明模型预测精度显著提高,为实现更准确的在线短期风速预测提供了可能。
短期风速预测;集成学习;动态权重;隶属度函数;支持向量机
随着能源问题和环境问题的日益突出,风能作为重要和最成熟的可再生能源技术,因其蕴藏量丰富、可再生、分布广、无污染等特性,成为可再生能源发展的重要方向。但随着风电比例的增加,风能具有的随机性、间歇性给电力系统的安全稳定和调度控制带来了很大的困难。如果能对风电场风速和风电功率进行准确预测,不仅有利于电力系统的运行和控制,还能降低旋转备用容量,有效提高电网接纳风电的能力[1-2]。
目前风电场短期风速的预测方法主要可以分为物理模型预测和统计学模型预测。物理预测方法主要是基于数值天气预报和考虑地理环境影响的物理建模,其模型复杂,计算难度大;统计预测方法主要有时间序列法、卡尔曼滤波法、神经网络法、支持向量机等数学方法和智能算法[3-6],其中应用最广泛的是神经网络和支持向量机理论。支持向量机理论与传统神经网络方法相比,具有学习速度快、泛化能力强等优点,在性能上明显优于神经网络,因此在时间序列预测中具有更广泛的应用。但单一的支持向量机预测模型易受核函数和参数影响,当大规模风电接入系统时,其预测精度仍无法满足要求。
针对以上问题,本文引入集成学习的研究思路,提出使用Adaboost算法来改进单一的支持向量机预测模型,并引入隶属度函数来改善预测中的随机性因素对预测结果的影响。通过算例分析,验证了经Adaboost算法和隶属度函数改进后的支持向量机预测模型在短期风速预测中的预测精度显著提高。
Adaboost算法[7-8]是Freund和Schapire在Boosting算法的基础上经过改进得到的一种机器学习方法,能有效提升算法性能,常用于解决分类和回归问题。目前该算法已经运用到电力系统负荷预测、交通量预测,得到了不错的预测效果。
Adaboost算法的主要思想是针对某一训练集,通过调整该训练集中样本的权重来训练不同的弱学习器;然后将这些弱学习器通过加权叠加的方式组合起来形成一个更强的学习器,使学习误差得到有效降低。算法的主要步骤是给定一个训练集,初始时训练集中的每个样本都具有相同的权重,在此样本分布下训练得到一个基本学习器G1(x)。然后通过比较学习器对训练集的预测误差来调整样本分布,对误差较大的样本赋予更高的权重,预测误差小的样本则降低其权重,这样将预测精度低的样本凸显出来。同时,根据预测误差情况给予学习器一个权重ω1,表示该学习器的重要程度,预测精度越高权重越大。在新得到的样本分布下,再进行学习得到第2个基本学习器G2(x)及其权重ω2。以此类推,经过T次迭代,可得到T个基本学习器及其对应权重ωt。最后将各个基本学习器按权重ωt累加起来,得到最终的强学习器,计算公式为
支持向量机[9-10]是一种建立在VC维(Vapnik-Chervonenks dimension)理论和结构风险最小原则基础上的分类方法和回归工具,具有学习速度快、泛化性好的特点,能够较好地解决小样本、非线性、高维数和局部极小点等实际问题。最小二乘支持向量机LS-SVM(least squares support vector machine)用等式约束代替标准SVM算法中的不等式约束,将求解二次规划问题转化为求解线性方程组,降低了运算复杂度,提高了计算速度。
支持向量机的基本原理是通过非线性转换将输入向量由低维空间映射到高维空间,使低维空间的非线性问题转换为高维空间的线性问题。在这个空间中结合结构风险最小原理构造回归函数,并引入空间核函数巧妙地代替高维空间中的向量内积值,使计算得到简化。
假设给定训练数据(xi,yi)(i=1,2,…,n),xi∈Rd,d为R空间的维数,yi∈R。通过核空间映射函数φ(x)将训练数据从低维空间映射到高维空间中去,其线性函数集合为
式中:w为权向量,w∈Rk;b为常数,b∈R。
最小二乘支持向量机的目标优化函数及约束条件分别为
式中:ξi为松弛因子,ξi≥0;c为惩罚参数。建立Lagrange方程,即
式中,ai为Lagrange乘子。
根据KTT优化条件可得
从而有
从而,上述的优化问题可简化为求解线性方程组,其线性方程组为
式中:I为n×n的单位阵;e为元素为1的n×1单位列向量。其中,a=[a1,a2,…,an]T;y=[y1,y2,…,yn]T;G=[(x1)T,(x2)T,…,(xn)T]
根据Mercer条件,定义核函数为
式(8)中的K(xi,xj)是最为常用的高斯径向基核函数,表示为
将式(9)代入式(7),得
解上述线性方程求出a和b,从而得到LSSVM非线性回归函数为
本文以SVM算法作为Adaboost算法的基本学习器,对采样后的各训练子集进行学习,得到相应的基本学习器,然后将这些基本学习器组合起来得到最终的预测模型。基于Adaboost的SVM模型的预测流程如图1所示。
图1 模型预测流程Fig.1 Flow chart of model prediction
当采用SVM算法进行预测时,近期的数据样本往往比远期的数据样本能提供更多的信息。因此在建立模型时就要考虑增强近期数据样本的影响而减弱远期数据样本的影响。本文提出以隶属度函数来表征数据样本的重要性。隶属度函数以时间为自变量,表达形式为
本文通过隶属度函数来确定Adaboost算法的样本初始分布,预测模型的具体步骤如下。
步骤1 给定训练集并确定训练算法,即
(x1,y1),(x2,y2),…,(xn,yn),xi∈X,yi∈Y,X和Y表示样本空间。
步骤2 初始化N个样本的权值,置样本初始权重ω为
步骤3 对于t=1~T进行迭代。
(1)在训练样本的概率分布下,训练弱学习器Gt(x);
(2)计算弱学习器在当前样本分布下的误差率εt,计算公式为
式中,μ为衡量预测精度的阈值。
(3)计算αt,计算公式为
(4)置ωt(i)×βt→ωt(i),并归一化ωt(i)。其中
(5)置t+1→t。
步骤4 输出结果为
4.1 预测误差指标选取
本文采用均方误差MSE(mean squared error)和平均相对误差MRE(mean relative error)来衡量预测结果,其定义分别为
式中:y(i)为实际值;ŷ(i)为预测值;N为预测样本个数。
4.2 循环次数T T的选取
本文通过模型的预测误差来确定最佳循环次数T。对Adaboost算法每一次循环得到的基本学习器Gt(x),通过加权累加得到强学习器G(x)。计算G(x)的预测误差,当预测误差开始增加时停止循环。将对应的循环次数作为最终T值,则此时的模型输出具有最小预测误差,能有效避免过学习。
4.3 风速预测实验
本文使用内蒙古某风电场在2007年某一时间段每1 h记录1次的风速数据序列,按时间顺序分别选用前396个观测点的记录数据作为训练样本,其后的24个观测点作为测试样本,采用Matlab仿真平台进行分析。
图2给出了本文预测模型和最小二乘支持向量机对风速序列进行预测的结果。将2个模型的预测结果进行对比。由图可观察到,引入Adaboost算法和隶属度函数后,模型能更好地预测实际风速序列的变化趋势,预测滞后现象得到大幅度改善,对风速突变点的预测能力也有所增强。
图2 Adaboost改进前后模型的风速预测结果Fig.2 Model prediction results with and without Adaboost algorithm improved
表1列出了本文方法、LS-SVM法及时间序列法3种预测方法的预测精度。通过计算发现:采用时间序列法和LS-SVM法进行风速预测时,预测的平均相对误差为30.82%和23.75%。而利用Adaboost改进后的预测方法进行风速预测时,平均相对误差降为10.32%,其预测精度大大提高,充分验证了本文方法的可行性和有效性。
表1 3种预测模型的误差比较Tab.1 Prediction errors between three forecasting models
针对单一支持向量回归模型易受自身参数和数据随机性的影响造成预测精度不高的问题,本文采用集成学习的分析方法,提出基于Adaboost算法和隶属度函数改进的SVM短期风速预测模型,通过合并多个基本学习器的输出以产生更精确的预测结果。同时采用隶属度函数对每个样本设置不同的权重,赋予近期数据样本较大权重来提高其在预测模型中重要性。仿真结果显示本文提出的预测模型预测精度较单一的SVM预测模型有显著提高,预测滞后效应得到有效改善,为实现更精确的短期在线风速预测提供了可能。
[1]尹明,王成山,葛旭波(Yin Ming,Wang Chengshan,Ge Xubo).风电并网经济技术评价研究综述(Review of economic-technical assessment of wind power integration)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2010,22(5):102-108.
[2]Lange B,Rohrig K,Ernst B,et al.Wind power prediction in Germany-Recent advances and future challenges[C]// European Wind Energy Conference and Exhibition.Athens,Greece,2006:1810-1817.
[3]Ma Lei,Luan Shiyan,Jiang Chuanwen,et al.A review on the forecasting of wind speed and generated power[J].Renewable and Sustainable Energy Reviews,2009,13(4):915-920.
[4]丁明,张立军,吴义纯(Ding Ming,Zhang Lijun,Wu Yichun).基于时间序列分析的风电场风速预测模型(Wind speed forecast model for wind farms based on time series analysis)[J].电力自动化设备(Electric Power Automation Equipment),2005,25(8):32-34.
[5]杨秀嫒,肖洋,陈树勇(Yang Xiuyuan,Xiao Yang,Chen Shuyong).风电场风速和发电功率预测研究(Wind speed and generated power forecasting in wind farm)[J].中国电机工程学报(Proceedings of the CSEE),2005,25(11):1-5.
[6]罗文,王莉娜(Luo Wen,Wang Lina).风场短期风速预测研究(Short-term wind speed forecasting for wind farm)[J].电工技术学报(Transactions of China Electrotechnical Society),2011,26(7):68-74.
[7]Freund Y,Schapire R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.
[8]MATLAB中文论坛.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.
[9]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[10]Suykens J A K,de Brabanter J,Lukas L,et al.Weighted least squares support vector machines:Robustness and sparse approximation[J].Neurocomputing,2002,48(1/2/ 3/4):85-105.
An Ensemble Learning Predictive Model for Short-term Wind Speed Forecasting
HU Qian,CHEN Hongkun,SUN Zhida
(School of Electrical Engineering,Wuhan University,Wuhan 430072,China)
Accurate wind speed prediction is important for safe and stable operation of power systems with large-scale interconnection of wind power.For a single time series prediction method,such as Kalman filtering,neural network models,the prediction accuracy is not high,this paper proposes an ensemble learning predictive model based on Adaboost algorithm and support vector machine(SVM)method for short-term wind forecasting.The algorithm utilizes multiple SVM models to obtain the final output by a weighted cumulative,to make up for the shortcomings of a single forecast model.While with the introduction of membership function,historical data have been given different weights to highlight the difference in the prediction model.Treating wind farms in Mongolia region as a example,the results indicate that the proposed method significantly enhances the accuracy and to make a more accurate short-term wind forecasting online possible.
short-term wind speed forecasting;ensemble learning;dynamic weighting;membership function;support vector machine
TM835
A
1003-8930(2016)01-0001-04
10.3969/j.issn.1003-8930.2016.01.001
2014-07-22;
2014-08-27
国家重点基础研究发展计划(973计划)资助项目(2012CB215200)
胡 倩(1990—),女,硕士研究生,研究方向为新能源接入、电力系统运行控制。Email:huqian.1990@hotmail.com
陈红坤(1966—),男,博士,教授,研究方向为电力系统运行与控制、新能源接入。Email:chkinsz@163.com
孙志达(1991—),男,硕士研究生,研究方向为电力系统规划、新能源接入。Email:304153295@qq.com