双加权最小二乘支持向量机的短期风速预测

2014-08-02 03:54潘学萍史宇伟张弛
电力系统及其自动化学报 2014年1期
关键词:训练样本风电场权值

潘学萍,史宇伟,张弛

(河海大学能源与电气学院,南京210098)

双加权最小二乘支持向量机的短期风速预测

潘学萍,史宇伟,张弛

(河海大学能源与电气学院,南京210098)

提出了双加权最小二乘支持向量机的短期风速预测方法。考虑到离预测点越远的历史风速数据对预测值的影响越弱,对训练样本中输入向量数据进行第1次加权,以体现不同元素对预测影响的差异。同时为区分训练样本的差异性,降低异常样本的干扰,对训练样本进行第2次加权。对双加权后的训练样本,采用加权最小二乘支持向量机模型进行预测,降低了对异常点的敏感度,实现了对不同样本的区别对待。根据某实测风速数据进行了风速预测,结果表明,所提方法能提高风速预测精度。

风速预测;双加权方法;加权最小二乘支持向量机;短期预测

风电作为当前发展最快的可再生能源发电形式,得到了世界各国的广泛重视[1]。对风电场风速或风电功率的准确预测,可以减少电力系统的运行成本和旋转备用,提高风电穿透功率极限,增强风电场在电力市场中的竞争能力[2]。由于风速的随机性和间歇性,准确预测风速难度较大[3]。

目前已有的风速预测方法可分为基于物理模型的方法和基于历史数据的预测方法两大类。物理模型法采用天气预报数据进行预测,由于气象预报数据更新频率低,适用于中期风速预测[4];基于历史数据的预测方法主要有空间相关法[5]、时间序列法[6]、人工神经网络法[7]、支持向量机(SVM)法[8]等。空间相关法需要考虑风电场以及与之相近的几个地点的风速时间序列,对历史数据要求很高;时间序列法基于历史数据建模,通过模型识别、参数估计和模型检验等过程得到预测模型,适用于短期风速预测,但这种方法在气候变化较大时,预测精度不理想;人工神经网络具有自学习、自组织和自适应性,可以逼近任意复杂的非线性映射,但存在着隐层神经元个数难以确定、算法收敛速度慢以及容易陷入局部最小等问题。

SVM方法通过非线性核函数,将输入样本空间映射到高维线性特征空间,能够处理高度非线性映射问题,在预测中得到了广泛应用[9,10]。最小二乘支持向量机(LS-SVM)方法作为传统SVM方法的扩展[11],用等式约束代替传统SVM方法中的不等式约束,降低了计算的复杂度,具有更快的求解速度和稳定性[12]。

但LS-SVM建模时,所有训练样本都被平等对待,而实际工程中的许多不确定性因素使得不同样本对预测模型的贡献程度不一样。为区分样本的差异,有学者提出了加权LS-SVM[13]算法,根据样本的不同,赋予各组样本不同的权值。风速具有随机性、波动性等特点,不同历史风速数据存在差异性,离预测点越远的历史风速数据对预测值影响越小,因此,对训练样本进行加权以体现时间因素的影响。本文提出了基于双加权最小二乘支持向量机的短期风速预测模型,即对训练样本中数据进行第1次加权,再对训练样本进行第2次加权,运用加权最小二乘支持向量机算法进行预测,以提高风速的预测精度。

1 加权最小二乘支持向量机算法

给定风速训练样本集{xi,yi},i=1,2,…,N,其中:N为样本数;xi为输入向量,包含n个元素;yi为训练样本集中的风速输出值。则SVM的回归模型为

式中:φ(xi)为非线性映射函数;ω为权重向量;b为偏差量。LS-SVM方法的目标函数为

式中:ξi为估计误差;C为惩罚系数。

约束条件为

文献[14]指出,如对每个样本赋予相同的惩罚系数C,即把所有样本都同等对待,必然会受到异常样本的影响,从而产生误差。由于风速的随机性、波动性特点,相同权值的风速样本参与训练必然会影响预测的精度。加权LS-SVM模型引入样本权值来区分不同样本在训练过程中的重要程度。该方法为每个样本引入权值wi,生成加权后的样本集{xi,yi,wi}。则式(2)的目标函数变为

结合式(3)建立的拉格朗日方程为

式中,ai为拉格朗日乘子,最优解应满足

式中:y=[y1,y2,…,yN]T;E=[1,1,…,1]T;ω=[ω1,ω2,…,ωN]T;a=[a1,a2,…,aN]T;Ωij=K(xi,xj)=φ(xi)Tφ(xj)。K(xi,xj)为核函数,采用RBF核函数[12],即

将式(6)可转化为求解线性方程[14],即

式中,σ为核参数。

根据式(7)求得a和b后,根据LS-SVM回归模型可得风速预测表达式为

式中,x为测试样本中的输入向量。

2 基于双加权LS-SVM的短期风速预测

2.1 输入向量的加权

文献[15,16]指出,离风速输出值越近的风速,对输出值的影响越大。为了体现样本中不同时刻的风速对预测值的影响,文中采用灰色关联度[17]法对输入向量进行了加权处理。具体步骤如下。

步骤1输入向量xi中的第j个元素xji和yi的关联系数εji定义为

式中,ρ为分辨系数,通常取值0.5。则灰色关联度rj表示为

步骤2根据该灰色关联度得到输入向量中各元素的权重μj,即

步骤3将输入向量各元素乘以对应的权值,生成新的风速训练样本集{xi′,yi}。

2.2 训练样本的加权

在SVM和LS-SVM的训练过程中,平等对待每一个样本必然会导致过学习现象[14]。在风速预测中,由于风速的随机性、不确定性以及随季节变化等特点,不同样本对预测模型的贡献程度不同。因此,需要对不同样本加以区别对待。

在风速预测中,考虑到训练样本中近期样本对预测的参考作用较大,远期样本对预测的参考作用较小。又考虑到所建模型进行预测的目的,与预测样本相似度越高的训练样本,其重要程度应越大。综合考虑样本的时间因素和相似度因素,各个训练样本的权值wi为

式中:wT,i为只考虑时间因素的训练样本权值;wD,i为只考虑相似度因素的训练样本权值;r为常数,0≤r≤1,用来调节时间因素和相似度因素的权重。

由于离预测样本时间越近的训练样本越重要,权值wT,i采用线性递增表示为

式中,β为离预测样本最远的初始权值,0≤β≤1。

对于训练样本与预测样本的相似度权值wDi,本文采用欧氏距离来度量,训练样本输入向量xi′和预测输入向量x^i′的欧氏距离为

与预测样本欧氏距离最大的训练样本权值为β′,与预测样本欧氏距离最小的训练样本权值为1。其他训练样本的欧氏距离可通过类似式(15)的线性表达式获得。训练样本权值根据欧氏距离的大小确定。

2.3 加权LS-SVM模型参数选择

对加权LS-SVM模型中惩罚系数C和核参数σ的选取,本文采用文献[18]中的改进粒子群方法进行寻优。具体方法为:在标准粒子群算法基础上,为提高算法局部寻优能力,加快收敛速度,选取适应度较大的50%种群以概率pc与粒子经过的最好位置进行交叉操作。同时,为避免陷入局部最优解,引入变异操作,使粒子以概率pm进行变异,提高算法的全局寻优能力。最后对预测结果进行反归一化处理,得到最终风速预测结果。

2.4 双加权LS-SVM方法的短期风速的预测流程

双加权LS-SVM方法的风速预测流程如图1所示。

图1 双加权LS-SVM模型预测流程Fig.1Flow chart of double weighted LS-SVM forecasting

风速时间序列的归一化,将原始风速序列经过线性变化至[0,1]区间,计算公式为

式中,z*为归一化后的数值。预测结果必须进行反归一化,即

式中:z^*为归一化后的预测值;z^为最终的预测值。

为评估风速预测精度,本文采用平均绝对误差EMAE和平均绝对百分比误差EMAPE来表示,即

式中:zi为实际风速;z^i为预测风速;m为预测值的个数。

3 算例分析

选取某风电场1 a的实测风速数据,采样时间间隔为1 h,分别对当年4个季节中的某一天(本文选为03-16、06-16、09-16、12-16)的24个风速值进行预测。对各个预测日,选取该预测日之前一定数量的风速值作为训练数据,建立风速预测模型,进行提前1 h预测。

一年中3月、6月、9月、12月风速时间序列如图2所示。

图2 风速序列Fig.2Wind speed series

3.1 训练样本大小对预测精度的影响

在风速预测中,训练样本的大小对于模型的预测精度有很大的影响。如果用于建模的风速训练数据太少,则不足以反映风速的全部信息。由于风速受季节影响大,太多的训练数据会包含更多的异常数据,并且大大增加了运算时间[15]。表1列出了历史样本数据分别为120、360、480、800、1200、182 4 h时,LS-SVM模型的预测精度。

表1 样本大小对预测精度的影响Tab.1Effects of training data on forecasting errors

由表1可以看出,训练大小会影响风速的预测精度。风速预测误差随样本增大总体呈下降趋势。由此得出,较大的样本能增加风速预测的精度,但由于训练样本中存在着一些分布规律差异较大的风速数据,对预测模型的作用不大甚至产生不利的影响。

3.2 基于双加权LS-SVM的风速预测

由表1可知,800个训练样本数据已经能较准确地建立各月的风速预测模型,因此选取对应预测日之前的800个风速数据作为训练数据,预测03-16、06-16、09-16、12-16的风速值。

以预测03-16的风速值为例,根据经验法,本文取输入向量维数n=4,求出输入向量中4个元素的权值向量μ=(0.2344,0.2433,0.2526,0.2697)。根据式(13)得出各个训练样本对应的权值,其中β、β′和r的选取依靠多次试验得到,本文取β= 0.6、β′=0.6、r=0.45。惩罚参数C和核参数σ的选取,采用改进的粒子群算法寻优,交叉概率pc取0.8,变异概率pm取0.15,得到最优参数C= 180.21,σ=2.23。把得到的03-16的风速预测值与相同训练数据下SVM和LS-SVM的预测结果进行比较,如图3所示。

同上,可得出06-16、09-16、12-16的风速预测值。并采用式(18)和式(19)对各预测方法在所有预测日上的误差结果进行分析,如表2所示。

从表2可以看出,LS-SVM方法的预测精度略高于SVM方法;输入向量加权的LS-SVM预测精度高于LS-SVM方法;双加权的LS-SVM预测方法的预测精度最高。本算例中,本文提出的方法平均绝对百分比误差能达到8.01%~18.33%,取得比较满意的预测效果。

图303 -16的预测结果Fig.3Forecasting results on March 16

表2 预测误差Tab.2Error comparison by different methods

4 结语

由于风速具有较强的随机性、波动性等特点,训练样本大小对预测精度有着直接的影响。文中算例表明在大部分情况下,增加训练样本数目可提高模型的预测精度。

训练样本中离输出值越近的风速对预测结果影响越大。为了体现样本中不同时刻的风速对预测值的影响,文中对输入样本进行了第1次加权处理。算例表明,采用样本输入向量加权后的LSSVM模型,其预测精度要高于预测LS-SVM方法。如采用同时对训练样本进行加权的双加权LSSVM模型,其预测精度高于单一加权的LS-SVM方法。由此说明采用本文提出的双加权LS-SVM模型,能提高短期风速的预测精度。

[1]尹明,王成山,葛旭波(Yin Ming,Wang Chengshan,Ge Xubo).风电并网经济技术评价研究综述(Review of economic technical assessment of wind power integration)[J].电力系统及其自动化学报(Proceedings of the CSUEPSA),2010,22(5):102-108.

[2]戴浪,黄守道,黄科元,等(Dai Lang,Huang Shoudao,Huang Keyuan,et al).风电场风速的神经网络组合预测模型(Combination forecasting model based on neural net

works for wind speed in wind farm)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2011,23(4):27-31.

[3]杨秀媛,肖洋,陈树勇(Yang Xiuyuan,Xiao Yang,Chen Shuyong).风电场风速和发电功率预测研究(Wind speed and generated power forecasting in wind farm)[J].中国电机工程学报(Proceedings of the CSEE),2005,25(11):1-5.

[4]Soman S S,Zareipour H,Malik O,et al.A review of wind power and wind speed forecasting methods with different time horizons[C]//North American Power Symposium,Arlington,USA:2010.

[5]李文良,卫志农,孙国强,等(Li Wenliang,Wei Zhinong,Sun Guoqiang,et al).基于改进空间相关法和径向基神经网络的风电场短期风速分时预测模型(Multi-interval wind speed forecast model based on improved spatial correlation and RBF neural network)[J].电力自动化设备(Electric Power Automation Equipment),2009,29(6):89-92.

[6]Gao Shan,He Yu,Chen Hao.Wind speed forecast for wind farms based on ARMA-ARCH model[C]//International Conference on Sustainable Power Generation and Supply,Nanjing,China:2009.

[7]Kariniotakis G N,Stavrakakis G S,Nogaret E F.Wind power forecasting using advanced neural network models [J].IEEE Trans on Energy Conversion,1996,11(4):762-767.

[8]杨洪,古世甫,崔明东,等(Yang Hong,Gu Shifu,Cui Mingdong,et al).基于遗传优化的最小二乘支持向量机风电场风速短期预测(Forecast of short-term wind speed in wind farms based on GA optimized LS-SVM)[J].电力系统保护与控制(Power System Protection and Control),2011,39(11):44-48,61.

[9]张智晟,马龙,孙雅明(Zhang Zhisheng,Ma Long,SunYaming).混沌理论和支持向量机结合的负荷预测模型(Load forecasting model using chaos theory and support vector machine)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2008,20(6):31-35.

[10]Mohandes M A,Halawani T O,Rehman S,et al.Support vector machines for wind speed prediction[J].Renewable Energy,2004,29(6):939-947.

[11]肖先勇,葛嘉,何德胜(Xiao Xianyong,Ge Jia,He Desheng).基于支持向量机的中长期电力负荷组合预测(Combination method of mid-long term load forecasting based on support vector machine)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2008,20(1):84-88.

[12]曾杰,张华(Zeng Jie,Zhang Hua).基于最小二乘支持向量机的风速预测模型(A wind speed forecasting model based on least squares support vector machine)[J].电网技术(Power System Technology),2009,33(18):144-147.

[13]Suykens J A K,De Brabanter J,Lukas L,et al.Weighted least squares support vector machines:robustness and sparse approximation[J].Neurocomputing,2002,48(1-4):85-105.

[14]吴青,刘三阳,杜喆(Wu Qing,Liu Sanyang,Du Zhe).回归型模糊最小二乘支持向量机(Fuzzy least square support vector machines for regression)[J].西安电子科技大学学报(Journal of Xidian University),2007,34(5):773-778.

[15]韩爽,杨勇平,刘永前(Han Shuang,Yang Yongping,Liu Yongqian).三种方法在风速预测中的应用研究(Application study of three methods in wind speed prediction)[J].华北电力大学学报(Journal of North China Electric Power University),2008,35(5):57-61.

[16]Sideratos G,Hatziargyriou N D.An advanced statistical method for wind power forecasting[J].IEEE Trans on Power Systems,2007,22(1):258-265.

[17]谭学端,邓聚龙(Tan Xuerui,Deng Julong).灰色关联分析:多因素统计分析新方法(Grey connected analysis:a new method of multifactor statistical analysis)[J].统计研究(Statistical Research),1995,12(3):46-48.

[18]伍铁斌,阳春华,孙备,等(Wu Tiebin,Yang Chunhua,Sun Bei,et al).灰色模糊LSSVM预测模型在锌净化除钴中的应用(Grey fuzzy-LSSVM forecasting model and its application in cobalt removal from zinc electrolyte)[J].中国有色金属学报(The Chinese Journal of Nonferrous Metals),2012,22(8):2382-2386.

Short-term Wind Speed Forecast Based on Double Weighted Least Squares Support Vector Machine Algorithm

PAN Xue-ping,SHI Yu-wei,ZHANG Chi
(College of Energy and Electrical Engineering,Hohai University,Nanjing 210098,China)

Double weighted least squares support vector machine algorithm for short-term wind speed forecast is proposed in this paper.The training data are weighted firstly to reflect the effects of different data on the predicting value. The training samples are weighted again to distinguish the difference of training samples,which can reduce the influence of abnormal sample.With the double weighted training sample,the weighted least squares support vector machine(LS-SVM)algorithm is used to predict the hourly wind speed.The proposed method improves the sparse characteristic of LS-SVM and reduces the sensitivity of abnormal points.The prediction results show that the proposed method can improve the prediction accuracy.

wind speed forecast;double weighted method;weighted least squares support vector machine;shortterm forecast

TK81

A

1003-8930(2014)01-0013-05

潘学萍(1972—),女,博士,副教授,研究方向为电力系统分析与控制。Email:xueping_pan@163.com

2013-08-26;

2013-09-30

国家自然科学基金项目(51207045)

史宇伟(1988—),男,硕士研究生,研究方向为风电场短期风速预测。Email:shiyuwei007@hotmail.com

张弛(1988—),男,硕士研究生,研究方向为风电场分群。Email:sw249161768@163.com

猜你喜欢
训练样本风电场权值
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
人工智能
基于PSS/E的风电场建模与动态分析
巴基斯坦风电场环网柜设计
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法