一种基于SVM的改进样本加权风速预测

2017-11-20 22:52张瑞成田新
电脑知识与技术 2017年25期
关键词:支持向量机相似性

张瑞成+田新

摘要:针对目前超短期风速预测精度不高的问题,提出了一种改进样本加权的SVM超短期风速预测方法。对样本加权中基于距离函数的时间序列相似性度量方法进行改进,在欧式距离的基础上,加入区间变化趋势相似度函数,将欧氏距离和趋势相似度函数按权值组合,构造了新的相似性度量函数。对训练样本进行相空间重构,基于样本相似性因素对训练样本进行加權,建立加权SVM超短期风速预测模型。分别建立随机森林、梯度提升树、SVM以及改进加权SVM超短期风速预测模型,研究表明,对SVM进行改进样本加权后,可以将预测误差从7.61%降为7.46%,有效降低了超短期风速预测误差,验证了该方法的有效性。

关键词:样本加权;相似性;相空间重构;支持向量机;风速预测

中图分类号:TM614 文献标识码:A 文章编号:1009-3044(2017)25-0211-04

Abstract: Aiming at the problem that the prediction accuracy of ultra short term wind speed is not high at present, an improved sample weight SVM method for ultra short term wind speed prediction is proposed. Based on the distance of Euclidean distance, the similarity function of interval trend is added, and the Euclidean distance and trend similarity function are combined by weight to construct a new similarity measure function. The training sample is reconstructed by phase space, and the training sample is weighted Based on the sample similarity factor to establish the model of weighted SVM ultra short wind speed prediction. The results show that the prediction error can be reduced from 7.61% to 7.46% after the improved weighting of SVM, which can effectively reduce the ultra short term wind speed prediction. The results show that the proposed method can reduce the prediction error of SVM Error, which verifies the effectiveness of the method.

Key words: sample weighting; similarity; phase space reconstruction; SVM; windspeed prediction

1 背景

随着并网风力发电技术的飞速发展,越来越多的大规模风电逐渐应用到电网中。由于风速的随机性和波动性,风电出力波动性很大,并且具有很强的随机性和间歇性,这无疑给电网的安全稳定运行增加了风险[1-3]。因此,对于风速预测的研究变得越来越重要 [4]。

一般来说,超短期风速预测指的是超前0~4h的风速预测,通常要求时间分辨率不小于15min,主要应用于对风电机组的实时控制,以便于电力系统的实时调度[5]。目前,针对超短期风速预测的研究还比较少,而且预测的效果也不太理想。文献[6]将神经网络和小波分析理论应用到超短期风速预测中,提高了模型的预测精度,但神经网络模型往往容易陷入局部极值,使得训练的网络模型非最优[7]。文献[8]将空间相关性技术应用到风速预测中,利用被预测地点及其周边地区风速风向等观测值作为样本数据集建立风速预测模型,有效提高了未来数小时的风速预测效果,但是采用空间相关性来预测需要大量的当地以及周边地区的各项数据,数据收集复杂,对输入样本要求高。文献[9]通过分别建立BP、RBF神经网络和SMO算法模型的泛化误差性能矩阵,动态的选择泛化误差较小的预测模型进行组合建立超短期风速预测模型,最后经等权平均形成最终预测输出,该方法经过训练可以提高预测精度,但组合预测确定各方法的结合方式比较困难。文献[10]将最小二乘SVM和自回归求和滑动平均方法组合进行基于小波变换的短期风速预测,有效提高了风速的预测精度,但组合方法的不同对模型精度影响很大。

支持向量机(Support Vector Machine, SVM)以其较强的泛化能力和小样本问题处理能力被广泛应用于风速预测[11]。因此,选取SVM算法作为预测模型。而实际应用中,由于样本的差异性,不同的训练样本对模型的贡献程度通常是不同的[12],因此,在传统SVM模型的基础上对风速样本依照其重要性进行加权。基于此,对传统的样本相似性加权进行改进,提出了一种结合距离函数和区间趋势相似度函数的样本相似性度量方式。首先,对原始风速序列进行相空间重构,然后,基于相似性因素对训练样本进行加权,对相似性的度量采用欧氏距离和区间变化趋势结合的方式,将加权后的训练样本作为输入建立SVM超短期风速预测模型,对预测值与真实值进行比较分析,证明了该方法能有效降低风速的预测误差。

2 基于相似性因素的改进样本加权

正由于风速具有随机性和不稳定性,使得不同样本对模型的影响不同,即不同的历史风速数据对未来同一时刻风速值的贡献不同。为了降低样本差异性带来的干扰,有学者提出了加权最小二乘SVM算法[13-14]。考虑到训练样本具有差异性,与预测样本相似度越高的训练样本,其对模型的影响应该越显著。因此,对训练样本进行加权时,主要考虑样本间的相似度因素。endprint

对于相似性度量,最常见的是欧氏距离,但是欧氏距离主要受幅值大小的影响,而无法反映时间序列趋势的变化,针对这一问题,提出了将欧氏距离和区间变化趋势按权值组合的相似性度量方法。为了度量时间序列变化趋势的相似性,将长度为n的时间序列按照时间分为n-1个连续的序列区间,分别记为q1,q2,...qn-1,其中,qi=[xi,xi+1],用xi+1-xi来表示区间变化趋势。当xi+1-xi>0时,表示区间qi的变化趋势为上升;当xi+1-xi<0时,表示区间qi的变化趋势为下降。当对应的训练样本区间与预测样本区间的变化趋势全部都一致时,可知训练样本与预测样本的整体变化趋势是一致的,这在一定程度上度量了训练样本与预测样本之间的趋势相似性。

式中,xi为由训练样本构成的模型输入向量;x0为由预测样本构成的模型输入向量;a为常数,00表示第i个训练样本的第j个序列区间变化趋势与预测样本的第j个序列区间变化趋势相同,而ki,j<0则表示第i个训练样本的第j个序列区间变化趋势与预测样本的第j个序列区间变化趋势相反,可知,训练样本的序列区间变化趋势与预测样本的越一致时,样本间的相似度越高。

3 超短期风速预测建模

3.1 风速序列的相空间重构题

对于风速时间序列{x(t),t=1,2,...n},相空间重构后得到d维的相空间矢量:y(t)=(x(t),...,x(t+(d-1)t),1?t?n-(d-1)t,其中t为延迟时间,y(t)为重构后的d维相空间风速序列。而对于相空间重构技术的两个重要参数嵌入维数d和延迟时间t,Takens嵌入定理只是在理论上证明了其存在性,并没有给出具体的求解方式。

求解相空间重构参数的方法有很多种,常见的有自相关系数法、交互信息法、几何不变法和虚假最邻近点法等,本文选用虚假最邻近点法对相空间重构技术中的参数嵌入维数d和延迟时间t进行求解。

3.2 加权支持向量机

支持向量机(Support Vector Machine,SVM)算法可以将一个实际问题转化为一个带不等式约束的凸二次规划问题。其基本思想是通过函数映射把样本数据从原始样本空间映射到高维特征空间,在高维特征空间中对问题进行求解。

4 实例分析

4.1 模型的建立

采用国外某风场2004年2.1-3.31共60天的风速观测值作为训练集,并对4月1日全天的144个时刻的风速值进行预测,时间分辨率为10min。首先对数据进行标准化处理,之后对风速时间序列采用虚假最近邻点法计算得到相空间重构参数m=6,t=4,对原始风速序列进行相空间重构,将得到的新的风速特征序列作为模型的训练样本。

对重构后的训练样本建立加权超短期风速预测模型,经过多次试验,取a=0.9,对于SVM惩罚参数和核函数参数的选取,通过网格搜索法,得到最优参数C=500,g=9e-05。

由表2可知,对SVM预测模型中的训练样本进行加权处理后,各项误差均有所下降,其中均方误差由1.0588%降为1.0275%,平均绝对误差由7.6118%降为7.4582%,可见,改进后的样本加权SVM可以有效降低模型预测误差。

5 结束语

首先建立RF、GBRT、SVM三种超短期风速预测模型,然后对训练样本进行基于相似度因素的改进加权处理,建立改进样本加权的SVM超短期风速预测模型,对以上模型进行对比分析,研究发现:

1) 在超短期风速预测中,RF、GBRT、SVM这三种模型中,SVM的预测误差是最低的,即预测效果是最好的,验证了SVM在超短期风速预测中的优越性。

2) 提出的新的样本加权方法,即度量样本相似度时结合欧氏距离和样本变化趋势的方法,可以将SVM超短期风速预测误差从7.61%降为7.46%,有效降低了预测误差。

参考文献:

[1] 张丽英, 叶廷路, 辛耀中, 等. 大规模风电接入电网的相关问题及措施[J]. 中国电机工程学报, 2010, 30(25):1-9.

[2] 张宏宇, 印永华, 申洪, 等. 大规模风电接入后的系统调峰充裕性评估[J]. 中国电机工程学报, 2011, 31(22):26-31.

[3] 陈妮亚, 钱政, 孟晓风, 等. 基于空间相关法的风电场风速多步预测模型[J]. 电工技术学报, 2013, 28(5):15-21.

[4] Yuan-Kang Wu, Jing-Shan Hong. A literature review of wind forecasting technology in the world[C]. Power Tech, 2007.

[5] Maria Grazia De Giorgi, Antonio Ficarella, Marco Tarantino. Assessment of the benefits of numerical weather predictions in wind power forecasting Based on statistical methods[J]. Energy, 2011, 36(7):3968-3978.

[6] 高陽, 钟宏宇, 陈鑫宇, 等. 基于神经网络和小波分析的超短期风速预测[J]. 可再生能源, 2016, 34(5):705-711.

[7] 向德生, 熊岳山, 朱更明. 基于关联规则的PSO-Elman短期风速预测[J]. 计算机工程与应用, 2017: 1-10.

[8] 杨正瓴, 刘阳, 张泽, 等. 采用最近历史观测值和 PLSR 进行空间相关性超短期风速预测[J]. 电网技术, 2017: 1-7.

[9] 刘彦华, 董泽. 风速及风电功率超短期动态选择线性组合预测[J]. 太阳能学报, 2016, 37(4):1009-1016.

[10] 田中大, 李树江, 王艳红, 等. 基于小波变换的风电场短期风速组合预测[J]. 电工技术学报, 2015, 30(9):112-120.

[11] 袁东锋, 杜恒. 基于小波分析和相空间重构相融合的风速预测[J]. 计算机仿真, 2013, 30(3):331-334, 388.

[12] 王晓兰, 康蕾. 在线模糊最小二乘支持向量机的时间序列预测[J]. 计算机工程与应用, 2010(9):215-240.

[13] Suykens J A K, De Brabanter J, Lukas L,et al. Weighted least squares support vector machines: robustness and sparse approximation[J]. Neurocomputing, 2002,48(1-4):85-105.

[14] 潘学萍, 史宇伟, 张弛. 双加权最小二乘支持向量机的短期风速预测[J]. 电力系统及其自动化学报, 2014, 26(1):13-17.

猜你喜欢
支持向量机相似性
一类上三角算子矩阵的相似性与酉相似性
浅析当代中西方绘画的相似性
基于改进支持向量机的船舶纵摇预报模型
基于支持向量机的金融数据分析研究
低渗透黏土中氯离子弥散作用离心模拟相似性
一种新的基于对称性的字符串相似性处理算法
一种相似性学习算法及其在人脸识别中的应用
V4国家经济的相似性与差异性