基于相关向量机的短期风速预测模型

2013-10-19 03:12李慧杰刘亚南卫志农李晓露KwokCheung孙永辉孙国强
电力自动化设备 2013年10期
关键词:相空间互信息延迟时间

李慧杰,刘亚南,卫志农,李晓露,Kwok W Cheung,孙永辉,孙国强

(1.阿尔斯通电网技术中心有限公司,上海 201114;2.河海大学 可再生能源发电技术教育部工程研究中心,江苏 南京 210098;3.ALSTOM Grid Inc.,Redmond,USA Washington 98052)

0 引言

可再生能源的开发利用得到世界各国的高度重视,风力发电因具有环保可再生、全球可行、成本低且规模效益显著等优点,已经受到广泛的重视,并且发展迅速[1]。近年来,风力发电机组容量的迅速增长,对电力系统的影响也越来越明显。尽管风力发电已经成为一种较为成熟的技术,但风电场风速的预测还未达到一定的满意程度。准确预测风电场的风速有利于调度部门调整计划,从而有效减轻风电对整个电网的不利影响,减少电力系统运行成本,也有利于调度人员及时采取正确的调度措施[2]。

由于风速受诸多因素的影响,具有很强的随机性和不确定性,所以预测难度较大,尤其是进行短期风速预测[3]。文献[4] 将经典的ARMA模型用于短期风速预测,取得了较好的结果,但这种方法低阶模型不能完全反映样本的性能,高阶模型的估计较为复杂,在计算中消耗时间,在气候变化很大的情况下预测结果不甚理想。文献[5-6] 分别采用BP神经网络和径向基神经网络进行风速预测,但其算法容易陷入局部最小问题,得不到全局最优解,收敛速度也较慢。文献[7] 将支持向量机(SVM)应用到风速预测中,同时采用微分进化算法进行参数优化,相比神经网络,该方法具有更高的精度和更强的鲁棒性。文献[8] 采用空间相关性法进行短期风速预测,该方法需要考虑所测地点以及与之相近几个地点的风速时间序列,基于几个地点风速之间的空间相关性,进行风速预测。由于该方法需要大量的原始数据,在实际操作中存在一定的难度。

混沌理论最早用于气象学中,通过对风速时间序列的Lyapunov指数计算,可以证明其具有混沌特性,而且混沌时间序列在短期内可以预测。因此,利用混沌相空间重构理论可以还原风速时间序列的非线性动力特性,使用一定的预测模型可以进行短期风速预测。文献[9-10] 已经将相空间重构用于风力发电功率预测中。本文通过相空间重构的方法建立相关向量机(RVM)短期风速预测模型,同时采用高斯核函数和多项式函数的组合作为RVM的核函数,以此来提高预测精度。算例结果表明,RVM模型较之现有的风速预测模型具有更高的精度。

1 相空间重构理论

根据Takens的嵌入定理[11],对于一个时间序列,延迟坐标的维数m≥2d+1(d是动力系统的维数),在该嵌入维空间里可以把有规律的轨道(吸引子)恢复出来,即重构的空间中的轨道与原吸引子的拓扑结构完全相同。对于一组时间序列{xi},则相空间重构为:

其中,m为嵌入维数,τ为延迟时间,Q=n-(m-1)τ为相空间中的相点个数,i=1,2,…,Q。

在重构过程中,嵌入维数和延迟时间选取至关重要,恰当选择2个参数将直接影响相空间重构的质量,从而影响预测精度。

1.1 互信息求取延迟时间

利用计算互信息函数的第一极小值来确定最佳延迟时间 τ 的方法称为互信息法。

对于2组信号{x(i),y(j)}(i,j=1,2,…,Q)给定x(i)的一个测量值,预测 y(j)的平均信息量为互信息函数:

其中,Px[x(i)] 为 x(i)的概率密度,Py[y(j)] 为 y(j)的概率密度,Pxy[x(i),y(j)] 为联合概率;H(x)为信号{x(i)}的熵,表示对指定系统的N个x(i)测量得到的平均信息量,H(y)的定义与 H(x)类似,H(x,y)为联合熵。本文采用等间距划分网格方法计算互信息。

针对本文选取的时间序列,利用互信息法得到该序列互信息函数与延迟时间的关系如图1所示,从图中看出,延迟时间取10。

图1 互信息函数与延迟时间关系Fig.1 Relationship between mutual information function and time delay

1.2 Cao算法求嵌入维数

目前相空间重构嵌入维数的求取广泛采用Cao算法。对于混沌时间序列 x1,x2,…,xn,若嵌入维数为m,延迟时间为τ,则重构的相空间如式(1)所示。定义:

其中,E(m)为所有 a(i,m)的均值,Ym+1(n(i,m))为Ym+1(i)的最邻近的点,Ym(n(i,m))为 Ym(i)的最邻近的点。

当嵌入维数m大于某个值时,E1(m)不再变化,这时m就是饱和嵌入维数。针对本文选取的时间序列,利用 Cao 算法得到 E1(m)、E2(m)与嵌入维数 m的关系如图2所示。从图中可以看出,嵌入维数m增加到7时,E1(m)趋于稳定,所以嵌入维数取8。

图2 E1(m)、E2(m)与嵌入维数 m 的关系Fig.2 Relationship between E1(m)/E2(m)and embedding dimension m

1.3 时间序列的最大Lyapunov指数

对于一个混沌系统,至少存在一个正的Lyapunov指数,它反映了轨道从初始条件附件开始发散的速度。因此,可以通过估计最大Lyapunov指数,来判断系统的混沌属性。本文采用Wolf法[12]估计最大Lyapunov指数。

步骤1 设初始时刻为t0,当前时刻为t1,终点时刻为tM,M=P-(m+1)τ,P为时间序列终点。

步骤2 设初始点为 Y(t0),其与最近邻点 Y0(t0)的距离为L0,经过一定时间的演化到达2个新的点Y(t1)和 Y0(t1),此时间距超过一个预先给定的阈值ξ(ξ>0),即。

步骤3 保留 Y(t1),同时在 Y(t1)邻近另找一个点 Y1(t1),使得并且与之夹角尽可能小。

步骤4 继续步骤3,直到到达时间序列的终点M,追踪演化过程的迭代次数为tM-t0,则最大Lyapunov指数λ1为:

根据前述分析,取m=8、τ=10,这时最大Lyapunov指数大于0,其值为λ1=0.2851。由此看出,风速时间序列具有混沌特性。

2 RVM原理

RVM[13-14]是在SVM的基础上,基于贝叶斯学习理论提出的算法模型。与SVM相比,RVM有如下优点:相关向量的数目远远小于支持向量,具有高稀疏性;仅有核参数的设置,可以节约训练时间;核函数无需满足Mercer条件,增加了核函数选择的灵活性。

对于给定的训练样本输入集{xn}Nn=1和对应的输出集{ln}Nn=1,RVM 回归模型[15-17]可定义为:

其中,ε 为服从 N(0,σ2)分布的各独立样本误差,wi为权系数,K(x,xi)为核函数,N 为样本数量。

对于相互独立的输出集,整个样本的似然函数为:

其中,l=(l1,l2,…,lN),w=[w0,w1,…,wN]T,Φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xN)=[1,K(x1,xN),K(x2,xN),…,K(xn,xN))]T,y(xi;w)为预测值。

根据概率预测公式,所求的条件概率为:

其中,l*为目标值。

为了避免直接使用最大似然方法求解w和σ2而带来的过适应现象,对w加上先决条件。根据贝叶斯理论,w为分布为零的标准正态分布,同时引入超参数 α=[α0,α1,…,αN]T,可得:

因此,概率预测式改为:

RVM的一个重要特征就是对每个权值限定先决条件。α为权值w对应的超参数,符合伽马分布。经过足够的更新次数后,大部分αi会趋近无限大,其对应的权值趋于0,而其他的αi会稳定地趋近有限值。而与之对应的xi称之为相关向量,实现RVM稀疏特性。

在定义了先验概率分布及似然分布以后,根据贝叶斯原理,就可以求得所有未知参数的后验概率分布为:

其中,ψ=(σ-2ΦTΦ+A)-1,μ=σ-2ψΦTl,A=diag(α0,α1,…,αN)。

最后使用最大似然方法可以得到估计的超参数α和方差σ2。

若给定新的输入值x*,则相应的输出概率分布服从高斯分布,其相应的预测值为 y*=μTφ(x*)。

3 风速预测的RVM预测模型

3.1 样本数据的预处理

为了加快样本的训练速度和收敛速度,需要对原始样本进行预处理,从而提高模型的预测精度。本文主要采用归一化方法对样本数据进行处理:

3.2 RVM模型参数的选取

RVM是基于核函数方法的模式识别技术,本质上讲,核方法实现了数据空间、特征空间和类别空间之间的非线性变换。混合核函数的基本思想[18]是将多个不同的核函数结合起来,使得组合后的核函数具有更好的特性。

高斯核函数在众多核函数中表现出了优异的特性,本文选择多项式核函数进行线性组合得到的函数作为RVM模型的核函数。为了方便起见,选择如下二项式函数:

其中,G(xi,xj)为高斯核函数;P(xi,xj)为二项式核;λ为核函数权重,0≤λ≤1,λ=0或λ=1时分别为单一核函数。

在基于核函数的模式识别技术中,核参数的选择对结果起着至关重要的作用。RVM预测模型中超参数α可以通过训练自适应得到最优值,核函数宽度σ和权重λ的选取采用网格搜索法来获得。

3.3 预测模型的评价标准

预测模型的预测效果采用平均绝对百分比误差评价,其表达式为:

3.4 风速预测模型流程图

风速预测流程如图3所示。

图3 风速预测流程图Fig.3 Flowchart of wind speed forecasting

4 算例分析

本文采用某风电场前15天的1440个实测风速值作为训练样本,数据采样间隔为15 min,建立RVM风速预测模型,对第16天的96个采样点的风速值做提前1点(即15 min)的预测。建立模型前对数据进行预处理,选取合理的参数。本文嵌入维数取8,延迟时间取10。

本文分别选择了Sigmoid函数、线性函数、二次项函数、RBF函数及其组合函数作为核函数,比较预测结果如表1所示。

表1 不同核函数的预测结果Tab.1 Forecasts by different kernel functions

由表1可以看出,不同的核函数对应的eMAPE的差别很大,对于单一核函数,二项式函数的eMAPE=2.62%,RBF核函数的eMAPE=2.65%,这2种核函数的误差远小于其余的单一核函数。本文所采用的RBF核函数与二项式函数的组合核函数的eMAPE=2.58%,预测效果优于RBF核函数和其他的组合核函数。

将RVM模型与时间序列模型、BP神经网络模型、SVM模型的预测结果分别进行比较,这些模型在数据处理上基本相同,得到的提前15 min的预测结果如表2所示(由于篇幅有限,只列出部分数据)。

表2 不同预测模型的预测结果Tab.2 Forecasts by different forecasting models

时间序列模型预测结果的eMAPE=5.21%,BP神经网络模型预测结果的eMAPE=5.18%,SVM模型预测结果的eMAPE=3.22%,RVM模型预测结果的eMAPE=2.58%。由不同模型得到的eMAPE可以看出,RVM模型在风速预测中精度比其他模型高。RVM模型计算的结果比较稳定,比BP神经网络模型性能优越,BP神经网络方法不能得到全局最优解,因为其采用梯度下降法优化权值,而这一优化过程只能保证收敛到其中一个点。SVM模型性能也很好,也可以得到全局最优解,其收敛时间为550.98 s,但是RVM模型具有更高的稀疏性,能较快收敛,其收敛时间为345.53 s,从而验证了RVM理论在风速预测中的可行性,具有一定的使用价值。

5 结论

本文对风速时间序列建立了非线性动力学系统模型,通过估计嵌入维数、延迟时间以及最大Lyapunov指数检验了该系统的混沌特性。在此基础上,借助RVM方法,对风速进行了短期预测。该方法克服了神经网络训练时间长、泛化能力差、易陷入局部极小等缺点,具有较强的小样本学习和泛化能力。同时通过对不同的核函数进行分析组合,选择出了RBF核函数与二项式函数的组合核函数作为RVM模型的核函数。与SVM相比,该方法稀疏性更高,核函数选择更加灵活,同时组合核函数的使用提高了预测的精度。作为一种新型的稀疏性学习方法,RVM可以同时输出预测值和预测值方差,非常适用于有实时性要求的工程预测估计。

猜你喜欢
相空间互信息延迟时间
二氧化碳对乙烷燃烧着火延迟时间的影响
LTE 系统下行链路FDRX 节能机制研究
基于分层COX模型的跟驰反应延迟时间生存分析
相干态辐射场的Husimi分布函数在非对易相空间中的表示
基于改进互信息和邻接熵的微博新词发现方法
延迟时间对气辅注射成型气体穿透行为影响的数值模拟和实验研究
非对易空间中的三维谐振子Wigner函数
基于互信息的贝叶斯网络结构学习
联合互信息水下目标特征选择算法
基于增量式互信息的图像快速匹配方法