基于D-S证据理论的短期风速预测模型

2013-10-10 02:27刘亚南卫志农孙国强孙永辉杨友情

电力自动化设备 2013年8期

刘亚南，卫志农，朱艳，孙国强，孙永辉，杨友情，钱瑛，周军

（1.河海大学可再生能源发电技术教育部工程研究中心，江苏南京 210098；2.国电南瑞科技股份有限公司，江苏南京 210061；3.安徽省电力公司池州供电公司，安徽池州 247000）

0 引言

风力发电在我国发展迅速并逐步走向产业化和规模化，对风速预测的研究也越来越深入。由于风速具有较强的随机性，所以风电机组出力波动性较大。对风电场风速进行准确的预测，对电力部门及时调整调度计划，衡量风电场的容量可信度，进而确定合适的风电上网价格，具有重要的现实意义[1]。

众所周知，风速预测的精度不仅与预测方法的选择有很大关系，还与预测周期及预测地点的风速特性有关。一般而言，预测周期越短，预测地点风速振荡性越小，预测精度越高，反之越低。目前，风速预测已经有比较深入的研究，较为成熟的有时间序列分析法、神经网络法等[2]。文献[3]采用时间序列分析方法对风电场风速进行预测，在有限的样本序列下建立了精度较高的预测模型，但是该方法的低阶模型往往不能反映所有样本的性能，高阶模型的估计较为复杂，在计算中消耗时间，同时不易寻找到合适的阶数。卡尔曼滤波[4]能动态地修改预测权值，并依靠预测递推方程获得较高的精度，但是如何建立卡尔曼滤波状态方程和量测方程存在困难。文献[5]提出了一种基于时间序列和卡尔曼滤波的混合型算法。首先利用风速的时间序列数据建立了一个低阶模型，通过该模型的预测方程直接推导出卡尔曼滤波的状态和量测方程，然后利用迭代方程进行预测，从而有效地避免了2种模型的缺陷。文献[6]分别借助于BP神经网络和广义回归神经网络GRNN（Generalized Regression Neural Network）进行风速预测，实验结果表明后者的效果优于前者。同时，也验证了时间序列与GRNN结合起来的预测效果比单一模型效果更有效。文献[7]采用改进的空间相关法和径向基神经网络相结合的风速预测模型，该方法通过分析风电场与空间相关点风速时间序列之间的关联度，分别选择关联度高的相关点的风速数据作为径向基函数RBF（Radical Basis Function）的输入数据，该方法提高了预测精度，减少了径向基神经网络的训练时间。

事实上，单个预测模型往往很难达到理想的精度，同时预测结果还具有不确定性和片面性，因此，如何融合单一方法的优点来进行风速预测成为近年来的一个研究热点。文献[8]利用改进的模糊层次分析法进行风速预测，该方法融合了多种预测方法，取得了一定的效果，但是引入的专家经验具有不确定性，而专家经验的选取与预测结果有密切的关系。基于以上分析，本文提出一种基于证据理论的短期风速预测模型，分别采用时间序列、BP神经网络和支持向量机（SVM）对风速进行预测。根据每个模型的相对误差确定该模型在组合中的权重，从而确立基本信任分配函数，并运用证据理论对函数进行融合，最终得到未来的风速。该模型融合多种预测模型的优点，预期的结果将比单个模型有明显的提高。

1 证据理论基本概念

1.1 基本定义

证据理论是目前信息融合领域中最常用的一种方法，它建立在集合论的基础上，主要用来解决不确定性问题[9]。

定义1：对于一个集合A，称集合Q=｛C|C⊆A｝是集合A的幂集，表示为2A。对于一个判决问题，用集合Θ表示能够认识到的所有可能结果，Θ称为识别框架。

定义2：设Θ为识别框架，基本信任分配函数m（·）是一个从集合 2Θ到[0，1]的映射，A 表示识别框架Θ的任一子集，记作A⊆Θ，且满足，。其中 m（A）称为事件 A 的基本信任分配函数，它表示证据对A的信任程度。

1.2 证据理论Dempster合成法则

D-S合成法则是一个反映证据联合作用的法则。给定几个同一识别框架上基于不同证据的信任函数，若证据不是完全冲突的，则可以利用D-S合成法则计算出一个新的信任函数。

设Bel1、Bel2是同一个识别框架上2个信任函数，m1和m2分别是其对应的基本可信度分配，对应焦元分别为 Ai和 Bj，设，则 D-S合成法则为：

若待合成的函数多于2个，则可以采用上述方法将前一步合成结果与下一个函数进行合成，直至所有函数合成完毕。

2 证据理论权重融合模型

2.1 权重提取模型

运用Dempster合成法则之前，需要提取融合样本的权重。利用训练数据对单一风速预测模型进行训练后，每个模型产生的训练误差为 ei=（yˆi-yi）／yi（i=1，2，3），yˆi为风速的预测值，yi为风速的真实值。权重赋值跟预测精度有密切的关系，预测精度高，说明该算法在组合中所占的权重比较大，精度低，相应的权重比就较小，因此权重wi可表示为下面关于ei的函数[10-12]：

这里ε的引入避免了相对误差为0，进而可得到组合预测结果：

2.2 权重融合模型

在风速预测融合模型中，模型权重被视为证据理论的基本信度值。对于3种风速模型预测值和，对应权重分别为 w1、w2和 w3，在识别框架 Θ=上建立基本信任分配函数 m（·），其对应的信度值为。假设 3 天的风速预测值所对应的信度值为。首先将第1天和第2天对应的信任函数进行融合，然后将合成后的信任函数与第3天的信任函数进行2 重融合，最终得到的信度值为和。假设第 4 天的风速预测值为，则最终合成结果表示为：

3 3种预测模型

3.1 时间序列法预测模型

时序模型主要包括稳定模型和非稳定模型。常用的稳定模型有自回归AR（Auto Regressive）模型、滑动平均MA（Moving Average）模型、自回归滑动平均 ARMA（Auto Regressive Moving Average）模型。非稳定模型有差分自回归平均ARIMA（Auto Regressive Integrated Moving Average）模型等，为方便起见，本文也采用此方法，其模型表达式为：

本文采用Box.Jenkins法进行时间序列分析建模。首先进行差分处理，直到获得平稳序列，再对该平稳序列进行模型识别和参数估计。定阶采用赤池信息准则 AIC（Akaike’s Information Criterion），参数估计采用非线性最小二乘法。

3.2 BP神经网络原理

BP神经网络[13]是一种多层前馈神经网络，由输入层、隐含层和输出层组成。BP网络的权值调整采用反向传播的学习算法，它利用均方误差和梯度下降法来实现对网络连接权值的修正，使得网络实际输出与目标输出之间的均方误差达到期望误差范围之内。神经元采用Sigmoid传递函数，各层神经元的权值修正如下：

其中，r为层数，l、t、k 为神经元，wtk为连接权，α 为学习率，δl为误差修正值。

3.3 SVM原理

SVM[14-16]的基本思想是通过一个非线性映射，将输入空间的数据映射到一个高维空间，然后在此空间中作线性回归。对于回归预测问题，设训练样本（xi，yi），xiє Rm，yiє R，i=1，2…，m，m 为训练样本个数。采用如下的回归函数：

其中，w为权值向量；b为偏差，是2个待训练的参数；对于非线性映射函数φ（x）的选取一般都是选择试算得到的。

对w和b的训练实际是极小化下面的泛函：

式（11）等号右边第1项为经验误差项，第2项为正规化项，正规化常数c用来平衡2项误差之间的关系。

即为ε的不敏感损失函数。

具体求解过程中，引入核函数 k（xi，xj），可以直接将上述极小值问题转化为下面的对偶问题，并采用二次规划进行求解：

其中，ai和a*i为非零的拉格朗日乘子。

由于上述问题转化为一个二次规划问题，因此，原来待定的回归函数表达式可表示为：

核函数的选择决定了特征空间的结构，常用有RBF等。由于对偶问题被描述成为一个凸规划问题，因此所求得的任意解均为全局最优解，克服了神经网络的局部极值问题。

4 基于证据理论的短期风速预测模型

4.1 模型输入、输出变量的选择

风速数据是一组随时间变化的一维时间序列。对于时间序列模型，其因变量是待预测的风速，自变量为风速自身的历史值。对于BP神经网络和SVM网络，在选择输入、输出变量前需要把一维数据序列转化成矩阵形式，以获得数据间的关联信息，这里采用相空间重构的方法。相空间重构中嵌入维数m和延迟时间τ的大小选取很重要，嵌入维数可以使用C-C方法和嵌入窗法[17]等来确定，延迟时间可以用C-C方法来确定。将原数据序列进行空间重构，构造样本对（xi，yi），其中 xi为 m 维向量[18]。

4.2 样本输入的预处理

原始样本数据进行相应的预处理有利于加快模型的样本训练速度和收敛速度，提高预测精度。本文主要采用归一化方法对数据进行处理：

4.3 预测模型的评价标准

预测模型的预测效果可以采用平均绝对百分比误差（MAPE）和均方根误差（RMSE）来评价，其表达式为：

5 算例分析

本文采用某地区风速数据进行实验，每15 min记录一次，每天96个点，得到一组风速序列，共有1 056个点（2008年6月1日至11日），分别用上述3种方法对11日的风速值进行提前一个点（即15min）的预测。BP神经网络和SVM的输入输出数据采用相空间重构方法获得，因此需要嵌入维数和延迟时间，本文嵌入维数取5，延迟时间取1。

首先分别采用3种预测模型获得8日至10日的风速预测结果，如表1所示（相对误差为真实值与预测值之差的绝对值与真实值的比值，由于数据较多，篇幅有限，只列取24个点数据）。通过对上述预测数据分析，利用融合模型对11日风速进行预测。分别提取8日至10日模型权重，从而得到基本信任分配函数，通过合成法则对基本信任分配函数进行多重融合，将最终融合结果作为11日预测模型的权重，该程序的流程图如图1所示。本文ε选择0.001。

通过权重提取模型，分别可以得到8日至10日每天3种预测模型对应的权重，如表2所示。

将表2中的权重当作相应的基本信任分配函数，通过Dempster合成法则进行2重融合，得到最终的权重为 0.238 9、0.169 9、0.591 2。最后对 11日风速进行预测，预测结果如表3所示。

3种单一预测模型和2种组合预测模型的误差对比如表4所示，同时预测风速值的分布如图2所示。

需要特别指出的是，单一模型中，大部分情况下BP模型和SVM模型都优于时间序列模型，BP模型的RMSE、MAPE和最大误差分别比时间序列模型低1.19%、1.03%和4.04%，SVM模型则分别比时间序列模型低2.13%、2.39%和5.42%。同时，利用单一模型进行预测，SVM模型的预测精度比BP模型高，而且预测时间更短。文献[8]也认为对于一般的风速预测模型，BP模型和SVM模型优于时间序列模型，但当风速变化较大时，预测结果将有所不同。

表1 2008-06-08至2008-06-10预测相对误差Tab.1 Relative forecast errors from 2008-06-08 to 2008-06-10

图1 证据理论权重融合的风速预测流程Fig.1 Flowchart of wind speed forecast with fused weighs based on evidence theory

表2 2008-06-08至2008-06-10 3种预测模型对应的权重Tab.2 Weights for three forecasting models from 2008-06-08 to 2008-06-10

改进模糊层次分析法[8]结合了3种预测方法的优点，预测精度高于时间序列、BP网络和SVM网络，但是引入的模糊判断矩阵是根据专家经验选取的，因此不同的判断矩阵得到的结果不同，预测效果很难掌握。本文采用证据理论的组合预测模型进行预测，从算例结果可看出，证据理论组合模型的预测精度优于其他单一预测模型，与改进的模糊层次分析法相比，RMSE、MAPE和最大误差分别低1.55%、0.37%和2.15%，同时避免了专家经验带来的影响，有效地降低了预测方法的不确定性，保证了模型的精度。

表3 D-S模型预测结果Tab.3 Forecasting results of D-S model

图2 真实值与预测值曲线Fig.2 Actual wind speed curve and forecast curve

表4 5种方法误差比较Tab.4 Comparisons of forecasting error among five methods

6 结论

本文借助于证据理论的思想，通过Dempster合成法则对历史预测数据进行模型权重的融合，从而对待预测日的风速进行预测。首先采用3种方法对待测日前3日的风速进行预测，提取融合样本，根据误差计算这3日的模型权重，然后将权重看作基本信任分配函数，并对函数进行融合，最后将融合结果作为待测日的模型权重，对待测日风速进行预测。实例分析结果表明，证据理论预测模型的预测结果比单一预测模型的精度更高，同时与现有的改进模糊层次分析法组合预测模型相比，其不仅预测精度更高，同时还能有效地避免层次分析法中专家经验的不确定性对预测精度的影响，为短期风速预测提供了一种新的有效方法。