李军 杜雪
摘要:针对短期风电功率预测,提出一类基于稀疏高斯过程(sparse gatlsSian processes,Sparse-GP)的概率预测方法。通过对数据集随机划分所形成的数据子集,给出基于数据点子集(subset of data-points,soD)近似、回归子集(subset of regressors,soR)近似、投影过程(projected proeess,PP)近似算法的3种Sparse-GP方法,该方法不仅能给出模型的均值预测,而且能获取模型的预测方差,这很好地解释了模型置信水平。不同的sparse-GP方法在保持常规GP方法优点的同时,还能解决GP方法随着训练数据增加而产生的矩阵运算困难等难题,且计算效率高。将具有不同协方差函数形式的sparse-GP方法应用于不同地区的短期风电功率单步与多步预测实例中,在同等条件下还与常规GP、sVM方法进行对比。实验结果表明,sparse-GP方法可以給出较好的预测效果,且适用于较大规模数据集的训练。
关键词:稀疏高斯过程;风电功率;概率预测;协方差函数;近似算法
DoI:10.15938/j.emc.2019.08.009
中图分类号:TM 614文献标志码:A 文章编号:1007-449X(2019)08-0067-011
0引言
作为最重要的可再生清洁能源之一,风能具有一定的随机性、间歇性与不可控性,这些特性使得风电场的风力发电功率往往不易控制,给电网方式安排和调度运行都带来了困难和挑战。准确、可靠的风电功率预测对于优化电网运行成本、提高电力系统可靠性都是至关重要的。目前,超短期、短期风电功率预测由于能够降低风电功率波动性的影响,保证电力系统的稳定运行及可靠性,越来越引起研究者的广泛关注。
前馈神经网络、支持向量机(support vector ma-chine,SVM)、进化计算等人工智能方法在风电功率的超短期与短期预测中已获得了许多成功应用。但是,这些方法一般仅能给出预测期望值的点预测,对风电功率预测的不确定性不能给出定量描述。含风电的电网规划、运行与安全稳定分析领域则需要对风电功率预测的波动趋势范围有较为准确的估计,在给出模型均值点预测输出的同时,还能给出预测的置信区间范围,则更有助于评估依赖预测结果的决策风险。因此,研究风电功率的概率预测,在给出未来风电功率期望预测值的同时,还提供风电功率的预测区问或分布函数,已成为当前的重要研究方向之一。
高斯过程(gaussian processes,GP)作为贝叶斯机器学习方法之一,是一种概率意义上的核学习机。GP方法与SVM、核学习、正则化网络等有着紧密联系,以概率分布来表示先验知识,在此基础上构建预测模型。与神经网络、SVM方法相比,GP方法的可调参数少,通过协方差函数的选择和“超参数”的自适应确定,能够把先验知识统一合并于模型中。在监督机器学习的框架下,GP方法在给出模型预测均值的同时,还能获取预测输出方差,因此,其对模型置信度的解释性更好。GP方法是概率预测建模的有力工具之一,近年来已应用于混沌时间序列预测、短期风速预测及交通流预测中,并取得了满意的预测效果。文献[17]则给出了另一种与SVM类似的稀疏概率建模方法一相关向量机(relevance vector machine,RVM),成功应用于电力负荷预测中。
另一方面,与SVM方法类似,随着训练数据集规模的增大,常规GP方法均会出现协方差矩阵或核矩阵运算困难的问题,这导致其计算复杂度急剧增加,往往难以满足矩阵计算时间和内存空间的需求,在一定程度上限制了其应用范围。稀疏高斯过程方法(sparse gaussian process,sparse GP)方法采用矩阵稀疏近似算法,在保持常规GP方法优点的同时,降低了矩阵计算的复杂度,能有效应用于较大规模数据集的监督学习中,从而也适用于具有较大规模数据集的回归建模领域。
针对短期风电功率预测,通过对训练数据集进行随机划分,选取训练数据的子集,给出基于数据点子集(subset of datapoints,SoD)近似、回归子集(subset of regressors,SoR)近似、投影过程(projectedprocess,PP)近似算法的3种不同Sparse-GP概率预测方法。为验证所提Sparse-GP概率预测方法的有效性,将其应用于不同地区的风电功率单步与多步概率预测实例中,在同等条件下,还与常规GP、SVM方法进行比较,同时还将进一步分析不同Sparse-GP方法采用单一协方差函数及ARD特性的组合协方差函数时,对预测结果的影响。
基于训练数据集中所有n个数据,SoR算法完成对GP的近似逼近求解。
1.3PP近似算法
作为一种降级GP,SoR算法可看作一种有限维广义线性模型实现方式,SoD算法是一种非降级的GP实现,但仅利用了m个数据点。投影过程(pro-jected process,PP)近似算法不仅能利用n个数据,而且还是一种非降级的GP。因此,它又称之为确定性训练条件(deterministic training conditional,DTC)逼近算法。
为了进一步衡量Sparse-GP采用其他不同协方差函数的预测效果,表4、表5分别给出了采用不同的单一协方差函数以及单一协方差函数与ARD协方差函数先验组合情形下,不同Sparse-GP及GP方法在训练结束后的目标函数值以及测试集上的预测指标对比。从表4看出,不同Sparse-GP与常规GP方法的预测结果相当,采用ARD协方差函数或NN协方差函数的Sparse-GP方法,其预测指标最佳且略优于表3中采用SE协方差函数的预测结果。总体来看,采用ARD协方差函数能取得最好预测效果,且SoD算法略优于SoR/PP算法的结果。
从表5看出,在采用ARD组合协方差函数情形下,常规GP方法的预测结果优于表3、表4中采用其他单一形式协方差函数时的GP方法预测结果。Sparse-GP方法的MAPE、NMSE值要略优于常规GP方法,其中,采用ARD与sE的组合协方差函数时,SoD算法获得了最优预测指标,采用ARD与Matv=5/2的组合协方差函数时,SoR/PP算法的预测指标较占优,总体看,SoD算法的预测指标略占优。从分析结果看出,采用不同协方差函数的Sparse-GP及GP方法均可取得满意的预测结果,其中采用ARD组合协方差函数的SoD算法的预测效果更好。
图1~图3分别给出了2015年5月8日~15日问,采用ARD与SED的组合协方差函数时,SoD、SoPdPP算法在测试集上与实际输出的对比,同时给出了预测输出方差,即误差带为预测值±2σ的概率区间输出,其中σ为标准差。图4进一步给出了不同Sparse-GP方法的各点预测误差比较,从图1~图4的结果清晰看出,不同Sparse-GP方法均取得了较好预测效果,且其均值预测完全位于置信区间内,这也验证了Sparse-GP方法的概率预测效果。
3.2实例二
本小节实验选取较大规模数据集的来自加拿大亚伯达省的国外某风场实例,取2010年1月1日~4月8日之间的实测原始风电功率数据,采样间隔为10min。实验对连续相邻两个采样点的数据进行平均后作为预处理后的风电功率值,即预处理后的采样间隔是20min。取经预处理后的2010年1月1日~3月11日问的约前5000组数据为训练数据集,其余为测试数据。预测目标分别为提前20min及提前40min、60min的单步、多步预测。
为了对比不同Sparse-GP方法在测试集上进行提前20min、40min和60min预测的效果,表6、表7分别给出采用单一协方差函数时,Sparse-GP方法的NMSE及MAPE指标值。从表6~表7的结果看出,采用ARD协方差函数时,SoD、SoR/PP算法的NMSE值及MAPE值均最优,且SoD算法的NMSE略优于SoR/PP算法,SoR/PP算法的MAPE值略占优。
表8、表9进一步分别给出了采用ARD组合协方差函数时,Sparse-GP方法的NMSE及MAPE指标值比较。从表8看出,采用ARD与LIN组合的协方差函数时,SoD算法的NMSE值最优,采用ARD与sE组合的协方差函數时,SoR/PP算法的NMSE值最优,总体看,采用ARD与sE组合的协方差函数时,SoR/PP算法的NMSE值略占优。
从表9看出,采用ARD与RQ的组合协方差函数时,SoD算法的MAPE值最优,采用ARD与LIN组合的协方差函数时,SoR/PP算法的MAPE值最优。总体看,采用ARD与LIN的组合协方差函数时,SoR/PP算法的MAPE值略占优。表6~表9的结果表明,基于不同协方差函数的Sparse-GP方法均可以取得较好的预测结果,其中,采用ARD组合协方差函数时可获得最好的预测效果,这也表明了其鲁棒性好。
图6~图8分别给出了采用ARD协方差函数时,不同Sparse-GP方法进行对2010年3月12日~4月8日之间的测试数据集进行提前20min预测的输出值与实际值对比,图中还给出了位于95%置信区间下的预测误差带,即预测值±2σ的概率区间输出。图9进一步给出SoD、SoR/PP算法的各点预测误差对比。从图6~图9的结果看出,在较大规模数据集训练情形下,不同Sparse-GP方法均可取得了满意的概率预测效果。
4结论
考虑到风电功率具有随机性与间歇性的特点,且进一步考虑到随着数据集的规模增加,现有常规GP或SVM方法会遇到矩阵运算困难等缺点,采用时间序列建模的方式,提出一类基于Sparse-GP的预测方法。与常规GP方法相比,通过随机划分训练数据活动子集,所给出的SoD、SoR、PP 3种算法的计算复杂度有效降低,计算效率高。
通过不同地区风场的短期风电功率时间序列单步与多步预测实例进行验证,本文的实验结果表明,分别采用单一协方差函数及组合协方差函数的Sparse-GP或GP方法,均可以给出较好预测效果,这也体现了该方法的鲁棒性。其中,采用ARD协方差函数或ARD组合协方差函数时,Sparse-GP方法的预测效果更好。这也表明了Sparse-GP及GP方法可以将先验知识与数据完美结合,能提供一个模型选择与学习的贝叶斯建模框架爱,对模型的解释性与透明性好,模型的推广性好且具有一定的鲁棒性。因此,作为一种适应性更强的概率预测模型,Sparse-GP方法在风电功率预测领域将具有很好的应用潜力。