基于时间序列建模在风力发电功率短期预测中的研究

2016-05-23 09:07田波朴在林王慧
电网与清洁能源 2016年3期
关键词:主成分分析

田波,朴在林,王慧

(沈阳农业大学信息与电气工程学院,辽宁沈阳 110866)



基于时间序列建模在风力发电功率短期预测中的研究

田波,朴在林,王慧

(沈阳农业大学信息与电气工程学院,辽宁沈阳110866)

摘要:为降低风力发电厂并网后对电网稳定性和波动性的影响,风力发电功率的特性分析和预测显得十分重要。论文针对影响风力发电功率的气象因素,引用主成分分析和逐步回归分析2种方法,明确了风速和最低温度与发电功率的因果关系。在进行发电功率预测中以风速作为主因变量的条件,应用指数平滑模型、ARIMA模型、组合预测3种方法分别对风力发电功率进行了预测。组合预测是将前两种预测方法的优点进行组合,使预测结果的精确度得到进一步的提高。

关键词:主成分分析;逐步回归分析;短期功率预测;指数平滑;ARIMA;组合预测

Project Supported by the National Science and Technology Support Program in the Twelfth Five-Year Plan(2012BAJ26B00).

随着全球不可再生能源的告急,人们将目光转向了洁净的新能源的开发和利用,在电力系统中风能的开发利用受到了全世界的关注,同时风能的不稳定性和不可预测性影响了大型风力发电厂并网后的随机波动性和总体上的反调峰特性,这都给电力系统的安全带来了巨大的挑战,因此风功率的短期预测对风力发电场并网后维持电力系统的稳定性变得十分重要。

目前,国内外有很多风功率的预测方法,例如物理预测方法,人工智能预测方法,统计学预测方法,综合预测方法。其中在使用物理预测方法时,建立模型复杂,计算时间过长,预测周期长,所以预测误差大;在人工智能预测方法中,它本身对样本相似性要求过高,而风功率数据的波动性过大,所以模型的实用性过小[1]。

本文引用统计学预测方法中的ARIMA模型,指数平滑模型和综合预测法中的组合预测法,并且利用SPSS软件自带的专家建模器进行了ARIMA模型的最优确认,减小了传统统计学预测方法中分析确定ARIMA模型时的误差,利用组合预测法综合利用前2种预测方法,从而提高了收敛速度,减小了预测误差。

1 SPSS软件对风力发电功率影响因素的分析

1.1主成分分析

主成分分析是通过降维的技术把多个变量转化为少数几个主成分的统计分析方法[2]。在我们研究的过程中,变量多且变量之间可能存在高度相关,如果直接用于回归会导致共线性的问题,这时可以采用主成分分析的方法进行降维,将得到的主成分用于下一步分析,可以达到减少变量和消除共线性的作用。

本文对2014年内蒙古赤峰市孙家营子地区影响风功率的因素:风速、气压、湿度、平均温度、最高温和最低温进行主成分分析,结果如表1所示。

表1 相关矩阵Tab. 1 Correlation matrix

从表1可以看出,最低温和平均温度之间的相关系数达到了0.986,如果直接进行回归分析将会导致共线性而严重影响回归结果从而得到错误的回归关系,也就会得到错误的结论,所以有必要进行主成分分析。进行主成分分析结果如表2所示。

表2 解释的总方差Tab. 2 The total explained variance

从表2可以看到,根据特征根大于1的原则,SPSS自动选出了3个主成分。第一个主成分的特征根为2.317,荷载量为38.608%;第二个主成分特征根为1.609,荷载量为26.81%;第三个主成分特征根为1,荷载量为16.763%。3个主成分累积荷载量达到了82.091%,说明信息提取程度较高,根据表3可以得出主成分矩阵。

从表3可以看到第一主成分主要代表平均温度、最低温和风速,第二个主成分代表气压和最高温表示,第三个主成分代表湿度。根据表3,可以得出计算公式(1)、(2)、(3)。

表3 主成分矩阵Tab. 3 Component matrix

式中:Zi表示第i个成分;F1为风速;F2为平均温度;F3为气压;F4为湿度;Tmax为最高温;Tmin为最低温。由式(1)可以得出,平均温度和最低温之间存在较高的相关性,如果直接进行回归分析则可能出现共线性。为了避免共线性对主成分分析进行降维,也可以采用逐步回归的方法,主成分的降维回归分析如表4所示。

表4 模型汇总Tab. 4 Model summary

由表4可以得出R2为0.384,数值要小很多,这是因为在作主成分分析的时候损失了一些变量的信息因此进行逐步回归变得十分必要。

1.2逐步回归分析

SPSS中的回归分析主要是通过观察变量与变量之间的关系及线性相关的特性来进行分析,本文使用了回归分析中的逐步回归分析法。逐步分析法就是先将自变量对因变量的贡献率由大到小逐步地代入到方程中去,每一次引入自变量,逐步回归分析都会对它进行F检验[3-4],继续对赤峰地区数据中的气象影响因素进行分析,结果如表5、表6所示。

从表5的结果可以看出逐步回归的R2为0.732,与表4相比,拟合度有很大程度上的提高,所以可以看出逐步回归分析法优于主成分分析的降维分析法。再根据表6的回归系数,可以看到,经过两次迭代之后,得到了最优的模型,模型的方程为:

表5 模型汇总Tab. 5 Model summary

表6 系数Tab. 6 Coefficient

根据式(4)可以看出风速的系数为778.098,说明风速越快,产生的功率也越多,最低温的系数为-37.64,说明最低温越高,产生的功率也就越多。

综合表5和表6的回归方程可以知道:

1)风力发电功率除了和风速有很紧密的联系以外,还和最低温度有关。

2)风速与产生功率呈正相关,最低温度与功率呈负相关。根据图1的标准残差直方图和图2的标准残差正态P-P图可以看出这里的回归模型是恰当适合的。

图1 标准残差直方图Fig. 1 Standard error histogram

所以从逐步回归法中可以看到气象因素和发电功率之间的联系,即风速对发电功率的影响最大,对影响程度小的因子在接下来的预测中可以排除不做分析,以减少因数据的过量分析而造成误差。

图2 标准残差正态P-P图Fig. 2 Standard error normal P-P

2 SPSS软件对风力发电功率的预测

2.1指数平滑模型

指数平滑模型最开始只用于估计非季节和季节平稳作为基本形式的时间序列分析[5],后来由相关学者的不断改进与深入研究现在所处理的方法也变得丰富起来,指数平滑估计的是非线性的,其目标是使预测值和实际值见得均方差最小。指数平滑模型公式如下:

带有自变量的ARIMA模型[6]一般形式如式(6):

论文仍用赤峰市孙家营子地区2014年风力发电厂的发电功率做预测,因为年发电功率是具有季节性周期波动的,所以对功率进行分析,在SPSS中选用专家建模器,自动选择最优指数平滑模型并进行回归分析,得到结果如表7所示。

表7 模型统计量Tab. 7 Model statistics

根据表7可以看到,α值为0.49,其P值为0.000,远远小于0.05,说明通过了检验。且R2为0.812,说明拟合优度较好。根据以上结果可写出一下指数平滑公式:

根据式(7)可以算出,以2014年1月1日—2014 年12月25日的数据为训练样本,预测2015年12月26日—31日的数据,结果如表8所示,可以看到,在6天内的预测相对误差均在10%以内,预测效果总体上是令人满意的。

表8 指数平滑模型预测结果Tab. 8 Prediction results of exponential smoothing model

2.2 ARIMA模型

ARIMA模型是时间序列分析中最常用的预测手段,由于数据本身是用时间数据形式进行的日期定义,所以可以用ARIMA进行预测,其中ARIMA模型表示为(p,d,q)×(P,D,Q)s,其中p,d,q表示自回归、差分和滑动平均阶数,P,D,Q表示以s为时间间距的自回归、差分和移动平均算子的阶数,s表示季节参数[6-7],对本文的数据进行分析预测得出图3。

图3 数据分析Fig. 3 Data analysis

根据数据分析图3可以发现,功率并没有呈现出明显的周期和趋势,所以不需要对功率序列进行差分,否则会出现过差分,导致参数估计不一致性。以风速的滞后一阶为功率的自变量,进行具有自变量的ARIMA模型预测,采用AIC和SC准则[8],选取最优滞后阶数,带有自变量的ARIMA模型一般形式如式(6)所示,采用专家建模器进行估计,得到结果如表9所示。

表9 ARIMA模型参数Tab. 9 ARIMA model parameters

选用的ARIMA模型为p=1,d=0,q=4的ARIMA (1,0,4)。由表9可以得出,功率的滞后一阶系数、随机扰动项1、2和4阶以及风速的滞后一阶系数的P值均小于0.01,说明所有系数在0.01的显著水平下通过了检验。且R2为0.895,相对于指数平滑模型,拟合优度有较明显的改善[8-9]。根据以上结果可以写出式(8):

根据式(8),同样以2014年1月1日—2014年12月25日的数据为训练样本,预测2015年12月26日—31日的数据,得到表10的预测结果。

表10 ARIMA模型预测结果Tab. 10 ARIMA model prediction results

由表10可以看到,预测误差在6天内均小于10%,而且可以判断,随着预测期数的增加,相对误差逐渐增高。但相对于指数平滑模型,相对误差减小了很多,说明具有自变量的ARIMA模型预测效果优于指数平滑。

2.3组合预测

组合预测法就是将2种或者2种以上的预测方法进行组合预测。通过几种方法任意组合将所提供的信息进行综合利用,最后达到提高精确度的目的。在很多实例和理论中都可以看到,相对于单一的一种预测方法,组合预测法的预测值都更为精确。组合预测有2种基本形式,一种是等权组合,另一种是不等权组合。这2种基本形式的原理和运用方法是完全相同的,只是权数上的取定有区别。

根据等权组合预测的方法,对两个模型预测的结果进行加权计算出组合预测值,并取该值为最后的预测值,权重取值公式如下[10]:

式中:w为权重;σ为预测值标准差。

根据预测结果,计算出各自的标准差。得到结果为:指数平滑预测标准差为2 885.669 8,带有自变量的ARIMA模型预测标准差为2 379.846 9。可以计算得到权重分别为:指数平滑权重为0.548 031 649,有自变量的ARIMA模型权重0.451 968 351,所以可以得到以下公式:

根据组合预测式(10),得到预测结果如表11所示。

表11 组合预测结果Tab. 11 Results of combination forecasting

组合预测法将2种方法的优点进行了组合,同样以2014年1月1日—2014年12月25日的数据为训练样本,预测2015年12月26日—31日的数据,对比表8,表10和表11中的误差率可以看出,指数平滑模型和ARIMA模型的相对误差范围在10%以内,组合预测法的相对误差都在5%中,说明预测可信度对比前2种方法更高。

3 结论

通过对内蒙古赤峰市孙家营子地区2014年风力发电功率数据的实例分析和预测,表明时间序列的分析方法和预测方法适用于波动性大的具有季节性的风功率数据分析预测,并且方法操作简单方便,结论图标简洁直观,根据实例得出的结论如下:

1)通过主成分分析的降维方法,剔除了相关性高的变量,极大地减少了共线性变量对整个分析的影响。

2)利用逐步回归分析方法找出影响风力发电功率的气象因素,并在进行数据预测的时候加入到自变量中以减少误差率。

3)在ARIMA模型和指数平滑模型中利用分析后的数据进行了直观的预测,预测结果使误差率都在10%以内。

4)组合预测综合利用了前两种预测的优点,进一步预测减少了误差率,使误差率减少到了5%以内,从而使预测结果更加精确可靠。

参考文献

[1]柳玉,白恺,崔正湃,等.风电场短期功率预测水平提升举措措施研究与实例分析[J].电网与清洁能源,2015,31(12): 77-82.LIU Yu,BAI Kai,CUI Zhengpai,et al. Study and case analysis of optimization measures of short-term wind power forecast[J]. Power System and Clean Energy,2015,31 (12): 77-82(in Chinese).

[2]王志征,余岳峰,姚国平.主成份分析法在电力负荷预测中的应用[J].电力需求侧管理,2003,24(3):21-24. WANG Zhizheng,YU Yuefeng,YAO Guoping. The application of principal component analysis in load forecasting[J]. Power Demand Side Management,2003,24 (3):21-24(in Chinese).

[3]徐东升,杨巍,魏哲,等.基于SPSS的短期负荷特性分析及其预测研究[J].电力系统保护与控制,2009,37 (21):147-151. XU Dongsheng,YANG Wei,WEI Zhe,et al. Application of SPSS in characteristic of short load and its forecasting[J]. Power System Protection and Control,2009,37(21):147-151(in Chinese).

[4]卢纹岱,吴喜之. SPSS统计分析[M].北京:电子工业出版社,2010:557-592.

[5]王颖,魏云军.风电场风速及风功率预测方法研究综述[J].陕西电力,2011(11): 18-21,30. WANG Ying,WEI Yunjun. Review on forecasting model of wind speed and wind power[J]. Shaanxi Electric Power,2011(11): 18-21,30(in Chinese).

[6]罗应婷,杨钰娟. SPSS统计分析从基础到实践[M].北京:电子工业出版社,2007:195-251.

[7]乔占俊.基于CensusX12-SARIMA模型的中长期负荷预

测[J].电力系统及其自动化学报,2014,26(1):34-37. QIAO Zhanjun. Medium and long-term load forecasting based on Census X12-SARIMA model[J]. Proceedings of the CSU-EPSA,2014,26(1):34-37(in Chinese).

[8]肖永山,王维庆,霍晓萍.基于神经网络的风电场风速时间序列预测研究[J].节能技术,2007(2): 106-108,175. XIAO Yongshan,WANG Weiqing,HUO Xiaoping. Study on the time-series wind speed forecasting of the wind farm based on neural networks[J]. Energy Conservation Technology,2007(2): 106-108,175(in Chinese).

[9]杨秀媛,肖洋,陈树勇.风电场风速和发电功率预测研究[J].中国电机工程学报,2005,25(11):1-5.YANG Xiuyuan,XIAO Yang,CHEN Shuyong. Wind speed and generated power forecasting in wind farm[J]. Proceedings of the CSEE,2005,25(11):1-5(in Chinese).

[10]章伟,邓院昌.基于组合模型的短期风速预测研究[J].电网与清洁能源,2013,29(7): 83-87,91. ZHANG Wei,DENG Yuanchang. Short-term wind speed prediction based on combination model[J]. Power System and Clean Energy,2013,29(7): 83-87,91(in Chinese).

田波(1990—),女,硕士研究生,从事地方电力系统及其自动化和新能源方向的理论和技术研究;

朴在林(1955—),男,本科,教授,博士研究生导师,研究方向为地方电力系统及其自动化;

王慧(1987—),女,博士研究生,助教,研究方向为地方电力系统及其自动化。

(编辑徐花荣)

Short Term Prodiction of Wind Power Based on Time Series Modeling

TIAN Bo,PIAO Zailin,WANG Hui
(College of Information and Electrical Engineering,Shenyang Agricultural University,Shenyang 110866,Liaoning,China)

ABSTRACT:To reduce the effects of the operation of the gridconnected wind power plant on the stability and volatility of the power grid,analysis and forecasting of the characteristics of wind power appear to be important. Aiming at the meteorological factors which affect the wind power,this paper uses the principal component analysis and stepwise regression analysis method to identify the cause-and-effect relationship between the minimum temperature and wind speed and generated power. The wind speed is taken as the main variable in the power generation prediction,and the exponential smoothing model,ARIMA model,combination forecasting are applied to forecast the wind power. The combination forecasting combines the advantages of the two prediction methods to further improve the accuracy of the prediction results.

KEY WORDS:principal component analysis;stepwise regression analysis;short term power prediction;exponential smoothing;ARIMA;combination forecasting

作者简介:

收稿日期:2015-08-04。

基金项目:十二五国家科技支撑项目(2012BAJ26B00)。

文章编号:1674- 3814(2016)03- 0115- 05

中图分类号:TM711

文献标志码:A

猜你喜欢
主成分分析
Categorizing Compiler Error Messages with Principal Component Analysis
关于AI上市公司发展水平评价
大学生创业自我效能感结构研究
塔里木河流域水资源承载力变化及其驱动力分析
我国上市商业银行信贷资产证券化效应实证研究
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
农村劳动力转移影响因素与转移数量的动态关系研究