基于互信息属性分析与极端学习机的超短期风速预测

2016-05-03 11:18黄南天王新库张建业王文婷王文霞
电工电能新技术 2016年10期
关键词:互信息风速预测

黄南天, 袁 翀, 王新库, 张建业, 王文婷, 王文霞

(1. 东北电力大学电气工程学院, 吉林省 吉林市 132012; 2. 国网山东省电力公司德州供电公司, 山东 德州 253008; 3. 河北省电力公司, 河北省送变电公司, 河北 石家庄 050051)

基于互信息属性分析与极端学习机的超短期风速预测

黄南天1, 袁 翀1, 王新库2, 张建业3, 王文婷1, 王文霞1

(1. 东北电力大学电气工程学院, 吉林省 吉林市 132012; 2. 国网山东省电力公司德州供电公司, 山东 德州 253008; 3. 河北省电力公司, 河北省送变电公司, 河北 石家庄 050051)

超短期风速预测对保证风电并网运行可靠性和维持电力系统安全稳定具有重要的意义,针对风速预测中不同因素对风速影响程度不同的特点,本文提出一种基于互信息属性分析与极端学习机的超短期风速预测方法。首先,选取与风速相关的68种候选属性因素,分别计算其相对于风速序列的互信息值,根据互信息,衡量属性对风速的影响程度,并选择输入属性;然后,由互信息值计算属性权值;之后,采用加权处理后的属性值来训练极端学习机,构建风速预测模型;最后,采用新模型预测未来4h内风速。采用北纬39.91°、西经105.29°的美国风能技术中心的实测数据开展实验,实验结果表明,新方法具有良好的预测精度,能够满足实际风速预测需要。

风速预测; 互信息; 极端学习机; 预测精度

1 引言

在世界性能源危机和环境保护的双重压力下,风能作为一种新型清洁能源受到世界各国的日益关注[1]。然而风能的随机性和波动性对电网的稳定运行不利,当风电的穿越功率超过一定的限值时就会对电力系统的经济和安全运行产生严重的危害。因此风电的大规模并网需要以准确的出力预测为前提[1-4]。风速预测是风力发电预测的基础环节,根据预测时间可分为长期预测、中短期预测以及超短期预测[5]。超短期预测一般预测未来4h内的风速变化情况,主要用于风电场短期内的发电量安排,以减轻风电的波动性和随机性对并网电网的影响。

现有的超短期风速预测方法大致分为基于时间序列方法和智能预测法两类[6]。时间序列法原理较为简单,但误差较大。在智能预测法中,采用神经网络的风速预测方法,可以无限地逼近非线性函数,具有良好的自适应能力、学习能力以及非线性拟合能力,其预测效果较好[7,8]。

传统的神经网络(如BP神经网络)具有收敛速度慢、参数设置复杂的缺点。黄广斌等[9,10]在单隐含层前向神经网络(Single-hidden Layer Feedforward Networks, SLFNs)学习算法的基础上,提出了极端学习机(Extreme Learning Machine, ELM)。ELM随机产生输入层权值以及隐含层节点偏置等网络参数,相对于传统的神经网络,结构简单、学习效率高、泛化能力强;同时,可以根据问题需要灵活地选择其隐含层个数和激活函数类型,适用于复杂的非线性风速预测工作[6,11]。但是,在风速预测过程中,ELM对与风速相关的因素随机分配权重值,未考虑不同的属性因素对风速的影响程度不同,在一定程度上,影响了ELM的预测效果。因此,在采用ELM预测风速前,需要对相关因素对风速的影响程度进行分析。

考虑互信息可衡量不同属性对风速的影响程度,因此,为提高ELM的超短期风速预测精度,提出一种采用互信息属性分析与ELM的超短期风速预测方法。首先,计算5种属性时间序列与风速序列间的互信息;之后,根据互信息,获得不同属性的加权属性值;然后,以加权处理后的属性集合训练ELM风速预测模型;最后,采用该模型预测超短期风速。采用实际风电场数据开展实验,验证新方法的有效性。

2 属性加权预处理ELM

2.1 ELM

图1 ELM结构图Fig.1 Structure of ELM

设ELM的激活函数为G(x),训练样本数为N,则ELM网络的训练输出函数F为:

F=[f1,f2,…,fi,…,fm]m×N

(1)

式中

(2)

将式(2)写成矩阵形式:

Hβ=Y

(3)

式中,H和β分别为隐含层输出矩阵和隐含层神经元与输出层神经元之间的连接权值矩阵。在训练中,权值矩阵ω以及偏置b初始化时,均由系统随机给定,隐含层输出矩阵H变为确定矩阵。由此将ELM网络的训练变成求解输出权值矩阵最小二乘解β的问题。即

(4)

(5)

式中,H-为隐含层输出矩阵H的MP广义逆。然后利用MP广义逆求得该方程组的最小二乘解作为ELM网络的权值参数。

由以上分析可知,ELM网络的训练过程就是一个求解非线性方程最小解的问题。即

‖fj-yj‖

(6)

‖F-Y‖

(7)

当ELM的输入为影响风速的属性、输出为该时刻风速时,则可构建基于ELM的风速预测模型。

2.2 属性加权预处理

ELM对输入特征属性随机分配相应的权值ω,减弱了重要属性在风速预测中的作用,未能体现出不同属性变化对风速预测的不同贡献度[10]。

互信息可以用于衡量不同属性变化与风速序列变化间的相关程度[12]。设I(X;Y)为2个离散随机变量间的统计依存关系,其定义为:

(8)

式中,p(x,y)为变量X和Y的联合概率密度;p(x)和p(y)分别代表X、Y的边缘概率密度。互信息值越大,表示变量X包含变量Y的信息越多,表明二者之间的相关性就越大。

由式(8)可计算获得不同属性相对于风速的互信息。根据互信息值大小,可以选择输入变量以及确定不同输入属性的权重因子σi:

(9)

式中,k为与风速相关的属性个数;Ii为第i种属性相对于风速时间序列的互信息值。在ELM训练过程中,通过权重因子σi对ELM输入数据进行加权处理得到最终的ELM训练数据集合。

3 预测模型的构建

3.1 风速预测属性选择

由于同一风电场风速变化趋势表现出一定的相似性,因此可以通过历史风速值开展超短期风速预测。在风速预测建模中,常将历史风速作为输入变量;针对不同的预测时间段,常采用不同时刻的历史风速作为输入变量[6,11-15]。由于国内历史气象信息记录一般不够全面,因此,在本文分析过程中,未考虑引入温度、湿度等历史气象信息。

考虑到前24个时刻风速与待预测风速相关程度高,故将其列为候选影响属性;前3个至前24个时刻风速的平均值也列为候选影响属性;同时,为衡量风速的变化程度,引入风速的前3个至前24个时刻标准差作为候选影响属性。这样共68个作为初始候选属性。然而过高维度的数据和数量庞大的样本在进行预测时需要较长的运算时间并且耗费过多的计算资源,且易影响预测效果。因此,基于互信息值对输入变量进行属性选择。

首先,采用式(8)计算所有属性相对于风速序列的互信息值。互信息值越大,表明该属性与风速序列的相关性越大,即属性能较大程度反映风速的信息[16,17]。互信息值最大的5个属性如表1所示。

表1 基于互信息的输入属性选择Tab.1 Selection of input attributes by MI

表1中属性采用式(10)进行归一化处理,将属性范围集中到[0,1]之间;同时,为避免故障导致的数据缺失对风速预测的影响,采用相邻数据替代缺失数据。

(10)

为确定构建风速预测模型的最优属性组合,将特征按照互信息值由大到小,构建不同属性集合建立风速预测模型并比较其预测效果。通过平均绝对误差百分比(MeanAbsolutePercentageError,MAPE)和均方根误差(RootMeanSquareError,RMSE)衡量新方法预测能力[1-3,5-8,11-15,18]。其计算公式为:

(11)

(12)

式中,yi和fi分别为对应的预测风速值和实际风速值;m为风速预测模型的输出数目。

比较结果如表2所示。表2分别记录了不同输入空间下的预测误差结果,按新添加属性的互信息值由大到小顺序逐一添加到预测模型所使用的特征子集中,并验证不同子集风速预测效果,以确定预测效果最佳的特征子集。由表2可知,当输入数据为互信息值最大的前5项属性时,其预测结果最佳。因此,新方法采用前3个时刻的平均风速、前1时刻风速、前2时刻风速、前3时刻风速、前3个时刻风速标准差构成预测模型的输入属性集合。

3.2 属性加权预处理

为进一步反映不同重要度的属性对风速的影响,新方法依据不同属性的互信息值,对原始属性数据进一步进行加权预处理。采用式(13)得到加权属性集合:

x″i=xiσi

(13)

式中,x″i为属性加权后的值。预测模型输出的风速值采用式(14)进行反归一处理,映射回原来的风速区间,进而得到风速预测结果。

(14)

表2 不同输入空间下的预测误差Tab.2 Prediction errors of different input spaces

图2 风速预测流程图Fig.2 Flow chart of wind speed forecast

3.3 预测模型

图2为新方法预测流程图。在新方法中,采用交叉验证法[6]来选择ELM的激活函数和隐含层神经元数。最终确定激活函数选择Sig函数,隐含层神经元数为8。ELM的输入为5个属性,输出为待预测时刻点风速,并采用单步预测,最终预测获得4h风速值。

风速的预测过程如下。

(1)对数据进行归一化处理。

(2)分别计算出5个属性相对于风速序列的互信息值,求出各属性的权重值。

(3)利用加权处理后的属性值构成训练数据集合,对ELM进行训练,得到风速预测模型。

(4)向训练好的模型中输入待预测时段属性因素的加权数据,得出预测风速值。

4 实验验证

采用北纬39.91°、西经105.29°美国风能技术中心(National Wind Technology Center, NWTC)M2测风塔的实测风速数据开展实验,验证新方法的有效性,数据采样间隔为10min。预测模型每次输出一个风速值。以2003~2004年相关数据为训练样本,训练风速预测模型;以2005年8月22日13∶00~17∶00为预测时段,验证新方法有效性。

图3为采用互信息加权后的ELM网络(WELM)以及直接采用ELM网络预测的结果。如图3所示,在40~120min风速变化缓慢阶段,新方法的预测风速几乎与真实风速完全重合,显示出良好的预测能力;在130min和190min风速剧烈波动点处,新方法亦能预测出风速的变化趋势。在预测时间窗内,除个别干扰点外,MAPE和RMSE分别保持在5.5和0.015之内。对比单纯的ELM预测方法,新方法能更好地实现对风速的预测。除去几个瞬时波动点外,加权ELM网络基本上预测出了风速的变化趋势规律,显示出了良好的预测能力。

图3 4h预测结果对比Fig.3 Forecasting results comparison of 4h

表3为预测时间窗内MAPE和RMSE的平均值。可以看出新方法明显提高了预测的精度,说明属性加权预处理提高了模型的预测性能。为了全面说明新方法的有效性,对2005年40天(每季度的前10天)的风速进行预测,结果显示了新方法具有更好的效果。

将2005年3月11日分为6个预测时间段开展预测,其预测结果如图4所示。由实验可知,新预测模型能更好地反映出风速的变化趋势,预测效果有明显的提升。在6个预测时段内,新方法的平均MAPE和RMSE分别为6.7245和0.019302,而直接采用ELM预测的平均MAPE和RMSE分别为8.9413和0.038204。相对于直接ELM风速预测模型,新方法风速预测能力有较大提升。其预测精度满足实际需要[1]。

图4 24h预测结果Fig.4 Forecasting result of 24h

此外,从图4可见,当出现波动和瞬时干扰时,新方法预测准确度出现较大波动,其原因主要由于训练样本不足,未能涵盖所有的干扰和瞬时波动的情况。

5 结论

针对风速因波动性和随机性较大而难以精确预测的问题,提出一种基于互信息属性分析和ELM的新型超短期风速预测方法。新方法克服了传统神经网络结构复杂、参数设置繁琐的缺陷,同时,通过互信息加权预处理环节,提高了ELM预测模型的预测精度。实验证明,相较无互信息属性加权预处理环节的传统ELM方法,新方法的风速预测精度明显提升,且精度较高,满足实际风速预测需要。

[1] 薛禹胜,郁琛,赵俊华,等(Xue Yusheng, Yu Chen, Zhao Junhua, et al.).关于短期及超短期风电功率预测的评述 (A review on short-term and ultra-short-term wind power prediction)[J].电力系统自动化(Automation of Electric Power System),2015,39(6):141-151.

[2] 陈翔,王福军,刘天琪,等(Chen Xiang, Wang Fujun, Liu Tianqi, et al.).考虑风电场布局以及风向角的风电功率预测(Wind power prediction considering wind farm layout and wind direction)[J].电工电能新技术 (Advanced Technology of Electrical Engineering and Energy),2013,32(1):9-12.

[3] 黄文杰,傅砾,肖盛(Huang Wenjie, Fu Li, Xiao Sheng).采用改进模糊层次分析法的风速预测模型(A predictive model of wind speed based on improved fuzzy analytical hierarchy process)[J].电网技术(Power System Technology),2010,34(7):164-168.

[4] 柯联锦,潘文霞,朱建红(Ke Lianjin, Pan Wenxia, Zhu Jianhong).一种基于风功率预测修正的储能电池容量需求分析(Analysis of capacity requirements of battery energy storage based on forecasted wind power correction) [J].电工电能新技术(Advanced Technology of Electrical Engineering and Energy),2013,32(3):57-61.

[5] 修春波,任晓,李艳晴,等(Xiu Chunbo, Ren Xiao, Li Yanqing, et al.).基于卡尔曼滤波的风速序列短期预测方法(Short-term prediction method of wind speed series based on Kalman filtering fusion)[J].电工技术学报(Transactions of Electrotechnical Society),2014,29(2):253-259.

[6] 王辉,刘达,王继龙(Wang Hui, Liu Da, Wang Jilong).基于谱聚类和优化极端学习机的超短期风速预测 (Ultra-short-term wind speed prediction based on spectral clustering and optimized extreme learning machine)[J].电网技术(Power System Technology),2015,39(5):1307-1314.

[7] 毕大强,杨歆玉,吴正平(Bi Daqiang, Yang Xinyu, Wu Zhengping).基于风速预测与储能的可调度风电场并网功率控制(Wind speed forecasting and energy storage based power control of grid-connected wind farm)[J].电工电能新技术(Advanced Technology of Electrical and Energy),2013,32(1):1- 4.

[8] 陈德生,李培强,李欣然,等(Chen Desheng, Li Peiqiang, Li Xinran, et al.).基于小波变换的短期风速预测综合模型(Integrated models of short-term wind speed forecasting based on wavelet transform)[J].电工电能新技术 (Advanced Technology of Electrical Engineering and Energy),2012,31(3):73-76.

[9] G Huang, Q Zhu, C Siew. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1-3): 489-501.

[10] W Zong, G Huang, Y Chen. Weighted extreme learning machine for imbalance learning[J]. Neurocomputing, 2013, 101(3): 229-242.

[11] 武峰雨,乐秀璠,南东亮(Wu Fengyu, Le Xiufan, Nan Dongliang).相空间重构的极端学习机短期风速预测模型(A short-term wind speed prediction model using phase-space reconstructed extreme learning machine)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2013,25(1):136-141.

[12] 韩敏,刘晓欣(Han Min, Liu Xiaoxin).基于互信息的分步式输入变量选择多元序列预测研究(Stepwise input variable selection based on mutual information for multivariate forecasting)[J].自动化学报(Acta Automatica Sinica),2012,38(6):999-1006.

[13] 刘兴杰,岑添云,郑文书,等(Liu Xingjie, Cen Tianyun, Zheng Wenshu, et al.).基于模糊粗糙集与改进聚类的神经网络风速预测(Neural network wind speed prediction based on fuzzy rough set and improved clustering)[J].中 国 电 机 工 程 学 报(Proceedings of the CSEE),2014,34(19): 3162-3169.

[14] 陈妮亚,钱政,孟晓风,等(Chen Niya, Qian Zheng, Meng Xiaofeng, et al.).基于空间相关法的风电场风速多步预测模型(Multi-step ahead wind speed forecasting model based on spatial correlation and support vector machine)[J].电工技术学报(Transactions of Electrotechnical Society),2013, 28(5):15-21.

[15] 杨德友,蔡国伟(Yang Deyou, Cai Guowei).基于因散经验模式分解与最小二乘支持向量机的风电场短期风速预测(The short-term wind speed forecasting for wind farm based on EEMD and LS_SVM)[J].东北电力大学学报(Journal of Northeast Dianli University),2015,35(3):44-49.

[16] H Peng, F Long, C Ding. Feature selection based on mutual information: criteria of max-dependency, max-relevance, and min-redundancy[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2005, 27(8): 1226-1238.

[17] N Amjady, F Keynia. Electricity market price spike analysis by a hybrid data model and feature selection technique[J]. Electric Power Systems Research, 2010, 80(3): 318-327.

[18] 王守相,王亚旻,刘岩,等(Wang Shouxiang, Wang Yamin, Liu Yan, et al.).基于经验模态分解和ELM神经网络的逐时太阳能辐照量预测(Hourly solar radiation forecasting based on EMD and ELM neural network)[J].电力自动化设备(Electric Power Automation Equipment),2014,34(8):7-12.

Ultra-short-term wind speed forecasting based on mutual information attributes analysis and extreme learning machine

HUANG Nan-tian1, YUAN Chong1, WANG Xin-ku2, ZHANG Jian-ye3, WANG Wen-ting1, WANG Wen-xia1

(1. Department of Electrical Engineering, Northeast Dianli University, Jilin 132012, China; 2. Dezhou Power supply Company, Shandong Power Company, Dezhou 253008, China; 3. Hebei Electric Power Transmission Company, Hebei Power Company, Shijiazhuang 050051, China)

Ultra-short-term wind speed forecasting has great practical significance to ensure the reliability with the wind farm connected to the grid, and is very helpful to maintain the safety and stability of power system. Different properties for wind speed forecasting have different influence degrees. A new method based on mutual information analysis and extreme learning machine is proposed in this paper. Firstly, five properties used for wind speed forecasting are selected for wind speed forecasting. The mutual information values of each property are calculated to measure the correlations between properties and wind speed series. Then, the data of properties weighted with the values of their mutual information are used to train the extreme learning machine. Finally, the trained ELM is used to forecast the wind speed. The experiment is carried out with the data from US NWTC. The experimental results show that the new method has good forecasting accuracy, and it can meet the actual needs of wind speed forecasting.

wind forecasting; mutual information; extreme learning machine; forecasting accuracy

2015-08-24

国家自然科学基金项目(51307020)、 吉林省科技发展计划项目(20150520114JH)、 吉林省社科基金项目(2015A2)

黄南天(1980-), 男, 吉林籍, 副教授, 博士, 研究方向为新能源预测与主动配电网规划; 袁 翀 (1992-), 男, 河南籍, 硕士研究生, 研究方向为新能源发电与主动配电网。

TM614

A

1003-3076(2016)10-0029-06

猜你喜欢
互信息风速预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
基于最优TS评分和频率匹配的江苏近海风速订正
基于时间相关性的风速威布尔分布优化方法
基于改进互信息和邻接熵的微博新词发现方法
不必预测未来,只需把握现在
基于GARCH的短时风速预测方法
快速评估风电场50年一遇最大风速的算法
基于互信息的贝叶斯网络结构学习