王沁
摘 要:随着资源环境约束的日趋严苛,以化石能源为主的能源发展模式必须根本转变。近年来,可再生能源开发的热潮遍及全球。我国已经规划了8个千万kW级的大型风电基地。截至2012年底,我国风电装机容量已超过7000万kW,居世界风电场通常有几十台、上百台风电机组。大型风电基地由数十甚至上百个风电场组成。因此,风电功率的波动有很强的时空差异性。本文对一个风电场的风电功率波动特性展开研究。利用概率拟合模型,ARMA预测模型,灰色预测模型和一阶差分模型解决了风电功率的波动和预测等问题。在问题中,首先使用excel软件对原始数据进行预处理,并选出合适的五个机组作为样本,建立概率拟合模型得出样本在30天范围内的功率波动概率。之后,利用matlab和spss软件对概率函数进行检验和对比,结果证明其功率波动情况与偏T分布最为接近;利用spss软件与matlab软件得出最贴切的概率分布仍然为偏T分布。在空间与时间的对比中,本模型得出,对某台风机而言,风机功率的波动情况受时间影响不大,而空间位置对于风机功率的影响较大;
关键词:ARMA预测;灰色预测;Eviews、matlab;风电功率波动;偏T分布
1 问题综述
给出了某风电场中20台1.5MW风电机组30天的风电功率数据(单位为kW,间隔为5s),做如下分析。
1.任选5个风电机组
a)在30天的范围内,分析机组i的风电功率Pi5s(tk) 波动符合哪几种概率分布?分别计算数值特征并进行检验,推荐最好的分布并说明理由。比较5个机组分布的异同。
2 问题分析
被测量随时间的变化情况具有极强的不确定性,因此我们所采取的算法必须具有很强的非线性处理能力。
2.1 问题一的分析
由于原始数据存在大量异常值和缺失值,本模型对其进行数据预处理。针对问题一(a),为分析机组i的风电功率Pi5s(tk) 波动符合何种概率分布,以及考虑到数据的完整性及可靠性,本模型选出五台风机作为分析的对象,利用matlab软件对每台风机的风电功率分布进行模拟整合得出其概率分布图并进行比较。
2.2 对问题二的分析
问题二要求用分钟级间隔乃至更長间隔的数据来描述风电功率波动。因此,本模型利用matlab软件分别从5台机的风电功率数据中提取出间隔为1分钟的数据序列Pim(tk)。对于这5个序列,做问题一(a)的分析。
3 模型假设
1.假设短期内不存在大的自然灾害,例如地震、海啸以及台风等等
2.假设预测期间风电机组分布不变,发电机组性能不随时间发生变化
4 问题模型的建立
5.1问题一a的模型建立与求解
5.1.1数据的预处理
经过对数据的查找,我们发现部分原始数据存在异常,另外有些类型数据存在缺失,在此我们将其正常化处理。
缺失数据的处理
本模型将附件中20台单机输出功率的异常值化为三种类型,分别是丢失数据null,输出功率为0,以及输出功率为负值。分析三种情况可能产生的原因,结果如下:
由于风电机未运行或风力很小产生的数据对分析结果未产生影响或影响较小在此可忽略不考虑,而对于数据中存在的缺失现象,本文采取均值替代法对缺失数据进行处理。均值替代法就是将该项目剔除异常数据后取整剩余数据的平均值来替换异常或缺失数据的方法,即:(其中,为缺失值,取其前五秒和后五秒
的平均值。)
5.1.2对分析样本的选择
在对原始数据进行分析后,根据所需数据的完整情况选出5个风电机组3 ,5, 7,13,15作为被研究对象。
5.1.3模型的建立与求解
(1)在模型求解过程中,分别使用spss软件,excel软件对各组数据平均数进行多次求解以保证得出结果的准确性
(2)计算出各台风机工作30天后的功率方差
使用spss20软件的非参数方差对数据进行检验,先假设被选为样本的5台风机30天内的功率波动情况符合正态分布,软件运行后显示结果为原假设错误,因此该五台风机在30天内的功率波动情况不符合正态分布,软件显示结果如下图(以3号风机为例)
从表中数据可知,sig为0,说明该数据T分布特性显著,综合考虑得出该组数据更接近于T分布。
5 模型的评价
(1)对于风电机的功率分布分析具有坚实可靠的数学基础。运用多种方法应用多种软件对数据进行分析、对风电机功率分布进行拟合,具有较高的可信度。
(2)通过图形、表格展现分析过程以及分析结果,使其清晰明了。
(3)熟练地运用spss、matlab、C语言、excel 、Eviews等软件,根据每种方法的结论验证结果正确性,对于探讨同一问题的最适宜方法有了进一步体会和了解。