风电功率波动特性分析

2015-01-12 17:57张晴露何天舒
中国高新技术企业 2015年1期
关键词:ARMA模型回归分析

张晴露 何天舒

摘要:文章通过频率频数的直方图进行初步估计,再通过dfittool工具箱进行确认和验证,最终得出指数分布最适合风电功率波动的分布。通过样本总体的均值和方差估计概率分布的参数,并用概率密度函数图和频率分布直方图对不同时间间隔、不同机组、每天或者一个月的概率分布之间的关系进行分析。最终得知,各个机组在以每日为时间窗宽,每天的平均风电功率大致相同,而方差除了一些特殊的点还有这个月的最后几天外,也是大致相同。

关键词:matlab工具箱;分布拟合;回归分析;ARMA模型;平稳时间序列 文献标识码:A

中图分类号:TM76 文章编号:1009-2374(2015)01-0025-02 DOI:10.13535/j.cnki.11-4406/n.2015.0013

1 问题描述

本题研究的是风电功率的波动性问题,当前世界各国资源环境约束的日趋严苛,以化石能源为主的能源发展模式必须向绿色可再生能源转变。风电机组发出的功率主要与风速有关。由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风力发电在满足用电需求方面的确定性不如常规发电。

大规模风电基地通常需接入电网来实现风电功率的传输与消纳。风电功率的随机波动是对电网不利的主要因素。研究风电功率的波动特性,对改善风电预测精度、克服风电接入对电网的不利影响有重要意义。

风电场通常有几十台甚至上百台风电机组。大型风电基地由数十甚至上百个风电场组成。因此,风电功率的波动有很强的时空差异性。

在此我们需要研究风电功率的概率分布等一系列信息并以此对未来风电的功率进行预测,希望得到风力发电机发电功率的一般性结论。

2 模型建立与求解

首先我们要研究风电机发电功率的概率分布。对于概率分布拟合,可以在matlab软件中用dfittool来解决。我们随机选择了五台电机作为观测对象。

将y输入dfittool里面,分别用t分布、指数分布、正态分布去拟合,然后根据拟合出来的各个分布的参数,求出三个分布的表达式,并选取一定的样本,比较三种分布的残差平方和,如表1所示:

表1 时间间隔为5秒风电功率数据用t分布、指数分布、

正态分布去拟合的残差平方和

从分析结果可以发现指数分布的残差平方和是最小的,因此指数分布为我们推荐的最优的概率分布函数。我们已经确定风电功率是服从指数分布的,则可以通过各个样本的总体的均值和方差对指数分布的参数进行估计。

根据经验,用Pim(tk)代替Pi5s(tk)时会损失很多信息,为了方便我们衡量损失的信息,需要通过一些数字化的特征来分析,前面已经确定用指数分布作为风电功率的最优估计分布,那么我们可以通过指数分布的一些特征值进行分析。如果我们直接比较不同的特征参数是很难看出差异的,所以我们比较不同参数特征下指数函数的密度函数,这样更容易观察出其中的差异。

样本的取值频率下降时会损失很多信息,接下来需要度量损失的信息。根据上面的分析,损失的信息大部分都存在于样本点中。

通过前面一系列的研究与分析,我们得到了以下的结论:得到的数据的时间间隔越大,那么分布损失的信息越多。对于不同时间间隔得到的样本,其均值大致相等,因为均值的信息一般都不会损失,损失的信息都来自其波动性,也就是方差。

对于风电功率的预测,我们参考了很多论文,最终确定使用ARMA模型对已有的风电功率的数据进行拟合,然后用matlab里的predict函数对模型进行预测,最终得到总功率的预测值。在用ARMA模型拟合之前,必须先检验时间序列PΣ5m(tk)和PΣ15m(tk)的平稳性,可以使用matlab里面的dfARDTest函数进行假设检验,检验值h=0时表示接受时间序列存在在单位圆中的根的原假设,即接受该序列不是平稳时间序列的原假设;h=1时表示拒绝原假设,则序列为平稳时间序列。将PΣ5m(tk)和PΣ15m(tk)的数据导进matlab用dfARDTest函数处理之后,发现这两个时间序列的检验值h都为1,说明两者都是平稳的时间序列,可以用ARMA模型进行拟合。

接下来是确定ARMA模型的阶数p和q,此处可以用matlab中的for循环实现,p和q分别在[0,10]取值,然后将这121个组合分别带入ARMA模型中,用aic函数求出121个AIC值,显然,最小的AIC值的那一组(p,q)就是ARMA模型的最优阶数,在本文中,经过编程后,发现PΣ5m(tk)和PΣ15m(tk)的最优的(p,q)分别是(2,3)和(1,2)。

最后,用predict函数求出预测值,得出对比的图像并编写程序求出误差值。在此处,我们采用第1~7天0∶00~4∶00的数据去预测0∶15~4∶15的值,并与观测值作对比。

通过计算,我们得出PΣ5m(tk)的预测效果明显要比PΣ15m(tk)预测的效果要好得多。这是因为PΣ15m(tk)的时间跨度比较大,自相关性没有PΣ5m(tk)要好,因此用ARMA模型预测的效果差。

对全部电机采集到的数据进行平稳时间序列的检验,发现h的值均为零,说明单台电机在时序上并不是平稳时间序列,而风电场总功率是一个平稳的时间序列。而从前面得出的概率分布中,可以看出,时间间隔加长之后,由于风速的相关性减弱,相邻时段的平均功率的波动性增强。而概率分布的局限在于没有办法得出每一个时间点所对应的风电功率,从而体现出了预测风电功率的时序规律的必要性。

通过上述对机组和全场风电总功率波动的分析,我们对风电功率波动的特性有了比较深入的认识。风电功率分布具有一定的随机性,但又具有一定的规律性。风电功率波动的规律是可以通过不断改进、完善数学模型得到的。通过以上的认识,我们可以不断深入了解风电功率波动的特性,以克服风电波动对电网运行的不利影响。例如,风电功率的波动是与风速风向有着紧密的关系的,由于风电功率具有随机性,但是风是由大气运动形成的,因此我们可以通过了解风电场里面风速波动的特性进而深入了解风电波动,更准确地预测风电波动,从而消除其对电网运行的不利影响。

参考文献

[1] 胡良剑,孙晓君.MATLAB数学建模[M].北京:高等教育出版社,2008.

[2] 姜启源,谢金星,叶俊.数学模型(第四版)[M].北京:高等教育出版社,2011.

[3] 李秀珍,庞常词.数学实验[M].北京:机械工业出版社,2008.

[4] 茆诗松,称依明,濮晓龙.概率论与数理统计教程(第二版)[M].北京:高等教育出版社,2011.

[5] 李子奈,潘文卿.计量经济学(第三版)[M].北京:高等教育出版社,2010.

(责任编辑:周 琼)

摘要:文章通过频率频数的直方图进行初步估计,再通过dfittool工具箱进行确认和验证,最终得出指数分布最适合风电功率波动的分布。通过样本总体的均值和方差估计概率分布的参数,并用概率密度函数图和频率分布直方图对不同时间间隔、不同机组、每天或者一个月的概率分布之间的关系进行分析。最终得知,各个机组在以每日为时间窗宽,每天的平均风电功率大致相同,而方差除了一些特殊的点还有这个月的最后几天外,也是大致相同。

关键词:matlab工具箱;分布拟合;回归分析;ARMA模型;平稳时间序列 文献标识码:A

中图分类号:TM76 文章编号:1009-2374(2015)01-0025-02 DOI:10.13535/j.cnki.11-4406/n.2015.0013

1 问题描述

本题研究的是风电功率的波动性问题,当前世界各国资源环境约束的日趋严苛,以化石能源为主的能源发展模式必须向绿色可再生能源转变。风电机组发出的功率主要与风速有关。由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风力发电在满足用电需求方面的确定性不如常规发电。

大规模风电基地通常需接入电网来实现风电功率的传输与消纳。风电功率的随机波动是对电网不利的主要因素。研究风电功率的波动特性,对改善风电预测精度、克服风电接入对电网的不利影响有重要意义。

风电场通常有几十台甚至上百台风电机组。大型风电基地由数十甚至上百个风电场组成。因此,风电功率的波动有很强的时空差异性。

在此我们需要研究风电功率的概率分布等一系列信息并以此对未来风电的功率进行预测,希望得到风力发电机发电功率的一般性结论。

2 模型建立与求解

首先我们要研究风电机发电功率的概率分布。对于概率分布拟合,可以在matlab软件中用dfittool来解决。我们随机选择了五台电机作为观测对象。

将y输入dfittool里面,分别用t分布、指数分布、正态分布去拟合,然后根据拟合出来的各个分布的参数,求出三个分布的表达式,并选取一定的样本,比较三种分布的残差平方和,如表1所示:

表1 时间间隔为5秒风电功率数据用t分布、指数分布、

正态分布去拟合的残差平方和

从分析结果可以发现指数分布的残差平方和是最小的,因此指数分布为我们推荐的最优的概率分布函数。我们已经确定风电功率是服从指数分布的,则可以通过各个样本的总体的均值和方差对指数分布的参数进行估计。

根据经验,用Pim(tk)代替Pi5s(tk)时会损失很多信息,为了方便我们衡量损失的信息,需要通过一些数字化的特征来分析,前面已经确定用指数分布作为风电功率的最优估计分布,那么我们可以通过指数分布的一些特征值进行分析。如果我们直接比较不同的特征参数是很难看出差异的,所以我们比较不同参数特征下指数函数的密度函数,这样更容易观察出其中的差异。

样本的取值频率下降时会损失很多信息,接下来需要度量损失的信息。根据上面的分析,损失的信息大部分都存在于样本点中。

通过前面一系列的研究与分析,我们得到了以下的结论:得到的数据的时间间隔越大,那么分布损失的信息越多。对于不同时间间隔得到的样本,其均值大致相等,因为均值的信息一般都不会损失,损失的信息都来自其波动性,也就是方差。

对于风电功率的预测,我们参考了很多论文,最终确定使用ARMA模型对已有的风电功率的数据进行拟合,然后用matlab里的predict函数对模型进行预测,最终得到总功率的预测值。在用ARMA模型拟合之前,必须先检验时间序列PΣ5m(tk)和PΣ15m(tk)的平稳性,可以使用matlab里面的dfARDTest函数进行假设检验,检验值h=0时表示接受时间序列存在在单位圆中的根的原假设,即接受该序列不是平稳时间序列的原假设;h=1时表示拒绝原假设,则序列为平稳时间序列。将PΣ5m(tk)和PΣ15m(tk)的数据导进matlab用dfARDTest函数处理之后,发现这两个时间序列的检验值h都为1,说明两者都是平稳的时间序列,可以用ARMA模型进行拟合。

接下来是确定ARMA模型的阶数p和q,此处可以用matlab中的for循环实现,p和q分别在[0,10]取值,然后将这121个组合分别带入ARMA模型中,用aic函数求出121个AIC值,显然,最小的AIC值的那一组(p,q)就是ARMA模型的最优阶数,在本文中,经过编程后,发现PΣ5m(tk)和PΣ15m(tk)的最优的(p,q)分别是(2,3)和(1,2)。

最后,用predict函数求出预测值,得出对比的图像并编写程序求出误差值。在此处,我们采用第1~7天0∶00~4∶00的数据去预测0∶15~4∶15的值,并与观测值作对比。

通过计算,我们得出PΣ5m(tk)的预测效果明显要比PΣ15m(tk)预测的效果要好得多。这是因为PΣ15m(tk)的时间跨度比较大,自相关性没有PΣ5m(tk)要好,因此用ARMA模型预测的效果差。

对全部电机采集到的数据进行平稳时间序列的检验,发现h的值均为零,说明单台电机在时序上并不是平稳时间序列,而风电场总功率是一个平稳的时间序列。而从前面得出的概率分布中,可以看出,时间间隔加长之后,由于风速的相关性减弱,相邻时段的平均功率的波动性增强。而概率分布的局限在于没有办法得出每一个时间点所对应的风电功率,从而体现出了预测风电功率的时序规律的必要性。

通过上述对机组和全场风电总功率波动的分析,我们对风电功率波动的特性有了比较深入的认识。风电功率分布具有一定的随机性,但又具有一定的规律性。风电功率波动的规律是可以通过不断改进、完善数学模型得到的。通过以上的认识,我们可以不断深入了解风电功率波动的特性,以克服风电波动对电网运行的不利影响。例如,风电功率的波动是与风速风向有着紧密的关系的,由于风电功率具有随机性,但是风是由大气运动形成的,因此我们可以通过了解风电场里面风速波动的特性进而深入了解风电波动,更准确地预测风电波动,从而消除其对电网运行的不利影响。

参考文献

[1] 胡良剑,孙晓君.MATLAB数学建模[M].北京:高等教育出版社,2008.

[2] 姜启源,谢金星,叶俊.数学模型(第四版)[M].北京:高等教育出版社,2011.

[3] 李秀珍,庞常词.数学实验[M].北京:机械工业出版社,2008.

[4] 茆诗松,称依明,濮晓龙.概率论与数理统计教程(第二版)[M].北京:高等教育出版社,2011.

[5] 李子奈,潘文卿.计量经济学(第三版)[M].北京:高等教育出版社,2010.

(责任编辑:周 琼)

摘要:文章通过频率频数的直方图进行初步估计,再通过dfittool工具箱进行确认和验证,最终得出指数分布最适合风电功率波动的分布。通过样本总体的均值和方差估计概率分布的参数,并用概率密度函数图和频率分布直方图对不同时间间隔、不同机组、每天或者一个月的概率分布之间的关系进行分析。最终得知,各个机组在以每日为时间窗宽,每天的平均风电功率大致相同,而方差除了一些特殊的点还有这个月的最后几天外,也是大致相同。

关键词:matlab工具箱;分布拟合;回归分析;ARMA模型;平稳时间序列 文献标识码:A

中图分类号:TM76 文章编号:1009-2374(2015)01-0025-02 DOI:10.13535/j.cnki.11-4406/n.2015.0013

1 问题描述

本题研究的是风电功率的波动性问题,当前世界各国资源环境约束的日趋严苛,以化石能源为主的能源发展模式必须向绿色可再生能源转变。风电机组发出的功率主要与风速有关。由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风力发电在满足用电需求方面的确定性不如常规发电。

大规模风电基地通常需接入电网来实现风电功率的传输与消纳。风电功率的随机波动是对电网不利的主要因素。研究风电功率的波动特性,对改善风电预测精度、克服风电接入对电网的不利影响有重要意义。

风电场通常有几十台甚至上百台风电机组。大型风电基地由数十甚至上百个风电场组成。因此,风电功率的波动有很强的时空差异性。

在此我们需要研究风电功率的概率分布等一系列信息并以此对未来风电的功率进行预测,希望得到风力发电机发电功率的一般性结论。

2 模型建立与求解

首先我们要研究风电机发电功率的概率分布。对于概率分布拟合,可以在matlab软件中用dfittool来解决。我们随机选择了五台电机作为观测对象。

将y输入dfittool里面,分别用t分布、指数分布、正态分布去拟合,然后根据拟合出来的各个分布的参数,求出三个分布的表达式,并选取一定的样本,比较三种分布的残差平方和,如表1所示:

表1 时间间隔为5秒风电功率数据用t分布、指数分布、

正态分布去拟合的残差平方和

从分析结果可以发现指数分布的残差平方和是最小的,因此指数分布为我们推荐的最优的概率分布函数。我们已经确定风电功率是服从指数分布的,则可以通过各个样本的总体的均值和方差对指数分布的参数进行估计。

根据经验,用Pim(tk)代替Pi5s(tk)时会损失很多信息,为了方便我们衡量损失的信息,需要通过一些数字化的特征来分析,前面已经确定用指数分布作为风电功率的最优估计分布,那么我们可以通过指数分布的一些特征值进行分析。如果我们直接比较不同的特征参数是很难看出差异的,所以我们比较不同参数特征下指数函数的密度函数,这样更容易观察出其中的差异。

样本的取值频率下降时会损失很多信息,接下来需要度量损失的信息。根据上面的分析,损失的信息大部分都存在于样本点中。

通过前面一系列的研究与分析,我们得到了以下的结论:得到的数据的时间间隔越大,那么分布损失的信息越多。对于不同时间间隔得到的样本,其均值大致相等,因为均值的信息一般都不会损失,损失的信息都来自其波动性,也就是方差。

对于风电功率的预测,我们参考了很多论文,最终确定使用ARMA模型对已有的风电功率的数据进行拟合,然后用matlab里的predict函数对模型进行预测,最终得到总功率的预测值。在用ARMA模型拟合之前,必须先检验时间序列PΣ5m(tk)和PΣ15m(tk)的平稳性,可以使用matlab里面的dfARDTest函数进行假设检验,检验值h=0时表示接受时间序列存在在单位圆中的根的原假设,即接受该序列不是平稳时间序列的原假设;h=1时表示拒绝原假设,则序列为平稳时间序列。将PΣ5m(tk)和PΣ15m(tk)的数据导进matlab用dfARDTest函数处理之后,发现这两个时间序列的检验值h都为1,说明两者都是平稳的时间序列,可以用ARMA模型进行拟合。

接下来是确定ARMA模型的阶数p和q,此处可以用matlab中的for循环实现,p和q分别在[0,10]取值,然后将这121个组合分别带入ARMA模型中,用aic函数求出121个AIC值,显然,最小的AIC值的那一组(p,q)就是ARMA模型的最优阶数,在本文中,经过编程后,发现PΣ5m(tk)和PΣ15m(tk)的最优的(p,q)分别是(2,3)和(1,2)。

最后,用predict函数求出预测值,得出对比的图像并编写程序求出误差值。在此处,我们采用第1~7天0∶00~4∶00的数据去预测0∶15~4∶15的值,并与观测值作对比。

通过计算,我们得出PΣ5m(tk)的预测效果明显要比PΣ15m(tk)预测的效果要好得多。这是因为PΣ15m(tk)的时间跨度比较大,自相关性没有PΣ5m(tk)要好,因此用ARMA模型预测的效果差。

对全部电机采集到的数据进行平稳时间序列的检验,发现h的值均为零,说明单台电机在时序上并不是平稳时间序列,而风电场总功率是一个平稳的时间序列。而从前面得出的概率分布中,可以看出,时间间隔加长之后,由于风速的相关性减弱,相邻时段的平均功率的波动性增强。而概率分布的局限在于没有办法得出每一个时间点所对应的风电功率,从而体现出了预测风电功率的时序规律的必要性。

通过上述对机组和全场风电总功率波动的分析,我们对风电功率波动的特性有了比较深入的认识。风电功率分布具有一定的随机性,但又具有一定的规律性。风电功率波动的规律是可以通过不断改进、完善数学模型得到的。通过以上的认识,我们可以不断深入了解风电功率波动的特性,以克服风电波动对电网运行的不利影响。例如,风电功率的波动是与风速风向有着紧密的关系的,由于风电功率具有随机性,但是风是由大气运动形成的,因此我们可以通过了解风电场里面风速波动的特性进而深入了解风电波动,更准确地预测风电波动,从而消除其对电网运行的不利影响。

参考文献

[1] 胡良剑,孙晓君.MATLAB数学建模[M].北京:高等教育出版社,2008.

[2] 姜启源,谢金星,叶俊.数学模型(第四版)[M].北京:高等教育出版社,2011.

[3] 李秀珍,庞常词.数学实验[M].北京:机械工业出版社,2008.

[4] 茆诗松,称依明,濮晓龙.概率论与数理统计教程(第二版)[M].北京:高等教育出版社,2011.

[5] 李子奈,潘文卿.计量经济学(第三版)[M].北京:高等教育出版社,2010.

(责任编辑:周 琼)

猜你喜欢
ARMA模型回归分析
城乡居民医疗费用的相关性与回归分析
企业工资增长模型与养老保险基金收支平衡模型