基于特征提取的FA-BP短期光伏发电预测

2021-04-16 04:35:28韩璐宋海亮宋佳刘太豪
南昌大学学报(工科版) 2021年1期
关键词:萤火虫亮度特征提取

韩璐,宋海亮,宋佳,刘太豪

(西南石油大学电气信息学院,四川 成都 610500)

因光伏发电自身带有特殊的间歇特性以及波动特性,当含有大量分布式光伏微电源并入电网时,会使电网的安全性能和经济性能遭受巨大的挑战[1-2]。光伏发电会因当时的天气情况不断变化,因此具有很大的不确定性,会给调度过程带来一定的影响[3]。精准的预测方法能够有效地避免出现诸如光伏出力造成的配电网损耗增加[4]等问题。

目前,针对光伏发电功率预测的精度问题,在国内外被越来越多的学者研究,并取得了一定的成果。李乐等[5]针对传统预测算法在突变天气条件下预测精度较低的问题,提出基于近邻传播聚类和回声状态网络的组合算法,通过近邻传播网络状态方程进行光伏出力预测的方法。张程熠等[6]提出了一种适用于双层神经网络小样本的单步光伏预测方法,有效减少对训练样本数量的需求,同时保证预测的准确度。李练兵等[7]提出一种采用Elman神经网络算法,结合与预测日同日类型下整点时刻的气象数据和光伏输出功率数据,建立光伏发电短期功率预测模型,但是因其并没有考虑到更多的真实天气情况,从而使预测的效果和精度欠佳。文献[8-10]都是基于深度学习对光伏发电预测进行了研究,但是就影响因素方面,并没有涉及天气情况。

本文考虑更全面的天气信息对光伏发电预测精度的影响,加入特征提取的方法,寻找光伏发电在天气数据中影响因素的主要组成成分。由于光伏发电时常伴随着随机性和不确定性,导致使用预测中的传统方法对其进行预测时,会有很大的缺陷和约束。BP神经网络的引入会有效改善光伏发电的预测效果,但是单一的传统的BP神经网络训练性能和求解精度都欠佳,而FA是新崛起的一种智能优化算法,在优化局部和全局,以及鲁棒性能等发面有着独特的优势。所以本次研究在基于特征提取的方法上利用FA优化BP神经网络的初始阈值与权值,进而提高预测模型的训练效果以及求解精度。

1 历史数据PCA特征提取

特征提取是根据原始数据加工植入出一些具有实际意义的特征,目的是替代从原始数据中收获有用的信息[11],以供算法和模型使用。光伏发电功率预测的精度与天气情况有很大的关系,历史数据特征提取的好坏会直接影响预测的精度,所以精准的特征提取是使预测模型达到更好预测结果的前提,在预测环节中尤为重要。主成分分析法(PCA)仅仅需要考虑对特征值进行分解,就可以对数据维度进行精简,达到特征提取的目的。

PCA的中心思想是:

1) 将数据降维。

2) 将原变量利用线性组合得到新变量。

3) 依据所得新变量的贡献率,选择出少数的主要成分。

PCA的主要优点有:

1) 只需通过方差来权衡各个信息量的比重,不会受到数据集本身以外任何因素的影响。

2) 通过各主成分间正交的方法,从而使初始各成分不受彼此之间的影响。

3) 采用的主要运算是特征分解,方法简单,易于实现。

本文针对全面复杂的天气数据(其中包括云覆盖、温度、阵风风速、降水类型、降水强度以及降水概率等共计15项)采用PCA技术进行历史数据的特征提取,作为后面BP神经网络预测模型与FA-BP预测模型的输入,利用PCA可以对历史天气数据进行去噪与数据降维,即去除对光伏发电预测结果影响小的因素,提取对光伏发电预测结果的主要影响因素,使原始数据的维度得到有效的压缩,使后述模型的求解速度显著加快。

2 BP神经网络模型

针对光伏发电预测非线性、特征参数较多等特点,由于BP神经网络具有强大的学习以及映射拟合的能力,能够很好地处理非线性以及复杂参数的问题,于是采用构建BP神经网络模型的方法对光伏发电进行功率预测研究。就非线性系统而言,使用BP神经网络能够很好地调整系统内各神经元之间的权重值。BP神经网络是一种能够以样本的输入和目标的输出为依据来初始化其权值和阈值,并进行网络训练的多层前馈型神经网络。BP神经网络模型的自身性能会随着隐含层的增加而得到提高,但是同时网络的规模会随之变大,增强复杂性,增大计算量,减慢计算速度。经理论研究表明,仅含有一个隐含层的神经网络可以逼近任意精度的连续函数,因此本次研究采用3层的BP神经网络模型对光伏发电进行预测,BP神经网络基本结构如图1所示,BP神经网络预测流程如图2。

图1 BP神经网络基本结构Fig.1 BP neural network structure

BP神经网络的工作原理如下:

1) 权重和偏差值的随机初始化,训练数据归一化。

2) 使用以下公式计算每次迭代的输出:

图2 BP神经网络预测流程Fig.2 BP neural network prediction process

(1)

(2)

式中:ωbi为节点b到i的权重;yi为变换函数。根据上述两个公式,能够分析BP神经网络的输出计算结果。xb由每个神经元接收yi与权重ωbi产生,然后通过激励函数产生yb,并将信号传递至下面一层的联接神经元,然后将结果依次输出。

3) 计算误差和权重更新,然后根据BP规则调整权重。

4) 不断更新权重以及误差,然后针对所有的训练数据重复第2步和第3步。

5) 重复第2步到第4步,直到误差能够达到合理的范围。

隐含层中神经元个数的改变会影响预测误差以及网络性能。计算最佳神经元数量的公式如式(3):

(3)

式中:Hn为最佳神经元数量;M和N分别为输入和输出参数;而Tn为训练数据集的数量。

3 光伏发电预测

针对传统BP神经网络训练效果欠佳和求解精度较低的问题,提出一种FA-BP的预测模型对光伏发电进行预测,该模型的基础结构为BP神经网络模型,利用FA对基础网络模型的参数进行优化,进而增强其训练效果,提高其预测精度。

3.1 FA原理

尽管目前缺少严格的数学分析去证明萤火虫优化算法的合理性,但是根据大量的实验以及与其他群智能优化算法(粒子群、遗传算法等)进行分析与对比,能够得出萤火虫优化算法在寻优速度和精度上表现出较高的性能[12]。

FA主要寻优过程如下:

假设一个萤火虫的固定位置为X,同时该萤火虫的亮度可以表示为i(x)f(x),然而,吸引力β是相互作用的,即表示某个萤火虫对其他萤火虫的吸引程度,由此可知β会因萤火虫i与萤火虫j之间间隔大小rij的改变而改变[13]。其亮度会随着两者间隔距离的增大而降低,表明亮度在传播过程中会受到介质的影响,因此吸引力会随着亮度的吸收程度的变化而改变。

由上述过程可得亮度公式为:

I=I0e-γr

(4)

式中:I0为开始时的亮度;γ为光的吸收系数;r为萤火虫之间的距离。

根据以上描述的过程和原理,可知个体吸引力与其他个体所能看到的亮度大小有关,即可以将个体吸引力β定义为:

β=β0e-γr2

(5)

式中:β0为当r=0时个体所具有的吸引力,此时最大,并且一般情况下取β0=1。

任意两个个体xi和xj之间的距离大小rij可以表示为式(6):

(6)

位置更新公式为:

(7)

式中:ζi为服从高斯分布的变化量;α在0~1之间,为常数。因此当β0=0时,即个体周围无其他个体时,其会进行随机移动。

FA的基本步骤为:

1) 个体参数和位置的初始化;

2) 通过目标函数求解个体适应度值;

3) 萤火虫位置更新;

4) 萤火虫亮度更新;

5) 具有最高的亮度个体就是所要寻找的最优个体;

6) 判别可否满足结束的要求,如若满足,流程结束;否则返回执行步骤3)。

FA基本工作流程如图3所示。

图3 FA基本工作流程Fig.3 Basic process of FA algorithm

3.2 建立PCA-FA-BP预测模型

PCA-FA-BP模型的构建思路是:首先,利用PCA技术对该模型所需的历史数据进行降维去噪。然后,根据本文的研究目的与方向,结合研究现状,选择和构建所需的基础预测模型,即3层的BP神经网络模型。最后,利用FA对BP神经网络的权值和阈值进行优化。

模型构建的基本步骤如下:

1) 数据预处理。利用PCA技术对光伏发电历史数据以及天气数据进行预处理。

2) 产生训练集/测试集。选取处理后数据中的前29 d(每天24 h)的数据作为预测模型的训练集,未来24 h的数据作为预测模型的测试集。

3) PCA-FA-BP神经网络。把经过PCA处理后的训练集输入到预测模型中,并进行网络训练,直至满足训练要求停止。

4) 光伏发电功率预测。网络训练完成后,即可得出根据相应的天气数据的光伏发电预测结果。

FA-BP预测流程如图4所示。

图4 FA-BP预测流程Fig.4 FA-BP forecasting process

4 仿真验证与结果分析

本文以国外某地小型光伏发电站为研究对象,根据历史天气数据(每天24 h)以及对应时刻的光伏发电量数据进行未来24 h的短期光伏发电功率预测,将云覆盖、温度、湿度、露点、紫外线强度、风向、平均风速、阵风风速、降水类型、降水强度、降水概率、臭氧含量、能见度以及日出与日落时间等15个原始变量数据作为模型的输入,各时刻的光伏发电量为输出,建立BP神经网络预测模型和FA-BP预测模型,并采用PCA方法对输入数据进行降维处理,根据PCA方法中解释程度(explained=78.984 1;6.996 3;5.010 6;5.004 6;4.003 2;6.159 4e-4;3.505 3e-4;8.173 1e-5;3.669 8e-5;1.455 9e-5;1.012 1e-5;5.134 9e-6;4.241 8e-6;2.618 9e-6;4.100 9e-9),可以看出前5个天气因素(紫外线强度、温度、日出时间、日落时间、云覆盖率)能够达到98%以上的解释程度,即将原有的15维数据降到5维,然后分别建立PCA-BP预测模型以及PCA-FA-BP预测模型。

在光伏发电预测模型中选取2019年5月1日—29日的光伏发电数据以及对应的天气数据,利用1日—29日的各项数据进行训练,利用30日的各项数据进行测试(FA的参数设置最大迭代次数为20,吸收系数为1)各种预测模型比较结果如图5所示。

图5为BP神经网络模型、PCA-BP模型、FA-BP模型以及PCA-FA-BP模型4种光伏发电预测结果。表1为4种预测方式比较结果,可以看出PCA-FA-BP光伏发电预测模型误差明显低于其他3种预测模型。由于将PCA技术引入到本次预测研究中,将原始多维数据的主要成分提取出来,降低了数据的维度,去除了干扰项,使输入节点减少,收敛速度与FA-BP模型相比,得到了有效提到。

t/h图5 各种预测模型比较结果Fig.5 Comparison results of various forecats

表1 4种预测方式结果比较Tab.1 Comparison of four forecasting methods

5 结论

光伏发电的功率预测对新能源的开发与利用,以及微电网的优化调度等方面具有重要的工程意义。本次研究提出了一种基于PCA-FA-BP的光伏发电预测模型。通过仿真算例分析,PCA-FA-BP光伏发电预测模型分别与BP神经网络模型、PCA-BP模型以及FA-BP模型相比,精确度分别提高54.9%、45.8%和37.1%。由于PCA技术的引入,在预测时间上PCA-BP模型比BP神经网络模型减少1.3%;PCA-FA-BP模型比FA-BP模型减少25.9%。仿真结果表明PCA-FA-BP光伏发电预测模型拥有更佳的训练效果以及预测精度。

猜你喜欢
萤火虫亮度特征提取
亮度调色多面手
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
萤火虫
萤火虫
亮度一样吗?
Bagging RCSP脑电特征提取算法
基于斩波调制的LED亮度控制
人生的亮度
抱抱就不哭了
夏天的萤火虫