[摘 要]随着可再生能源在全球能源结构中的比重逐渐增加,光伏发电站的短期功率预测成为电网管理和能源调度的重要环节。文中提出了一种结合BOHB优化算法和Elman神经网络的短期光伏短期功率预测方法,该方法注重历史数据中相似日的选取,以提高预测精度。研究采用了先进的数据处理技术,对大量历史数据进行深入分析,筛选出与预测日气象和发电特性最为相似的日子,进而利用这些数据训练BOHB-Elman模型。试验结果表明,该方法相比传统的预测模型具有更高的准确性和稳定性,为光伏发电站的能源管理提供了一种新的解决方案。
[关键词]光伏短期功率预测;Elman神经网络;BOHB算法;相似日
[中图分类号]TM615 [文献标志码]A [文章编号]2095–6487(2024)06–0159–03
Short Term Power Prediction Method for BOHB Elman Photovoltaic Power Stations Based on Similar Days
ZHAO Xianzhi,YUAN Lu
[Abstract]With the increasing proportion of renewable energy in the global energy structure, power prediction of photovoltaic power plants has become an important link in grid management and energy scheduling. This study proposes a short-term photovoltaic power prediction method that combines BOHB optimization algorithm and Elman neural network. The method focuses on the selection of similar days in historical data to improve prediction accuracy. The study utilized advanced data processing techniques to conduct indepth analysis of a large amount of historical data, selecting the days that are most similar to the predicted daily meteorological and power generation characteristics, and then using these data to train the BOHB Elman model. The experimental results show that this method has higher accuracy and stability compared to traditional prediction models, providing a new solution for energy management of photovoltaic power plants.
[Keywords]photovoltaic power prediction; Elman neural network; BOHB algorithm; similar day
1 概述
1.1 光伏短期功率预测
光伏短期功率预测在提高电网的调度灵活性、优化光伏系统的运行管理等方面发挥着重要作用。光伏短期功率预测方法可分为统计方法和机器学习方法。统计方法依赖于历史数据,通过建立数学模型来预测未来的光伏短期功率,这类方法简便易行,但在处理非线性、非平稳数据时表现不佳。机器学习方法能够通过学习历史数据中的模式来预测未来的短期功率,这类方法在处理复杂数据时显示出更高的准确性和灵活性。随着技术的不断进步,机器学习方法逐渐成为光伏短期功率预测领域的研究热点。
1.2 Elman神经网络
Elman神经网络是一种典型的递归神经网络,由输入层、隐藏层、上下文层及输出层构成。其特点是在隐藏层和上下文层之间存在反馈连接。上下文层的作用是存储过去的信息,使网络具有处理时间序列数据的能力。Elman网络能够学习和记忆先前的状态,这使得其在处理具有时间依赖性的序列预测问题时表现出色。在光伏短期功率预测中,Elman神经网络能有效捕捉到时间序列数据中的动态变化,从而提高预测的准确性。
1.3 BOHB算法
BOHB是Hyperband(机器学习超参数优化算法)的后续工作。Hyperband在生成新的配置时,没有利用已有的Trial(试验)结果,而BOHB算法利用了Trial结果。BOHB中,HB表示Hyperband,BO表示贝叶斯优化(Byesian Optimization)。BOHB会建立多个TPE(热塑性弹性体)模型,从而利用已完成的Trial生成新的配置。该算法通过贝叶斯优化的概率模型来指导搜索过程,同时利用高斯带宽选择方法来调整搜索范围,使得算法能在较短的时间内快速收敛到最优解。BOHB算法在多种机器学习任务中表现出了优异的性能,尤其是在神经网络的结构和参数优化上。其高效性不仅体现在搜索时间上,也体现在找到的超参数对应模型性能的提升上。
1.4 相似日方法在光伏预测中的应用
相似日方法是一种基于历史数据寻找与目标日具有相似特征的日子,进而用于预测的方法。在光伏短期功率预测中,通过分析历史天气条件、温度、辐照度等因素,选择与预测日气候条件相似的日子作为参考,可以提高预测的准确性。这种方法的优势在于其考虑了环境因素对光伏短期功率的影响,能够适应光伏发电的高度非线性和时间变化特征。结合机器学习方法,相似日方法可以进一步提炼数据特征,优化预测模型,为光伏短期功率预测提供更为精准的数据支持。
2 方法论
2.1 数据收集与处理
在光伏短期功率预测的研究中,数据收集与处理是基础且关键的步骤,需要从可靠的数据源收集光伏发电站的历史数据,包括光伏短期功率输出、太阳辐照度、温度、风速等。这些数据来源可能是公开的数据集、合作的光伏电站或其他相关机构。收集到的数据需要经过严格的质量控制,确保数据的完整性和准确性。
数据预处理是将原始数据转化为适合进行模型训练的格式的过程。这一过程包括数据清洗、缺失值处理、异常值检测和修正、数据归一化或标准化等步骤。数据清洗主要是去除数据集中的无关信息,如非运行时间的数据记录。对于缺失值,可以采用插值、删除或预测等方法进行处理,确保数据的完整性。异常值的检测和修正则是为了确保数据质量,避免异常数据影响模型的训练效果。数据的归一化或标准化是为了消除不同量纲的影响,使得模型更容易训练,提高模型的稳定性和预测准确度。
2.2 相似日的选择标准
在光伏短期功率预测中,选择与预测日气候条件相似的历史日子作为参考是一种有效方法。相似日的选择标准通常基于多个维度,如天气条件、季节变化、温度等,确保所选历史日子在关键特征上与预测日接近。这一过程要求综合考虑多种因素,制订合理的标准,以确保选出的相似日对预测日的代表性。
相似度计算是相似日选择过程中的核心环节。常用的相似度计算方法包括欧氏距离、皮尔逊相关系数、余弦相似性等。这些方法从不同角度衡量历史日子与预测日的相似程度。例如,欧氏距离可以直观反映两个日子在多个维度上的差异程度,而皮尔逊相关系数则能够评估其在变化趋势上的相似性。选择合适的相似度计算方法对于提高预测准确性至关重要。
确定相似度计算方法后,接下来的相似日筛选流程包括计算预测日与历史日子在选定指标上的相似度,然后根据相似度对历史日子进行排序,最后选取相似度最高的几天作为相似日。这一流程要求高效且准确地处理大量数据,以确保最终选出的相似日能够为光伏短期功率预测提供可靠参考。
2.3 BOHB-Elman模型构建
在构建基于相似日的BOHB-Elman光伏电站短期功率预测模型时,采用Elman神经网络作为基础框架,其递归特性适合处理时间序列数据。模型的输入层接收选定的气象和发电数据,隐藏层通过时间反馈连接到上下文层,存储历史信息以增强预测连续性和稳定性。应用BOHB算法对Elman网络的超参数进行优化。BOHB结合了贝叶斯优化的全局搜索能力和Hyperband的快速收敛性,可有效调整网络结构和学习参数,如学习率、隐藏层神经元数等。通过迭代试验,BOHB选择性能最佳的配置,提升模型对未来功率的预测精度。此外,模型构建过程中还需重视数据预处理和相似日的精确选择,确保输入数据的质量和相关性,从而最大化预测模型的准确性和可靠性。
2.4 模型训练与验证
2.4.1 训练集与测试集的划分
为了训练并验证BOHB-Elman模型的性能,需要将收集到的数据集分为训练集和测试集。训练集用于模型的训练,而测试集则用于评估模型的泛化能力。通常,这种划分会遵循一定的比例,例如70%的数据用作训练集,30%的数据用作测试集。合理的数据划分不仅能够保证模型有足够的数据进行学习,还能有效评估模型对未知数据的预测能力。
2.4.2 模型训练过程
在训练阶段,BOHB-Elman模型通过输入训练集中的数据,不断调整网络参数,以最小化预测值和实际值之间的差异。训练过程中,模型的参数更新依赖于反向传播算法和优化器,如梯度下降法。模型训练的目标是找到一组最优的网络参数,使得在训练集上的预测误差最小。
2.4.3 模型验证指标
常用的模型验证指标包括均方误差、均方根误差、平均绝对误差及决定系数。通过这些指标,可以全面评价模型的预测精度和稳定性。验证过程中,如果模型在测试集上的表现接近于训练集,说明模型具有良好的泛化能力,没有出现过拟合或欠拟合的问题。过拟合指的是模型在训练集上表现优异,但在测试集上表现不佳。这通常是因为模型过于复杂,捕捉到了训练数据中的噪声而非潜在的数据生成规律。相反,欠拟合则表明模型过于简单,无法捕捉数据中的基本结构,导致在训练集和测试集上都表现不佳。
在评估模型性能时,不同的指标反映了模型性能的不同方面。均方误差和均方根误差侧重于衡量预测值与真实值之间的平均差距,能够提供预测误差的大小。平均绝对误差则给出了预测值偏离真实值的平均程度,更加直观。决定系数反映了模型预测值与真实值之间的相关程度,值越接近1表示模型的解释能力越强,预测性能越好。
3 试验设置与结果分析
3.1 试验设置
在光伏短期功率预测的研究中,试验设置是确保试验结果可靠性和有效性的关键。试验设置包括确定试验的硬件环境、软件环境及参数配置。硬件环境通常指定试验所使用的计算机配置,如处理器类型、内存大小、存储空间等,这些硬件配置直接影响试验的运行速度和数据处理能力。软件环境则包括操作系统、编程语言、使用的机器学习框架及其版本等,这些软件工具的选择和配置会影响试验的复现性和稳定性。
试验参数配置是试验设置中至关重要的部分,包括模型训练的各种参数,如学习率、批次大小、迭代次数等。这些参数直接影响模型训练的效果和效率。例如,学习率的选择会影响模型收敛的速度和稳定性,批次大小则影响每次迭代的计算量和内存使用,迭代次数决定了模型训练的充分程度。合理的参数配置能够确保模型训练过程的高效性和最终预测结果的准确性。
在进行光伏短期功率预测试验之前,需要仔细规划和设定这些试验参数,以确保试验的顺利进行和结果的可靠性。此外,试验过程中还应记录详细的试验日志,包括模型训练的进度、中间结果、最终结果,以及遇到的问题和解决方案等,这些记录对于试验结果的分析和未来研究的参考都具有重要价值。
3.2 预测结果展示
在光伏短期功率预测试验完成后,展示预测结果是评估模型性能的重要环节。预测结果的展示通常包括图表和数值两种形式。图表可以直观地展示模型预测值与实际值之间的对比,常用的图表包括折线图、散点图等。折线图能够清晰地显示出预测值和实际值随时间变化的趋势,便于观察模型在不同时间点的预测准确性。散点图则能够展示出预测值和实际值在各个数值范围内的分布情况,有助于分析模型在不同功率水平下的预测性能。
数值结果则通过具体的数值指标来反映模型的预测性能,包括前文提到的均方误差、均方根误差、平均绝对误差及决定系数等。这些指标能够从不同角度量化模型的预测误差和准确性,为模型性能的评估提供了客观的标准。
3.3 结果分析
结果分析是试验研究的核心部分,通过对预测结果的深入分析,可以揭示模型的性能特点,理解模型在不同情况下的表现,并为未来的研究提供指导。
在结果分析阶段,需要对模型的整体预测性能进行评估,分析模型在整个测试集上的平均表现。通过对比模型的预测结果与实际数据,可以评价模型捕捉数据趋势的能力。此外,还要关注模型在特定条件下的表现,如不同天气条件、不同时间段的预测准确率,从而评估模型的鲁棒性和适应性。
进一步的分析可能包括识别模型预测性能的影响因素。例如,探讨数据特征对预测结果的影响,分析哪些特征对模型的预测结果影响最大,以及模型是否对某些特征过度敏感。通过这种分析,可以揭示模型的内部工作机制,为模型结构的优化提供线索。
此外,结果分析还包括与其他研究成果的比较。将所开发的模型与现有的模型或方法进行比较,可以展现模型在当前研究领域内的竞争力和创新性。这种比较不仅限于预测准确性,还包括模型的计算效率、易用性及可扩展性等方面。
基于以上分析,可总结模型的优点和局限性,并提出未来改进模型的建议。这些建议包括如何调整模型结构、如何优化训练过程、如何更好地处理数据等,旨在指导未来的研究工作,进一步提高光伏短期功率预测的准确性和效率。
4 结束语
本研究通过实施基于相似日的BOHB-Elman模型,对光伏电站的短期功率进行预测,展示了该模型在提高预测准确性方面的有效性。通过精细化的数据处理、模型训练与验证,以及深入的结果分析,研究证实了结合相似日选择和BOHB优化的Elman神经网络在光伏短期功率预测领域的应用价值。光伏能源企业应积极采用先进的预测模型,如BOHB-Elman模型,对历史数据进行深度分析和学习,从而优化光伏发电的调度与管理。展望未来,随着人工智能和机器学习技术的不断进步,光伏短期功率预测的准确度和实用性将持续提升,不仅能为光伏能源企业带来更高的经济效益,也将推动可再生能源的广泛应用和能源结构的优化升级。
参考文献
[1] 卢俊杰,蔡涛,郎建勋,等.基于集群划分的光伏电站集群发电功率短期预测方法[J].高电压技术,2022,48(5):1943-1951.
[2] 王本涛,白杨,邢红涛,等.基于STL与MMoE多任务学习的区域多光伏电站超短期功率联合预测方法[J].电力系统及其自动化学报,2022,34(9):17-23,31.
[3] 梁志峰,董存,吴骥,等.组合辐射衰减因子预报与RBF神经网络的光伏短期功率预测方法[J].电网技术,2020(11):4114-4120.