基于机器学习的光伏发电功率预测研究

2024-05-22 07:25北京市市政工程设计研究总院有限公司陶廷伟

电力设备管理 2024年6期

北京市市政工程设计研究总院有限公司陶廷伟

1 基于Stacking-支持向量机的光伏发电功率预测

1.1 集成学习理论

集成学习可理解为一种分布式机器学习框架，其主要作用在于整合多个学习器，完成相应学习任务，在实际运用时需预先打造一组基学习器。之后，依托结合策略实现学习器输出结果的融合。通常基学习器大多依靠训练集训练决策树等机器学习算法，相较于传统的单一学习器来说预测性能更加突出。常见的集成学习理论主要包括：boosting。是指对弱学习器性能实现增强的算法，该算法的优势在于基学习器件性能能够相互影响，产生极强的依赖效果，能依照基学习器误差赋予相应权重；bagging 方法。是指借助并行形式完成基学习器的构建，利用引入随机特征选择方式，强化机学习器的多样性，保证模型的泛化功能。

1.2 模型构建

为了更好地实现光伏发电功率的预测，笔者认为需要以上述集成学习理论为依托打造预测模型，借助多种参数反映光伏发电系统的实际工作情况，具体公式为：S（t）={Idc（t），Vdc（t），T（t），Iac（t），Vac（t），P（t），E（t）}，其中：Idc（t），Vdc（t），Iac（t），Vac（t）分别表示直流电流、直流电压、交流电流、交流电压，而T（t），P（t）分别表示组件温度和发电功率，至于E（t）则用于表示累计发电量。

在充分考虑光伏发电特性的基础上，将连续时刻下的光伏系统工作状态S（t），S（t-1）作为样本特征，依靠大量数据参数将下一时刻的发电功率P（t+1）设计为目标值，此时训练样本可采用下述公式进行表示：sampie（t）={[t，S（t），S（t-1），P(t+1)]}。至于预测模型则主要表现为：P（t+1）=model（t，S（t），S（t-1）)。

对于集成学习来说，主要依靠融合多个学习器来满足预测目标。其应用要点更多地表现为基学习器的构建以及融合，前者大多采用随机子空间法，通过预先从原始训练集中采集样本，抽取样本特征，获取初级训练集，凭借基学习器训练达到基学习器生成的目的。该方法能够从样本扰动等方面推动机学习器多样性的大幅度强化，从而保证模型预测性能，满足实际需求，之后借助选择性集成筛选性能优良的基学习器。

在应用Stacking 支持向量机模型时还要注意，应优先采用K 均值聚类算法进行训练集的聚类分析，并划分为多个子样本集，通过输入筛选获得相应的次级训练集，并将每条样本特征值设计为基学习器的输出值，从而使用次级训练集完成各类别语言学习器的训练。

1.3 数据处理与评价指标

在数据处理方面，主要任务在于解决不同参数单位差异性造成的影响，具体的处理方式如下：（xi-xmin）/（xmax-xmin），式中：分别表示输入数据以及处理后的数据，xmin、xmax分别表示输入的最大值、最小值。至于在模型评价指标的设置上，则依靠百分比误差mape以及均方根误差rmse两种指标来实现模型的性能预测，具体方法为：

式中：xmodel,i，xactual,i分别表示预测值以及实测值，n表示常数，i表示样本集序列。

1.4 算例分析

为进一步验证上述光伏发电功率预测模型的可行性与适用性，本文以自身所在城市的光伏发电站作为研究对象，并采用2019年5～7月以及2020年5～7月的数据进行预测模型的训练，进一步考察该模型在2021年6月不同气象条件下的具体表现。借助实验法，确定K 均值聚类数，并选取基学习器数量的1/3，实现集成处理。根据研究显示，在晴天条件下光伏发电功率不会产生较强波动，Stacking 支持向量机模型所生成的预测曲线基本与实测值保持一致。但在发电站开始发电以及结束发电时会存在较高的预测偏差。而在雨天环境下，光伏发电功率本身会出现多个尖峰，此时会进一步加大预测难度。

根据Stacking 支持向量机模型的预测结果显示，发电功率的变化趋势均被准确掌握。即便在上午、傍晚等波动较为严重的时间，Stacking 支持向量机模型仍能保持极佳的预测效果。而在多云气候条件下，对于光伏发电影响的主要因素表现为光照，在受风力、云层位置的影响下光伏发电功率的波动较为强烈。此时Stacking 支持向量机模型仍能具备极佳的预测精确性，准确判断多云天气的发电功率的变化趋势。具体的预测结果如表1所示。

表1 不同气象条件下预测模型的百分比误差mape 以及均方根误差rmse

根据上述数据可知，Stacking 支持向量机模型的预测性能较为突出，相较于传统的K 均值聚类支持向量机模型来说，能够更好的应对气象环境波动造成的影响，在雨天下更具有预测优势。

2 基于长短期记忆网络与注意力机制的光伏发电功率预测

上述章节中主要探究了在加入光伏系统参数后，实现光伏发电功率预测精确性的增强，验证了Stacking 支持向量机模型的预测效果。但要注意，Stacking 支持向量机模型需要根据季节特性克服恶劣天气造成的影响，因此在实际应用时无形增加了模型训练量，也对工作人员的专业能力提出了更高的要求，且模型使用不够便捷，更多的依靠光伏发电特性的设计样本特征，因此无法进行较长时间范围的预测。

为解决此类问题，本文提出基于长短期记忆网络的光伏发电功率预测模型，其中长短期记忆网络可以理解为一种时间递归神经网络，更适合运用在预测时间序列领域，且在语音识别等方向已取得一定应用成果。通过在此模型上加入注意力机制达到模拟生物视觉注意力的目的，从而自动关注重要参数，帮助预测模型，依托发电功率、时间序列，为下一时刻发电功率进行准确评估[1]。

2.1 预测模型算法

根据实际调查显示，以往采用的神经网络模型各层节点无有效连接，更多的表现为层与层之间的全连接，此类结构经常会出现时序数据预测精确性达不到预期标准的问题。究其原因在于，时序数据与原始数据存在联系，而神经网络则难以有效记忆之前参数。至于循环神经网络，虽然能够在时序数据分析过程中具备良好的适应效果，且隐藏神经元存在连接，可以将之前信息记忆并输出，但在实际应用时则难以有效学习数据内的长期依赖特征，且在训练过程中也经常会出现梯度爆炸的不足之处。为此，我国学者提出了长短期记忆网络，其本质上属于一种时间循环神经网络，可凭借传递算法结合错误修改每次权重。在设置过程中，误差能够随着倒回计算，直至数值被过滤掉，以此使循环神经网络正确处理时序信息[2]。

相较于传统的基于机器学习的光伏发电功率预测，基于长短期记忆网络的光伏发电功率预测模型添加了注意力机制，通过打造生物视觉系统，使人体能够将精力放在相关数据信息上，以此最大程度提高观察效率。注意力机制本质上属于一种模拟大脑注意力的网络架构，能够在特定时刻进行注意力的合理分配，以此减少计算资源占用。将其运用在深度神经网络中，能够更好的筛选输入向量内的相关特征，降低其他特征造成的不良影响，保证模型的泛化性能最大化。

在实际应用过程中，通常将长短期网络记忆的隐藏输出向量作为输入，之后寻找特征向量，分配注意力权重，具体公式表现如下[3]：ei=tanh（Whhi+其中：Wh、bh、ai分别表示权值矩阵、偏置项及权重参数，hi表示特征量，ei表示注意力机制，t为输出向量子集个数。

2.2 预测模型构建

在模型构建方面，需要依照光伏发电站的相关数据参数，充分考虑相关学者的研究结果，将光伏发电功率时间序列作为主要输入，搭配组件温度时间序列，从而实现下一时刻的发电功率预测。对于输入中包含的大量参数信息，需要进行分类型的特征提取。将前者输入长短期记忆网络，凭借注意力机制进行隐藏输出的持续关注，并对隐层输出的各个元素赋予差异性注意力权重。而在后者的处理方面则与前者基本保持一致，之后将注意力权重展开成一维向量，借助全连接层预测发电功率。过程中要注意，模型训练阶段需充分考虑网络前向传播的真实训练输出值，并将其结合实际功率值完成平方损失函数的推演，通过适当优化网络架构降低平方损失值，直至返归一化处理后获得实际预测结果[4]。

2.3 数据处理与评价指标

在数据处理方面基本与Stacking 支持向量机的光伏发电功率预测保持相同，主要目的在于解决不同参数之间单位差异造成的影响，控制好数量级大小。同时还要利用滑窗法获得训练样本，设置样本特征值，从而为下一时刻的实际功率值设计训练目标，并同样采用绝对百分比误差来评价模型的实际预测性能。

2.4 算例分析

为进一步验证上述模型的适用性以及可行性，同样选取笔者所在城市的光伏发电站作为研究对象，收集2019、2020年信息以及2021年1～9月的数据完成模型训练，并将2021年10月至次年9月的信息设为训练集，进一步考察长短期网络记忆模型在不同季节下、不同时间区间内的预测效果，与上述章节中的Stacking 支持向量机光伏发电功率预测模型进行比对。其中基准模型可进一步描述成，采用两个长短期网络记忆层实现发电功率的时间序列特征提取，并将其拉成一维后，与组件温度时间序列合并输出预测结果。根据预测结果显示，基于长短期网络记忆和注意力机制的光伏发电功率预测模型能够在30min 时段做出精准预测，60min 时间段同样具备极佳的预测效果，预测值与实际值误差极小[5]。

3 基于机器学习的光伏发电预测未来发展

在信息化时代背景下大数据技术的应用愈发广泛，该技术的迅速兴起也为大规模数据处理提供助力，通过将其与机器学习深度结合，能够进一步挖掘数据背后的价值意义。大数据技术的应用尚处于摸索阶段，因此本文在进行分析时主要以hadoop大数据处理平台作为研究对象，搭建试验群，以此存储光伏发电数据，实现光伏发电信息的建模预测。hadoop 本质上属于一种分布式大数据处理框架，能够具备负载均衡、任务调度等功能，可直接部署在廉价的集群上实现文件的切分处理，保留多个文件备份，具有极高的容错性。在实际应用时需要结合决策树、梯度提升算法以及随机森林，分别完成回归任务、残差训练以及基学习器集成。

根据实际研究发现，相较于上述两种方法来说，基于大数据技术的光伏发电预测同样能够准确预测光伏发电功率，具有极高的应用潜力。同时，为保证光伏发电预测模型的准确应用，还需要相关技术人员加强对先进技术手段的学习与使用，明确相关算法的优劣，结合实际情况进行科学运用，具备一定的信息化素养，能够有效应对突发状况，降低人为操作干扰，更多的依靠系统程序的自动计算模拟，保证参数录入准确。总结算法应用规律，持续开发循环控制单元、相似日选择等一系列机器学习的光伏发电功率预测，适当结合信息化手段、人工智能，迎合适当发展潮流，并注重预测时间段的延长，从而满足实际需要[6]。