结合GA 和LSTM 网络的电力数据分析方法

2021-06-27 03:26赵越
电子设计工程 2021年12期
关键词:适应度染色体负荷

赵越

(中国电力科学研究院有限公司,北京 100192)

随着智能电网建设的实施和智能传感设备的大量安装,由此产生了超大数量的电力数据[1]。如何有效地分析、利用这些数据,为电网运营商带来显著的经济效益,成为了电力系统研究的热点问题[2]。

目前,数据分析方法已普遍应用于电力行业,例如用户分类、负荷预测等。其中,负荷预测是大量专家学者关注的热点问题[3]。通过对当前及未来一段时间内的负荷作出精准预测,以最大程度地保证电力系统对负载不间断的可靠供电[4],且负荷预测支持电力需求与生产之间的平衡,能够降低生产成本和规划未来的产能[5]。对于负荷预测模型,主要分为统计模型和机器学习模型两种[6-7]。而统计模型已无法适应智能电网海量电力数据的处理,基于机器学习的电力数据分析方法能够较优地掌握负荷与环境因素的内在联系,并实现较为理想的预测精度[8]。

由于单一机器学习算法的处理性能较差,从而提出了一种结合遗传算法(Genetic Algorithm,GA)和长短期记忆网络(Long Short-Term Memory,LSTM)的电力数据分析方法[9]。利用GA 改进LSTM 网络,并通过改进后的LSTM 分析电力数据来实现精准预测。

1 电力数据预处理

在电力数据输入预测模型之前,需要对其进行预处理,并将预处理后的数据集划分成3 个集合,即训练集、验证集和测试集。

输入用户分类及负荷预测模型的数据x是预测时间前一周中,每小时的电量数据与相应的温度、节假日等信息,输出时标记数据为待预测时刻的实际负荷。

采用数据归一化方法将负荷与温度数据预处理成(1,2)之间的数值,并采用哑变量表示节假日信息。其中0代表非节假日,1则代表节假日[10]。假定历史负荷与天气数据集是m×n的矩阵,则X表示为:

对原始数据集矩阵每一列的数据进行归一化处理:

2 基于GA 和LSTM 的电力数据分析方法

2.1 LSTM网络

LSTM 网络是由LSTM 单元组成的深层循环神经网络(Recurrent Neural Networks,RNN)模型,与其他现有的全连接前馈网络不同。通过在模型中共享参数,RNN 可以被推广到训练过程中的不可见序列长度,其适用于建模序列问题和一些由于循环连接而获得的信息[11]。然而,RNN 存在消失和梯度爆炸的问题。为此,采用LSTM 网络处理电力数据,其能够向后保留1 000 个时间步长以上的信息,且比简单的RNN 扩展了更长的时间序列。其中LSTM 网络的结构如图1 所示。

图1 LSTM网络结构

LSTM 块中包含了存储单元、输入、输出和遗忘门,单元之间有一个反复的联系。该单元在随机时间间隔上传送“状态”值,并由单元的每个门执行写入、读取和复位操作[12]。除非输入门允许,否则相关数值不能被存储在单元格中。在时刻为t处的输入值it和存储单元的候选值的推导公式如下:

式中,ω是权重,u是矩阵,b是偏差。遗忘门处理状态单元的权重,遗忘门的值计算如下:

存储单元的状态更新如下:

存储单元的新状态有助于确定输出门的数值:

LSTM 单元的最终输出值为:

当使用LSTM 进行负荷预测时,时间延迟、日期和温度等相关变量的特征被用作输入[13]。对于LSTM 模型预测而言,时滞起着较为重要的作用,层数、每层神经元数和批量大小也是LSTM 优化模型的重要因素。

2.2 GA算法

GA 是一种随机的元启发式优化算法,其包含模仿自然遗传与进化概念的算子,如交叉和变异[14]。GA 算法的处理流程如图2 所示。

图2 GA的处理流程

GA 的处理过程可分为6 个阶段:初始化、计算适应度、检查终止条件、交叉、选择和变异。在初始化阶段,搜索空间中任意选择一条染色体,然后根据预设的适应度函数确定染色体的适应度。对于GA等优化算法,适应度函数是影响模型性能的关键因素。一些染色体在这一过程中被反复选择,而有些染色体未经选择就消失了,因为这些染色体是根据适应度函数的适应性随机选择产生的。这也意味着显性染色体有更高的机会遗传到下一代,所选择的显性染色体经过相似片段的交换和基因组合的改变可以产生后代。

在交叉过程中,基于现有的解决方案可以产生出新的解决方案。在突变过程中,选择一条染色体改变一个随机选择的位,从而通过随机交换将多样性引入解决方案池[15]。通过选择、交叉和变异,采用新生成的染色体计算模型的适应度并验证终止准则。所提方法中,将预测模型的均方根误差(Root Mean Square Error,RMSE)作为适应度值。

2.3 基于GA-LSTM的负荷预测模型

对于LSTM模型,寻找最优的时滞(超参数)值、隐藏层数、批量大小等是一个困难且不确定的多项式问题,因此从一组可能的组合中寻找超参数的最佳数目,可以看作是一个搜索和优化的问题[16]。在迄今为止的研究中,GA 是一种有效的算法,通过它可以获得几乎最优的超参数集。所以将GA用于优化LSTM模型,以选择最佳的视窗大小、神经元数目与批量大小。基于GA-LSTM的负荷预测模型流程如图3所示。

图3 基于GA-LSTM的负荷预测模型

在所提模型中,遗传算子开始搜索空间之前对具有可能解的种群进行初始化。其中使用的染色体编码为二进制位,表示时间窗口大小、批量大小和神经元数量。通过一个预设的适应度函数来判断解,选择最小的RMSE 作为最优解。为了获得问题的最优解,种群规模、迭代数与基因长度均起着重要作用,分别设置为100、3 和14。利用GA 寻得LSTM 网络的最优参数,将优化后的LSTM 网络用于电力数据处理,以得到负荷的精准预测。

3 实验结果与分析

文中采用Python3.7 语言作为编程平台,进行电力数据分析。由于LSTM 网络和GA 算法中均有大量的数据需要处理,则需要一台功能强大的计算机。计算机的硬件配置为:Intel®Core™I78665UE处理器、16 GB RAM、1 TB 硬盘、GEFORCE GTX 1050 显卡等。

3.1 评价标准

通过计算平均绝对误差(Mean Absolute Error,MAE)和RMSE,确定GA-LSTM 网络的数据分析性能。MAE 定义为预测值与实际值之间绝对误差的平均值,反映了预测值的实际误差。RMSE是预测值与实际观测值之差的样本标准差。MAE和RMSE的定义分别如下:

式中,n为采样数量,y′为模型预测值,y为实际期望值。

3.2 电力数据分析结果

在负荷预测之前,采用K-means 聚类分析的方式将用户进行分类,如此便可剔除各种用电特有性质的影响。在实施聚类算法之前,需要将负荷数据进行0-1 标准化处理。数据样本选用764 户的用电信息,并选取全部用户30 天的用电量作为30 次聚类实验的样本数据。同时将实验结果的均值当成最终的用户分类输出,3 种类型的用户数量和用电特性见表1 所示[17]。

从表1 中可看出,种类1 的负荷特性是存在两个用电高峰,且晚高峰比早高峰的电量高,其符合居民的生活习惯,因此为居民用户;种类2 的负荷特性为高峰期较长,几乎没有低峰期,这与工业或商业生产经营时间相对吻合,因此其为工业或商业用户;种类3 的负荷特性为高峰期,出现在上午和下午,这种用电习惯较多为政府事业单位。

表1 聚类得到的用户数量及用电特性

在明确用户类型的基础上,利用所提GA-LSTM预测模型进行一天内的负荷预测。24 小时内实际和预测的电力负荷曲线如图4 所示。

图4 电力负荷真实值与预测值的曲线

由图4 可知,所提方法得到的负荷预测值与真实值尤为接近。由于环境和人为因素等存在,因此无法实现零误差的预测。但所提方法采用GA 优化后的LSTM 网络进行负荷预测,已取得了较为理想的预测效果。

3.3 不同方法的性能对比

为了定量论证所提方法的电力数据分析性能,将其与文献[7]、文献[10]、文献[15]进行对比。采用MAE 和RMSE 作为评价指标,结果见图5 所示。

从图5 中可看出,相比于其他对比方法,所提方法的误差值最小,MAE 与RMSE 值分别为88.32 和120.01。由于所提方法采用GA 优化LSTM 的网络参数,并利用改进后的LSTM 进行负荷预测,从而获得高精度的预测结果。文献[7]采用支持向量机的方法实现负荷预测,方法较为单一,预测效果较差。文献[10]利用深度学习算法进行负荷预测,虽然预测误差减小,但计算量巨大。文献[15]基于GRU-NN 模型完成负荷预测,取得了良好的预测效果,但缺乏对门控循环单元(Gating Recurrent Unit,GRU)网络的训练,其性能有待提升。

图5 负荷预测误差对比

4 结束语

电力数据分析是电力行业的重要组成部分,为了向用户提供稳定可靠的电力,电网运营商需要能够高精确度地预测负荷,以满足用户需求。为此,文中提出了一种结合GA 和LSTM 的电力数据分析方法。在采用GA 算法优化LSTM 网络的基础上,利用优化后的LSTM 网络分析电力数据,从而实现负荷可靠预测。另外,基于Python 仿真平台对所提方法进行实验分析。结果表明,所提方法能够获取负荷特性并完成用户分类,将用户分成了居民、商业或工业、事业政府单位3 种。同时负荷预测的结果与真实值较为接近,MAE 与RMSE 值分别为88.32和120.01,均优于其他对比方法,具有一定的应用价值。

文中在考虑批量选择的基础上,将LSTM 与GA相结合,为时间序列预测的研究奠定了基础。在接下来的研究中,将尝试通过增加隐层来提高LSTM 模型的精度,并尝试构建LSTM 和人工神经网络的混合模型,以进一步提高电力数据分析的精度,从而更优地服务于电力行业。

猜你喜欢
适应度染色体负荷
改进的自适应复制、交叉和突变遗传算法
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
一种基于改进适应度的多机器人协作策略
能忍的人寿命长
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
基于空调导风板成型工艺的Kriging模型适应度研究
负荷跟踪运行下反应堆一回路控制系统仿真与验证
再论高等植物染色体杂交