摘 要:准确地预测用电量有助于电力气象服务工作的开展,并可保障电力系统经济、安全、可靠运行。基于东至县2014—2018年日用电量数据,结合气象要素和日期因素,通过相关性分析筛选要素,并利用长短期记忆(LSTM)神经网络开展多时次用电量预测。利用人体舒适度指数、平均地面温度、最高气温、最低气温、平均水汽压、日期因素和用电量序列数据构建用电量预测LSTM模型,该模型利用过去24日数据,对未来1、3、6日日用电量进行预测,其标准化均方根误差(CVRMSE)分别为0.06、0.09和0.11,相对误差(RE)分别为0.27、0.26、0.27,决定系数(R2)分别为0.56、0.22、0.12。结果证实了基于LSTM神经网络预测短期用电量的可行性,可为电力部门开展需求侧管理、提高能源存储运营水平提供技术支持。
关键词:电力气象服务;长短期记忆神经网络;多时次预测;日用电量
中图分类号:TM715 文献标志码:B 文章编号:2095–3305(2024)07–0-03
随着智慧电网的发展,用电量的精准预测能帮助供电公司更好地进行负载规划,并减少过多的电能产量[1-2]。
准确的预测数据能让公用设备提供商模拟和预测用电负载真实评估能源价格,从而维持生产和需求的平衡,减少生产损失,以及更好地规划未来和设计负载。
当前,广泛应用于预测用电量的模型主要有工程学模型和数据挖掘模型。随着深度学习的发展,如何应用数据挖掘模型预测电力负荷受到广泛重视。深度架构中的人工神经网络(ANN)擅长捕捉大数据中复杂的非线性特征,因而在相关研究中尤为重要[3]。深度学习中大量的隐藏层赋予了其通过分析输入输出之间的关系学习复杂数据的特征,因此探究如何结合先进的神经网络算法和相关要素预测用电量成为近些年的研究热点。
利用先进的神经网络模型结合气象数据等因子提高用电量预测准确率,对电力气象服务的开展和保障电力系统经济、安全、可靠运行具有重要意义[4-5]。
1 数据与方法
用电量数据来源于国网池州市供电公司所提供的东至县用电量数据。气象因子选用平均气温、最高和最低气温、降雨量、蒸发量、最大风速、平均地面温度、日照时数等,数据来源于CIMISS,数据时段为2014年1月1日—2018年12月31日。
1.1 数据预处理
神经网络模型的训练表现和预测准确率十分依赖数据质量,因此数据预处理是一项重要工作。
用电量数据为东至县供电公司整理后的数据,数据质量较高且不存在缺测的情况。东至站气象观测数据中降水量少量数据缺测,蒸发量和日照时数数据存在连续缺测,利用东至站2017年同时段相对湿度、气温日较差、风速对蒸发量建模,再利用该模型结合2018年的相对湿度、气温日较差、风速参数计算缺测的蒸发量数据。经分析,模型如下:
y=4.301-0.048x1+0.025x2+0.181x3(1)
式(1)中,y为蒸发量,x1、x2、x3分别为相对湿度、气温日较差、风速。对于日照时数的缺测值修补,以2017—2018年该时段岳阳、株洲站日照时数为自变量,
对东至站该时段日照时数建模如下:
y=0.353x1+0.452x2+0.779(2)
式(2)中,y为东至站日照时数,x1为岳阳站日照时数,x2为株洲站日照时数。将缺测时段的岳阳、株洲站日照时数代入式(2),得到缺测时段东至站日照时数。降水量及其他气象因子的少量缺测数据采用前后平均值进行插补。
1.2 长短期记忆模型的构建
长短期记忆神经网络是循环神经网络的一种变体,引入自循环使得梯度长时间持续流动[6-8]。通过输入门、遗忘门、输出门(公式如下)控制自循环权重,累积的时间尺度可以因输入序列而改变。
ft=σ(Wf·[hf-1xt]+bf)(3)
it=σ(Wi·[hf-1xt]+bi)(4)
Ct=tan h(Wc·[hf-1xt]+bc)(5)
Ct=ft⊙Ct-1+it⊙Ct(6)
Ot=σ(Wo·[ht-1xt]+bo)(7)
ht=Ot⊙tan h(Ct)(8)
整理后的气象参数、日期因素、用电量序列数据共1 826行,为防止训练过程中的梯度爆炸,需要将参数分别进行归一化处理。
(9)
式(9)中,xi为各项参数,xmin为该项参数最小值,xmax为该项参数最大值。各项参数归一化后取值范围均为[0,1]。
(10)
式(10)中,yi为验证集日用电量真实值,为根据当轮训练模型计算的验证集日用电量计算值,m为验证集数据量。连续的时间序列数据会对模型训练产生影响,因此每轮训练集采用随机抽样的方式构建,训练前在训练集中随机抽取500组连续64条数据集,每个数据集中包括前24日的气象参数、日期因素和用电量数据,预测下1、3、6日的用电量数值。训练后的验证阶段同样采用随机抽取的方式进行评估。
1.3 评价指标
模型预测值与真实值间差异的评价基于以下3种指标。
标准化均方根误差:
(11)
相对误差:
(12)
决定系数:
(13)
式(11)~(13)中,为日用电量的模型预测值(kW·h),
yi为其真实值(kW·h),y为日用电量的平均值(kW·h),
N为观测次数。CV(RMSE)为均方根误差的标准化值,该数值越小,表示预测模型的精度越高;RE为相对误差值(%),可用于反映模型预测的可信程度;R2为决定系数,可用于判断模型的解释力。
该研究数据预处理、分析、模型训练、效果评估及部分作图过程均在R语言(版本3.6.0)中完成。LSTM模型的建立基于keras深度学习框架,作图利用了“ggplot2”包。
2 结果与分析
2.1 日用电量与各要素之间的相关性分析
图1为日用电量与日起因子之间的关系,可以看出,工作日用电量相对于节假日会有少许增加。
图2为日用电量与气象要素之间的关系,因计算人体舒适度指数时使用了平均气温、相对湿度和风速数据,故此3种气象要素不再单独验证与日用电量之间的相关性。由图2可知,人体舒适度指数、平均地面温度、最高气温、最低气温、平均水汽压与日用电量间有明显的二次曲线关系,平均气压与其相关关系不明朗,但也有二期曲线关系的趋势。其他气象因子如风速、降水量、蒸发量、日照时数与日用电量间均无明显相关性。
2.2 基于多要素的日用电量LSTM预测
整理数据得出,用电量在2014—2018年逐年波动增加。较好的神经网络模型结构可以在较少的计算量下得到更好的预测效率。经过多轮测试,最终得出7层模型结构,激活函数为“ReLU”,优化器为“ADAM”,最大训练轮数设置为100轮。
LSTM模型在1日尺度上的预测值十分准确,在较长的时间尺度上也具有较高的精度。图3为1、3、6日下的LSTM模型预测值与真实值的对比情况,可以看出,1日预测步长下预测值与真实值基本一致,3日和6日步长下也紧贴着y=x线。
3 结论与讨论
该研究在相关分析的基础上精减参数类型,并基于气象要素、日期因素和日用电量序列数据利用LSTM模型训练并预测多时次动态日用电量参数,取得了较好的预测效果。分析得出,除平均气压外,其他因子对日用电量的影响效果明显。由用电量LSTM预测模型的预测结果可证实该种训练和预测方式可实现准确率较高的短期日用电量预测。
神经网络模型的成功应用依赖于准确的各流程算法和足量的时间序列数据,该研究应用的算法均经过仔细检验,可确保准确无误,但受数据量的限制,无法试验算法在更长时间尺度上的预测能力。
精准的用电量预测对于电力运营管理至关重要[9-10]。
该研究利用相关分析方法,所筛选的气象要素、日期因素、用电量序列数据,并结合LSTM模型成功预测东至县短期日用电量,其结果可为电力部门开展需求侧管理、提高能源存储运营水平、减轻能源短缺威胁,最终实现智慧电网提供数据和技术支持。
参考文献
[1] 王增平,赵兵,纪维佳,等.基于GRU-NN模型的短期负荷预测方法[J].电力系统自动化,2019,43(5):53-58.
[2] 唐平雅.电力需求预测方法和能源需求预测模型探讨[J].中国电力,2000(4):32-34,52.
[3] 孙静,阮本清,蒋任飞.宁夏引黄灌区参考作物蒸发蒸腾量及其气候影响因子的研究[J].灌溉排水学报,2006(1):54 -57,61.
[4] 易礼秋.基于长短期记忆神经网络变权综合的短期电力负荷预测[D].乌鲁木齐:新疆财经大学,2021.
[5] 邱凯旋,李佳.基于贝叶斯优化和长短期记忆神经网络(BO-LSTM)的短期电力负荷预测[J].电力学报,2022,37(5): 367-373.
[6] 陈胜,刘鹏飞,王平,等.基于LSTM人工神经网络的电力系统负荷预测方法[J].沈阳工业大学学报,2024,46(1):66-71.
[7] 王子乐,王子谋,蔡莹,等.基于长短期记忆神经网络组合算法的短期电力负荷预测[J].现代电力,2023,40(2):201-209.
[8] 姜凡.基于长短期记忆神经网络的短期电力负荷预测研究[D].武汉:湖北工业大学,2021.
[9] 吴翔宇,荀超,肖芬,等.基于RF变量选择与LSTM回归的长期用电量预测模型[J].电气传动,2023,53(5):71-76.
[10] 蔡翔,朱莉.改进深度神经网络的用户用电量预测方法[J].湖北工业大学学报,2023,38(1):15-20.