习 伟,蔡田田,张 镇,于 浩,李 鹏
融合多元影响因素的配电台区BiLSTM负荷预测方法
习 伟1,蔡田田2,张 镇1,于 浩1,李 鹏1
(1. 智能电网教育部重点实验室(天津大学),天津 300072;2.南方电网数字电网研究院有限公司,广州 510700)
配电台区负荷预测是保障电力供需平衡的关键,对电力系统的安全预警、应急维护和经济运行具有重要的指导作用.受多种耦合因素影响,面向台区负荷的中短期常规预测方法存在较大的局限性.为提高台区负荷预测方法的泛化能力,提出一种基于双向长短期记忆网络(bidirectional long short-term memory,BiLSTM),并引入要素主成分分析(principal component analysis,PCA)和用电行为分析的中短期日负荷预测模型.首先,基于PCA方法提取预选的影响用电负荷外在因素的主成分,实现对包含冗余、缺失和异常信息的输入变量的降维和修正;其次,依据历史负荷数据,利用基于遗传算法(genetic algorithm,GA)的模糊C均值(fuzzy C-means,FCM)聚类提取台区内不同用户的用电行为特征并依此划分台区内的用户集合,降低用电行为差异对预测结果的影响;然后,搭建每类用户的BiLSTM预测模型,并应用随机权重平均(stochastic weight averaging,SWA)算法提升预测模型的泛化能力,以年为单位预测日负荷电量;最后,将每类用户的负荷预测数据进行线性叠加,得到配电台区负荷预测结果.选取中国某低压台区近4年来的负荷数据作为算例,与其他基于LSTM的常规预测模型相比,基于PCA-BiLSTM模型预测得到的各类用户的年度用电负荷曲线更贴合真实数据曲线,更符合用户的实际生活需求,且基于主成分分析和用电行为分析的分类预测方法可有效提升预测结果的准确率.
负荷预测;特征聚类;主成分分析;双向长短期记忆网络
随着我国社会经济的高速发展,社会用电需求急剧增加.配电网作为电力系统中直接面向用户的环节,其规模庞大、结构复杂;分布式可再生能源和电动汽车等新要素在中低压配网层面大量接入,各种不确定性因素相互耦合,显著改变了配电系统的源、荷特征,给系统的安全高效运行带来了巨大挑战[1],对更加有效的新型配电系统行为特征分析与预测方法提出了迫切需求.
负荷预测旨在基于配电系统本身,综合考虑多种因素(地区、气象等)变化对用电负荷产生的影响,从历史负荷数据中挖掘负荷变化的内在规律,并做出预先估计和推测[2].准确的负荷预测是优化配电系统控制策略、保障系统安全高效运行和用户可靠供电的必要前提[3-4].负荷预测可分为系统级和配电台区级,其中系统级负荷预测的目标是为各级电力部门安排调度计划提供依据,而配电台区级负荷预测的目标是指导安排检修计划、实现事前预警、调配抢修资源、调整运行方式等配网工作.同时,从系统层面来看,其涵盖的负荷类型众多、相互之间存在互补特性,整体规律性更为显著;而配电台区的地域规模更小,整体负荷变化规律性弱,系统级预测方法无法直接适用.此外,长期以来,受制于配电系统的量测通信水平、数据条件和计算能力,实现台区级别的准确负荷预测一直面临挑战.边缘计算等先进信息技术的应用提升了配电系统边缘侧的数据采集和利用能力,使配电网业务从主站向边缘侧转移[5],为更加准确的台区负荷预测提供了基础条件,同时对多要素融合影响下的台区负荷预测新方法提出了要求.从负荷预测研究的时间尺度分析,中、短期负荷预测有助于指导配电网的日常生产;与此同时,用户用电特性由用户日负荷曲线体现,从海量用户的日负荷数据中提取出有价值的信息,有助于构建精准用户画像,保障需求侧响应策略有效实施.因此,精确的中、短期日负荷预测结果对配电系统的正常运行具有重要意义.
关于用电负荷预测的研究已取得诸多成果,早期研究大多采用线性方法,如回归分析法[6]、时间序列法[7-8]、基于灰色理论的改进算法[9-10]和卡尔曼滤波算法[11-12]等.由于负荷预测本身是一个复杂的过程,影响因素较多,传统的线性方法往往无法有效发掘用电负荷数据的内在特征,难以实现精确预测.随着非线性理论的逐步完善和人工智能技术的推广应用,面向负荷预测及相关技术领域的研究中,已涌现大量基于传统机器学习及其改进算法的应用成果.其中,文献[13-14]对传统贝叶斯预测模型进行改进,提高模型的泛化能力,获得较高的预测精度,但此类方法面对影响因素复杂的情况时,存在因计算量大导致预测效率低的问题;文献[15-17]通过改良支持向量机回归(SVR)算法,提升了用电负荷预测精度,SVR算法较为成熟,能够快速求得全局最优解,但对历史数据依赖大,当负荷波动较大时,预测效果变差.
传统机器学习及其改进算法在负荷预测应用中存在以下两点问题:①模型结构相对简单,不能充分表达配电系统所包含的信息;②时序数据问题的处理能力较弱.深度学习是近年来兴起的一种机器学习算法,其核心是通过模仿人脑的机制对数据进行表征学习[18].基于深度学习的模型复杂度高,具有较强的非线性映射能力,能充分发掘数据特征,很好地表达海量电力数据所包含的内在规律[19].文献[20-21]提出利用遗传算法优化反向传播(BP)神经网络对进行负荷预测;文献[22]应用预先训练权重值的受限玻耳兹曼机提高负荷预测精度.该类基于前向神经网络模型的方法预测精度较高,但其具有收敛速度慢、模型可解释性差及易发生过拟合等缺点.以长短期记忆网络(LSTM)为代表的循环神经网络模型,在神经元串行的基础上,加入时序信息表达模块,实现对负荷数据的有效处理[23].用电负荷改变由多种因素共同造成,其内在联系复杂,单一模型往往很难全面反映这种关系.为了解决这个问题,组合模型预测的方法应运而生.依托多个模型各自的优点,可更充分地发掘和利用负荷数据特征,使模型更具有表现力,从而实现提高负荷预测精度的目标.文献[24]通过Stacking模型将负荷影响因素降维,并利用LSTM网络实现短期负荷的快速准确预测;文献[25]提出基于特征筛选的卷积神经网络-双向长短期记忆网络(CNN-BiLSTM)组合模型的短期用电负荷预测方法,提升了多维用电负荷数据的短期预测精度.
用电负荷值受多种因素影响,而表征这些因素的数据集成后会包含大量的冗余信息,模型训练过程中易产生过拟合现象,降低了预测结果的准确性.此外,现阶段多数研究关注负荷本身,单纯基于负荷电气特性建模,并未充分考虑用户差异化的用电行为对电力系统的影响,势必会在某种程度上导致预测精度下降.针对以上问题,本文选取低压台区中短期负荷作为研究对象,通过分析用电负荷影响因素(包括外在因素和用电行为),构建BiLSTM模型,以年为单位进行台区日负荷预测.其具体过程为:首先,利用PCA方法计算各类外在因素的相关性,并依据相关性进行特征降维;其次,基于日负荷历史数据,提取台区用户的用电行为特征,并应用GA-FCM算法对用户进行特征聚类;然后,结合外在因素的特征降维结果,基于BiLSTM模型预测不同特征用户每日的负荷电量;最后,按比例叠加得到台区负荷预测模型.相比于一般混合预测模型和其他机器学习方法,文中方法将系统的影响因素划分为外在因素和用电行为因素,能够更充分地发掘负荷影响因素的特征,在保证预测效率的同时提升准确率.此外,本文结合某电力公司低压台区数据搭建系统仿真模型,借助仿真结果验证本文所提出融合多元影响因素特征分析的双向长短记忆网络负荷预测方法的有效性.
用电负荷预测属于多指标变量的预测问题,输入特征变量增多会大大提升问题复杂度,增加运算时间.PCA用于发掘用电负荷不同影响因素之间的相关性,去除重叠的特征信息、降低数据维度.
PCA的基本思想是用少数具有代表性的变量描述整个变量系统的相关关系,属于多元统计分析方 法[26].该方法基于线性变换,将原变量转化为互不相关的新变量,同时尽可能多地包含原变量的信息;即通过求解原变量的正交矩阵,满足以下条件:①每个原变量系数的平方和为1;②每个新变量之间的协方差为0.此外,分析过程中用变量的方差反映所包含的信息量,并通过计算累计贡献率对变量进行评价.
为识别台区用户用电行为,将模糊C-均值(FCM)聚类算法与遗传算法(GA)相结合进行聚类分析.FCM是一种应用较为广泛的局部搜索模糊聚类算法[27],通过计算数据与各聚类中心的隶属度实现样本数据的聚类划分,可定义为一个样本容量为最优化问题,即
式中:表示聚类中心个数;表示模糊加权指数;为第个样本;为第个聚类中心;u为样本x属于对类别的隶属度系数.聚类中心和隶属度系数的迭代计算公式分别为
FCM算法收敛速度快,但因其基于梯度下降法进行寻优,存在聚类结果对初始值依赖大和容易陷入局部最优解等缺点,导致无法得到准确的用电特征聚类结果.为解决上述问题,引入GA算法优化FCM的初始聚类中心[28],其基本思想是从一组随机产生的种群初始解开始搜索过程,种群中的每个个体对应问题的一个解;后代个体由前一代通过交叉、变异等运算产生,根据适应值的大小选择/淘汰部分后代,保持种群数量不变;这样经过若干代后,算法收敛于最优的个体,即得到全局最优解的近似解.进一步利用FCM算法得到最终的分类结果.
BiLSTM是一种基于时间的双向循环神经网络,通过正向时间序列和反向时间序列进行训练,可有效地挖掘当前数据同过去及未来时刻数据的内在联 系[29],进而充分利用负荷数据信息.
BiLSTM网络是LSTM网络基础上的改进与优化,旨在解决LSTM网络因单向传播的限制,即基于时间序列进行预测时,无法利用过去和未来的序列信息评估当前时刻的技术问题.如图1所示,LSTM网络的神经元结构主要由遗忘门、输入门、输出门和记忆单元构成.
图1 LSTM网络神经元结构
LSTM网络训练过程中,记忆单元时刻的状态由遗忘部分状态和保留部分状态组成;其中,遗忘部分状态由输入、记忆单元(-1)时刻的状态-1及中间输出共同决定,保留部分状态由分别经过sigmoid函数()和tanh函数变换后的输出共同决定.此外,在输出门中和经变换处理得到.图1中各变量的计算公式分别为
式中:f为遗忘门的权重矩阵;i和g为输入门的权重矩阵;o为输出门的权重矩阵;f为遗忘门的偏置项;i和g为输入门的偏置项;o为输出门的偏 置项.
图2 BiLSTM网络结构
本文应用上述方案构建台区负荷预测模型架构(如图3所示),具体流程分为以下两个阶段.
1) 影响因素特征分析
利用PCA提取高维外在因素数据的主成分,以待输入BiLSTM网络进行训练;同时,采用FCM算法对用户用电数据进行聚类,并基于GA算法获得最优初始聚类中心,得到不同用电行为类别的用户数 据集.
2) BiLSTM预测模型设计
对各类用户分别构建BiLSTM预测模型,并运用随机权重平均(stochastic weight averaging,SWA)算法优化网络;进一步针对目标台区不同类别的用户,利用相应的PCA-BiLSTM模型进行预测,并将所有用户的预测值叠加得到台区负荷预测结果.
2.2.1 数据特征
电力系统负荷影响因素众多,以气象因素的影响最为普遍[30];同时由于用电负荷曲线具有明显的日周期性和星期周期性[31],因此在进行负荷预测时,需着重考虑天气情况和日期类型.此外,历史负荷数据中隐藏着用户的用电行为习惯,对这些数据进行挖掘并研究用户类型,有助于更全面地描述台区系统[32].综上分析,本文面向台区的每日用电负荷进行预测,将系统的影响因素特征划分为外在因素特征和用电行为特征.
(1) 外在因素特征.选定预测日的最高气温、最低气温、当日平均气温、前一日平均气温、湿度、降水量、天气状况(包含晴、多云、阴、阵雨等33种天气类型)、日期类型(星期几)及月份共9项特征作为模型的备选输入;模型输出则为未来1d的日负荷值.
图3 台区负荷预测模型架构
(2) 用电行为特征.通过分析用户用电曲线的形状特征,描述用电行为.从波动点、均值及方差3个维度刻画用电曲线形状,具体过程为:首先,通过平滑处理剥离用电数据中的随机波动成分;其次,参考用电量峰值易出现于夏、冬两季[33],并考虑系统的运行效率,选取用电曲线斜率变化最大的2个波动点,将曲线划分为3段;然后,计算分段之后的每段用电数据的平均值和方差;最后,将每个用户用电曲线的2个波动点的时序坐标值、3段曲线的用电量均值和用电量方差共8项指标作为该用户的用电行为特征.
2.2.2 缺失值
为保证预测结果的正确性和客观性,针对时序数据的缺失值问题,本文结合电力负荷曲线的日周期性和星期周期性特点[34],同时考虑负荷数据的时间连续性,采用均值数据插补的方法进行处理,即基于缺失值当日的前后各2d、以及1周前对应时间共计5个采样点的日用电负荷值的平均数补全缺失值,其计算式为
2.2.3 异常值
异常值因输入错误、测量误差及实验误差等情况造成.这类数据参与预测模型训练,会导致预测结果产生较大偏差.本文应用箱型图分析法[35]鉴别异常数据,并参考配电网电气量的正常波动范围对其进行校验;当确认为异常值后,将该数据视为缺失值,并且依照缺失值的补全方法进行处理.
2.3.1 外在因素特征降维
针对数据预处理环节中选取的9项外在因素特征,利用PCA方法进行数据降维,具体步骤如下.
其中
2.3.2 用电行为特征聚类
为充分反映用户的用电行为特征,得到客观的分类结果,在进行特征聚类分析时,数据需包含用户近若干年的日用电负荷值.在此基础上,针对每个用户的负荷数据,以年为区间进行叠加,并求取每日的用电负荷均值.同时考虑用电行为具有明显的星期周期性,采用采样频率为7d/次的分段聚合近似方法对数据进行平滑处理,采样数值表示用户前一周的用电量.进一步应用GA-FCM方法进行特征聚类,步骤如下.
2.4.1 预测模型结构
本文基于Keras框架下的内置神经网络结构搭建BiLSTM预测模型,编程环境为Python3.7,并使用Numpy、Pandas、Matplotlib、Keras和Sklearn等第三方扩展库.考虑时序预测中随机性波动带来的预测精度损失问题,在试验中构建两层BiLSTM网络,并将BiLSTM与Dense(全连接层)连接,从而提取更深层特征.
在此基础上,选取平均绝对百分比误差(mean absolute percentage error,MAPE)作为损失函数(计算公式见式(17)),对每个类别用户的用电负荷进行预测;进一步通过添加Dropout层,解决过拟合问题.模型网络结构如图4所示.
图4 BiLSTM预测模型结构
模型第1层和第2层均为BiLSTM层,初始神经元个数均设置为128,并选用ReLu激活函数.模型第3层为全连接层,用于综合隐藏层提取的特征数据,神经元个数设置为64,并选用ReLu激活函数.模型第4层引入Dropout机制,通过丢弃神经元节点,降低模型对局部特征的依赖度,设置概率参数为0.3.模型第5层为输出层,输出信息的维度为1,选用ReLu激活函数.
2.4.2 SWA优化算法
典型的深度学习网络训练过程是使用优化器对损失函数进行优化,使用一个衰减的学习率,直到模型收敛.在基于随机梯度下降(stochastic gradient descent,SGD)优化器的模型训练过程中,每轮更新参数时,随机抽取一个样本或子成分函数计算梯度,并以此梯度为全局梯度的估计值.但由于实际数据存在噪声,使用SGD优化器常难以沿着最佳的更新方向逼近最优参数,存在参数更新比较频繁,损失函数易产生振荡现象,影响负荷预测的准确性.
针对上述问题,本文应用SWA算法对SGD优化器进行改进,进一步提升模型的泛化能力.SWA算法在SGD优化器的基础上,通过加入周期性的滑动平均操作限制权重的变化(即对SGD优化器遍历的网络权值进行平均),限制了参数更新频率,更容易找到最优值域[38].具体优化步骤如下:
本文以中国某低压台区(227个用户)2017—2020年期间用电负荷信息为研究对象,其中居民、商业等不同用户以及不同建筑类型的用电行为存在差异,应用基于用电特征聚类和PCA-BiLSTM的方法进行预测分析.台区每年的日最大功率和最小功率如表1所示,可以看出,相比与2017—2020年期间的负荷功率数据均在正常波动范围内.据此推断,2020年该台区的整体用电负荷未受到新冠疫情影响.
表1 台区负荷功率
Tab.1 Load power of the transformer district kW
实验过程中,设定每年1月1日—12月31日为一个周期,选取2017—2019年的历史负荷数据作为训练集,用于建立台区负荷预测模型;选取2020年的历史负荷数据作为测试集,用于检验负荷预测效果.进一步采用MAPE和均方根百分比误差(root mean square percentage error,RMSPE)作为评价指标,对比LSTM模型、BiLSTM模型及PCA-BiLSTM模型的预测精度,以验证本文预测方法的有效性. RMSPE的计算公式为
基于PCA方法提取4个台区负荷影响因素主成分后的结果如表2所示.主成分1~4的累计方差贡献率达到87.097%,已基本包含负荷影响因素的全部信息;同时,4个主成分中权重系数最大的外在因素特征依次为预测日的平均温度、日期类型、天气状况、月份.因此,可代替原有9个特征作为输入变量对BiLSTM预测模型进行训练,实现特征降维,进而提升算法的效率.
表2 主成分提取结果
Tab.2 Principal component extraction results
基于2017—2019年的历史负荷数据,计算每个用户3a用电的日负荷均值;进一步通过降采样处理得到周用电量数据.考虑不同用户用电负荷在量级上存在较大差异,对周用电量数据进行归一化处理得
应用GA-FCM方法对归一化后的数据进行特征聚类,得到3类典型用户.图5为各类用户的周用电均值曲线,可以看到3类用户的用电特征差异较为明显,且呈现出季节性波动的特点.
实验过程,选取2017—2019年期间每类用户下所有用户每日的累加负荷作为各自预测模型的训练集;进一步应用预测模型,对2020年每类用户下所有用户的每日累加负荷进行预测.
3.3.1 BiLSTM预测模型分析
为分析两层BiLSTM网络的有效性,应用训练集分别训练单层BiLSTM网络和两层BiLSTM网络的负荷预测模型,并采用SGD进行优化;进一步对比训练过程中每次迭代后的训练集的损失情况,如图6所示.可以看到,两种网络结构均在模型迭代至100次时损失值大幅减小;迭代至700次时,损失值均已趋于平稳,同时基于双层BiLSTM网络模型的损失值更小,表现出更好的预测效果.
图5 用电行为特征聚类结果
图6 预测模型训练集损失
此外,进一步应用SWA算法对基于双层BiLSTM网络的预测模型进行优化.训练过程中,迭代至500次时,损失值趋向平稳,表现出更好的泛化能力.
3.3.2 用户负荷预测结果
面向3类用户,分别构建LSTM预测模型、BiLSTM预测模型及PCA-BiLSTM预测模型,每种模型均采用5层神经网络结构,各层参数设置相同,迭代500次.各类用户的负荷预测结果及3种模型的性能指标对比如图7~图9所示.
由图7~图9可知,相比于LSTM模型,BiLSTM模型和PCA-BiLSTM模型的负荷预测曲线更加贴近实际值,能够准确反映3类用户全年的日用电情况.同时,通过对比分析误差分析数据及BiLSTM模型的预测结果,3类用户的PCA-BiLSTM模型预测结果的MAPE和RMSPE指标均明显下降.因此,进一步说明PCA方法对于模型预测性能具有明显改善作用,在降低数据维度的同时,能够有效提升负荷预测精度.
进一步分析3类用户的用电负荷曲线,得到相应的用电行为特征如下.
(1) 第1类用户的用电负荷曲线呈夏季单峰型(如图7所示),即用电量在7—8月出现显著峰值,其他时段的用电情况较为平稳.结合地区气候特点,推断此类用户在夏季大面积使用空调等电器设备,用电制冷需求较高;而冬季用电制热的需求较小.此群体可对应台区内冬季供暖效果较好的居民用户.
图7 第1类用户负荷预测结果
图8 第2类用户负荷预测结果
图9 第3类用户负荷预测结果
(2) 第2类用户的用电负荷曲线呈冬春交替季单峰型(如图8所示),即用电量在2—3月达到高峰,其他季节用电量波动较小.据此推断,在冬季集中供暖期结束后,该类群体因房屋保温性差,导致用电制热消耗激增.
(3) 第3类用户的用电负荷曲线呈双峰型(如图9所示),即在冬春交替季和夏季月份分别出现一个高峰,且夏季用电需求高峰期的时段更为集中.据此推断,该类用户的夏季制冷和冬季制热的用电需求都较大.
3.3.3 台区负荷预测结果
将以上3类用户的PCA-BiLSTM模型预测结果进行线性叠加,得到所选台区的2020年负荷预测数据.进一步与不区分用电特征类别情况的PCA-BiLSTM模型预测结果进行对比(如图10所示).其中,根据式(17)和式(18)计算可得,所选台区360d内区分用电类别情况预测结果的MAPE指标为4.29%,RMSPE指标为5.09%;不区分用电类别情况预测结果的MAPE指标为5.49%,RMSPE指标为10.04%.可以看出根据用电行为特征将台区全体用户区别开,再分类构建PCA-BiLSTM模型,最后通过叠加得到的负荷预测结果具有更高的精度.因此,分析台区不同类型的用电行为,有助于更加有针对性地制定电力运行和检修等计划.
图10 台区负荷预测结果
本文应用GA-FCM算法对4类典型低压台区中用户的用电行为进行分类,并利用PCA方法提取出5个用电负荷影响因素作为预测模型的特征输入;在此基础上,通过构建BiLSTM模型预测各类用户的中短期用电负荷情况,进而得到各台区的整体负荷曲线.经分析验证得到以下结论.
(1) 低压台区用电负荷的各影响因素之间存在一定的相关性,通过重新组合,可形成4项作为主成分的特征变量,描述整个影响用电负荷的外在因素 系统.
(2) 低压台区中用户的用电行为存在明显差异,依据各类用户的周用电负荷曲线,可分为夏季单峰、冬春交替季单峰和双峰3种类型.
(3) 相比于LSTM模型、BiLSTM模型,PCA-BiLSTM模型负荷预测精度较高,能够精确地反映低压台区各类用户的用电行为;基于用电行为分析的分类预测方法可有效提升预测结果的准确率,具有一定的应用价值.
本文所分析的负荷数据来源于单一地区的用电信息采集系统,未考虑台区网损及地域因素对负荷产生的影响.后续工作将结合不同地区的负荷数据,进一步结合台区网损,开展用电行为特征和外在因素特征的分析工作,实现更为精准的负荷预测,进一步提升预测结果助力电网的高效运行.
[1]李坤,周来,张勇军,等. 基于量测数据质量的低压台区拓扑识别结果可信度评价[J]. 电力系统自动化,2021,45(17):99-107.
Li Kun,Zhou Lai,Zhang Yongjun,et al. Credibility evaluation of topology identification results in low-voltage distribution network based on quality of measured data[J]. Automation of Electric Power Systems,2021,45(17):99-107(in Chinese).
[2]康重庆,夏清,张伯明. 电力系统负荷预测研究综述与发展方向的探讨[J]. 电力系统自动化,2004,28(17):1-11.
Kang Chongqing,Xia Qing,Zhang Boming. Review of power system load forecasting and its development [J]. Automation of Electric Power Systems,2004,28(17):1-11(in Chinese).
[3]Chen B J,Chang M W. Load forecasting using support vector machines:A study on EUNITE competition 2001 [J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.
[4]陈振宇,刘金波,李晨,等. 基于LSTM与XGBoost组合模型的超短期电力负荷预测[J]. 电网技术,2020,44(2):614-620.
Chen Zhenyu,Liu Jinbo,Li Chen,et al. Ultra short-term power load forecasting based on combined LSTM-XGBoost model[J]. Power System Technology,2020,44(2):614-620(in Chinese).
[5]李鹏,习伟,蔡田田,等. 数字电网的理念、架构与关键技术[J]. 中国电机工程学报,2022,42(14):5002-5016.
Li Peng,Xi Wei,Cai Tiantian,et al. Concept,architecture and key technologies of digital power grids [J]. Proceedings of the CSEE,2022,42(14):5002-5016(in Chinese).
[6]徐东升,杨巍,魏哲,等. 基于SPSS的短期负荷特性分析及其预测研究[J]. 电力系统保护与控制,2009,37(21):147-151.
Xu Dongsheng,Yang Wei,Wei Zhe,et al. Application of SPSS in characteristic of short load and its forecasting[J]. Power System Protection and Control,2009,37(21):147-151(in Chinese).
[7]Wang B,Tai N,Zhai H,et al. A new ARMAX model based on evolutionary algorithm and particle swarm optimization for short-term load forecasting[J]. Electric Power Systems Research,2008,78(10):1679-1685.
[8]乔占俊. 基于Census X12-SARIMA模型的中长期负荷预测[J]. 电力系统及其自动化学报,2014,26(1):34-38.
Qiao Zhanjun. Medium and long-term load forecasting based on Census X12-SARIMA model[J]. Proceedings of the CSU-EPSA,2014,26(1):34-38(in Chinese).
[9]Wu Y C,Cheng Z Y,Li M. Med-long term system structure forecasting of power consumption based on grey derived model[C]//Proceedings of 2013 IEEE International Conference on Grey Systems and Intelligent Services(GSIS). Macao,China,2013:142-146.
[10]孙晓璐,肖先勇,尹星露,等. 基于模型有效度的地区电网母线负荷组合预测与系统实现[J]. 电力自动化设备,2014,34(12):106-110.
Sun Xiaolu,Xiao Xianyong,Yin Xinglu,et al. Combination forecasting based on model availability for district network bus loads and its system implementation [J]. Electric Power Automation Equipment,2014,34(12):106-110(in Chinese).
[11]赵峰,孙波,张承慧. 基于多变量相空间重构和卡尔曼滤波的冷热电联供系统负荷预测方法[J]. 中国电机工程学报,2016,36(2):399-406.
Zhao Feng,Sun Bo,Zhang Chenghuui. Cooling,heating and electrical load forecasting method for CCHP system based on multivariate phase space reconstruction and Kalman filter[J]. Proceedings of the CSEE,2016,36(2):399-406(in Chinese).
[12]Sharma S,Majumdar A,Elvira V,et al. Blind Kalman filtering for short-term load forecasting[J]. IEEE Transactions on Power Systems,2020,35(6):4916-4919.
[13]Chapagain K,Kittipiyakul S. Short-term electricity load forecasting model and Bayesian estimation for Thailand data[C]//MATEC Web of Conferences. EDP Sciences,2016,55:06003.
[14]蒋玮,黄丽丽,祁晖,等. 基于分布式图计算的台区负荷预测技术研究[J]. 中国电机工程学报,2018,38(12):3419-3430.
Jiang Wei,Huang Lili,Qi Hui,et al. Research on load forecasting technology of transformer areas based on distributed graph computing[J]. Proceedings of the CSEE,2018,38(12):3419-3430(in Chinese).
[15]吴倩红,高军,侯广松,等. 实现影响因素多源异构融合的短期负荷预测支持向量机算法[J]. 电力系统自动化,2016,40(15):67-72,92.
Wu Qianhong,Gao Jun,Hou Guangsong,et al. Short-term load forecasting support vector machine algorithm based on multi-source heterogeneous fusion of load factors[J]. Automation of Electric Power Systems,2016,40(15):67-72,92(in Chinese).
[16]席雅雯,吴俊勇,石琛,等. 融合历史数据和实时影响因素的精细化负荷预测[J]. 电力系统保护与控制,2019,47(1):80-87.
Xi Yawen,Wu Junyong,Shi Chen,et al. A refined load forecasting based on historical data and real-time influencing factors[J]. Power System Protection and Control,2019,47(1):80-87(in Chinese).
[17]Zhang Z,Hong W C. Application of variational mode decomposition and chaotic grey wolf optimizer with support vector regression for forecasting electric loads[J]. Knowledge-Based Systems,2021,228:107297.
[18]吕海灿,王伟峰,赵兵,等. 基于Wide&Deep-LSTM模型的短期台区负荷预测[J]. 电网技术,2020,44(2):428-436.
Lü Haican,Wang Weifeng,Zhao Bing,et al. Short-term substation load forecast based on Wide&Deep-LSTM model[J]. Power System Technology,2020,44(2):428-436(in Chinese).
[19]朱继忠,董瀚江,李盛林,等. 数据驱动的综合能源系统负荷预测综述[J]. 中国电机工程学报,2021,41(23):7905-7924.
Zhu Jizhong,Dong Hanjiang,Li Shenglin,et al. Review of data-driven load forecasting for integrated energy system[J]. Proceedings of the CSEE,2021,41(23):7905-7924(in Chinese).
[20]韦琦,杨明. 改进神经网络算法的智能电网短期负荷预测[J]. 哈尔滨理工大学学报,2017,22(4):65-69.
Wei Qi,Yang Ming. Short term load forecasting based on improved neural network algorithm[J]. Journal of Harbin University of Science and Technology,2017,22(4):65-69(in Chinese).
[21]张海,李士心,石军,等. 基于串行式GA-BP的短期负荷预测方法[J]. 电力系统及其自动化学报,2021,33(4):97-101,107.
Zhang Hai,Li Shixin,Shi Jun,et al. Short-term load forecasting method based on serial GA-BP[J]. Proceedings of the CSU-EPSA,2021,33(4):97-101,107(in Chinese).
[22]Dong Y,Dong Z,Zhao T,et al. Short term load forecasting with markovian switching distributed deep belief networks[J]. International Journal of Electrical Power & Energy Systems,2021,130(1):106942.
[23]杨甲甲,刘国龙,赵俊华,等. 采用长短期记忆深度学习模型的工业负荷短期预测方法[J]. 电力建设,2018,39(10):20-27.
Yang Jiajia,Liu Guolong,Zhao Junhua,et al. A long short term memory based deep learning method for industrial load forecasting[J]. Electric Power Construction,2018,39(10):20-27(in Chinese).
[24]丁斌,邢志坤,王帆,等. 基于Stacking模型集成的LSTM网络短期负荷预测研究[J]. 中国测试,2020,46(7):40-45.
Ding Bin,Xing Zhikun,Wang Fan,et al. Short-term load forecasting of LSTM network based on Stacking model integration[J]. China Measurement & Test,2020,46(7):40-45(in Chinese).
[25]Wu K,Wu J,Feng L,et al. An attention-based CNN-LSTM-BiLSTM model for short-term electric load forecasting in integrated energy system[J]. International Transactions on Electrical Energy Systems,2021,31(1):e12637.
[26]张智晟,于道林. 考虑需求响应综合影响因素的RBF-NN短期负荷预测模型[J]. 中国电机工程学报,2018,38(6):1631-1638,1899.
Zhang Zhisheng,Yu Daolin. RBF-NN based short-term load forecasting model considering comprehensive factors affecting demand response[J]. Proceedings of the CSEE,2018,38(6):1631-1638,1899(in Chinese).
[27]Ruspini E H. Numerical methods for fuzzy clustering[J]. Information Sciences,1970,2(3):319-350.
[28]Zhang L,Lu W,Liu X,et al. A global clustering approach using hybrid optimization for incomplete data based on interval reconstruction of missing value[J]. International Journal of Intelligent Systems,2016,31(4):297-313.
[29]Varadharajan S K,Nallasamy V. P-SCADA—A novel area and energy efficient FPGA architectures for LSTM prediction of heart arrthymias in biot applications[J]. Expert Systems: The International Journal of Knowledge Engineering,2022,39(3):e12687-1-16.
[30]李滨,陆明珍. 考虑实时气象耦合作用的地区电网短期负荷预测建模[J]. 电力系统自动化,2020,44(17):60-68.
Li Bin,Lu Mingzhen. Short-term load forecasting modeling of regional power grid considering real-time meteorological coupling effect[J]. Automation of Electric Power Systems,2020,44(17):60-68(in Chinese).
[31]Mandal P,Senjyu T,Urasaki N,et al. A novel approach to forecast electricity price for PJM using neural network and similar days method[J]. IEEE Transactions on Power Systems,2007,22(4):2058-2065.
[32]王毅,张宁,康重庆,等. 电力用户行为模型:基本概念与研究框架[J]. 电工技术学报,2019,34(10):2056-2068.
Wang Yi,Zhang Ning,Kang Chongqing,et al. Electrical consumer behavior model:Basic concept and research framework[J]. Transactions of China Electro-technical Society,2019,34(10):2056-2068(in Chinese).
[33]王成亮,郑海雁. 基于模糊聚类的电力客户用电行为模式画像[J]. 电测与仪表,2018,55(18):77-81.
Wang Chengliang,Zheng Haiyan. A portrait of electricity consumption behavior mode of power users based on fuzzy clustering[J]. Electrical Measurement & Instrumentation,2018,55(18):77-81(in Chinese).
[34]Mandal P,Senjyu T,Urasaki N,et al. A novel approach to forecast electricity price for PJM using neural network and similar days method[J]. IEEE Trans Power Systems,2007,22(4):2058-2065.
[35]徐敏,刘中财,严晓,等. 容量增量内阻一致性在线检测方法[J]. 储能科学与技术,2019,8(6):1197-1203.
Xu Min,Liu Zhongcai,Yan Xiao,et al. Online detection method for incremental capacity internal resistance consistency[J]. Energy Storage Science and Technology,2019,8(6):1197-1203(in Chinese).
[36]崔芮华,李泽,佟德栓. 基于相空间重构和PCA的航空电弧故障检测[J]. 中国电机工程学报,2021,41(14):5054-5065.
Cui Ruihua,Li Ze,Tong Deshuan. Arc fault detection based on phase space reconstruction and principal component analysis in aviation power system[J]. Proceedings of the CSEE,2021,41(14):5054-5065 (in Chinese).
[37]李泽文,胡让,刘湘,等. 基于PCA-DBILSTM的多因素短期负荷预测模型[J]. 电力系统及其自动化学报,2020,32(12):32-39.
Li Zewen,Hu Rang,Liu Xiang,et al. Multi-factor short-term load prediction model based on PCA-DBILSTM[J]. Proceedings of the CSU-EPSA,2020,32(12):32-39(in Chinese).
[38]江知航,王艳霞,颜家均,等. 基于BILSTM的棉花价格预测建模与分析[J]. 中国农机化学报,2021,42(8):151-160.
Jiang Zhihang,Wang Yanxia,Yan Jiajun,et al. Modeling and analysis of cotton price forecast based on BILSTM[J]. Journal of Chinese Agricultural Mechani-zation,2021,42(8):151-160(in Chinese).
BiLSTM Load Forecasting Method for Transformer Districts Integrated with Multiple Influencing Factors
Xi Wei1,Cai Tiantian2,Zhang Zhen1,Yu Hao1,Li Peng1
(1. Key Laboratory of Smart Grid of Ministry of Education,Tianjin University,Tianjin 300072,China;2. Digital Grid Research Institute of China Southern Power Grid,Guangzhou 510700,China)
Load forecasting for transformer districts is the key to meeting the power supply-demand balance and hence plays a significant role in guiding the early warning,emergency response,and economic operation of power systems. However,satisfactory short- and medium-term forecasted results for transformer districts are unavailable using conventional methods since the daily load forecasting is affected by various coupling factors. To improve the generalization capability of load forecasting for transformer districts,a bidirectional long short-term memory (BiLSTM)load forecasting model is proposed,which introduces principal component analysis(PCA)and electricity consumption behavior analysis. First,to achieve the dimensionality reduction and information correction of input variables containing redundant,missing,and error components,the PCA method is used to analyze the principal components of preselected external factors that affect the power load. Second,to eliminate the effects of behavior differences,the electricity consumption behavior of different categories of consumers is extracted and grouped using the fuzzy C-means(FCM) method based on genetic algorithm(GA),according to historical data. Third,to improve the generalization capability,BiLSTM forecasting models,which are optimized by the stochastic weight averaging (SWA)algorithm,are established for each category of consumers to forecast the daily load of the entire year. Finally,the load forecasted results for transformer districts are obtained using a linear superposition of load forecasted data from all categories of consumers. Based on the historical data of a low-voltage transformer district in China in the last four years,the forecasted annual electricity consumption of the PCA-BiLSTM model is closer to the real data and better reflects the electricity demand of consumers,compared with those obtained from other conventional LSTM models. Moreover,the classified forecasting method based on PCA and electricity consumption behavior analysis can effectively improve the accuracy of the forecasted results.
load forecasting;feature clustering;principal component analysis;bidirectional long short-term memory network
10.11784/tdxbz202208020
TM715
A
0493-2137(2023)11-1205-12
2022-08-15;
2023-02-20.
习 伟(1980— ),男,博士研究生,xiwei@csg.cn.Email:m_bigm@tju.edu.cn
张 镇,zhangz@tju.edu.cn.
国家重点研发计划资助项目(2020YFB0906000,2020YFB0906001).
the National Key Research and Development Program of China(No. 2020YFB0906000,No. 2020YFB0906001).
(责任编辑:孙立华)