李杰,王秀丽,邵成成,王志成,张航,陈雨甜,王帅
(1.西安交通大学电气工程学院,710049,西安;2.国网经济技术研究院有限公司,102209,北京)
在国内经济中高速增长的背景下,电力消费需求迅速上升,不同地区社会发展水平的差异将会导致电力消费的不同。负荷预测是电网优化调度和规划建设的关键工作,是地区电网规划、运行、调度和运营的重要前提和基础,对于提高电网运行的稳定性和经济性、降低输电线路建设成本和实现电力供需平衡具有重要意义[1]。地区电网负荷预测是工作人员根据电网的实际运行状态,结合当地的政治、经济、人口、气候等各种随机因素的影响,首先对与社会用电量相关的历史数据进行处理和分析,然后寻求电力负荷及其影响因素之间的内在联系,最后建立地区电网负荷预测的模型,根据建立的模型得到未来某一阶段的负荷预测数据,并且对地区的负荷变化趋势进行分析和判断。
电力系统负荷预测方法主要有回归分析法、时间序列分析法、人工神经网络法和指数平滑法等。文献[2]对电力系统负荷预测研究作了综述,并对发展方向进行了探讨;文献[3]对回归分析法在负荷预测中的应用进行了介绍,该方法通过分析负荷的历史数据,建立回归模型,利用回归模型对负荷进行预测,由于回归模型受到影响因素的不确定性影响,所以预测精度往往不尽人意;文献[4]将时间序列分析法和卡尔曼滤波算法组合应用到短期负荷预测,得到了精度较高的预测结果;文献[5-6]对人工神经网络在中长期负荷预测中的应用进行了介绍。
综上所述,目前的负荷预测方法主要有以下不足:首先,模型参数是根据历史数据来确定的,不能考虑地区未来的发展状况;其次,未能充分考虑影响社会用电量的多方面因素;最后,非参数模型的物理意义不明确,当预测偏差较大时,从模型本身进行分析和调整的难度较大。
有鉴于此,本文将研究地区电网负荷预测并提出一种组合模型来提高预测精度。灰色Verhulst模型是用于研究自然界生物S形增长的模型,最终种群数量将趋于饱和状态。灰色系统预测具有预测所需的原始信息较少、计算过程简单、预测结果可检验的优势,所以广泛应用于负荷预测[7]。系统动力学模型通过建立电力消费的子系统来模拟负荷发展趋势,考虑影响负荷变化的主要子系统,通过仿真软件可以得到负荷预测的数据。本文将灰色Verhulst模型和系统动力学模型得到的负荷预测数据按照线性组合方法耦合到最终的负荷预测结果中,组合模型的预测结果既能拟合历史负荷数据,又能考虑电力消费及其子系统的变化趋势。通过最小方差准则得到单一模型的权系数,使得组合模型预测值的方差不大于任意单一模型的,尽可能地提高组合模型的预测精度。
Pierre François Verhulst在1838—1847年期间研究人口变化时,命名了一种常见的S形曲线,即Logistic函数
(1)
式中:P是人口数量;L′是曲线的最大值;k是曲线的增长率;t0是初始时刻。Pierre François Verhulst在人口增长的指数模型dP(t)/dt=kP(t)中加入一个自然资源限制人口发展项,使得人口增长率k随着人口数量P(t)的增加呈现线性下降,即k=A1-A2X(t),从而得到Verhulst模型[8]
(2)
式(2)为一阶自治微分方程,通过分离变量法可以得到解析解
(3)
式中P0为初始值。为了直观地观察人口数量随时间的变化,从几何角度出发,使用MATLAB绘制式(3)(式中参数取值如下:A1=1,A2=3,t0=0,P0=0.1)的方向场,得到几何解如图1所示。
图1 Verhulst模型的积分曲线
灰色系统理论弥补了经典统计分析方法的不足,以部分信息已知、部分信息未知的小样本,贫信息,不确定性系统为研究对象,弥补了采用数理统计方法进行分析时的缺点,对样本数量和样本规律性没有特殊要求,不会出现量化结果与定性分析结果不相符合的情况[8]。
灰色Verhulst模型建模要求原始数据必须等时间间距,处理思路是首先对原始数据进行累加,弱化原始时间序列数据的随机因素,然后建立生成数的微分方程[9]。
设已知序列为x0(1),x0(2),…,x0(n),做一次累加生成新序列x1(1),x1(2),…,x1(n),其中
(4)
由序列x1(k),k=1,2,…,n生成紧邻均值生成序列
(5)
式中0≤α≤1,通常可取α=0.5。建立灰微分方程
x0(k)+az1(k)=b(z1(k))2,k=2,3,…,n
(6)
相应的Verhulst模型的白化微分方程为
(7)
灰微分方程用来得到参数a、b,进而将其代入白化微分方程中得到时间响应x1(t),将式(6)整理为矩阵形式
(8)
将式(8)写为
Ax=η
(9)
(10)
(11)
求解式(11)得到离散的时间响应序列
(12)
将式(12)做一次累减还原得到灰色Verhulst模型原始序列的预测序列
(13)
灰色Verhulst模型实际上是一种以数找数的方法,从系统的一个或几个离散的数列中找出系统的变化关系,是一种试图建立系统连续变化的模型,主要反映事物自身产生、发展和饱和的过程,是对S型饱和负荷曲线的预测[10-11]。
系统动力学是美国麻省理工斯隆商学院的J.W.Forrester在1950年综合了系统理论、控制论、伺服机械学、信息论、决策理论以及计算机模拟所发展出来的,对系统的研究可以划分为以下2步。
(1)根据相关理论将系统S划分为n个相互关联的子系统Si。
(2)对子系统Si进行建模。子系统由基本回路和反馈回路组成,变量主要包含流、积量、率量、辅助变量。
系统动力学对问题的理解,是基于系统行为与内在机制间的相互紧密的依赖关系,透过数学模型的建立与操弄的过程而获得的。系统动力学逐步发掘出产生变化形态的因果关系,称之为结构。结构是指一组环环相扣的行动或决策规则所构成的网络。
本文基于相关文献的研究,选取电力消费影响因子如下:国内生产总值(GDP)、人口数量、人口结构、三产用电、生活用电、再电气化进程、能源替代效应等。对电力消费影响因子采用平稳性检验、协整检验、因果检验[12]。通过电力消费影响因子的聚类分析,可以将地区电网负荷预测系统分为4个子系统:经济子系统、人口子系统、能源替代与再电气化子系统、电力消费子系统,图2展示了各个子系统之间的拓扑结构关系。
图2 系统拓扑结构
(1)经济子系统。经济子系统通过有技术进步的索洛增长模型[13]推导得到。本文首页OSID码中的开放数据附录A详细介绍了索洛增长模型。
经济子系统方程设计为
(14)
式中:ΔI为投资增量;IR为投资率;AD为资产折旧率;A为资产;ΔE为就业增量;ΔL为劳动人口增量;LR为劳动增长率;ΔW为工资增长量;SMOOTH和DELAY3为仿真软件Vensim PLE中的函数,详细定义见本文首页OSID码中的开放数据附录B;WG为工资增长率;WB为工资初始值;ΔTR为技术增长率;T为技术初始值;T′为设置的负荷预测时间长度(a);ΔGi为第i产业国内生产总值增量;ΔG为国内生产总值增量;G为经济体初始国内生产总值。
(2)人口子系统。以外生人口增长模型[14]为基础,模拟人口数量和结构的变化对GDP和电力消费的影响。人口数量和城市化进程影响到各产劳动人口,从而使人口子系统与经济子系统产生联系,人口数量影响到生活用电,从而使人口子系统与电力消费子系统产生联系。
人口子系统方程设计为
(15)
式中:MGR为人口机械增长率;INTEG和DELAY1为仿真软件Vensim PLE中的函数,详细定义见本文首页OSID码中的开放数据附录B;Iav为人均GDP影响因子;NGR为人口自然增长率;Nini为人口自然增长率初值;UGR为城市化率;P2、P3分别为第二产业、第三产业劳动人口数量;Pini为当前时间人口数量初始值;EL为生活用电;Tav为年平均气温。
(3)能源替代和再电气化子系统。文献[15-16]分别对我国再电气化进程和能源替代效应作了相关介绍。能源替代和再电气化子系统主要模拟发电侧新能源接入和用电侧电能广泛使用,通过分布式能源发电量与电力消费子系统联系。能源替代和再电气化子系统方程设计为
ERE=EPO+ln(PV+HY+WP)
ECL=INTEG(ERE+ECED)
EFE=INTEG(EUL+EFED)
ERN=(ECL+EFE)e-4
(16)
式中:ERE为能源替代效应;EPO为能源政策影响力;PV、HY、WP分别为光伏、水电、风力发电量增长率;ECL为清洁能源发电量;EFE为化石能源发电量;ERN为再电气化速率。
(4)电力消费子系统。电力消费子系统主要模拟三产用电、生活用电、分布式能源发电量对最终电力消费的影响。计量经济学是以数理统计为基础,运用大量数据资料,建立数学模型定量分析经济变量相关关系的学科。本文首页OSID码中的开放数据附录C对其中用到的理论技术进行了说明,使用计量经济学方法分析GDP、电力消费、资产、劳动人口之间的协整关系和因果关系。
本小节将研究电力消费和经济增长之间的协整关系,并通过因果检验分析电力消费是否会引起经济增长、衰退,亦或是二者都有。基于本文首页OSID码中的开放数据附录C的方法,对GDP、电力消费、资产、劳动人口数据的协整关系进行检验,JJ协整检验结果如表1所示。结果表明,在5%显著性水平上最少存在一组协整关系。
表1 采用JJ协整检验的结果
协整检验后还需要判断变量间的因果关系及方向。首先对时间序列变量进行平稳性检验,对GDP、电力消费、资产、劳动人口进行单位根检验,结果表明这些序列是一阶单整的。基于本文首页OSID码中的开放数据附录B中的方法,对GDP(G′)、电力消费(E)、资产(A)、劳动人口(L)间的因果关系进行检验,Granger因果检验结果如表2所示,结果表明,电力消费和GDP、资产在10%置信度水平上存在双边Granger因果关系,但不存在从GDP到电力消费的因果关系。
表2 采用Granger因果检验的结果
由于影响电力消费的因素太多,如果把所有因素都考虑进系统动力学模型,那么不仅会使模型变得复杂,而且精度也可能会随着远离当前年而降低,所以本小节利用相关性检验的方法找出主要的影响因素,由检验结果得到电力消费方程[17],检验结果如表3所示。
表3 电力消费与其影响因素的相关性
由表3的检验结果可得
(17)
(18)
组合模型残差为
r=w1r1+w1r2
(19)
残差的方差为
2w1w2cov(r1,r2)
(20)
式中cov(r1,r2)为残差r1和r2的协方差。var(r)对w1求极小值,得到
(21)
显然可取单一模型之间的协方差为0,且有w1+w2=1,则组合模型的权系数分别为
(22)
将组合模型方程带入仿真软件Vensim PLE中,可以得到三产用电、生活用电和不同地块负荷的预测结果,组合模型如图3所示。
图3 地区电网负荷预测的组合模型
处理负荷历史数据得到累加新序列和紧邻均值生成序列,求解灰微分方程得到最小二乘参数,将其代入到白化微分方程中,求解得到负荷预测的离散时间响应序列,进行一阶累减还原得到灰色Verhulst模型的预测值。处理经济子系统和人口子系统时,将索洛增长模型和Logistic人口增长模型得到的方程代入系统动力学模型中,处理电力消费子系统时,对电力消费及其影响因素进行平稳性检验、协整检验和因果检验,通过EViews软件得到电力消费方程并代入到系统动力学模型中。用最小方差准则得到单一模型的权系数,得到组合模型的电力消费方程,使用仿真软件Vensim PLE得到各产用电、单一模型预测值和组合模型预测值。基于组合模型的地区电网负荷预测的流程如图4所示。
图4 基于组合模型的地区电网负荷预测流程
高,因此灰色Verhulst模型更适用于负荷近似按照S形曲线变化的地块的饱和负荷预测。
以枣庄市2003—2013年各区(市)社会用电量为负荷历史数据,采用组合模型进行各地块负荷预测,得到2014—2018年所有地块在不同预测方法下的预测结果和各个产业用电量数据,分别如表4和本文首页OSID码中的开放数据附录D所示。模型1为灰色Verhulst模型,模型2为系统动力学模型,文中组合模型需要的所有数据均来源于枣庄市统计局。
表4 不同预测模型下的用电量比较 104 kW·h
单一灰色Verhulst模型和单一系统动力学模型能够提供不同的有用信息,组合模型能够综合利用这些信息,更充分地利用原始数据,从而提高预测精度。因为在组合模型设计时采用最小方差准则来确定灰色Verhulst模型和系统动力学模型的权系数,所以组合模型残差的方差不大于任一单一模型残差的方差,并且组合模型预测值的残差介于灰色Verhulst模型和系统动力学模型预测值的残差之间,能够减少单一模型带来较大预测残差的风险,不同模型的预测精度比较结果如表5所示。
表5 不同预测方法下的预测精度比较 %
系统动力学能够直观地描述系统,并且模型的参数物理意义明确,所以可以用于研究结构、功能和行为之间呈现辩证统一关系的复杂系统[18]。系统动力学模型具有非线性、高阶次、多变量的特点,能够充分地将影响社会用电量的因素考虑在内,为中长期负荷预测提供了系统性和动态性更强、因果反馈关系更明确的解决思路,适用于结构复杂、原始信息丰富、各个子系统之间联系紧密的负荷预测。灰色Verhulst模型是一种不严格的系统方法,它避开了对系统结构进行分析的环节,直接通过对原始数据的累加构建负荷的饱和增长模型,预测所需的原始信息较少、计算过程简单,适用于原始数据缺乏、负荷按照S形曲线变化的饱和负荷的预测。组合模型可以综合利用单一模型的所有信息,采用最小方差准则的方法确定权系数,使得预测曲线更加平滑,预测误差介于各单一模型误差之间,减少了使用单一模型带来较大预测误差的风险,适用于原始信息丰富的饱和负荷的预测。
枣庄市面积4 564 km2,下辖5个市辖区,代管1个县级市,人口422.56万,2017年地区社会用电量为1 352 071×104kW·h,第一产业用电量为21 905×104kW·h,第二产业用电量为936 760×104kW·h,第三产业用电量为184 435×104kW·h,全市社会用电量以第二产业为主。
滕州市作为全国百强县,人口众多,经济以轻工业、生产加工业、煤炭等相关产业为主,服务业等第三产业发展较为落后,在经济构成中占比不足四成,属于典型的工业化中后期产业结构。滕州市社会用电量的历史数据分析表明:滕州市一直占据枣庄市近半的社会用电量,滕州市历史社会用电量及其相关影响因素等参数稳定,滕州市产业结构成熟,电力消费会逐渐趋于饱和,使用灰色Verhulst模型进行负荷预测时,预测曲线更加符合滕州市社会用电量的变化趋势,预测精度相对于系统动力学模型也较高新区始建于1988年,辖内人口仅15万,经济主要以高新技术等第三产业为主,经济发展增速较快,社会用电量占枣庄市比重最低,影响电力消费的因素具有较大的波动性,使用系统动力学进行建模分析时,能够综合考虑影响社会用电量的因素,将政策因素、人口流动、产业结构、技术进步等要素考虑在模型内,充分利用高新区的原始信息,紧密联系各个子系统,因此系统动力学更适用于影响社会用电量的因素有较大变动的地区负荷预测。
市中区经济发展较好,人口众多,产业结构稳定,主要以第二产业、第三产业为主,经济、人口、电力消费等历史数据变化较为平稳,在不增加复杂性的基础上,组合模型能综合利用单一模型的所有信息,得到较单一模型更高的预测精度,适用于参数变化较为平稳的饱和负荷的预测。
本文通过提出一种组合模型来对地区电网负荷进行预测,通过仿真软件Vensim PLE对实际算例进行了仿真,对不同模型的适用性进行了分析,得到如下结论。
(1)单一灰色Verhulst模型没有直接分析系统结构,而是通过对原始数据的累加得到负荷变化趋势,因为考虑的原始信息较少,所以预测精度可能难以满足实际需求,并且容易达到饱和状态。
(2)单一系统动力学模型通过模拟子系统的变化趋势来预测地区电网负荷,预测结果的总体变化趋势和实际负荷变化趋势一致,但是由于没有直接利用负荷历史数据,系统动力学模型中本身有很多待预测和逐年不断滚动修正的变量,所以预测精度往往有所偏差。
(3)组合模型在不增加复杂性的基础上,综合利用了单一模型的所有数据,丰富了模型信息,通过最小方差准则确定单一模型的权系数,使组合模型预测值残差的方差不大于任一单一模型预测值残差的方差,得到的负荷预测曲线更加平滑,减少了单一模型容易产生较大预测误差的风险,尽可能地提高了预测精度。