孙晓璐,肖先勇,尹星露,黄 静
(1.四川大学 电气信息学院,四川 成都 610065;2.国家电网成都供电公司,四川 成都 610021)
负荷预测是古老而常新的课题。地区电网母线负荷预测,作为负荷预测的组成部分,在220 kV电网归口地区电网调度运行后,对于地区电网确定运行方式、进行安全校核等具有重要意义。不同地区、不同电压等级的母线负荷变化规律差异很大,电压等级越低,分散性和不确定性越强,预测难度很大。针对负荷的分散性和不确定性,为弥补单一预测方法的不足,组合预测被公认为是一种合理选择,因此,深入研究模型选择和组合模型确定方法,具有重要的理论价值和现实意义。
国内外对负荷预测已开展了大量研究,方法可分为单一模型预测法和组合预测法,已在预测模型与算法、预测效果评价、模型评价、组合策略等领域取得了大量成果。已提出的单一预测法有最小二乘、回归分析、时间序列、卡尔曼滤波、人工神经网络[1]、趋势外推[2]、灰色系统等方法[1-3];提出的预测效果评价法有偏差分析法、残差分析法、回归差分析法、相对误差分析法等[1];提出的模型评价法包括均方差误差法、平均绝对误差法、Diebold-Mariano 检验法等[4]。现有评价指标主要采用均值指标、稳定性指标和综合指标等[5]。组合预测的研究重点是组合模型和组合策略[6-12],现有研究建立了丰富的预测模型库[7],并认识到模型及其参数对组合预测结果影响很大[13]。事实上,各种预测模型均有自身特点和优势,组合预测的目的在于综合利用各模型的优点。为此,需在研究预测模型评价准则的基础上,提出合理的组合策略。遗憾的是,现有研究大多基于误差理论,用预测结果的均值代替预测真值,认为拟合精度等同于预测精度,忽略了预测期内的负荷真值未知、难以获得真实误差的事实[14-18],预测误差同时受模型和样本的影响,因此,误差如果作为模型评价准则,必然也受样本影响。为了减少样本对模型评价的影响,需研究能更好地反映预测模型固有属性的评价准则,并基于该准则进行模型选择和组合预测[18-20]。
为了避免样本对模型评价和选择的影响,在分析误差理论的基础上,引入模型有效度概念,提出模型有效度评价准则;提出一种基于关联度指标的模型选择方法;提出组合模型集确定方法和基于虚拟预测和灰色理论[1,13]的模型有效度预测方法;详细研究了模型选择和组合预测算法[21];基于C#平台开发了预测系统,并将该系统应用于某地区电网。结果表明,本文方法正确、合理,具有工程应用价值。
设母线负荷序列为{x(t),t=1,2,…,N,N+1,…,N+T}(N为负荷样本数,T为负荷预测值个数),每15 min取一个值,每天96个点。将该序列分为[1,N]和[N+1,N+T]2 个区间,前者为样本区间,后者为预测区间。设有m种单一预测模型,fj(t)为模型j在第 t点的预测值,ej(t)=[x(t)-fj(t)]/x(t)( j=1,2,…,m)为第t点的相对误差。模型j在第t点的拟合精度和预测精度定义为:
其中,tє[1,N]时 Aj(t)表示拟合精度,tє[N+1,N+T]时 Aj(t)表示预测精度。
由式(1)可见,由于影响负荷预测的因素很多,误差 ej(t)具有随机性,Aj={Aj(t),t=1,2,…,N+T}可以视为由di日内各时刻模型j的拟合精度与预测精度构成的随机变量序列,其数学期望和均方差分别为:
其中,l取 1、n 取 N(对应 t=1,2,…,N)和 l取 N+1、n取 T(对应 t=N+1,…,N+T)时,E(Aj)、σ(Aj)分别为模型j的拟合精度的数学期望、均方差与预测精度的数学期望、均方差;Q(t)为各时刻精度的加权系数。当先验信息未知时,可取,则:
模型j在di日的有效度定义为:
对应于区间[1,N]和[N+1,N+T],Mj(di)分别为拟合有效度和预测有效度[18]。拟合有效度反映了模型对样本的拟合水平,预测有效度反映了模型的预测有效性。 Mj(di)随 E(Aj)增加而增加,随 σ(Aj)增加而减少,更好地反映了模型的固有属性。
传统方法中采用的误差同时受样本和模型的影响,以模型有效度作为预测模型的评价准则,能更好地反映模型属性,规避样本(影响小)干扰,更有利于在组合预测中体现单一模型的优点。
基于预测期内的母线负荷真实值未知的事实,基于虚拟预测思想[1,13],将历史时期分为历史模拟区间G和虚拟预测区间V。虚拟预测区间的选取准则为:近期 k 个相似日组合,表示为 V= [d1,…,di,…,dk],每日负荷点数为96个点。根据模型j对虚拟预测区间内第di日的预测值和实际值,用式(1)—(5)可求得第di日的有效度Mj(di),在区间V内可构成有效度序列Mj:
序列Mj反映了区间V内模型j的有效度变化规律,但实际中可获得的样本有限,所幸母线负荷预测更关注未来一天的母线负荷,对更远期母线负荷的关注度不是很高,灰色理论中的GM(1,1)模型能较好地满足样本有限且对近期预测结果要求高的需要,因此,本文用GM(1,1)模型预测未来一天的模型有效度,具体算法见文献[22]。将第dk+1日的模型有效度预测值表示为,所有模型有效度预测值可构成一个序列,可作如下归一化处理[23]:
显然w(j)体现了预测日(第dk+1日)各模型的优劣程度。w(j)越大,模型越有效。第dk+1日及以后预测日可类似地处理。如果用m个单一模型进行组合预测,各模型的组合权重系数就是w(j)。尚存在组合模型的选择问题。
为了选择组合模型,本文引入组合模型集的概念,将其定义为实际参与组合预测的所有单一模型构成的集合。利用文献[24]提出的关联度法选择组合模型集中的单一模型,具体方法如下。
设母线负荷序列为:
模型 j(j=1,2,…,m)的预测结果序列为:
定义
为x0与xj在第t点的关联系数。其中,为x0与xj的绝对差;为两级最小差;为两级最大差;ρє[0,1]为分辨系数,根据文献[24],通常取 ρ=0.5。
综合各时刻关联系数,得xj与x0的关联度rj:
将所有备选模型的关联度从大到小排序,选择前m′个模型构成组合模型集,一般m′取值3~5。实际中,可根据经验或以综合有效度最大为目标,经优化确定m′取值。关于组合模型集中模型个数的最优确定,尚值得进一步研究。
利用提出的组合模型集确定法、模型有效度预测法和基于模型有效度归一化系数的组合预测权重系数确定法,研究了地区电网母线负荷预测算法,具体如下:
a.用备选预测模型库中各单一模型预测相似日虚拟预测区间的母线负荷,由式(10)、(11)计算模型关联度rj;
b.对rj按从大到小排序,选择前m′种模型构成组合模型集,本文默认值为m′=3,实际可根据需要进行调整,也可经优化确定(具体尚需研究);
c.用式(1)—(5)计算组合模型集中各模型的有效度,并用GM(1,1)灰色模型预测待预测日模型有效度;
d.用式(7)计算组合模型集中各模型的归一化系数,并作为组合预测的组合权重系数;
e.用组合模型进行母线负荷预测,并求出组合预测结果。
组合预测流程如图1所示。
图1 组合预测流程Fig.1 Flowchart of combination forecasting
系统实现思路见图2。基于C#平台开发适用于地区电网220、110、35 kV母线负荷预测的系统。系统有9种备选模型(还可根据需要增加):点对点倍比法(f1)、倍比平滑法(f2)、重叠曲线法(f3)、变化系数法(f4)、一元回归法(f5)、频域分解法(f6)、模型识别法(f7)、相似度外推法(f8)和灰色系统法(f9)。 系统默认组合模型集的模型数设为m′=3(还可进一步研究m′的优化确定方法)。除实现本文算法外,系统还有数据预处理、参数自适应训练等功能,不再赘述。
图2 母线负荷预测的基本思路Fig.2 Basic concept of bus load forecasting
将所开发的预测系统应用于某地区电网。以相似日为样本,预测2012年9月1日到7日某110 kV母线负荷。可选模型在待预测日的关联度如表1所示,9月1日到9月7日的组合模型集分别为{f3f7f8}、{f3f7f8}、{f3f7f8}、{f3f7f8}、{f2f7f8}、{f3f8f9}、{f3f6f7};组合预测的权重系数如表2所示。9月1日到9月7日共96×7=672个点的预测结果,如图3所示。
表1 本文方法确定组合模型集所用关联度值Table 1 Correlation degrees used for combination model set determination
表2 本文方法的组合权重系数Table 2 Combination weight coefficients ofproposed method
图3 负荷预测曲线与实际负荷曲线对比图Fig.3 Comparison between forecasted and actual load curves
为了验证本文方法所得结果的准确率,将本文方法预测所得待预测日的准确率与最优单一模型预测(最优模型)、方差综合分析组合法(组合模型1)、最优预测组合法(组合模型2)、拟合有效度组合法(组合模型3)进行比较,结果如表3所示。其中,模型j在待预测日的预测准确率定义为:
由表3可见,组合预测提高了预测准确率,且本文方法的平均准确率比现有方法高。本文方法的预测准确率比最优模型预测法提高了1.29%,比组合模型 1、2、3方法分别提高了 1.16%、1.09%、1.23%。在最靠近样本的9月1日,准确率至少提高了3.88%,符合地区电网母线负荷预测更关注未来一天预测准确率的要求。从预测结果更优天数看,本文方法相对于方差综合分析组合法、最优预测组合法,更优天数分别为6 d和4 d,相对于拟合有效度组合法,更优天数为5 d,证明了本文方法的有效性。
表3 预测准确率比较Table 3 Comparison of forecasting accuracy
为了进一步验证提出的组合模型集确定方法的合理性,将未经模型选择和经模型选择的结果的准确率进行比较,如表4所示。
表4 未经模型选择组合方法和本文方法预测结果比较Table 4 Comparison of forecasting results between unselected combination model and proposed model
可见,经模型选择后,准确率更优的天数为5 d,其余2 d非常接近,7 d平均预测准确率从91.97%提高到了93.45%。
a.基于关联度的组合模型集确定法,在保证预测结果准确率的前提下,减少了模型冗余,降低了组合预测的复杂性;
b.以模型有效度为预测模型评价准则,更好地体现了参与组合预测的模型的固有属性,有利于组合模型的选择;
c.基于GM(1,1)灰色模型的模型有效度预测法能准确预测近期模型有效度,可满足地区电网母线负荷预测的需要;
d.基于模型有效度的组合预测方法,以被组合模型与样本的关联度和模型有效度为准则,提高了组合预测的准确率,在实际应用中得到了证明。
地区电网母线负荷预测的影响因素复杂,如何结合实际,进一步考虑计划检修、气象与地理信息、地区经济结构与负荷结构,以及负荷转移等因素的影响,进一步研究组合模型集最优确定方法等,是值得研究的课题。