基于混沌理论的电力系统短期负荷预测的局域模型

2013-07-26 11:05李文启文福拴刘伟佳
关键词:相空间局域延迟时间

何 洋,邹 波,李文启,文福拴,刘伟佳

(1.河南省电力公司,河南 郑州450052;2.浙江大学 电气工程学院,浙江 杭州310027)

0 引 言

短期负荷预测是安排电力系统运行方式的基础,其预测精度直接影响系统运行的安全性和经济性。短期负荷预测主要用于预报未来几h,1 天至几天的负荷,对调度部门开展经济调度和制定机组最优组合具有重要作用[1]。负荷预测精度对电力系统运行的安全性和经济性具有重要影响。

在过去的30 多年间,国内外电力工作者在短期负荷预测方面做了大量研究工作,提出了包括时间序列法[2,3]、回归分析或人工神经元网络法[4]、专家系统法[5]、模糊集合方法[6]以及组合预测方法[7]等,但这些方法在对影响负荷的不确定因素的模拟方面还有局限,目前主要采用概率方法和模糊集方法。事实上,负荷预测受各种社会、自然因素影响,很难准确建模,因此要准确预测也就相当困难。

混沌是一种由确定性系统产生、对初值条件敏感的非周期运动,其反映确定性系统的内在随机性[8]。混沌行为中奇怪吸引子的存在,使得其可用于短期预测;而混沌所固有的初值敏感性,使得其不适合做长期预测。近年来,已有应用混沌理论进行预测包括电力短期负荷预测的研究报道。

文献[9]较早地将混沌理论引入电力短期负荷的预测中,运用混沌特征量Lyapunov 指数进行短期负荷预测。文献[10,11]基于混沌理论,采用局域线性预测方法,将相空间中与预测中心点的欧氏距离小于某一阈值的相点即最近邻域点作为辨识预测模型参数的基础,再利用如此得到的模型进行预测。文献[12]在确定最近邻域点时,首先通过欧氏距离确定可选邻域点,然后根据邻域点与预测中心点的关联度(即曲线间的相似程度)大小更新邻域点,从而提高了局域模型的预测精度。文献[13]提出了基于混沌理论的自适应预测模型,其中采用了模拟进化算法进行优化,从而能够根据学习和训练的结果优化非线性反馈项。文献[14]将混沌理论、关联度和人工神经元网络相结合进行短期负荷预测;文献[15]综合评估了几种基于混沌理论的短期负荷预测方法,包括局域预测法、回归分析法、Lyapunov 指数预测法、混沌卡尔曼滤波法、混沌神经元网络模型以及混沌小波网络模型等。

基于Lyapunov 指数的预测模型的精度受限于Lyapunov 指数的求解精度;基于专家系统、模糊推理等人工智能方法的预测模型在相当程度上取决于专家的经验。在基于混沌理论框架下发展的根据邻近点演化规律进行局域线性预测的方法则具有广泛的适应性。

在上述背景下,本文首先概述了混沌相空间重构理论,并由电力负荷时间序列重构出一个未改变吸引子拓扑结构的相空间;通过分析时间序列连续功率谱和计算最大Lyapunov 指数来检验混沌特性,从而为采用混沌理论进行短期负荷预测提供理论基础;之后,基于局域线性预测模型和广义自由度方法确定最邻近点数,进而进行短期负荷预测。最后,采用某实际电力系统2007年3月1日至5月14日的实际负荷数据为历史样本,对5月15日24 个时刻的负荷进行预测,说明了所发展的负荷预测模型的准确性。该算例的负荷历史数据列于附录(略)。

1 电力短期负荷时间序列的相空间重构

1.1 相空间重构理论

电力负荷受到诸如气温、节假日、季节等多种因素的影响,呈现出十分复杂的变化特点。图1为某地区2007年3月1日至5月14日的实际负荷数据,其变化曲线展现出了不规则的变化行为。

在负荷序列貌似随机的背后,隐藏着一定的规律性,即其演化过程展现出一种混沌行为,而不是通常认为的完全随机行为。这样,借助混沌理论,可以揭示负荷时间序列内在的规律性,对其演化过程进行分析和预测。

基于时间序列数据研究混沌问题,始于美国科学家N.H.Packard 等人提出的相空间重构理论[16]。在20 世纪80年代,荷兰数学家F.Takens证明了可以找到一个合适的嵌入维数,如果延迟坐标的维数m≥2d +1 (d 为动力系统维数),则在这个嵌入维空间中可以把有规律的轨迹(即吸引子)恢复出来[8]。

Takens 定理:若某动力系统的状态空间是一个d 维流形M,则动力系统可表示为一光滑映射φ:M →M,构造二阶可导观测函数y 将M 中任一点映射到某实数,即y :M →R,则存在微分同胚映射φ(φ,y):M →R2d+1,其中:

称φ(φ,y)是M 到R2d+1的一个嵌入。

图1 某实际电力系统2007年3月1日至5月14日电力负荷波动曲线Fig.1 Load fluctuation curves of an actual power system from March 1,2007 to May 14,2007

按照Takens 定理,可以在拓扑等价意义下恢复吸引子的动力学特性。把观测到的N 个负荷数据记为一个单变量时间序列{x1,x2,··,xN},将其嵌入延迟时间为τ 的m 维相空间,则相空间中的相点表示如式(2)所示。

式中:Yn为相点;τ 为延迟时间;m 为嵌入维数;重构相空间点数为M=N–(m–1)τ,n=1,2,··,N–(m–1)τ。

在相空间重构的过程中,合理选择延迟时间和嵌入维数是非常关键的,否则有可能脱离微分同胚的原则。F.Takens 认为τ 和m 在理论上是相互独立的,可分别进行选择。

1.2 延迟时间τ 的选择

根据Takens 定理,对于无限长且没有噪声的时间序列,延迟时间τ 的选取就没有限制。然而,大量的数值实验表明相空间的特征量依赖于延迟时间的选择,通常采用的选取原则为使其在统计意义上为独立的尽可能小的值。在实际应用中所采用的最佳延迟时间选取方法主要包括互信息法、信息熵法、自相关法等。本文后面采用了互信息法[17]。

互信息法是估计重构相空间延迟时间的一种有效方法,它克服了自相关法仅能提取序列间的线性相关性和很难应用于高维混沌系统的缺点,取互信息函数的第一个极小值点为延迟时间τ。

对于时间序列{x1,x2,··,xN}和延迟时间τ的时间序列{x1+τ,x2+τ,··,xN+τ},设xi在{x1,x2,·,xN}中出现的概率为p(xi),xi+τ在{x1+τ,x2+τ,·,xN+τ}中出现的概率p(xi+τ),xi和xi+τ在两个序列中共同出现的联合概率为p(xi,xi+τ)。p(xi)和p(xi+τ)可以通过计算在相应的时间序列中所出现的频率得到,p(xi,xi+τ)则可以在平面(xi,xi+τ)上计算对应点对出现的频率得到。这样,相应的互信息就是延迟时间τ 的函数:

该函数可以度量相继测量结果的依赖性。从τ=1 开始,选择使I(τ)取得首次极小值的τ作为延迟时间。对于附录中(略)列出的算例采用互信息法计算得到图2 所示结果,得到延迟时间τ=5。

图2 用互信息法确定延迟时间的例子Fig.2 An example of determining the delay time employing the mutual information method

1.3 嵌入维数m 的确定

根据Takens 定理,对于无噪声、无限长的数据序列,只要取嵌入维数m 大于关联维数的最小整数即可。但对长度有限且具有噪声的数据序列,嵌入维数m 要比关联维数大得多。通常采用的确定原则为能够充分描述由时间序列给出的原系统动力学行为的最小嵌入维数。

目前常用的求取最佳嵌入维数的方法包括:关联指数饱和法、伪最邻近点法[18]、真实矢量法等。其中,关联指数饱和法中最常用的为由Grassberger 和Procaccia 提出的所谓G-P 算法[19],本文也采用此方法确定嵌入维数。

关联维数是一种分形集维数,其对选取重构相空间嵌入维数有着举足轻重的作用。一般而言,如果时间序列来源于混沌吸引子,则该序列的关联维维数随着嵌入维数的增大而趋于饱和,在关联维数饱和时的值即为最佳嵌入维数。相关计算步骤参见文献[19],这里不再赘述。对附录(略)中的算例数据进行计算,得到图3 所示的关联函数C(ε)和欧氏距离极限ε 的对数关系曲线,然后对线性区域的线段用最小二乘法进行线性拟合,得到图4 所示的关联维数D(m)随着嵌入维数m 变化的曲线。

图3 lnC( m,ε) -lnε 曲线Fig.3 lnC( m,ε) vs lnε curves

图4 D( m) -m 曲线Fig.4 D( m) vs m curve

随着嵌入维数m 的增加,关联维数D(m)逐渐趋于饱和;当嵌入维数m=6 时,关联维数基本不变,且D(m)=2.42 为非整数,具有分数维的吸引子,这表明负荷的演化具有混沌特性,同时m=6 的选取也满足m >2D+1 的要求。

2 混沌时间序列的确定性检验

为验证引起时间序列复杂变化的支配因素是内在的确定性动力学机制,而非外在的随机因素,本节采用功率谱法和Lyapunov 指数法进行混沌特性的确定性检验。

2.1 功率谱方法

功率谱表示随机运动过程在各频率成分上的统计特性,是研究随机振动的基本工具。

对于时间序列{x1,x2,··,xN},设其附加周期性条件为xN+i=xi,则该时间序列的离散功率谱为

式中:Pk表示第k 次频率分量被称为自关联函数。

对于周期运动的功率谱只有在运动频率、分频和倍频处才会出现离散谱线;对于准周期运动的功率谱则在几个不可通约(即数值之间不存在公约数)的基频及它们的叠加处具有离散谱线;而混沌运动的功率谱为连续谱,即出现噪声背景和宽峰。对于附录(略)中列出的算例进行功率谱分析,局部放大之后如图5 所示。

图5 负荷时间序列功率谱图Fig.5 Power spectrum graph of load time series

由图5(a)可以看出,谱图变化剧烈,存在多峰、宽峰和噪声背景,这说明负荷时间序列不是简单的周期序列,而是复杂的非线性序列,具有随机运动特性。由图5(b)的周期-功率谱图可以发现,其平均周期T =24 h,这与实际情况相符合。

然而,功率谱分析只能确定该负荷时间序列是随机的,却无法确定该随机运动是由外界的随机扰动引起的,还是确定性非线性系统的内禀随机性。这样,就需要采用其它方法诸如Lyapunov指数进行判断。

2.2 Lyapunov 指数法

Lyapunov 指数(Lyapunov exponent,LE)是相空间中邻近轨道的平均指数发散率的数值表征,用以刻画混沌运动的初态敏感性。在识别混沌运动时往往只需计算最大LE 即可,若最大LE 为正,则系统具有初态敏感性,其运动呈现混沌状态。

目前计算LE 的主要方法为轨道跟踪法。这种方法直接从LE 的定义出发,通过跟踪相空间中的两条轨道来获取LE。轨道跟踪法[20]自从1985年被A.Wolf 提出以来,已经取得了很大的进展,最具代表性的是M.T.Rosenstein 等人提出的小数据量算法[21]。这种方法因为具有对小数据组比较可靠、计算量较小且较易操作等优点,而得到了广泛使用。相关计算步骤的细节可见文献[21,22],这里不再赘述。

对附录(略)中的算例进行计算可得到如图6所示的混沌轨道指数发散平均值同演化步长的关系。图6 中虚线框内的曲线由于演化时间步长过大,不满足指数增长规律,因此可以去掉,而只对前面线性部分进行拟合,得到如图7 所示的拟合图形。如此线性拟合得到的Lyapunov 指数λ1=0.017 7,其为正数说明负荷时间序列是混沌的;同时可知,此负荷序列的最长可预报时间为T=1/λ1=56 h,即在利用该时间序列进行预测且保证精度满足要求的情况下,最大可预测时间为56 h。

图6 小数据量Lyapunov 指数计算结果Fig.6 Results of the Lyapunov exponent using a small set of data

图7 Lyapunov 指数的线性拟合图Fig.7 Linear fitting graph of the Lyapunov exponent

3 混沌局域线性预测模型

局域法是把相空间轨迹的最后一点作为预报点,对预报点邻域的若干相点的关系进行拟合,再对预测相点的未来演化规律进行预测。

3.1 预测思想

现假设xN为已知点,xN+1为需要预测量,则包含这两个分量的最新相空间相点为:YM=(xM,xM+τ,…,xM+(m-1)τ)T,YM+1= (xM+1,xM+1+τ,…,xM+1+(m-1)τ)T,其中M=N–(m–1)τ 为重构的相空间的相点数。

按照相空间的演化轨迹,只要获得相点YM的下一轨迹点YM+1,并从中分离出唯一未知量xN+1就完成了该值的预测。通常通过拟合预测中心点YM的k 个最近邻域点来得到YM+1。可以采用欧氏距离法确定最近邻域点,即

进而确定各最近邻域点的下一演化轨迹点Yj+1的演化规律,这里采用一阶线性关系来描述,即存在映射f 使得:

式中:A 和B 分别为拟合参数向量和矩阵,均为待求值。

在局域预测中,Yj与Yj+1的演化规律也适用于YM和YM+1,则

因此预测模型为

式中:xM+(m-1)τ即为xN。

现在的问题是如何求取式(7)中的各未知参数。由式(6)可得:

3.2 最近邻域点数的确定

在局域线性预测模型中,最近邻域点的个数影响局域模型的预测精度和计算量。邻域点个数k 取的太少或者邻域半径r 取的太小,邻域点数将会过少,此时不能充分利用历史信息,且噪声的影响会增大;邻域点个数k 取的太多或者邻域半径r 取的太大,邻域点数将过多,局域线性模型的线性假设条件就不再满足,模型预测精度会因而下降。因此,为保证预测精度较高,邻域点不宜过多。

本文采用基于广义自由度方法[23]确定最近邻域点数。对式(8)所确定的k 个点进行线性拟合,可得估计参数为

则有:

式中:V 为误差向量。

式中:D 为广义自由度。D 的定义如式(11)。

式(10)给出了确定最近邻域点数的判定条件。最近邻域点数k 不同,对应的均方差σ2就不同,其中最小均方差σ2所对应的最近邻域点数即为需要选定的最近邻域点数。如此选定最近邻域点数可使预测模型获得好的预测精度。

最近邻域点的个数不能太少也不能太多,一般要大于2m +1。通过使均方差最小来选择最佳的邻域点数。

4 算例分析

以某实际电力系统2007年3月1日至5月14日的1 800 个负荷数据为样本,对短期电力负荷进行混沌预测。根据前面的分析,重构相空间的延迟时间通过互信息法确定为τ =5,采用G-P算法得到的嵌入维数为m=6,相点数目M=N–(m–1)τ=1 800 -(6 -1)×5 =1 775。这样,可对负荷数据{x1,x2,·,x1800}进行相空间重构:

采用一阶局域线性预测思想,通过使均方差最小确定最佳邻域点数。采用MATLAB 编程得到的计算结果如图8 所示。

图8 2007年5月15日实际和预测负荷曲线Fig.8 Actual and forecasted load curves on May 15,2007

图8 中的实线和虚线分别表示实际和预测负荷。表1 列出了预测数据与实际数据之间的误差。

由表1 可知,在83.33 %的预测时间点,预测误差小于5.00 %;在29.17 % 的预测时间点,预测误差小于1.00 %;预测误差最大的为5.91 %。总体而言预测精度较高。然而,仍然存在预测误差较大的时间点,主要原因包括几个方面:

首先,原始数据没有经过预处理。在现代电力系统中,负荷数据是由SCADA 系统采集的。采集过程中的一些偏差(例如测量系统故障或接收系统故障等)或系统发生故障,都会使得所采集的负荷数据偏离其真实值,从而可能降低负荷预测精度。这样,就需要对负荷数据预处理,包括异常值识别和替换、负荷数据的非线性去噪等[24]。

表1 2007年5月15日负荷预测结果Table 1 Load forecasting results on May 15,2007

其次,在相空间重构中延迟时间τ 和嵌入维数m 的选择至关重要,能否合理选择和优化这两个参数直接关系到所逼近的吸引子的真实性和可靠性。确定这两个参数的方法已有很多,如何针对短期负荷预测问题选择最适用的方法,仍是一个有待研究的困难而重要的问题。

最后,本文采用的预测模型为局域线性单步预测。采用单步预测可以累积误差,即上一步预测误差将累积到下一步的负荷预测中。在将来的研究中,可以考虑实现多步预测,以避免单步预测误差的累积问题。

若能较好解决以上三个方面的问题,预测精度有望进一步提高。

5 结 论

本文采用混沌时间序列方法对短期负荷进行预测。首先介绍了相空间重构理论及相关方法,通过互信息法确定延迟时间以及G-P 方法确定关联维数和嵌入维数;论述了混沌时间序列的混沌特性检验问题,采用功率谱方法和Lyapunov 指数方法对某地区的负荷数据进行了混沌特性检验,表明其具有混沌特性。之后,采用局域线性预测方法,并引入广义自由度方法确定最近邻域点数目,对某地区做了短期负荷预测,仿真结果表明所提出的预测模型取得了较高的预测精度。

采用混沌理论可以根据历史数据的时间序列窥视其内在演化规律,从而对近期的变化规律进行预测。需要指出,采用一阶局域线性预测方法进行单步预测会导致预测误差的累积问题,在未来的研究中可以考虑采用多步滚动预测思想,以期避免预测误差的累积问题,从而取得更高的预测精度。

[1]康重庆,夏 清,张伯明.电力系统负荷预测研究综述与发展方向的探讨[J].电力系统自动化,2004,28 (17):1 -11.

[2]Hagan M T,Behr S M.The time series approach to short term load forecasting[J].IEEE Trans on Power Systems,1987,2 (3):785 -791.

[3]万志宏,陈 亮,文福拴.计及温度影响的短期负荷预测时间序列模型[J].华北电力大学学报(自然科学版),2011,38 (3):61 -66.

[4]周佃民,管晓宏,孙 婕,等.基于神经网络的电力系统短期负荷预测研究[J].电网技术,2002,26(2):10 -13.

[5]于希宁,牛成林,李建强.基于决策树和专家系统的短期电力负荷预测系统[J].华北电力大学学报,2005,32 (5):57 -61.

[6]于海燕,张凤玲.基于模糊神经网络的电力负荷短期预测[J].电网技术,2007,31 (3):68 -72.

[7]马文晓,白晓民,沐连顺.基于人工神经网络和模糊推理的短期负荷预测方法[J].电网技术,2003,27 (5):29 -32.

[8]吕金虎,陆君安,陈士华.混沌时间序列分析及其应用[M].武汉:武汉大学出版社,2002.

[9]梁志珊,王丽敏,付大鹏,等.基Lyapunov 指数的电力系统短期负荷预测[J].中国电机工程学报,1998,18 (5):368 -371.

[10]李天云,刘自发.电力系统负荷的混沌特性及预测[J].中国电机工程学报,2000,20 (11):36 -40.

[11]李玲玲,朱 博.基于混沌时间序列的短期电力负荷预测[J].信息技术,2009 (3):44 -46.

[12]雷绍兰,孙才新,周 湶,等.电力短期负荷的混沌局域关联性预测[J].重庆大学学报(自然科学版),2005,28 (5):24 -27.

[13]姚永刚,张亚华.基于混沌理论的电力短期负荷预测[J].华东电力,2007,35 (5):7 -10.

[14]李如琦,孙 艳,孙志媛.混合混沌理论和关联度的神经网络短期电力预报模型的研究[J].电网技术,2006,30 (增刊):678 -681.

[15]李眉眉,丁 晶.基于混沌理论的电力负荷预测[J].四川水力发电,2004,23 (4):51 -53.

[16]Packard N H,Crutchfield J P,Farmer J D,et al.Geometry from a time series[J].Physical Review Letters,1980,45 (9):712 -716.

[17]Kim H S,Eykholt R,Salas J D.Nonlinear dynamics,delay times,and embedding windows[J].Physica D,1999,127:48 -60.

[18]Kennel M B,Brown R,Abarbanel H D I.Determining embedding dimension for phase-space reconstruction using a geometrical construction [J].Physical Review A,1992,45 (6):3403 -3411.

[19]Grassberger P,Procaccia I.Measuring the strangeness of strange attractors [J].Physica D:Nonlinear Phenomena,1983,9 (1):189 -208.

[20]Wolf A,Swift J B,Swinney H L,et al.Determining Lyapunov exponents from a time series[J].Physica D:Nonlinear Phenomena,1985,16 (3):285 -317.

[21]Rosenstein M T,Collins J J,De Luca C J.A practical method for calculating largest Lyapunov exponents from small data sets[J].Physica D,1993,65:117 -134.

[22]吕金虎,占勇,陆君安.电力系统短期负荷预测的非线性混沌改进模型[J].中国电机工程学报,2000,20 (12):80 -83.

[23]丁 涛,周惠成.混沌时间序列局域预测方法[J].系统工程与电子技术,2004,26 (3):338 -340.

[24]Harrison R G,Yu D J,Oxley L,etc.Non-linear noise reduction and detecting chaos:some evidence from the S&P composite price index[J].Mathematics and Computers in Simulation,1999,(48):497 -502.

猜你喜欢
相空间局域延迟时间
二氧化碳对乙烷燃烧着火延迟时间的影响
LTE 系统下行链路FDRX 节能机制研究
基于分层COX模型的跟驰反应延迟时间生存分析
基于快速局域线性回归的IRAS/FY-3B大气温湿廓线反演
延迟时间对气辅注射成型气体穿透行为影响的数值模拟和实验研究
非对易空间中的三维谐振子Wigner函数
PET成像的高分辨率快速局域重建算法的建立
尼日利亚局域光伏发电的经济性研究
基于相空间重构的电磁继电器电性能参数预测研究
基于局域波法和LSSVM的短期负荷预测