蔡舒平 孙华辰
摘 要:挖掘合适的气象因素处理方法是提高预测精度的关键,Fisher信息理论为此类问题的解决提供了一种新途径,该方法用于解决大数据环境下短期负荷预测中实时气象因素的建模问题。针对气象变量,Fisher信息计算问题首先被解决,据此给出了基于Fisher信息的气象因素建模方法。
关键词:短期负荷预测;气象因素;累积效应;预测模型
DOI:10.16640/j.cnki.37-1222/t.2018.18.104
1 引言
信息理论为我们提供了解决负荷预测中气象因素处理的另一种思路。原因是任何类型的数据和模型本质上都是对客观事物的一种刻画和表征,是我们认识外部客观事物的一种有用的信息。文献[1]将负荷预测过程描述为负荷信息运动的过程,从而利用信息理论来处理负荷预测中的不确定性,据此提出了最小信息损失综合短期负荷预测方法,来改善负荷随机性较大时的预测精度,只是气象因素作为整体信息的一部分隐含其中,并没有单独涉及。
本文首先阐述了Fisher理论及其计算,接着展示了气象因素的Fisher信息建模方法,提出了一种基于此种建模方法的负荷预测新模型。
2 Fisher信息理论及其计算
2.1 Fisher信息
统计学家Ronald Fisher从系统稳定性的角度出发,给出了一种度量不确定性的方法——Fisher信息(FI)。Fisher信息基于概率密度函数导数的计算表达式如下:
(1)
式中:P(s)为概率密度函数(PDF),s是一个状态变量。
具体计算中,考虑到除以较小的P(s)值会带来数值误差,令 q2(s)=P(s),于是公式(1)变为:
(2)
用和来代替ds和dq,式(2)能被近似为:
(3)
式中:si表示系统的某一个特定状态,即s1表示状态1,s2表示状态2等等。于是:si-si+1=1,则式(3)简化为:
(4)
式中:i为状态序号,n为状态总数。式(4)作为我们以下计算和推导的基础。
2.2 Fisher信息计算
根据数据的量和系统的行为,在变量时间序列数据集上定义一个滑动的时间窗口。
假设所给观察数据序列集为,其中N为序列总长度,窗宽为,滑动因子为,则滑动窗W可用数学语言表述如下:
(5)
式中:,M为窗口个数,。
此时单变量时间序列已经转变为一个重叠窗口序列,将每个滑动窗口都划分为如下I个区间:
(6)
式中: ,互不相交,此处Si为区间边界,i为区间数。
(7)
(8)
(9)
则数据位于区间Zi的概率P(Zi)计算如下:
(10)
这样即可计算出相应于每个状态的q(Zi) 以及使用公式(4)为每个时间窗口估计FI。
3 气象因素的Fisher信息处理
反映此前时段气象因素变化强弱、稳定的气象Fisher信息量可以从记录的过去时段的气象变量中获得,这样一来,使用过去时段的气象Fisher信息值对目前的气象变量进行加权以体现过去气象变量对目前负荷需求的影响即累积效应。符合人们通常意义中对气象变化的“稳定低”或“稳定高”的描述,避免了惯常处理方法中需确定累积效应系数的主观随意性。文献[2]指出温度对负荷需求所产生的累积效应是当日内累积效应与多日累积效应的综合。据此,气象因素单次计算Fisher信息的窗口数据应由以下三部分组成(以智能电网每15分钟采集1个气象数据点为例):
式中第一部分数据为预测当日当前时段3小时内12个气象数据采集点,第二部分为预测前一日当前时段2小时内8个气象数据采集点,第三部分为预测前二日当前时段1小时内4个气象数据采集点,即总共24个数据点组成了单次计算Fisher信息的数据窗。
4 基于Fisher信息的气象因素建模方法
4.1 气象因素直接输入的预测模型
短期负荷预测模型要考虑实时气象因素的影响。并且目前时段的负荷需求通常要受到前几时段的影响,尤以前1时段、前4时段最为显著。同时考虑到负荷变化的周期性特征,则一个采用了直接输入气象变量、并体现了上述诸多影响因素的每日96点预测模型输入量组成如下所示:
1~2:预测日星期类型及当前预测时段;
3~4:预测日预测时段的前一时段、前4时段的负荷值;
5~10:预测日预测时段、前一时段、前4时段的温度、湿度;
11~13:上周同类型日预测时段、前一时段、前4时段的负荷值;
14~19:上周同类型日预测时段、前一时段、前4时段的温度、湿度。
把上述19个输入量作为预测模型的输入变量来考察处理实时气象因素对负荷影响的效果,并和以下基于Fisher信息的建模方法做比较。为清楚所见,我们标记它为模型1。
4.2 基于Fisher信息的气象因素建模方法及预测模型
对模型1中的温度和湿度气象变量采用基于Fisher信息处理策略,即可计算出过去时段气象变量的Fisher值,经归一化处理后,再乘以当前时段气象变量的归一化值即得预测模型当前预测时段气象变量的Fisher信息加权值。则输入层的变量减为11个,预测模型输入量组成如下所示:
1~2:预测日星期类型及当前预测时段;
3~4:预测日当前预测时段的前一时段、前4时段的负荷值;
5~6:预测日当前预测时段温度、湿度的Fisher信息加权值;
7~9:上周同类型日当前预测时段、前一时段、前4时段的负荷值;
10~11:上周同类型日当前预测时段温度、湿度的Fisher信息加权值。
由此所形成的模型我们标记为模型2。在模型2中,通过Fisher信息对当日气象因素加权不但很好地体现了气象因素的累积效应,还弥补了负荷变化对气象因素的滞后效应,使得负荷随温度、湿度的变化呈现出即时效应。
5 结论
本文提出了基于Fisher信息的气象因素建模策略,给出了基于此种建模策略的负荷预测新模型。最后,本文所提方法作为一种统一的气象因素处理方法,不仅能用在短期负荷预测中,同样也可以用在其他需要考虑气象因素的累积效应和滞后效应的研究领域中。
参考文献:
[1]孫宏斌,陈佳,江曦源等.最小信息损失综合短期负荷预测:理论[J].中国电机工程学报,2016,36(17):4513-4520.
[2]方鸽飞,胡长洪,郑奕辉,蔡金明.考虑夏季气象因素的短期负荷预测方法研究[J].电力系统保护与控制,2010,38(22):100-104.
作者简介:蔡舒平(1964-),男,副教授,硕士研究生导师,研究方向:电力负荷预测及新能源发电。