梁 武,李 丽,赵 云,徐宜臻,潘志鸿,车金星
(1. 宿州学院 数学与统计学院,安徽 宿州 234000;2. 南昌工程学院 理学院,南昌 330099;3. 国网修水县电力公司,江西 修水 332400)
短期尖峰负荷预测主要为电力系统制定发电计划和电力系统规划服务,并从而促使电力系统运行的可能性及经济性得到有效提高。[1,2]所以,确保短期尖峰负荷预测准确可靠,不仅能有效提高电力系统运行的安全性而且还能有效促使电力系统有效运行,经济效益的提高。[3]
常见的负荷预测方法主要有两类:线性类统计模型和非线性类智能模型。线性类统计模型最为经典的是ARIMA 模型,并有很多学者提出了相应的预测模型。[4-6]非线性类智能模型最为经典的是神经网络模型,并有很多学者提出了相应的预测模型。[7,8]神经网络模型优点是预测精度高,但其缺点是黑盒建模过程、这将导致可解释性很差;ARIMA 模型优点是理论基础完备、具有较好解释性,但其缺点是对数据具有一定要求、往往需要对原始数据作足够的预处理、以便获得更好的建模效果。实际上,没有任何一个预测模型可以对不同的数据集都取得很好的效果,因此,我们需要结合具体的数据集来建立相应的预测模型。
在本文中,考虑到短期负荷具有较强的周期性变化的特征,设计了一种基于周期性成分分析的混合预测模型。首先,依据短期负荷的周期性变化特征主要是星期和月份,设立了19 周期成分:包括7 个星期周期和12 个月份周期变量;再利用多元线性回归模型估计出上述各周期成分的影响值,从而为尖峰负荷的内在结构提供可解释性;最后,利用ARIMA 模型建立短期尖峰负荷需求与其内在成分的关系模型。2012 年某县短期尖峰负荷的数值模拟检验了模型的有效性,研究成果可以为该县电网运行的可持续发展提供一定的参考价值。
电是与我们日常生活和工作息息相关的一种能源,因而电力负荷也会存在着与我们生活和工作类似的规律性。本文考虑以天为单位的尖峰负荷预测问题,提出了星期周期性成分和月份周期性成分分析。
一方面,电力负荷会依据星期一至星期天表现出重复的规律性:我们称星期一至星期五为工作日,在这个时段里,人们大多会每天按时上下班,公司或单位也在进行工作生产,这个时段会呈现出工作时期的规律性,主要表现为工业负荷为主;而星期六至星期天成为休息日,在这个时段里,人们大多以生活和休息为主,公司或单位也大多停止生产,这个时段会呈现出休息时期的规律性,主要表现为生活负荷为主;并且这些规律是以7 天作为变化周期的,这就是星期周期成分。
另一方面,短期负荷与季节变化存在着密切的关系,本文提出以月份作为周期成分,分析电力负荷依据季节特征表现出重复的规律性,较为明显的特征是:在夏季,天气气温通常较高,这时人们会在生活或工作场所启动降温设备(如电风扇、空调等),这将导致电力负荷的大幅提升;在冬季,天气气温通常较低,这时人们会在生活或工作场所启动取暖设备,这也将导致电力负荷的提升;本文用月份来刻画这样表现出来的规律性,称为月份周期成分。
多元线性回归模型是以经典的数理统计理论为基础,是进行回归分析最为基础、最为常用的统计方法之一,在工程应用中已获得广泛的应用。[9]考虑到周期性成分具有很强的规律性,本文在添加一个负荷的时间趋势项基础上,建立了一种多元线性回归模型,该模型的回归方程可以表达如下(1)式:
其中,It是负荷因变量,X 和IA是独立变量,a0是一个常数,ai和bj是回归系数,执行这个回归分析,上述系数需要由最小二乘法解决。这些系数的含义可以解释如下:
a0代表了时间的线性趋势,a1代表了周日的基础期限,依次类推,a7代表了周六的基础期限,a8代表了1 月份的基础期限,a19代表了12 月份的基础期限。
负载的系列结构在一个特殊的时间可以解释为:时间的线性趋势,加上一个星期的基础期限,以及12 个月份的基础期限就相应地相互作用,如果一个系数的置信区间包含零,那么这个系数的意思是不可靠的。在这种情况下,模型通过添加或减少变量应该改进。
经过分析,可以发现上述周期成分并不能表达电力负荷在时间连续上的因果关系:例如季节性也会出现时间上的偏差,有时气温的升高(或降低)会提前或推后一些时间到达。其实,可以用时间序列分析方法来获取这样的一些特征,ARIMA 模型正是这类时间序列分析方法中最为流行和有效的方法之一。因此,本文采用ARIMA 模型对周期成分分析后的残差时间序列建模,分析时间上的连续因果关系,进一步提升模型的预测精度。
ARIMA(Autoregressive Integrated Moving Average Model)模型最初是由Box 和Jenkins 提出的,[9,10]包含自回归(AR)参数p、移动平均(MA)参数q、以及时间差分参数d。其一般形式可以表示为:
其中,ci、Qj为模型的待定参数,εt为残差时间序列。
本文采用多元线性回归及ARIMA 模型,设计了周期性成分分析法提取某县短期负荷的内在结构。首先,设立星期周期和月份周期等19 周期变量(星期周期项包括星期一至星期天7 项,月份周期项包括一月份至十二月份12 项),对周期变量进行优化选取研究;再利用多元线性回归模型求解上述各变量的影响值,并给出相应的特征解释。最后,利用ARIMA 建立该县短期电力负荷需求与其内在成分的关系模型。
为了实证上述预测模型的有效性,本文以江西省某县短期负荷预测问题为实例。在短期负荷预测问题中,尖峰负荷预测问题尤为重要。为此,我们收集了2012 全年江西省某县每天得尖峰负荷值作为研究对象,原始数据图见下图1 所示。模型采用的技术原理将在下面各小节依次描述。
图1 江西省某县2012 年每天尖峰负荷原始数据
本文以江西省某县尖峰负荷预测问题为典型,探索基于周期成分分析模型的有效性。具体分两部分进行:首先,利用MATLAB 软件,实现该模型的计算机仿真模拟,并作出负荷预测曲线;其次,在第一步预测仿真模拟的基础上,用评价统计量定量评价模型有效性。
本节紧密结合江西省某县短期负荷数据实际情况,依据上述基于周期分解的短期负荷预测模型,说明该问题的具体的计算过程。实际计算过程大致可分为以下三个步骤进行:
第一步:原始数据预处理。
本文所采用的数据来源于江西省某县电力公司,其具体负荷数据曲线描述见2.1 部分的图1 所示。因为电力负荷数值与其所处时刻紧密相关,例如炎热夏季需要使用空调避暑、公司星期六和日休整等等,所以本文添加负荷所处的周期属性值,即引入7 个星期变量和12 个月份变量。为了反映周期属性的交互性,依据绘图添加星期和月份间的交互项。
第二步:周期性成分分析(SCA)法预测模型。
引入时间趋势项、星期周期项、每月周期项,建立多元线形回归模型,其具体原理见1.1 部分所述。利用上述模型,将图1 所示江西省某县2012 年尖峰负荷数据代入模型,得到如下时间和用电量的趋势图,实验结果见下图2 所示。在图2 中,红色叉(x)符号线表示原始尖峰数据、黑色圆(●)符号线分别表示SCA 预测线和预测残差线;从图中可以看出:SCA 能够很好地识别负荷数据的趋势和周期成分,但残差曲线中应该还包含了时间序列的内在结构关联信息。本文将利用以下第三步进一步提取信息,改进预测模型。
图2 江西省某县2012 年每天尖峰负荷的周期性成分分析法预测结果
第三步:周期分解改进模型。
为了进一步改进SCA 预测模型,本文利用ARIMA 模型对图2 的残差序列进一步建模,ARIMA 模型具体原理见2.2 部分所述。
采用ARMA 模型对上述残差平稳时间序列建模,我们得到预测结果如下图3 所示。图中红色叉(x)符号线表示原始尖峰数据、黑色圆(●)符号线分别表示SCA-ARIMA 预测线和预测残差线。从下图可知,该结果是图2 结果的改进结果。而且所得残差曲线基本围绕在0 值上下随机波动,可以认为呈现均值为0 的正态分布。
图3 江西省某县2012 年每天尖峰负荷的改进预测结果
至此,以江西省某县短期尖峰负荷预测问题为案例,基于周期性成分分析的建模过程已经实施完毕,从图3 可以看出预测曲线很好地逼近真实数据曲线、并且残差基本呈现均值为0 的随机波动,这说明建模是成功的。为了进一步定量刻画模型的有效性,下一节引入误差评价指标进行有效性评价。
本文针对江西省某县短期电力负荷预测问题,分别建立了周期性成分分析模型(SCA)及其改进模型(SCA-ARIMA)。从图2 和图3,我们可以直观地对比两个模型的预测效果,为了进一步评价负荷预测结果,定义以下三个定量评价的统计指标:平均根误差(root mean square error,缩写为RMSE)、平均绝对误差(mean absolute error,缩写为MAE)和平均绝对百分比误差(mean absolute percentage error,缩写为MAPE)用来检验预测精度。计算公式如下:
其中Pi,Ai分别为第i-th 预测和实际值,p是总预测数。得到结果如下表1 所示,结果定量评价了预测效果。
表1 预测模型的MAE,MAPE and RMSE 值
通过MATLAB 软件仿真模拟计算,我们得到了上述模型的武宁县电力负荷预测模型,预测结果见表1。在表1 中,我们采用了上述三个评价统计量来检验模型的预测能力。第一列是模型,第二到四列分别是三个评价统计量。通过表1 的分析可以明显地看出:文中所建SCA-ARIMA 模型MAE =7.21091,而SCA 模型MAE=9.46797,从MAE 角度表明SCA-ARIMA 模型具有更高效能,另外两个评价统计量也可验证这一点。
从表1 可以看出,周期性成分分析模型(SCA)不仅具有很好的解释性,而且也取得了一定的精度;在此基础上,我们进一步利用ARIMA 模型对残差进行建模,形成了改进模型(SCA-ARIMA);从结果上看,SCA-ARIMA 取得了更高精度。
该论文以江西省某县短期电力负荷预测为典型,研究短期电力负荷时间序列的发展规律及其成分特征的关联性,从本质上揭示该县短期电力负荷过程的内在机理。论文通过设立星期周期和月份周期等19 周期变量,利用样本数据统计上述两类变量的交互项变量,对周期变量进行优化选取研究,获得平稳的残差时间序列;再利用多元线性回归模型求解上述各变量的影响值,并给出相应的特征解释。最后,利用ARIMA 模型建立该县短期电力负荷需求与其内在成分的关系模型,并用江西省某县2012 年的运行数据检验了模型的有效性。研究成果可以为江西省某县电网运行的可持续发展提供一定的参考价值。
[1](美)P.Kundur. 电力系统稳定与控制(中译本)[M].北京:中国电力出版社,2002:1-57.
[2] Murata A,Kondou Y.Electricity demand in the Chinese urban household-sector[J].APPL ENERGY,2008,85(12):1113-1125.
[3]陈建志. 电力企业增强执行力的途径[J]. 广西电业,2004,(7):9-10.
[4]朱艳科. 广东省能源消费的ARIMA 模型预测分析[J].数学实践与认识,2012,43(3):14-18.
[5]魏红燕,孟纯军. 基于arima 模型的汇率预测研究[J].时代金融,2014,(8):13-15.
[6]Contretas J,Espinola R,Nogales FJ,et al.ARIMA models to predict next-day electricity prices[J].IEEE Trans on Power Systems,2003,18(3):1014-1020.
[7]杨廷志,文小飞,万俊,等. 改进神经网络的短期负荷预测模型及仿真[J]. 计算机仿真,2014,(10):145-150.
[8]黄岳嵘,徐晓钟,张益铭,等. 基于ARIMA 和神经网络模型的城市燃气负荷预测[J]. 计算机应用与软件,2011,28(12):206-209.
[9]吴喜之. 统计学[M]. 北京:中国统计出版社,2013:111-213.
[10]谢衷洁. 应用概率统计研究实例选讲[M]. 北京:北京大学出版社,2011:231-322.