数据预处理对电力负荷预测精度的影响

2015-06-09 10:28:16陶莉朱小光
综合智慧能源 2015年9期
关键词:淮阴工作日样本量

陶莉,朱小光

(1.南京工程学院电力工程学院,南京 211167;2.中兴通讯南京研发中心,南京 210012)

数据预处理对电力负荷预测精度的影响

陶莉1,朱小光2

(1.南京工程学院电力工程学院,南京 211167;2.中兴通讯南京研发中心,南京 210012)

电力系统负荷预测精度越高,越有利于提高发电设备的利用率和经济调度的有效性。针对淮阴地区2013年负荷数据进行研究,分析了负荷的特性及不同的数据预处理方法对负荷预测精度的影响。结果表明:异常值平稳化是最直接、有效的方法;原始数据每日样本量对预测结果影响不大;预测重大节假日过后的工作日负荷时可删去双休日及重大节假日数据,预测精度显著提高;春、秋季负荷较平稳时,调整同类型日数据顺序也可适当提高预测精度。

电力负荷;预测;数据预处理;预测精度;负荷特性;同类型日

0 引言

准确的电力系统负荷预测对我国电力系统的发展有着重要意义,主要表现为:电网管理中准确的负荷预测能够为电网经济调度以及生产计划制订提供有力的帮助;负荷预测是电力系统安全分析及运行的基础,是电网进行实时调度的必需数据;预测负荷需求数据是电力系统市场化的重要组成部分。短期负荷预测在数学上就是估计一个时间序列的未来值问题,不可能百分之百的准确,往往存在一定的误差,而预测精度越高则越有利于提高发电设备的利用率和经济调度的有效性[1]。近年来,越来越多的数学方法应用于电力负荷预测领域,旨在提高其精度,但目前还没有一种算法适合所有数据的预测,也不是越新颖、越复杂的预测方法就一定会提高预测的精度。实际上,一些传统算法[2](如回归、滑动平均、灰色、移动平滑法等)只要做好数据预处理工作就可以显著提高精度。本文针对淮阴地区2013年负荷数据进行研究,分析不同的预处理对电力负荷预测精度的影响。

1 负荷特性分析

在进行某地区的负荷预测之前,需要对该地区负荷的特性进行分析,研究其变化规律及影响因素,这对选择合适的预测方法及改善精度大有裨益。由于社会生产方式和人们生活习惯一般都会呈现工作和休息的交替变化,这种变化具有日或周的周期性,所以地区负荷的变化一般也会具有日或周的周期性特点,此外,地区负荷周期的季节、节假日特性也非常明显[4]。

1.1 负荷的日周期性

负荷的日周期性体现出24h规律性的循环变化特点。各地区由于负荷成分、产业结构、地域、天气、风俗习惯等不同,负荷日周期呈现出来的特性会有很大差别,但基本都会在白天工作时间出现波峰,午间或夜间出现波谷。

1.2 负荷的周周期性

地区日负荷在工作日和双休日虽有类似的变化趋势,但存在明显差异。图1是淮阴地区春季1周的连续日负荷曲线(其中周一到周五为工作日,周六、周日为双休日)。在工作日,地区负荷的主要构成一般是工业负荷,工业企业通常在白天稳定工作,所以工作日负荷具有基本相似的变化规律,数值相差也不大;而在双休日工业负荷所占比例下降,居民生活、服务业负荷比例明显上升,这样的变化结果使得双休日(具体针对淮阴地区,尤其是周日)负荷比工作日明显偏低[3]。

图1 淮阴地区2013年春季1周负荷曲线

1.3 负荷的节假日特性[1]

重大节假日(如清明、五一、端午、中秋、国庆、元旦、春节等)来临时人们一般会休息较长时间并伴随有大量的庆祝活动,对负荷变化的影响很大。图2为淮阴地区2013年春季工作日、双休日、清明节、劳动节负荷曲线对比图。由图2可看出,重大节假日的负荷比工作日的负荷低很多,与周日负荷也存在明显的差值,曲线变化趋势更接近周日的。

图2 淮阴地区2013年春季工作日与节假日负荷曲线

1.4 负荷的季节特性

四季的工作日负荷曲线基本遵守典型日负荷曲线的特点。图3是淮阴地区2013年四季典型工作日的负荷曲线,比较后发现:早高峰一般都出现在08:00—12:00,晚高峰通常出现在20:00—22:00;因夏、冬季存在大量的空调负荷,夏、冬季的负荷曲线要明显高于春、秋季。夏季日负荷曲线与其他季节的变化趋势差别较大,一年中的最高负荷一般出现在夏季高温日。

图3 淮阴地区2013年四季工作日负荷曲线

2 数据预处理对精度的影响

2.1 异常值平稳化处理[4]

数据预处理是指在进行主要处理前对数据进行的一些处理。异常值平稳化是电力负荷预测预处理常采用的方法。电力负荷预测中收集到的历史数据经常会出现异常值或缺失个别数据,如果直接以这样的原始数据进行预测,预测结果不够准确,因此,需要识别出异常值并进行一定的处理。可以先设定一个变动范围,如待处理的原始数据超过这个范围,即可视为异常数据,可采用平均值的方法平稳其变化。图4中,4月9日15:00左右的数据可视为异常值。

图4 出现异常值的负荷曲线

2.2 选择原始数据样本量

短期负荷预测中每日的负荷曲线由24,48,96或288点组成,采用同样的预测方法,选取的样本量不同,误差也会不同。

以淮阴地区2013年春季某工作日的负荷为例进行预测,预测结果误差见表1。

表1 预测结果误差对比 %

样本量大的情况下,由于负荷波动或其他原因,出现误差较大点的几率更高一些,但从表1可看出,负荷样本量的多少对预测结果的平均误差影响并不大。

2.3 考虑工作日及节假日差异删选数据

通常双休日、重大节假日的负荷比工作日负荷明显偏低[5],变化趋势也不完全一致,所以在对工作日负荷进行预测时可考虑删去原始数据中的双休日(淮阴地区周日的负荷差别更大,因此就只删去了周日的负荷)及重大节假日数据。多组数据预测分析比较得出,重大节假日过后的工作日负荷预测采用这种处理方法预测精度明显提高。采取4种预测方法对淮阴地区五一劳动节后某日24h的负荷进行预测,原数据删去节假日负荷前、后预测结果见表2(样本量均为24点,下同),原数据删去节假日负荷前、后指数平滑法预测比较如图5所示。由表2可以看出:删去节假日数据后的预测结果不仅平均误差大大降低,而且误差大于5%的点数也明显减少;由图5可见:删去节假日的预测曲线更贴近实际曲线。

表2 原数据删去节假日负荷前、后预测结果对比

图5 删去节假日负荷数据前、后指数平滑法预测对比

2.4 考虑同类型日调整数据顺序

对负荷特性进一步的研究表明,不仅重大节假日、双休日与工作日的负荷特性有明显差异,工作日内周一至周五的负荷特性也存在差异。预测有一个基本原则:近期数据对预测影响大,远期数据影响小,基于这个原则,将同类型日的数据调整为近期数据(建议优先调整前两三周的同类型日负荷数据),具体应根据负荷特性来选择。对多组数据进行分析比较后发现:该方法较适用于春、秋季负荷较平稳时;夏、冬季温度变化较大,同类型日数据往往是一周或两周前的数据,时间跨度大、温度变动大,负荷受温度的影响也大,这种调整方法不适宜。采取4种预测方法对淮阴地区春季某工作日24h的负荷进行预测,原数据考虑同类型日调整数据前、后预测结果见表3,考虑同类型日调整数据顺序前、后滑动平均预测比较如图6所示。由表3可以看出:考虑同类型日调整数据顺序,不仅可以显著降低平均误差,而且误差大于5%的点数也明显减少;由图6可见:调整之后的预测曲线明显更贴近原曲线。

表3 考虑同类型日调整数据顺序前、后预测结果对比

图6 考虑同类型日调整数据顺序前、后滑动平均预测对比

3 结论

异常值平稳化是电力负荷预测预处理最常用、效果最直接的方法;原始数据每日样本量的多少对预测结果误差的影响不大;考虑工作日及节假日差异删选数据可以在一定程度上提高预测精度,特别对重大节假日过后工作日的负荷预测效果尤佳;在春、秋季负荷较平稳时,考虑同类型日调整数据顺序,对预测精度的提高也可起到较好的作用。

[1]康重庆.电力系统负荷预测[M].北京:中国电力出版社,2007.

[2]牛东晓,曹树华,赵磊,等.电力系统负荷预测技术及其应用[M].北京:中国电力出版社,1998.

[3]袁耀臻,徐剑洪.电力负荷预测中数据挖掘过程研究[J].中国科技财富,2010(24):214.

[4]钟惠锋.提高电网短期负荷预测精度的研究[J].广东电力,2011,24(6):97-100.

(本文责编:刘芳)

TM715

A

1674-1951(2015)09-0008-03

陶莉(1978—),女,江苏盐城人,讲师,工学硕士,从事负荷预测、电力需求侧管理等方面的教学及研究工作(E-mail:julysky_tl@126.com)。

2015-03-31;

2015-07-21

猜你喜欢
淮阴工作日样本量
一饭千金
医学研究中样本量的选择
内蒙古统计(2021年4期)2021-12-06 02:49:20
淮阴:母爱之都
华人时刊(2020年13期)2020-09-25 08:21:48
淮阴:活跃着一支“老兵”调解队伍
人民调解(2019年3期)2019-03-16 00:22:32
航空装备测试性试验样本量确定方法
测控技术(2018年4期)2018-11-25 09:46:52
Sample Size Calculations for Comparing Groups with Binary Outcomes
背水一战
对《资本论》中工作日问题的哲学思考
商(2012年14期)2013-01-07 07:46:16
自适应样本量调整中Fisher合并P值法和传统检验法的模拟比较
郑州局办理业务全程提速
资源导刊(2011年4期)2011-08-15 00:51:44