基于多因素改进型PSOSVM算法的中长期负荷预测

2016-02-05 07:31曹渝昆
上海电力大学学报 2016年6期
关键词:改进型步长向量

曹渝昆, 帅 浩

(上海电力学院 计算机科学与技术学院, 上海 200090)

基于多因素改进型PSOSVM算法的中长期负荷预测

曹渝昆, 帅 浩

(上海电力学院 计算机科学与技术学院, 上海 200090)

中长期负荷预测作为电力规划与调度中的重要一环,其影响因素有着多样性和不确定性等特点.选取支持向量机作为中长期负荷预测的核心算法,筛选多种区域宏观经济因素,利用粒子群(PSO)寻优与循环寻优的改进型算法对支持向量机(SVM)的参数进行优化及负荷预测.仿真结果显示,改进型PSOSVM算法有着较高的预测精度.

中长期负荷预测; 宏观影响因素; 粒子群与循环寻优; 改进型PSOSVM算法; 支持向量机

中长期负荷预测主要研究方向有灰度预测[1]、回归分析[2]、组合预测[3]、神经网络算法[4-5]与支持向量机(Support Vector Machine,SVM)算法[6-10]等,其中灰度预测与回归的研究对象主要是历史负荷数据,组合预测国内研究的较多,国外研究相对较少,而神经网络算法与支持向量机是目前研究最多的两种方法.

文献[1]对过度依赖历史数据的灰度算法做了改进,结合了一定未来波动趋势,但不能解决其他影响因素的干扰,稳定性不高;文献[2]的回归预测存在着同样的问题,不能很好地处理干扰量;文献[3]的组合预测结合了多种算法的优点,但容易产生误差传递;文献[4]和文献[5]提高了预测的收敛速度,但预测精度不够高;文献[6]提出了粒子群(Particle Swarm Optimization,PSO)优化鲁棒支持向量回归的方法,提高了支持向量机的稳定性,但容易出现样本集的过拟合;文献[7]和文献[8]分别提出了经验模态分解和主成分分析支持向量机,在一定程度上考虑了影响因素的权重,但不够全面,造成相应的预测精度与稳定度有限;文献[9]提出季节型最优灰度支持向量机的算法,对季度负荷进行了很好的预测,并应用最小二乘支持向量机,但精度同样受限.

中长期负荷预测系统结构主要包括经济、社会因素,以及能源环境、人口、技术和电力需求等6个子系统[10].这些因素中部分变量对负荷波动的影响非常大,但由于部分指标只能定性估计,无法量化形成非常准确的样本集.支持向量机算法具有小样本学习、处理非线性数据的特点.因此,本文选取经济、社会因素,以及能源环境、人口、电力需求等5个方面的主要指标进行量化,利用支持向量机进行预测.为了在提高支持向量机预测精度的同时避免出现过拟合,采用二重寻优与PSO算法对支持向量机的惩罚系数与gamma参数进行优化,利用训练完成的模型对未来3年用电量进行预测,得到了较好的效果.

1 影响因素多样性

电力负荷中长期预测本身有着复杂的内在系统,与外界因素的联系又形成了外界系统.预测对象的未来发展是系统整体的动态发展,与各个组成部分和影响因素之间相互作用、密切相关.电力负荷中长期预测系统的影响因素主要有以下几种.

(1) 经济因素 主要包括区域经济发展水平、产值单耗等内容.在多数理论与实证研究中,国内生产总值(Gross Domestic Product,GDP)被认为是电力消费的最重要的决定因素.

(2) 用电结构 地区用电结构的内容包括第1产业、第2产业、第3产业和城乡居民生活需求电量、重点行业需求电量即行业用电结构、重点用户需求电量等.随着我国产业结构的转型,第1产业和第2产业所占国内生产总值的比重会下降,第3产业的比重将会有较多的上升.

(3) 社会因素 包括人口基数和增长率等.人口增加对于电力消费起着很重要的作用,人口增长与电力需求之间呈现了非常强的正相关关系.

(4) 能源市场 从整个能源消耗市场来看,电力市场只是其中的一个组成部分.电力消耗与其他能源的消耗之间有着密切的关系,用户选择电力消费和其他能源消费的比重可能会发生变化,有时甚至会发生逆转.

(5) 电力弹性系数 是指一定时期内电力消费的年平均增长率与国民经济年平均增长率的比值.电力工业与国民经济之间发展速度的比例关系通常用电力弹性系数表示,它是国民经济诸多数量关系中的一个重要变量.

影响因素的简要说明如表1所示(数据来源于上海市各年统计年鉴网络).

表1 影响因素说明

2 改进型PSOSVM预测

2.1 支持向量机算法

假设有训练样本集G={(xi,di)},i=1,2,3,…,N,xi∈Rn,di∈R.其中xi为第i个n维输入,di为输出.支持向量机回归的基本原理是寻找一个输入空间到输出空间的非线性映射ψ(x),通过映射将数据x映射到一个高维特征空间F,并在特征空间中用下述估计函数进行线性回归:

(1)

式中:ω——权值向量,ω∈Rk; ψ(x)——输入向量在高维空间上映射函数;

b——常数,b∈R.

其函数逼近问题等价于如下函数最小:

(2)

(3)

通过引入两个松弛变量ξ,ξ*,上述函数可以变为:

(4)

求解上述问题最终可得到支持向量机回归函数:

(5)

因此,利用支持向量机进行负荷预测需要确定的参数c和σ.

2.2 粒子群寻优模型

粒子群算法(PSO) 是由KENNEDY J等人于1995年提出的一种基于种群搜索的自适应进化技术.算法随机产生一个初始种群并赋予每个粒子一个随机速度,在飞行过程中,粒子的速度通过自身以及同伴的飞行经验来动态调整整个群体飞向更好的搜索区域的能力.在每代中的速度和评价函数位置的计算式为:

(6)

(7)

式中:i=1,2,3,…m; d=1,2,3,…D; ω——惯性因子,为非负数;c1,c2——加速常数,为非负常数; r1,r2——[0,1]范围内变换的随机数; α——约束因子,用于控制速度的权重.

2.3 改进型PSOSVM预测模型

改进型PSOSVM算法主要以支持向量机为主体,由于标准型支持向量机的参数设置不能符合预测要求,造成预测精度不高,而使用PSO算法寻优得到的参数是训练样本全局最优解,预测模型陷入过拟合,因此将二重寻优与粒子群寻优算法结合,对支持向量机参数进行优化.二重寻优能够很好地找到基本最优解,而PSO算法的寻优参数则可以作为微调量与二重寻优结合,最终结果作为支持向量机的最优输入参数.二重寻优算法简要过程为:

Begin

Forc,gfroma1toa2,step=a3;

{cmd=(c,g);

If svmtrian(trainfactors trainload cmd)

cbest=c;

gbest=g;}

End.

其中,a1,a2为SVM参数c和g的寻优范围;a3为寻优步长;E为允许误差;cbest与gbest分别为二重寻优最优参数.二重寻优是事先设置参数范围与寻优步长,通过交叉验证,遍历参数范围内的各种参数组合.寻优精度受寻优步长影响,步长越小,精度越高,但运行时长越长.根据多次实验结果选取[2-5,25]为c,g的寻优范围,寻优步长为20.5.

支持向量机的主要优化参数是c和g,即惩罚系数与gamma参数.二重寻优即给定c和g的范围,并规定每次寻优步长,通过嵌套循环来寻找最优c和g.二重寻优参数精度主要与c和g的寻优范围和步长有关,范围过大,易使惩罚系数过大,模型过拟合,而步长过长则会导致算法运行时间过长,同时精度实际提高并不明显.为了降低粒子群寻优的过拟合程度,设定支持向量机的初始惩罚系数最小为0.1,最大为100.

设二重寻优结果分别为c1与g1,PSO寻优结果为c2与g2,则SVM的参数为:

(8)

g=g1+k2g2

(9)

式中:k1,k2——PSO寻优结果的微调权重.

为了进一步提高模型的准确度,在将影响因素作为输入样本的同时,选取预测年前3年的历史负荷加入输入样本.多次实验结果表明,改进型PSOSVM的预测精度和稳定性较其他算法要高.

3 算法预测流程

在确定并量化影响因子后,通过改进型PSOSVM算法对数据集进行训练,算法设计结构如图1所示.

图1 改进型PSOSVM算法结构

步骤1 根据中长期负荷预测系统的复杂性,对历史数据及影响因素有选择性地提取,并计算各个指标与预测值的相关度,剔除相关度较低的指标;

步骤2 将剩下相关度较高的宏观因素指标结合预测年前3年的历史负荷作为输入样本;

步骤3 初始化PSO算法与SVM算法,分别利用PSO寻优和循环寻优进行SVM参数寻优;

步骤4 取二重循环寻优结果为基本最优解,PSO寻优结果取相应的权重值对基本最优解进行微调,获得SVM模型参数最优解;

步骤5 将最优c和g带入SVM,输入样本数据,进行训练;

步骤6 进行负荷预测,并与实际值比较,计算均方根误差.

4 实例仿真

我们选取上海市2000~2010年的GDP,第1产业产值,第2产业产值,第3产业产值,能源消耗量,常住人口,预测年前3年负荷,共9个指标作为SVM的训练样本输入变量,初始化粒子群算法,c的寻优范围为0.1~100,g的寻优范围0.01~1.根据多次实验结果,二重寻优选取c和g的寻优范围为[2-5,25],步长为20.5;微调系数k1为0.5,k2为0.001.图2为各个算法训练集得出的结果(rmse为绝对误差的均方根误差).

图2 各算法(2000~2010年)训练集结果

本文选择样本输入变量指标主要包括:GDP,第1产业产值,第2产业产值,第3产业产值,常住人口总数,能源消耗量,电力消费弹性系数,预测年前3年的历史负荷,共10个变量指标.具体数据见表2.

由于各个影响因素指标是选取各类宏观因素中的主要指标,因此在影响因素确定后,需要进行相关度计算.本次实验的相关度计算是通过SPSS软件计算得出的.将样本数值输入SPSS软件得到相应的相关系数与显著性水平,计算结果见表3.

表2 2000~2013年10个指标的具体数据

表3 各变量相关系数

注:**在0.01水平(双侧上)显著相关;统计数据范围为2000~2013年.

由图2可以看出,相对于灰度算法,神经网络与支持向量机算法对于训练集的学习程度都要高.在得到训练模型后,利用各个算法的模型分别对上海市2011~2013年的用电量进行预测,各个算法的预测结果如图3所示.

灰度算法3年预测值均方根误差为15.39%,BP神经网络3年预测值均方根误差为5.19%,标准SVM算法3年预测值均方根误差为3.31%,多因素改进型PSOSVM算法3年预测值均方根误差为0.41%.

由此表明,灰度算法由于仅仅是在历史负荷的基础上进行相关预测,没有考虑宏观的影响因素,因此预测结果并不理想;而BP算法和通过二重寻优SVM算法,由于考虑了多种因素,并将多种宏观因素作为训练集的输入,因此相对于灰度算法,其精度有了一定的提高.本文提出的多因素改进型PSOSVM算法在SVM寻优参数的基础上,引入PSO寻优算法对参数结果进行微调,使该算法预测结果精度得到了进一步的提高.

图3 各算法(2011~2013年)预测结果比较

5 结 语

电力负荷中长期预测是一个系统有机整体,在规划区域电力发展蓝图时,从地区的实际出发,需考虑自然、经济、社会、人文的各种要素.本文通过不同算法的比较可知:是否考虑宏观因素对负荷预测结果影响很大;简单PSOSVM预测算法容易出现过拟合预测,从而影响预测准确性;而通过对参数值的改进寻优,可提高预测精度并保证预测的准确性.

[1] 李红伟,毛文晋.基于双向差分建模的优化GM(1,1)模型及其在中长期电力负荷预测中的应用[J].电力系统保护与控制,2011,39(13):56-61.

[2] 李钷,李敏,刘涤尘.基于改进回归法的电力负荷预测[J].电网技术,2006,30(1):99-104.

[3] 蒋燕,王少杨,封芸.基于递归等权组合模型的中长期电力负荷预测[J].电力系统及其自动化学报,2012,24(1):151-155.

[4] 陈泽淮,张尧,武志刚.RBF神经网络在中长期负荷预测中的应用[J].电力系统及其自动化学报,2006,18(1):15-19.

[5] 陆宁,周建中,何耀耀.粒子群优化的神经网络模型在短期负荷预测中的应用[J].电力系统保护与控制,2010,38(12):65-68.

[6] 张雪君,陈刚,周杰,等.基于粒子群优化鲁棒支持向量回归机的中长期负荷预测[J].电力系统保护与控制,2009,37(21):76-80.

[7] GHELARDONI L,GHIO A,ANGUITA D.Energy load forecasting using empirical mode decomposition and support vector regression[J].Smart Grid,IEEE Transactions on,2013,4(1):549-556.

[8] 王志征,余岳峰,姚国平.主成份分析法在电力负荷预测中的应用[J].电力需求侧管理,2003,5(3):21-24.

[9] 吴钰,王杰.综合最优灰色支持向量机模型在季节型电力负荷预测中的应用[J].华东电力,2012,40(1):18-21.

[10] 崔和瑞,刘冬.区域电力负荷中长期预测复杂性研究[J].华东电力,2011,39(8):1 233-1 237.

(编辑 胡小萍)

Medium and Long-term Load Forecasting Based onMulti-factors Modified Psosvm Algorithm

CAO Yukun, SHUAI Hao

(SchoolofComputerScienceandTechnology,ShanghaiUniversityofElectricPower,Shanghai200090,China)

Medium and long-term load forecasting as an important part of the electric power planning and scheduling,its influence factors have diversity,uncertainty,etc.Article selection of support vector machine (SVM) is the core of the medium and long-term load forecasting algorithm,screening of a variety of regional macroeconomic factors uses particle swarm optimization (PSO) and the improved algorithm of loop optimization of support vector machine (SVM) parameters optimization,load forecasting.The simulation results show that the modified PSOSVM algorithm has a high prediction precision.

medium and long-term load forecasting; macro factors; PSO and cross validation optimization; modified PSOSVM algorithm; support vector machine

10.3969/j.issn.1006-4729.2016.06.021

2016-01-16

简介:帅浩(1991-),男,在读硕士,江苏江都人.主要研究方向为电力大数据下的负荷预测.E-mail:shuaihao23@126.com.

TM715;TP18

A

1006-4729(2016)06-0603-06

猜你喜欢
改进型步长向量
向量的分解
Cr5改进型支承辊探伤无底波原因分析
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
聚焦“向量与三角”创新题
改进型CKF算法及其在GNSS/INS中的应用
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
基于逐维改进的自适应步长布谷鸟搜索算法
改进型逆变器无效开关死区消除方法
改进型抽头电感准Z源逆变器