聂 鹏,宋 坤,田 莉,肖 白
(1.东北电力大学电气工程学院,吉林吉林132012;2.辽宁省电力有限公司电力经济技术研究院,沈阳110015;3.吉林省吉林供电公司,吉林吉林132001)
在电力负荷迅猛增长和城市电网快速建设的发展趋势下,SLF逐渐受到相关部门的重视。SLF不仅要预测未来负荷的大小,还要预测未来负荷增长的位置[1]。SLF可依据负荷总量预测的顺序划分为两类:自上而下的SLF方法是由负荷总量“分配”到供电范围内各元胞进而得到负荷分布情况的方法,例如用地仿真法[2-6]和多变量法[7];自下而上预测方法则是根据负荷分布的预测结果来累积求取负荷总量的方法,例如负荷密度指标法(有些文献也称分类分区法)[8,9]。然而在我国城市配电网规划中用地仿真法应用较少,主要由于用地仿真法在用地规划明确的情况下适用性并不强,并且预测精度受到分类负荷密度指标的制约[10];传统的负荷密度指标法并未深入挖掘影响负荷密度的各因素之间的关系,则是以聚类分析和简单计算等方法为相关专家的经验判断提供依据。
本文以文献[8]中元胞历史负荷数据为基础,提出基于SVM的城市电网SLF方法,利用SVM预测模型对元胞目标年负荷最大值进行预测并与其他方法的预测结果进行误差比较,通过吉林市城网实例分析验证该方法的可行性和有效性。
基于SVM的城市电网SLF方法是通过建立SVM预测模型来实现空间负荷预测的。该方法首先以等大小网格划分生成元胞,获得各元胞年负荷最大值,然后对各元胞建立SVM预测模型,其中采用PSO算法进行参数寻优,通过所建立的SVM模型预测元胞目标年负荷最大值,最后对预测结果进行误差分析。该方法的总体流程如图1所示。
图1 空间负荷预测总体流程
SVM是以统计学习理论的VC维理论和结构风险最小原理为基础的数据挖掘方法,为模式识别和回归问题提供解决方案,如今已推广应用于预测和综合评价等领域和学科中[11,12]。
SVM的原理是确定最优分类超平面,在保证分类精度的同时,能够达到超平面两侧空白区域最大化的目标。
训练样本集为(xi,yi),yi∈ {± 1},i=1,…,l,超平面记作(ω·xi)+b=0,则设定如下约束条件:分类间隔表示为2/ ω,所以在上述约束条件下解决最优超平面的建立问题:
该最优化问题转化为Lagrange函数进行解决:
式中:ai为Lagrange乘子。最优化问题的解由Lagrange函数的鞍点决定,且最优化问题的解在鞍点处满足对ω和b的偏导为0,得到最优权值向量ω0和最优偏置b0,分别为:
将式(3)和式(4)代入式(2)中,得到在非负象限ai≥0中的最大化泛函为:
SVM对于非线性问题的处理思路是通过核函数将输入向量映射到高维的特征向量空间从而构建最优分类面,核函数表达式为:
常见的核函数形式有线性核函数,多项式核函数和高斯核函数等。采用核函数技术将非线性问题转化为线性问题求解,最终求得最优分类函数为:
核函数的引入使目标函数避免了复杂的高维运算,而只需通过选取核函数来计算支持向量与特征空间中向量的内积。
PSO算法是通过模拟鸟群活动行为而发展起来的随机搜索算法,通过个体信息的共享能力使得群体运动由无序向有序的演化,从而实现最优化问题的求解,该算法的流程如下:
(1)随机选取微粒i的初始位置xi0与速度vi0,并设目标函数f(xij)为微粒i在位置xij上的适应值;
(2)微粒i经历过的最好位置为xij,j=1,…,n,选取适应值最好的位置作为微粒i的当前位置xibest;
(3)比较各微粒当前位置的适应值f(xibest),选取全局中适应值最好的位置xbest;
(4)根据全局最好位置对各微粒的位置和速度进行进化;
(5)若未满足结束条件(最佳适应度或最大迭代数),则返回步骤(2)循环执行。
将PSO算法与SVM相结合,采用PSO算法对SVM模型的参数进行优化选取,以此提高SVM模型的适应度和预测精度。
1983年H.L.Willis对空间负荷预测明确定义,即根据电压等级和用地规划等因素,按某一规则划分供电区域生成元胞,依据元胞负荷历史数据以及土地利用特征和发展规律的分析来预测各元胞内电力用户数量、负荷值和相关的时间参数[13]。划分规则的不同将导致SLF的方法和结果不同,其中划分供电范围的方法通常可分为2类。
1)按照等大小网格划分的规则生成元胞,网格形状可为三角形、四边形、六边形或其他形状,如图2(a)所示。元胞负荷数据并不能直接获得而是通过计算间接得到,因此各元胞与电力系统之间不存在匹配关系。
2)按照电力设备、供电单位或行政区的供电范围划分的规则生成元胞,例如馈线、变电站、供电局、市的供电范围,如图2(b)所示。利用电力设施相关表计可直接获取元胞负荷数据,因此各元胞与电力系统之间存在匹配关系[14]。
图2 供电区域划分
等大小网格划分生成的元胞表现负荷空间分布直观清晰,元胞大小调整灵活,位置可坐标表示,然而供电范围划分生成元胞的范围并不固定而是逐年变化,且其面积相对较大,对于城市电网的SLF而言并不适合。
相对于遵循经验风险最小化归纳原则的神经网络方法,SVM则实现了结构风险最小化(structural risk minimization,SRM)的归纳原则,对于有限样本高维模型的构造问题有了更好的解决方案,而且构建模型的预测性能更好,则SVM是针对有限样本的数据挖掘方法。而元胞负荷具有非线性增长[15]的特性,所以本文利用SVM模型来预测元胞负荷,
其步骤如下:
1)元胞序号:所生成的元胞可用C(i,j)表示,i和j分别表示元胞位置在第i列和第j行,则元胞C(i,j)在t0至tk年的负荷最大值为{Pt|t=t0,…,tk},t为年份;
2)获取元胞负荷数据:对各元胞历年负荷最大值进行采集,对于没有历史负荷数据的空白小区直接跳过不采集,并不作为预测对象;
3)确定训练样本:针对各元胞分别建立SVM预测模型,将各元胞年负荷最大值及其对应的年份作为训练样本的因变量和自变量。如:对元胞C(3,4)进行预测,则元胞C(3,4)的年负荷最大值Pt及其对应的年份t(t=t0,…,tk)分别作为训练样本的因变量和自变量;
4)选择核函数:采用高斯核函数的SVM可获得较为平滑的估计,由于其核值的范围为(0,1),计算过程比较简单,所以本文中的SVM预测模型选取高斯核函数将具有良好的推广能力,如下式
5)参数寻优:惩罚参数c和高斯函数核宽度σ的合理选择,对于SVM的泛化能力和拟合效果有很大的影响。采用PSO算法对SVM模型进行参数寻优,该算法流程为随机选取初始参数c和σ,设误差函数e(c,σ2)作为适应值,根据适应值的比较选取最佳参数组合,并对c和σ进行逐步修正;此时如适应值或迭代数达到指定值的要求,则结束寻优,否则循环以上步骤。
6)建立SVM预测模型:将各元胞的训练样本输入SVM建模程序中,同时采用PSO算法进行参数寻优,最后得到各元胞对应的SVM预测模型。
将待预测元胞的目标年份作为输入向量代入其对应的SVM预测模型中,预测程序计算输出该元胞目标年负荷最大值。对下一个元胞重复执行以上步骤,直到求出目标年所有元胞的负荷最大值,最终实现空间负荷预测。
预测结果与实际值之间的预测误差是客观存在的,结果的准确性往往以预测误差来体现,两者存在紧密的关系。预测误差的研究不但起到评价预测方法准确程度的作用,为预测资料的利用和计划决策的确定提供重要的参考价值,而且在负荷预测改进的研究中,对检验和选取恰当的预测方法等方面也有较大的帮助。针对基于SVM的SLF方法进行误差分析,只选取部分预测结果则不能表现预测方法的适用性,所以选取均方误差作为误差分析的综合指标,同时各相对误差区间内元胞个数占元胞总数的百分比也作为误差分析的依据。
以东北某城市的一个行政区配电网为例,用边长为300 m的正方形网格划分生成元胞,如图3所示;以2004-2008年各元胞的负荷最大值作为历史负荷数据,预测各元胞2009年负荷最大值,以此说明本文SLF方法的模型和算法。
对该区域内所有元胞(816个)进行历史年负荷最大值采集,对于无历史负荷数据的空白小区直接跳过不采集,得到380个元胞(图3中黄色元胞)的年负荷最大值,表1为各元胞的历年负荷最大值。
图3 元胞生成示意图
表1 各元胞的历年负荷最大值(单位:kW)
将各元胞年负荷最大值及其年份作为SVM预测模型训练样本,采用PSO算法对预测模型进行参数寻优,惩罚参数c和高斯函数核宽度σ的初始值分别设为c=1和σ=0.1,最大迭代次数为100次,得到各元胞SVM预测模型的最优参数;然后通过各元胞的SVM预测模型计算出2009年该元胞的负荷预测值,同时采用线性回归,灰色理论和指数平滑的预测方法与基于SVM的SLF方法作对比分析,表2为各方法的预测结果和负荷实际值。
表2 各方法的预测结果和负荷实际值
求取各方法预测结果的相对误差,并统计在相对误差区间内元胞个数占元胞总数的比例,同时计算出各方法的均方误差,以此对各方法预测结果进行误差比较分析,如表3所示。
表3 各方法的预测结果评估
由表3得知,基于SVM的SLF方法在0%-10%的误差区间内元胞所占比例为57.90%,而且该方法预测结果的均方误差为各方法中最小的;与此同时,线性回归和指数平滑的预测方法中有相对较少元胞的相对误差在10%以下,灰色理论方法在10%以下的误差区间内元胞个数所占比例为51.85%,则基于SVM的SLF方法优于线性回归和指数平滑预测方法,预测效果与灰色理论模型相近。
本文对基于SVM的城市电网SLF方法进行了详尽的表述,建立SVM模型预测各元胞目标年的负荷最大值,实现了空间负荷预测。对吉林市城市电网进行实例分析,预测结果验证该方法的适用性和有效性。
1)利用SVM理论解决有限样本的非线性问题,挖掘元胞负荷非线性增长的特性,对各元胞的年负荷最大值进行预测,显著地提高了预测精度;
2)采用PSO算法对SVM预测模型的参数进行优化选取,提高了预测模型的适应度;
3)与其他方法的预测结果进行对比,误差分析说明该方法具有误差较小,精度较高的优点,因此该方法有较强的理论性和实用性;
[1]周湶,孙威,任海军,等.基于最小二乘支持向量机和负荷密度指标法的配电网空间负荷预测[J].电网技术,2011,35(1):66-71.
[2]吴蓓,丁明,陈闽江.基于模糊推理和多目标规划的空间负荷预测[J].电网技术,2004,28(15):48-52.
[3]雷绍兰,孙才新,周湶,等.模糊粗糙集理论在空间电力负荷预测中的应用[J].电网技术,2005,29(9):26-30.
[4]Wu Hung-chih,Lu Chan-nan.A data mining approach for spatial modeling in small area load forecast[J].IEEE Transactions on Power Systems,2002,17(2):516-521.
[5]余健明,燕飞,杨文宇,等.基于模糊多目标多人决策的配电网空间负荷预测[J].电网技术,2006,30(7):69-72.
[6]王天华,王平洋,范明天.遗传算法、模糊逻辑和运输模型在配电网空间负荷预测中的应用[J].电网技术,1999,23(1):24-28.
[7]肖白,杨修宇,穆钢.基于多变量分析的城市电网空间负荷预测方法[J].东北电力大学学报,2012,33(1/2):39-44.
[8]肖白,杨修宇,穆钢,等.基于负荷密度指标法的SLF[J].电网技术,2014,38(4):1014-1019.
[9]王成山,黄纯华,葛少云,等.一个实用的城市电力负荷密度预测系统[J].电网技术,1992,16(6):41-46.
[10]肖白,周潮,穆钢.空间电力负荷预测方法综述与展望[J].中国电机工程学报,2013,33(25):78-92.
[11]丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10.
[12]谢宏,魏江平,刘鹤立.短期负荷预测中支持向量机模型的参数选取和优化方法[J].中国电机工程学报,2006,26(22):17-22.
[13]肖白,穆钢,杨右虹,等.基于 GIS的空间电力负荷预测平台的研究与开发[J].中国电力,2010,43(10):53-56.
[14]肖白,黎平.最佳电力负荷空间分辨率的获取方法[J].中国电机工程学报,2010,30(34):50-56.
[15]肖白,黎平.城网空间电力负荷预测中的负荷规律性分析[J].电网技术,2009,33(20):113-119.