何轩,王永庆,温步瀛
(1.福州大学电气工程与自动化学院,福建闽侯 350108;2.国网陕西省电力公司电力科学研究院,陕西西安 710054)
基于粒子群算法优化支持向量机的专用工程费用量化研究
何轩1,王永庆2,温步瀛1
(1.福州大学电气工程与自动化学院,福建闽侯350108;2.国网陕西省电力公司电力科学研究院,陕西西安710054)
针对电力专用工程费用的复杂性且易受各种因素影响的问题,以某地区专用工程数据为基础,参考国内其他地区的收费标准,提出了一种基于粒子群算法优化支持向量机的专用工程费用预测。通过历史的专用工程费用数据样本对支持向量机进行训练,利用训练的模型对专用工程费用进行预测。同时用粒子群优化算法优化支持向量机的关键参数,提高专项工程费用的预测精度。
专项工程;粒子群优化;支持向量机
为了满足不断增长的电力需求,需要进行大量电网基础设施建设。2015年3月中央已明确提出鼓励社会资本投资配电业务,巨大的投资和繁重的建设任务将对工程费用测算提出更高的要求。
专用工程输电价指电网经营企业利用专用工程提供电能输送服务的价格。同时,随着供、配电贴费停止收取,电力专用工程的建设和出资形式发生了改变,由供电企业统一建设转型为用户可根据自身情况自购或自建,从而提高工程建设的效率,降低了工程的成本[1]。用户接入工程市场化的同时,也发现许多需要解决的问题,如用户投资建设缺乏后期维护与更新改造的能力;供电部门对用户专用工程建设、维护及更新改造的监管缺少法规和政策依据;对专用工程无法实行统一的规划,造成布局混乱及工程建设和管理分散。
基于此,电力专用工程费用的量化研究显得尤为重要,其不仅可以为专用工程同一收取提供参考依据,而且可保障电网的安全稳定运行[2]。
当前国内对于输电工程造价的预测研究,主要从多元线性回归分析[3]、灰色关联度[4]、支持向量机[5]等方法入手。多元线性回归和灰色关联度计算法在一些特定的历史时期内或者工程中能较快地对工程造价进行预测,但是普遍都有把竞争中最活跃的因素固定化的缺点,忽略资金随时间的变化量,缺乏动态性。而粒子群优化算法优化简单,全局优化问题性能卓越。支持向量机如今已经被运用到很多优化中。所以本文将采用粒子群优化的支持向量机等方法进行专用工程费用模型的研究。
1.1支持向量机理论
支持向量机是一种基于统计学习理论和结构风险最小化原理的算法,在函数拟合问题中就称为支持向量回归。并且支持向量机引入了特征空间和核函数的概念,把非线性问题映射到特征空间,然后在高维特征空间中当作线性问题解决,同时解决了“维数灾难”问题。在新的高维线性空间中求取最优线性分类面来分离训练样本,将寻找最优线性回归超平面的算法归结为求解一个凸约束条件下的一个凸规划问题,求取全局最优解[6]。
所以支持向量回归的基本思想是:首先通过一个非线性映射函数φ将数据x映射到高纬特征空间F,然后在该高维特征空间F进行线性拟合。SVR的拟合函数可得出
式中:l为支持向量的数目;αi和α*i为拉格朗日乘子;k(x,xi)=φ(x)φ(xi)为核函数;b为阀值。
选择一个合适的核函数k(x,xi),就可以实现非线性变换后的线性回归。
1.2粒子群优化算法
粒子群优化算法是群体智能的一个新的分支,通过个体协作来寻找最优解。所有的粒子都有一个由被优化的函数决定的适应值,每个粒子还有一个速度决定它们的方向和距离[7]。粒子群初始化为一群随机粒子,然后通过迭代找到最优解。在每一次迭代中,粒子通过跟踪2个“极值”来更新自己。第一个就是粒子本身所得到的最优解,另一个极值是整个种群目前找到的最优解。这样可以找到支持向量机中的最优参数,提高预测精度。
1.3基于粒子群算法的支持向量机参数优化
由于支持向量回归的泛化性能依赖于核参数C和误差惩罚参数γ,所以对(C,γ)参数集进行寻优是十分关键的。因此本文采用粒子群优化算法来寻求最优参数子集(C,γ)。
首先载入已有的数据,初始化一组核参数C和误差惩罚参数γ作为粒子的初始位置。把全部数据均匀地分为n个互不包含的子集m1,m2,…,mn。根据现有的核参数C和误差惩罚参数γ训练模型,选用均方根误差(root-mean-square error,RMSE)作为适应度函数来反映出支持向量回归的性能其表达式为:
式中:n为训练样本数;mi和分别为第i个训练样本目标量的实测值和预测值。根据泛化误差寻找最优的核参数C和误差惩罚参数γ[8]。
核参数C和误差惩罚参数γ的优化步骤如下:
1)读取以后样本,初始化一组核参数C和误差惩罚参数γ作为粒子的初始位置。
2)把全部样本数据均匀分为n个互不包含的子集X={m1,m2,…,mn}。
3)根据当前的核参数C和误差惩罚参数γ训练模型,计算交叉验证误差:假设i=1;把子集m1作为检验集,其余的子集一起作为训练模型的训练集;根据计算m1的泛化误差;然后i=i+1,重复上一步,直到i=k+1;最后把k次泛化误差作为交叉验证误差。
4)上一步交叉验证误差作为适应值,并记录个体最佳适应位置和群体最佳适应位置。找到这2个最优值时,粒子群根据式(1)和式(2)更新自己的速度和位置,寻找更好的核参数C和误差惩罚参数γ。
5)当迭代次数达到所要求的最大迭代次数或者获得了满足要求的粒子适应函数值时,终止迭代,输出结果。否则返回第3步继续计算,直至达到最大迭代的次数或获得满足要求的粒子适应值为止。
2.1相关性分析
对专用工程的影响因数很多,从历史工程经验中可知主要的影响因素是线路长度、输送容量、风速、地形系数。
在SPSS19.0软件中进行偏相关分析,取相关性系数0.5为界限,结果显示与工程实际费用的相关性最密切的属性如表1所示。通常认定相关性系数大于0.5为强相关,即风速与地形系数相关性系数为弱相关,线路长度与输送容量为强相关[9]。
2.2模型的建立
专用输电工程费用影响因素很多,参考我国原有的供、配电贴费政策和国内多个地区的收费政策,根据实际工作的情况以及相关性分析,把专用工程费用分为容量费用与线路长度费用,可通过分别求取容量单价及线路单价为专用工程费用核算提供参考依据。
表1 元素相关性Tab.1 Element correlation table
针对专用工程造价的主要影响因数,考虑到主要的影响变量为容量费用与线路长度费用。所以以配电变压器容量和线路长度作为输入变量,以实际工程费用作为输出变量进行学习训练。建模时首先用24个训练样本数据对粒子群优化支持向量机进行回归训练学习,通过不断地训练和调整后,经粒子群算法寻优得到的SVR最佳参数g=0.01,c=83.17,然后利用建立的模型对样本数据进行预测[10]。
表2为某地区专用工程案例数据,利用MATLAB编程分别进行传统多元线性回归预测、支持向量回归预测和粒子群优化支持向量回归预测,求取多变量模型。
表2 某地区专用工程案例数据表Tab.2 Case data sheet of a specific power transmission project in a certain area
针对这3种预测方法进行测算,结果见表3,相对误差分析如图1所示。
表3 几种方法测算结果对比Tab.3 Comparison of several methods to calculate the results
图1 二元线性回归残差图Fig.1 Multivariate linear regression residuals chart
根据表3,分别算出全样本数据3种方法的平均相对误差及残差图,图2为支持向量回归残差图,图3为粒子群优化支持向量回归线差图。
二元线性回归平均相对误差:
支持向量回归平均相对误差:
图2 支持向量回归残差图Fig.2 Support vector machine regression residuals chart
粒子群优化支持向量回归平均相对误差:
图3 粒子群优化支持向量回归残差图Fig.3 Particle swarm optimization support vector machine regression residuals chart
由表3可以看出,虽然有个别数据比优化前误差更大,但在允许范围内。总体上看,优化后的预测数据跟真实数据的平均相对误差更小,模型精度比优化之前的模型精度要高。因为数据中变压器容量的范围很大,可以看出在变压器容量较小时,预测的误差会偏大,实际工程中在小容量的线路模型可能会出现偏差。
本文按照实际工程实际需求,提出基于粒子群算法优化支持向量机的专用工程费用量化模型,并与原有的二元线性回归和支持向量机的预测模型进行对比,提高了算法精度,较好解决了专用工程费用量化的问题,为专用工程费的预测提供了可靠的依据。本文局限是虽然利用优化后参数的支持向量回归模型提高了整体的预测精度,但是个别数据由于算法本身不确定性限制,使个别数据误差偏大,有待进一步研究。
[1]党晓峰.750 kV输电工程造价分析[J].电网与清洁能源,2009,25(11):37-39.DANG Xiaofeng.Cost analyses of 750 kV transmission projects[J].Power System and Clean Energy,2009,25(11):37-39(in Chinese).
[2]刘志鹏.浅析输变电工程的造价管理[J].电子制作,电脑维护与应用,2015(2):260.LIU Zhipeng.Cost management of power transmission project[J].Computer Maintenance and Application,2015(2):260(in Chinese).
[3]王黎明,陈颖,杨楠,等.应用回归分析[M].上海:复旦大学出版社,2008.
[4]赵学明.基于一元回归法和灰色预测模型GM(1,1)的工程项目成本预测[J].华北电力大学学报(社会科学版),2011(S2):114-117.ZHAO Xueming.Project cost forecast based on one element regression method and grey forecasting model GM(1,1)[J].Journal of North China Electric Power University(Social Science Edition),2011(2):114-117(in Chinese).
[5]王绵斌,李欢欢,谭忠富,等.基于支持向量机方法的输电工程造价指标评估体系[J].电力建设,2014(3):102-106.WANG Mianbin,LI Huanhuan,TAN Zhongfu,et al.Evaluation system of transmission cost index based on support vector machine method[J].Electric Power Construction,2014(3):102-106(in Chinese).
[6]丁龙,郝虎在,吕玉祥,等.基于支持向量机回归法的绝缘子污闪电压预测研究[J].电瓷避雷器,2014,57(1):23-25.DING Long,HAO Huzai,LÜ Yuxiang,et al.Research on the prediction of the pollution flashover voltage of insulators based on support vector machine regression[J].Insulators and Surge Arresters,2014,57(1):23-25(in Chinese).
[7]王宏志,陈帅,侍洪波.基于最小二乘支持向量机和PSO算法的电厂烟气含氧量软测量[J].热力发电,2008,37(3):35-38.WANG Hongzhi,CHEN Shuai,SHI Hongbo.Soft sensing of oxygen content in power plant based on least square support vector machine and PSO algorithm[J].Thermal Power Generation,2008,37(3):35-38(in Chinese).
[8]舒服华,张望祥.最小二乘支持向量机预测绝缘子等值附盐密度[J].高压电器,2008,44(5):420-423.SHU Fuhua,ZHANG Wangxiang.A prediction model for insulator's ESDD based on least square support vector machine[J].High Voltage Apparatus,2008,44(5):420-423(in Chinese).[9]宋九飞.影响500 kV送电线路工程造价敏感因素分析[J].电力建设,2007,28(4):42-44.SONG Jiufei.Analysis of the factors affecting the cost of 500 kV power transmission line project[J].Electric Power Construction,2007,28(4):42-44(in Chinese).
[10]夏向阳,徐林菊.考虑谐振基于改进PSO算法的电容器优化配置[J].电力电容器与无功补偿,2012,33(2):7-11.XIA Xiangyang,XU Linju.Optimal allocation of the capacitor based on improved PSO algorithm considering harmonic resonance[J].Power Capacitor&Reactive Power Compensation,2012,33(2):7-11(in Chinese).
(编辑冯露)
Quantization Research on Special Power Transmission Project Cost Based on Particle Swarm Optimization and Support Vector Machine
HE Xuan1,WANG Yongqing2,WEN Buying1
(1.School of Electrical Engineering and Automation,Fuzhou University,Minhou 350108,Fujian,China;2.Shaanxi Electric Power Research Institute,Xi'an 710054,Shaanxi,China)
To address the complexity of the specific cost of the power transmission project and its proneness to be affected by various factors,based on the data of a specific power transmission project in a certain area and with reference to the costing standards in other regions of China,this paper puts forward a cost prediction method for the special transmission line based on Particle Swarm Optimization and Support Vector Machine.The historical project cost growth data samples are used to train the support vector machine(SVM),and the training model is used to forecast the cost of the line.At the same time Particle Swarm optimization is used to optimize the key parameters of the support vector machine to improve the prediction accuracy of the project cost.
special power transmission project;Particle Swarm Optimization(PSO);support vector machine(SVM)
1674-3814(2015)12-0027-04
TM-9
A
2015-06-29。
何轩(1991—),男,在读硕士研究生,研究方向为电力系统优化运行与电力经济;
温步瀛(1967—),男,博士,教授,研究方向为电力系统优化运行、电力市场和风电并网运行。
福建省自然科学基金项目(2013J01176)。
Project Supported by Natural Science Foundation of Fujian Province(No.2013J01176).