基于支持向量机的城市小区燃气管网日负荷预测模型

2014-11-10 12:35张建秋
科技创新导报 2014年12期
关键词:支持向量机

张建秋

摘 要:该文使用支持向量机中的两种核函数,采用grid-search算法、遗传算法、粒子群算法优化参数,建立对吉林市某小区燃气管网日负荷预测的支持向量机模型。将日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄作为燃气管网日负荷变化密切相关的主要影响因素,分别作为支持向量机的输入量,将小区人员临时出差、小区临时增加暂住人口等随机因素作为燃气管网日负荷变化密切相关的次要影响因素,将随机因素统一归为支持向量机的一个输入量。采用[0,1]归一化方法,对作为影响因素的输入量数据与日负荷预测输出量数据进行归一化处理。对节假日和工作日的燃气管网日负荷预测采用独立处理方法,避免了相互之间的干扰影响。试验结果表明,采用径向基核函数的支持向量机预测模型对燃气管网日负荷预测拟合程度达到90%以上。

关键词:燃气管网 支持向量机 日负荷预测

中图分类号:TP391.4 文献标识码:A 文章编号:1674-098X(2014)04(c)-0099-04

城市小区燃气管网的日负荷指标是城市燃气的基础工作,对分析燃气管网的年负荷、月负荷具有重要指导意义,并且燃气经营企业对燃气管网的日负荷及预测情况日益重视[1]。燃气管网日负荷数据的变化规律十分复杂,主要同天气、气温、终端用户人口数量等因素密切相关,并且国家法定节假日的日负荷变化与工作日亦不相同。传统的燃气管网日负荷预测方法主要有回归综合位移平均模型、多元主要有线性回归法、三角函数模型、BP神经网络法等[2],试验结果表明这些预测方法具有一定的精度[3-5]。但上述方法所需样本数据较多,并且样本数据越多,上述方法得到的预测模型泛化能力越强,可信度越高。

支持向量机(SVM)是机器学习研究重大成果,其具有泛化能力强、全局寻优的特点,尤其具有所需样本数据少的特点[6]。SVM利用松弛变量和核函数[7],针对样本数据线性不可分的情况,在高维空间寻找其最优分类面。

该文将吉林市某小区燃气管网的日负荷作为研究对象,将燃气管网日负荷变化密切相关的主要影响因素——日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄,作为SVM的6个输入量,将燃气管网日负荷变化密切相关的次要影响因素——小区人员临时出差、小区临时增加暂住人口等随机因素,统一作为SVM的1个输入量,利用不同核函数、不同参数的支持向量机建立吉林市某小区燃气管网日负荷预测模型,通过该预测模型得到该小区的燃气管网日负荷预测值。

1 支持向量机

1.1 支持向量机原理

设表示线性函数,其表达式为: (1.1)

其中:为偏置,为可调权值向量,决策规则:,将称为超平面(Hyper Plane)。由式定义超平面L,L将输入空间X划分成两部分,如图1所示。

显然,有许多分类超平面可以将图1中的“圆圈”和“五角星”两类点正确区分开。

取训练样本{},其中:为第i个样本,。对于线性可分训练集存在超平面L:,即式1.2和式1.3。

, (1.2)

, (1.3)

定义超平面L1:,,设为超平面L1上的一点;超平面L2:,,为超平面L2上的一点。和满足式1.4和式1.5。

(1.4)

(1.5)

超平面L1与超平面L2之间间隔为式1.6。

(1.6)

寻找超平面L1和L2间隔最大化的平面——最优超平面,即为二次规划问题,如式1.7和式1.8所示。

(1.7)

s.t (1.8)

利用lagrange乘子法解决上述二次规划问题,建立lagrange函数如式1.9所示。

(1.9)

其中为lagrange乘子。

将lagrange函数对,求其最小值,对求其最大值,解、和在函数的鞍点上满足式1.10和式1.11。

(1.10)

(1.11)

将式1.10代入lagrange函数式1.9,利用式1.11可得原优化问题的对偶问题,可构造出最优超平面,如式1.12、式1.13和式1.14所示。

(1.12)

s.t. (1.13)

(1.14)

基于最优超平面的分类规则如式1.15所示。

(1.15)

1.2 核函数

对于二维空间的线性不可分数据群,为构造最优超平面,其函数表达式如式1.16所示。

(1.16)

构造向量y和a,如式1.17和式1.18所示。

(1.17)

(1.18)

可转化为,即式1.19。

(1.19)

可见,映射到四维空间后,原来在二维空间中一个线性不可分的问题变成了线性可分,构造函数,其满足式1.20和式1.21。

(1.20)

(1.21)

其中,为低维空间多维常量,为低维空间多维变量,为由映射到高维空间的对应常量,为由映射到高维空间的对应向量。

若只需将低维空间的输入代入式1.20,计算即可得到高维空间的线性分类函数,则函数称为核函数,能使得上述式1.20和式1.21中的两个函数计算结果完全一致。

2 燃气管网日负荷的影响因素及数据处理

本文以吉林市某小区燃气管网日负荷为研究对象,时间为2012年9月份非节假日和节假日,非节假日的时间跨度为2012年9月份工作日,即9月3日至9月7日、9月10日至9月14日、9月17日至9月21日、9月24日至9月29日,节假日的时间跨度为2012年9月份中的部分法定节假日,取9月8日、9日、15日、16日、22日、23日、30日。将日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄作为影响小区燃气管网日负荷的主要因素,分别作为SVM的6个输入量。将小区人员临时出差、小区临时增加暂住人口等随机因素作为影响小区燃气管网日负荷的次要因素,采用随机变量法统一作为SVM的1个输入量。将小区燃气管网日负荷实际消耗量作为SVM的输出量。由于温度、人员数量、人员年龄等数据单位不同,会引起数据数量级差异,本文对日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄、随机因素、日负荷实际消耗量的数据进行[0,1]归一化,使所测数据归为一个数量级。工作日和节假日中小区燃气管网日负荷影响因素的归一化数据,分别如图2和图3所示。endprint

3 建立小区燃气管网日负荷的预测模型

3.1 支持向量机建模

本文采用多项式核函数(polynomial核函数),径向基核函数(radial basis function核函数),惩罚参数c和gamma值采用grid-search算法、遗传算法(GA)、粒子群算法(PSO)进行参数寻优。对以上组合所建立的不同支持向量模型进行交叉试验,寻求最优预测模型。利用该模型对工作日和节假日的小区燃气管网日负荷进行预测。

3.2 试验结果分析

寻求工作日小区燃气管网日负荷最优预测模型阶段,训练集时间跨度为9月3日至9月7日、9月10日至9月14日、9月17日至9月21日,预测集时间跨度为9月24日至9月29日;寻求节假日小区燃气管网日负荷最优预测模型阶段,训练集时间跨度为9月8日、9日、15日、16日、22日,预测集时间跨度为9月23日、30日。训练集和预测集的数据为日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄、随机因素、日负荷实际值。利用支持向量机中polynomial核函数和radial basis function核函数(RBF)、优化方法采用grid-search算法、遗传算法(GA)、粒子群算法(PSO)。对工作日、节假日小区燃气管网日负荷产生的预测效果分别见表1和表2。

由表1可见,采用radial basis function核函数和PSO优化算法的模型,可以实现工作日小区燃气管网日负荷预测集的拟合程度最高,达到了90.781 %。预测结果如图4、图5所示。

由表2可见,采用polynomial核函数和PSO优化算法的模型,可以实现节假日小区燃气管网日负荷预测集的拟合程度最高,达到了92.538 %。预测结果如图6、图7所示。

可见,支持向量机采用radial basis function核函数和PSO优化算法时,对工作日小区燃气管网日负荷预测集的拟合程度最高;采用polynomial核函数和PSO优化算法时,对节假日小区燃气管网日负荷预测集的拟合程度最高,均高于90%。

4 结语

该文采用多项式核函数、径向基核函数,利用支持向量机对吉林市某小区工作日、节假日的燃气管网日负荷建立预测模型,模型参数采用grid-search算法、遗传算法、粒子群算法进行优化,将日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄作为影响小区燃气管网日负荷的主要因素,将小区人员临时出差、小区临时增加暂住人口等随机因素作为影响小区燃气管网日负荷的次要因素,主要因素与次要因素统一作为SVM的输入量,日负荷预测值作为SVM的输出量。试验结果表明,采用支持向量机建立的城市小区燃气管网日负荷预测模型,其预测精度达到90%以上,为城市小区燃气管网年负荷、月负荷的进一步分析提供了理论依据、技术支持和试验方法。

参考文献

[1] 谭羽非.城市燃气管网日负荷预测的灰色神经网络模型[J].哈尔滨工业大学学报,2003,35(6):679-682.

[2] 朱刚.城市燃气管网负荷预测的研究[D].天津大学,2009.

[3] Potocnik, Primoz,Govekar. Short-term natural gas consumption forecasting[J].Proceeding of the International Conference on Applied Simulation and Modelling,2007(5):353-357.

[4] 杜元顺.煤气日负荷用的回归分析方法[J].煤气与热力,1982(4):26-28.

[5] 田一梅,赵元,赵新华.城市煤气负荷预测[J].煤气与热力,1998,18(14):20-23.

[6] 武海巍,于海业,张蕾.光合有效辐射预测模型的核函数组合优化[J].农业机械学报,2011,42(6):167-173.

[7] 武海巍.核函数与仿生智能算法在林下参光环境评价系统中的研究[D].吉林大学,2012.endprint

3 建立小区燃气管网日负荷的预测模型

3.1 支持向量机建模

本文采用多项式核函数(polynomial核函数),径向基核函数(radial basis function核函数),惩罚参数c和gamma值采用grid-search算法、遗传算法(GA)、粒子群算法(PSO)进行参数寻优。对以上组合所建立的不同支持向量模型进行交叉试验,寻求最优预测模型。利用该模型对工作日和节假日的小区燃气管网日负荷进行预测。

3.2 试验结果分析

寻求工作日小区燃气管网日负荷最优预测模型阶段,训练集时间跨度为9月3日至9月7日、9月10日至9月14日、9月17日至9月21日,预测集时间跨度为9月24日至9月29日;寻求节假日小区燃气管网日负荷最优预测模型阶段,训练集时间跨度为9月8日、9日、15日、16日、22日,预测集时间跨度为9月23日、30日。训练集和预测集的数据为日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄、随机因素、日负荷实际值。利用支持向量机中polynomial核函数和radial basis function核函数(RBF)、优化方法采用grid-search算法、遗传算法(GA)、粒子群算法(PSO)。对工作日、节假日小区燃气管网日负荷产生的预测效果分别见表1和表2。

由表1可见,采用radial basis function核函数和PSO优化算法的模型,可以实现工作日小区燃气管网日负荷预测集的拟合程度最高,达到了90.781 %。预测结果如图4、图5所示。

由表2可见,采用polynomial核函数和PSO优化算法的模型,可以实现节假日小区燃气管网日负荷预测集的拟合程度最高,达到了92.538 %。预测结果如图6、图7所示。

可见,支持向量机采用radial basis function核函数和PSO优化算法时,对工作日小区燃气管网日负荷预测集的拟合程度最高;采用polynomial核函数和PSO优化算法时,对节假日小区燃气管网日负荷预测集的拟合程度最高,均高于90%。

4 结语

该文采用多项式核函数、径向基核函数,利用支持向量机对吉林市某小区工作日、节假日的燃气管网日负荷建立预测模型,模型参数采用grid-search算法、遗传算法、粒子群算法进行优化,将日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄作为影响小区燃气管网日负荷的主要因素,将小区人员临时出差、小区临时增加暂住人口等随机因素作为影响小区燃气管网日负荷的次要因素,主要因素与次要因素统一作为SVM的输入量,日负荷预测值作为SVM的输出量。试验结果表明,采用支持向量机建立的城市小区燃气管网日负荷预测模型,其预测精度达到90%以上,为城市小区燃气管网年负荷、月负荷的进一步分析提供了理论依据、技术支持和试验方法。

参考文献

[1] 谭羽非.城市燃气管网日负荷预测的灰色神经网络模型[J].哈尔滨工业大学学报,2003,35(6):679-682.

[2] 朱刚.城市燃气管网负荷预测的研究[D].天津大学,2009.

[3] Potocnik, Primoz,Govekar. Short-term natural gas consumption forecasting[J].Proceeding of the International Conference on Applied Simulation and Modelling,2007(5):353-357.

[4] 杜元顺.煤气日负荷用的回归分析方法[J].煤气与热力,1982(4):26-28.

[5] 田一梅,赵元,赵新华.城市煤气负荷预测[J].煤气与热力,1998,18(14):20-23.

[6] 武海巍,于海业,张蕾.光合有效辐射预测模型的核函数组合优化[J].农业机械学报,2011,42(6):167-173.

[7] 武海巍.核函数与仿生智能算法在林下参光环境评价系统中的研究[D].吉林大学,2012.endprint

3 建立小区燃气管网日负荷的预测模型

3.1 支持向量机建模

本文采用多项式核函数(polynomial核函数),径向基核函数(radial basis function核函数),惩罚参数c和gamma值采用grid-search算法、遗传算法(GA)、粒子群算法(PSO)进行参数寻优。对以上组合所建立的不同支持向量模型进行交叉试验,寻求最优预测模型。利用该模型对工作日和节假日的小区燃气管网日负荷进行预测。

3.2 试验结果分析

寻求工作日小区燃气管网日负荷最优预测模型阶段,训练集时间跨度为9月3日至9月7日、9月10日至9月14日、9月17日至9月21日,预测集时间跨度为9月24日至9月29日;寻求节假日小区燃气管网日负荷最优预测模型阶段,训练集时间跨度为9月8日、9日、15日、16日、22日,预测集时间跨度为9月23日、30日。训练集和预测集的数据为日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄、随机因素、日负荷实际值。利用支持向量机中polynomial核函数和radial basis function核函数(RBF)、优化方法采用grid-search算法、遗传算法(GA)、粒子群算法(PSO)。对工作日、节假日小区燃气管网日负荷产生的预测效果分别见表1和表2。

由表1可见,采用radial basis function核函数和PSO优化算法的模型,可以实现工作日小区燃气管网日负荷预测集的拟合程度最高,达到了90.781 %。预测结果如图4、图5所示。

由表2可见,采用polynomial核函数和PSO优化算法的模型,可以实现节假日小区燃气管网日负荷预测集的拟合程度最高,达到了92.538 %。预测结果如图6、图7所示。

可见,支持向量机采用radial basis function核函数和PSO优化算法时,对工作日小区燃气管网日负荷预测集的拟合程度最高;采用polynomial核函数和PSO优化算法时,对节假日小区燃气管网日负荷预测集的拟合程度最高,均高于90%。

4 结语

该文采用多项式核函数、径向基核函数,利用支持向量机对吉林市某小区工作日、节假日的燃气管网日负荷建立预测模型,模型参数采用grid-search算法、遗传算法、粒子群算法进行优化,将日最高温度、日最低温度、日平均温度、小区人员最高年龄、小区人员最低年龄、小区人员平均年龄作为影响小区燃气管网日负荷的主要因素,将小区人员临时出差、小区临时增加暂住人口等随机因素作为影响小区燃气管网日负荷的次要因素,主要因素与次要因素统一作为SVM的输入量,日负荷预测值作为SVM的输出量。试验结果表明,采用支持向量机建立的城市小区燃气管网日负荷预测模型,其预测精度达到90%以上,为城市小区燃气管网年负荷、月负荷的进一步分析提供了理论依据、技术支持和试验方法。

参考文献

[1] 谭羽非.城市燃气管网日负荷预测的灰色神经网络模型[J].哈尔滨工业大学学报,2003,35(6):679-682.

[2] 朱刚.城市燃气管网负荷预测的研究[D].天津大学,2009.

[3] Potocnik, Primoz,Govekar. Short-term natural gas consumption forecasting[J].Proceeding of the International Conference on Applied Simulation and Modelling,2007(5):353-357.

[4] 杜元顺.煤气日负荷用的回归分析方法[J].煤气与热力,1982(4):26-28.

[5] 田一梅,赵元,赵新华.城市煤气负荷预测[J].煤气与热力,1998,18(14):20-23.

[6] 武海巍,于海业,张蕾.光合有效辐射预测模型的核函数组合优化[J].农业机械学报,2011,42(6):167-173.

[7] 武海巍.核函数与仿生智能算法在林下参光环境评价系统中的研究[D].吉林大学,2012.endprint

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究