改进粒子群算法支持向量机的烟台港货物吞吐量预测

2022-07-06 08:15秦圻周兆欣韩洋王士鹏马续仕
现代信息科技 2022年3期
关键词:支持向量机

秦圻 周兆欣 韩洋 王士鹏 马续仕

摘  要:为了精准预测港口货物吞吐量,文章研究了改进粒子群算法支持向量机模型。引入自适应惯性权重以及最优粒子扰动决策,来优化支持向量机中的惩罚参数C和核函数参数g。基于1978—2020年烟台港吐吞量进行实证分析,对比改进支持向量机模型和原本支持向量机模型的平均相对误差,预测效果优于SVM模型,因此为港口货物吞吐量提供技术支持。

关键词:核函数;支持向量机;改进粒子群算法;烟台港

中图分类号:TP18        文献标志码:A文章编号:2096-4706(2022)03-0133-05

Cargo Throughput Prediction of Yantai Port Based on Improved Particle Warm Optimization Support Vector Machine

QIN Qi, ZHOU Zhaoxin, HAN Yang, WANG Shipeng, MA Xushi

(School of Navigation and Shipping, ShanDong JiaoTong University, Weihai  264200, China)

Abstract: In order to accurately predict the cargo throughput of a port, this paper studies the improved Particle Swarm Optimization (PSO) support vector machine model. Adaptive Inertia Weight and optimal particle perturbation decision are introduced to optimize the penalty parameter C and kernel function parameter g in the support vector machine. This paper makes an empirical analysis based on Yantai Port throughput from 1978 to 2020, comparing the average relative error between the improved support vector machine model and the original support vector machine model, the forecasting effect is better than that of SVM model, therefore it provides the technical support for the port cargo throughput.

Keywords: kernel function; support vector machine; improved Particle Swarm Optimization; Yantai port

0  引  言

2021年,在全球疫情的影响下,港口作为对外贸易的重要枢纽,该如何面对困难,又该如何在疫情下突出重围,如何在加快建设以国内大循环为主体、国内国际双循环相互促进的新展格局上,扮演好港口作为枢纽的重要角色[1-3]?港口吞吐量决定了港口未来发展的方向,也对资源的配置起到了重要的作用,实施精准预测对港口建设和发展具有重要的意義[4]。目前,关于港口货物吞吐量的预测方法有很多[5],其中人工神经网络在处理非线性方面的能力很高,但是容易陷入局部最优的困境[6,7]。支持向量机在小样本非线性问题上有很强的解决问题的能力[8-10]。

目前,有很多学者通过优化或者改变支持向量机的参数来进行港口货物吞吐量的预测,Du P等人提出了基于变分模式分解、机器学习、最优化算法和误差修正策略的混合学习模型,用于集装箱吞吐量预测[11]。Li L等人研究了非线性子序列的选择性组合预测模型,对港口吞吐量进行预测[12]。陈锦文、兰培真改进型BP神经网络,将未来三年港口吞吐量作为输出层参数,利用tansig函数和logsig函数为传递函数,对深圳港集装箱吞吐量进行预测[13]。张雷雨、杨毅从影响集装箱吞吐量的若干因素出发,基于主成分分析和支持向量机回归算法的建模预测方法[14]。为了使支持向量机模型预测更加精准,刘路民根用网格搜索算法、遗传算法、粒子群算法分别进行径向基核参数寻优[15]。在港口货物吞吐量预测方面用得最多是时间序列法[16]。其中,时间序列法主要有季节性变化法[17]、灰色系统法[18]、马尔科夫法[19]、移动平均法[20]等。

烟台港作为环渤海地区重要的港口,也是“一带一路”倡议布局下的港口,对于它货物吞吐量的研究较少。本文首先介绍了支持向量机的原理,惩罚参数和核函数参数的选择影响着预测的精准性,因此,通过改进粒子群算法,来进行过参数的快速寻优,从而减少误差,提高了改进支持向量机模型的拟合能力,为烟台港在港口建设方面提供依据。

1  支持向量机基本理论

支持向量机(Support Vector Machine, SVM)是由前苏联教授Vapnik最早提出的[21]。支持向量机是一种新型机器学习算法,其基本思想把原有数据训练集映射到高维特征空间,借助损失函数和惩罚因子,从而达到精确度和计算复杂度相平衡[22],因此,可以将上述问题看作一个在高纬度的二次回归问题来进行求解,其函数表达式为:

f(x)=ω*φ(x)+b   (1)

其中,ω为超平面权重向量,根据文献得到回归支持向量机可以表示为:

(2)

(3)

其中,是松弛变量C,是正实数松弛惩罚因子。

非线性回归求解中,可以使用核函数K(xi,xj)=φ(xi)φ(xj)把所需要的训练集映射到高维空间,从而就可以将其变化到线性问题的拟合,可得到一样的效果,非线性拟合函数为:

(4)

则将问题转化为对偶求解:

(5)

其中,ηi,,ai,为拉格朗日乘子,b为阈值。

2  改进粒子群算法

2.1  自适应惯性权重

PSO算法由于需要调整的参数较少,因此鲁棒性高且更容易实现[23]。但是,粒子群算法的缺点就是寻优过程中出现收敛速度慢和陷入局部最优的问题,为了避免算法进入局部最优,可以从一开始粒子群进化速度和聚集度的变化,引入自适应惯性权重来调整其运动状态,表达式为:

(6)

ω=exp(-λ(k)/λ(k-1)) (7)

其中,k为迭代数,λ(k),为衡量惯性权重变化的平滑度,ω为惯性权重fgbest(PSi(k)为第i个粒子在第k次更新位置的时候对应的个体极值适应度值,fzbest(PSi(k))为第k迭代更新位置时候最优粒子对应的极值适应度值。

2.2  最优粒子扰动决策

粒子群算法在迭代过程中,随着次数的增加粒子之间呈现聚集的趋势从而降低了搜索的能力,容易跳入局部最优。粒子群算法的全局最优位置fgbest(t)在整个粒子群的寻优过程中具有较强的引导作用[24,25]。为了避免此问题的出现,需要在粒子群聚集过程中,改变全局最优的位置来进行干扰,从而增大粒子的活动范围,因此最优粒子的决策表达式为:

(8)

ri=|xi-avg_x| (9)

(10)

其中,avg_x(j)为粒子群所属粒子的中心位置第j纬,i为第i个粒子,r(i)为第i个粒子与粒子群中心位置的距离。式(10)为全部粒子到中心位置的平均距离。

若avg_r变大则表示粒子群比较分散,也就是说明粒子群还具有很强的多样性,此时只需要轻微的扰动全局最优位置,就可以增强粒子群的局部搜索能力。反之,则需要对全局最优位置进行更大的干扰,使得粒子增加搜索范围。

3  改进粒子群算法支持向量机模型

支持向量机中的惩罚参数C是模型对误差的容忍度,数值越大,容忍度越差;数值越低,欠拟合越容易。其次就是核函数参数g的选取对支持向量机的学习能力和预测精度有很大的影响。在使用支持向量机对数据进行训练时,为了使模型准确度达到一定的要求,需要不断地调整C和g的值,并对数据不断地进行交叉验证,以找到合适的C和g的值。

本文则使用改进的粒子群算法来快速寻优到最佳惩罚参数和核函数参数,为解决粒子群算法收敛慢及陷入局部最优的,通过引入自适应权重和最优粒子决策达到搜索平衡,以参数作为初始位置的粒子群一步一步走向全局最优,在最优位置fgbest(t)处迅速收敛。本模型中改进的粒子群算法主要搜索优化支持向量机中的惩罚参数C和核函数参g,在得到惩罚参数C和核函数参数g的最优值的基础上对烟台港货物吞吐量进行预测。

基本步骤:

第1步:根据初始化过程,将参数设置为粒子配置随机位置和速度。

第2步:为了使得粒子群能过扩大搜索区域,对其设置最优粒子干扰决策。

第3步:通过自适应权重及最优扰动,计算每个粒子的适应度值。

第4步:以參数作为粒子进行寻优,将所选取的适应值与当前粒子经历的最佳位置的适应值进行比较,如果适应值更好,则将其更新到当前最佳位置。

第5步:对于粒子群中的粒子,将当前粒子的适应值与所有全局粒子所经历的最佳位置的适合值进行比较,如果更好,则更新为当前全局最佳位置。

第6步:对于每个粒子的速度和位置按照一定规律进行优化。

第7步:当适应度值满足设置的最大迭代次数在结束条件允许下,反之需要返回第2步。

4  烟台港货物吞吐量实证分析

本文以烟台港货物吞吐量为研究对象选取了1978—2020年的数据进行模型验证数据来源国家统计年鉴如表1所示,其中以1978—2016的烟台港货物吞吐量为模型的训练数据,2017—2020年的吞吐量作为预测数据。本文才有对比的方法进行试验,一种采用基本的支持向量机模型,另外一种就是改进粒子群算法优化支持向量机模型。在进行预测模型训练之前,则需要对原本的数据归一化处理,将其大小限制在[0,1]之间,公式为:

(11)

其中,xj表示第j个样本烟台港货物量的归一化值,xmin,xmax,表示烟台港货物量存在的最小值和最大值。

4.1  优化模型训练

根据改进支持向量机模型,通过MATLAB 2016进行算法编写。改进支持向量机预测模型时将粒子群算法全局搜索能力设置为2,种群个数为40,最大迭代次数500,惯性因子设置为0.8,在适应度函数方面选取Griewank函数。最后,基于改进粒子群算法优化支持向量的参数经过迭代,得到SVM的最优参数C=217 226.657 238和g=1.683 678 926,如图1所示。

4.2  SVM预测

从图2(a)可看出,通过基本的支持向量机模型对烟台港货物吞吐量数据拟合时,由于需要人为设定SVM的参数,从而导致了拟合训练数据时出现了幅度较大的偏差,用设定的参数进行预测的时候,从图2(b)可以看出,预测的曲线与真实值有相当大的差别,预测效果较差。

通过改进粒子群算法,加入了自适应权重,使系统鲁棒性更高,再利用最优粒子扰动决策,来防止过拟合现象发生。以烟台港1978年—2016年货物吞吐量作为训练集。在预测时将粒子群算法全局搜索能力设置为2,种群个数为40,种群个数、最大迭代次数与参数取值的上下界保持一致,其中自适应度函数是将训练样本的拟合均方差与测试样本的预测均方差之和作为判别标准。经过改进支持向量机模型的拟合与测试图分别为图3(a)和图3(b)。

4.3  结果评价

通过相对误差进行改进支持向量机的有效性评价,也能体现其预测的精准度,表达式为:

(12)

如表2所示,对2017—2020年的烟台港货物吞吐量预测所产生的相对误差分别为0.7%、0.22%、0.91%、0.2%,结果与实际的结果很接近,其次相对误差都远小于基础支持向量机预测模型。因此表明改进支持向量机预测模型拥有较高的预测精度,为港口准确预测货物吞吐量提供理论依据和参考。

5  结  论

本文在对自适应权重以及最优粒子扰动决策来改进粒子群算法容易跳入局部最优的问题,用其对支持向量机的参数进行优化,选取1978年—2016年烟台港货物吞吐量数据进行模型的拟合和预测。为了检验此模型预测的精准度引入相对误差来进行评价,同时将改进的支持向量机模型与支持向量机模型进行对比,来证明经过改进的模型更加合理准确。实例表明,在改进粒子群优化算法支持向量机的预测的相对均误差为0.51%,要远远小于原本支持向量机模型的平均相对误差,预测效果优于SVM模型。该研究仅仅采用了改进粒子群算法对支持向量机的参数进行寻优,并没有将其他算法优化结果与之对比,在以后的研究中将会进一步完善。

参考文献:

[1] 贾大山,徐迪,蔡鹏.2020年沿海港口发展回顾与2021年展望 [J].中国港口,2021(S1):1-13.

[2] 李慧.基于Holt-Winters算法的长江干线货物吞吐量分析及预测 [J].中国水运,2021(4):29-32.

[3] 李香晖.通道建设“提速”港口吞吐“增量” [N].钦州日报,2021-11-01(2).

[4] 孔琳琳,刘澜,许文秀,等.基于时间序列分析的港口集装箱吞吐量预测分析 [J].森林工程,2016,32(5):106-110.

[5] DELURGOIO S A. Forecasting Principles and Applications [M].Boston:Irwin/McGraw-Hill,1998.

[6] 占祖桂.基于BP神经网络的香港离岸人民币汇率预测 [J].吉林金融研究,2018(8):44-46.

[7] 马广慧,马豆豆,邵秀丽.基于遗传BP神经网络的三七价格预测 [J].天津师范大学学报(自然科学版),2017,37(6):76-80.

[8] DONG B,CAO C,LEE S E. Applying support vector machines to predict building energy consumption in tropical region [J].Energy and Buildings,2005,37(5):545-553.

[9] 居锦武.基于LS-SVM的养殖水体氨氮含量分析模型的优化 [J].大连海洋大学学报,2016,31(4):444-448.

[10] 赵合胜.基于灰色预测和SVM的茶叶烘焙温湿度预测 [J].西安文理学院学报(自然科学版),2018,21(5):64-67

[11] DU P,WANG J Z,YANG W D,etal. Container throughput forecasting using a novel hybrid learning method with error correction strategy [J/OL].Knowledge-Based Systems,2019,182:[2021-12-02]. https://www.sciencedirect.com/science/article/abs/pii/S0950705119303284.

[12] MO L L,XIE L,JIANG X Y.et al. GMDH-based hybrid model for container throughput forecasting:Selective combination forecasting in nonlinear subseries [J].Applied Soft Computing,2018,62:478-490.

[13] 陈锦文,兰培真.改进型BP神经网络的港口吞吐量预测 [J].集美大学学报(自然科学版),2019,24(5):352-357.

[14] 张雷雨,杨毅.基于PCA-SVM的港口集装箱吞吐量预测模型研究 [J].江苏商论,2019(5):33-38.

[15] 刘路民根.支持向量机径向基核参数优化研究 [J].科学技术创新,2018(26):48-49.

[16] 余国刚,冯琪,徐粉.张家港永嘉集装箱码头集装箱吞吐量组合预测 [J].物流技术,2017,36(4):103-107.

[17] 杜刚,刘娅楠.季节性变动影响下的上海港集装箱吞吐量预测 [J].华东师范大学学报(自然科学版),2015(1):234-239.

[18] 张绪进,母德伟,韩涛.改进的灰色预测模型在过坝货运量预测中的应用 [J].水運工程,2009(6):4-7.

[19] 王慧,吴茜茜.空间自回归模型中系数变量及误差项的贝叶斯估计 [J].合肥工业大学学报(自然科学版),2021,44(9):1291-1296

[20] LIM S,KIM S J. PARK YOUNGJAE,et al. A deep learning-based time series model with missing value handling techniques to predict various types of liquid cargo traffic [J/OL].Expert Systems With Applications,2021,184:[2021-12-02]. https://www.sciencedirect.com/science/article/pii/S0957417421009404.

[21] 陈旭,李典,张利华,等.基于改进支持向量机(SVM)模型的荆州港吞吐量预测 [J].水运工程,2020(3):38-42.

[22] SCHÖLKOPF B,SMOLA A J. Learning with Kernels:Support Vector Machines,Regularization,Optimization and Beyond [M].[S.I.]:The MIT Press,2001.

[23] 马秋芳.改进PSO优化的BP神经网络短时交通流预测 [J].计算机仿真,2019,36(4):94-98+323.

[24] 林权,何正东,仓伟,等.一种基于复合储能的自适应权重粒子群算法研究 [J].机电信息,2021(28):8-9+13.

[25] YAN L,WANG H,WANG H,et al. An improved OS-ELM based Real-time prognostic method towards singularity perturbation phenomenon [J/OL].Measurement,2021,182:[2021-12-02].https://www.sciencedirect.com/science/article/abs/pii/S0263224121006424?via%3Dihub.

作者簡介:秦圻(1996—),男,汉族,江苏如皋人,硕士研究生在读,研究方向:航运科学与技术。

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究