阎伸 张全
【摘 要】支持向量机是一种基于统计学习理论的机器学习方法。在傳统的支持向量机模型中,模型参数需要用试凑的办法,本文中提出一个基于粒子群算法的参数选择机制,这可以大大减少模型的运算时间。最后给出一个算例。
【关键词】粒子群算法;支持向量机;参数选择
A Support Vector Machine Method based on Particle Swarm Optimization
YAN Shen ZHANG Quan
(Department of Information Engineering,ShenYang University of Technology,Shenyang Liaoning 110870,China)
【Abstract】Support Vector Machine(SVM)is a new machine learning technique based on the statistical learning theory.In the traditional SVM model,we usually select the parameter by trial and error.In this paper,we propose a parameter optimization method based on PSO for SVM,it can reduce computing time obviousely.At last,a numerical example is proposed.
【Key words】PSO;SVM;Parameter selection
0 引言
期刊评价可以归结为多属性决策问题,即参考多个指标(或称属性)来评价期刊的质量[1]。期刊质量的等级分类往往需要计算期刊的综合评价值,而且通常需要确定属性的权重值与综合评价值的函数形式。
基于支持向量机的非线性系统建模不须要事先对函数关系进行任何假设,通过其机器学习的过程达到对问题真实模型的逼近[2],运用粒子群算法进行参数选择,在不影响准确率的前提下,缩短运算时间。最后,通过算例可以看出算法的优势。
1 支持向量机的参数
本文利用?着-SVR(Support Vector Regression)模型进行期刊评价问题的回归拟合。
有三个参数需要给出,即?着-SVR的惩罚因子C、损失函数?着和RBF核函数里参数?酌的值。本文结合粒子群算法,对上述三个参数进行寻优。这里,要用到判断模型拟合效果的指标:均方根误差(mean square error,MSE)及平方相关系数r(squared correlation coefficient),通常,MSE的值越小,r 的值约接近1,则拟合的效果越好。
2 算例分析
c=1.2779,g=0.1000,p=0.0100。同时,训练集和测试集的MSE分别为0.0001和0.0088,平方相关系数分别为0.9997和0.7119。20个期刊的综合评价值,分别为9.918、9.734、10.802、9.626、7.972、8.874、6.757、5.820、5.850、4.910、4.765、6.468、5.112、5.719、4.090、4.270、3.840、4.141、4.228、4.724,因此,得出20个期刊的排序结果为:S3>S1>S2>S4>S6>S5>S7>S12>S9>S8>S14>S13>S10>S11>S20>S16>S19>S18>S15>S17。
3 结论
本文提出了基于粒子群算法参数寻优的支持向量机拟合方法。解决了在期刊等级评价过程中需要人为给出属性权重值以及选择综合评价值计算模型的主观因素,达到了完全根据客观数据来确定期刊综合评价值与其排序的效果。
【参考文献】
[1]邱均平,武庆圆,刘霞.《中国学术期刊评价研究报告》的特色、做法和结果分析[J].评价与管理,2011,9(2):29-34.
[2]邓乃扬,田英杰.数据挖掘中的新方法—支持向量机[M].北京:科学出版社,2004.
[责任编辑:田吉捷]