基于SVM的稿件质量评价系统

2014-07-07 15:38梁凤鸣
关键词:二叉树稿件专家

梁凤鸣

泰山学院学报编辑部,山东泰安271021

基于SVM的稿件质量评价系统

梁凤鸣

泰山学院学报编辑部,山东泰安271021

分析了科技期刊稿件审理的指标体系与SVM的基本原理,建立了基于SVM的稿件质量评价系统,并应用100个样本对网络进行了训练。检验结果表明,检验样本的期望输出结果与网络模型的计算结果符合较好,说明该模型可行。

SVM;稿件质量评价系统

科技期刊以发表系统性、专门性、创造性的学术论文为主体,以反映高水平、高质量的科研教学成果为重点的期刊。科技期刊责任编辑的一项重要任务就是对科技期刊的总体质量进行有效的控制,而最有效的途径就是专家审稿,专家通过对文稿的审阅,为期刊筛选出高质量的文稿。专家审稿是保证和提高论文质量的中心环节,是发现和培养学术新秀的重要途径。因此,为了提高审稿质量,使专家评价指标与综合评价指标的评价结果分离,避免审稿结果受其他因素的影响,同时提高审稿的效率与方便性,实现远程审稿与网络资源的共享[1],本文在文献[1]的基础上建立了基于SVM的稿件质量评价系统。

本文采用专家评价法对稿件质量评价系统进行评价,专家评价法是出现较早且应用较广的一种评价方法。专家评价法就是根据评价对象的具体情况选定评价指标,对每个指标均定出评价等级,然后对每个等级的标准用分值来表示;专家对评价对象进行分析和评价,确定各个指标的分值。

该评价体系分为专家评价指标和综合评价指标,并把每个评价指标分别赋予对应的定性模糊评价量值进行量化。

1 评价指标

本文选取政治性、思想性、创新性、学术性、科学性和实用性6项组成专家评价指标体系。文中的综合评价指标采用文献[1]的方法,是责任编辑根据编辑部的实际情况,参照审稿专家对论文从不同的侧面对上述评价指标进行评审后所得到的结果,确定与其对应的综合的评价结果,每一个评价指标的各评价元素组成的向量只能与确定的一个评价结果因素相对应[1]。

2 评价指标的量

根据实际情况,我们把每个评价指标分为好、较好、一般、差等4个评价等级,并对每个评价等级赋予对应的评价量值,用于审稿专家根据自己对稿件进行判断和选择,最后得到一个7维的模糊向量[2-4]。

A={好,较好,一般,差};B={100,80,60,0};C=(a1,a2,a3,a4,a5,a6,b)

3 SVM评价模型

支持向量机(Support Vector machine,SVM)[4-9]作为凸二次规划问题的一种典型代表已经广泛应用于文本识别、手写字体识别、人脸图像识别、回归分析、函数估计等领域。支持向量机分类问题的描述如下:给定样本训练集,T={(x,y),...,(x,y)},其中x∈Rm是输入指标向量,11nn i yi∈Y={1,-1}是输出指标,确定Rm上的一个实值函数g( x),使得对任意输入x∈Rm,都可由决策函数f(x)=sign( g( x))推断出其对应的输出y(1或-1),其中sign为符号函数。

SVM理论是要求一个最优分离超平面ωTφ(x)+b=0,其中φ(.)为Rm到另外一个空间的映射。基于“间隔”极大化的思想,求最优分划超平面的问题即转化为求如下关于变量ω和b的最优化问题[10]:

其中ξ=(ξ1,...,ξn)T为松弛变量,ω和b分别是分离超平面的法方向和截距,C>0为间隔最大化和错分最小化的权衡系数。模型(1)的对偶问题为下列二次规划问题:

M( M>2)分类问题可描述如下:给定m个分类训练样本(x1, y1),(x2,y2),...,(xn,yn),其中x∈Rm,i=1,...,n且y∈{1,2,...,M},基于上述样本构造一个分类函数f(x):X=Rn→y。多分

i i

类和二分类问题之间有一定的对应关系:若M分类问题完全可分,则M类中任意两类一定可分;反之,若其任意两类之间可分,则通过一定的组合或投票法则,可由两两可分来最终实现M类可分。

基于二叉树的SVM多分类算法[11-12]的基本思想是将所有类别分成两个子类,再将子类划分成两个次级子类,重复执行直到所有的结点只包含一个单独的类别为止。该方法将原有的多类问题同样分解成了一系列的两类分类问题,其中两个子类间的分类函数采用SVM。本文中的稿件质量三分类问题(60,80,100),首先按类别把训练数据集分为两个子集SetA(80,100)和SetB(60),对SetA的数据赋予标号+1,SetB的数据赋予标号-1,用此两类数据构造分类函数SVM1,进一步对SetA中的训练数据集执行相同的步骤,得到另外一个分类函数SVM2,如图1所示。

图1 基于二叉树的四分类算法Fig.1 Four classification algorithm based on binary tree

对于一个新的样本,用SVM1进行分类:如果结果为1,则表明该样本可能属于100,80类中的一种;如果结果为-1,则结果为60。如果SVM1分类结果为1,则用SVM2进行分类,如果结果为1,则表明该样本类别为100,否则为80。

为了说明基于SVM的二叉树多分类算法针对稿件质量分类问题的有效性,本实验选取了100个稿件质量数据样本进行数值实验,程序用matlab7.10语言编写,实验平台Pentium(R),2G RAM,操作系统为Windows XP。

4 实例分析

本文根据《泰山学院学报》对评审稿件的要求,对稿件的思想性和政治性达到较高水平,而学术性、创新性、科学性、实用性要达到一般等级,参照上述7个指标和量化原则,所有符合要求的样本共计100个,因数据较多,在此不再列出。

训练样本是从100个数据样本中随机选取的,并把剩余的样本作为训练样本,二分类器为Libsvm工具箱,SVM二分类采用高斯核函数),表1列出了数据集的信息以及参数选择信息。

表1 实验数据的信息Table 1 Experimental data

表2 数值结果Table 2 Numerical results

表2给出了10组随机测试的数据结果,由表2可以看出10组数据的分类准确率集中在90%左右,最低也不低于87.5%,最高可达97.5%。因此可以说,基于SVM的二叉树多分类算法对于稿件质量评价问题,二叉树多分类算法是比较有效的。

5 结语

本文在审稿质量评价指标体系的基础上提出了基于SVM的二叉树多分类算法的稿件质量评价模型,通过对100个样本的训练,达到了期望的输出效果。这样在今后的审稿过程中,审稿专家只要根据编辑提供的审稿指标体系以及相应的评价因素选取相应的值,此模型就可以根据审稿专家的输入值给出期望审稿结果,这样大大的减少审稿过程中人为因素的干扰,严格以稿件质量作为稿件取舍的标准,同时,也提高了审稿专家在审稿认真程度,并尽可能缩短审稿周期,为提高学报质量把关取得了令人满意的效果。

[1]赵志宏,孙守增.基于BP神经网络的稿件质量评价系统[J].中国科技期刊研,2006,17(5):742-745

[2]邱浪波,刘作良,刘明.一种神经网络技术的威胁股计算法[J].空军工程大学学报(自然科学版),2002,3(6):25-27

[3]张新红.基于神经网络的管理信息系统综合评价方法[J].系统工程学报,2002,17(5):445-450

[4]Tseng P,Yun S W.A coordinate gradient descent method for nonsmooth separable minimization[J].Mathematical Programming,2009,(117):387–423

[5]Thomas S,Zanni L.On the working set selection in gradient projection-based decomposition techniques for support vector machines[J].Optimization Methods and Software,2005,(20):583–596

[6]Lin C J,Lucidi S,Palagil L,et al.Decomposition algorithm model for singlylinearly constrained problems subject to lower and upper bounds[J].Journal of Optimization Theory andApplication,2009,(141):107-126

[7]Lucidi S,Palagi L,RISI A,et al.A convergent decomposition algorithm for support vector machines[J].Computational Optimization andApplications,2007,38(2):217-234

[8]Tseng P,Yun S W.Acoordinate gradient descent method for linearly constrained smooth optimization and support vector machines training[J].Computational Optimization andApplications,2010,47(2):179-206

[9]李明强.几类特殊凸二次规划问题的求解算法研究[D].青岛:山东科技大学信息科学与工程学院,2013

[10]李明强,韩丛英,贺国平.基于分解技术的并行支持向量机算法[J].中国科技论文在线-精品论文,2013,6(13):1249-1254

[11]邓乃扬,田英杰.支持向量机:理论、算法与拓展[M].北京:科学出版社,2009

[12]王永丽,韩丛英,李田,等.求解不等式约束优化问题无严格互补松弛条件的QP-free新算法[J].应用数学学报,2013,36(1):3-15

The Manuscript Quality Evaluation System Based on SVM

LIANG Feng-ming
Editorial Department of Journal Taishan University,Taian 271021,China

This paper analyzed the manuscripts hearing index system of scientific journals and the principle of SVM, established the manuscript quality evaluation system based on SVM,and applied 100 samples to train the network.The test results showed that the calculated results of the network model were in agreement with the expected output of test samples, which indicated that the model was feasible.

SVM;manuscript quality evaluation system

G353

A

1000-2324(2014)03-0473-03

2012-12-03

2013-03-16

山东省自然科学基金项目(ZR2012AL03)

梁凤鸣(1979-),女,编辑,主要从事期刊编辑研究工作.E-mail:liang-fengming@163.com

猜你喜欢
二叉树稿件专家
录用稿件补充说明
致谢审稿专家
本刊稿件体例要求
二叉树创建方法
一种由层次遍历和其它遍历构造二叉树的新算法
一种由遍历序列构造二叉树的改进算法
请叫我专家
Shanxi Agricultural University Visitor Professor Donald Grierson*
专家面对面
特约稿件