基于支持向量机的舰船战储器材分类算法研究*

2014-12-02 06:07由大德
舰船电子工程 2014年9期
关键词:超平面正确率分类器

赵 翀 由大德 彭 亮

(1.海军大连舰艇学院研究生管理大队 大连 116018)(2.海军大连舰艇学院训练部 大连 116018)

1 引言

舰船战储器材的种类繁多、数量庞大,且按照不同的方式可得到很多种不同的分类,给战储器材的科学管理带来不便。因此急需一种规范的分类方法对其进行合理分类,才能加强对舰船战储器材储备的管理。

目前,ABC 分类方法被广泛应用于确定储备的备件品种[1~3]。该方法丰富了装备备件分类的理论和方法,是一种节约费用的简单而有效的科学管理方法,但在战储器材分类中却没有得到很好的推广。原因有:1)舰船战储器材种类多、数量大,将每种器材逐一评价分类,操作难度大;2)即使对每种器材进行分类,繁多的器材将造成分类速度很慢,如基于层次分析法、模糊综合评价法、主成分聚类分析法[4~5]等。

支持向量机具有严格的理论和数学基础,对有限样本的学习能力强,能得到现有信息下的最优解,克服了人工神经网络的缺陷[6~7],同时采用结构风险最小化准则设计学习机器,具有较好的推广能力[8~9]。

2 支持向量机模型

2.1 基本原理

支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论有限样本情况下的机器学习理论。通过非线性映射Φ,把样本空间映射到一个高维乃至无穷维的特征空间(Hilbert空间),使在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归问题[10]。

其核心思想是寻找支持向量,以建立最优分类超平面[11]。假设两个类别为A类和B类,H是将两类分开的界面,H也是需要寻找的一个分类超平面。使H与H1和H2平行,并且使H1、H2上的样本点与分类面H之间的间隔最大化,其中H1上的样本是第一类样本到H距离最近的点,H2上的样本点则是第二类样本距H最近距离点。如图1所示。

设训练集为{(xi,yi),i=1,2,…,n}∈(X×Y)i,其中xi∈X=Rm,yi∈Y={-1,1}为样本标记。被一个超平面Wx+b=0 没有错误的分开。则最优超平面将由离它最近的少数样本点(支持向量)决定,而与其他样本无关。

与样本间隔为△的分类超平面为

将SVM 最优化问题中的分类超平面做以下归一化处理:令△=1,而W和b可以按比例缩放,则支持向量到超平面的距离为1/W。因此,要使间隔最大,则:

2.2 舰船战储器材分类原理

图2 基于SVM 的战储器材分类原理图

假定舰船战储器材种类繁多,在军民通用件中随机抽取有限数量的器材进行评价分类,分为A、B、C三类,其中A 表示非常重要件,B表示重要件,C表示一般件。用这些已分类的器材作为构造分类器的学习样本,然后利用剩余通用件的指标值与样本的指标值对照,进行同规则的分类。利用支持向量机实现这种对照学习,通过对已分类的舰船战储器材学习,记忆分类规则,形成分类机;未分类的战储器材输入到分类机后对其快速自行分类。分类原理如图2所示。

3 基于SVMs的战储器材分类方法

上述原理是针对二类别的分类,对于ABC 分类的多类别分类问题一般有三种方法。

1)一对一方法

图3 一对一法

2)决策有向无环图法

使用该方法进行ABC 分类,构建SVM 与一对一方法相同。在分类时,建立决策树,树中有三个内部节点,每个内部节点对应一个二类分类器SVM;三个叶节点,不同叶节点对应不同类别。该决策树如图4所示。

3)二次选择法

二次选择法只需构建两个二类别SVM。SVM1表示属于A 类或不属于A 类;SVM2表示属于B类或C类。方法如图5所示。

图4 决策有向无环图

图5 二次选择法

4 实例分析

为验证分类模型和方法的效果,现以舰船战储器材为例进行实例验证。某型号舰载火炮装备的通用型战储器材共有315种,随机抽取65种(本实例对随机抽取样本数量保持在原样本数的20%左右)。依据通用件分类模型提取每种器材的四个指标,这四个指标分别是关键性、使用量、价格和采购期,关键性是定性指标,其他三项都是定量指标。

通过专家打分,将这65种战储器材分A、B、C三类,A 表示重要度高,B表示重要度中等,C表示重要度低。其中A 类15种,B类20种,C类30种。将关键性指标进行量化,假定A=5,B=3,C=1,且四个指标越大,则关注程度越高。预处理数据时,将四个指标进行规范化处理,将ABC进行数值替换,A=3,B=2,C=1方便分类器生成,提高其准确率。

选取五种核函数,分别是polynomial多项式核函数、mlp多层感知器、rbf高斯径向基核函数、linear线性核函数和quadratic二次核函数。选择两种训练算法,即LS和SMO。选取六种惩罚参数C(1,101,102,103,104,105)。多项式核函数参数选择为(3,4,5,6,7,8,9,10)。多层感知器核函数参数选择[-1,1],[-2,2],[-3,3],[-4,4],[-5,5]。高斯径向基核函数参数为(10-1,10-2,10-3,10-4,10-5,10-6,10-7,10-8,10-9)。在核函数、核参数、超平面以及惩罚参数的组合中生成442种组合,代表442个二类别分类器。

将C类样本剔除,用442个分类器对AB类样本值进行交互验证法训练学习,选择正确率高的分类器作为AB 类分类器。同理,可得到AC、BC 和A 非A 类分类器。下表给出AB 类、AC 类、BC类、A 非A 类分类器中分类正确率较高的前五种,如表1~表4所示。

表1 AB类分类器

表2 AC类分类器

通过四个表可知,优选后结果是:AB类分类器SVM1是由线性核函数(poly)、核参数3、惩罚参数1和LS算法组成;AC分类器SVM2是由多项式核函数(polynomial)、核参数3、惩罚参数10000 和LS算法组成;BC 分类器SVM3是由线性核函数(linear)、核参数4、惩罚参数100和SMO 算法组成;A 非A 类分类器SVM4是由多项式核函数(quadratic)、核参数3、惩罚参数1 和LS 算法组成。

表3 BC类分类器

表4 A 非A 类分类器

依据一对一法、决策有向无环图法和二次选择法,统计A、B、C三类的正确率,三种分类运算正确率如表5所示。

表5 分类机分类正确率(单位:%)

表6 舰船战储器材分类表

通过表5可知选择决策有向无环图方法分类正确率最高。将315种战储器材的数据先进行规范化预处理,然后引入分类机中进行分类,运行部分结果如表6所示。其中A 类46种,有带水泡的水泡座、充气轮胎、轴承等;B类50种,有胶管接头总成、驻推杆螺母等;C类219种,有挡圈、O形圈、碟簧等。

5 结语

在已有备品备件ABC 分类法的基础上,将支持向量机算法引入分类模型中,将研究算法有效地转化为可行操作,提高了战储器材分类速度,所得结果客观、合理,有利于ABC分类法在仓库中推广实施。

[1]梁清果,高琦,李双阁.ABC 分类法在军械维修器材仓库管理中的应用研究[J].物流技术,2004(8):60-61.

[2]卢庆铃,白盟亮,李庆全,等.战储物资轮换管理策略研究[J].物流科技,2011(2):115-116.

[3]郭清风.航空战储物资轮换方式研究[J].物流科技,2013(9):94-95.

[4]胡新涛,张作刚,刘望.主成分聚类分析在战储器材轮换中的应用[J].计算机与现代化,2012(12):226-229.

[5]张永利,傅俊伟.基于主成分分析方法的聚类分析方法在灾情综合分类中的应用[J].佳木斯大学学报,2011,29(2):296-299.

[6]黄奕潇,李菁菁,邵培基.基于SOM 人工神经网络的客户资源分类方法研究[J].重庆大学学报,2003,9(6):30-32.

[7]白雪飞,周明全,耿国华.人工神经网络在文物分类系统中的应用研究[J].微机发展,2005,15(2):94-96.

[8]秦玉平.基于支持向量机的文本分类算法研究[D].大连:大连理工大学博士学位论文.

[9]Joachims T.Text categorization with support vector machines:learning with many relevant features[C]//Proceedings of the 10thEuropean Conference on Machine Learning,Berlin,Germany,1998:137-142.

[10]Mustafa H,Doroslovacki M.Digital modulation recognition using support vector machine classifier[C]//Proceedings of the 38thAsilomar Conference on Signals,Systems and Computers,California,USA,2004:2238-2242.

[11]房佳勋,孙明珠,马野.基于多分类SVM 的航空发动机故障诊断[C]//2012年全军研究生创新论坛(工学)优秀论文集.北京:海潮出版社,2012:79-81.

猜你喜欢
超平面正确率分类器
个性化护理干预对提高住院患者留取痰标本正确率的影响
基于非线性核的SVM模型可视化策略
全纯曲线正规族分担超平面
有限维Banach空间中完备集的构造
基于朴素Bayes组合的简易集成分类器①
门诊分诊服务态度与正确率对护患关系的影响
基于特征选择的SVM选择性集成学习方法
基于差异性测度的遥感自适应分类器选择
生意
生意