基于SVR的武器装备费用预测

2014-12-16 18:36:52霍丽娟徐静黄西韩文甫
现代商贸工业 2014年23期
关键词:高维训练样本样本量

霍丽娟 徐静 黄西 韩文甫

摘 要:

武器装备的费用是影响装备发展的首要问题。在装备寿命周期的各个阶段,开展装备费用的预测研究,对于促进装备可靠性和维修性的提高,加强装备使用和维修的科学管理有着十分重要的意义。

关键词:

SVR;武器装备;费用

中图分类号:

F23

文献标识码:A

文章编号:16723198(2014)23011301

传统的费用预测方法有类比估算法、专家判断估算法、参数估算法和工程估算法等。类比估算法和专家判断估算法以经验和主观评价为基础,增加了方法的不确定性。参数估算法最大的问题是需要相当容量的历史数据,其精度取决于样本数量的大小。工程估算法预测过程复杂、繁琐、费时。

由于样本限制,装备费用预测问题是小样本学习问题。支持向量机(Support Vector Machine, SVM)是由统计学习理论发展起来的一种新型学习机器,它以结构风险最小化原理为理论基础,具有逼近复杂非线性系统、较强的学习泛化能力和良好的分类性能,同时所需要样本数量少、建模方便、计算简单、学习训练时间短、泛化能力强。SVM最初是用来解决模式识别问题,随着 Vapnik 的ε不敏感损失函数的引入, SVM已经扩展到解决非线性回归问题。

1 支持向量机回归模型

支持向量机回归(SVR)的基本思想是:基于Mercer核展开定理,通过非线性映射,把样本空间映射到一个高维特征空间,在这个空间中构造最优决策函数。在构造最优决策函数时应用结构风险最小化原则,并利用原空间的核函数取代高维特征空间中的点积运算,把寻找最优线性回归超平面的算法归结为求解一个凸约束条件下的一个凸规划问题。

对线性规划,设训练样本集(xi,yi),i=1,2,…,n具有ε相似性,即yi-f(xi)≤ε,i=1,2,…,n。该最优问题可作如下描述:

minf=12wTw+C∑ni=1(ξi+ξ*i)(1)

s.t.wxi+bi-yi≤ε+ξ*i

-wxi-bi+yi≤ε+ξi

ξi,ξ*i≥0

其中C为惩罚因子,实现经验风险和置信范围的折中;ξi,ξ*i为松弛因子,ε为损失函数,采用ε不敏感 (insensitive)损失函数,用于控制回归逼近误差和泛化能力。

在求解上式时,一般采用对偶理论,把它转化成二次规划问题。建立拉格朗日方程:

L(w,ξi,ξ*i)=12wTw+C∑ni=1(ξi+ξ*i)-∑ni=1αi(ε+ξ*i-wxi-bi+yi)-∑ni=1αi(ε+ξ*i+wxi+bi-yi)-∑ni=1(ηiξi+ηiξ*i)  αi,αi,ηi,ηi≥0,i=1,2,…,n(2)

在极值处,上式对w,b,ξi,ξ*i求偏导为零,得:

w = ∑ni = 1(αi -α*i )xi

∑ni = 1(αi -α*i ) = 0

C-αi -ηi  = 0

C-α*i♂-η*i♂ = 0

化简后, 可得原约束表达式的对偶式:

min12∑ni,j = 1(α*i -αi )(α*j -αj )xTi xj -∑ni = 1α*i (yi -ε)-αi (yi  + ε)(3)

St.∑ni = 1(αi -α*i ) = 0,\\quadαi ,α*i ∈0,C

对于非线性问题,将原数据集通过一非线性映射,映射到一高维特征空间,在高维特征空间中进行线性回归,则此时约束表达式为:

min12∑ni,j = 1(α*i -αi )(α*j -αj )Φ T(xi )Φ (xj )-∑ni = 1α*i (yi -ε)-αi (yi  + ε)(4)

St.∑ni = 1(αi -α*i ) = 0,\\quadαi ,α*i ∈0,C

定义K(xi,xj)=(Φ(xi)·Φ(xj))=ΦT(xj)Φ(xi)为核函数。

根据Karush-Kuhn-Tucker定理,可求得αi ,α*i ,b,最终可得SVM回归函数为:

f(x) = ∑ni = 1(αi -α*i )K(xi ,x) + b(5)

2 支持向量机预测装备费用的方法和步骤

基于支持向量机回归的装备费用预测的方法和步骤如下:

(1)确定样本量。

武器装备的费用受多方面因素的影响,如果只从单独的一个方面对武器装备费用进行考察评估,就不可能对装备费用有正确的反映。一般选取对费用较为敏感的若干个主要物理与性能参数(如质量、体积、射程、探测距离、平均故障间隔时间等)。对于单一费用的预测,其样本量可以选择前阶段该项费用作为样本量。

(2)数据的预处理。

支持向量机没有对数据量纲的要求,这就可能造成两个数量级相差很大的数据一起作为训练样本,造成模型训练费时,误差较大。因此对训练样本要进行数据的缩放处理。一般归一化采用下式实现:

xM=2(x-xmin)xmax-xmin-1(6)

式中,xM表示归一化后的数据,xmax,xmin是原始变量x的最大和最小值。

(3)选择核函数,进行学习训练。

常用的核函数有线性核函数,多项式核函数,径向基核函数,高斯核函数。支持向量机回归常用的核函数是径向基核函数,表示为:

K(xi,xj)=exp{-|xi-xj|2σ2}(7)

选择参数C,ε以及核函数中σ2的合理取值,一般按经验选取,以所确定的模型的拟合精度作为标准。

(4)确定模型,用于预测。

将新的参数数据输入到模型中进行预测。

猜你喜欢
高维训练样本样本量
医学研究中样本量的选择
内蒙古统计(2021年4期)2021-12-06 02:49:20
人工智能
航空装备测试性试验样本量确定方法
测控技术(2018年4期)2018-11-25 09:46:52
一种改进的GP-CLIQUE自适应高维子空间聚类算法
测控技术(2018年4期)2018-11-25 09:46:48
Sample Size Calculations for Comparing Groups with Binary Outcomes
基于加权自学习散列的高维数据最近邻查询算法
电信科学(2017年6期)2017-07-01 15:44:37
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
电视技术(2016年9期)2016-10-17 09:13:41
基于稀疏重构的机载雷达训练样本挑选方法
一般非齐次非线性扩散方程的等价变换和高维不变子空间