李永华,李金颖
(1.大连交通大学交通运输工程学院,辽宁大连116028;2.大连交通大学机械工程学院,辽宁大连116028)
目前国内外评价方案优劣的方法主要有主成分分析法、灰色关联法、层次分析法、模糊集理论、熵权法、TOPSIS方法、神经网络和支持向量机等方法。其中TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)是一种适用于有多个目标属性的多个方案进行比较选择的分析方法,对原始数据矩阵进行归一化处理后,找出有限方案中的理想解和负理想解,分别计算各个待评价对象到正理想解和负理想解的距离,获得各个评价对象与正理想解之间的贴近度[1]。但是,由于传统的TOPSIS方法存在以下缺点:1)对原始数据矩阵的计算比较复杂;2)属性权重是事先确定的,存在一定的主观性[2]。因此针对传统的TOPSIS方法,本文采用基于传统TOPSIS的支持向量机方法对某铁路重载货车设计方案进行评价,一方面由于支持向量机的机器学习的特性,克服了TOPSIS方法在确定属性权重时的主观性。另一方面由于支持向量机和Matlab软件可以很好的结合,使复杂的矩阵计算也变得容易。
TOPSIS方法的基本思想是对归一化后的原始数据矩阵确定出理想中的最佳方案和最差方案,求出各个备选方案与最佳方案和最差方案之间的距离,得出每个方案与最佳方案的接近程度,并以此作为评价各个备选方案优劣的依据[3-4]。
对于多个目标属性的有限个方案,其TOPSIS方法的求解步骤如下[5]:
1)设有m个备选方案,每个备选方案有n个属性,其中第i个备选方案的第j个属性值为xij,则原始数据矩阵V为
2)由于各个属性的量纲可能不同,需要对初始数据矩阵进行归一化处理,则归一化处理后的矩阵 V′为
3)根据归一化后的矩阵,确定正理想解和负理想解
正理想解为m个备选方案中的n个属性中,均达到最优值的理想方案,即为正理想解。同理,负理想解即为m个备选方案中的n个属性均达到最劣值的方案,即:
4)计算各个备选方案的目标属性值到正理想解和负理想解的距离
5)计算各个目标的贴近度
6)最后根据贴近度大小对方案进行排序。
支持向量机(Support Vector Machine,SVM)是Vapnik和Cortes等于1995年根据统计学习理论中结构风险最小化原则最早提出的一种新的机器学习方法[6]。它在解决小样本、非线性及多维问题中表现出许多特有的优势,与传统的人工神经网络相比,SVM具有结构简单、理论完备、适应性强、全局优化、泛化性能好等优点[7]。
目前,SVM算法在分类、回归预测等方面都有应用,并且凭借其诸多优点在人工智能和机器学习领域颇受关注。本文在TOPSIS方法的基础上,使用支持向量机方法对各个备选方案进行回归预测,从而选出较优的方案。
现有机器学习方法共同的重要理论基础之一是统计学习理论[8-9]。传统统计学研究需要大量的样本数据支持,因此统计学习理论与传统的统计学相比,它是一种专门针对样本数量很少的机器学习理论。与传统统计学相比,它基本上不涉及概率论相关的定义及大数定律,它为建立有限样本学习问题提供了一个统一的框架,它有效地避免了人工神经网络等方法的网络结构选择、过学习和欠学习问题以及局部最小等问题。
SVM是专门针对有限样本情况的学习机器,实现的是结构风险最小化[10]。SVM将实际问题通过非线性变换转换到高维的特征空间,在高维空间中设计线性学习方法,即利用核函数替换线性算法中的内积,得到原输入空间中对应的非线性算法,解决了维数问题,保证了较好的推广能力,而且算法复杂度与样本维数无关。
本文中SVM回归预测是通过Matlab软件中的Libsvm工具箱进行回归预测。首先输入数据作为训练集,将TOPSIS贴近度函数作为目标函数;然后利用支持向量机理论知识选取回归模型中的参数和核函数;再通过交叉验证方法选取均方根误差较小的参数;最后输入测试数据作为测试集,建立测试目标函数,预测输出。
铁路货车是铁路货物运输的重要装备,在国民经济发展中起着重要的作用。因此,对铁路货车的的载重、运行速度等性能的要求也越来越高。因此,一个最佳的设计方案就显得尤为重要。本文将TOPSIS和SVM相结合,借助于Matlab软件对某铁路重载货车的设计方案进行评价,选出最优方案。
某铁路货车生产企业在进行新型铁路重载货车的设计研发过程中,给出8种设计方案,如表1所示。
表1 铁路重载货车初步设计方案Table 1 The preliminary design schemes of the railway overloaded trucks
首先,利用Matlab软件及上述归一化公式对上表进行归一化处理,其结果如表2所示。
表2 进行归一化处理后的备选方案Table 2 The schemes after normalization process
由于铁路货车的不断发展,所以人们希望在尽可能降低自重和轴重情况下提高载重和容积。由于铁路运输量的不断增加,较高的运行速度是提高货运效率的一种重要手段。因此,在保证安全性要求的前提下尽量提高铁路货车的运行速度。制动距离越小,说明其制动性能越好,也会大大地提高其安全性。因此,由公式(3)、(4)可以得到最优方案和最劣方案,即理想解与负理想解。
根据已经求得的正理想解和负理想解,利用Matlab软件及公式(5)和(6)可求得各个备选方案的目标属性值到正理想解和负理想解的距离和。将其代入到公式(7)即可得到贴近度,从而选出最优方案。但是由于在最优方案和最劣方案的选取时存在一定的人为因素,因此将贴近度公式作为目标函数,通过支持向量机这一机器学习的方法来克服其主观性,从而获得一个较为客观的评价结果。
针对某铁路重载货车,使用基于TOPSIS的支持向量机法对其进行预测。本文选取的支持向量机类型为 ε-SVR,核函数为 RBF核函数,使用Matlab软件中的Libsvm工具箱,进行回归预测。每次预测过程选取6个设计方案作为训练集,其余两个方案作为测试集。下面以方案7和8为测试集,其余方案为训练集,采用交叉验证进行参数优化[11],在参数粗略选择时,设其惩罚参数C的对数log2c的取值范围为(-10,10),参数 g的对数log2g的取值范围为(-10,10),每次优化的步长取为0.5,在参数精细选择时,设其惩罚参数C的对数log2c的取值范围为(-5,5),参数g的对数log2g的取值范围为(-5,5),每次优化的步长取为 0.1。
图1 参数粗略选择结果图Fig.1 Parameters of rough selection
图2 参数精细选择结果图Fig.2 Parameters of fine selection
由图1~图2可知,经过交叉验证,粗略选择结果为均方根误差CVmse=0.011 468,惩罚参数C=32,参数 g=1,精细选择结果为均方根误差CVmse=0.010 969,惩罚参数 C=18,参数 g=1.3。依照上述方法,其余6个设计方案的测试结果均可获得,其结果如表3所示。
表3 测试结果表Table 3 Test results
由表3可知,最优方案为方案6,即方案6中其自重和轴重都比较低,虽制动距离较长,但载重、容积和运行速度较大。最劣方案为方案2,其中虽载重很大,但其轴重和自重都很大,相比较其他方案其运行速度不高,制动效果也不好。
1)通过对某铁路重载货车的8个设计方案的评价,可以看出方案6的贴近度值最大,说明该方案设计最接近理想方案。综合比较测试结果,可以发现对于每个方案的6个目标属性,其容积、载重和最高运行速度的大小对方案优劣具有较大的影响,而自重、轴重和制动距离产生的影响则相对较小。
2)TOPSIS方法与支持向量机方法单独使用都可以进行方案评价。传统TOPSIS方法对原始数据矩阵计算较复杂,并且属性权重是事先确定的,存在一定的主观性,单独使用支持向量机时,需要对方案建立目标函数关系。因此将二者结合具有以下优点:借助支持向量机方法的机器学习特性克服主观性;将TOPSIS方法的贴近度函数作为目标函数进行预测。此外,借助Matlab分析计算软件以解决数据矩阵的复杂计算。
[1]梁昌勇,戚筱雯,丁勇,等.一种基于TOPSIS的混合型多属性群决策方法[J].中国管理科学,2012,20(4):109-116.
LIANG Changyong,QI Xiaowen,DING Yong,et al.A hybrid multi-criteria group decision making with TOPSIS method[J].Chinese Journal of Management Science,2012,20(4):109 -116.
[2]张亚东,邹波,郭进,等.基于TOPSIS法的列车运行控制系统风险排序模型的研究[J].中国铁道科学,2012,33(6):96-101.
ZHANG Yadong,ZOU Bo,GUO Jin,et al.Study on the risk ranking model of train control system based on TOPSIS method[J].China Railway Science,2012,33(6):96-101.
[3]Goyal,Kapil Kumar,Jain,P K,et al.Optimal configuration selection for reconfigurable manufacturing system using NSGA II and TOPSIS[J].International Journal of Production Research,2012,50(15):175 -191.
[4]程锦,谭建荣,余加红.基于TOPSIS的注塑工艺参数多目标稳健优化设计[J].机械工程学报,2011,47(6):27-32.
CHENG Jin,TAN Jianrong,YU Jiahong.Multi- objective robust optimization of injection molding process parameters based on TOPSIS[J].Chinese Journal of Mechanical Engineering,2011,47(6):27 -32.
[5]Nakhaeinejad,Mahdi,Nahavandi,Nasim.An interactive algorithm for multi-objective flow shop scheduling with fuzzy processing time through resolution method and TOPSIS[J].International Journal of Advanced Manufacturing Technology,2013,66(5):47 -64.
[6]韩彦彬,白广忧,李晓颖,等.基于支持向量机柔性机构动态可靠性分析[J].机械工程学报,2014,50(11):86-92.
HAN Yanbin,BAI Guangyou,LI Xiaoying,et al.Dynamic reliability analysis of flexible mechanism based on support vector machine[J].Chinese Journal of Mechanical Engineering,2014,50(11):86 -92.
[7]孟洛明,朱杰辉,杨杨,等.支持向量机回归预测在网络故障检测中的应用[J].北京邮电大学学报,2014,37:23-29.
MENG Luoming,ZHU Jiehui,YANG Yang,et al.A fault detection algorithm for wireless sensor networks based on support vector regression[J].Journal of Beijing University of Posts and Telecommunications,2014,37:23 -29.
[8]Lee Yuh-Jye.Reduced support vector machines:A statistical theory[J].IEEE Transactions on Neural Networks,2007,18(1):1 -13.
[9]张铃,钱付兰,何富贵.粒计算与统计学习理论[J].计算机科学与探索,2013,7(8):754 -759.
ZHANG Ling,QIAN Fulan,HE Fugui.Granular computing and statistical learning[J].Journal of Frontiers of Computer Science and Technology,2013,7(8):1 -13.
[10]Monnet J M.Support vector machines regression for estimation of forest parameters from airborne laser scanning data[J].IEEE International Geo-science and Remote Sensing Symposium,2010:2711-2714.
[11]邓蕊,马永军,刘尧猛.基于改进交叉验证算法的支持向量机多类识别[J].天津科技大学学报,2007,22(2):58-61.
DENG Rui,MA Yongjun,LIU Yaomeng.Support vector machine multi-class classification based on an improved cross validation algorithm[J].Journal of Tianjin University of Science & Technology,2007,22(2):58 -61.