邹 杰,葛俊锋,叶 林,郑 英,张 洪
(华中科技大学控制科学与工程系,武汉 430074)
基于支持向量机的飞机空中结冰严重程度识别
邹 杰,葛俊锋,叶 林,郑 英,张 洪
(华中科技大学控制科学与工程系,武汉 430074)
为了保证飞机的飞行安全,必须对飞机空中结冰的严重程度作出较准确的判断。针对飞机空中结冰状况的复杂性,提出将支持向量机与二分法相结合的飞机空中结冰严重程度识别的算法模型。仿真结果表明,虽然该训练样本较少且为多参量分类识别,但是由于建立了多支持向量机且采用二分法的概率抉择能找到最佳的建立支持向量机的分类方式,所以找到了最佳的分类方式,提高了分类准确率,而且可以较准确地识别飞机空中结冰的严重程度。可见该方法可以在训练样本较少的情况下对飞机空中结冰严重程度作出较好的识别效果。
飞机空中结冰;支持向量机;二分法
飞机空中结冰对飞机飞行安全具有重要影响[1],全世界已经发生了很多起由于飞机空中结冰而导致的空难事故,使国家和人民承受了巨大的精神和财产损失。西方发达国家早已对飞机空中结冰进行了大量研究,中国近年来也意识到飞机空中结冰的严重危害并开展了一系列的研究工作,但对飞机空中结冰严重程度的识别大多基于单参量。单参量识别具有一定的局限性,而且鉴于飞机空中结冰情况的复杂性,该研究还不可能获取大量的训练样本,为了能够在训练样本很少的情况下也能达到很好的分类效果,本文提出了基于支持向量机[2-3]的飞机空中结冰严重程度识别方法。在详细的分析空中飞机空中结冰复杂性的基础上,开展冰风洞试验进行基础研究,对影响飞机空中结冰的目标进行特征提取,并利用提取的特征产生初始的训练样本,然后采用支持向量机对小样本进行学习,再将学习的好的分类器结合二分法和概率论的基本原理进行分析识别。
支持向量机(support vector machine)是Vapnik于1963年首先提出的,用于解决模式识别问题,其理论基础源于统计学理论。与神经网络、遗传算法、人工智能等现有的学习机相比,在解决小样本、非线性及高维模式识别中支持向量机表现出许多特有的优势。
支持向量机是从线性可分情况下的最优分类面发展而来的,主要解决的是一个二分类问题,其基本思想可用如图1所示的二维情况说明。
图1 线性可分的最优分类线Fig.1 Linear divisible optimal classifier line
图1中正方形和圆形的圈代表两类数据样本,H、H1、H2为分类线,它们之间的距离margin=2/‖w‖。SVM就是要寻找一个满足要求的H、H1、H2,使训练样本中的点距离H尽可能地远,亦即使其两侧的margin尽可能大。
现实世界的实际问题很多是非线性问题,为了在此种情况下仍能实现支持向量机,于是引入了核函数,即通过一个非线性映射,把输入映射到另一个可以使用支持向量机处理的高维空间,然后计算高维空间的内积。
常用的核函数K(xi·xj)有以下两种:
线性核函数:K(x·ix)j=
径向基函数(RBF):K(x·ix)j=exp(-|xi-xj|2/σ2)
由于飞机空中结冰的严重程度识别是多分类问题,所以为了更好的分类,我们采用了二分法。其分类原理如图2所示。
图2 二分法基本原理Fig.2 Basic principle of method of bisection
如图2所示,二分法解决多分类问题就是将多类看成一个整体,每次采用一个SVM将其分成两类,再将余下的训练集用另一个SVM分成两类,以此类推,直到分出所有的类为止。由此可知,对于n分类需要构建n-1个支持向量机。
支持向量机可用于飞机空中结冰严重程度,主要体现在以下几个方面:
1)飞机空中结冰对飞机的影响程度受冰型(明冰、淞冰、混合冰)、温度、结冰速率、冰厚等因素的共同影响,所以飞机空中结冰的识别本质上是一个高维模式识别的问题,而支持向量机的特点是使其适合于解决高维模式识别的问题;
2)飞机空中结冰的真实数据极难获取,冰风洞模拟试验数据也比较难于获取,所以其仿真分析的数据样本往往是小样本,而支持向量机恰好适合于解决小样本的问题;
3)支持向量机已在飞机空中结冰的冰型识别方面取得了一定发展[4],为多参量识别提供了依据。
飞机空中结冰数据获取的关键在于两方面:探测装置(传感器)和模拟实验(结冰风洞试验)。
作为飞机空中结冰的探测装置[5],目前飞机空中结冰传感器在国内的相关研究比较少,目前国内只有华中科技大学等少数科研单位在进行飞机空中结冰探测技术的研究。作为飞机空中结冰的试验环境,国内仅有武汉航空仪表有限责任公司等极少的几家单位拥有结冰风洞。
本文选用的是自行研制开发的光纤式飞机空中结冰探测系统,在武汉航空仪表有限责任公司的结冰风洞中进行模拟试验而获取的。
美国国家大气研究中心(NCAR)将结冰的严重性指数S用数字0~10来表示,严重程度随数值的增大而增加[6]。前苏联将积冰强度按单位时间内的积冰厚度划分为轻度(<0.6 mm/min)、中度(0.6~1.0 mm/min)、重度(>1.0 mm/min)3个等级。因此,依据结冰厚度和结冰速率的综合影响将飞机空中结冰严重程度划分为未结冰状态、轻度结冰状态、中度结冰状态、重度结冰状态共4个严重程度。
将获取的38个数据样本根据结冰严重程度等级分为四个等级,每个数据样本包括温度、结冰持续时间、冰厚对应的电压值和结冰速率。用于支持向量机的数据样本,如表1所示。
表1 训练及测试样本Tab.1 Train and test sample
由于数据样本对SVM的分类识别具有决定性的影响作用,所以在训练之前需对数据样本进行归一化处理,使每个数据在一个给定的范围内(一般取(-1,1)之间),避免数据样本之间的大小差异性。归一化公式如下
式中:X*为归一化后的值;X为归一化前的值;Xmax、
Xmin为此影响因素中的最大值和最小值。
通过尝试仿真各种核函数,本课题选取线性(linear)核函数作为该SVM的分类核函数,将训练数据二分类进行训练,即每次将一个结冰等级作为一类,余下的一类或几类作为另一类进行训练。如将未结冰状态作为一类,将轻度结冰状态、中度结冰状态、重度结冰状态作为另一类训练。
为了提高飞机空中结冰严重程度识别的准确率,经过研究发现,对于多分类问题,不同的分类循序(即想把哪一类从多类中分出来)可以影响分类的准确率,于是提出了基于二分法的概率抉择。
对于n分类问题所需构建的n-1个支持向量机而言,其每一个支持向量机可能构建的二分类可能有多种可能性,如图2所示的SVM1可能的SVM二分类情况如图3所示。
图3 基于二分法的概率抉择Fig.3 Probility choice based on method of bisection
对应于每种可能分类情况的分类准确率可能各不相同,设对应于SVM1的n情况的分类准确率分别为 P11、P12、…、P1n,则对应于 SVMi的分类准确率分别为Pi1、Pi2、…、Pi(n-1),由此得最终的分类准确率P=P1x×P2y× … × Pnz,x∈1,2,…,n;y∈1,2,…,n-1;z=1。要提高分类的准确性就是要提高每个SVM的分类准确率,也就是对应于每个SVM,要从可能的分类情况中找出一个分类准确率高的情况,再在此情况下依次向下分。
因此,一种可行的提高多分类问题分类准确率的方法就是对根据一个数据样本的可能分类情况将其每一种情况都建立一个支持向量机,然后再比较其分类准确率,从中挑选出分类准确率较高的分类情况,再按相同的方法在此基础上继续往下分类,直至所有情况都被分类完全。
本文的分类属于多分类,采用的是one-againstall多分类法,通过构建3个SVM来区分4类样本数据,并通过二分法的概率抉择来提高分类的准确率。第1个SVM的构建有4种可能情况,于是构建了4个SVM,然后再比较它们的分类准确率,以确定第1个SVM的分类方式。0、1、2、3分别代表未结冰状态、轻度结冰状态、中度结冰状态、重度结冰状态,[0:1-2-3]代表将未结冰状态作为一类,将轻度结冰状态、中度结冰状态、重度结冰状态作为另一类训练,检验结果如表2所示。
表2 SVM1检验结果Tab.2 SVM1test result
由表2可知,[0:1-2-3]分类方式构建的SVM能将未结冰状态和轻度结冰状态、中度结冰状态、重度结冰状态完全区分开,为四种可能的分类情况中准确率最高的一种。因此第一个SVM将先区分有冰状态和无冰状态。
经过第1次区分后,只需区分轻度结冰状态、中度结冰状态、重度结冰状态。第2个SVM的构建有3种情况,检验结果如表3所示。
表3 SVM2检验结果Tab.3 SVM2test result
由表3可知,[1:2-3]分类方式构建的SVM能将轻度结冰状态和中度结冰状态、重度结冰状态完全区分开,为四种可能的分类情况中准确率最高的一种。因此第2个SVM将区分轻度结冰状态和中度结冰状态、重度结冰状态。
经过第2次区分后,只需区分中度结冰状态和重度结冰状态。第3个SVM的构建只有一种可能性,检验结果如表4所示。
表4SVM3检验结果Tab.4 SVM3test result
由表4可知,该SVM能正确区分中度结冰和重度结冰。
通过以上分析可发现:采用先从未结冰状态、轻度结冰状态、中度结冰状态、重度结冰状态所组成的总样本中区分出未结冰状态,然后再从剩余的样本中区分出轻度结冰状态、再从剩余样本中区分中度结冰状态和重度结冰状态的样本的分类顺序可以达到最佳的分类准确率。
若令识别率Px=S1x×S2x×S3x(S1x、S2x、S3x分别为某种分类方式在某个支持向量机的分类准确率,如S12则为[1:0-2-3]这种分类方式在第一个构建的支持向量机下对应的分类准确率),则对于本试验样本若采用本文提出的支持向量机与二分法相结合的分类方式的分类准确率为P=S11×S21×S31=100%×100%×100%=100%,而当采用其它分类方式的分类准确率时,则由于参数 S1x 本文探讨了基于支持向量机的飞机空中结冰严重程度的识别,采用二分法来解决多分类问题,并提出了基于二分法的概率抉择的方法。从检验结果显示,支持向量机能够较好地对飞机空中结冰的严重程度作出分类识别;不采用二分法的概率抉择,不能够完全正确的对飞机空中结冰严重程度进行分类识别,而采用了二分法的概率抉择之后分类的准确率大大提高。未来的研究方向将是在核函数的选取方面再进行仔细的研究。 [1] 张德跃,王国栋.警惕!飞机结冰[J].江苏航空,2008(1):12. [2]VAPNIK V N.统计学习理论的本质[M].北京:清华大学出版社,2000. [3] 邓乃扬,田英杰.统计学习理论的本质[M].北京:科学出版社,2009. [4] 张 镇,叶 林.基于支持向量机的主动红外式结冰冰型分类方法研究[J].计算机应用研究,2010(7):2560-2562. [5] 张 杰,周 磊,张 洪,等.飞机空中结冰探测技术[J].仪器仪表学报,2006,27(12):1578-1586. [6]POLITOVICH M K,SAND W R.A Proposed Icing Severity Index Based Upon Meteorology[C]//4th International Conference on Aviation Weather Systems,1991:24-27. Aircraft Air Icing Severity Recognition Based on Support Vector Machine ZOU Jie, GE Jun-feng,YE Lin, ZHENG Ying,ZHANG Hong In order to guarantee the aircraft flight safety, must on the severity of the aircraft air icing a more accurate judgment.Aiming at the complexity of the aircraft air icing conditions,the aircraft air icing severity recognition algorithm model was built which mixed SVM (support vector machine) and method of bisection.The simulation results show that, although the training sample is not enough and there are many parameters,but due to not only one support vector machine and with dichotomy of probability choices can find the best build SVM classification approach, and found the perfect classification method, improve the classification accuracy,but also can accurately identify the aircraft air icing severity.So this method make good recognition effect of the aircraft air icing severity even there are not enough the training sample. aircraft air icing;SVM;method of bisection TN911 A 1674-5590(2011)02-0009-04 2010-10-09; 2011-01-04 基金项目:国家自然科学基金项目(60975030) 邹 杰(1986—),男,湖南长沙人,硕士研究生,研究方向为结冰探测、数据处理. (责任编辑:杨媛媛)4 结语
(Dept of Control Science&Engineering,Huazhong University of Science&Technology,Wuhan 430074, China)