基于SV M分类器的道路湿滑图像分类方法研究*

2011-08-17 09:37刘新宇黄德启
关键词:正确率分类器向量

刘新宇 黄德启

(武汉理工大学水路公路交通安全控制与装备教育部工程研究中心 武汉 430063)

0 引 言

目前路面传感器是获取路面湿滑状况信息主要手段,由于路面传感器智能获取断面路况的点信息,且维护极为不便,基于道路监控摄像机的路况图像识别技术以及结合路测非接触传感器判别路面湿滑状况成为当前研究的热点.Kuehnle Andreas[1]利用路面图像灰度的统计特征作为路面湿滑状况分类器的输入,设计了神经网络路况分类器识别路面干、湿、结冰等状况.YA MADA MUNEO[2]利用车载摄像机采集路况信息,以路面图像极化特征等为参数建立路面湿滑状况评价模型.I.Becchi等[3]通过摄像机拍摄路面水流状况,综合图像分析结果和降雨密度值判断路面水膜深度,并以此预测路况演变规律.Lars Forslöf[4]采集3 135幅路面图像包含了干燥、结冰、积雪和潮湿四种状况,并提取原始图像像素灰度统计特征、图像边缘和轮廓信息、高亮度像素块的大小和分布信息作为分类器输入参数,建立路面湿滑状况神经网络分类器.Fu kui[5]通过计算路面图像的表面亮度和空间频谱,分析道路的湿滑状况.王维锋,初秀民等[6]提出利用D-S证据理论和人工神经网络方法对不利天气下的交通运行状况等级进行识别与预测.

本文首先利用所设计的SV M分类器结合三种训练算法对道路湿滑图像进行分类学习训练,并通过训练后的SV M分类器对大量道路湿滑图像进行分类实验,最后分析了实验结果,并讨论了SV M分类器在道路湿滑图像分类上存在的优缺点,以期寻找利用有限样本设计高效、泛化性好的路况图像识别SV M分类器.

1 支持向量机(SV M)分类器

支 持 向 量 机 (support vector machines,SV M)与其他机器学习方法相比,在解决小样本、非线性及高维模式识别问题上表现出许多特别的优势,具有良好的推广能力和很强的普适性,可用于模式识别、回归估计及函数逼近等方面.支持向量机的最终求解可以转化为一个线性约束凸二次规划问题,不存在局部极小;引入核函数方法可以将线性支持向量机简单地推广到非线性支持向量机,而且对于高维样本几乎不增加额外的计算量,成功地解决了维数灾难问题[7].

SV M最初是用以解决两类分类问题,不能直接用于多类分类.当前已经有许多算法将SV M推广到多类分类问题,这些算法统称为“多类支持向 量 机 ”(multi-category support vector machines,M-SV M).它们大致有以下两种思路[8-9]:(1)通过某种方式构造一系列的两类分类器并将它们组合在一起来实现多类分类;(2)将多个分类面的参数求解合并到一个最优化问题中,通过求解该最优化问题“一次性”地实现多类分类.

第二类方法尽管看起来简洁,但在最优化问题求解过程中的变量远远多于第一类方法,训练速度不及第一类方法,而且在分类精度上也不占优.当训练样本数非常大时,这一问题更加突出.

2 SVM分类器设计与实现

2.1 SVM分类器设计思想

支持向量机算法是针对两类数据分类的,本文推广SV M的分类思想,对多类数据进行分类.图1给出了非线性多类分类器的设计思路.

图1 多类分类的转化示意图

由图1可知,多类分类的非线性模式最终转化成了两类分类的线性模式,由此设计非线性多类分类器.图中非线性向线性的转换依赖于核函数对输入空间的非线性变换.具体如图2和图3所示.

图2 核函数的非线性变换

图3 高维属性空间的线性分类

经过复杂的变换之后,最终问题优化成求解一个二次规划问题(quadratic progra mming pr oblem,QP).

本文采取一对一判别策略.对于m类模式的分类问题,可以设计m个两类分类器,其中每个分类器只区分一类模式与其他类.

给定输入模式x,设m个分类函数为

在理想情况下,应存在某个k∈{1,2,…,m},使得

且满足:fJ(x)<0,j=1,…,k-1,k+1,…,m,则输入模式应属于第k类.为了增加分类器输出的可靠性,可以采用更严格的判据条件,即如果

式中:τ>0,则判定输入模式应属于第k类.

2.2 分类器设计实现

本文采集沥青路面图像,选用JVC GZHD6 AC摄像机随机拍摄.

要实现SVM分类器对道路湿滑图像进行分类,首先要对道路湿滑图像进行特征选择.本文使用基于内容的特征提取方法选择灰度特征、结构特征和纹理特征.通过离线方式用主成分分析法和Tabu搜索提取有效特征并降维,运用基于类内类间距离的可分性判据选取最有效的低维特征.通过特征库分析,由灰度方差值,2阶Hu不变矩,灰度共生矩阵特征,频谱密度特征,Gabor纹理特征组成特征矢量构成最优特征解.图4为特征选择流程图.

图4 特征选择流程图

为了对比支持向量机(SVM)在非线性方面的分类性能,运用相关的非线性模式对多类道路湿滑图像数据分类,该模型包括3种分类算法:OAA算法、OAO算法、BSVM算法.在实现过程中该模型还结合4种核函数:linear内核、rbf径向基函数内核、poly多项式内核以及Sigmoid内核,形成3×4=12种组合来对多类数据进行分类.

图5和图6分别是程序进行分类器设计和实现的流程图.

3 分类结果分析

在实验之前,把特征分为二维,研究SV M分类器的分类性能,为多维特征输入的分类设计作理论基础准备.设计的分类器界面及结果如图7所示.

图5 分类器设计流程图

图6 分类器实现流程图

图7 SV M分类器界面

表1~表3分别对应训练时间,支持向量个数和分类错误率,以对比3种非线性分类训练算法的效率与准确率,表4表明了不同样本情况下的SV M性能对比的情况.

表2 SVM支持向量个数

表3 SVM分类错误率

表4 不同样本情况下的SVM性能对比

从以上实验中可以分析得出一些结论.从训练时间上看,BSV M训练时间最长,要高出其他两种几倍.OAA和OAO训练所需时间大概一致,而核函数对训练时间的影响不大;从分类所需的支持向量数量上看,BSV M分类所需的支持向量最少,OAO次之,OAA最多,核函数对支持向量个数的影响也不大;从分类的错误上看,BSV M错误率最小,都为0,这说明该算法能把这个数据集完全正确的分开.OAO分类错误率也比较小,OAA的最大.但是在RBF核函数下,其分类错误率都为0,说明RBF核函数较其他核函数在某些方面有优势,而RBF核函数也是常用的核函数之一.选用OAO方法的RBF核函数进行分类试验,其结果如图8所示.约定输出结果分别对应的是干燥、潮湿 、水膜、淤泥、冰雪、松雪、积雪、干冰.从统计中也可以看出:积雪路面的分类正确率达100%,这与其明显的特征是有很大关系的,最难分辨的是干燥路面,分类错误率达83.2%.在训练样本为240个时,分类正确率71.8%,而选用360个样本进行训练后发现正确率下降到68.0%,选用400个样本进行训练后发现正确率下降到66.1%,560个样本训练的正确率是65.6%.这一反常现象也说明了SV M的本质是寻找最优超平面,而不是逼近.

图8 不同样本数时的SV M分类结果

4 结 论

1)对于SV M,同一组数据选择不同的核函数,基本上都可以得到相近的训练效果.在四种核函数中,选用RBF核函数的SV M正确率稍高一些.OAO和OAA的效率相差不大,但都比BSV M训练的时间少.寻找合适的核函数,选择合适的参数是使用SV M进行高效分类的一个重要因素.

2)在训练过程中,MSE值能反映出分类器实现的正确率,因此,SV M的训练本身的误差决定了分类的正确率,可见其泛化性能并不高,训练个数的增多带来了特征空间维数的增加,从而导致计算量的增大.

由此可见,支持向量机在二次型寻优过程中要进行大量的矩阵运算,因此,多数情况下,矩阵运算占用了算法时间的主要部分,随着训练数据个数的增加,支持向量的个数和训练时间也随之增多,而且支持向量只是总训练样本中的很少一部分,要使支持向量机标准算法达到最佳效果,应该选取合适的训练个数,使得分类的训练时间达到最佳效果,并提高分类的正确率.

[1]Andreas K,Wilco B.Winter road condition recognition using video i mage classification[C]//Source:Transportation Research Record 1627,1998 National Research Council:29-33.

[2]Muneo Y,Koji U,Isao H,Shin Y,Sadayuk T.Detection of wet-road conditions fr o m i mages captured by a vehicle-mounted camera[J].Rob Mechatron,2005,17(3):269-276.

[3]Caporali B E,Castelli F,Lorenzini C.Field analysis of the water fil m dynamics on a road pavement[J].Phys.Chem.Earth(C),200l,26:717-722.

[4]U.S.Depart ment of Transportation Federal Highway Ad ministration.Final report on signal and i mage processing for road condition classification[R].Aerotech Telub and Dalar ma University,2002.

[5]Fukui H,Takagi J,Murata Y,Takeuchi M.An i mage processing method to detect road surface condition usingoptical spatial frequency[J].Intelligent Transportation System.IEEE Conference on,1997.ITSC97:1005-1009.

[6]Wang Weifeng,Wu Qing,Chu Xiumin,Wu Yong.Discussion to infor mation acquisition technology and safety identification method of traffic environ ment[J].Pacific-Asia Wor kshop on Co mputational Intelligence and Industrial Application,2008,12:874-878.

[7]Zhang Xuegong.Introduction to statistical learning Theory and support vector machines[J].Acta Automatica Sinica,2000,26(1):32-42.

[8]Hsu Chih-Wei,Lin Chih-Jen.A co mparison of met hods for multiclass support vector machines[J].IEEE Transactions on Neural Networ ks,2002,13:415-425.

[9]Burges J C.A tutorial on support vector machines for pattern recognition[J].Data Mining and Knowledge Discovery,1998,2(2):l-47.

猜你喜欢
正确率分类器向量
向量的分解
聚焦“向量与三角”创新题
门诊分诊服务态度与正确率对护患关系的影响
基于实例的强分类器快速集成方法
生意
品管圈活动在提高介入手术安全核查正确率中的应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
生意
向量垂直在解析几何中的应用