摘要:通过介绍基于机器学习的分类器的训练过程。首先对模式识别的相关知识进行介绍,并对分类器的训练进行具体的说明;然后给出了机器学习中最常用的支持向量机(SVM)方法和梯度方向直方图特征描述的相关知识,重点讲述了其原理和计算过程,建立了工程车辆样本库,采用梯度方向直方图作为样本特征,使用线性支持向量机的方法训练分类器,最后通过实验证明了算法的正确性和可行性。
关键词:梯度方向 支持向量 工程车辆 HOG特征
中图分类号:TP391.1 文献标识码:A 文章编号:1007-9416(2016)06-0000-00
1 引言
一个完整的模式识别系统应该包括从信息数据的采集、处理、分析到决策的整个过程[1]。而要使机器具有人的智能,相应的必须具备人体所拥有的一些最基本的功能,比如视觉、触觉;而且应该具备大脑一样的分析决策能力。就算一个简单的人的动作让机器来模仿也是相当困难的。如图1给出了一个完整的模式识别系统流程图[2-3]。
从图1中可以看出完整的模式识别所经过的不同的模块。传感器相当于人的感官,主要负责数据信息的采集;特征提取器所提取的特征具有以下性质:同一类别的不同样本特征值非常接近、不同类别的样本的特征值有很大差异、这些特征值对与类别不相关的变换具有不变性;而且特征提取相比分类器更加依赖问题所在的具体领域,所有相应领域的知识能够帮助寻找出更有效的特征 [4-5]。分类器是模式识别系统的核心模块,相当于这个系统的大脑,其作用是根据特征提取器得到的特征值来对一个被测样本进行分类标记;同样理想的分类器是不可能得到的,作为解决方案,往往采用确定一个可能类别的概率,根据概率分析结果;后处理是根据分类器给出的结果做出相应的动作,是模式识别系统的输出,也是模式识别最终的目的。
图2给出了分类器训练的流程图,所采用的是有监督学习的方法。数据采集是对于训练样本而言的,是有监督学习的方法。特征的选择需要根据特定领域的具体问题而定,选取具有明显区分意义的和不易被噪声干扰的特征。训练分类器,利用样本的特征数据确定分类器的过程;分类器的训练是一个比较复杂的问题,起码到目前为止没有一个通用的方法可以完美的解决所遇到的所有问题,但采用基于样本的分类器训练方法已得到人们的共识。
1 选择训练样本
训练样本作为训练系统的输入内容,承载了所要识别对象的主要特征信息。机器学习就是去模仿人类的大脑的能力,通过对样本知识的学习去辨别新的问题;然而现有的技术远远达不到人类的水平,学习的能力很难达到需要区分的高度。这样选取的样本对分类器的训练结果起到了决定性的作用。为弥补技术上的不足,通常采取选取与实际环境比较相近的样本、加大样本的数量等方法提高分类器的准确率。用于训练车辆分类器的样本必然使用包含所要识别车辆的图片作为正图像,而且图像的尺寸不宜太大;所有样本变换为同样大小的尺寸。
2 训练分类器
分类器的训练是一个机器学习的过程,根据模式识别的知识可以了解具体的步骤:第一步是选取一定数量的样本;第二步是提取样本的特征信息,本算法采用的特征是梯度方向直方图,用于对图像进行描述,提取样本的信息就是计算样本的梯度方向直方图特性,得到的是一个多维的特征向量;第三步就是对特征信息进行学习最后得到一个能用于检测识别的分类器,为检测的时候方便,在得到分类器之后将其转换成能可以直接用于对图像进行检测的检测算子。如图3所示是样本分类器训练系统的流程图。
计算出所有样本的HOG特征,得到一组2916维度的特征向量;这一组向量作为线性SVM的输入,其中正样本的向量标识为1,负样本的向量标识为0。训练的原理在SVM原理中有所介绍;其过程是根据确定的分类间隔和给出的样本点,不断的对分类函数进行修正,最后求解出分类函数的系数向量 ;由此得到分类器。分类器作为训练结果,包含的信息可能比较多,而不适合直接用于图像中目标的检测;为检测方便,将分类器转换为检测算子的形式,可以用于任何尺寸图像的目标检测。
3 工程车辆的特征提取
算法选用梯度方向直方图(HOG)作为样本的特征信息。本文将样本图像划分成均匀的小块,每个小块包含8×8的像素,求取每个像素点的边缘(梯度信息);并以每个小块为单位将边缘映射到9个不同的方向块中。每个方向块的范围为20度;8×8像素梯度方向投影到9个方向块内,形成9维的特征向量作为细胞的值。投影是采用加权投票的方式,这个权值是根据该像素点的梯度幅度计算出来的。大块(Block)表示相邻的2×2cell。一个大块(Block)中包含36(4×9)维的特征向量,其中相邻大块之间是相互重叠的,步长按照cell的大小行进。以80×80像素的图像为例,根据步长为8个像素,图像包含9×9个大块,转化为HOG特征描述为一个2916(9×9×36)维的向量。
4 结语
本文主要介绍了基于机器学习的分类器的训练过程。首先对模式识别的相关知识进行介绍,并对分类器的训练进行具体的说明;然后给出了机器学习中最常用的支持向量机(SVM)方法和梯度方向直方图特征描述的相关知识,重点讲述了其原理和计算过程;在此基础上介绍了本文算法的分类器训练过程。
参考文献
[1] 李宏东,姚天翔 译.Richard O.Duda,Peter E.Hart,David G..Stork,模式分类(第二版)[M].北京:机械工业出版社,2003.
[2] 刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图像图形学报,2009(4):622-635.
[3] VAPNIK V. Statistical learning theory[M].New York:Wiley,1998,56-70.
[4] 曹翼.基于支持向量机理论的车辆监控技术研究与应用[D].上海:上海交通大学,2010:30-32.
[5] 车志富.基于支持向量机的行人检测[D].北京:北京交通大学,2010:25-27.
收稿日期:2016-03-30
作者简介:崔鹏宇(1982—),男,辽宁丹东人,硕士,讲师,研究方向:计算机应用、网络安全、计算机控制方面的教学与科研工作。