李玲,王江涛
基于分步降维HOG-LBP特征的行人头部分类算法
李玲,王江涛
(淮北师范大学 物理与电子信息学院,安徽 淮北 235000)
传统的基于PCA-HOG特征的行人头部分类算法存在降维后的子空间鉴别性不足的问题.为此,提出一种基于分步降维HOG-LBP特征的行人头部分类算法.首先,利用样本类别标签构建2类样本的HOG特征集合,在这2类特征集合中分别执行PCA降维,然后将所得的特征与LBP纹理特征进行级联得到最终的头部描述算子,最后通过训练SVM分类器对实际样本集进行分类.实验结果表明,与传统PCA降维方法相比,该方法可有效提高行人头部的分类性能.
HOG;LBP;PCA;头部检测
一直以来,行人检测都是模式识别与计算机视觉领域的研究热点,而头部作为行人的重要局部特征,对正确检测出行人起到重要的作用.
近年来,众多研究人员提出多种不同的特征表达方法来进行行人检测,其中应用最广泛的是2005年由Dalal和Triggs提出的方向梯度直方图(HOG)描述算子[1].该算子通过统计局部区域内的梯度方向分布来表达图像中目标的外形轮廓,目前已被广泛地应用在图像处理与计算机视觉领域中[2-7].随着研究的不断深入,与HOG融合的特征算法相继出现,文献[8]提出将局部HOG特征与Haar特征级联起来对行人进行分类的方法.尽管HOG得到广泛的关注,但是存在特征维数高的缺点,导致训练分类器性能欠佳.除了HOG特征外,LBP特征是当前的另外一种流行特征描述算子,它可对局部目标的纹理特征进行有效表达,且已被广泛用于车牌识别及文字识别等领域.Ahonen[9]等人将LBP特征应用于人脸识别且取得了良好的效果.而文献[10]则给出一种方向梯度直方图与纹理特征融合的方法来解决图像检索问题,此方法取得了较单一的特征更好的检索性能.
本文设计了一种将HOG特征和LBP特征相级联的行人头部特征表达方法.在构建HOG特征时,分别建立正负样本的HOG特征集合,通过分步地在2个特征集合上进行PCA处理得到降维子空间.将降维后的HOG特征与相对应的LBP特征进行级联构建行人头部描述算子,最后通过SVM训练分类器实现人体头部分类.实验表明,所设计的描述算子可以显著提高行人头部检测性能.
1特征的相关描述
1.1HOG特征
一般来说,边缘方向分布或者梯度方向分布可以很好地表征局部目标的轮廓和形状.基于此,Dalal 和Triggs提出了HOG描述算子来对物体进行表达,并取得了优异的效果.对待检测图像进行HOG特征构建的步骤大致如下:
(1)如果待测图像不是灰度图像,则先对其进行灰度化处理;
(2)计算图像每个像素的梯度(包括大小和方向),位于像素点的梯度可以表达为
(3)将图像划分成多个小块cells;
1.2LBP特征
局部二值模式(Local Binary Patter,LBP)主要用来描述图像的局部纹理特征模式,它具有灰度不变性和旋转不变性等显著优点.目前,LBP特征已被广泛应用到车牌识别、人脸识别和指纹识别等领域.
传统的LBP特征构建过程(见图1):首先设定一个固定大小33的邻域窗口,令窗口的中心像素点的值为阈值,然后将其周围的8个像素点的值与其进行比较.如果周围像素值大于阈值则令其为1,否则为0,最后根据比较结果可以得到一个8bit无符号数,该无符号数即中心像素点的LBP编码值.
图1 提取LBP特征
由图1可见,像素点最终可以用一串二进制序列表示为(01001100)2=76,即中心像素点的LBP编码值,对图像每个像素点求LBP特征值,最后统计所有编码值的直方图即可得到LBP特征.
2分步降维HOG-LBP级联特征的构建
2.1分步降维HOG
在使用HOG特征时,其面临着特征维数多、计算量大,导致训练分类器复杂度高的问题.对于此问题,常采用PCA算法来对HOG特征降维.PCA是一种当前应用最广泛的无监督降维方法,其核心思想是保留最新信息量的同时将高维数据投影到一个低维空间.PCA降维的步骤如下:
(7)
(8)
(9)
(11)
(4)将训练样本在新的特征空间投影
(12)
PCA可以很好地保留样本特征间的共性信息,但由于其无监督特性,没有考虑异类样本间的鉴别性.因此,采用PCA得到的降维空间不能保证异类样本在该空间中的鉴别性.
为了克服该问题,与传统的PCA降维方法不同,本文采用不对正负样本整体执行PCA降维,而是分别在正负样本集合内进行2次PCA降维的策略.对于正样本集合来说,在该集合进行PCA降维得到正样本间最具共性的特征,当负样本投影到该空间时,其将保持与正样本间的鉴别性.同样的,在负样本集合内部进行PCA降维时,将得到负样本间最具共性的低维信息;当正样本投影到该空间时,将保持与负样本间的鉴别性.
经过处理后,可以得到2个投影子空间,分别为S1={d11,d12,d13,...,d1},S2={d21,d22,d23,...,d2},将2个子空间进行连接得到一个新的特征空间S={ d11,d12,d13,...,d1,d21,d22,d23,...,d2},对于待分类的样本在这个特征空间进行投影,最终得到分步降维后的HOG特征(见图2).
图2 分步降维HOG-LBP级联特征的构建
2.2HOG-LBP级联特征
在对目标图像进行特征表达时,不同的特征之间往往是互补的,采用多特征可以进一步地提高检测的鲁棒性.LBP特征作为一种纹理描述算子,在目标检测中已显示出优良的性能.将降维后的HOG特征与LBP特征结合,可以在得到方向梯度信息的基础上获取头部的纹理信息L={d31,d32,d33,...,d3},从而提高在复杂背景中人体头部检测率.以此为出发点,本文采用将分步降维后HOG特征和LBP特征级联的方法来构建头部图像描述算子E={ d11,d12,d13,...,d1,d21,d22,d23,...,d2,d31,d32,d33,...,d3},这种方法不仅有效地降低了HOG的大量冗余信息,实现信息有效压缩,而且考虑了特征的多样性.
分步降维HOG-LBP级联特征的构建过程见图2,正负样本分别进行降维得到2个特征空间,二者结合构成新的特征再与LBP特征级联,最后将所得特征与样本标签一起经SVM训练得到人头分类器.当给定一待分类样本,将其特征送入分类器即可得到分类结果.
3实验及分析
通过对现实场合下采集的样本图像进行分类实验,来评估HOG-LBP级联特征的性能.为验证该方法的有效性,将该方法在配置为intel处理器,CPU主频为3.40 GHz,RAM为4.00 G的机器上采用MATLAB平台编写算法.实验中所用的样本取自某公交车监控图像序列,正样本集合通过手工截取人体头部图像来获得,而负样本图像则为在没有行人的图像中随机截取构建.训练样本中包括500张正样本(人体头部模型),3 500张负样本(非人体头部模型),而测试样本包括60张正样本,245张负样本.部分正负样本示例见图3,为简化计算将所有样本大小归一化为64×64.
图3 部分正负样本
在构建HOG特征时,采用如下参数设置:每个cell的大小设为8×8,每个cell梯度方向为9,滑动步长为8,2×2个cell构成一个Block,从而每个Block特征维数为36维,最终得到HOG特征维数为1 764.
在对HOG特征进行降维时,令正样本集合所得投影空间维数为维,负样本集合所得投影空间维数为,则最后得到的分步降维HOG特征维数为.
在计算样本图像的LBP特征时,采用分块均匀模式LBP特征(Uniform LBP)构建方法,通过该方法对任一局部区域可以得到一个59维的特征向量.将样本图像分成个局部区域,则总的LBP特征维数为
(13)
采用2.2中所给出的方法,将降维后的HOG特征与LBP特征相级联集合得到样本图像的描述特征E,其维数为,得到每个样本的级联特征后即可训练SVM分类器进行分类决策.
鉴于SVM分类器的优异性能,实验中采用SVM分类器来对测试样本进行分类,SVM分类器采用的核函数为径向基函数.为了能对不同特征的分类性能进行对比,实验中分别使用传统的PCA降维后的HOG特征和LBP特征,这2种特征的级联特征以及本文所提出特征进行分类实验.分类结果见表1.
表1 不同特征组合下的性能分类比较 %
表1给出了各种分类器对测试样本的正确分类率,其中特征维数的选取根据主成份所占能量比来确定.由正确分类率数值可以看出,随着选取特征主成份所占能量比的不断增大,传统的PCA-HOG和LBP分类准确率保持稳定的水平,当两者进行特征级联后,分类正确率随着能量比的增大逐渐提高,当达到总能量的95%时,分类精度最高.在4种特征表达方法中,本文的方法取得了最高的正确分类率.实验结果表明,采用分步降维HOG-LBP级联特征可以有效地提高头部图像的特征表达性能.
4结束语
在注意到传统的PCA降维方法没有考虑样本标签信息的基础上,本文提出一种分别在正负样本集合内对HOG特征进行降维的方法,以提高降维后特征的鉴别性能.该方法将分步降维后的HOG特征与LBP特征相级联得到样本图像的特征描述子.对实际场合中的样本采用SVM分类器进行分类的结果表明,所设计的特征描述算子可以进一步提高特征表达性能.
[1] Dala N,Triggs B.Histograms of oriented gradients for human detection[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.San diega IEEE,2005:886-893
[2] Ninomiya H,Ohki H,Gyohten K.An evaluation on robustness and brittleness of HOG feature of human detection [C]// 17thKorea-Japan Joint Workshop on Frontiers of Computer Vision.Ulsan IEEE,2011
[3] 顾炯,赵曙光,王宏斌.基于Joint HOG特征复杂场景下的头肩检测[J].电子设计工程,2012,20(7):58-62
[4] 孙丽娟,张立材.基于边缘梯度方向直方图的静态手语识别[J].微电子学与计算机,2010(3):148-150
[5] 李林,张丽红.基于改进梯度方向直方图的多尺度的行人检测[J].计算机应用,2013,32(A2):168-170
[6] 刘威,段成伟,遇冰,等.基于后验 HOG 特征的多姿态行人检测[J].电子学报,2015,43(2):217-224
[7] 李星,郭晓松,郭君斌.基于HOG特征和SVM的前向车辆识别方法[J].计算机科学,2013,40(11A):329-332
[8] Geismann P,Schneider G.A two-staged approach to vision-based pedestrian recognition using Haar and HOG features[C]// IEEE Intelligent Vehicles Symposium.IEEE,2008:554-559
[9] Ahonen T,Hadid A,Pietikinen M.Face Description with Local Binary Patterns:Application to Face Recognition[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2006,28(12):2037-2041
[10] Yu J,Qin Z C,Wan T,et al.Feature integration analysis of bag-of-features for image retrieval[J].Neurocomputing,2013,120(23):355-364
Pedestrian head classification algorithm with two-step dimension reduction HOG- LBP feature
LI Ling,WANG Jiang-tao
(School of Physical and Electronic Information,Huaibei Normal University,Huaibei 235000,China)
Traditional pedestrian head classification algorithm based on PCA-HOG feature has the problem of degradation of the discrimination in the subspace.In order to handle this problem,the pedestrian head classification is completed based on the proposed two-step dimension reduction HOG- LBP feature.Firstly,two category of HOG sample set are obtained according to the sample labels.The PCA algorithm is carried out on each sample set step by step.Then the LBP texture features are combined with the dimension reduced HOG feature to form the final head descriptor.Lastly,experiments were performed by SVM classifier on practical test samples,and the experimental results show that,comparing with the traditional PCA algorithm,the presented HOG-LBP features can effectively improve the classification performance of pedestrian head.
HOG;LBP;PCA;head detection
1007-9831(2016)07-0029-05
TP391.41
A
10.3969/j.issn.1007-9831.2016.07.008
2016-05-17
国家自然科学基金资助项目(61203272);安徽省高校优秀青年人才支持计划重点项目(gxyqZD2016113);安徽省自然科学基金项目(1508085MF116);淮北师范大学教学研究项目(jy15128)
李玲(1992-),女,安徽滁州人,在读硕士研究生,从事图像处理、模式识别方面的研究.E-mail:1784656698@qq.com
王江涛(1979-),男,山东潍坊人,副教授,博士,从事视频处理、计算机视觉方面的研究.E-mail:jiangtaoking@126.com