焦淑红,孙志帅
(哈尔滨工程大学 信息与通信工程学院,黑龙江 哈尔滨 150001)
基于GPCA的KNNY与SVM融合的人脸识别方法
焦淑红,孙志帅
(哈尔滨工程大学 信息与通信工程学院,黑龙江 哈尔滨150001)
摘要针对K近邻和支持向量机人脸识别率较低的问题,采用一种KNN和SVM融合的识别方法。提出了一种Gabor小波和主成分分析进行人脸特征提取,KNN-SVM进行分类的人脸识别方法。基于ORL和YALE人脸库中进行实验,结果表明该算法较KNN和SVM中任何一个的识别率都要高,且识别率最高可达到98.89%。
关键词K近邻;支持向量机;Gabor小波;PCA;人脸识别
人脸识别是通过计算机对人脸进行学习然后利用特征进行识别,作为生物识别的重要分支,其具有诸多优点,并在出入控制、公共安全、刑侦破案和人机交互等方面具有重要的应用[1]。
利用Gabor小波进行特征提取时,能克服光照、角度、尺度等全局干扰对识别结果的影响[2],但是会造成维数灾难,即使维数大幅度提高,增加计算量,可通过均匀采样和主成分分析(Principal Component Analysis,PCA)进行降维,降低计算量。
K近邻(K Nearest Neighbors,KNN)和支持向量机(Support Vector Machine,SVM)是人脸识别过程中常用的识别分类方法,其具有自身的特点,通过实验发现对于相同的样本,同样的识别目标,采用不同的分类方法识别率是不同的,识别出来的目标也不完全相同的,有交叉的部分,也有不同的部分。进而提出了一种KNN和SVM相互融合的分类方法,使得兼有两者的识别优势,提高了识别率,实验结果证明了其算法的有效性。
1Gabor小波、KNN和SVM分类器简介
1.1Gabor小波算法
Gabor小波以其图像处理上的独特的优势,近年来得到了广泛应用。其拥有多尺度和多方向特点的同时,也容易造成维数大幅度增加。2D-Gabor小波和核函数定义为
(1)
将人脸图像和Gabor小波核函数进行卷积,则每幅图便可等到40幅Gabor纹理图像,这样图像的维数大幅增加,进而计算量大幅增加,需要进行降维。降维方法一般是均匀采样和主成分分析。采样因子的数量影响最终的识别率,PCA降维过程特征向量的数量同样也影响最终的识别率,最优的结果均可通过实验获得,但这个数字具有一定局限性,针对不同的人脸库,取值也不同。
1.2KNN算法
K近邻(KNN)是模式识别方法中常用和简单的方法之一,是Cover和Hart于1968年提出[4]。K近邻是1NN的推广,识别的基本过程是选取待识别目标和训练目标之间的距离最小的若干个,根据训练目标的类别对待识别目标进行分类。KNN算法如下
(2)
其中,f′(zr)是对f(zr)的估计,其是距离zr最近的m个训练样本的f值
(3)
其中,z是n维空间中的点;f(zr)表示zr的所属类别;γ(a,b)是类别判别函数。
1.3SVM算法
支持向量机是CorinnaCortes和Vapnik于1995年首先提出的,其在解决小样本、非线性和高维模式识别中表现出许多特有的优势[5]。其是建立在统计学习理论的VC维理论和机结构风险最小原理基础上,根据有限样本信息在模模型的复杂性和学习能力之间寻求最佳折中,以获得最佳的推广能力。简而言之,就是将样本通过某种非线性函数映射到一个线性可分的空间,且寻求这一线性可分空间的最优线性可分超平面[6]。其判别函数为
(4)
其中,h(zi,zj)是核函数,核函数需满足的条件φ(zi)·φ(zi)=h(zi,zj),φ(z)为任意函数。
2GPCA的KNN和SVM融合人脸识别算法
K近邻识别算法是最简单的算法之一,其具有良好的定位性能,但识别率较低[7]。SVM算法具有较好的识别率,尤其在解决小样本问题上具有特别的优势,但识别分类时间较长,用KNN进行范围定位,然后用SVM进行精确识别,达到优势的互补,同时也提高了识别率[8]。具体流程如下:(1)利用Gabor小波对人脸进行特征提取;(2)对Gabor特征进行采样降维;(3)对采样降维后的特征进行PCA再次降维;(4)将得到的特征矩阵进行KNN范围定位,选出最小的K个训练样本;(5)利用SVM将待识别目标和定位出的K个训练样本进行分类识别。
3实验结果分析
在ORL和YALE人脸库中,在不同的特征向量的个数的情况下分别进行6次样本实验,每次训练样本都选5个,6次实验求平均值,进行对此。
首先通过两组实验,选出最优的K值,实验结果如下。
表1 ORL库中K值对识别率的影响
表2 YALE库中K值对识别率的影响
这两组实验结果分别在ORL和YALE人脸库中得到,特征向量的个数都为前95%,即0.95×199个,通过实验发现,K取2为最佳。
然后分别在ORL和YALE人脸库中进行6次实验求取识别率的平均值,6次实验的训练样本不相同,但是训练样本个数定位5。Gabor滤波采用5尺度,8方向。在ORL人脸库中,共40人,每人5幅进行训练,剩余5幅进行识别,均匀采样因子为8×4,采样后的维数是322;在YALE人脸库中,共15人,每人5幅进行训练,剩余6幅进行识别,均匀采样因子为5×10,采样后的维数是200;SVM选取高斯核,设定标准差θ=0.007 8,惩罚因子ξ=128,实验结果如下。
图1和图2中的特征值前百分比表示的是特征向量的个数,即特征值降序排列,取前百分之多少,在ORL人脸库中转换为特征向量的个数为:百分比×199;在YALE人脸库中转换为特征向量的个数为:百分比×75。通过实验对比,发现KNN和SVM融合的识别算法确实比其中任意一个识别算法的识别率高,且识别率较稳定,不会出现较大的折点,使两种分类识别算法进行了优势互补,在人脸识别方面表现了其良好的性能。
图1 基于GPCA在ORL库中3种识别算法平均识别率对比
图2 基于GPCA在YALE库中3种识别算法平均识别率对比
表3和表4为在两个人脸库中分别6次实验结果的最大识别率对比。
表3 ORL库中不同方法的识别率对比
表4 YALE库中不同方法的识别率对比
通过在ORL和YALE人脸库中实验结果数据对比发现,本文的人脸识别算法比较稳定,而且最高识别率也有优势。
4结束语
本文研究了基于Gabor+PCA人脸特征提取进行KNN
和SVM融合的识别方法,利用KNN进行范围定位,然后通过SVM精确分类识别,达到优势的互补,提高了识别率[9-10]。通过实验结果表明,KNN进行范围定位时,K值取2最佳,核函数取高斯函数,设定标准差θ=0.007 8,惩罚因子ξ=128。在ORL人脸库中均匀采样因子为8×4,最高识别率可达98%;在YALE人脸库中均匀采样因子为5×10,最高识别率可达98.89%,其识别优势明显。
参考文献
[1]方文俊.基于Gabor小波变换的热红外人脸识别研究[D].合肥:安徽大学,2014.
[2]王宪,陆友桃,宋书林,等.基于Gabor小波变化与分块PCA的人脸识别[J].计算机工程与应用,2012,48(3):176-179.
[3]叶超.基于Gabor小波和SVM的人脸识别算法研究[D].太原:中北大学,2014.
[4]Vapnik.The nature of statistical learning theory[M].Berlin:Springer Verlag,1999.
[5]Vapnik V N.Estimation of dependencies based on empirical data[R].Berlin:Springer Verlag,1982.
[6]曾梦璐,王晅,石林枫.基于Contourlet-NMF和SVM的近红外人脸识别方法[J].计算机应用与软件,2014,31(12):229-232.
[7]陈丽,陈静.基于支持向量机和k-近邻分类器的多特征融合方法[J].计算机应用,2009,29(3):833-835.
[8]张建明,杨忠,李巍.改进KNN-SVM的性别识别[J].计算机工程与应用,2009,45(4):177-179.
[9]侯玉婷.基于SVM-KNN的特征自适应加权自然图像分类研究[D].西安:西北大学,2014.
[10]穆新亮.基于混合核函数的快速KPCA人脸识别算法[J].电子科技,2015,28(2):46-50
《电子科技》欢迎投稿
《电子科技》杂志(月刊),设置栏目有:电子·电路、协议·算法及仿真、图像·编码与软件、保密及网络安全、光电·材料、专题综述等。欢迎业界专家、教授、学者及工程技术人员、教师、学生投稿。来稿应以反映当前国内外电子科学技术领域中的先进理论、创新成果及发展趋势,并有实际的应用背景,以及相应的实验结果。
投稿请登录:www.dianzikeji.org联系电话:029-88202440
Face Recognition Based GPCA of KNN and SVM Fusion
JIAO Shuhong,SUN Zhishuai
(School of Information and Communications Engineering,Harbin Engineering University,Harbin 150001,China)
AbstractIn view of the poor face recognition rate of the K Nearest neighbor and support vector machine (SVM),a KNN and SVM fusion recognition method is proposed with a Gabor wavelet and principal component analysis (PCA) for face feature extraction and KNN-SVM classification method for face recognition.Experiments based on ORL and YALE face database show that the proposed algorithm offers a recognition rate up to 98.89%,higher than both KNN and SVM.
KeywordsKNN;SVM;Gabor wavelet;PCA;face recognition
中图分类号TP391.41
文献标识码A
文章编号1007-7820(2016)02-074-03
doi:10.16180/j.cnki.issn1007-7820.2016.02.019
作者简介:焦淑红(1966—),女,教授,博士生导师。研究方向:宽带信号检测等。孙志帅(1988—),男,硕士研究生。研究方向:人脸识别。
收稿日期:2015- 07- 03