徐晓
(无锡机电高等职业技术学校,江苏 无锡 214028)
一种基于非参数特征分析的非参数人脸识别方法
徐晓
(无锡机电高等职业技术学校,江苏 无锡 214028)
由于非参数子空间分析的非参数方法(KNSA)的运算法则还是有一定的限制性:首先,该方法中的类内散步矩阵Sw还是和LDA一样,如此对识别结果就会有很大的影响.其次,该方法在计算类间散步矢量时,未考虑到不同的KNN点会产生不同的类间散射矩阵.本文提出了一种非参数特征分析的非线性(核)鉴别分析方法(KNFA),并在ORL和XM2VTS人脸库上验证了该方法在识别性能上优于KDA和KNSA方法.
人脸识别技术;线性判别分析方法;模式识别;弹性图匹配;非参数特征分析的非线性(核)鉴别分析方法
人脸识别是一种最直观、最精确、最友好的身份认证手段,它是一项非常热门的计算机技术探究范畴.它是指基于人的脸部特征信息,通过高科技手段提取每个人脸中所蕴涵的身份特征,从而进行身份识别的一种生物识别技术.较之于其他生物识别技术,人脸识别能实现智能预警,所以在有些隐秘的场景中可以很好的得到应用[1].因为人脸识别技术采用不需要被动协作的生物识别方法,且采用非接触式技术,具有操作简单、隐蔽性强、非侵犯性等优点,因而容易被人们接受,被称为最自然、最直观的一种生物特征识别技术[2].可用在公安、银行、电子商务、金融、军队、机场、安全防务等领域,还可用在门禁考勤、防盗门、智能手机、智能玩具、数码相机等民用领域,具有非常广阔的应用前景和商机.
人脸识别已经有很长的研究历史,己经发展了很多算法,特征脸方法(Eigenface)[3-4],Fisherface方法[5]、弹性图匹配技术[6]及局部特征分析法[7]巳经形成人脸识别研究的主流方向.特征脸(Eigenface)方法是将人脸识别推向真正可用的第一种方法,具有简单有效的特点.它的思想是把人脸从像素空间变换到另一个空间,在另一个空间中做相似性的计算.Fisherface人脸识别方法是对原有数据进行整体降维映射到低维空间的方法.它能将同一个类别的所有数据聚集在一块,而将不同类别的数据尽可能的分开.弹性图匹配法是一种基于动态链接结构的方法.它的思想是利用人脸的基准特征点构成弹性图,让它能符合人脸描述的几何特征,从而通过获取人脸关键点的特征值进行匹配来完成识别.
主成分分析(PCA,Principal Component Analysis)的原理是将高维的向量,经过一个非常特殊的特征向量矩阵来投影到一个低维的向量空间中去,使得压缩前后的均方误差最小.它是从人脸图像中找出最能代表人脸的特征空间,去除一些不能代表人脸特征的属性,从而计算量变小了,识别速度快了.但是,它是以样本的最优为目的,忽略人脸细节,易受光照影响,所以就不能达到令人满意的效果.为了解决这一问题,研究人员提出了线性判别分析(Fisher’s Linear Discriminant Analysis,FLDA)方法[8],Belhumeur等研究人员在它的基础上提出了Fisher脸方法.之后又提出了进一步推进Fisher脸的识别方法,例如零空间法[9],Direct LDA(DLDA)方法[10]等,目前Fisher脸算法有了更进一步的进展[11].但上面介绍的这些算法在解决非线性问题时,它的识别效果常常不能令人如意,为了解决这些问题,研究人员又提出基于PCA和LDA的非线性推广新方法,就是基于核的主成分分析(Kernel Principal Component Analysis,KPCA)[12]新方法和基于核判别分析(Kernel Discriminant Analysis, KDA)[13]新方法.然而,KDA却存在着下面这些不足之处:KDA算法往往只想到c-1个特征向量,利用这些特征向量判别还是不行的;而且构建类间离散度矩阵时需使用所有的训练样本,而一部分有利于分类的边界结构却没有能被提取[14].为此,研究人员又提出了一种非参数非线性KDA人脸识别方法.它是在运算特征空间中的类间离散度时引进一个权值函数,从而有利于分类的边界结构能够被很好的提取[15].而非参数子空间分析的非参数方法(KNSA)的运算法则还是有一定的限制性:首先,该方法中的类内散步矩阵Sw还是和LDA一样,如此对识别结果就会有很大的影响.其次,该方法在计算类间散步矢量时,未考虑到不同的KNN点会产生不同的类间散射矩阵.本文提出了一种非参数特征分析的非线性(核)鉴别分析方法(KNFA),并在ORL和XM2VTS人脸库上验证了该方法在识别性能上优于KDA和KNSA方法.
式中α是一个从零到无穷大变化的且控制权值方面距离比变化速度的一个参数,d(v1,v2)是矢量v1和v2的欧几里得距离,NNp(覬(),j)点覬)到类i的第k个近邻.
于是Fisher判别准则为
极大化该准则函数即可得特征空间H中的最佳投影向量.
由再生核理论可知,Fisher式的任一解ω∈H可表为H中全体训练样本的线性组合,即
于是,有
下面的情况和KDA的相似,计算在最佳投影矩阵下的前d个最大特征值所对应的特征向量Z1,Z2,…,Zd.令最优投影矩阵Q=[Z1,Z2,…,Zd].
3.1 核函数的选取
核函数及其参数的选择仍然是一个具有挑战性的问题,对于提高识别率很大的影响效果,因为选取不同的内积核函数直接影响着高维特征空间的性质.目前有关核函数的选取虽然取得了一定的成果,但还缺乏指导原则.
核函数的确定并不困难,满足Mercer定理的对称函数,都可作为内积核函数来使用.下面列出一些常见的内积核函数:
(1)线性内积核函数:k(x,y)=x·y
3.2 ORL上人脸识别实验结果
目前人脸识别领域常用的人脸数据库是英国剑桥大学AT&T实验室创建的ORL人脸数据库.它包含了40个志愿者,每个志愿者10幅,总共组成400张图像,92×112=10304像素为每张图像的分辨率,面部图像使用了256色灰度图像.在面部细节、表情、姿态、等方面每幅图像都是不一样的[17].图1是一组从ORL人脸数据库中的选出的图像:
为进行人脸识别,我们把ORL人脸数据库分成训练样本库和测试样本库两大部分.训练集是从训练样本库中提炼的人脸子空间组成且是训练过的,随着训练样本集越大,就越容易识别;测试集,用于评估这一模式对未知样本进行预测时的精确度.所以通过取一组不同数目的训练集与测试集来进行实验,从而来评估各种算法性能优劣.
从表1和表2数据我们可以看出,KNSA和KDA方法的识别率会随着投影轴数目的变化而发生变化,但KNFA方法的识别率在不同的投影轴数目下获得的识别率都要高于KNSA和KDA方法.
3.3 XM 2VTS上人脸识别实验结果
XM2VTS人脸库包含了295志愿者在4个不同的时间段内的人脸和语音视频数据[17].在每一个时间段,每人被记录了2个头部旋转的视频片段和6个语音视频片段.55*51=2805像素为每幅图像的分辨率.图3是一组XM2VTS库图像.
从表3和表4数据我们可以看出,KNSA和KDA方法的识别率会随着投影轴数目的变化而发生变化,但KNFA方法识别率在不同的投影轴数目下获得的识别率都要高于KNSA和KDA方法.
KNFA的类内散布矩阵有非参数的形式,KNSA和KDA方法却没有这种形式.此外,KNFA方法在在运算特征空间中的类间离散度时引进一个权值函数,从而有利于分类的边界结构能够被很好的提取.实验证明了KNFA算法的识别性能优于KNSA和KDA方法.由于KNFA算法使用了Fisher准则,因而从分类率这一角度来看,并不是一种很好的算法.鉴定一种核方法的性能好坏,核函数选取是一个关键,因此处理这类问题的关键就是找到和数据特性相吻合的核函数.KNFA方法识别性能的优劣关键因素也在于核函数的选取,所以对于核函数的选取己经成为研究者关注的问题.
表4 核函数k(x,y)=exp在XM2VTS上的识别率
表4 核函数k(x,y)=exp在XM2VTS上的识别率
表1 核函数k(x,y)=(x·y+1)2在ORL上的识别率
表2 核函数在ORL上的识别率
表2 核函数在ORL上的识别率
表3 核函数k(x,y)=(x·y+1)2在XM2VTS上的识别率
图1 ORL数据库中的图像
图2 XM 2VTS人脸库中的图像
[1]田捷,杨鑫.生物特征识别技术理论与应用[M].北京:电子工业出版社,2004,1-5.
[2]王映辉.人脸识别—原理、方法与技术[M].北京:科学出版社,2010,19-24,47-48.
[3]Bischel M and Pentland A.Human face recognition and face image set's topology[J].CVGIP:Image Understanding, 1994,59(2):254-261.
[4]Turk M and Pentland A.Eigenfaces for recognition[J].Cognitive Neuroscience,1991,3(1):71-86.
[5]P.N.Belhumer,J.Hespannha,D.Kriegman.Eigenfaces vs fisherfaces:Recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,Special Issue on Face Recognition,1997,17(7): 711-720.
[6]M lades,J C Vorbruggen,J Buhmann.istortion invariant object recognition in the dynamic link architecture[C]. IEEE Trans on omputers,1993,42(3):300-311.
[7]P.Penve,J.Atick.Local Feature Analysis:A General Statistical Theory for Object Representation[J].Network: Computationin Neural Systems,1996,7(3),477-500.
[8]D.L.Swets,J.Weng.Using discriminant eigenfeatures for image retrieval.IEEE Trans.Pattern Analysis and Machine Intelligence,1996,18(8):831-836.
[9]Li Fen Chen,Hong Yuan Mark Liao,Ming Tat Ko,etc.A new LDA-based face recognition system which can solve the smalls ample size problem[J].Patern Recognition,2000,33 (9):1713-1726.
[10]Hua Yu,Jie Yang.A direct LDA algorithm for highdimensional data with application to face recognition[J]. Pattern Recognition,2001,34(10):2067-2070.
[11]Zhong Jin,Jing Yu Yang,et al.Face recognition based on the uncorrelated discriminant transformation[J].Pattern Recognition,2001,34(7),1405-1416.
[12]B.Scholkopf,A.Smola,K.R.Muller.Nonlinear component analysis as a kernel eigenvalue problem[J].Neural Computation,1998,10(5):1299-1319.
[13]S.Mika,G.Ratsch,J.Weston,B.Scholkopf,K.Muller.Fisher discriminant analysis with kernels[C].In IEEE Neural Networks for Signal Processing Workshop,Wisconsin,1999: 41-48
[14]Li Zhifeng,Tang Xiaoou,etal.Nonparametric Discriminant Analysis for Face Recognition[J].Pattern Analysis Machine Intelligence,2009,31(4):755-761.
[15]BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J. Eigenfaces vs.Fisherfaces:Recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[16]B.Acholkopf,A.Smola,K.-R.Muller.Monlinear component analysis as a kernel eigenvalue problem,Neural Computation, 1998,10:1299-1319.
[17]Friedman N,Geiger D,Goldszmidt M.Bayesian Network Classifiers[J].Machine Learning,1997,29(2/3):131-163.
[责任编辑:郭正涛]
A Face Recognition A lgorithm Based on Kernel Non-parameter Feature Analysis
XU Xiao
(WuxiMachinery and Electron Higher Professional and Technical SchoolWuxi214028)
The Kernel Non-Parameter subspace analysis still has some limitations.Firstly,the walkingmatrix in the class is sinilarte the LDA and Sw,so itwill affect the results of the identification.Secondly,thismethod can generate different class scatter matrix among different KNN points in the computation of the walk matrix of the kind.In order to solve these problems.A Kernel Non-Parameter Feature Analysis(KNFA)method is proposed. Experimantal results on ORL and XM2VTS face datafaces show the performance of Kernel Non-Parameter Feature Analysis is obviously better than the Kernel Non-Parameter subspace analysis and Kernel Discriminant Analysis.
Face Recognition Technology;Linear Discriminant Analysis;Pattern Recognition;Elastic Bunch Graph Matching;Kernel non-parameter feature analysis
TP 2
A
1672-402X(2016)02-0024-05
10.13408/j.cnki.gjsxb.2016.02.005
2015-12-10
徐晓(1978-),女,无锡人,江南大学信息工程学院工程硕士研究生,江苏联合职业技术学院无锡机电分院副教授,研究方向:人工智能、信息管理.