杨玉平,向 华
(1.重庆电子工程职业学院,重庆 401331;2.重庆师范大学,重庆401331)
对人脸识别特征数据降维算法的优化
杨玉平1,向 华2
(1.重庆电子工程职业学院,重庆 401331;2.重庆师范大学,重庆401331)
在模式识别领域,人脸特征数据相对庞大,为了提取人脸主要的特征数据,提高识别系统的运行效率,对特征数据的降维是必须的操作。针对现有降维算法对识别率有较大影响的问题,本文总结了各类降维算法,提出了一种优化的降维算法。
人脸识别;降维;人脸特征;人脸识别
随着模式识别技术的发展,各种识别系统都有了很大的发展,例如:指纹识别、虹膜识别、人脸识别等。人脸识别以其不易察觉性、自然性等特点得到广泛的应用。相对于其他的识别方式,人脸识别的特征数据量较大,在提取特征数据之后要进行降维,这样可以在一定程度上减少数据量,提高识别系统的运行效率。但如果降的维度过大,会造成一些主要特征数据丢失,使识别系统的识别率降低而达不到要求。现在在降低维度的实验过程中,一般运用多种维度降维,比如提取的特征数据的维度从几十维到上百个维度不等。或者就以实验的方式来提取经验数据,往往在维度降到一定程度之后,如果继续降维就会造成整个识别系统的识别率降低。
Karhunen-Loeve变换,简称K-L变换,是一种传统的数学领域常用的正交变换。简单来讲就是将K维空间的数据,通过降低数据维度,把数据变成L维空间的数据。可以用下面的数学公式来表示:
假设有矩阵Xm×k,m个行向量表示样本的个数,k表示每个样本数据的维数。有另一矩阵Rk×l,称这个Rk×l为变换矩阵,将这两个矩阵作如下运算:
可见最终可将m个样本的k维数据,降低到l维数据了。Karhunen-Loeve变换的实质就是将数据从一个坐标系转换到另一个坐标系中,而前一个坐标系的维度很大,且里面的数据带有许多的冗余信息;而后一个坐标系的维度相对来说很小,只带有数据的主要信息。
在众多的特征脸方法中,PCA、LDA、SIFT等特征提取过程中,都有降低特征数据维度的过程,其一般过程是:预处理人脸图像;加载人脸库,提取特征数据形成特征空间;形成特征子空间;把样本人脸图像和待识别的人脸图像投影到特征子空间上;选择一定的距离参数进行识别。如下图1:
图1 图像处理过程
一张M×N的人脸图像,在作预处理时,可以看成是一个M×N的行向量或者列向量。例如一张64×64的人脸图片可认为是4 096维列向量,因此它就是一个4 096维空间中的一点。但一般人脸的都是比较相似的,所以这些人脸中就存在许多的冗余信息,当提取了人脸图像的特征数据后,就可以把这些特征数据降到一个低维的空间当中,用一个相应的低维子空间来表示除去冗余信息的主要的特征数据。设m是人脸图像样本的数目;xi表示第i幅人脸图像构成的人脸向量,则样本的协方差矩阵为:
根据SVD定理,设li(i=1,2,……,k)为矩阵W的k个非零特征值,vi为W对应于li的特征向量,则W的正交归一特征向量ui为:
则特征脸子空间为:w=(u1,u2…… ur,)。其中A=
优化的特征数据降维算法是建立在原有的特征数据降维算法的基础上,通过在形成特征子空间时预设参数,使降低的维度不至于过低,从而使主要的特征向量丢失,造成识别率下降;降低的维度过少,使过多的冗余信息存留,造成系统运行效率降低。此优化算法的流程图如下图2:
图2 优化算法流程
具体实现步骤:
(1)运用imread()函数读入训练样本图像,把每张样本图像的像素以行的方式连接起来,构成一个一维行向量。把每个行向量从上到下连接起来,就构成了一个训练人脸样本矩阵。
(2)每一行就是一张图像,把每一张图像相对应的像素点求得它们的平均值,最后得到一个平均图像的行向量。
(3)把每一个行向量与平均图像行向量作差运算,得到一个差值矩阵A,运用协方差公式:W=AAT进行计算。并计算出W的特征值和特征向量。
(4)将特征向量按特征值大小以降序排列,设定优化参数值R,此参数表示取所有特征值中的多少特征值来作为主要特征值,实验中,取R=0.9110(0 (6)在识别阶段,将待识别的人脸图像先作预处理,提取特征向量,再把其特征向量投影到新坐标系所表示的空间中,最后与特征模板数据库中的数据进行比较,进行识别。 本算法在实验中所用的人脸数据库有ORL和AR。ORL人脸库中有40个人的人脸图像,每个人有10幅图像。选取5人的人脸图像作为训练样本人脸图像,剩余图像作为识别时用,图像大小为64×64,如图3所示。 图3 ORL人脸库 表1 ORL库识别率及运行时间 本实验运用Matlab 7.5,并且基于SIFT人脸特征数据提取算法。从表1中的数据可以看出,人脸特征数据从4 096维降到不同的维度特征空间,系统运行的时间不一样。一般来说,维数降得越低,处理的特征数据越少,系统运行就越快,但因此所得到的识别率也有所降低。本实验中所用的优化参数值R=0.9110,相应所得到的降维维数是93维,识别率是0.9972,运行时间是0.4580秒。与表1所得到的分析数据对比来看,充分说明了参数优化效果。 在人脸识别的众多算法中,数据的降维是必不可少的操作。本文介绍了早期的K-L变换,总结了PCA、LDA、SIFT等算法中的降维方法,给出了一种优化的特征数据降维算法。并运用Matlab工具验证了此算法的可行性。此优化降维算法将给以后降维操作带来方便、快捷,并具有一定的指导意义。 [1]周玲丽,赖剑煌.生物特征数据安全保护技术的发展[J].计算机科学,2008,35(10):33-38 [2]苑玮琦,柯丽,白云.生物特征识别技术[M].北京:科学出版社,2009:164-165 [3]田印中,董志学,黄建伟.基于PCA的人脸识别算法研究及实现[J].内蒙古经济与科技,2010,(3). [4]罗昊,孟传良.基于特征脸和LDA的人脸识别[J].贵州工业大学学报(自然科学版),2005,(1). [5]H.K.Ekenel and R.Stiefelhagen.Why is facial occlusion a challengingproblem[C].IntemationalConferenceonAdvances in Biometrics,2009:299-308. [6]Roberts C.Biometric technologies-palm and hand[EB/OL].http://www.ccip.govt.nz/newsroom/information-notes/2006/biometrics-technologies-palmhand.pdf,2008-03-22. [7] H.Jia and A.M.Maninez,Support vector machines in face recognitionwithocclusions[C].IEEEConferenceonCompmer Vision and Pattem Recognition,2009:136-141. [8]Nagar A,Nandakumar K,Jain A K.Biometric Template Transformation:ASecureityAnalysis[C].Proc.of SPIE,Electronic Imaging,Media Forensics and Security XII.2010. [9]Feng Y C,Yuen P C,Jain A K.A Hybrid.Approach for Generating Secure and Discriminating Face Template[J].IEEE Transactions on Information Forensics and Security,2010,5(1):103-117. [10]Nagar A,Jain A K.On the Security of Non-invertible FingerprintTemplateTransforms[C].IEEEWorkshopon Information Forensics and Security(WIFS),2009. Optimization of Dimension Reduction Algorithm for Face Recognition Character Data YANG Yuping1,XIANG Hua2 In the field of pattern recognition,facial character data is relatively large,and therefore it is necessary to reduce the dimension of the character data in order to extract the primary facial main data and improve the efficiency of the recognition system.For the existing dimension reduction algorithm has some negative effect on the recognition rate,this article sums up various kinds of dimension reduction algorithms and brings forward a better algorithm. face recognition;dimension reduction;facial character TP39 A 1674-5787(2012)01-0162-03 2011-12-28 杨玉平(1984—),男,重庆市人,重庆电子工程职业学院,助教、重庆师范大学计算机与信息科学学院计算机软件与理论专业2010级硕士研究生,研究方向:数字图像处理与模式识别;向华(1984—),女,重庆市人,重庆师范大学外国语学院学科教学(英语)2010级专业硕士研究生。 责任编辑 王荣辉4 实验效果与分析
5 结语
(1.Chongqing College of Electronic Engineering Chongqing 401331,China;2.Chongqing Normal University,Chongqing 401331,China)