摘 要:人脸识别技术是生物特征识别技术的一种,它根据人脸来识别人的身份。人脸识别技术具有准确、经济、可扩展性良好等特点,更重要的是,它比其它生物特征识别技术更加简便、直观、可靠。现在应用于人脸识别的算法有3种:基于PCA的人脸识别算法、基于Fisher线性判别的人脸识别算法、基于LBP特征的人脸识别算法。对前两种算法进行了深入研究,在人脸数据库上进行识别,取得了预期效果。
关键词:人脸识别技术;PCA;K-L变换;Fisher线性判别
DOIDOI:10.11907/rjdk.151986
中图分类号:TP312
文献标识码:A 文章编号文章编号:1672-7800(2015)012-0069-03
作者简介作者简介:方洁(1980-),女,湖北武汉人,武汉大学珞珈学院电子信息与机械工程学院副教授,研究方向为计算机技术。
0 引言
人脸识别[1]技术涵盖了数字图像处理、计算机视觉、模式识别以及数学等多方面内容。目前,相关研究虽然取得了一些重要成果,但该技术在实际应用中仍存在很多问题。由于人脸五官分布的相似性,人脸表情、姿态、发型、化妆的不同都给识别带来了困难。如何快速正确地识别大量人脸是目前急需解决的难题。人脸识别在身份认证、信息安全、金融交易、国防安全[2]等方面应用广泛。人脸识别是对人脸部信息处理的重要研究课题之一,有很高的研究价值。人脸识别又是一个非常具有挑战性的课题,面临着诸多难题。
1 基于PCA的人脸识别方法
1.1 K-L变换
K-L(Karhunen-Loeve)变换是研究人员常用的特征提取方法。K-L变换也可称为主成分变换PCA,可以使大维数的数据集合简化。
依据K-L变换[3]流程,首先从人脸样本中提取出人脸关键特征。假设图像为N*N的人脸图像,一幅N*N个像素组成的图像则是一个N*N维的矩阵,人脸图像可以视为一个N2维向量的样本。但是由于维数太高,需要对这些特征降维。
不考虑类别标号,利用所有的样本估计总协方差矩阵为:
∑=1m∑mi=1(xi-μ)(xi-μ)T=1mXXT(1)
其中,X是由所有去均值的样本构成的N2*m维矩阵。∑称为总体散布矩阵,其维数是N2*N2。要对样本降维,要求∑正交归一的本征向量。由于矩阵维数过高,直接进行计算比较困难。
由样本集组成的矩阵R=XTX,维数为m*m,通常m< XTXυi=λiυi(2) 两边同时左乘X,得: XXTXυi=Xλiυi 即: 1,对应的本征值表示为μi,相应的μ0,μ1,μ,2,…,μM-1被称为特征脸,所有的特征脸又可称为特征脸空间。在特征脸空间中,大的特征属性值可以表示为人脸整体轮廓以及附近环境,而小的值用来表述细节特征。 步骤四:将训练集合和测试集合映射到特征空间中。将全部的人脸图像映射到特征子空间,每一幅图像对应特征子空间的每一个坐标,该坐标有自己的坐标系数,这组系数代表相应的人脸图像。在一般情况下,一个特定的人脸图像可以通过多个特征脸的加权组合得到,用于最终的人脸识别。通过K-L变换产生的系数,即为y=UTf。经过相应的矩阵以及系数的转变,原始图像能够转变成新图像:fΛ=Uy。 步骤五:对待识别样本进行分类。通过分类器将待识别的样本进行分类,分类方法可以是贝叶斯算法、SVM算法等。 2 基于Fisher线性判别的人脸识别方法 Fisher线性判别分析(Fisher Discriminant Analysis)算法[4]是降低特征维数的一种方法。即把d维空间中的所有模式全部投影到一条直线上,然后将该模式的维数缩减到一维,并且需要同一类型的样本之间聚在一起,不同类型样本之间分开。而关于c类问题,需要c-1个判别函数。由d维空间向c-1维空间进行投影,假如d>c,关于样本的类内散布矩阵SW和类间散布矩阵SB定义如下: SW=∑∑(xj-ui)(xij-ui)T(1)SB=∑ci=1(ui-u)(ui-u)T(2) 式中,c为类别数;ni为ci的样本数;ui为ci的样本均值,ui=1N∑nj=1xj;u为所有样本的均值,ui=1N∑ci=1niui;xij为ci类中的第j个样本。 为了找出一个矩阵W,使类间离散度[5]和类间离散度的比值达到最大值,散布矩阵的行列式的值是离散度的一种简单的标量度量,得到Fisher 准则函数定义为: J(Wopt)=BWargmaxwWTSBWWTSWW(3) 当 Fisher 准则函数取最大值时,Wopt=[W1,W2,…,Wc-1]则是使类间离散度和类内离散度的比值最大时的最优投影方向。求解[W1,W2,…,Wc-1]特征值可以求出最优投影方向,即方程的前c-1个最大特征值对应的特征向量,即: SSBWi=λiswwi;i=1,2,…,c-1(4) 在SW可逆时,得到: S-1WSBWi=λWi;i=1,2,…c-1(5) 在求出特征向量[W1,W2,…,Wc-1]后,确定式(4)中c-1个判别函数,由式gi(X)>gj(X)可知,对于所有的i≠j有yi(X)>yj(X),则把X归为Wi类。 3 结语 通过选用FERET人脸数据库和AT&T人脸数据库进行人脸识别实验,实现了人脸识别实验平台的效果,验证了两种人脸识别算法的有效性。基于PCA的人脸识别算法,主要被用来进行图像的特征提取,而基于Fisher线性判别的人脸识别算法,可达到将高维空间进行降维,映射到最佳鉴别向量空间中,求得最佳鉴别平面,并在图像的局部层级通过对图像纹理特征的描绘达到描述图像的目的,在图像的识别、检索以及分析方面有更多应用。 参考文献参考文献: [1] 周德华,毛敏峰,徐浩.一种多人脸跟踪算法的研究与实现[J].电视技术,2005,275(5):88-90. [2] 王伟,张佑生,方芳.人脸检测与识别技术综述[J].合肥工业大学学报:自然科学版,2006(2):158-163. [3] 高建坡,王煜坚,杨浩,等.一种基于KL变换的椭圆模型肤色检测方法[J].电子与信息学报,2007(7):1739-1743. [4] 王芳.基于五官特征定位的人脸识别技术在防盗门中的应用[D].青岛:中国海洋大学,2006. [5] 高建坡.视频序列中的人脸检测与跟踪算法研究[D].南京:东南大学,2007. (责任编辑:黄 健)