作者简介:孟今(1983.10-),女,汉,北京市,中国人民大学,学历:本科,研究方向:数据分析。
摘要:人脸识别是当前计算机模式识别领域中的一个非常活跃的研究课题,在安全监测、身份验证、军事等领域具有广泛的应用前景。本文深入了解了主成分分析(Principal Component Analysis,PCA)方法的基本原理,探析到PCA方法最显著的优点是能用低维特征向量来估计原始样本,基于此特点实现了对人脸的识别。此外,文中也深入分析了在PCA中特征值及距离准则的选取问题。
关键词:人脸识别;主成分分析;人脸图像;特征提取;匹配
在人脸识别系统中有许多关键环节,其中最重要的莫过于特征提取。利用主成分分析法(PCA)进行特征提取是目前应用最多的提取方法。作为一种科学的统计方法,它在模式识别、信号处理、数字图像处理等等领域都有广泛涉猎。基于PCA中空间原始数据主要特征提取,减少数据冗余的思想,一些在低维特征空间的数据被处理,并合理保留了原始数据中有用的信息,数据空间中维数过高的问题也得以解决。
一、主成分分析的基本原理
实际上主成分分析就是一种数学降维演算方法,用若干个综合变量来代替原本更多的变量,让这些综合变量尽可能的实现对原有变量信息的取代,并保持彼此之间不存在关联。这种多变量化为少数相互无关的变量且信息量不变的统计分析方法就叫做主成分分析法。
假设F1表示原变量的首个线性组合所组成的主要成分指标,就有F1=a11X1+a21X2+…ap1Xp。根据这个数学式可知,如果在每一个主成分中提取一个信息量,即可用方差(F1)进行度量,随着方差F1的增大,F1所包含的信息也就越多,同时它的线性组合选取也可表示为X1、X2…XP,它们都被称为方差F1中的第一主成分。如果第一主成分不足以代表原有的P个变量信息时,就可以考虑选取F2,即第二个线性组合,借由它来反映原本的有效信息。在F2中可以不显示第一主成分中已有的信息,以数学语言来表达要求的话即Cov(F1,F2)=0,其中F2为第二主成分。所以按照实际原变量的变化需求,就可以构造出多个主成分指标。
二、人脸识别的技术特点
人脸识别是模式识别中的重要分支,它是指通过计算机系统来分析人脸图像,从中获取有价值的识别信息,从而辨识身份。所以说从技术特点上来看,人脸识别具有以下几个关键特色。
1.人脸定位特点
如图1所示,人脸识别系统首先要解决三大问题,第一,要从相对复杂混乱的背景中自动分割并辨识出真正的目标人脸;第二,再从分割出来的人脸图像中提取区域有效特征点;第三,将提取出的区域特征点与数据库中的有效信息进行选择对比,再利用多种分类器将待识别的人脸特征存储下来与其他人脸特征对比,最后获取识别结果。
2.人脸检测定位技术特点
人脸检测定位对输入的图像进行分析处理,判断它是否有相匹配的人脸,如果有,就将其进行彩色或灰度处理,简化人脸识别的识别难度。人脸检测定位能够直接影响后期识别工作中特征提取与识别演算的成功率,目前比较成熟的人脸检测定位算法主要包括了依靠面部肤色和轮廓特征的特征分布算法,还有基于马赛克规则的神经网络BP算法、基于概率统计模型的Matlab算法以及利用Hausdorff的距离定位人脸算法。
3.图像预处理技术特点
图像预处理的优势就在于对影响人脸识别的客观因素进行排除,提高特征提取对人脸变化的敏感性,比如说将图像中的暗影取出或改变光照条件等等。另外,对人脸图像的预处理也很有必要,比如对人脸图像进行色彩、尺度、明暗、灰度的转化等等,其目的就是为了更加清晰的识别人脸,达到辨识目的。
以上几种技术都体现了人脸识别系统中速度快、辨识能力强、处理快捷和处理方法简单的技术特点,它们是保证人脸识别系统正常运行的基础。正是这些技术环节的存在,人脸识别的技术可扩展性才更让研究者期待[1]。
三、人脸识别的主要研究内容
1.人脸识别的主要技术研究
人脸识别是一个复杂的科学演算和推理过程,它不但要求提取图像中人脸的特征值,还要求从各个角度来进行识别分析,做到全面立体化。
在人脸识别过程中,首先要对人脸进行检测并研究它的定位。它的主要内容就是从图片中确认是否存在人脸,如果存在就将人脸图像从背景中提取出来。考虑到人脸的可变性会随着光线、表情、头部遮挡物、头部姿态、设备图像噪点与年龄的变化而改变,所以人脸检测定位从技术角度讲具有一定的复杂性。
第二是对图像预处理的研究,在识别前需要通过对其进行预处理来凸出人脸的特征,比如灰度的转换、直方图的修正和图像的平滑锐化处理等等。这些分支技术的研究有助于工作人员快速识别人脸轮廓,并从中引入细节识别。
第三是人脸特征提取研究,前文说过,特征提取是人脸识别中最为关键的步骤,因为在人脸关键特征方面要遵循人脸的唯一性。所以这就要求人脸识别要更加细致精确,像利用几何特征来校正和修改人脸的轮廓,从而与数据库中的现有资料进行匹配就很有效。另外还包括了人工神经网络BP技术、特征脸模板匹配技术等等,这些都是特征提取的关键研究内容。
第四点是人脸识别,人脸识别的研究包括了待识别人脸的数据预存库规划整理,其目的就是为了在数据库中规划人脸特征脸的空间距离,从而寻找到距离识别对象最小的人脸图像,最终输出匹配达到身份验证的结果[2]。
四、人脸识别的技术流程
基于PCA技术的人脸识别系统强调将结构相似程度高的人脸数据进行图像归一化分析管理。考虑到这些图像数据在某一个高维度空间中存在规律性,所以要按照同一个人脸部的不同图像与空间之间的距离,来进行图像像素度的辨识。但由于图像中存在若干像素点,不能靠直接运算来识别,而是要通过K-L转换技术将其带入到一个低维度的子空间中展开描述,同时还要保留所需要的识别信息,以求达到人脸图像的采集和特征脸空间的构造。
1.人脸图像采集及检测
假设对一幅尺寸为4cmx4cm的人脸图像进行识别,它的每一列相连都会构成大小为4x4维的列向量,假设D=4x4,D表示人脸图像的具体维数即16cm2。那么设n为训练样本的数量,而xj表示第j幅人脸图像所形成的人脸向量,就可以得到以下人脸样本的方差矩阵为:
Sr=∑nj=1(xj-u)(xj-u)T
在方程式中u的训练样本即为平均图像的向量值,它的表现形式为:
u=1n∑nj=1xj
如果让向量A={x1-u,x2-u,…xn-u},就有Sr=AAT,那么它的维数应该为DxD=16x16=256。
按照SVD定理,当λi(i=1,2…,r)时,如果矩阵ATA的第r个非零特征值vi为ATA所对应的特征向量时,则AAT则会呈现正交归一现象,此时它的特征向量ui应该为:ui=1λiAvi(i=1,2…,r)
在这种情况下所得到的特征向量维数是相对较高的,所以为了实现维数的递减达到所采集人脸图像的检测目的,应该在数据库中选择一些已经确定的计算信息量来对之前计算的前i个特征向量进行维数确定,保证这些特征向量更好的表达所采集到的人脸图像,将它们变为适配于PCA系统的特征脸。在这些特征脸所组成的降维子空间内,所有人脸图像都可以投影并获得相应的坐标系数,它们表示了特征脸在降维子空间中所存在的位置,如此一来它们就成为了人脸识别的主要依据。
2.人脸图像的特征提取
人脸图像特征提取即表示从一个测量空间Rn到某一特征空间Rm的映射,从Rn到Rm的测量空间就表示人脸空间,它的映射遵循两大原则。其一,特征空间中一定要保留所要测量的主要分类人脸信息;其二,在特征空间中的维数必须远低于测量空间中的维数。PCA算法主要靠K-L变换来进行人脸图像特征提取,只要K-L变换能满足两大原则并具有合理的数据压缩办法,它就能达到特征提取的效果。它的具体提取方法是在某一确定的测量空间中列出一组以m为数量的正交矢量,并且根据矢量表示出数据可能呈现的方差。再在原模式的矢量n维度空间中投影m维子空间中的这组正交矢量,最后依据投影系数来计算m组正交矢量的特征,以完成对维数的压缩,保证m始终小于等于n。
将上述方法带入人脸特征提取计算,它的具体步骤如下:
首先推算所提取图片中的平均脸,在ORL人脸数据库中提取40张人脸,每一组分为10幅人脸图像,他们的角度、表情、面部细节都有不同程度的变化,但每组表示的都是同一个人。计算他的平均脸为:
ψ=1200∑200i=1xi
第二步,计算一组图像中每一张人脸的平均脸差值:
di=xi-ψ.i=1.2…,200
第三步,按照平均脸差值构建基于PCA的协方差矩阵:
C=1200∑200i=1didTi=1200AAT
在矩阵中选取特征值λi并将其对应到正交归一化的特征矢量vi上。然后选取P(P≤200),并保证它始终对应最大的特征向量值。最后求得C的正交归一化特征向量值:
ui=1λiAvi,i=1,2…,p
所以特征脸的空间值应该表示为:w=(u1,u2,…,up)。此时就可以将人脸图像一一与平均脸的差值矢量进行对比,并将投影投入到特征脸的空间中,可以得到:
Ω=wTdi(i=1,2…,200)
3.人脸图像匹配与识别
根据上述步骤完成特征脸提取之后,应该进行最后的匹配与识别。首先将需要识别的人脸图像Γ完全投影到特征脸数据库空间中,得到的第M类人的第i个特征人脸向量表示方式:
ΩMi=wT(Γ-)
可以运用欧式距离来对每一幅人脸图像的距离εM进行计算:
ε2M=Ω-ΩMi2
再次用原始图像Γ和特征脸空间图像Γf二者的距离ε:
ε2=Γ-Γf2
Γf=wΩMi+Ψ
在匹配识别人脸图像过程中,按照以上公式和下述原则进行匹配。如果ε≥θi,当图像输入后则不显示人脸图像;当ε<θi且M,εM≥θi时,当图像输入后会显示未知人脸图像;当ε<θi且M,εM<θi时,如果输入图像,数据库中会显示出第M个人的人脸图像[3]。
五、人脸识别的应用前景
基于PCA的人脸识别算法是目前主成分分析中最为重要的广义范围的计算方法。它还衍生了诸如以行列综合主成分为分析重点的2D2PCA法,对角DiagPCA法等等,它们都能从广义的、主成分分析的角度去结合PCA来进行人脸的特征提取、匹配与最终识别工作。而且由于这几种方法的图像列向量协方差矩阵尺寸范围更小,所以它们的识别准确性更高,在灰度与结构信息处理方面也有独到之处,综合来说,目前这些方法的人脸识别率都远远高于经典的PCA算法。
另一方面,根据人脸图像的锐化预处理算法,基于主成分分析的PCA在人脸识别时受到光照的影响较大,所以目前的技术正在致力于研究如何消除光照对图像样本的影响,从而提高识别率。锐化预处理就是这样一种一维的图像锐化方法,它不用考虑光照等光影对人脸的影响,而是利用一维微分算子和平滑滤波器进行图像的垂直锐化与水平处理,最后通过向量投影合并获得人脸的最终锐化图像。这种预处理方法对提高图像矩阵的灰度与人脸识别的光照鲁棒性都有帮助,可以最大限度的缩短人脸图像的特征提取空间,达到快速有效识别的目的。
总结:人脸识别存在很多关键要素,也涉及很多很广的技术理论与实践科学,本文只是从特征提取和识别匹配这一个角度浅析了基于主成分分析PCA背景下的人脸识别系统和相关技术流程。由于人脸的自然属性,所以对其识别是一个相当复杂的系统问题,我国在近30年的人脸识别技术研究中已经取得了不错的成果,熟悉掌握了如Matlab、PCA、神经网BP等等多种识别方法。但就目前状况来看,在多种自然条件和人为条件的干扰影响下,人脸识别的识别率依然还不尽如人意,还需要进一步的深入研究,随着图像处理技术与计算机视觉系统的不断演进,研究者也力争在人脸识别技术这一领域取得更多新奇的发现。(作者单位:中国人民大学)
参考文献:
[1]张岩.基于主成分分析的人脸识别算法研究[D].曲阜师范大学,2010.4-11.
[2]王国栋.基于MATLAB的人脸识别算法的研究[D].内蒙古大学,2014.1-2.
[3]齐兴敏.基于PCA的人脸识别技术的研究[D].武汉理工大学,2007.31-34.