李全彬 黄 昶
摘 要:多姿态人脸识别是目前人脸识别中的难点,已有方法的识别率普遍不是很高。利用PCA对不同姿态的人脸分别建立特征子空间,将待识别人脸图像向相应的特征子空间投影的方法,可以提高多姿态人脸的识别率。实验结果表明,该方法对样本多姿态的人脸图像识别率可以达到97%。
关键词:多姿态;人脸识别;PCA;欧氏距离
中图分类号:TP391 文献标识码:B
文章编号:1004-373X(2009)01-181-03
Multi-pose Face Recognition Based on Eigenspace
LI Quanbin1,HUANG Chang2
(1.College of Physics and Electronic Engineering,Xuzhou Normal University,Xuzhou,221116,China;
2.School of Information Science and Technology,East China Normal University,Shanghai,200062,China)
Abstract:Multi-pose face recognition is a very difficult task,how to improve the recognition rate is a challenge.This paper providsps an efficient multi-pose face recognition method based on eigenspace using PCA.It shows that making different eigenspace for variant pose is the effective way for solving the multi-pose face recognition based on many multi-pose samples.The results of experiment show that this method has a high face recognition rate of 97% to the multi-pose face images.
Keywords:multi-pose;face recognition;PCA;Euclidean distance
0 引 言
人类利用生物特征识别的历史可追溯到古代埃及人通过测量人体各部位的尺寸来进行身份鉴别,现代生物识别技术始于上世纪70年代中期,目前已经成为发达国家普遍重视并大力发展的关键技术和产业。在生物认证方面,人脸识别具有特定的优势。相比其他生物认证技术,如指纹识别,有一部分人是没有指纹的,或者指纹无法录入,仅靠指纹识别就会出现障碍;如虹膜识别,有些眼睛有障碍的人也是无法使用的;还有声音识别,对于发音有障碍或者无法说话的人群来说,这是毫无意义的。正是基于人脸的人人具备这一先天优势,近年来,作为生物特征认证的重要分支——人脸及器官的检测、定位和识别技术开始受到广泛重视[1]。
多姿态人脸识别是目前人脸识别中的难点,识别率普遍不是很高。国内外许多学者已对多姿态人脸识别进行了深入研究,提出了许多姿态判定[2-8]和识别算法[9-12]。
在多姿态人脸数据库构建[13]的基础上,利用PCA对不同姿态的人脸分别建立特征空间,待识别人脸图像向相应的特征空间投影,进而利用欧氏距离进行分类识别,获得了较高的多姿态人脸图像识别率。
1 基于本征空间的多姿态人脸识别方法
Sirovich 和 K 1.1 利用本征脸建立多姿态人脸特征空间的步骤 (1) 从已知的人脸图像中按姿态选择训练图像M张,每人可以选同姿态的一张或多张照片(表情和光照有所变化)。 (2) 计算M×M的矩阵的特征值和特征向量,选择M′个主成份分量。 (3) 计算得到该姿态的特征脸空间μ。 (4) 重复步骤(1)~(3)得到各个姿态的特征脸空间。 1.2 欧氏距离分类器的设计 采用欧式距离分类器,对未知人脸图像和特征空间各类别对应的特征空间向量之间的欧式距离进行计算,未知人脸图像与哪一类别的距离最近就把其归入该类。 假设待分人脸图像共有c类,分别为w1,w2,…,wc,每类都有一个对应的特征空间向量,则共有c个特征空间向量,记作T1,T2,…,Tc。 未知人脸图像的特征向量x和wi类的特征空间向量Ti之间的欧氏距离为: di(x)=d(x,Ti)=‖x-Ti‖ =(x-Ti)T(x-Ti), i=1,2,…,c 未知人脸图像的特征向量x对已训练的c类人脸图像的特征空间向量分别求距离后,得到一个距离集d1,d2,…,dc,对所有的i≠j,如果di(x)<dj(x),即di(x)是距离集d1,d2,…,dc中最小的值,则将x归入第wi类。 1.3 识别步骤 得到多姿态人脸特征空间后,就可以采用欧氏距离分类器对待识别图像进行识别。识别步骤如下: (1) 将已知姿态的训练人脸图像投影到相应姿态的本征脸空间(计算本征向量μl和相应M类训练图像的内积),得到M个人脸图像的分类权重ΩTM=[Ω1,Ω 2,…,ΩM]; (2) 将待识别的属于该姿态的人脸图像(X)投影到对应姿态的本征脸空间,得到权重向量Ω: wk=μTk(X-Ψ), k=1,2,…,M ΩT=[w1,w2,…,wM] (3) 计算待识别图像权重向量和每一类图像的分类权重的差值ε: ε2k=‖Ω-Ωk‖2, k=1,2,…,M (4) 如果εk小于固定的门限θ e1,则待识别图像属于Ωk类。 上述步骤(2)可以按下面方法判断待识别图像是否为人脸图像: (1)计算待识别图像和脸空间的距离φ: φ2=‖迹糵‖2 式中=X-Ψ;糵=∑Mi=1wiμi。 (2) 如果φ小于门限θ e2,则认为待识别图像近似为人脸空间,否则,则认为待识别图像不是人脸图像。 根据ε和φ,待识别图像可能存在4种情况: ① 近似为人脸空间并且属于已知的某一类别; ② 近似为人脸空间但不属于已知的某一类别; ③ 不像人脸空间但属于已知的某一类别; ④ 不像人脸空间也不属于已知的某一类别。 对于第一种情况,输入待识别图像可以被识别出来;第二种情况说明待识别人脸图像是一副新图像;后面两种情况说明输入图像不是人脸图像,放弃处理。 2 实 验 这里的训练原始图像取自ORL人脸数据库。从建立的ORL人脸数据库中,按类别分别选择编号为R,L,U,D,F(分别对应右、左、上、下、正面等五种姿态)的人脸图像各一幅进行训练,共产生5个本征脸空间Ω1,Ω2,Ω3,Ω4,Ω5。 判定待识别人脸图像的姿态,根据判定结果选择投影的本征脸空间。如果是从文献[13]已建立的ORL人脸数据库中选择测试图像,则直接读取其姿态编号即可,不需要再次进行姿态判定。
把待识别图像向训练过程产生的特征空间投影,根据投影距离判断是否包含人脸,如无人脸,则退出识别过程,操作结束。
对待识别的人脸图像进行预处理,并向训练过程产生的特征空间投影,得到的权重向量如图1所示。
图1 待识别人脸图像投影权重
投影结果利用欧式距离进行分类,如图2所示。
图2 待识别图像和特征空间的欧式距离图
由图2可以看出,靠近红线最近的点是ω3类(图中双圈的位置)。因此,认为待识别人脸图像属于第 3个人。
对无法归入当前任一类别的人脸图像,保存到人脸库,增加一个新的类别,重新进行训练样本的选择,获取新的训练结果,以备下次识别使用。
实验一:从这里建立的ORL人脸图像库中随机选择40人(每类1人)的图像进行训练,得到本征脸空间。
实验二:从这里建立的ORL人脸图像库中按类别分别选择编号为R,L,U,D,F的人脸图像各一幅进行训练,得到5个本征脸空间。任意选择其他人脸图像进行识别。
两个实验均采用欧式距离分类器进行分类。
实验结果如表1所示。
表1 基于本征脸空间的多姿态人脸识别实验结果
实验编号采用的人脸数据库识别率 /%
实验一已处理的ORL人脸库(姿态已标注)83
实验二已处理的ORL人脸库(姿态已标注)97
从表1可以看出,改进后的人脸识别实验,识别率有了明显的提高,说明在样本姿态多样化的情况下,这种按姿态分别进行训练的方法是切实有效的。
3 结 语
实验中发现该方法也存在一个需要进一步改进的问题,即如果测试样本均为正面人脸图像,而待识别人脸图像出现姿态变化,则识别效果很不理想。如何根据正面人脸图像构建相应样本的多姿态图像是下一步的工作。
参考文献
[1]Hara F,KobayashiH.State of the Art in Component Development for Interactive Communication with Humans [J].Advanced Robotics,1997,11 (6):585-604.
[2]Chiunhsiun L [3]Yegnanarayana B,AnilKumarsao.Determination of Pose Angel of Face Using Dynamic Space Warping(DSW)[A].Proceedings of the International Conference on Information Technology:Coding and Computing (ITCC'04).2004. [4]Rui ISHI YAMA.Fast and Accurate Facial Pose Estimation by Aligning a 3D Appearance Model[A].Proceedings of the 17th International Conference on Pattern Recognition (ICPR′04).2004. [5]Xiaoming L [6]张小平,朱红锋,刘志镜.多姿态人脸照片的姿态估计[J].计算机仿真,2005,22(4):202-205. [7]Wang Jiangang.EM Enhancement of 3D Head Pose Estimated by Point at Infinity[J].Image and Vision Computing,2006,25(2007):1 864-1 867. [8]Jun wen Wu.A Two-stage Head Pose Estimation Framework and evaluation[J].Pattern Recognition,2008,41: 1 138-1 158. [9]朱长仁,王润生.基于单视图的多姿态人脸识别方法[J].计算机学报,2003,6(1):104-109. [10]刘志镜,李夏忠,武芒.基于三维模型的多姿态人脸识别[J].西安电子科技大学学报:自然科学版,2004,31(2): 218-222. [11]L [12]Hsiuao-Ying Chen.Hybrid-boost Learning for Multi-pose Face Detection and Facial Expression Recognition[J].Pattern Recognition,2008,41:1 173-1 185. [13]李全彬.基于delphi的多姿态人脸库的构建方法[J].微计算机信息,2007,23(33):155-156. [14]Sirovich L,K [15]K [16]Turk M,Pentland A.Eigenfaces for Recognition[J].Cogn.Neurosci,1991,3(1):71-86. [17]Khan,Muhammad Murtaza.Face Recognition Using Sub-Holistic PCA[A].Proceedings of 1st International Confe-rence on Information and Communication Technology ICICT 2005.2005:152-157. [18]Russ,Trina.3D Face Recognition Using 3D Alignment for PCA[A].2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition CVPR 2006.2006:1 391-1 398. [19]Satyanarayana C H.Performance Evaluation of Incremental Training Method for Face Recognition Using PCA[J].Journal of Real-Time Image Processing,2007,1(4): 311-327. [20]Lu Yufeng.New PCA Method to Increase Recognition Rate[J].Guangxue Jishu/Optical Technique,2008,34(1): 10-13. 作者简介李全彬 男,1977年出生,山东临沂人,徐州师范大学讲师,硕士。主要研究方向为人工智能,网络信息系统,信号检测与信息处理。 黄 昶 华东师范大学信息学院,成像信息联合实验室,硕士生导师,副教授。研究方向为数字图像处理,人工智能,信号检测与信息处理。