何春
摘要:文章首先对人脸识别技术进行了介绍,其次回顾了人脸识别研究的发展历程及识别方法的基本分类,然后对当前主流的人脸识别方法展开了详细的论述,最后提出了人脸识别技术面临的问题及研究方向。
关键词:人脸识别;特征脸;线形判别分析;局部二值模式
中图分类号:TP391
Survey of face recognition technology
He Chun
(Education and Information Technology Center, China West Normal University, Nanchong Sichuan 637002, China)
Abstract: This paper introduces technology of face recognition firstly, and reviews the development process and the basic classification method of face recognition. After that, the paper discusses the current methods of face recognition in detail, therefore proposes the existing problems in the research of recognition faces and futures research direction.
Key words: face recognition; Eigenface; linear discrimination analysis; LBP
1 人脸识别技术简介
人脸识别,特指利用人脸视觉特征信息的分析比较结果进行身份鉴别的计算机技术[1]。一般人脸识别有广义和狭义之分,广义是指包含人脸图像采集、定位、预处理、身份确认与查找等在内的技术;而狭义仅指身份确认或查找系统。
通俗来讲,人脸识别指运用计算机分析人脸视频或图像之后,提炼可用、有益的识别信息,再对人脸对象的身份构建判断与识别。人脸识别是身份识别研究中最主要的一种方法,重点建立在生物识别技术基础之上,而且其中应用了诸多计算机相关的图形学、人工智能等最新技术手段。
人脸与人体的其他生物特征(指纹、虹膜等)一样与生俱来,其生物特征内在的稳定性和唯一性使其自然成为了身份识别的理想依据。学术界对人脸识别相关问题的研究已然趋近成熟,并形成了为数可观的研究成果,到目前为止,仍然在不断的探索与发展中,尤其在人脸身份识别方面的建树颇多。快速、直接、简捷是人脸识别系统的独有优势,并已广泛运用于刑事侦破、信息安全等方面。在此,本次研究将对人脸识别技术给出全面的解析论述。
1 人脸识别发展历程
早在20世纪50年代,心理学家即已着手对人脸识别展开研究,但是直至60年代,对人脸识别真正意义上的研究才正式开启,具体是从工程应用层面出发,研究得到一种半自动的人脸识别系统,这种系统具备的特点可描述如下:
一是该系统是对局部的识别,对人脸的几何特点识别,进而分析人脸器官特征信息及其之间的关系,优势在于识别手段简易、清晰,劣势在于一旦人脸的视角、表情等发生变动和变化,那么很难准确地得到识别效果;二是这种半自动的人脸图像识别需要较为严苛的约束环境和条件,如果图像存在单一或无背景的情况下,那么就将削弱最终的处理效果。
研究递进到20世纪90年代以后,即已朝着整体和局部相结合的态势演变。学者们认为需要将人脸的形状拓扑结构、局部灰度和全局灰度分布等多项人脸特征信息相结合,才能全面、准确地实现人脸图像识别。1991年,Turk和Pentland [2]、首次提出著名的“特征脸”(Eigenface)方法,利用主成分分析(Principal Component Analysis,PCA)取得了不错的识别效果;Belhumer在其论文中,则将Fisher判别准则成功应用到了人脸分类当中,由此而提出Fisherface方法[3]。
此后,这种应用线性子空间和统计特征的技术就已成为当时大众化流行的识别技术,可概括为利用成分分析、线性判别分析的特征识别手段。后期出现了基于机器学习理论的实用技术,学者们相继探索出遗传算法、支持向量机等方法对人脸进行识别。
2 人脸识别方法分类
研究可知从不同的角度,人脸识别可有不同的分类方法,本次研究根据人脸识别发展阶段的特征,把人脸识别技术分为初始以几何特征为基础、中期以代数特点为依据、后期以机器学习理论为原理三种。下面即对这3类研究给出功能实现概述。
2.1 以几何特征为基础的研究
这种方式是将人脸用一个几何特征矢量予以有效表示,并根据模式识别中层次聚类的思想设计分类器,达到识别目的。识别所采用的几何特征是以人脸器官的形状和几何关系为基础的特征矢量,本质上是特征矢量之间的匹配,相应分量通常包括人脸指定2点间的欧式距离、曲率、角度等[4]。
该类研究方式优点是简单易懂,但是由于能量函数中加权系数的选择表现出一定的经验性,并未能形成规范统一的特征提取标准;而且图像稳定的特征提取仍有难度,尤其是特征受阻时;另外,对于明显的表达变化或不良的姿势变化,其鲁棒性均呈低弱。
2.2 以代数特点为依据的研究
这种方式往往基于代数特征图像的像素变换投影空间,具有某种数量的基本图像对人脸图像线性编码,典型的理论工作可首推主成分分析方法。
主成分分析方法早期是由Sirovitch和Kirby[5]引入人脸识别领域,并将其用于分析数据,过程中是使用数量少的特点来描述为了降低特征空间维数的样本,而且是基于K-L来展开和实现的。
2.3 以机器学习理论为原理的研究
由2.1节中的研究方式可知,人脸特征是预先定义形成的。本节讨论的方式,则是通过使用统计分析和机器学习技术,从中获取信息。获得的信息存在于确定的分布之中,并通过算法、模型和判别函数,用作人脸图像识别。这种分类器是时下至关重要的一门技术,而且涵盖了SVM、Hidden Markov模型与AdaBoost算法等在内的综合开发系统技术。
3 人脸识别主流方法介绍
3.1 特征脸方法
人脸方法来自主成分分析的人脸识别和描述技术。这种方法主要是把图像区域当作随机变量,运用K-L转变成为正交K-L基,与较大特征值相关的对应基具有与人脸相似的形状,所以也可称做特征脸。使用这种线性组合能够描述、展现近似的人脸图像、人脸识别以及合成。具体表现为把人脸图像映射到人脸子空间之上,同时对人脸图像在特征脸子空间上的方位进行对比。
3.1.1 人脸空间的建立
研究假设人脸图像包含了众多像素点,并且可用N维向量Γ来表示,那么样本库就可用Γi(i=1,...,M)提供应用表达[6] 。人脸空间的基向量由协方差矩阵C的正交特征向量构成,因此称为特征脸。
把特征值由大到小排列:λ1≥λ2≥...≥λr ,其对应的特征向量为μk。在此条件下,不同的人脸图像都能投影到由u1, u2, ..., ur组成的子空间中。结果就是不同的人脸图像将映射为子空间中不同的点,反之亦然。
3.1.2 特征向量的选取
协方差矩阵Ω所生成的非零特征值的k(k远小于M)个特征向量,一般来说k值比较大,但在常规情况下并非需要保留所有有的特征向量。因为投影的计算速度是同子空间向量数有着密切关联,如果能够考虑到时间限度,就能够提取有效信息的特征向量。
3.1.3 预测识别
人脸图像置其投影可得到一组坐标系数,该系数能够表明图像在子空间中的位置,因而可以作为人脸识别的基础。换言之,每一幅人脸图像皆能显示出线性组合的“人脸”,加权系数为K-L变换的扩展系数,也能作为图像的代数特征。所以,提取特征脸信息后,可向对方典型样本进行投影,并将得到的投影特征映射到各研究人脸的特征向量,作为后续识别匹配搜索空间的一个步骤。 图1~图3给出了不同情况下的特征脸图像。
3.2 线性判别分析法
线性判别分析,可简称为LDA,本质是多维模式空间到一维特征空间的映射,使用类的成员信息形成一组特征向量,构建得到的特征空间称为Fisherface。在理论上,这种方式主要是利用类之间的散射矩阵类中的训练样本和基于散射矩阵的最优投影空间。和人脸识别方式比较,该种模式能够抑制不确定图像间的差异信息,并可以进一步提取利于识别的特征,因而具有较好的识别性能。
Lades等人认为人脸图像皆有相似的拓扑结构,提出了关于建立在动态连接结构的弹性图匹配方式基础上的物体识别问题。每节点涵盖40个小波系数,集合称为射流,对小波系数进行原始图像和一组5个频率,8个方向的Gabor小波卷积。所以每一张图像,就像标签被逐一校准,而边缘之间的距离则是通过点来设计校准。因此,针对图中边缘编码后得到的是人脸的几何形状,而图中节点编码后的结果是灰度值的分布。实现过程示意如图4所示。
由图4可知,弹性图匹配的意义在于寻找新的人脸,同时提取一张图像,图像类似于束图,用其可以开展识别工作。当开始识别的时候,计算、测量人脸和目前束图之间的相似性,具有最大相似性的面部实体就指明了测试人脸的身份。
3.3 局部二值模式
局部二值模式(Local Binary Pattern, LBP)是执行纹理描述的最佳方法之一, 并已在于各类应用软件中获得全面功能发挥,同时经由实践证得该模式具备着强大的判别能力、计算效率及不变形单调灰度水平变化等显著优势[7],因而可将其应用到不同复杂程度的图像分析任务之中。
3.3.1 基本LBP算子
LBP算子最初是界定于3×3邻域,将中心像素设置成阈值,并将灰度值与其建立对比,大于中心像素时就记1,反之记0。这时的8个点就能变换为一种8位没有符号的二进制数,此二进制数再转换为十进制数,也就是窗口的LBP值。LBP可整体反馈出区域的纹理信息。基本的LBP算子如图5所示。
LBP能够用邻域的大小不同,采用圆形面积与双线性插值,邻域半径R和P的像素数能任意选择,用符号(p,r)表示像素区域。常见的LBP算子参见图6。
3.3.2 LBP人脸描述
使用LBP手段描述人脸,具体表现为运用纹理描述符对人脸局部展开详细的绘制处理,然后将其组合成一体。人脸图像就被分割成几个局部区域,从这些不同的区域提取纹理描述符,并共同构成人脸的整体视图。
把脸部区域分成确定的m份R0、R1、R2、…、Rm-1,直方图将依序计算每个区域,M的直方图计算结果整合在一起形成空间,空间增加M×N大小的直方图,其中的n表示一个直方图的大小。空间增强的直方图可以有效地描述3个不同层次的脸部,具体的3个层次分别为:直方图LBP标识包含一个像素级别的信息;地域级是由小的区域上的标志结合构成的;这些区域的直方图连接起来,最终形成完整的人脸。
4 人脸识别技术面临的问题
人脸识别技术存在独有优势和广阔前景,但同时却也面临一定问题,而这些问题是却均是源起于人脸具备的生物特征的某些显性表象。人脸在视觉上的特点可实际剖析如下:
一方面由于个体间差别较小,人脸、人体器官构成也比较类似,虽然对人脸定位是占优势的,而对区别个体却产生干扰;另一方面,人脸的表情变化产生的视觉图像也会导致差异。此外,人脸图像识别时还会受到其他约束条件影响,比如光照、年龄、遮盖物等。因此,解决上面提及的各类问题则既是创新,也是挑战,更是人脸识别技术开展未来研究的后续发展方向。
参考文献:
[1] 吴巾一,周德龙. 人脸识别方法综述[J]. 计算机应用研究, 2009, 26(9): 3205-3209.
[2] TURK M, PENTLAND A. Eigenfaces for recognition [J]. Journal of cognitive neuroscience, 1991, 3(1): 71-86.
[3] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D. et al. fisherfaces: Recognition using class specific linear projection [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19(7): 711-720.
[4] BARTLETT M, LADES H, SEJNOWSKI T. Independent component representations for face recognition[C]//Proceeding of the SPIE Symposium on Electronic Imaging: Human Vision and Electronic Imaging . San Jose, CA:IEEE, 1998, 3299:528-539.
[5] KIRBY M, SIROVICH L. Application of the Karhunen-Loeve procedure for the characterization of human faces [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12(1):103-108.
[6] SAMARIA F, YOUNG S. HMM based architecture for face identification [J]. Image and Computer Vision, 1994, 12(8): 537-543.
[7] AHONEN T, HADID A, PIETIKAINEN M. Face description with local binary patterns: Application to face recognition [J]. IEEE Trans. Pattern Anal. 2006, 28(5): 2037-2041.