陈云平
摘要: 利用数字图像模式识别技术实现了人脸的自动检测及特征定位。对数字图像处理中的颜色模型、肤色建模的原理及在人脸识别中的应用进行了概述,分析了人脸识别过程中存在的困难,展望了人脸识别技术的发展方向。
关键词: 数字图像; 颜色模型; 肤色建模; 人脸识别; 特征定位
中图分类号:TP391文献标志码:A文章编号:1006-8228(2012)05-37-02
The application of digital image recognition in face detection
Chen Yunping
(School of Computer Engineering,HuaiHai Institute of Technology, Jiangsu, Lianyungang 222005, China)
Abstract: Focusing on the introduction of color model, skin-color model theory application in face recognition, the article analyzes the difficulties in face recognition and look into the future development of face recognition technique. Meanwhile, the article achieves the goal of face automatic detection and feature location based on the digital image recognition technique.
Key words: digital image; color model; skin-color model; face recognition; feature location
0 引言
模式识别是利用计算机模仿人的识别能力,根据模式的特性,将其判定为某一模式类的技术。人脸识别检测是指在图像或视频中鉴别人脸是否存在,若存在,确定人脸的位置及大小。人脸识别检测在视频监控、数字视频处理中被广泛应用。将数字图像模式识别技术应用到人脸的自动检测中,运用算法寻优阈值,目的在于提高人脸检测的精度和效率。
1 图像识别在人脸检测中的应用
目前,人脸检测技术主要有三大类:①基于肤色的检测方法。这种方法是利用环境和人脸肤色的颜色反差,将背景环境和人脸肤色区分开来。②基于形状的检测方法。通过人脸和五官的形状信息,在数字图像中用一些形状模式与人脸进行匹配,从而进行人脸检测。③基于统计理论的检测方法。这种方法是利用机器学习和统计分析的方法找出非人脸样本和人脸样本各自的统计特征,再通过各自的特征构建分类器完成人脸检测。
1.1 人脸识别概述
人脸识别涉及计算机图像处理、模式识别、统计学和人工智能等众多学科,具有很高的研究价值。在一个完整的人脸识别系统中,人脸检测和人脸识别是相对独立的两个技术环节。人脸检测是在输入图像中确定人脸(如果存在)的位置、大小等信息[1]。人脸检测系统的输入信息可能不包含人脸的图像,也可能包含人脸的图像,输出是关于图像中是否存在人脸和人脸的大小、位置、表情等信息的参数。通过人脸检测技术,可以将人脸图像从复杂的背景图像中检测出来,并对人脸图像尺寸及位置进行标准化,从而得到标准的人脸图像,为以后的计算机人脸识别处理提供相应的数据。肤色特征是人脸的重要信息,它不依赖于面部的细节特征,对于旋转、表情等变化情况都能适用,具有相对的稳定性,因此它是人脸检测中最常用的一种特征[2]。研究表明:尽管不同种族、不同年龄、不同性别的人的肤色看上去不同,但这种不同主要集中在亮度上。在去除亮度的色度空间里,不同人的肤色分布具有聚类性,可以根据这种聚类性将人脸从背景中分割出来[3]。所以,基于肤色的人脸检测中最为关键的技术是建立肤色模型。
1.2 颜色空间
颜色模型是颜色在三维空间中的排列方式。当前,图像处理中常用的颜色模型有RGB颜色空间、NTSC颜色空间、HSV颜色空间及YCbCr颜色空间等。
1.2.1 RGB颜色空间
RGB颜色空间是彩色中最基本的颜色表示空间。它是通过红(Red)、绿(Green)、蓝(Blue)三种原色混合而产生其他颜色的。其中每种基色的亮度都由0-255表示。任何颜色都可以用红、绿、蓝3种基色来调制。由于R、G、B分量相关性太强, RGB颜色空间不容易直接建立肤色模型;并且亮度和颜色不相互独立,R、G、B三个基色不仅代表颜色,还表示了亮度。而在基于肤色的人脸检测中,为了把肤色区域同非肤色区域分离,需要使用适合不同肤色和不同光照条件的可靠肤色模型。所以,直接利用RGB空间聚类进行肤色分割不可能取得很好的效果。
1.2.2 NTSC颜色空间
NTSC颜色空间是一种用于电视图像的颜色空间。它使用的是YIQ色彩坐标系。其中Y是光亮度,用它表示灰度信息;I是色调,Q是饱和度,它们都表示颜色信息。所以,NTSC颜色空间的主要优点是区分灰度信息和颜色信息。
1.2.3 HSV颜色空间
HSV颜色空间是一种复合主观感觉的色彩空间。H是指色调(彩)(hue)、S指色饱和度(saturation)、V指明度(value)。因此,在此颜色空间中,颜色的参数便是H、S、V三个分量组成的三元组。
在HSV颜色空间中,反映颜色特征的两个属性色调和饱和度与明度特征相互独立,这对于建立肤色模型是有利的。建立肤色模型需要找到肤色的聚类性,这种聚类性主要体现在颜色的本质特性上。在实际应用中,肤色的情况会受到光照亮度的影响,而光照主要反映在亮度上。采用HSV颜色空间可以将亮度从颜色中分离出来,只使用反映颜色特征的色调和饱和度来进行聚类分析,所以可以取得较好的效果。
1.2.4 YCbCr颜色空间
YCbCr颜色空间又称为YUV空间,它是数字图像和视频图像中常用的色彩空间,主要用在数字电视系统中。其中Y代表亮度,Cb代表蓝色,Cr代表红色分量。在8位无符号整型数据的存储空间中,YCbCr模型中的数据可以是双精度类型,Y的范围为16~235,Cb和Cr的取值范围为16~240。
YCbCr颜色空间和HSV颜色空间有一个共同的特点是亮度和颜色的本质特性是分离开的。本文选择在YCbCr颜色空间中建立肤色模型的原因除此以外,还在于与HSV颜色空间比较而言,它的计算过程更加简单。在将图像从RGB颜色空间转换到YCbCr颜色空间的过程中,彩色分量Cb、Cr可以由三基色R、G、B经过线性变换得到,转换公式如(1-1)所示;并且在YCbCr颜色空间中,肤色有较高的聚集程度[4]。
Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128 (1-1)
Cr=0.5000R-0.4187G-0.0813B+128
1.3 建立肤色模型
不同种族、不同年龄、不同性别的人肤色是存在差异的,这个差异表现在亮度上。若消除亮度后,肤色就具有较高的聚类性。
在RGB颜色空间,为了除去光照影响,对人脸肤色要进行亮度归一化。归一化的颜色分量分别为r、g、b,如式(1-2)所示。
(1-2)
其中,r+g+b=1。由于这种归一化只除去了R、G、B中的相对亮度成分R+G+B,而r、g、b仍存在亮度信息,因此此种方法用于肤色检测效果不理想。
在YCbCr颜色空间,归一化色度直方图后,若肤色满足二维高斯模型M=(m,c),其中,m为均值,m=E(x),x=(Cb,Cr)T,C为协方差矩阵,C=E[(x-m)(x-m)T]。利用这个肤色模型检测任意一个像素为肤色的概率
(1-3)
经过验证,这个模型能很好地分辩出人脸和非人脸来。
1.4 亮度补偿
因为光照会影响图片的亮度,所以采用Gary World算法来对RGB图像进行快速颜色补偿:
(1-4)
式中,Cstd是标准亮度图像R、G、B值;Cave是输入图像R、G、B的平均值;C是原图像的像素值;Cnew是亮度补偿后的像素值。
2 基于VC++在人脸检测中的应用技术难点
通过VC++已验证数字图像模式识别技术可以对人脸实现自动检测。整个识别过程主要包括人脸相似度计算、人脸轮廓提取、人脸定位、脸内轮廓提取、眼睛定位、鼻子定位及嘴定位等。
⑴ 肤色识别技术
大量研究表明肤色是一种有效的人脸检测特征, 不同人种肤色的差别主要在于亮度信息而不是色度信息[5-6]。在肤色信息提取中,色度表技术应用较广泛。常用的色度表生成方法包括高斯模型和高斯混合模型等方法。然而由于其他非人脸肤色对象的存在和光照变化等影响,单独利用肤色信息无法保证人脸检测的准确性和完整性, 一般需要与其他特征结合使用。
为了准确进行人脸肤色识别,本文先将人脸图像从RGB颜色空间映射到YCbCr颜色空间,然后建立肤色模型并得到相似度矩阵,最后用相似度矩阵中的最大值对相似度矩阵归一化。
⑵ 嘴部定位技术
嘴部定位通过肤色掩码进行。由于嘴部存在较大的空洞,需要形态学闭运算填充,时间开销大,因此,直接利用R、G、B三原色建立肤色掩码。肤色掩码的计算公式如(2-1)所示:
(2-1)
肤色掩码加上嘴巴的位置约束就可以进行人脸嘴部定位。
3 结束语
人脸检测是实时人脸识别和表情识别的基础,只有将人脸检测准确,表情识别和人脸识别才能实现。而其中特征提取与处理是人脸识别中的关键, 无论是人脸检测定位、面部特征提取还是人脸确认识别,每一步都需要大量可靠的人脸特征。在实际的人脸识别中,单独使用任何一种已有的方法都不可能取得很好的识别效果。基于混合方法结合了两种以上已有的方法,实现了信息的融合,从而形成更准确和鲁棒性强的人脸识别系统。所以,混合的数字图像识别方法将是未来人脸识别研究领域的主要课题。
参考文献:
[1] Zhiwei Ye, Zhaobao Zheng, Xin Yu. Automaticthreshold selection
based on ant colony optimization al2gorithm[C]. Proc of Int Conf on Neural Networks and Brain,2005:728~732
[2] 冯驰,王衢,杜云明.基于肤色和几何特征的人脸检测[J].信息技术,
2007.8:84~87
[3] 徐从东,罗家融,肖炳甲.基于肤色信息马氏距离图的人脸检测[J].计
算机工程,2007.37(12):196~198
[4] 吕东辉,王滨.YCbCr空间中一种基于贝叶斯判决的肤色检测方法
[J].中国图象图形学报,2006.11(1):47~52
[5] F.Soulie,E.Viennet,B.Lanmy. Multi -Modular Neural Net -work
Architectures:Pattern Recognition Applications in OpticalCharacter Recognition and Human Face Recognition[J].Int'1J.Pattern Recognition and Artificial Intelligence,1993.7(4):721~755
[6] H.wu,Q.chen,M.Yaehida. Face Detection from Color Images
Using a Fuzzy Pattern Matching Method[C].In IEEE,Trans:Pattern Analysis and Machine Intelligence,1999.21(6):557~563