王称意 王小鹏 万生阳 吴 双
(兰州交通大学电子与信息工程学院,兰州 730070)
人眼定位在人脸识别、智能监控、视频跟踪、人眼状态分析等方面发挥着重要作用,但在实际应用中复杂光照条件导致的光照过强、过弱、及光照不均匀等情况给人眼定位带来较大困难,因此在人眼定位之前需要进行预处理,利用直方图均衡化[1]可以使图像灰度分布均匀并增强对比度,但可能丢失图像细节信息;基于光照-反射模型的频域方法[2,3]利用图像频率信息将高频与低频部分分开再进行滤波达到增强图像对比度同时压缩图像动态范围的目的;视网膜神经理论(Retinex)增强方法[4]利用平滑函数估计原图像的亮度分量进行光照补偿。
在光照条件相对均匀的情况下,人眼定位的方法有很多,灰度积分投影法[5]对人脸图像分别进行水平与垂直积分,根据投影曲线分布信息进行人眼定位,计算简单,但对于图像灰度信息分布复杂的人脸定位精度不高,且受人姿态影响较大;模板匹配方法[6]结合皮肤模型进行人眼定位,但人眼模板计算量相对较大,且对人的初始姿态要求较高,如果人脸偏转角度较大,模板匹配度会降低;Hough变换法[7,8]先粗定位出二值化后图像中的人眼区域,再对该区域进行边缘分析,最后利用Hough变换定位瞳孔圆心,该方法定位准确率受人眼圆形度的影响较大;Gabor模型[9]可以有效克服噪声干扰,但在眼部区域存在头发、眼镜等饰物干扰时,效果不佳。
为了克服复杂光照对人眼定位的影响,提出了一种复杂光照下先定位人脸后定位人眼的方法,该方法首先利用高斯肤色模型提取人脸图像中对光照不敏感的特征量,经过形态学运算定位人脸位置;然后对获得的人脸图像进行自适应连续均值量化变换(SMQT)增强,使图像光照分布相对均匀,最大限度的消除光照对图像后续处理的影响;最后对人脸图像进行连通域分析[10]与形态学运算,完成人眼定位。
为了提高人眼定位准确率,减少计算量,首先进行人脸定位,其流程如图1所示。首先将获取的彩色图像由RGB空间转化到YCbCr空间,然后进行基于YCbCr高斯肤色模型的人脸定位。
图1 人脸定位流程图
人类肤色变化主要是由亮度引起的,而色度则分布在某一局限范围内,不随光照变化。因此,在复杂光照下,如果将肤色在YCbCr色彩空间[1(]Y代表亮度,Cb和Cr分别表示蓝色和红色色度)中的受光照影响的亮度Y分量分离,只对不受光照影响且具有良好聚类性的Cb和Cr分量建立肤色模型,则可建立一个不受光照影响的肤色模型,进而来完成人脸定位。
假设肤色服从二维高斯肤色模型[12],提取N个肤色随机样本的Cb和Cr分量构成向量t并分别计算其样本均值A与样本方差D,建立肤色相似度函数P(Cb,Cr):
将每个像素的肤色相似度结果与预设阈值(通常设定为0.5)进行比较,若相似度大于阈值,则该像素设定为“1”(白色)即肤色像素,否则为“0”(黑色)即背景。然后对肤色区域进行形态学膨胀运算和孔洞填充,得到封闭的肤色区域。由于人脸长宽比一般为1左右,但考虑到人脸偏转和颈部等因素影响,将此范围设定在0.8-1.3,依此长宽比可检测出疑似人脸区域,将疑似人脸区域面积与其外接最小矩形面积进行比较,将比值大于0.6的区域判定为人脸区域,排除颈部等对人脸定位的干扰。依据先验知识,人眼通常位于人脸上1/3处,但考虑到人头部姿态与表情对人眼定位的影响,因此将人脸区域上2/3部分作为后续人眼定位的待处理区域。
SMQT[14,15]算法将图像中像素按照灰度值大小进行逐层分类,将每一层分类结果加权求和实现图像增强。在提高图像对比度的同时,最大限度保持了图像的原始信息。分类层数越多,图像增强程度越高,图像细节保留越多。但随着图像分类层数的增多,算法复杂度呈几何增加。为了使图像增强程度与算法复杂度之间相互兼顾,提出了一种自适应SMQT图像增强算法,在SMQT图像增强算法的基础上,通过对图像增强等级参数进行自适应调整,在图像增强程度满意的前提下,尽可能的减小算法复杂度。
对于包含人眼的部分人脸图像f(x)(x代表像素),假定L为图像增强等级,M(x)为输出图像,则L阶的SMQT变换可描述为:
运算过程如图2中二叉树所示,树之间节点均值量化单元(MQU)为SMQT的基本运算单位。图像经过L阶增强运算,需经过2L− 1 个MQU单元。每经过一次MQU运算,依据图像平均灰度值(x)可将f(x)分解为两个与其大小相同的新图像,其中一幅图像保留f(x)中灰度值大于(x)的像素点,其余像素点均赋值0;另一幅图像则保留f(x)中灰度值小于(x)的像素点,其余像素点均赋值0。然后将上述两图像分别进行分解比较,并依次类推。假定u(x)为每个MQU运算单元的分类输出,那么经过L阶增强运算后,输出增强图像M(x)则为u(x)的加权和,即
图2 SMQT二叉树表示
自适应SMQT算法中,图像每经过一次MQU单元时,均对图像中像素灰度最大值fmax(x)与平均值(x)作差分归一化,并与预设阈值k进行比较,若小于k,则图像增强完成,运算结束,否则,图像增强参数L+1,进行下一级运算,即
通过这一判定步骤,可最大限度地在消除光照对人眼定位影响的前提下,使参数L随图像、光照等条件自适应变化,减少运算复杂度。
人脸图像经过自适应SMQT增强后,对脸部图像进行形态学重构,将人眼与其它部分连接断开,消除小的孤立点以及区域(相对于人眼来说)等干扰;计算所得疑似人眼区域长宽比,设定长宽比范围为1-3,将长宽比不满足此范围的区域判定为非人眼部分,排除包含头发在内的多种遮挡物干扰。另外,由于眉毛和眼睛在位置上非常接近,需进行眉毛排除。由先验知识可知,眉毛位于人眼上方,包含眉毛的连通域中心纵坐标值小于人眼,故对连通域中心坐标进行排序,排除纵坐标值较小的连通域,从而消除眉毛对人眼定位的干扰。
为了验证算法的有效性,在Matlab环境下对人脸数据库进行了仿真实验。测试的人脸包含不同光照、头部姿势以及表情条件下的图像。图3(a~j)为不同背景、光照、遮挡、头部姿势、表情的人眼定位结果,人脸与人眼部位见白色矩形框标记。
为了验证本文方法在复杂光照下的人眼定位准确率,实验对650张样本进行了人脸检测率和人眼定位率测试,结果表明,人脸检测率为98.7% ,而人眼定位率为94.6%。人眼定位率比人脸检测率低的原因在于复杂光照下,人脸偏转较大角度时,未能有效排除眉毛等区域对人眼定位的影响。
图3 不同光照条件下的人眼定位结果
表1给出了不同人眼定位方法的定位率以及平均运算时间,可以看出,本文方法运算时间略长于灰度积分投影法,但人眼定位率高于灰度积分投影法。与其余三种方法相比,本文方法运算速度较快,人眼定位率较高。
表1 不同人眼定位方法的定位率(%)及平均运算时间(s)
由此可见,本文方法对复杂光照条件下的人眼定位适应性较好,且对不同头部姿势、面部表情有很好的鲁棒性。但对于偏转角度过大情况下,有一定的局限性。
提出了一种在复杂光照条件下,采用基于YCbCr高斯肤色模型结合人脸的几何特征对人脸进行定位,消除了光照对肤色的影响。对包含有人眼的人脸部分采用自适应SMQT算法进行增强处理,能够在增强图像的同时,减低计算复杂度。通过对图像连通域进行分析排除非人眼区域,从而定为人眼。仿真实验表明,本方法可以在复杂光照条件下,对于头部存在偏转旋转、表情变化、遮挡、等情况,均具有较高的定位人眼准确率。
[1]Arici T, Dikbas S, Altnnbasak Y.A histogram modification framework and its application for image contrast enhancement [J].IEEE Trans on Image Processing, 2009, 18(9): 1921-1935.
[2]XIE Hu-dong, LANKin-man.An efficient illumination invariant face recognition[J].Pattern Recognition, 2005,38(10) : 1750-1716.
[3]ZHANG Yi, XIONG Fei, ZHANG Gui-lin.A preprocessing algorithm forillimination invariant face recognition[J].Journal of Image and Graphics, 2008,13(9) : 1707-1712.
[4]MEYLAN L,SIISSTRUNK S.High dynamic range image rendering with a retinex-based adaptive filter[J].IEEE Trans on Image Processing, 2006, 15(9) : 2820-2830.
[5]Karin Sobottka, Ioannis Pitas.A Novel Method for Automatic Face Segmentation, Facial Feature Extraction and Tracking[J].Signal Processing: Image Communication, 1998, 12(3) : 263-281
[6]D Orazio T, Leo M, Cicirelli G, Distante A.An Algorithm for Real Time Eye Detection in Face Images[C].IEEE International Conference on Pattern Recognition(ICPR), 2004(3) : 278-281.
[7]Canny J.A computational approach to edge detection[J].IEEE Transaction on Pattern Analysis and Machine Intelligence, 1986, 8(6) : 679-698.
[8]Zana’F.A multimodal registration algorithm of eye fundus images using vessels detection and Hough transform [J].IEEE Trans on Medical Imaging, 1999,18(5) : 419-428.
[9]Smeraldi F, O Carmona.Saccadic search with Gabor features appliedto eye detection and real-time head tracking[J].Image and Vision Computing, 2000, 18(4):323-329.
[10]徐正光,鲍东来,张利欣.于递归的二值图像连通域像素标记算法[J].计算机工程, 2006, 32( 24) : 186-225.
[11]Son Lam Phung.A novel skin color model in YCbCr color space and its application to human face detection [C].Proceedings of the 2002 International Conference on Image Processing (ICIP), 2002, (1) : 289-292.
[12]YANG M H,AHUJA N.Gaussian mixture model for human skin color and its application in image and video databases[C].Proceedings of SPIE: Conference on Storage and Retrieval for Image and Video Databases,1999, 36(56) : 458-466.
[13]Soille P.形态学图像分析原理与应用[M].王小鹏 译.北京:清华大学出版社, 2008.
[14]M.Nilsson, M.Dahl, I.Claesson.The successive meanquantization transform[C].IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 2005(4): 429–432.
[15]M.Nilsson.Face Detection Using Local SMQT Features and Split up SNOW Classifier[C].IEEE International Conference on Acoustics,Speech and Signal Processing(ICASSP), 2007(2): 589–592.