尚 骁,吴 进
(西安邮电大学电子工程学院,西安 710121)
采用Gabor-Hough变换的自适应滤波人眼定位*
尚 骁,吴 进**
(西安邮电大学电子工程学院,西安710121)
人眼定位是人脸识别方法的第一步。传统人眼定位方法需要将人脸裁切,情况单一,对于复杂背景、倾斜等情况,精度低,宽容度差。指出将改进的滤波器与改进的定位方法相结合,首先对原图像进行Gabor变换,寻找图像凹陷,凹陷区域通过边缘像素向量改进的Hough变换检测瞳孔,得到参考坐标,经过训练得到滤波器并在角度[-0.1,0,0.1]旋转两次得到3个相关滤波器,通过相关滤波器滤出3个目标,选择最小误差位置作为最终的目标。相比传统方法,改进方法避免了矩阵盲目计算,具备传统方法的普适性,学习过程使定位误差减小为0.040 4,计算量减少为传统方法的1/5。该方法对不同光照、光照不均、不同表情、复杂背景、头部倾斜等情况有较好的鲁棒性,避免了单一方法定位不到和不准的情况。
人脸识别;人眼定位;自适应滤波;Gabor变换;Hough变换
引用格式:尚骁,吴进.采用Gabor-Hough变换的自适应滤波人眼定位[J].电讯技术,2016,56(3):324-330.[SHANG Xiao,WU Jin.Eye 1ocation based on adaPtive fi1ter using Gabor-Hough transform[J].Te1ecommunication Engineering,2016,56(3):324-330.]
当面部区域被确定以后,下一步是面部特征点的识别和定位。面部五官特征作为身份的明显标识,一直是下一代身份识别技术研究的重心。而眼睛作为五官中比例对称、特征明显的器官,更是面部识别的首要着眼点。定位眼睛即可完成虹膜识别、状态检测、人像匹配等后续工作。定位的速度和精度决定人脸识别系统的性能。
目前的眼睛定位方法都是在图片裁剪到足够小的区域内进行。传统的定位方法有基于灰度投影定位、混合投影定位、模板匹配方法、Hough变换定位、脸部生物特征定位等,统计学的方法有神经网络定位、Adaboost算法定位、支持向量机的方法等。由于自适应需要大量的先验知识,目前收集知识有很大的局限性,单独用于人眼检测的方法不多,多为辅助方法。但是随着大数据的发展,自适应方法前景广阔。
近年来的人眼检测方法依然是传统算法居多。Gabor小波变换算法在地理上用于地形凹陷检测,而人的眼睛在面部整体“地形”中,也属于凹陷区域。利用这一点,李文娜[1]利用Gabor小波变换,结合灰度投影算法,加上先验知识的限定,设计出来一种由粗略估计到比较准确的检测方法。这种方法从图像中盲选出眼眶凹陷区域,通过形态学变换寻找眼睛区域,获取人眼大概位置,缩小搜索范围,再通过灰度投影,获得比较精确的坐标范围。从效果图来看,此方法会圈定整个眼睛区域,但是对浓眉小眼鲁棒性不强。
Hough变换方法用于提取边缘特征,对于明暗图像或者二值图像有较好的提取效果,能够提取出直线、正圆、椭圆等边缘。对于二维以内的参数空间,速度快、效率高,但是扩展到三维,计算量突增,不适合作为眼睛识别的计算方法,对于高清图像处理,更是一种考验[2]。应用这种方法的前提是预处理的图像为眼睑区域,对于圆心在图像之内的情况有比较理想的效果,但是容易受光照、眼睛闭合程度的影响。
Bo1me等人提出了平均合成精确滤波器(Average of Synthetic Extract Fi1ters,ASEF)相关滤波器的方法,作为自适应滤波器的代表出现在人眼识别领域。由于定位对眼睛位置的要求比较高,所以有不少改进方法,例如最小输出平方误差(Minimum Out-Put Sum of Squared Error,MOSSE)、自适应合成相关滤波器(AdaPtive Synthetic Corre1ation Fi1ter,ASCF)等[3]。这些自适应算法的基本原理是:通过对面部人眼瞳孔位置手工标定,对输入图像得到期望位置,高斯型合成输出,频率域构造精准滤波器,将得到的数据进行平均、最小平方误差或者迭代等方法得到最终的滤波器,训练的样本越多,得到的位置越准确。相对于普通滤波器,ASEF和MOSSE运用卷积定理,很大程度上简化了迭代过程。ASCF算法是不断更新滤波器,对尖峰最值位置目标加以记录,精度大幅度提高。
通过对上述各类典型方法的学习发现,Gabor对光照均匀程度、噪声等不敏感,使用二维Gabor计算0~2π方向任何角度的频谱能量。人脸中频率变化非常剧烈的区域在眉眼嘴唇区域,这样就可以区别出来特征,再进一步筛选即可获得眼部区域。
Gabor小波变换适合寻找眼睛大致位置,有的方法中把Gabor眼睛区域几何中心作为瞳孔区域这是不科学的,这是因为没有考虑眼球运动偏转位置,对于斜眼偏差较大[4]。而Hough变换对于全部人脸部分寻找圆具有相当大的计算量,适用于小范围搜索[5]。自适应滤波器定位比较精准,但通用性较差,对被识别图像要求非常苛刻,图片要求只能包含额头到下巴部分[6]。针对前面几种算法的问题,本文提出以下改进思路:对一幅包含少量背景的人脸图像,进行Gabor小波变换,找到脸部特征明显的区域,筛除干扰确定人眼模糊区域,二值化眼睛区域,以眼睛区域向外扩展,按照生物特征将数据存入新的矩阵,同时在区域内使用改进的Hough寻找正圆,为预判瞳孔位置,提前训练完成滤波器,对矩阵进行滤波处理得到第二坐标,与第一坐标比对,取几何中央得到最终瞳孔坐标。实验表明,Gabor对人眼区域判断非常有效,Hough计算量大大减少,裁剪后矩阵滤波器使精度更高。
2.1Gabor变换
Gabor小波变换常用于特征提取,原因在于Gabor函数与图像在大脑皮层简单细胞认知能力上极其类似。图像在视觉皮层被分解为两个分量的基信号,基信号包括空域和空频域两个域。二维Gabor在空域和空频域都具有解析性,而且能达到分辨率的下限。
对于80 Pixe1×80 Pixe1的人脸图像,卷积上5个频点,16个方向的Gabor小波,Gabor小波变换核函数定义为
原理参照孙大瑞等人[2]研究。
本文的参数选择为5个尺度,方向数16。实部、虚部分别表示如下:
将图像矩阵与Gabor核函数进行卷积,即为
式中:I(z)为图像;z(x,y)为像素坐标。分解到实部和虚部的范围为
2.2圆霍夫变换(Cycle Hough Transform,CHT)与改进
传统Hough检测一个圆需要半径和圆心两个参数[7],利用三维空间的投票参数积累提取圆形,在图像中圆形坐标可以表示为{xi,yi},圆心为(a,b),半径为r,以上几个系数满足方程
此方程有3个变量,相当于在一个三维空间求一系列满足条件的(x,y)点,从理论上讲是可以实现的。
对于计算机来讲,参数空间超过三维,变换就非常消耗空间和时间。检测圆时,参数空间变为x-yr三维,对应圆的圆心和半径。平面上的每一点就对应于参数空间中每个半径下的一个圆,这实际上是一个圆锥。这个方法显然需要大量的内存,运行速度也会是很大问题。如果对传统霍夫圆检测进行降维,将会节省大量的资源[8]。图像中圆形的边缘不仅有位置信息,而且有方向信息,所以可使用相位编码的方法降维。
CHT在应用中有许多分支算法,大体上说,前三个关键步骤是一样的,第三、四点是本文的改进Hough变换的思路。
(1)累加矩阵计算
梯度变化较大前景被作为候选像素,在累加器进行投票。以一个固定的半径形成一个整圆,如图1所示。
图1 经典投票模型Fig.1 C1assic voting Pattern
(2)圆心估计
候选像素的选票点属于一个图像圆,选票在矩阵容器中累加入和圆心对应的累加器[9]。图2显示,候选像素(实心点)在一个实心圆上,投票模型虚圆圆心和实心圆重合。
图2 投票模型圆心重合Fig.2 Coincides with the center of the circ1e voting Pattern
(3)半径估计
使用2D累加器存储所有半径。尽管这个方法需要额外的估计步骤,但是总体计算量是大幅降低,尤其对于大的半径定义域。
算法函数使用边缘像素信息。存储和速度被候选像素的数目影响。为了限制数量,输入的梯度量级有限定,这样一来,高梯度才能进行后续运算。使用边缘定位信息,约束候选像素容器的数目,利用局部可用边缘信息,在有限区间内只对许可的选票朝着梯度方向,可减少计算,提高性能。边缘梯度因子0~1之间,小值弱边缘容易检测,大的时候强边缘检测,默认情况下可以自己调节,使用最大类间方差找到图片的一个合适的阈值,投票模型如图3所示。图中:rmin为最小半径;rmax为最大半径;ractua1为实际圆半径;Cmin为最小半径圆心;Cmax为最大半径圆心;Cactua1为实际半径圆心。
图3 投票模型Fig.3 Voting Pattern
(4)相位编码
关键是用了累加矩阵在矩阵入口处编码半径信息的复数值,投票被边缘像素投射,像素信息包含可能的中心位置,还包含相关联的圆心位置的半径。使用相位法,半径可以通过简单解码相位信息来估计,而相位信息由累加器估计的中心位置确定。圆的半径垂直于切线,(xi,yi)在法线上。图中利用某点方向信息确定的直线必然通过圆心,所以圆心就是所有边缘像素方向信息的交点。
2.3ASEF滤波器
ASEF和MOSSE滤波器原理:手工标定训练图像目标点,产生尖峰值,其他位置产生低灰度值[10]。根据n幅输入图像I(n),得到期望输出O(n)。i为每幅图像下标,O(i)和I(i)为高斯关系,图像I(i)目标点坐标为(xi,yi),如公式(6)所示:
gi=exP{-[(x-xi)2+(y-yi)2]/σ2},i=1,2,…,n。
(6)式中:σ为高斯函数的尖锐系数。由滤波器卷积关系得滤波器为
滤波器对平正人像有不错的鲁棒性,但是对头部歪斜、光照不均等情况易出现误判,研究发现误判区域为眼眶周围波动。因此改进方法为将得到的初始滤波器再模拟头像旋转的情况在角度[-0.1,0,0.1]内旋转滤波器,生成相关滤波器后得到3个参考位置,判断三点关系得出最终目标。
总体来讲,本文方法是由Gabor小波变换确定大致位置,通过自适应滤波器与改进的霍夫变换完成精确定位与校验,如图4所示。
图4 改进方法流程图Fig.4 F1ow chart of the ProPosed method
3.1对于霍夫变换的改进
由于瞳孔区域经过膨胀,白像素点远多于黑像素点,所以圆心必须朝向白像素峰值区域,而所有像素的相位必定交于圆心点,命中阈值即可得到圆心坐标。相对于经典变换,减小了一维的计算量。
3.2对ASEF的改进
滤波器的训练过程中,从人脸库中取300人共3 000张面部图片。对于同一个人数据库取不同表情不同光照的10张图I1…I10,I1…I6作为训练,I7…I10作为测试。手工标定期望人眼坐标T1(x,y)…T6(x,y);根据公式(7)处理得到的理想坐标矩阵,计算得到ASEF滤波器H0。再将训练得到的H0在[-0.1,0,0.1]角度之间旋转两次,得到两个相关滤波器H1、H2。
测试时,将同一张图像分别通过H0、H1、H2滤出3个不同的峰值点,判断峰值点位置,如果位置集中,则取几何中心为最终坐标。
3.3本方法关键步骤
步骤1 读入一幅被测图像,灰度化后进行二维Gabor变换,得到全图频域二值图像,寻找凹陷,筛除嘴巴鼻孔干扰,腐蚀消除噪点,膨胀扩大眉眼区域。
步骤2 对眉眼区域进行二维Hough圆监测,聚集圆心位置与膨胀后结果相与,确保瞳孔圆心集合于眼睛区域,对于Hough找到的中心点与前期区域中心比较,如果H圆心与G中心误差不大于3,以H圆心为目标;如果误差大于3,以H与G几何中心为目标。以左眼向外估算脸部区域并裁剪出与训练大小相同图像待滤波[11]。
步骤3 载入H0、H1、H2数据,采用改进算法对裁剪后图像进行滤波,找到眼睛区域并记录,与GH结果再比较,方法同第二步筛选办法。
仿真实现的平台为:Windows XP,Mat1ab2013b。采用随机选取的50张人像摄影作品,FE-RET数据库,外加自造库。由于人脸采集环境为普通荧光灯光照,无特殊补光效果,故模拟荧光灯环境和自然光环境,50张人像用来测试Gabor与霍夫变换对眼眶区域的定位和对瞳孔的预定位,返回参考坐标。照片选取不同背景,验证对复杂背景的鲁棒性。FERET用来测试对比自适应相关滤波准确度,由于人脸库大多数由国外人员统计,对于国内情况创建了自造库,以验证G-H变换后裁剪图像与人脸库图像通用性以及滤波器对不同国籍人像的识别能力。
表1为分别使用3种方法对左眼右眼定位坐标与手工标定坐标的标准差,数据表明各种方法对眼睛的识别误差在5个像素内。测试图片均采用250 Pixe1×250 Pixe1像素图像,可以看出G-H方法对于单纯的Gabor和Hough,避免了Hough变换识别不出瞳孔弱圆的情况,同时对单纯的Gabor几何中心精度有所提高。很显然,如果对眼睛区域识别出圆形,基本可以确定是瞳孔中心。
表1 3种方法左右眼坐标标准差Tab.1 Each SD with three methods
图5为随机抽取12组图像各种算法获取的6组数据标准差标点集合。坐标原点为瞳孔中心,发现标准差大部分集中于4 Pixe1以内。我们针对性地联系与比较G-H变换与ASEF滤波器,对于第一张图裁剪后结果自适应定位结果为[101,108],计算左右眼得到的标准差为0、1.414 2,一般认为像素误差的宽容度为3~5个(包括手工标定误差),结果是比较理想的。从表2的数据可以看出:经典Hough算法盲目计算时间过长,甚至达到13 s,远远超过了理想时间,这对于实时识别是很难接受的;而改进的Hough计算时间维持在0.5 s以内,很好地实现了实时识别。
图5 标准差分布情况Fig.5 The distribution of SD
对ASEF和MOSSE自适应滤波器[12]分别进行改进,各旋转两次得到ASEF-R和MOSSE-R,表3给出了不同方法的精度比较结果,可见在同样条件下改进后的方法精度得到了提高。
表3 精度比较Tab.3 ComParison of accuracy
图6为G-H处理效果,图7为训练过程,图8为测试定位效果。
图6 处理效果图Fig.6 Processing effect
图7 第一次学习过程图Fig.7 The first 1earning Procedure
图8 第一次实测效果图Fig.8 The first testing resu1t
为了验证不同光照、不同性别、不同表情对本方法的影响,做了以下测试,经过一次训练,如图9所示,用15张不同情况的人脸进行测试,结果如图10所示。
图9 第二次学习过程图Fig.9 The second 1earning Procedure
图10 第二次实测效果图Fig.10 The second testing resu1t
可以看出,改进方法对面部光照不均匀、不同表情、脸部旋转、闭眼等情况,具有很强的鲁棒性,定位快速且精确。改进的自适应方法区别于一般霍夫变换和自适应滤波器,避免了弱圆无法检测的劣势,提供多个参考坐标,防止数量为0的情况出现,对倾斜、光照不均的情况鲁棒性增强。
本文的定位方法是传统定位方法与学习型定位方法的结合:Gabor变换只用于粗定位,框选大致区域;改进的Hough变换在框选区域内限制半径识别瞳孔;自适应滤波器精准定位,参考G-H定位结果取几何中心;对于Hough定位不成功的情况,滤波器坐标为主,参考坐标作为补充,避免以往文献所述方法识别不到导致误判的情况。实验表明:新方法兼备传统方法盲选的优点,同时不需要大批量的训练过程,节省计算时间和存储空间,对不同光照条件下人脸识别稳定性良好,性能有较大提升,具有很高的普适性,利于快速识别人眼,为后续在动态环境中人眼定位、实时视频目标点分析等研究课题打下了基础。下一步可以探究人眼定位在安防、医疗等方面的应用。
[1] 李文娜.基于Gabor小波变换与灰度相结合技术设计的人眼检测[J].中国组织工程研究与临床康复,2009,13(9):1661-1664.
LI Wenna.Human eye detection based on Gabor wave1et transform and gray sca1e[J].Journa1 of C1inica1 Rehabi1itative Tissue Engineering Research,2009,13(9):1661-1664.(in Chinese)
[2] 孙大瑞,吴乐南.基于Gabor变换的人眼定位[J].电路与系统学报,2001,6(4):29-32.
SUN Darui,WU Lenan.Eye 1ocation based on Gabor transfrom[J].Journa1 of Circuits and Systems,2001,6 (4):29-32.(in Chinese)
[3] 张金焕,吴进,宋骁,等.基于自适应相关滤波器的人眼定位改进方法[J].电讯技术,2014,54(11):1538-1543.
ZHANG Jinhuan,WU Jin,SONG Xiao,et a1.An imProved eye 1ocation method based on adaPtive corre1ation fi1ter [J].Te1ecommunication Engineering,2014,54(11):1538-1543.(in Chinese)
[4] 韩玉峰,王小林,张传文.生物特征识别技术研究及应用[J].测控自动化,2012,33(3):33-35.
HAN Yufeng,WANG Xiao1in,ZHANG Chuanwen.Biometric techno1ogy:research and aPP1ication[J].Contro1& Automation,2012(3):33-35.(in Chinese)
[5] 赵秀萍.生物特征识别技术发展综述[J].刑事技术,2011(6):44-48.
ZHAO XiuPing.A survey of biometric recognition techno1-ogy[J].Forensic Science and Techno1ogy,2011(6):44-48.(in Chinese)
[6] 唐坤.面部特征点定位算法研究[D].大连:大连理工大学,2013.
TANG Kun.Facia1 feature Points 1oca1ization a1gorithm research[D].Da1ian:Da1ian University of Techno1ogy,2013.(in Chinese)
[7] 韩玉峰,王小林.一种基于改进的ASM的人脸特征点定位方法[J].计算机科学,2014,40(4):271-274.
HAN Yufeng,WANG Xiao1in.A face feature Point 1ocation method based on imProved ASM[J].ComPuter Science,2014,40(4):271-274.(in Chinese)
[8] KUMAR A.An emPirica1 study of se1ection of the aPProPriate co1or sPace for skin detection:a case of face detection in co1or images[C]//Proceedings of 2014 Internationa1 Conference on Issues and Cha11enges in Inte11igent ComPuting Techniques.Ghaziabad:IEEE,2014:725-730.
[9] NADERI S,NASIRI J A,CHARKARI N M,et a1.Visua1 i11umination comPensation for face images using 1ight maPPing matrix[J].IET Image Processing,2013,7(5):514-522.
[10] PARK S H,YOO J H.A new imP1ementation method of ASEF for eye detection[C]//Proceedings of 2012 7th Internationa1 Conference on ComPuting and Convergence Techno1ogy.Seou1:IEEE,2012:1034-1037.
[11] BOLME D S,DRAPER B A,BEVERIDGE J R.Average of synthetic exact fi1ters[C]//Proceedings of 2009 IEEE Conference on ComPuter Vision and Pattern Recognition CVPR.Miami,FL:IEEE,2009:2105-2112.
[12] ZHOU L B,WANG H.Iterative adaPtive synthetic corre1ation outPut fi1ters[J].E1ectronics Letters,2013,49 (14):878-880.
尚 骁(1990—),男,山西运城人,2011年获工学学士学位,现为硕士研究生,主要研究方向为图像与视频处理;
SHANG Xiao was born in Yuncheng,Shanxi Province,in 1990.He received the B.S.degree in 2011.He is now a graduate student.His research concerns image and video image Processing.
Emai1:sniPersPy@qq.com
吴 进(1975—),女,江苏常州人,教授、硕士生导师,主要研究方向为信号与信息处理。
WU Jin was born in Changzhou,Jiangsu Province,in 1975.She is now a Professor and a1so the instructor of graduate students.Her research concerns signa1 and information Processing.
Emai1:huatao2000@126.com
Eye Location Based on Adaptive Filter Using Gabor-Hough Transform
SHANG Xiao,WU Jin
(Schoo1 of E1ectronic and Engineering,Xi'an University of Posts and Te1ecommunications,Xi'an 710121,China)
Eye 1ocation is the first steP of the face recognition.Traditiona1 eye 1ocation methods need to cut the face,and the situation is sing1e.For comP1ex background or 1eaned images,the methods have 1ow accuracy and Poor to1erance.In this PaPer,the imProved adaPtive fi1ter is combined with the traditiona1 Positioning methods.First1y,the origina1 image is transformed with the Gabor Transform to find the sag regions. In these regions the PuPi1 is detected with edge Pixe1 vector imProved Hough Transform to gain the first reference coordinates.The fi1ter is trained and rotated for two times to get three coherent fi1ters,then the image goes though the coherent fi1ters to find three target coordinates.Fina11y,the best target which has the minimum error is chosen as the fina1 target.ComPared with the traditiona1 methods,the new method avoids the weakness of aim1ess comPutation and has the genera1 aPP1icabi1ity of the traditiona1 method.At the same time,the adaPtive fi1ter makes the mean error reduce to 0.040 4,and comPuting Pressure reduce to 1/5.The method has better robustness for different i11umination,uneven i11umination,different countenance,comP1ex background images and 1eaned head images,thus avoiding the situation of 1ocating no targets and wrong targets with sing1e method.
face recognition;eye 1ocation;adaPtive fi1ter;Gabor transform;Hough transform
The Nationa1 Natura1 Science Foundation of China(No.61272120);2013 Scientific Research Projects of Education DePartment of Shaanxi Province(2013JK1129);2014 Scientific Research Projects of Education DePartment of Shaanxi Province (14JK1673);2013 Natura1 Science Basic Research Program of Shaanxi Province(2013JC2-32);2014 Natura1 Science Basic Research Program of Shaanxi Province(2014JQ5183)
TN911.7;TP391.4
A
1001-893X(2016)03-0324-07
10.3969/j.issn.1001-893x.2016.03.016
2015-06-29;
2015-09-30 Received date:2015-06-29;Revised date:2015-09-30
国家自然科学基金资助项目(61272120);陕西省教育厅2013年科学研究计划项目(2013JK1129);陕西省教育厅2014年科学研究计划项目(14JK1673);陕西省2013年度自然科学基础研究计划项目(2013JC2-32);陕西省2014年度自然科学基础研究计划项目(2014JQ5183)
**通信作者:huatao2000@126.com Corresponding author:huatao2000@126.com