徐英武,胡学刚
(1.安庆职业技术学院,安徽 安庆 246003;2.合肥工业大学,安徽 合肥230009)
基于三维人脸数据的性别分类
徐英武1,2,胡学刚2
(1.安庆职业技术学院,安徽 安庆 246003;2.合肥工业大学,安徽 合肥230009)
提出了一种新颖的基于视觉词典直方图的三维人脸特征,并将其应用到三维人脸数据中实现了人脸性别分类。视觉词典直方图特征提取分为两个阶段,训练阶段和识别阶段。在训练阶段中,先是通过Gabor滤波器提取出三维人脸数据中的局部纹理特性,组成滤波响应向量集合,然后通过聚类算法得到向量中心,即三维人脸视觉词汇;在识别阶段中,将滤波响应向量与三维人脸视觉词汇进行映射,得出对应的视觉词汇直方图向量,即基于视觉词典直方图的人脸特征。在获取人脸特征后,采用SVM分类器实现性别分类。实验表明,该特征在性别分类中可以获得比其他广泛采用的表象特征(如Gabor滤波器、LBP等)更好的分类性能,充分证明了该特征实现了三维人脸描述有效性和鲁棒性的统一。
三维人脸;视觉词典;性别分类
近年来,由于三维人脸数据对于光照以及姿态等变化的鲁棒性,三维人脸识别的关注度得到不断提升[1]。虽然分类问题在很多领域都有着广泛的应用,与识别同属于计算机视觉方向的经典问题,但三维人脸分类问题的研究内容还比较少见。三维人脸数据不仅包含个体身份这样的具体信息,还包括其所属民族、性别、年龄等多方面的社会和人文属性,因此,出色的分类结果不仅可以减少人脸识别时的搜索空间,提升识别速度和识别性能,而且还可以对人脸数据加入准确的语义标签,有助于图像在数据搜索等领域的进一步应用。基于此,本文在三维人脸的性别分类领域进行了初步的探索。
性别分类是一个典型的二类问题,因此一些强分类器,如支持向量机(SVM)、Adaboost等算法在该领域有着广泛的应用[2]。目前,在灰度人脸模态上性别分类已经有了相当多的研究工作,其中比较有代表性的如B.Moghaddan[3]等利用大规模的二维人脸数据库,将原始的人脸图像灰度信息输入到支持向量机(SVM)分类器中,学习得出类别分界面的支撑脸(support face)。论文提出,在利用学习得到的支撑脸分界来对图像进行有效性别分类时,可以取得90%以上的识别率。与此同时,该论文还发现分类性能和人脸图像的分辨率没有直接关系,利用分辨率为21*12或是分辨率为84*48的人脸图像数据进行分类,它们的性能差距在1%以内。S.Baluja[4]等也得到了类似的结论,而且作者还提出如果利用Adaboost算法作为分类器在二维人脸模态进行性别分类,不仅可以取得和SVM分类器近似的分类性能,而且还可以获得远小于SVM分类器的计算代价,进一步提升性别分类的速度。
大部分的性别分类工作都是基于基础像素数据的[3,4],但是一些人脸的局部纹理特性,如Gabor滤波器[5]或者Local Binary Pattern(LBP)[6],它们或是通过提取多方向多尺度的局部纹理区域对比特征,或是利用中心像素与其邻域像素值的对比关系建立纹理模式,因此包含着比像素值更为丰富的纹理细节信息。如果利用这些特征,完全有可能进一步提升性别分类算法的性能。
本文中我们提出了一种新颖的基于视觉词典的直方图特征并将其应用于三维人脸性别分类领域,算法流程图如图1所示。该特征将Gabor滤波器对人脸数据局部纹理细节的描述性以及直方图对于人脸全局数据的统计性结合在一起,体现了三维人脸特征描述有效性和鲁棒性的统一。
图1 三维人脸性别分类系统流程图
1.1视觉词典特征提取
表象特征就是基于三维人脸深度图像数据分析得到的全局或局部的纹理特征,基于这个方向的算法主要问题就是如何充分利用深度纹理信息来描述纹理的本质特征以获得数据的准确分类,这也是特征选择的主要目标。自从KBovver等的工作之后,利用表象特征进行三维人脸的特征描述逐渐成为了三维人脸研究领域的主流方向。
在二维人脸识别中,Gabor滤波器[5]由于其可以提取多个尺度多个方向的数据响应信息,获得了更加精细的纹理内部特性,因此取得了广泛的使用。但是,由于涉及了图像数据响应的尺度和方向信息,这也就对于数据的预处理和配准实现有了更高的要求,否则其表述效果更容易受到数据噪音的影响。而三维数据采集本身就包含很多噪音,因此使得Gabor滤波器局部特征在该领域的应用受到了一定的制约。与之相反,基于统计信息的直方图特征对于数据噪音比较鲁棒。该类算法通过统计深度像素值的分布信息,实现了对于某类纹理图像的一种总体概括。但这类方法缺乏对于纹理局部信息和位置信息的细致描述,表达能力相对比较薄弱,在需要用到纹理细节情况的分类问题时,其识别性能不够理想。视觉词典直方图特征的动机就是希望能够融合上述几类算法的优点,克服它们的缺点,使得本文的算法可以达到识别效果和鲁棒性能的统一。
视觉词典直方图特征向量的计算过程如图2所示,其流程可以分为训练和分类两个阶段。在训练阶段中,先是通过Gabor滤波器提取出三维人脸数据中的局部纹理特性,组成滤波响应向量集合,然后通过聚类算法计算出向量中心,即三维人脸视觉词汇;在识别阶段中,将滤波响应向量与三维人脸视觉词汇进行映射,得出对应的视觉词汇直方图向量,即基于视觉词典的三维人脸直方图特征。其中间过程主要包括三维Gabor人脸计算、视觉词汇聚类以及直方图特征生成3个步骤。
图2 视觉词典直方图向量流程图
1.2三维Gabor人脸计算
在三维Gabor人脸计算中,Gabor滤波器的定义如下:
其中 Ku=Kmax/fu,φv=πv/4,Kmax代表最大的频域值,f 是Gabor核函数在频域中尺度的间隔量。
我们选择4个方向和5个尺度的Gabor核函数,u∈{0,1,2,3}和u{0,1,2,3,4},尺度和方向的数目选择反映了所采用空域信息的局部性和方向选择的精细程度。对于深度人脸图像的Gabor描述,我们称之为三维Gabor人脸,可以通过深度人脸图像和Gabor核函数进行卷积计算得到。
1.3视觉词汇聚类
在训练阶段,获取三维Gabor人脸数据(Gabor滤波器响应向量)集合之后,我们利用K均值聚类对于数据进行聚类[2],其具体步骤如下:
1.从n个数据对象任意选择k个对象作为初始聚类中心;
2.计算每个数据对象与这些聚类中心对象的距离;
3.根据最小距离对每个数据对象依据聚类中心对象重新进行划分;
4.重新计算每个聚类的中心对象;
5.循环步骤2-4直到每个聚类中心不再发生变化为止。
计算得到的聚类中心即为三维人脸视觉词汇。
1.4视觉词典直方图特征生成
在分类阶段,获取Gabor滤波器响应向量(三维Gabor人脸数据)之后,计算每个响应向量与视觉词汇向量的欧式距离,并将该向量归属于与其距离最近的视觉词汇。通过这种映射方式,可以将该深度人脸图像的所有Gabor滤波器响应向量归属于与其对应的三维人脸视觉词汇。基于该对应关系,可以计算出该深度人脸图像的视觉词典直方图特征。
1.5性别分类
在获取视觉词典直方图特征之后,将性别分类转化为二类分类问题处理,选取SVM分类器对数据进行学习和分类,从而达到性别分类的目的。SVM分类器是被广泛使用的强分类器,对于二类问题具有很好的分类性能和泛化性能,在实验中我们采用了带有高斯核函数的SVM分类器,其实现的具体细节可以参考。
为了验证视觉词典直方图特征在三维人脸性别分类领域中的性能,我们的实验基于FRGC2.0三维人脸数据库[7]。因为原数据库中并未提供性别数据的分类,因此我们人工为数据库手动挑选出了男性图像和女性图像。基于FRGC2.0数据库,得到了2148幅男性图像和1859幅女性图像,部分代表性三维人脸图像如图3所示。
由于在训练人脸视觉词汇时,采用的是中性表情图像(FRGC1.0),因此,在实验中还挑选出了仅含有表情变化的三维人脸图像子集验证该特征的泛化性能,FRGC2.0数据库中表情图像的定义可见[8],共有796幅小表情变化图像和742幅大表情变化图像。
图3 三维人脸数据,其中第一行为男性,第二行为女性
实验中,把视觉词典直方图特征与其他几种常用的表象纹理特征的分类性能进行对比,对比特征包括深度像素值、Gabor特征和LBP特征,实验结果如表1所示。
表1 性别分类识别率比较
由上述实验的结果,可以得到以下结论。
1.视觉词典特征在所有试验中都取得了最优的性别分类性能,这也充分说明了视觉词典算法在三维人脸性别分类问题上的有效性和对表情变化程度的鲁棒性。由于我们的视觉词汇在训练时只利用了中性表情的三维人脸数据,而其在表情数据实验中也取得了最优的分类性能,这也说明了该特征具有很好的泛化性能[9]。
2.Gabor特征的分类性能优于深度像素值。由于Gabor特征提取了人脸数据中多尺度多方向的局部纹理细节特性,其比直接深度像素值包含了更多有效的纹理信息,因此在分类性能方面明显优于后者。
3.深度像素值的分类性能优于LBP特征。由于LBP特征利用的是人脸局部纹理模式的统计信息,对于纹理细节的描述能力要弱于直接的深度像素值,该结论也说明表象纹理细节信息对于性别分类问题更为有效。
4.在实验中,对原始三维人脸图像分别作了1:2和1:4的降采样,结果发现分类性能几乎不会受到影响(差距在1%以内),这也说明深度图像和灰度图像类似,其分辨率的变化对于性别分类影响并不明显。
在本文中,提出了一种新颖的视觉词典直方图特征,并将其成功应用于三维人脸性别分类。该特征同时考虑了局部纹理的细节信息和纹理模式的统计信息,实现了三维人脸纹理描述有效性和鲁棒性的统一。基于FRGC三维人脸数据库的人脸性别分类实验结果表明该特征可以获得明显优于其他表象纹理特征的分类性能。还发现,深度图像分辨率对于三维人脸性别分类性能的影响很小,这也使得在我们进行性别分类计算时可以对数据进行进一步的压缩,提升计算效率。
[1]K.Bowyer,K.Chang,and P.Flynn.A survey of approaches and challenges in 3d and multi-modal 3d+2d face recognition.[J].Computer Vision and ImageUnderstanding(CVIU),2006(1):1-15.
[2]R.O.Duda,P.E.Hart,and D.G.Stork.Pattern Classification,SecondEdition.[M].JohnWiley&Sons,Inc.,2001:3-17.
[3]B.Moghaddam and M.H.Yang.Learning gender with support faces.[J].IEEE Transactions on Pattern Analysis and Machine Intelligence(PAMI),2002,1(7):1-5.
[4]S.Baluja and H.Rowley.Boosting sex identi-cation performance.[J].International Journal of Computer Vision(IJCV),2007(1):111-119.
[5]C.J.LiuandH.Wechsler.Gaborfeaturebased classification using the enhanced fisher linear discriminant model for face recognition.[J].IEEE Transactions on Image Processing(TIP),2002,11(4):467-476.
[6]T.Ojala,P.Matti,and M.Topi.Multiresolution grayscale and rotation invariant texture classification with local binary patterns.[J].IEEE Transactions on Pattern Analysis and Machine Intelligence(PAMI),2002,24(7):971-987.
[7]P.J.Phillips,P.J.Flynn,T.Scruggs,K.W.Bowyer,J. Chang,K.Hoffman,J.Marques,J.Min,and W.Worek. Overview of the face recognition grand challenge.[J].In Proceedings of IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2005(1):947-954.
[8]T.Maurer,D.Guigonis,I.Maslov,B.Pesenti,A.Tsaregorodtsev,D.West,andG.Medioni.Performanceofgeometrix activeid TM 3d face recognition engine on the frgc data. [J].InProceedingsofIEEEConferenceonComputer Vision and Pattern Recognition(CVPR),2005(3):145-154.
[9]徐英武.多模态人脸识别系统研究[J].池州学院学报,2015 (6):32-34.
责任编辑:胡德明
Gender Categorization Based on 3D Face Data
Xu Yingwu1,2,Hu Xuegang2
(1.Anqing Vocational&Technical College,Anqing 246003,China;2.Hefei University of Technology,Hefei 230009,China)
The article proposes a novel histogram feature based on 3D facial visual codes,and successfully applies this algorithm to 3D face gender categorization.Extracting facial histogram feature based on visual codes can be divided into 2 stages,training stage and categorization stage.In the training stage,first the local texture characteristics in 3D facial data are extracted using Gabor filters to a form filter response vector set,and then vector centers,namely,3D facial visual codes are obtained through clustering algorithm.In the categorization stage,the filter response vectors are mapped to the visual codes,and the mapping results can be represented as a histogram feature vector.Gender classification is achieved by using SVM classifier based on the obtained histogram feature vector.Experimental results illustrate that our proposed visual code histogram feature achieves better categorization performance than the widely used appearance-basedfacialfeatures,suchasGaborfilterandLBPfeatures,whichdemonstratesits effectiveness and robustness for 3D face gender categorization.
3D face data;visual codes;gender categorization
TP391
A
1672-447X(2016)03-0007-004
2016-04-26
安徽省高等学校自然科学研究重点项目(KJ2016A449);安徽省高校质量工程教学研究项目(2015jyxm757)。
徐英武(1974-),安徽潜山县人,硕士,安庆职业技术学院电子信息系讲师,研究方向为模式识别。