利用测地距离的三维人脸定位算法

2018-02-13 01:28林璇玑林克正孙一迪魏颖
哈尔滨理工大学学报 2018年6期

林璇玑 林克正 孙一迪 魏颖

摘 要:针对传统的二维人脸定位,无法克服旋转、表情、姿态等因素带来的问题,同时传统定位算法的准确率较低,算法在三维人脸模型的基础上,加入测地距离,提出利用测地距离的三维人脸定位算法。首先输入待检测的三维人脸图像,对其进行维纳滤波预处理,在预处理后的图像中进行鼻尖点定位,进而找到人脸的位置,在待检测图像中标记所得到的人脸区域。算法在三维人脸库FRGC和BU-3DFE上进行实验,利用深度信息定位方法和SPIDER特征点定位方法进行对比,实验结果表明本算法的定位准确率更高,鲁棒性更强。

关键词:人脸定位;测地距离;维纳滤波;鼻尖点定位

DOI:10.15938/j.jhust.2018.06.020

中图分类号: TP391. 4

文献标志码: A

文章编号: 1007-2683(2018)06-0110-06

Abstract:The traditional two-dimensionnal face positoning unable  overcome the rotation expression posture and own a low accuracy in the location. We join the geodesic distance on the 3D face modle  and proposed the algorithm of three-dimension location using geodesic distance. We use wiener filtering to preprocess the 3-dimentional face datas for the detecting image and confirm the location of the face by finding the location of nose point in the preprocessing image called nose tip location. Then we unify the human faces to the same coordinate frame. Finally and mark the face region to be detected in the resulting image. The algorithm makes the experiment on FRGC face database and BU-3DFE face database uses the depth information positioning method and spiders feature point positioning methods for comparing. The experimental results show that our algorithm of positioning accuracy is higher stronger and has good robustness.

Keywords:face location; geodesic distance; wiener filtering; nose tip location

0 引 言

每个个体都有唯一的可以测量或可自动识别和验证的生理特性或行为方式,即生物特征。它可划分为生理特征(如指纹、人脸、虹膜、掌纹等)和行为特征(如步态、声音、笔迹等)。生物识别就是依据每个个体之间独一无二的生物特征对其进行识别与身份的认证[1-2]。生理特征是人体所固有的、不可复制的、唯一的,人脸作为人体的标志性生物特征,近年来被广泛应用于金融、司法、军队、公安、边检、政府、教育等领域,人脸识别技术已经融入到我们的生活,人脸支付、人脸考勤、人脸安全门、人脸安检等,人脸识别技术被越来越多人所熟知,同时也将应用于更多的领域,由于环境背景的变化,人脸自身表情、浓妆等变化都会对人脸识别产生一定的影响,因此,人脸识别技术还有研究的意义[3-4]。

2D人脸识别技术在过去的30余年里取得了显著的进步,但是2D人脸识别在人脸检测、定位、识别等过程受限于光照、姿态、表情和年龄的变化[5-6],目前3D成像设备和3D图像采集设备发展迅猛,研究者们将目光逐渐从二维转向三维相比于2D人脸识别,其能够更加有效地克服在现有的2D人脸识别中存在的姿态和光照等困难,因此,研究3D人脸识别已经是大势所趋[7-8]。

与2D人脸数据一样,3D人脸数据信息中也常常含有诸多噪声,例如头发、饰品、衣服和脖颈等等,这些混合在数据中的噪声对人脸识别中的特征提取和分类识别都有不同程度的影响,所以,要对3D人脸图像进行预处理,以便清除或减少图像模糊以及几何失真,进而提高其清晰度,因而它是3D人脸识别过程中至关重要的一部分[9-10]。但是目前,在3D人脸识别的研究中,大多数的研究都是通过手动的方式来进行除噪声或分割人脸区域块并进行提取[11-13]。然而,高效并且简便的人脸检测和人脸定位是迅速执行人脸识别的必要条件,本文提出利用测地距离的三维人脸定位算法,对3D人脸数據进行处理,分块提取和校正。

1 人脸数据去噪

通过采集而得到的3D人脸的原始点云数据模型中往往含有最直接的数据信息,除反映了相应点的几何信息,还反映了其纹理信息以及扫描仪器收集回波来获取的数据的强度信息,因此,本文主要以3D人脸点云数据模型为基础来进行研究,并且使用到的3D人脸数据库以及涉及到的点云数据的坐标均是以毫米为单位,即在三维坐标系中,每个点坐标分别有x,y,z 3个数据,且x,y,z 3个数据的单位为mm,它们就是该三维空间中的尺度坐标。将3D人脸点云模型投影于所对应的的二维空间,则在每一个二维空间上都有一张2D人脸图像,这些人脸点云数据模型中包含了一些噪声点或者错误点,例如,空洞和尖点就很可能存在于数据信息当中,它们通常是在采集信息的过程中,出现了数据缺失甚至是错误的情况而产生的,这些空洞或是尖点看似微乎其微,然而,它们的存在影响了人脸图像的质量和后续工作的进行,因而在人脸定位之前,必须采取高效的方法施加于原始点云数据模型之上,以便后续工作的进行。为了读者理解起来更加方便,将原始的人脸图像分别在XY平面、XZ平面和YZ平面进行投影,原始的人脸图像和投影后的人脸图像如图1所示,其中图像(a)是XY平面投影图像,相当于人脸的正面投影;图像(b)和(c)分别是XZ平面和YZ平面的投影图像,相当于人脸的侧面投影,图像(d)表示的是原始的人脸图像。

在实验过程中,我们往往将彩色图像转化成灰度图像或者从含有灰度图像的人脸数据库中选取图像,但仍然掩盖不了由于某些不确定的因素所造成的噪声在图像上留下的痕迹,更有甚者,会让人们无法辨认出图像中的关键部位,此时,就需要把某些已经含有噪声的检测图像在噪声的去除与图像特征的保留上进行折中,经过处理后,获得近似原始图像的检测图像,所以选择一种有效的去噪方法尤为重要。然而,图像处理中存在很多种去噪声的方法,例如,中值滤波、平均滤波等,但是并不能够说出某种方法的去除噪声的效果是最好的,因为它们是各有所长的,只能说它们滤除噪声的时候所针对的噪声对象是不同的,以及使用者想得到的结果也是不相同的,因而,不同的去除噪声的方法所发挥的效果自然各有不同。本文选择改进的维纳(Wiener)滤波方法对人脸图像来进行去噪,该方法不但能够高效地去除干扰噪声和尽量地保持原图像的边缘信息,而且可以在面部主要特征的周围获得更好的清晰度,例如眼睛,鼻子还有嘴。

Wiener滤波方法归属于一种低通滤波方法,它也是一种最小均方误差的滤波方法。在这里,我们选择使用Wiener滤波对z分量进行去噪。在使用Wiener滤波处理的过程中,对于被处理的图像上的每一个像素点,均是在从像素的局部领域估计的统计信息上使用了自适应Wiener滤波方法。为了更好地去应用此种滤波方式,在XY平面上,我们使用一个以当前点为中心且尺寸为4mm×4mm的窗口。让μ和σ2分别表示位于当前窗口内的z分量,那么就有式(1)和式(2)。

此外,我们还尝试使用了其他的低通滤波方法,例如,中值滤波和平均滤波等方法,它们所得到的效果均不相同,如图2所示,即为不同滤波方法处理人脸噪声图像所得到的效果图。

对于维纳滤波、中值滤波和平均滤波这三种滤波,为避免实验用具等外因产生对此比较实验的干扰,我们选取同样一张人脸图像如图2中的(a)所示,经过简单的转换后,得到(b),在图像中加入相同量的高斯噪声,如图2中的(c)所示,然后分别采用上述3种滤波方法对其进行滤波,得出不同的效果图,分别如图2中的(e)、(f)、(g)所示。显而易见,维纳滤波的效果要好于另外两种滤波方法,经比较,最终得出结论,Wiener滤波可以在面部特征周围获得更好的清晰度(即眼睛,鼻子和嘴)。

2 利用测地距离的三维人脸定位算法

2.1 鼻尖点定位

在人脸图像上,鼻尖部位通常深度最小,很容易通过检测得到,常用于定位人脸。然而,在一些人脸图像中,由于头部的出平面旋转或者是在脸部存在头发等外物时,将会导致具有最小深度的点不会与鼻尖点对应。为了验证这个点是否是真正的鼻尖点,在这里,我们采用PCA技术进行描述。在该方法中,先用一组训练鼻间区域构造一个PCA空间,然后,如果该区域与它映射到该空间的投影的距离小于一个阈值,就证实了它是一个鼻区域。

在实验中,首先,我们直观地验证了位于一些图像上的鼻尖点,即40张人脸主体上的鼻尖点;然后,我们进行下一步裁剪,以验证的鼻尖点为中心,半径为60mm的球形里的3D人脸上的点;此后,裁剪后的点的z值在一个均匀矩形网格上重采样,且这些网格在一个分辨率为1mm的XY平面上,其中,矩形网格是以鼻尖点为中心的,它们的x轴的范围是从-30~30mm,y轴的范围是从-20~50mm;最终,鼻尖区域的图像如图3所示,最终得到的这些图像也构成了一组鼻间区域的训练图像。

在鼻间区域的训练图像上,应用PCA来构建一个PCA空间,因为这个区域代表了鼻间区域的空间,因此,我们称它为特征鼻间空间。为了使用PCA,采用深度值的列连接,构成了用于每个鼻间区域的训练图像的向量表示。特征鼻间空间是由平均鼻间空间表示的,即训练鼻间向量的集合和协方差矩阵的一组主要特征向量的均值。

为验证一个点是否是真正的鼻尖点,我们先来裁剪和重采样如上所述的点及其周围的区域。然后,我们将候选区域的向量映射在特征鼻间空间上,进而获得了候选向量x在特征鼻间空间的投影,其中,u1…k是对应于 k个协方差矩阵的最大特征值的归一化特征向量,且其中n指的是鼻子。如果候选向量及其投影之间的重建误差小于某个阈值,经过多次试验,这里我选取数100作为这个阈值,我们就可以确定它为鼻尖点,如若不然,那么下一个具有最小深度的点就会被挑选出来并且对其进行测试,此后会一直重复这个过程,直到检测出鼻尖点Ntop。

2.2 人脸分割

分割图像就是由广义图像通过将其元素聚集成可能与图像中有意义物体相联的集合而得到的。上一小节已经找到了鼻尖点的位置,这里要通过已经找到的鼻尖点位置来判断出人脸所在的区域,然后对原始的图像进行分割。以便经过该处理过程之后,使后续研究所使用的人脸图像是不存在过多冗余数据信息的人脸范围区域。通过参考大量的文献和实际分析知道,人脸不是一类具有纯刚性的物体,所谓刚性,即坚硬且不容易发生形变,而众所周知的是人脸的形变是随着面部表情的变化而产生的。有一些研究者把由表情变化产生的人脸形变当作一种等距变换,认为这种类型的变换不会改变人脸的曲线,提出了使用欧式距离作为进行相关研究的度量,降低了最终结果的准确率,因为欧氏距离表示的是点与点之间的直线距离,而形变的大小程度已经改变原有的欧式距离的长度,与原有测得的欧式距离偏差较大。

有些专家学者对一些数学描述进行研究,试图找到一种数学描述并使得其与人脸表情变化没有关联,首先,这些研究者人工地在人的面部上标记133个Mark点,并实测人脸的表情变化与点之间距离变化的关系,跟踪并记录,统计的结果表明,人脸表情发生变化,其测地距离变化量甚至不到欧氏距离变化量的二分之一,所得到的结果肯定了测地距离应用于人脸曲面上是具有优越性的,因此,这里采用测地距离来进行人脸分割。

测地距离的定义为:令网格M相接近于人脸S,那么在网格M上,任意的ni与nj两个顶点之间的测地距離d(ni nj)表示成式(4)的形式。

2.3 人脸姿态归一

想要方便后续的人脸识别实验,就需要我们把人脸模型放到同样的坐标系里面,在这个坐标系中,鼻尖点Ntop与这个坐标系的原点重合,人脸模型的上下走向与Y轴方向是一致的,人脸的法向方向与Z轴方向是一致的,X轴的方向与右手定则确定的方向是一致的。

首先,平移坐标系的框架,令坐标系的原点与人脸上的鼻尖点Ntop重合;然后通过旋转,令Z轴的方向与人脸的法向方向一致,再令Y轴方向与人脸上下走向一致,且其是在鼻梁对称面上的,最后利用坐标系右手定则就确定了X轴的方向。

综合上面几个小节所述,改进的人脸定位过程如图4所示。

3 实验结果与分析

本文在三维人脸库FRGC V1.0和BU-3DFE,利用本文算法与传统定位算法进行比对,从而验证本文算法的有效性。

3.1 滤波效果分析

本文采用维纳滤波方法分别对三个不同的人脸数据模型进行去噪,图像被去噪后的效果图如图5所示。(a)表示的是不同的原始图像,(b)表示的是与每个原始图像所对应的经过维纳滤波后的图像。

从图5中的(a)和(b)两组图像中可以看出,在眼睛,鼻子和嘴部等区域的滤波效果明显,由此可以得出,Wiener滤波可以在面部特征周围获得更好的清晰度。

3.2 人脸定位结果分析

本文选择在FRGCv1.0和BU-3DFE这两个三维人脸库上进行实验。首先在人脸数据上施加初步预处理,然后采用不同的人脸定位算法对人脸进行定位,使用本文提出的方法和传统的定位方法进行多次实验,记录实验结果并进行比对分析。

首先在FRGC的3D人脸数据库上进行实验,但是FRGC数据库的版本分为ver1.0和ver.2.0两种版本,本文选择在FRGC v1.0数据库上来进行实验。FRGCv1.0中包含276人,他们属于不同的种族,且他们的年龄和性别也都不相同,并且拥有不同的肤色和表情,展现了形态各异的人脸图像,为研究者研究人脸识别提供了相对全面的人脸数据信息,给后续应用算法和分析算法提供了平台和便利。

在FRGCv1.0数据库上实施实验,随机无规则地选择出数目不相同的三维人脸来参与实验,通过实验,测试了人脸定位准确率随着测试样本数据量变化而发生的变化。

FRGC v1.0里一共包含了900多张人脸图像,考虑到记录的便利性,这里随机地选取整数个数的人脸进行实验,分别是用200、400、600和800张人脸作测试样本来操作实验。为验证所提出人脸定位方法的有效性,把本文方法同传统的方法进行比较,即与深度信息定位方法和SPIDER特征点定位方法来进行比对,对比结果图如图6所示,每组测试样本结果的详细信息见表1。方法一表示深度定位信息方法,方法二表示SPIDER特征点定位方法。本文方法表示基于测地距离的三维人脸定位方法。

由于实验中选取多组不同的样本数量来做实验,其得出的结果较多,在表1中就不依次列出,仅列出样本数为整数的实验结果数据。

跟随测试样本的数量增加,各种干扰信息也会增多,从图6中三条曲线的高低,可以明显看出,深度信息定位算法的人脸定位准确率是要低于另外两种方法,并且人脸定位准确率随测试样本数目增加而呈现不稳定的变化,甚至准确率会有所下降;结合表1中的数据,使得结果更加清晰明了,可以得出,SPIDER定位方法比深度信息定位方法的鲁棒性好,但是从整体上看,准确率仍低于本文方法,因此,相比于深度信息定位和SPIDER方法,本文方法在测试样本数量增加的情况下,鲁棒性更强,人脸定位准确率更高。

为验证该算法的适用性,在BU-3DFE人脸库上使用上述的方法再次进行实验。BU-3DFE数据库里有男有女,总共包含了100个人的人脸图像,这些被采集的人同样是来自不同的种族,肤色各异,且每个人又对应着25张带有不同表情的人脸,为实验提供了大量的研究数据。为充分地且简便地应用数据信息,从2500张人脸图像中选择整数个数的人脸进行实验,分别用500、1000、1500、2000张人脸作测试样本,同样地,把本文方法与另两种方法作比较,详细信息见表2。方法一表示深度定位信息方法,方法二表示SPIDER特征点定位方法,本文方法表示基于测地距离的三维人脸定位方法。由于实验中选取多组不同的样本数量来做实验,其得出的结果较多,在表2中就不依次列出,仅列出样本数为整数的实验结果数据,对比结果如图7所示。

跟随测试样本的数量增加,各种干扰信息的增多,人脸定位准确率在不断变化,从图7中的曲线高低和走势可以看出,深度信息定位算法的准确率随测试样本数目增加呈现出不稳定的变化,准确率会出现下降的情况;结合表2中的数据,结论更加清晰可见,SPIDER定位方法相比于深度信息定位方法准确率较高,从整体上看,本文方法在测试样本数量增加的情况下优于另外两种方法。

表3中记录了不同方法在两个不同的人脸库上的定位准确率,将数据进行了对比,进一步验证基于测地距离的人脸定位方法的有效性。明显地,如果样本的数量增多,数据信息就必然会增多,这就会给定位带来相应的影响,从表中3可以看出,不同的方法在两个不同的人脸库上,随样本数量的不同,定位的准确率也有所变化。但从总体上,与另外两种方法相比,基于测地距离的人脸定位方法能更好地排除更多信息带来的干扰,定位准确率也相对较高,并且有较好的稳定性。

本文利用3种方法在两个人脸数据库实验,实验结果表明,无论在哪个人脸库上操作实验,本文方法都要比另外两种方法更优,更能克服信息增多,表情增多等影响因素,也更稳定,定位更准确。

4 结 语

对于人脸识别过程中的输入图像,一般有噪声、表情、姿态等影响,因此,本文首先对输入人脸进行去噪处理,从而解决噪声问题。其次,二维人脸识别的输入图像是三维的人脸在二维的空间上的简约投影,产生的二维图像对姿态及表情十分敏感,本文利用脸部曲面的显式三维表达做输入图像,得到更丰富的人脸信息,同时对人脸区域进行归一化处理,从而准确的找到人脸中的鼻尖点。再利用测地距离提取到鼻尖点相同距离的点组成的区域,对采样点进行局部描述,与人脸库中的数据进行比较,准确找到人脸的位置。实验结果表明本算法能克服表情增多等影響因素,实现了更高的人脸准确定位并具有较好的鲁棒性。

参 考 文 献:

[1] 穆新亮. 基于混合核函数的快速KPCA人脸识别算法[J]. 电子科技 2015 28(2): 46-50.

[2] 林克正 王浩 辛晨. SIFT算法的相似性度量优化[J].哈尔滨理工大学学报 2012 17(3): 78-82

[3] 张石请 赵小明 楼宋江. 一种局部敏感的核稀疏表示分类算法[J]. 光电子激光 2014 25(9): 1812-1817.

[4] 梁礼明 钟震 陈召阳. 支持向量机核函数选择研究与仿真[J]. 计算机工程与科学 2015 37(6): 1135-1141.

[5] 马小虎 谭延琪. 基于鉴别稀疏保持嵌入的人脸识别算法[J]. 自动化学报 2014 40(1):73-82.

[6] 陈幼芬 宋海生. 一种鲁棒性强的光照人脸预处理算法[J]. 科技通报 2014 30(11): 168-172.

[7] 陆焱 惠巧娟. 改進的统计模型三维人脸特征点标定算法框架[J]. 计算机工程与应用 2016,52(24):166-170.

[8] 赵泉华 高郡 李玉. 基于区域划分的多特征纹理图像分割[J]. 仪器仪表学报 2015 36(11):2519-2530.

[9] SUN Y WANG X TANG X. Deeply Learned Face Representations are Sparse Selective and Robust[J]. Computer Science 2015:2892-2900.

[10]WU T TURAGA P CHELLAPPA R. Age Estimation and Face Verification Across Aging Using Landmarks[J]. IEEE Transactions on Information Forensics & Security 2012 7(6):1780-1788.

[11]LENC L KRAL P. Automatic Face Recognition System Based on The SIFT Features[J]. Computers and Electrical Engineering 2015 456: 256-272.

[12]HAN T L LIU G W CAI H et al. The Face Detection and Location System Based on Zynq[C]// the 2014 10th international conference on natural computation. 2014:835-839.

[13]PEREIRA C J TEATINI E O SARCINELLI M. Face Tracking in Unconstrained Color Videos with the Recovery of the Location of Lost Faces[J]. IEEE Latin America Transactions 2015 13(1):307-314.

(编辑:温泽宇)