一种基于VEI的人脸识别的方法

2014-07-09 16:04吴雪刚赵爽文蒋丽鲁银芝

科技创新与应用 2014年20期

吴雪刚赵爽文蒋丽鲁银芝

摘要：人脸识别是模式识别中的重要研究领域之一。受到the Variation Energy Image（VEI）成功的启发，我们将VEI方法应用于对人脸特征进行有效的提取。使用此方法就可以从训练样本中找到一幅特征图。而且这个特征就是差别最大的特征。于是，根据这个特征图，我们去除掉特征图中相对应的像素。使得原来的训练样本，变得更加接近自己类的特征。待测试样本，在进行比较时，也去掉特征图的像素。最后使用Linear Discriminant Analysis（LDA）方法得到特征子空间，测试样本投影到特征子空间上的一个最近的L2范数距离，作为分类的标准。提出的方法与传统的LDA方法进行比较，得到了较好的实验效果。

关键词：人脸识别；LDA；VEI；Discriminant

现在的模式识别领域之中，生物特征识别已经成为重要的研究领域。而且，很多研究成果已经用于实际的使用，并取得了很好的效果。比如说，人脸识别、指纹识别、虹膜识别、手形识别、掌纹识别、签名识别以及步态识别都取得了较好的进展。其中，人脸识别成为近几年中国内外学者争相研究的一个热门领域。

人脸的生理结构[1]包括骨骼、肌肉和皮肤。人脸的总体结构是由骨骼确定的。人的头颅本身不能活动。头骨的突起和凹陷，会形成头部形体的变化，是表现造型特征的主要部位，尤其象隆起的骨点，是人脸表现的重要标志。人的下颌呈马蹄形，上端与颞骨部分连接，通过咬合肌作用，可以上下活动。这样，一个人的面部就相应的固定了。头部的肌肉影响着表情的变化。颅骨处于相对固定的状态，而位于头骨上的肌肉却富有变化，会呈现各种形状，牵动着人的头部运动和脸部上表情的产生。面部肌肉分为运动肌和表情肌两大类，运动肌主理下颌骨的活动，如咬肌、唇三角肌、下颌骨肌、颞肌等；表情肌主理面部的表情，如额肌、皱眉肌、眼轮匝肌、上唇方肌、口轮匝肌、下唇方肌等。这样，由于人脸表情肌肉丰富，所以各种肌肉的相互配合会产生许多的表情。在这种情况下，研究对人脸识别的研究就具有很大的难度。通过上述的说明，我们了解到人脸识别具有长期性和研究的艰巨性。

现有的人脸识别方法主要是二维的人脸识别，通常把一幅人脸图片拉成一个向量，然后把训练样本的这些向量排成一个矩阵。比较经典的方法包括Principle Component Analysis（PCA）[2][5]，Linear Discriminant Analysis（LDA）[3]。其中，PCA方法是通常所说的主成分分析方法，是找到一个正交投影的子空间，使得每个训练样本在其上的投影具有最大的方差。LDA方法是通过一个目标函数，这个目标函数要找到一个子空间，使得属于不同类的样本在其上的投影满足同类样本具有较小的方差而异类样本具有较大的方差。上面所述的方法通常被叙述为线性的判别方法，这些方法与核方法（kernel method）相结合就具备了非线性的特征。流形-作为一种非线性假设，在人脸识别方法中也起到了较大的作用。我们从这些方法中可以得出结论，为了认知，人类以自己的认知方式或者使用简单的认知方式用于人脸识别。从而有了线性和非线性的假说，并在此基础上，形成了众多的模式识别方法。无论怎样，我们注意到属性特征提取，是模式识别中的重要前提。受到近期的行为识别中VEI方法[4]成功的启发，我们将此方法用于人脸属性特征的提取。然后，每一类形成自己的一幅特征图，这个特征图是以一个向量的形式存在。有待测试图像过来的时候，我们求出待测试向量和每类特征向量的二范数距离，找到最小的距离进行分类。

1 LDA人脸识别方法

假设原来样本空间的维度为n维，考虑有c类的情形。类间散步矩阵为Sb，类内散布矩阵为sw，它们的定义如下：

这也是所有样本的协方差矩阵。

LDA算法的目标函数为：

其中，W就是我们要求的最符合目标函数的子空间。

2 VEI行为识别方法

论文[1]提出了VEI方法提取行为识别中目标一个目标在一个周期的标准差。

最后的VEI模型定义为：

3 本文使用的方法

我们将VEI方法与LDA方法相结合应用于人脸识别。

其中，分别求出每个像素对应的均值与标准差，然后计算人脸图像的VEI图，如下，

其中，mi（x，y）对应于第i类的每个像素的均值，（x，y）为相应的位置坐标。Si（x，y）为第i类的每个像素的标准差，这是个统计量，每个样本减去均值过后的平方最后在除以总数量减一，再开方得到的。图1，是我们得到的VEI脸以及根据一定的阈值去除掉较大的VEI值留下的一幅训练样本的人脸。

这样，我们就得到了新的经过VEI处理过的类样本集。然后，我们使用LDA方法得到這些新样本集的优化子空间。最后，将测试样本经过VEI方法处理后，在映射到LDA优化子空间进行分类。

4 方法分析

由于使用了VEI方法，我们去除掉在同一类中方差比较大的像素，并保留了具有稳定判别力的样本像素。这样，就使得对人脸的分类更具有鲁棒性。对一些离群点，进行了有效的处理。

5 实验结果

本文使用了Yale人脸数据库[6]进行试验，本数据库包括15个人，每人11张图像。我们对其进行了处理，修剪成32×32像素大小。本方法与LDA方法进行了50次试验进行的比较。

从上面的试验，可以看出我们的方法要好于原来的LDA方法。上面括号外面的是平均识别率，括号里面的是做过50次试验的方差。可以将本方法用于工程当中，这要好于传统的方法，时间和空间上不会有太多的耗费。

参考文献

[1]解剖学技术[M]. 人民卫生出版社， 1997.

[2]Abdi H， Williams L J. Principal component analysis[J]. Wiley Interdisciplinary Reviews： Computational Statistics， 2010， 2（4）： 433-459.

[3]Ye J， Janardan R， Li Q. Two-Dimensional Linear Discriminant Analysis[C]//NIPS. 2004， 4： 4.

[4]He W， Yow K C， Guo Y. Recognition of human activities using a multiclass relevance vector machine[J]. Optical Engineering， 2012， 51（1）： 017202-1-017202-12.

[5]Yang J， Zhang D， Frangi A F， et al. Two-dimensional PCA： a new approach to appearance-based face representation and recognition[J]. Pattern Analysis and Machine Intelligence， IEEE Transactions on， 2004， 26（1）： 131-137.

[6]Yale face database： http：//vision.ucsd.edu/datasets/yale_face_dataset_original/yalefaces.zip