有监督正交局部保留投影及其在人脸识别中的应用*

2014-09-13 12:43:10董昌剑陈秀宏陈达遥

计算机工程与科学 2014年8期

关键词：降维识别率人脸识别

董昌剑，陈秀宏，陈达遥

(江南大学数字媒体学院,江苏无锡 214122)

有监督正交局部保留投影及其在人脸识别中的应用*

董昌剑，陈秀宏，陈达遥

(江南大学数字媒体学院,江苏无锡 214122)

针对局部保留投影算法(LPP)的无监督和非正交问题，提出了一种有监督的正交局部保留投影算法SOLPP。该算法同时考虑了样本的类别信息以及投影向量间的相互正交性，首先利用样本的类标签信息重新定义了类内和类间相似度矩阵，同时最大化类间离散度与类内离散度之比，有效地保持了样本的局部结构；其次对投影基向量进行正交化，在保持数据空间结构的同时进一步提高了人脸识别效果。在ORL和FERET人脸库上的实验表明，该方法的识别率要优于SLPP等算法。

人脸识别；图像降维；有监督；正交化；局部保留投影

1 引言

图像降维是人脸识别中重要的预处理步骤之一，其目的是在保留人脸的主要信息的同时将高维的特征空间嵌入到一个维数相对较低的空间。根据是否使用标签信息，降维方法可分为有监督的和无监督的，其对应的两个最常用的降维方法分别是主成分分析法PCA(Principal Component Analysis)[1]和线性判别分析法LDA(Linear Discriminant Analysis)[2]。

近年来基于流形技术的降维方法吸引许多人研究，并基于不同的准则和目的提出了多种流形降维算法。He Xiao-fei等[3,4]提出了一种局部保留投影LPP(Locality Preserving Projection)的线性降维算法，并已被证实在许多应用中可以得到比PCA和LDA更好的效果。LPP的本质是一种无监督的降维方法，其主要思想是通过变换，使原始空间中相互离得近的点对在降维后的低维空间中也保持较近，从而保留原始数据的局部结构。该方法对于类内距离较近的数据能够找到好的投影方向，但当两个不同的类距离较近甚至部分重合时，则会被投影到一起，得到的结果不理想。为此，申中华[5]提出了有监督局部保留投影算法SLPP(Supervised Locality Preserving Projection)，它同时考虑了局部保留特性和类间分离性，得到了较好的投影效果。李晓曼等人[6～9]提出的基于类别信息的监督局部保留投影方法使样本点在低维空间能够同时保持流形的局部几何结构和分类信息。但是,他们都没有考虑投影向量间的正交性。LPP本身是通过求解一个不对称特征方程的最小特征值所对应特征向量得到投影向量，它并不能保证各方向均为正交的，从而导致人脸数据重建因难。Cai D[7]等提出了一种正交拉普拉斯算法，保证了向量间的正交性，但是没有考虑标签信息及类间离散度问题。

基于对上述算法的优缺点分析，并参考一些较新的改进算法[8～12]，本文将有监督的局部保留投影与正交拉普拉斯算法相结合，在同时考虑局部保留特性、类间分离性和投影向量正交性的条件下，提出一种新的有监督正交局部保留投影SOLPP(Supervised Orthogonal Locality Preserving Projection)的人脸识别算法，并在ORL和FERET人脸库上进行实验，以说明该方法优于SLPP等方法。

2 LPP算法回顾

假设样本集X=[x1,x2,…,xn]，xi∈Rm，i=1,2,…,n。数据的线性降维就是寻找一个投影矩阵A=[a1,a2,…,ad]∈Rm×d，将这些样本映射到一个低维的特征空间。在这个低维样本空间中，样本集表示为Y=[y1,y2,…,yn],且Y=ATX。变换矩阵A可通过最小化如下LPP的目标函数来得到：

其中yi=aTxi，S为相似矩阵，用k近邻法定义为：

经过简单代数计算后，可得:

aTX(D-S)XTa=aTXLXTa

上述约束问题很容易转换为一个求解特征值问题:

XLXTa=λXDXTa

在人脸识别中，LPP算法经常会遇到小样本问题，即矩阵XDXT是奇异的。为了解决这个问题，通常先对原始图像数据采用PCA降维，保证矩阵XDXT是非奇异的;然后在PCA子空间应用LPP算法。因此,LPP算法的投影矩阵A=[a1,a2,…,ad]就由矩阵(XDXT)-1XLXT的前d个最小特征值所对应的特征向量构成。

3 有监督的正交局部保留投影(SOLPP)

3.1LPP算法的缺点

LPP算法是一种非监督的降维算法，它的主要目的是使原始空间中两个距离相近的点在低维投影空间中也相距很近，这样可以有效地保持原始空间的局部结构。但是，由于LPP算法没有考虑数据中的类别信息，对于属于同一类的相近点来说，在低维空间中相距很近是合适的，但对于属于不同类的相近点来说，在低维空间中如果也保持靠近就会影响最后的识别效果。其次，降维后的低维空间的两个数据点的欧氏距离可以表示成：

如果A是正交的，则AAT=I,原始图像的空间结构就能被完好地保存。但是，由于LPP算法中矩阵(XDXT)-1XLXT是非对称的，其解也不可能是一组相互正交的特征向量，因些对数据重建造成一定困难，不能有效地保持图像的空间结构。

3.2SOLPP算法

针对LPP的非监督本质，引入有监督的处理机制，充分利用不同人脸图像的类别信息。通过上述对LPP的分析可以看出，为了获得更好的投影降维效果，不但要保留类内的局部结构，使同一类的样本点相距很近，还要最大化类间分离度，使不同类的样本点相距较远，以便得到最佳的分类特征，提高分类识别的精度。

类内局部结构的保留可通过最小化式(1)得到：

(1)

其中,W是类内相似度矩阵，Wij和LPP中的Sij相似，不同的是Sij表示的是全局样本中的两点xi和xj的相似度，而Wij表示的是同一类内的两个样本的相似程度。这样最小化式(1)就可以保证同一类内的点在投影到低维空间后相距较近。

同时，类间分离度可通过最大化式(2)得到：

(2)

其中,B是类间相似度矩阵，Bij表示不同类的两个样本xi和xj的相似程度。这样最大化式(2)就可以保证不同类的点在投影到低维空间后相距较远。这里仍使用热核来计算相似度。在SLPP 中，首先是建立类间邻接图和类内邻接图，然后分别定义了样本类内相似度矩阵B和类间的相似度矩阵W。为了充分利用样本的类别信息以及减少构建邻接图的过程，可以将其重新定义为：

因此,目标函数可重写为：

经过简单的变换后目标函数可变为：

(3)

其中,LB=DB-B,LW=DW-W是拉普拉斯矩阵。DB和DW都是对角矩阵，对角元素分别是B和W对应的列或行上的元素之和。则最大化目标函数式(3)可转化为求下面广义特征值问题的最大特征值对应的特征向量：

XLBXTa=λXLWXTa

(4)

同样，在小样本情况下，矩阵XLWXT可能会出现奇异性，因此首先对原始图像数据进行PCA降维，以保证矩阵XLWXT是非奇异的。则式(4)的前k个最大特征值对应的特征向量构成投影矩阵。

则正交基向量可通过下面的迭代方法计算得到：

Step1计算q1，q1由广义特征方程XLBXTq=λXLWXTq的最大的特征值所对应的特征向量得到。

Step2计算qk，qk通过计算方程M(k)q=λq的最大特征值所对应的特征向量得到，其中M(k)的定义如下：

最后得到正交投影矩阵U*=[q1,q2,…,qk]。

综上所述，利用SOLPP算法进行人脸识别的基本步骤如下：

(1) 为了保证XLXT是非奇异的，首先对原始人脸图像进行PCA降维处理，将高维的人脸特征通过转换矩阵投影到低维的PCA子空间中去，并求得投影矩阵UPCA。

(2) 使用热核函数建立类内相似度矩阵W和类间相似度矩阵B，并计算拉普拉斯矩阵LB=DB-B,LW=DW-W。求解下面的广义特征值问题得到初始投影基向量：

XLBXTa=λXLWXTa

(3) 采用迭代正交化方法对上面得到的初始投影基向量进行正交化，得到正交投影矩阵U*。

(5) 利用最小近邻分类法对测试图像进行分类。对于每一个投影后的测试图像，比较其与投影后的训练图像之间的欧氏距离，并决策为与其最近的图像的同类。进而通过决策的正确与否求出SOLPP算法的人脸识别效率。

4 仿真实验与结果分析

4.1ORL上人脸识别实验结果

为了验证算法的有效性，在ORL库上对本文算法进行测试，并与PCA、LDA、LPP、SLPP算法进行比较。ORL人脸库包括40个人的400幅112×92大小的人脸图片。人的脸部表情和脸部细节有着不同程度的变化，人脸姿态也有相当程度的变化，深度旋转和平面旋转达20°,人脸的尺度也有10%的变化。本文实验使用的人脸图片经剪切后大小均为64×64。图1是ORL人脸库的一些人脸照片。

Figure 1 ORL face database图1 ORL人脸库

ORL人脸库上每人有10张图片，本文用每人的前4、5、6张图像进行训练，用剩下的图片进行测试。其中变量d的值从1取到最大特征维数，最佳识别率便可通过k的不同取值来得到。表1为PCA、LDA、LPP、SLPP、SOLPP几种方法在不同训练样本数下的最佳识别率的比较。图2为训练图像为前4张时不同方法在不同特征向量维数下的识别率比较。

Table 1 Best recognition rates on ORL表1 ORL人脸库上的最佳识别率 %

Figure 2 Recognition rates of different dimension on ORL图2 ORL人脸库上不同维数下的识别率(4Train)

4.2 FERET上人脸识别实验结果

FERET人脸库由FERET项目组创建，包含200个人的1 400张人脸灰度图像，其中图像具有多姿态、不同光照环境的特点。图3是FERET人脸库的一些人脸照片

Figure 3 FERET face database图3 FERET人脸库

FERET人脸库中每人有7张图片，本文用每人的前3、4、5张图像进行训练，其余图像进行测试。实验结果如表2和图4所示。

Table 2 Best recognition rates on FERET表2 FERET人脸库上的最佳识别率 %

Figure 4 Recognition rates of different dimension on FERET图4 FERET人脸库上不同特征维数下的识别率(4Train)

4.3 实验结果分析

上述实验结果表明，本文提出的算法识别率是最高的，有监督算法的识别率要高于无监督的算法，保留局部结构算法的识别率要高于保留全局结构的算法。PCA算法的识别率最低，因为其是非监督学习算法，没有使用类标签信息。LDA是有监督学习算法，使用了类标签信息，识别率较PCA有很大提高，但是忽视了流形的局部结构。LPP具有保持局部结构的特征，它的识别率要优于PCA。SLPP在LPP算法的基础上加上类标签信息，将有监督和保持局部结构的优点相结合，识别效果要优于前三种算法。本文提出的SOLPP算法在SLPP算法的基础上，又考虑了投影向量间的正交性，更有效地保持了数据的空间结构，从而更好地提高了识别率。

5 结束语

本文结合了有监督局部保留投影和正交拉普拉斯算法的优点，提出了一种新的有监督正交局部保留投影算法，同时解决了LPP没有利用类标签信息和投影向量非正交的问题，保持了数据的局部结构和整体结构，使人脸识别的效率有了进一步的提高。最后通过仿真实验进行了验证。但是，该算法仍然是线性的数据降维方法，下一步的工作是尝试使用核函数把线性降维，扩展到非线性降维以求得到更好的识别效果。

[1] Jolloffe I T. Principal component analysis[M]. New York:Springer-Verlag,1986.

[2] Belhumeur P N,Hespanha J P,Kriegman D J.Eigenfaces vs. Fisherfaces:Recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.

[3] He X F, Niyogi P. Locality preserving projections[C]∥Proc of Conference on Advances in Neural Information Processing Systems, 2003:585-591.

[4] He X F, Yan S C, Hu Y X. Face recognition using Laplacianfaces[J]. Pattern Analysis and Machine Intelligence, 2005,27(3):328-340.

[5] Shen Zhong-hua,Pan Yong-hui,Wang Shi-tong.A supervised locality preserving algorithm for dimensionality reduction[J]. Pattern Recognition and Artificial Intelligence,2008,21(2):233-239.(in Chinese)

[6] Li Xiao-man, Wang Jing.Supervised locality preserving projection based on class information[J]. Journal of Computer Applications, 2012,32(2):531-534.(in Chinese)

[7] Cai D, He X, Han J. Orthogonal Laplacian faces for face recognition[J].IEEE Transactions on Image Processing, 2006, 15(11):3608-3614.

[8] Jin Yi,Ruan Qiu-qi.Kernel based orthogonal locality preserving projections for face recognition[J].Journal of Electronics & Information Technology,2009,31(2):283-287.

[9] Wong W K, Zhao H T.Supervised optimal locality preserving projection[J].Pattern Recognition, 2012,45(1):186-197.

[10] Zhang Liang, Huang Shu-guang, Guo Hao.A fast kernel supervised locality preserving projection algorithm[J].Journal of Electronics & Information Technology,2011,33(5):1049-1054.

[11] Shu Xin, Gao Yao, Lu Hong-tao. Efficient linear discriminant analysis with locality preserving for face recognition[J].Pattern Recognition, 2012,45(5):1892-1898.

[12] Yang Wan-kou, Sun Chang-yin, Lei Zhang. A multi-manifold discriminant analysis method for image feature extraction[J]. Pattern Recognition,2011,44(8):1649-1657.

附中文参考文献：

[5] 申中华,潘永惠,王士同.有监督的局部保留投影降维算法[J]. 模式识别与人工智能,2008,21(2):233-239.

[6] 李晓曼, 王靖. 基于类别信息的监督局部保持投影方法[J]. 计算机应用, 2012,32(2):531-534.

DONGChang-jian,born in 1991,MS candidate,his research interests include artificial intelligence, and pattern recognition.

陈秀宏(1964-),男,江苏泰兴人,教授，研究方向为人工智能和模式识别。E-mail:xiuhongc@263.net

CHENXiu-hong,born in 1964,professor,his research interests include artificial intelligence, and pattern recognition.

陈达遥(1988-),男,湖南益阳人，硕士生，研究方向为人工智能和模式识别。E-mail:404704115@qq.com

CHENDa-yao,born in 1988,MS candidate,his research interests include artificial intelligence, and pattern recognition.

Supervisedorthogonallocalitypreservingprojectionanditsapplicationinfacerecognition

DONG Chang-jian,CHEN Xiu-hong,CHEN Da-yao

(School of Digital Media,Jiangnan University,Wuxi 214122,China)

Aiming at the unsupervised and non-orthogonal property of the locality preserving projection, a supervised orthogonal locality preserving projection algorithm is proposed. The algorithm considers both of the class information and the orthogonal basis functions. Firstly, the within-class similarity matrix and the between-class similarity matrix are redefined by using the class information, the ratio of the between-class scatter and the within-class scatter is maximized, and the locality structure is preserved effectively. Secondly, the projection vector is orthogonalized, and the space structure of data is reserved as well as the effect of face recognition is further improved. Experimental results on ORL and FETER face databases demonstrate that the effectiveness of our proposed algorithm is better than other algorithms.

face recognition;image dimensionality reduction;supervised;orthogonalization;locality preserving projection

1007-130X(2014)08-1576-05

2013-01-03;

：2013-04-03

中央高校基本科研业务费专项资金资助(JUSRT211A70 )

TP391.4

：A

10.3969/j.issn.1007-130X.2014.08.027

董昌剑(1991-),男,安徽濉溪人，硕士生，研究方向为人工智能和模式识别。E-mail:723985704@qq.com

通信地址：214122 江苏省无锡市江南大学数字媒体学院

Address:School of Digital Media,Jiangnan University,Wuxi 214122,Jiangsu,P.R.China