稀疏投影在人脸识别中的应用研究

2020-02-02 06:46隋在娟

电子技术与软件工程 2020年15期

隋在娟

（三星电子（中国）研发中心江苏省南京市 210012）

近年来，在统计学，信号处理、图像处理等领域中，稀疏问题得到广泛的研究，并已经成功地应用于解决很多实际问题。稀疏表示可以去掉冗余信息，用很少的数据来表示出图像绝大部分的重要信息，因此图像稀疏表示算法已成为近年来图像处理领域中的研究重点。同样稀疏问题也被用在信号处理中，在信号处理领域中，稀疏问题的研究在于表示和压缩信号，在给定的超完备字典中用尽可能数量少的原子来表示信号，从而使人们更方便进一步对信号压缩，编码等。同样，人们也一直探索稀疏方法在人脸识别方向上的应用。本文在稀疏算法的基础上，进一步研究将稀疏表示应用于人脸识别与分类，为了验证算法的有效性，在AR 和CAS-PEAL 人脸库进行识别效果验证，实验结果表明，稀疏投影用于人脸识别正确率比传统的算法有明显的提升。

1 人脸稀疏表示模型

给定一定的人脸数据集X=[x1,x2,...,xn]，这里的n 是样本总数，xi是某一个人脸的二维图像列向量化得到的一维向量。因为任意一个人脸样本可以用相同类的其他人脸样本线性表示，所以，若稀疏表示用的完备字典选用训练所用的全部人脸图像来组成，即任意一个样本由总的样本集来表示的话，通常其他不相关样本的贡献理论上为零，只有与该样本相关的同类的其他样本才可以在构造中发挥主要作用。也就是说，将任意样本xi由所有样本集来线性表示如下：

图1中等号左边是某个待表示的人脸图像样本xi，中间12 张人脸表示去除该样本xi后的剩下所有人脸图像构成的字典（该样本集字典大小为12，最上面一排4 个样本与选定样本xi是同一类），最右部分线段图表示左边男性人脸样本由完备字典中所有其他样本重构得到的稀疏系数。从右边稀疏系数图可看出，与左边特定样本相关性最大的是前几个样本（即同一类），它们对重构做出主要的贡献。

现将重构后的样本表示为，稀疏系数矩阵表示为A，则所有重构样本的过程可以表示为公式：Y=XA。其中，通过下面公式计算得到重构系数集合：

其中||·||0表示用来计算向量中非零元素的个数，数学上称之为向量的L0范数。如果字典足够大，那么中零元素个数相对较多，非零数目就相对较少，所以就越稀疏。

在实际应用中，L0范数本身不容易有一个很好的数学表示形式，给出上面问题的形式化表示是一个很难的问题，故被认为是一个NP 难题。实际中都不是直接求L0范数，而是转换成高阶范数，在足够稀疏的情况下，上述L0范数的求解可以用L1范数的求解来代替，两者得到的解几乎等价。所以对于公式（2），可以将0 范数的最优求解转换到1 范数的最优化问题：

图1：人脸稀疏表示示意图

图2：AR 数据库识别率对比展示

图3：CAS-PEAL 数据库识别率对比展示

实际中有很多成熟的快速求解最小化L1范数问题，包括有梯度投影，增广拉格朗日等解法，因此系数稀疏求解问题得到解决。

2 稀疏保留投影

基于稀疏表示理论提出的一种特征提取的方法稀疏保留投影(SPP)，它和很多保留结构信息的降维方法不同，SPP 是在流形稀疏表示框架下，构建数据集的紧邻权重矩阵，以保留样本的稀疏重构关系。它的目标是获得一个线性投影空间，使样本之间的全局重构关系得以在低维空间中保留。这种方法因为不需要提前知道类别信息，因此属于无监督的人脸识别方法，但是稀疏表示有其自然的不俗的鉴别力，即一幅人脸图像的最紧凑的重构表示绝大部分来自于相同的类。它无需选择任何模型参数，具有很强的适应性和灵活性。

SPP 的第一步是前面介绍的公式（3），用L1范数最优问题求解得到稀疏重构系数矩阵A。之后，SPP 的目标是求如下公式（4）最小化问题，就是要寻找最优的W 投影空间，使初始图像在W 投影空间投影和重构样本在W 投影空间中投影，且保证投影后二者的差值最小：

简化展开可得：

设e 为N 维单位向量，则上式可以写成：

下面给出SPP 算法用于人脸识别的步骤：

（5）选择合适的分类器进行分类。

SPP 有很多优点，比如它是线性的，所以out of sample 的问题随之被解决；不需要解决模型参数问题；同时数据的局部属性得到大部分保留。所以它很容易在其他有监督或半监督的人脸识别方法中得到使用和拓展，并同时得到较好的其他衍生方法。

3 实验结果

我们选取了两个人脸库：AR 库和CAS-PEAL 库上进行实验，我们将稀疏保留投影同另外的两个经典的人脸分析方法：PCA 和LDA 的分类正确率进行对比，同时我们还对实验结果进行了详细的数据分析。

3.1 AR数据库实验结果

AR 数据库包含126 个人，其中男性70 名，女性56 名，一共约4000 幅人脸彩色照片。这4000 张图像是不同的光照明暗、光照方向，不同人脸表情神态，不同遮挡物下的正面人脸图像，它们拍摄于不同时期。由于相机采集到的原始人脸图像维数比较高，直接使用该图像库所需的计算量超过了目前普通计算机的处理能力，所以使用处理过后的图片集（包括119 个人，每人26 个图片，每幅图像有256 个灰度级别，图像的分辨率压缩至60×60 像素）组成一个新的AR 人脸库。

在本实验中，我们随机地从每个人的所有图片中选取6 个图像样本作为训练样本，剩余的20 个为测试样本，并且为了公平起见所有的方法运行20 次。识别率对比结果如图2。

图2可以看出，总体说来，两个经典的人脸识别方法PCA 和LDA 在该人脸库的识别率基本上都输给稀疏保留投影SPP 方法，我们将20 次的结果求出平均值：PCA 平均识别率76.35%，LDA 83.44%，SPP 86.13%。在AR 库中SPP 比对比方法至少高了2.69（86.13%-83.44%）个百分点，说明稀疏投影成功应用到人脸识别中，并且识别效果比传统的两种人脸线性鉴别算法好。

3.2 CAS-PEAL实验结果

CAS 人脸数据库由中国科学院制作，包含了106 个人，每人10 张图像。此数据库的特点是各个图像是在光照条件有很大差异的情况下拍摄的。每张图像大小是120×90，每幅图像256 个灰度级。我们将图像分辨率压缩成60×45 像素大小。

本实验在CAS-PEAL 库上选取5 个训练样本，剩余的5 个为测试样本，并且为了公平起见所有的方法也运行20 次。识别率对比结果如图3。

图3可以看出，稀疏保留投影SPP 方法在该人脸库的识别率也基本上都超过了PCA 和LDA 人脸识别方法，我们将20 次的结果求出平均值：PCA 平均识别率79.65%，LDA 84.52%，SPP 88.18%。在CAS-PEAL 库中SPP 比对比方法至少高了3.66（88.18%-84.52%）个百分点，识别效果有了更进一步的提高，说明稀疏投影总体优于传统人脸线性鉴别方法，达到了我们预期的效果，是一种可行的和有效的算法。

4 结束语

本章着重介绍稀疏理论，研究了稀疏投影在人脸识别上的应用。稀疏投影使人脸样本之间的全局重构关系得以在低维空间保留，因此优于传统算法，文章将它与传统的人脸识别方法作对比，实验结果表明有效的提高了人脸识别率，可见稀疏投影在人脸识别中也可以成功运用，并打开了人脸识别领域的新思路。