基于字典优化的稀疏表示人脸识别

2014-08-06 02:08熊承义汪淑贤高志荣
关键词:字典人脸人脸识别

熊承义,汪淑贤,高志荣

(1中南民族大学 电子信息工程学院,武汉430074;2中南民族大学 计算机科学学院,武汉430074)

鲁棒性自动人脸识别是当前模式识别与计算机视觉领域的研究热点.近年来随着压缩感知理论[1,2]的兴起,一种基于稀疏编码模型的人脸识别方法得到了国内外学者的广泛关注.Wright等[3]首先提出了基于稀疏表示分类的人脸识别算法(SRC),将所有训练样本组成的过完备字典线性紧凑地表示待测样本,并通过最小残差的方式进行分类.实验证明在图像严格对齐的条件下,SRC对存在亮度变化、噪声、遮挡的人脸图像具有良好的鲁棒性识别效果.但因光线强度的变化、用户不配合等情形,实际环境获取的图像可能存在不同程度的干扰成分,破坏了图像的可分离特性及判别能力.在SRC算法中,Wright[3]采用单位矩阵扩充训练字典的方法实现遮挡/噪声图像的识别,但计算复杂度较高.针对此,Meng[4,5]和文献[6]提出稀疏约束框架下的字典模型以解决遮挡问题, 且提高了计算速率;Aharon[7]提出K-SVD字典学习的方法,使得稀疏编码拥有鉴别能力的结构化字典.由此表明,字典的好坏影响着稀疏编码图像分类的性能.然而,上述训练字典的设计建立于“非干净”的图像上,而且直接用于传统的特征提取方法进行简约降维和稀疏表示,并不能获得最优的特征表达.因此,寻求一种有效滤除训练字典中干扰成分的方法尤其重要.文献[8]提出了鲁棒性主成分分析(RPCA),逐步形成低秩矩阵恢复的思想[9,10],并能成功运用于人脸图像分类.Chen[11]和Li[12]尝试采用结构非相关性的低秩矩阵恢复、低秩正则化的可判别字典学习方法嵌入稀疏表示分类中,验证了低秩矩阵恢复对字典优化的可行性,有效地提升了稀疏编码的识别性能.

字典的优化设计获取了优异的人脸特征,而存在表情、部分遮挡的人脸图像仅依存于稀疏表示分类,并不能突显其在特征低维上识别的正确性.针对此,Lu[14]和Guo[15]分别提出了基于位置加权的稀疏表示分类(GWSRC)方法,将待测样本和训练样本间的相似性嵌入线性稀疏编码模型,有利于识别性能的提升.但其全局相似性缺失了非受控图像真实的位置关系,使得全局加权的稀疏编码分类存在弊端.因此,为保证特征的优化表达和图像分类的正确性,本文探讨了一种基于低秩矩阵恢复的字典优化设计方案,并基于此优化字典结合分块相似性先验对待测样本进行分类.测试结果表明,通过改进字典的判别能力,系统极好地抑制了非受控因素的影响,其稳健性得以有效提升.

1 稀疏表示分类算法

y=α1,1d1,1+ …+α1,n1d1,n1+…+αi,1di,1+ …+

αi,nidi,ni+…+αc,1dc,1+ …+αc,ncdc,nc.

(1)

令x=[α1,1,α1,2,…,α1,n1,…,αi,1,αi,2,…,αi,ni,…,αc,1,αc,2,…,αc,nc],若y隶属于第i类,则只有对应于第i类训练样本集的表示系数不为零,其余系数均近似或等于零,此时系数x可表示为:x=[0,…,0,ai,1,αi,2,…,αi,ni,0,…,0]T.式(1)进一步由训练字典D和系数x线性表达:

y=Dx.

(2)

由压缩感知理论可知,在x足够稀疏的条件下,可以转化为最小l1范数计算式(2)的最优稀疏解,如式(3):

(3)

2 基于字典优化设计的稀疏表示人脸识别

2.1 基于低秩矩阵恢复的字典优化

字典的设计是进行稀疏编码图像分类的重要因素之一.当训练样本为“干净”的图像时,则组成质量优异的字典,有助于稀疏编码稳健性的提升;反之,当训练样本存在不同干扰成分时,字典的质量明显降低,势必影响稀疏编码的稳健性和识别效率.在实际场合中,因外界环境的非受控性及个体本身的不配合性,获得的人脸图像常混合光照/表情变化、遮挡、污损等干扰,严重增加了训练字典的冗余误差,且不能完整显示图像本身的低秩结构.因此,探讨一种恢复人脸图像低秩子空间的方案对字典的优化设计具有重要的意义.

在低秩矩阵恢复理论的基础上,将其用于人脸图像的低秩子空间恢复,并建立相应的数学模型.假设c个不同类的训练样本基矢量组成字典D=[D1,D2,D3,…,Dc]∈Rm×n,对D进行分解,则有:

D=A+E,

(5)

式(5)中A对应于人脸图像的低秩结构成分,E对应于人脸图像中的光照/表情、遮挡等干扰成分,为拥有多个非零元的误差矩阵.此时可以采用l0范数加以描述:

由压缩感知理论和矩阵秩最小化理论可知,式(6)中的非凸优化问题可以松弛为基于l1范数的凸优化问题,秩可转为核范数问题,即有:

为验证上述思想对改进字典稀疏鉴别能力的有效性,本文从AR人脸库中选取包含光照、表情、围巾/眼镜遮挡的同类样本图像进行实验,如图1所示.可以看出,A以高概率恢复了“非干净”样本图像的可靠特征,获得了相对“干净”且具备稀疏判别能力的字典集.

图1 低秩矩阵恢复图例Fig.1 The example of low-rank matrix recovery

为进一步实现人脸特征的优化表达,本文将以低秩矩阵A为对象进行主成分分析的特征提取,构建判别能力更强大的特征脸空间.图2展示了基于两种不同训练集的特征向量空间.可以直观地看出,基于低秩成分A的特征空间更清晰,这意味着低秩成分相对于原始训练字典,更有利于人脸特征的优化表达.

图2 特征脸空间对比Fig.2 Comparisons of the feature space

2.2 基于字典优化设计的稀疏表示人脸识别

对于存在光照/表情变化、遮挡/伪装的人脸图像,Lu[14]和Guo[15]基于位置加权的稀疏编码分类存在一定的弊端.因此,在字典优化设计的基础上,稀疏编码稳健性的进一步提升需要寻求有效的位置结构信息.本文在分类决策上,采用改进的位置先验信息,首先通过非重叠分块的方式寻找判别能力较强的人脸局部特征,由训练样本和测试样本对应分块的最大相似性衡量图像间的位置关系,进而嵌入稀疏编码实现人脸图像的分类.综上所述,本文基于字典优化设计的稀疏表示人脸识别方法可描述如下:

Step1 输入包含干扰成分的原始训练字典D和待测试样本y,并将二者的每个列向量归一化至l2单位范数.

Step2 采用低秩矩阵恢复方法对字典D进行优化,获得近似D的低秩结构A;

Step3 以A为对象进行基于主成分分析(PCA)的特征提取,获得最优表达的特征脸空间M,实现D与y的降维:Dk=D*M;yk=y*M;

3 实验结果与分析

3.1 参数设置

实验选取AR人脸库的50名男性和50名女性,每个目标包括session1、session2两个部分,各部分包括7个正面无遮挡、3个戴眼镜、3个戴围巾的13幅图像.图像尺寸由原始165×120像素裁剪为60×43像素大小.本文测试分两种情况.

(1) 训练图像中存在围巾遮挡.训练字典由每个类session1中7幅正面无遮挡的图像和随机选取的1幅戴围巾图像构成(共8幅/类),以session2中13幅图像和session1中剩余的5幅图像作为测试样本(共18幅/类).

(2) 训练图像中存在眼镜遮挡.此时,以每个类session1中7幅正面无遮挡的图像和随机选取的1幅戴眼镜图像构成该训练字典(共8幅/类),以session2中13幅图像和session1中剩余的5幅图像作为测试样本(共18幅/类).

3.2 性能分析

在上述设置的参数条件下,实验中选择4×2分块作为图像的理想分块取值,并将本文方法与SRC[3]、LR_SRC[11]、GWSRC[14]进行性能对比,图3给出了上述两种实验参数条件下的对比测试结果.由图3结果可得:1)由于低秩方法恢复了不同光照、眼镜或围巾遮挡等干扰图像的近似低秩结构,滤除了干扰成分对面部特征表达的影响,故与SRC相比,LR_SRC和本文方法得到了明显的识别率提升.由此,更有效地说明了基于低秩矩阵恢复的字典优化方法有利于提高图像的可分离特性,增强稀疏编码字典的鉴别能力,对稀疏编码稳健性和识别性能的提升有着重大的意义;2)相对于全局相似性判断图像位置信息的方法,分块相似性嵌入稀疏编码分类获得了可靠的位置结构,有效地控制了眼镜或围巾遮挡对图像特征的破坏,故本文方法与GWSRC对比,有力地提高了特征低维的识别效果.

图3 不同遮挡训练环境的识别性能比较Fig.3 Comparisons of the recognition performance in different occlusions

4 结语

为滤除非受控环境中光照/表情、遮挡等因素对人脸图像的干扰,探讨了一种基于低秩矩阵恢复的字典优化设计方案,以增强稀疏表示人脸识别分类的性能.通过改进稀疏编码字典的鉴别能力和可靠的位置先验信息,更有效地抑制了干扰成分的影响,进一步提升了稀疏编码的稳健性.

参 考 文 献

[1] Donoho D L. Compressed sensing [J]. IEEE Transac-tions on Information Theory, 2006, 52(4):1289-1306.

[2] 石光明, 刘丹华, 高大化, 等.压缩感知理论及其研究进展 [J].电子学报, 2009, 37(5): 1070-1081.

[3] Wright J, Yang A Y, Ganesh A, et al. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2) : 210-227.

[4] Meng Y, Zhang L. Gabor feature based sparse represen-tation for face recognition with gabor occlusion dictionary [C]// IEEE. Computer Vision, Springer Berlin. Heidelberg: IEEE, 2010: 448-461.

[5] Meng Y, Zhang L, Yang J, et al. Robust sparse coding for face recognition [C]// IEEE. Computer Vision and Pattern Recognition. Providence: IEEE, 2011: 625-632.

[6] Mairal J, Bach F, Ponce J, et al. Discriminative learned dictionaries for local image analysis [C]// IEEE. Computer Vision and Pattern Recognition. Anchorage: IEEE, 2008: 1-8.

[7] Aharon M, Elad M, Bruckstein A. K-SVD: An algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54(1):4311-4322.

[8] De la Torre F, Black M J. Robust principal component analysis for computer vision [C]// IEEE. Computer Vision. Vancouver: IEEE, 2001: 362-369.

[9] Wright J, Peng Y G, Ma Y. Robust principal components analysis: exact recovery of corrupted low-rank matrices by convex optimization [C]// NIPS. Neural Information Processing System.Vancouver: NIPS, 2009:2080-2088.

[10] CandèS E, Li X D, Ma Y, et al. Robust principal component analysis [J]. Journal of the ACM, 2011, 58(3):1101-1137.

[11] Chen C F, Wei C P, Wang Y C F. Low-Rank Matrix Recovery with Structural Incoherence for Robust Face Recognition [C]// IEEE. Computer Vision and Pattern Recognition. Providence: IEEE , 2012 : 2618-2625.

[12] Li L Y, Li S, Fu Y. Discriminative dictionary learning with low-rank regularization for face recognition [C]// IEEE. Automatic Face and Gesture Recognition. Shanghai: IEEE, 2013: 1-6.

[13] 彭义刚,索津莉,戴琼海,等. 从压缩传感到低秩矩阵恢复:理论与应用 [J]. 自动化学报, 2013, 39(7) : 981-994.

[14] Lu C Y , Min H , Gui J, et al. Face recognition via weighted sparse representation [J]. Journal of Visual Communication and Image Representation, 2013, 24(2) : 111-116.

[15] Guo S, Ruan Q, Miao Z. Similarity weighted sparse representation for classification [C]// IEEE. Pattern Recognition. Tsukuba: IEEE, 2012:1241-1244.

[16] 胡正平,李 静. 基于低秩子空间恢复的联合稀疏表示人脸识别算法 [J].电子学报,2013, 41(5): 987-991.

[17] Lin Z, Chen M, Ma Y. The augmented lagrange multiplier method for exact recovery of corrupted low-rank matrices [J]. arXiv preprint arXiv, 2010.

猜你喜欢
字典人脸人脸识别
人脸识别 等
有特点的人脸
一起学画人脸
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
字典的由来
三国漫——人脸解锁
大头熊的字典
人脸识别在高校安全防范中的应用
正版字典