王利龙,吴 斌
(西南科技大学信息工程学院,四川 绵阳 621010)
作为模式识别与人工智能领域中的热门研究课题,人脸识别[1]的研究工作取得了突破性进展。但图像特征提取过程会受到不同干扰因素限制[2],如光照强度和遮挡变化、人脸姿态和表情变化等外在、内在因素,会使人脸识别算法的性能面临较大的挑战[2-11]。
为保证少样本条件下特征提取的完备性,进一步增强人脸特征的表示和提取,提出了Gaborface多通道优化与二维线性降维的特征提取算法。①多通道Gaborface表征模型对样本集进行预处理,提取不同通道下的人脸Gabor幅值特征,并选取较优的通道特征融合方式组合成新人脸特征表示。②引入类内、类间鉴别信息改进二维局部保持投影(two dimentional locality preserving projection,2DLPP)提取行方向特征,同时在列方向上采用二维主成分分析算法(two dimentional principal component analysis,2DPCA)对新人脸进行特征提取与降维。③通过最近邻分类器得到分类结果,用于描述人脸识别性能。
人脸图像本质上为高维流形,非线性降维[4]能够很好地保留图像结构,但计算量大。因而,HE[5]提出了局部保持投影(locality preserving projections,LPP)共享非线性降维算法特性,较主成分分析(principal component analysis,PCA)得到更优的人脸表示。进一步直接获取二维图像矩阵的最优特征,可更好地保证算法有效性,如2DPCA[12]、2DLPP[13]等。二维双向降维算法能增强人脸识别算法的鲁棒性,QI提出了一种结合2DLPP与2DPCA的人脸识别方法[14-15]。该算法对图像行和列方向上最优特征求解,但缺乏对图像样本间鉴别信息的考量,对于人脸姿态、光照变化仍较为敏感。
Gabor滤波算法[6-11]能够很好地表示空间局部性和方向选择性。多通道Gaborface表征(multi channel gabor face representation,MGFR)可以提供多通道间的信息补偿。HUO[15]提出了多通道Gabor小波与2DFLD相融合的算法。该算法能够提取人脸特征的空间局部和方向信息,并对人脸的光照变化不敏感,具有很好的鲁棒性。
为有效保留图像的全局和局部特征,在多通道Gaborface组合表征的行、列方向上,分别采用引入类别权重的二维局部保持投影和二维主成分分析算法。改进算法流程如图1所示。
图1 改进算法流程图Fig.1 Processing of improved algorithm
二维Gabor人脸特征的提取过程为:采用不同属性的Gabor滤波器对人脸图像进行核卷积处理,获得的特征矢量与Gabor滤波器的方向、尺度相对应。经给定参数的核卷积运算后,不同通道Gabor人脸特征Gμ,v(x,y)为:
(1)
式中:Ψμ,v为Gabor滤波器;kμ,v为波向量,μ∈{0,1,…,7}和v∈{0,1,…,4}分别为其方向和尺度参数;z=(x,y);σ=2π;I(x,y)为单张人脸;‖·‖为欧式范数算子。
文献[6]引入串接方式来组合多通道Gabor特征矢量,且不同尺度和方向上的组合表征在分类性能上表现出了较强的差异性。受特征表示不同鉴别属性的启发,选取四种通道组合形成Gabor特征人脸表示。
①求和全部通道。
(2)
②方向通道相加后串接。
(3)
③尺度通道相加后串接。
(4)
④串接全部通道。
(5)
式中:C为串接符[6];∑为求和符。
对于任意单张图像,经过Gabor滤波器卷积并组合通道操作后,新特征矩阵维数随不同通道组合形式的变化而不同。多通道组合处理结果如图2所示。
图2表示选取四种通道组合下的人脸表征。其中,图2(d)可直观表现出全部通道下人脸图像的局部和方向描述,且四种矢量组合效果存在较为明显的差异。虽然该特征提取过程能获取单张图像更为丰富的特征表示,但其高维属性影响算法的实效性。针对该算法不足,提出改进双向二维线性降维方法进行优化。
图像降维过程往往会丢失数据原有结构信息,且一维向量较二维矩阵对数据破坏性更大。而行、列方向上分别获取最优投影,可得到样本图像最小维数的特征表示。
图2 多通道组合处理结果Fig.2 Processing results of multi-channel combination
2.2.1 列方向2DPCA特征提取
(1)求取样本均值:
(6)
(2)求取协方差矩阵:
Ψ=E[g-Eg]T[g-Eg]=
(7)
(3)求取投影后总散度矩阵:
J(Z)=tr{E[u-Eu]T[u-Eu]}=
tr{E[gZ-EgZ]T[gZ-EgZ]}
(8)
则将式(6)、式(7)代入式(8),可以得到:
J(Z)=ZTΨZ
(9)
最后求解式(9)并保留前p个最大的广义特征值,取其对应的特征向量组成样本列方向上的投影矩阵Zopt=[z1,z2,...,zp]。
2.2.2 行方向2DLPP特征提取
通过列方向2DPCA特征提取得到图像全局结构,现采用改进权重的2DLPP保留图像行方向上的局部信息[10]。算法实现如下。
①构建有向邻接图。
利用包含M个样本的数据集构建有向邻接图,且图中包含M个结点,结点间的近邻关系通过K近邻准则确定。
②权重选择及优化。
在全局邻域的基础上引入类间、类内信息,通过增大样本类间差异,缩小类内差异来更好描述数据间的近邻关系。其优化后的权重为:
(10)
③求取投影矩阵。
首先取标准列正交矩阵A∈Rm×q,n≥q将矩阵gi行方向映射到A上,有变换后矩阵yi=ATgi,yi∈Rq×n,i=1,2,...,M。经权重改进后,2DLPP的目标函数为:
且需同时满足:
AgT(D⊗In)gAT=1
(11)
式中:D为对角阵;L为拉普拉斯矩阵;⊗为克罗内克积;In为单位阵。联立公式,进一步得到:
gT(L⊗In)gAT=λgT(D⊗In)gAT
(12)
最终,求解式(12)并保留前q个最大的广义特征值,取其对应的特征向量组成样本行方向上的投影矩阵Aopt。
基于行、列方向上的最优投影矩阵Aopt和Zopt,对于任意单张人脸图像,均可得维数为q×p的矩阵Fopt:
(13)
(14)
为比较训练样本和测试样本间的相似性,采用最近邻分类,通过计算特征矩阵间的欧式距离d,可快速验证算法的有效性。
(15)
试验选取AR人脸数据集,验证不同Gabor通道组合的有效性,选取YALE和ORL两人脸数据库,分别验证不同算法与改进算法的性能对比。试验平台为WIN7系统;Pentinum(R) Dual-Core CPU 2.80 GHz;算法编程环境为Matlab R2017a。
AR人脸数据库是由美国俄亥俄州立大学提供的公开数据库,包含了超过4 000张彩色人脸照片,包括不同角度、不同表情、不同光照和遮挡条件,所有图像均为165×120。
YALE库中包含15个人的165张照片,每个人11张照片,图像像素大小为100×100。
ORL人脸数据集是由剑桥大学试验室提供的公开数据集。其包含40个人的人脸图像,每类人脸图像均有10张,不但包含了一些人脸俯仰达20°的倾斜和旋转图像,而且包含了达10%的尺度变化。所有图像均为灰度图,像素大小为112×92。
由上文可知,Gabor滤波的方向和尺度属性对人脸表示影响较大。因此,选择四种表征能力较强的通道组合方式,再对其融合改进双向线性降维来对比算法性能差异,且试验在AR人脸集上验证。 优化Gaborface通道组合的算法性能曲线如图3所示。
图3 优化Gaborface通道组合的算法性能曲线Fig.3 Algorithmic performance curves of optimizing Gaborface channel combination
每类样本训练数为3和4,且维数取d=1,2,…,30时的算法性能对比。其中,全部通道求和、方向通道相加后串接、尺度通道相加后串接、全部通道串接分别用组合方式表示。结果表明,方向通道相加后串接总体表现较佳。
选取方向通道相加后串接方式生成人脸特征表示。此时,需验证不同数据集上不同维数对改进算法性能的影响。不同特征维数下识别率曲线如图4所示。
图4 不同特征维数下识别率曲线Fig.4 Recognition rate curves under different feature dimensions
值得注意的是,2DPCA和2DLPP得到的特征矩阵维数为m×d,而双向降维算法得到的则为d×d。图4表明,在AR、ORL、YALE数据集上,五种算法的性能都在特征维数增大的情况下得到提高,且初始位数较低的情形下,双向降维算法的识别率较低;当维数d≥5时,其性能表现更优。同时,改进算法表现出了更高的识别率,其算法有效性得到了验证。
针对小样本集问题,试验在ORL和YALE两数据集上选取每类样本的不同训练个数来比较不同算法的识别性能。ORL、YALE上不同训练样本数下算法性能对比如表1、表2所示。
表1 ORL上不同训练样本数下算法性能对比Tab.1 Comparisons of algorithm performance under different training samples on ORL
表2 YALE上不同训练样本数下算法性能对比Tab.2 Comparisons of algorithm performance under different training samples on YALE
试验选取ORL和YALE两样本数较少的数据集。通过表1和表2可以看出,改进算法总体性能表现较好。由于较低维数下算法识别性能较差,故通过求取均值获取到的识别率偏差较大。
前述算法对比过程仅在改进工作中引入了优化后的多通道Gabor组合特征表示。为考量通道组合后特征对其他算法的性能影响,试验在数据集AR、ORL和YALE的每类样本上分别选取训练个数为7、5、5。
AR、ORL、YALE数据集上识别性能对比如表3~表5所示。
表3 AR数据集上识别性能对比Tab.3 Comparisons of recognition performance on AR dataset
表4 ORL数据集上识别性能对比Tab.4 Comparisons of recognition performance on ORL dataset
表5 YALE数据集上识别性能对比Tab.5 Comparisons of recognition performance on YALE dataset
对比结果表明: ①多通道Gaborface的组合表征对每种算法均有识别率上的提升,但同时增加了训练耗时和分类耗时;②总体上,改进算法的训练时间较久[16-17],且分类性能表现较优。
针对人脸姿态变化、光照变化等因素对人脸识别性能的影响,通过选取多通道Gaborface优化组合和引入样本类别信息提升线性降维鉴别性能的方式,提出了一种Gaborface多通道优化与二维线性降维的特征提取算法,用于描述人脸识别性能。
试验结果表明,在选取的人脸数据库上,提出的改进算法能够增强人脸特征的表示和提取。采用多通道Gaborface表征组合更好地保留了人脸特征的局部性和方向性,并进一步提升了双向降维算法的识别性能,验证了改进算法在人脸识别性能上的有效性。