董九玲,赖惠成,杨 敏,许 伟
(新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046)
基于图像去模糊的改进Gabor与LSSVM的人脸识别
董九玲,赖惠成,杨 敏,许 伟
(新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046)
为有效解决人脸识别中二维Gabor的维数灾难,线性鉴别分析算法(LDA)的小样本问题和因拍摄不慎造成的图像模糊的问题,提出一种图像去模糊的改进Gabor和最小二乘支持向量机(LSSVM)相结合的新算法。首先用约束最小二乘方(CLS)对模糊的人脸图像去模糊,然后将DLDA和二维Gabor相融合进行降维处理,最后利用训练速度快,泛化能力强的LSSVM进行分类识别。并通过ORL和Yale人脸库来做对比验证,证明了此方法的高效性。
Gabor特征;DLDA;LSSVM; CLS;人脸识别
随着信息智能化的发展人脸的自动化识别(face recognition)技术也得到了完善和提高[1-3]。该技术应用在身份认证、视频监控、公共安全等领域。而且由于人脸的唯一性使得它比指纹、虹膜等其他生物特征作为个人身份的鉴别更具有直接、方便的特性。但是由于人脸的复杂性、多姿态、多表情和拍摄时造成的模糊性等因素,使得人脸识别的效率还很难达到零误差的识别。所以研究如何进一步提高人脸识别的准确率、速率和稳定性具有较好的现实意义和使用价值。
针对拍摄时造成人脸图像的模糊和噪声的干扰问题,本文利用约束最小二乘方滤波法[4-5]使原图像复原,从而保证了特征提取的高效性。Gabor滤波器可以从多方向、多尺度来获得人脸图像的局部特征和对光照变化、人脸姿态的不敏感。但是得到的人脸Gabor特征向量的维数很高,使得数据的处理变得很复杂,为了解决此问题本文把Gabor和直接线性鉴别分析(DLDA)相融合,使得Gabor处理后的向量的维数大大降低,而且DLDA还弥补了线性鉴别分析算法[6-7](LDA)小样本问题的缺陷。因此,此算法大大提高了人脸的识别率。
人脸自动识别的另一关键问题是分类标准,常用的主要有BP网、K阶近邻、SVM、欧氏距离等。K阶近邻和欧氏距离虽然计算方便但其误差较大;BP网在训练时达到最小值的时间长,易掉进局部的极小值,而且还存在过学习和欠学习等缺陷[8-10];SVM虽然在泛化方面的能力强,也不需先验知识但训练的速度慢。所以本文选择了SVM的改进的方法LSSVM[11],它有效地避免了BP网的过拟合现象和SVM的训练速度慢等弱点,从而提高了人脸识别的效率和速率。
1.1 二维 Gabor变换算法
Gabor变换被Daugman等人首次运用在二维空间,它在时域和频域上都具有良好的分辨能力而且在频域中可以从不同方向和尺度上提取图像的纹理特征。由于2DGabor滤波器[12-15]是由类似高斯函数形状的波组成的,所以它对图像的形状变化、光照强度、角度等因素具有不敏感性,使得它在纹理识别方面具有良好的识别效果。它的核函数定义式是
(1)
将Gabor内核和它的变换做卷积
Gabor的相位信息易出现周期性的变化,所以不稳定,一般不予以采用,而它的幅值信息一般稳定平滑,所以可利用。本文将按照图像的输入顺序依次和每个滤波器做卷积,并将得到的图像幅值信息当作输出。即
(2)
图1 一幅图像处理后的幅值信息
由图1知,当位置改变时,与灰度人脸图像相比较,可知图像幅度信息没有较大的改变。说明Gabor特征能在方向上很好地选取和空间中的部分性,而且对不同的光照、不同的姿态具有较好的稳定性,对对齐误差和器官的定位也具有更大的容忍性。
1.2 DLDA算法原理
线性判别分析(Linear Discriminant Analysis, LDA)是一种基于Fisher准则的特征提取的监督型模式分类方法。它利用投影方法使难分类的高维样本投射到低维空间,使得投影后的点同类之间距离较小,不同种类间的距离较大。其实质是寻找一个最好的投射向量,使之容易找到全局最好的解。但它有自身的局限性:1)在对数据处理时,通常假设数据服从高斯分布,可实际数据并非都服从高斯分布,那么此时的分类效果就会较差;2)其决定因数是样本中心而不是样本的方差,且存在小样本问题。由于LDA的上述缺点本文选择既能使类内矩阵单位化又能使类间矩阵对角化的算法DLDA用来实现数据的降维处理。其算法步骤如下:
假设所用的样本训练集为式(3)表示,样本不同种类的个数为c,第j类中的样本数为Nj,各类模式的样本平均值为μi,样本总均值为μ0第i类中的第j个样本是Vj,类Vi中的样本个数是Ni,Sw为同种类内散布矩阵,Sb为不同种类之间散布矩阵,φ为最佳投影矩阵。
Q=(q1,q2,…,qk) ,Q⊂Rn×m
(3)
第一步:计算训练样本的均值
(4)
第二步:平均脸和每张训练人脸图的差值
(5)
第三步:创建重要的协方差矩阵,然后求出此矩阵中最重要的信息即它的特征向量和特征值
(6)
因为Sb的零空间没有有用的分类信息,所以去掉对角阵中等于零或接近零的特征值。即VTSbV=∧VTV=I。∧为降序排列的对角化矩阵。Y是V前的m列向量(n×m),即YTSbY=Db,Db是∧的m×m的子矩阵。
2.1 约束最小二乘方原理
在实际的图像去模糊中通常原始图像和噪声的功率谱是未知的,而且它们的信噪比一般没有合适的解,在上述情况下维纳滤波和逆滤波的效果不佳,为了解决上述的不稳定性,本文选择最小二乘方滤波法进行图像的去模糊和滤噪,在最小二乘约束去模糊中,欲使函数最小化,关键是得到一个最好的f估计值。在此前提下,可把不清楚的图像问题转化为对f的估计求式(5)目标泛函数最小值的问题。
(7)
式中:L一般选择拉普拉斯算子,是对原图的估计进行某些线性操作的矩阵。λ是拉格朗日乘子,欲使式(7)最小则对式(7)求导并等0,即可求出最小二乘解f的估计值。
(8)
为了易求出式(8)的解则对其实行FFT运算之后再求,变换后的公式为
(9)
通过调整r=1/λ的值,可使得约束最小二乘滤波器达到较好的去模糊效果。其中H(u,v)的共轭是H*(u,v),g(x,y)和h(x,y)经过二维傅里叶变换后分别为G(u,v)与H(u,v)。噪声和信号的功率谱密度分别为Sn(u,v)和Sf(u,v),该算法可以自动抑制噪声的放大,但是它却使低频段中偏高的频率成分增强了,通常情况下在信号的高频谱区,信噪比较小,噪声项一般包含在高频范围中,因此噪声被滤波器所抑制,但与此同时,它也使得一些有用的高频细节丢失,在低频谱区信噪比很高时,滤波器接近于反向滤波器的效果使小细节被增强。通常r在0~1之间取值,但实验证明其在信噪比较高时r一般在0.1~0.4之间取值效果最佳。此方法去图像模糊的效果图如图2所示。
a模糊图像 b去模糊后的图图2 模糊图像处理前后对比
SVM分类器由于在工作时无需先验证知识,泛化能力强等优点所以被广泛应用于各个领域,尤其是在模式识别中,对于解决具有维数高的非线性的和样本少的问题效果更为明显。但它在训练样本时所需时间长,针对此缺陷本文采用LSSVM法,其计算过程如下:
第一步:建立一个分类的函数设一训练集为(xi,yi),i=1, 2,…,l,x∈Rd,y∈R,偏置量为b,权值向量为w,则LSSVM在维数高的样本中的线性函数是
f(x)=wT·φ(x)+b
(10)
第二步:根据结构风险最小化原理建立目标函数设分类误差为ξ正则化参变量为r。
(11)
限制条件为
yi=φ(xi)ω+b+ξi,i=1,2,…,l
(12)
式中:‖ω‖2用来控制模型的复杂度;c为正则化的参数;ξi表示松弛因子。
第三步:LSSVM优化对应的拉格朗日函数为:
(13)
式中:ai(i=1,2,…,l)是拉格朗日乘子。对上面的式子求偏导,并且将结果设置为0,高维计算的问题可以转化为求解线性方程组的问题。
(14)
式中:e=[1,1,…,1];Y=[y1,y2,…,yi] ;Ωij=K(xi,yj),最后得出非线性的回归模型
(15)
第四步:选择最佳的核函数,若使用径向基函数作为核函数则LSSVM的分类决策函数为
(16)
径向基核函数的宽度参数为σ,LSSVM的惩罚参数和核函数的值选择什么可以直接影响到预测结果的准确度,然而,需要解决的难题是怎样能找到合适的惩罚参数和核函数的值。
1)图像预处理:在采集人脸图像时可能会由于光学系统的配置、相机对焦不准、人手的抖动、光线的强弱等因素造成的人脸图像的模糊不清或噪声的污染,从而会导致人脸识别率的降低,为了尽可能的避免这种原因造成的干扰,在进行人脸识别之前先对其进行约束最小二乘法去模糊处理。
2)Gabor特征提取:将人脸的图像分别与40个Gabor滤波器进行卷积运算,即可得到人脸图像的Gabor幅值特征,但所得到的Gabor特征矢量维数可高达40×图像的分辨率维,在Gabor特征相邻信息中有相当多的冗余信息。
3)DLDA降维处理:把上步得到的高维人脸Gabor特征矢量进行DLDA数据降维处理,消除冗余特征,大大节约了存储空间提高了人脸识别速率。DLDA算法相比LDA算法不仅克服了小样本的缺点而且它还使同类之间的离散度矩阵的零空间保存下来同时删掉了不同类之间的离散矩阵。
4)LSSVM训练分类:数据经过DLDA运算后得到的最佳投影矩阵作为LSSVM的输入,选择合适的核函数和参数并计算出每个支持向量机的最优决策函数值,最后把待测人脸图像经过相同变换后输入到LSSVM中得到40个决策值,把每个决策值做统计,最后票数最多的类就是样本的类别。本文算法Gabor+DLDA+LSSVM具体过程如图3所示。
图3 Gabor+DLDA+LSSVM的流程
5.1 实验数据库简介
为了验证本文算法的高效性和广泛性,本文分别选择了两种不同的人脸数据库进行实验验证。一种是被英国剑桥大学所收集的并且在国际上通用的标准ORL人脸库,此图像库中包含400幅人脸图像,其中有40个不同类型的人,每类人有10种不同的表情。它们的面部表情各不相同,有哭或不哭,是否佩戴眼镜,人脸的朝向不同,每幅图像的分辨率是112×92;灰度等级为256,它的部分人脸如图4所示。另一种是YALE标准人脸库,此库中共有165张图像,其中有15个不同类型的人如男、女等,每个人又有11张不同的表情动作图,其不同体现在光照、表情、姿态等的变化上,每幅图像的分辨率为100×100,灰度等级为256。 YALE人脸数据库的优点是充分考虑了现实场景下,不同光照、面部缺失和表情各异等状态,其部分人脸图如图5所示。
图4 ORL库中的一些样本图
图5 YALE库中的部分样本图
5.2 实验结果及分析
实验条件为分别在ORL库和YALE库中随机获得每人5幅图像当作训练的样本,剩余的作为测试样本,所有仿真软件为Matlab2012和Windows XP系统,为更充分地证明本文算法的高效性,首先仿真出PCA+SVM算法的识别率,其程序的可视化界面为图6所示。
图6 PCA+SVM算法的GUI(截图)
为了比较各个算法在不同训练样本数目下的影响,在ORL库中随机抽取每一个人的1,2,…,8幅人脸图作为训练样本,各算法的特征维数保持一致。图7中PCA、Gabor+PCA方法的实验参考结果数据来源于文献[16]。LDA算法结果来源于文献[7],而SVM+PCA、Gabor+ DLDA+LSSVM的数据结果是由软件编程仿真得到的,五种方法结果对比如图7所示。
图7 ORL库中每种算法在不同训练样本下的识别率
由图7结果可以得出,在50次求平均的相同实验条件下,首先在ORL库中,本文方法对人脸的正确认知率上明显高于其他四种算法。还可以明显看出Gabor+PCA算法的识别率高于SVM+PCA算法。当每种训练的图像个数增加时,测试的图像上识别率就随着增加,即分类器的分类能力会随着训练图像个数的增加而增强。但是当训练的样本数目达到一定数量时识别率趋于一种稳定状态。
在为了验证本算法的广泛性,排除偶然性,在用50次求平均相同实验条件下,使用YALE人脸库进行实验,得出的实验结果如表1所示。
表1 YALE库中每种算法在不同训练样本下的识别率
每类训练样本个数各算法的识别率/%PCALDAGabor+PCASVM+PCA本文算法130.253.161.349.364.3242.669.273.358.868.7359.481.682.263.484.8477.284.386.879.689.1580.485.990.580.390.8682.887.491.382.593.4783.990.992.883.794.9884.892.393.287.995.9
通过对上表分析可得出如下结论,可以明显看出本方法在YALE人脸库中对人脸的正确认识率也明显高于其他四种算法,当训练样本的数目曾多时可以看出识别的正确率也会相应的提高。通过两个人脸库的验证结果可以说明本文方法具有稳定性和广泛性。对比在表1和图7中的同一种方法的不同识别率可知,在ORL人脸库中的识别率普遍高于YALE中的。这是因为在YALE库中的人脸受光照、表情的影响比ORL中的稍高。
本文首先针对人脸图像在拍摄、传输、存储的过程中导致的人脸图像的模糊问题,提出了利用约束最小二乘法对被退化的图像进行去噪和去模糊处理,从而有助于Gabor算法对人脸主要特征的获得。其次针对Gabor算法在对人脸特征进行提取后,存在的维度灾难问题和LDA算法存在的小样本问题,本算法采用对多姿态、不同强度的光照具有一定的稳定性和良好的方向选择性和空间局部性,能很好地描述图像的纹理信息的Gabor与DLDA相融合,正好弥补了上述两种算法的缺陷,从而很好地提高了人脸识别率。最后针对神经网络存在的过学习和欠学习现状、SVM的收敛速度缓慢等缺点,本算法利用LSSVM作为分类器。实验结果证明本文提出的研究方法比其他四种方法具有较高的识别率。
[1] GUPTA S, SAHOO O P, GOEL A, et al. A new optimized approach to face recognition using eigenfaces[J]. Global Journal of Computer Science and Technology,2010,10(1):15-17.
[2] YAN Y,ZHANG Y J.1D correlation filter based class-dependence feature analysis for face recognition[J].Pattern Recognition,2008,41(12):3834-3841.
[3] LIAO S, SHEN D, CHUNG A C S. A markov random field groupwise registration framework for face recognition[J]. IEEE Trans. Pattern Analysis & Machine Intelligence,2014,36(4):657-669.
[4] 肖宿,韩国强. 基于变量分离和加权最小二乘法的图像复原[J].计算机应用研究,2012,29(4):1584-1587.
[5] VASKELAINEN L I. Constrained least-squares optimization in conformal array antenna synthesis[J]. IEEE Trans. Antennas & Propagation, 2007,55(3):859 - 867.
[6] OUYANG A,LI K,ZHOU X,et al. Improved LDA and LVQ for face recognition[J]. Applied Mathematics & Information Science,2014,8(1L): 301-309.
[7] 周维芳,赵玉刚,王世亮,等. 基于Gabor小波和LDA的人脸识别算法研究[J]. 电视技术, 2011,35(23):118-120.
[8] HO H T, CHELLAPPA R. Pose-invariant face recognition using Markov random fields[J]. IEEE Trans. Image Processing,2013,22(4): 1573-1584.
[9] YANG S S,SIU S,HO C L. Analysis of the initial values in split-complex backpropagation algorithm[J]. Neural Networks,2008,19(9):1564-1573.
[10] ZAIED M,SAID S,JEMAI O,et al. A novel approach for face recognition based on fast learning algorithm and wavelet network theory[J]. International Journal of Wavelets, Multiresolution and Information Processing, 2011, 9(6): 923-945.
[11] 薛涛,刘潇潇,张海兵. 基于Gabor特征融合和LSSVM的人脸识别算法[J]. 计算机应用与软件, 2014,31(7):191-194.
[12] WANG F,DU M. A new Gabor feature extraction method for face recognition [J]. Journal of South China University of Technology :Natural Science Edition,2004,32(8): 5-8.
[13] LIN K Z, XU Y, ZHONG Y, et al. Using Kernel Discriminant Analysis and 2D Gabor Local Features Fusion for Face Recognition.[J]. International Journal of Digital Content Technology & Its Applications,2010,4(8):232-241.
[14] 朱伟涛,刘士荣. 基于二维Gabor小波和支持向量机的人脸识别[J]. 杭州电子科技大学学报,2009, 29(6):53-56.
[15] ZHUANG D W,ZHOU D L,WANG X B,et al. Face recognition from single sample per class based on Gabor filtering[J]. Application Research of Computers,2009,26(6):2379-2382.
[16] 田玉敏,云艳娥,马天骏.判别近邻保持嵌入人脸别[J].西安电子科技大学学报:自然科学版,2011,38(3):24-29.
董九玲(1986— ),女,硕士生,主研图像处理、人脸识别;
赖惠成(1963— ),教授,主研模式识别、图像处理;
杨 敏(1990— ),硕士生,主研图像处理、人脸检测;
许 伟(1987— ),硕士,主研图像处理。
责任编辑:哈宏疆
Face Recognition Method with Improved Gabor and Lssvm Based on Image Blur
DONG Jiuling, LAI Huicheng, YANG Min, XU Wei
(SchoolofInformationScienceandEngineering,XinjiangUniversity,Urumqi830046,China)
In order to effectively solve the problems of curse dimensionality of 2D Gabor, the small sample size of LDA and image blurring due to accidentally shooting in the face recognition, a new algorithm is proposed based on improved Gabor and LSSVM . The improved Gabor solved the problem of deblurring image. First the blurred facial image is dealed with constrained least squares, then reducing the dimensionality of the feature space is done by fusion of DLDA and 2D Gabor.Because the LSSVM has the advantage of fast training speed and strong generalization ability. Finally, we use the LSSVM for classification and recognition. The efficiency of the proposed method is demonstrated by comparative verification of the Yale and ORL face database
Gabor wavelets; DLDA; LSSVM; constrained least squares methods; face recognition
新疆维吾尔自治区科学基金项目(2015211C257)
TP391
A
10.16280/j.videoe.2015.24.026
2015-06-16
【本文献信息】董九玲,赖惠成,杨敏,等.基于图像去模糊的改进Gabor与LSSVM的人脸识别[J].电视技术,2015,39(24).