蔡丽霞
子块加权保持近邻嵌入和相关向量机的光照人脸识别
蔡丽霞
为了提高光照人脸识别正确率,针对传统特征提取算法存在的不足,提出一种子块加权保持近邻嵌入算法和相关向量机相融合的光照人脸识别算法。首先,将人脸图像划分成多个子图,然后,再采用保持近邻嵌入算法对各子块提取特征信息,并进行加权连接一个特征矩阵,最后,输入到相关向量机中进行分类识别,并采用ORL和Yale人脸库对算法的性能进行测试。仿真结果表明,其算法不仅提高了人脸识别的正确率,而且加快了人脸识别的速度,对光照变化具有较好的鲁棒性。
人脸识别;保持近邻嵌入;子块加权;相关向量机
人脸识别作为一种常用生物识别技术,其在身份认证、视频监控、安全认证等领域具有广泛的应用前景。目前,约束环境下人脸识别已经获得比较令人满意的识别结果,然而在实际应用环境中,人脸常受到光照因素的影响,使得人脸识别性能急剧下降,因此提高光照条件下的人脸识别性能成为一种挑战[1]。
为了解决光照条件下的人脸识别问题,学者们进行了许多研究,提出了许多不同的人脸识别算法[2]。人脸识别实质是一种模式分类题,提取人脸特征是最为重要部分,文献[3]最早就主成分分析(Principal Component Analysis,PCA)应用于人脸特征,其将高维人脸图像特征投影到低维子空间,对原始特征维数进行有效的压缩,提高了人脸识别的效率,随后有学者提出基于线性判别分析(Linear Discriminant Analysis,LDA)的人脸特征提取算法[4],但是它们是一类线性特征提取算法,当特征维数较高时,易出现“小样本”问题,即样本数会远小于特征维数。小波变换具有多尺度分解能力,因此,有学者采用小波变换提取人脸特征,将人脸图像分解成为4个分量,只提取低频分量作为人脸识别特征,然后,采用主成分分析对人脸特征进行降维,提高了人脸识别的准确率[5],但是,由于只利用低频分量信息,丢失了人脸高频分量信息,识别结果不太可靠,对光照变化鲁棒性较差[6]。近年来,大量研究结果表明,人脸可能位于一个低维非线性子流形上,因此,非线性流形学习算法引起了人们的广泛关注,其中局部线性嵌入(LLE)具有较强的非线性降维能力,具有平移,旋转不变性,取得了不错的人脸识别结果[7]。LLE只适用于均匀分布的流形结构,但人脸图像存在大量的非均匀分布的流形结构,为此,有学者提出一种保持近邻嵌入算法(Neighborhood Preserving Embedding,NPE),可以有效地保持人脸的局部特征。然而以上述算法均将整幅人脸图像作为输入模式,提取是人脸图像的全局特征[8]。实际上人脸的局部特征包含了更多的识别信息,此外在光照变化环境中仅部分人脸区域存在变化,其它部分没有什么变化,为此一些学者提出了分块PCA算法(Block PCA,BPCA),首先,将人脸图像划分成多个的子图像,然后,再采用PCA对各子图像集提取局部特征信息[8];文献[10]提出了分块加权的PCA算法,通过设置相应的权值描述各子块特征向量之间的差异,提高了人脸识别的正确率。
为了获得更加理想的光照人脸识别效果,提出了一种子块加权保持近邻嵌入算法(Block Weighted NPE,BWNPE)和相关向量机(Relevance Vector Machine,RVM)相融合的光照人脸识别方法,采用2个人脸数据库进行对比仿真实验,以测试BWNPE-RVM的有效性。
BWNPE-RVM的光照人脸识别算法主要思想为:首先,将人脸图像划分成多个子图,然后再采用保持近邻嵌入算法对各子图提取特征信息,并进行加权连接一个特征矩阵,最后输入到相关向量机中进行分类识别,具体工作流程如图1所示:
图1 BWNPE-RVM的工作流程
2.1 人脸图像分块
首先,将每幅图像分割成K份相等大小的子图像,然后,将所有分割后的训练样本第i行,第j列的子图像集中在一起构成一个子图像集,得到K个分离的子图像集,具体如图2所示:
图2 人脸图像的分块
2.2 NPE提取子图像集特征
对于样本集X=[x1,x2,...xN],近邻保持嵌入算法采用一个投影矩阵A将它们样本映射到一个低维的特征空间,即有公式(1):
(1)根据k近邻计算样本点的近邻点集,构造近邻图G。
(2)计算近邻重建权重矩阵W。令xij()表示xi的k个近邻点,wij表示相本点xi与xj之间的权值,每个数据点xi可以通过它的k个最近邻点重构,重构损失函数为公式(2):
(3)线性变化矩阵A可以通过求解下面最小化问题得到公式(3):
为了简化的运算,式(2)可以转化成下面的广义特征值求解问题,即公式(4):
投影向量A=[α1, α2,…,αd]是前d个最小非零特征值所对应的特征向量构成。
2.3 子块加权
Elij用来度量第j个样本对第i个样本的影响程度,距离越近,影响程度越大,其具体定义如公式(5):
NEli越大的子图像赋予的权重应该越大,为此第l个子图像集的权重定义为公式(8):
2.4 分类器设计
其中先验分布的超参数向量[11]。
为使w的后验分布最大化,需要优化超参数a和σ2,其边缘似然函数为公式(13):
运算后剩下的非0权值的训练样本即为相关向量,最终给定新的输
预测分布为公式(14):
把提取训练样本中人脸图像特征输入到RVM进行训练,得到相关向量和超平面方程,即相应的人脸分类器,然后将待识别人脸输入到分类器中进行分类,输出人脸识别结果。
由于人脸图像分类实质上是一个多分类问题,但RVM只能求解两分类问题,必须通过组合策略构建多类别的人脸分类器,本文采用有向无环图将两分类的RVM组合在一起,构造的多类别的人脸分类器如图3所示[12]:
图3 多类别的人脸分类器设计
3.1 仿真环境及人脸库
为了测试BWNPE-RVM的人脸识别性能,在Intel 双核2.65 GHz,4G 内存的计算机上,采用VC++编程实现仿真实验,采用ORL、Yale人脸库的数据集作为仿真对象[13,14],选择BPCA、BWPCA以及文献[15]的人脸识别算法进行对比实验。ORL人脸库包含40个人的正面图像,每人10幅图像,图像倾斜变化和旋转变化在20%左右,尺度变化在10%左右,图像分辨率大小为112×92像素,其部分人脸样本图像,如图4所示:
图4 ORL人脸库示例图像
Yale人脸库包含38个人、64种不同光照条件下的图像,每个人在不同光照条件下有5个子集,子集1包含7幅图像,子集2、3、4和5分别包含12、12、14、19幅图像。Yale B人脸图像示例,如图5所示:
图5 Yale人脸库示例图像
3.2 结果与分析
3.2.1 ORL的识别结果
从每个人脸图像中随机选择7幅图像组成训练样本集,剩余3幅图像组成测试样本集,每一幅人脸图像划分8个子块,最近邻样本数k=5,每一种算法均进行10次实验,取其平均值作为最终识别结果,仿真结果如图6所示:
图6 不同算法在ORL人脸库上识别率对比
从图6可知,相对于对比算法,BWNPE-RVM的人脸识别正确率得到了进一步提高,这表明BWNPE-RVM较好的解决了当前人脸识别算法存在的不足,获得了更加理想的人脸识别结果。
3.2.2 Yale的识别结果
随机选取每个人7幅图像组成训练样本集,其余样本组成测试集,每一幅人脸图像分割为10子块,最近邻样本数k=5,仿真结果如图7所示:
图7 不同算法在Yale人脸库上识别率对比
从图7可知,相对于对比算法,BWNPE-RVM的人脸识别正确率得到了进一步提高,这表明BWNPE-RVM通过子块划分、加权以及保持近邻嵌入算法提取人脸特征,获得了对人脸识别结果有重要贡献的特征,同时采用非线性分类能力强的相关向量机建立人脸分别器,对光照变化具有较好的鲁棒性。
3.2.3 不同算法的识别速度比较
对于实时性要求比较高的人脸识别应用来说,算法速度至关重要,为此测试一幅人脸图像的平均识别时间,结果如图8所示:
图8 不同算法的平均识别时间对比
从图8可知,相对于对比人脸识别算法,BWNPE-RVM的平均识别时间最短,提高了人脸识别的速度,也体现了BWNPE-RVM算法进行人脸识别的优越性。
为了获得更加理想的光照人脸识别结果,提出了一种子块加权保持近邻嵌入算法和相关相向量机相融合的光照人脸识别算法。首先,将人脸图像划分成多个子图像,然后,再采用保持近邻嵌入算法对各子图像集提取局部特征信息,并进行加权连接一个特征矩阵,最后,输入到相关向量机中进行分类识别,并采用ORL和Yale人脸库对算法的性能进行了测试。仿真结果表明,BWNPE-RVM通过划分子块,考虑了人脸的局部和全局特征,并通过加权对特征之间差异性进行描述,通过保持近邻嵌入算法提取了重要的人脸别特征,不仅提高了人脸识别的正确率,而且加快了人脸识别的速度,对光照变化具有较好的鲁棒性,性能要优于其它人脸识别算法。
[1] 赵松,张志坚,张培仁.增强的典型相关分析及其在人脸识别特征融合中的应用[J].计算机辅助设计与图形学学报,2009,21(3):394-400.
[2] 田玉敏,云艳娥,马天骏.判别近邻保持嵌入人脸识别[J].西安电子科技大学学报, 2011, 38(3): 24-28.
[3] 王心醉,李岩,郭立红,等. 基于双向PCA和K近邻的人脸识别算法[J].解放军理工大学学报(自然科学版),2010, 11(6): 623-238.
[4] 邹建法,王国胤,龚勋.基于增强Gabor特征和直接分步线性判别分析的人脸识别[J].模式识别与人工智能, 2010 (004): 477-482.
[5] 李建科,赵保军,张辉,等.DCT和LBP特征融合的人脸识别[J].北京理工大学学报, 2010, 30(011): 1355-1359.
[6] 张疆勤,廖海斌,李原.基于因子分析与稀疏表示的多姿态人脸识别[J].计算机工程与应用,2013,49(5): 154-159.
[7] Yong Xu, Song Feng Xi , Feng Ge , et al. A novel local preserving projection scheme for use with face recognition [J]. Expert Systems with Applications, 2010,37(9):6718-6721.
[8] He Xiao Fei, Cai Deng, Yan Shui Cheng, Zhang Hong Jiang. Neighborhood Preserving Embedding[C]. Tenth IEEE International Conference on Computer Vision, 2005: 1208-1213.
[9] 洪泉,陈松灿,倪雪蕾.子模式典型相关分析及其在人脸识别中的应用[J].自动化学报,2008,43(1):21-30.
[10] Hsieh P C, Tung P C. A novel hybrid approach based on sub-pattern technique and whitened PCA for face recognition [J]. Pattern Recognition, 2009, 42(5): 978-984.
[11] Tipping M E. The relevance vector machine [J]. Advances in Neural Information Processing Systems, 2000, (12): 652-658.
[12] 柳长源,毕晓君,韦琦.基于相关向量机的含噪声人脸图像识别[J].吉林大学学报(工学版), 2013,43(4):1121-1126.
[13] Xu Yong, Zhong Aini, Yang Jian, et al. LPP solution schemes for use with face recognition[J]. Pattern Recognition, 2010,43(12) : 4165-4176.
[14] 陈恒鑫,唐远炎,房斌,张太平.LMCP:用于变化光照下人脸识别的LBP改进方法[J]. 计算机工程与应用,2011,47(3):30-33.
[15] 王国强,欧宗瑛,刘典婷,苏铁明.基于保持近邻判别嵌入的人脸识别[J].大连理工大学学报, 2008,(3):378-382.
TP391.4
A
2014.12.07)
1007-757X(2015)07-0062-04
蔡丽霞(1979-),女,河南工业职业技术学院,网络管理中心,工程师,硕士,研究方向:图形图像学、网络应用和多媒体技术,南阳,473000