顾理琴
摘要:特征提取部分是要从人脸图像中提取可以区分不同类别人脸的特征信息(有效识别信息)。将图像预处理、二维PCA特征提取和神经网络分类器结合提出了一种改进的图像识别方法,和其他方法进行了比较,在Matlab环境中的仿真结果表明,该算法降低了系统的运算复杂度,提高了人脸识别率。
关键词:人脸识别 pca 2dpca 神经网络
中图分类号:TP391.4 文献标识码:A 文章编号:1672-3791(2012)10(b)-0235-01
人脸识别是神经网络应用的一个重要研究方向。神经网络的学习需要大量的样本,图像维数通常很高。理论上神经网络可以直接进行识别,但实际操作时,其时间的消耗是无法接受的,也降低了该项技术的实用性。二维PCA是近年来提出的一种有效特征提取方法,已经在人脸识别中获得了成功的应用。二维PCA在保留主要识别信息的前提下,实现了人脸特征的提取和图像的降维。和传统特征提取方法相比,二维PCA在图像特征提取上更加简单和直观,特征提取速度也得到提高。
1 人脸识别流程
本文的实验是在英国剑桥大学提供的ORL人脸库上进行的,库中共有400幅人脸图像,包括40个人,每人10幅,分辨率为92112。ORL图库比较规范,大多数图像的光照方向和强度都差不多。但有少许表情,姿态,伸缩的变化,尺度差异在10%左右。实验环境为Matlab7.0。采用小波工具箱和神经网络工具箱对人脸识别进行了仿真实验。
2 人脸特征提取
特征提取是人脸识别的重要组成部分。特征提取的内容包括两方面。
首先是特征选择,从原始特征向量中确定能充分完整且稳定的表示人脸信息的低维非零特征向量。然后是特征提取。对获得的低维特征向量进行最优变换,获取最能反映模式分类本质的特征向量。
目前可以用于人脸识别的特征主要有以下几种。
(1)几何特征。如人脸的五官尺寸和相对位置。这些特征的维数较低。但光照等外界条件对其影响较大,例如:拍摄角度造成的人脸尺寸差异。因此,难以获得满意的识别效果。
(2)灰度统计特征。用于识别的人脸图像多为灰度图像因此,人脸的特征也可以用直方图和主分量等特征来表示。这些特征能在保留有效分类信息的前提,降低人脸特征的维数。
(3)变换系数特征。如,傅立叶变化等,这些变换可以对人脸图像进行数学变换,以变换的系数作为人脸特征。虽然其计算较方便,但是去相关性较差。得到的特征维数仍然很大。
(4)代数特征。人脸图像可以表示为矩阵或数组的形式。矩阵的特征向量反映了矩阵的代数属性。奇异值分解是典型的利用代数特征进行人脸特征提取的方法。
本文采用二维PCA进行人脸的特征提取。二维PCA直接利用人脸图像表示的二维数据作为分析对象,构建协方差矩阵,进行特征提取,特别适宜于图像(或者矩阵)数据的处理,在小样本数据测试(如:人脸识别)中,表现出了很好的识别能力。
特征提取算法描述:
令训练样本集,为训练样本集的样本总数,为训练样本集中的任一样本图像,可以表示为维的图像矩阵。
平均样本。图像协方差矩阵:
根据协方差矩阵进行特征提取的推导过程如下。
(1)获取最优投影轴。令(维)为给定的一个人脸图像样本,为维列向量,为样本图像。则在方向上投影后的特征向量:。
为获取最优投影方向,定义最优化准则函数:
其中:为的协方差矩阵;为的迹。求准则函数的最大值即可得到最优投影方向。
样本图象的协方差矩阵为:
可知为非负定的矩阵,由公式(1)(2)(4)(5)可得:
其中是一维列向量,取最大值时对应的是最大特征值对应的特征向量,称为最优投影轴。由此得到满足条件:(1)…,(2)…。前个较大特征值对应的的特征向量…。
(2)特征提取。对于给定样本图像可得:…,相应的,…,即为样本图像的主成分向量,组成了样本图像的特征矩阵,完成了样本图像的特征提取。
本文实验中所使用的图像取自ORL人脸库中的图像。原始图像尺寸为112×92,图像归一化阶段经过剪切尺寸降为60×60维,小波变换后样本图像降为15×15维。取小波变换后的样本图像作为特征提取的对象。原始图像在特征提取中获得的协方差矩阵为92×92,而按本文的方法得到的协方差矩阵为15×15维,将有效的降低数据运算量。
3 BP神经网络分类器设计
BP神经网络分类的设计主要包括:输入层和输出层的设计、中间层(隐层)的设计、传递函数的设计。
3.1输入层和输出层设计
BP神经网络用作人脸识别分类器时,其输入层的节点应该和提取的人脸特征维数相对应,即二维PCA特征提取后得到的人脸特征向量维数即为本文设计的BP神经网络分类器的输入层节点数。
BP神经网络分类器输出层节点数应为用于识别的人脸的类别数。神经网络输出层的节点数需要根据该网络设计该网络的用途来设计。设样本图像为人脸图像的第类,则目标输出为[0,0,…,1,0,…0],即当其成功被识别后,第个输出节点的输出值为1。
3.2隐层节点数的设定
关于中间层,即隐层的层数和各隐层节点的个数,目前的研究结果还难以给出网络类型和规模之间的函数关系。增加隐层层数和节点数不一定能提高网络的精度和分类能力,因此,本文采用标准的三层BP网络作为人脸识别分类器。
通常可以根据经验公式来进行隐层节点数的确定:
或 (8)
式中:为隐层节点个数,为输入层节点个数,为输出层节点个数。为110之间的常数。
或根据网络收敛程度来调整:选择较少的隐层节点,如果网络没有达到满意的收敛效果,确认网络缺少分化数据的能力,可以增加隐层的大小,重复上述实验,知道获得满意的网络收敛。
4 结语
人脸识别是一种基于信息处理的模式识别技术。广泛的应用前景使得人脸识别作为一个极富潜力的研究课题在许多领域得到发展。目前人脸识别的研究仍处于探索阶段。信息的发展使人脸识别在身份认证,安全监控等方面成为关键技术。