程国建,石彩云,朱 凯
(1.西安石油大学 计算机学院,陕西 西安710065;2.美国太平洋大学 工程与计算机科学系,美国 加州斯托克顿CA 95211)
人脸识别指利用人脸视觉特征信息进行身份鉴别的计算机技术,是机器视觉和模式识别领域最具有挑战性的课题之一。与指纹识别、视网膜识别,基因识别等生物技术相比,它具有对人体无伤害、无限制、友好方便等优点,是一种比较理想的生物识别技术。当前主流的人脸识别技术有基于几何特征的方法[1]、神经网络方法[2]、弹性图匹配方法、PCA[3](主成分分析)方法等。
粒子群优化 (particle swarm optimization,PSO)算法是1995年Kennedy和Eberhart通过对鸟类觅食行为的研究共同提出的[4]。PSO的优势在于算法简单,没有许多参数需要调整。目前已广泛应用于函数优化、神经网络训练、模糊系统控制以及遗传算法的应用领域,主要是针对连续函数优化问题。但是在许多优化问题中,自变量是整数,比如生产调度、路由选择、以及很多整数规划问题。针对0-1整数规划问题,Kennedy和Eberhart博士1997年提出了二进制粒子群算法 (binary particle swarm optimization,BPSO)[5],目前已经成功应用于求解离散优化问题[6-7]。
人脸识别技术发展迅速,并且已经应用到了信息安全、视频监控、刑侦破案等领域。但是人脸识别技术受外部环境,如光照、摄像设备、设备距离和角度、图像存储质量等的影响非常大。现在人脸识别技术主要的挑战课题就是,进一步研究特征提取算法和识别算法,来提高识别率。本文中BPSO算法作为特征提取算法应用到人脸识别中,希望对人脸识别技术的发展起到参考性作用。
离散余弦变换 (discrete cosine transform,DCT)经常用作信号处理和图像处理[8-9],对信号和图像进行有损数据压缩。除了应用在数据压缩中,DCT还用于特征提取[10]。这是由于DCT具有很强的 “能量集中”特性:大部分信号都集中在DCT变换后的低频部分。DCT利用像素间的冗余,对图像进行去相关的处理。经过去相关性处理后,变换后的相关系数可以进行独立编码,而不影响压缩效率[11]。DCT变换把图像分成不同的部分 (不同的光谱带),把输入变换为加权函数的线性组合,这些基本函数就是输入数据的频率。DCT类似于傅立叶变换 (DFT),它们都是把信号或者图像从空间域变换到频域,并且都使用基函数,具有良好的去相关性和能量压缩的特性[12]。主要的不同点就是,DCT使用简单的余弦函数作为基函数,而DFT是一个复杂的变换,图像的大小和相位都要进行编码。
设f(x,y)一幅分辨率为M×N的人脸图像矩阵,则其对应的二维离散余弦变换和反余弦变换的公式分别为
其中
离散余弦变换是一种正交变换,在一定程度上减小了随机变量的相关性,经过DCT变换后,信号的能量集中在低频部分 (对应于DCT系数比较大的部分),也就是DCT阵列的左上角[13]。DCT变换可以用很少的系数包含图像最具代表性的特征,也就是说,可以利用少数DCT系数就可以完成对图像的重构。如图1所示,图 (a)为原始图像,(b)为经过二维DCT变换后的结果,(c)为利用部分DCT系数进行离散余弦逆变换重构的图像。从图1(b)看出,能量大部分集中在变换后图像的左上角。
图1 离散余弦变换示例
只用很少的DCT系数就可以重构人脸图像,这使得DCT系数在人脸识别系统中非常关键,DCT系数对人脸识别效果非常重要,将在后面实验结果部分作分析介绍。
PSO算法是一种全新的智能算法[14]。类似于遗传算法(GA),PSO算法也采用 “群体”与 “进化”的概念,同样也是根据个体 (粒子)的适应度大小进行操作。但是PSO算法不像GA算法那样对个体使用进化算子 (交叉和变异),而是将每个个体看作是在搜索空间中的一个没有重量和体积的粒子,并在搜索空间中以一定的速度飞行。而且,这个飞行速度是由个体飞行经验pbest和整个群体飞行经验gbest进行调整。假设在D维的搜索空间中,第i个粒子的位置为,速度为,第i个粒子经过的最佳位置为pbest,所有粒子经历过的最佳位置为gbest,每次迭代的公式如下
式中:ω——惯性因子,一般取值区间为 (0.4,1.2);c1、c2——学习因子,一般取值区间为 (0,2);r1、r2——区间 (0,1)上的随机数;粒子的规模一般取30~50。图2为基本PSO算法流程图。
图2 基本PSO算法流程
基本PSO算法适合求解无约束连续型最优化问题,对于有约束的优化问题,首先要转换为无约束问题,或者定义合理适应度函数把问题转换为和原函数同解最优化问题[15]。为了使PSO算法应用在离散型的优化问题中,Kennedy和Eberhart博士1997年提出BPSO算法。在BPSO算法中,模仿遗传算法中的染色体,粒子被编码成一个二进制字符串,每一维的位置只能取0或1。从式 (5)和(6)看出,迭代后可能会取0、1以外的其它数值。为保证迭代后满足取值为0或1,引入函数sig(x)
因此迭代公式就变为
BPSO算法在本文中的应用主要是:从经过DCT处理的人脸图像特征空间中,提取最具代表性的特征子集。算法中的每个粒子代表一个可能的候选解,每代的进化是通过适应度函数来完成。适应度函数如下
式中:Mi、M0——当前分类的数目和样本空间总平均数。
Mi的计算如下
这里,j=1,2,3,…,Ni表示wi类中的样本图像。M0的计算如下
这里的N表示所有类里面图像的数目。
图3给出了用二进制粒子群算法进行特征提取的算法流程图。
实验用到的数据库是ORL人脸数据库,由剑桥大学AT&T实验室创建,是人脸识别中常用的标准测试数据库。ORL数据库包括40名志愿者的共400张人脸图像,每张图像的大小为92×112像素。部分志愿者图像包括了姿态、表情和面部饰物的变化。图4为ORL数据库中部分人脸图像。
人脸识别系统总的实现过程如图5所示,具体实现步骤如下:
(1)首先对图像进行直方图均衡化处理,直方图均衡的目的是降低光照对图像的影响,提高对比度;
(2)把人脸数据库中每个人的前5张图像作为训练样本,后5张作为测试样本,对训练样本和测试样本图像都进行二维离散余弦变换;
(3)得到离散余弦变换后的图像,这时图像最具代表性的元素集中在左上角,提取左上角一些元素组成特征向量;
(4)应用BPSO算法对步骤 (3)中得到的特征向量进行特征提取;
(5)利用欧式距离分类法判断每个测试样本所属类别,最后输出结果。
图5 人脸识别系统框架
经过二维DCT处理之后的图像,反映图像特征的信号主要集中在变换后图像的左上角。实验中,分别提取DCT系数矩阵为50×50、40×40、30×30和20×20,作为特征选择阶段的输入。把BPSO算法和遗传算法 (GA)在选择的特征数目、训练时间和识别率几方面进行了比较,结果如图6所示。每个系数矩阵下的实验都做10组,然后计算平均值作为这个系数矩阵下的实验数值。BPSO算法和GA算法的参数设置如表1所示。
图6 BPSO和GA在不同DCT系数下的性能比较
表1 BPSO和GA参数设置
从图6中可以看到,当系数矩阵为50×50时,相对于其它系数矩阵,两种算法选择的特征数目最多,但需要的训练时间最长。就这两种算法而言,当系数矩阵为50×50时,GA比BPSO选择的特征数目多,训练所需时间也比BPSO算法短,就识别率而言BPSO算法明显比GA算法高。当系数矩阵的大小为20×20时,两种算法选择到的特征数目都非常少,但是在识别率方面,BPSO算法明显高于GA算法,为93.25%。总体来看最高的识别率是94.5%,是BPSO算法实现的结果。从DCT系数矩阵大小对识别效果来看,当系数矩阵大小为50×50,BPSO算法识别率达到了最大,当系数矩阵的大小为20×20时,它的识别率最小。系数矩阵大小为40×40时,GA算法的识别率达到实验中的最大值。
从上面的实验分析看到,DCT系数对BPSO算法和GA算法在选择的特征数目和训练所需要的时间两方面的影响是相同的。随着DCT矩阵的增大,两种算法选择的特征数目也跟着增加,同时训练所需要的时间也增大。但是在识别率方面,GA算法没有表现出明显的规律,系数矩阵大小为40×40和30×30时,识别率相对比较高,而当系数矩阵大小为50×50和20×20时识别率相对比较低。
人脸识别是生物识别领域非常热门的研究课题之一。本文首先对人脸图像进行二维离散余弦变换 (DCT),在变换后的图像上应用BPSO算法进行特征提取,并且和GA算法进行了比较。实验结果表明,BPSO应用到人脸识别中,有较高的识别率,是一种有效的特征提取方法。和GA算法的比较结果表明,在DCT系数矩阵较低或者较高的情况下,BPSO算法的识别率优于GA算。
[1]XU Yuan.A research on face recognition method based on geometric features[D].Beijing:China University of Geosciences(Beijing)Institute of Geophysics & Geomatics,2008 (in Chinese).[徐媛.基于几何特征的人脸识别方法 [D].北京:中国地质大学 (北京)地球物理与信息技术学院,2008.]
[2]GAI Huaicun,ZHANG Xiaofeng,JIANG Zetao.Face recognition technology based on quantum neural networks [J].Computer Engineering and Applications,2010,46 (8):1897-1989(in Chinese).[盖怀存,张小锋,江泽涛.基于量子神经网络的人脸识别技术研究 [J].计算机工程与应用,2010,46(8):187-189.]
[3]QIN Hongwei,SUN Jinguang,WANG Qiang,et al.Research of face recognition method on adaptive pre-processing and PCA [J].Computer Engineering and Applications,2011,47(14):186-188 (in Chinese).[秦宏伟,孙劲光,王强,等.基于自适应预处理和PCA的人脸识别方法的研究 [J].计算机工程与应用,2011,47 (14):186-188.]
[4]TANG Jun,ZHAO Xiaojuan.An enhanced opposition-based particle swarm optimization [C].Proceedings of the WRI Global Congress on Intelligent,2009:149-153.
[5]XU Yichun,XIAO Renbin.An improved binary particle swarm optimizer [J].Pattern Recognition and Artificial Intelligence,2007,20 (6):788-793 (in Chinese).[徐义春,肖人彬.一种改进的二进制粒子群算法 [J].模式识别与人工能,2007,20 (6):788-793.]
[6]LI Shuhong,ZHANG Qiaorong.Application of binary particle swarm optimization algorithm in path planning [J].Computer Engineering and Design,2009,30 (21):4953-4955 (in Chinese).[李淑红,张巧荣.二进制粒子群算法在路径规划中的应用 [J].计算机工程与设计,2009,30 (21):4953-4955.]
[7]LU Zhigang,YANG Guoliang,ZHANG Xiaohui,et al.Reconfiguration of distribution network based on improved particle swarm optimization [J].Power System Protection and Control,2009,37 (7):31-34(in Chinese). [卢志刚,杨国良,张晓辉,等.改进的二进制粒子群优化算法在配电网络重构中的应用 [J].电力系统保护与控制,2009,37 (7):31-34.]
[8]FU Desheng,GU Taoeng.Color image information in DCT domain based on human visual characteristic [J].Computer Application and Software,2008,25 (9):86-88 (in Chinese).[傅德胜,顾桃峰.基于人眼视觉特征的DCT域彩色图像的信息隐藏 [J].计算机应用与软件,2008,25(9):86-88.]
[9]HONG Rui,GUO Jichang.Method of speech enhancement based on DCT and neural network [J].Electronic Measurement Technology,2006,29 (6):44-45 (in Chinese). [洪锐,郭继昌.基于DCT与神经网络的语音增强方法 [J].电子测量技术,2006,29 (6):44-45.]
[10]LUO Rongfang,LIN Tusheng.Finger crease identification based on discrete cosine transform [J].Data Acquisition &Processing,2008,23 (2)129-134 (in Chinese).[罗荣芳,林土胜.基于离散余弦变换的手指指节折痕识别 [J].数据采集与处理,2008,23 (2):129-134.]
[11]CHEN Bo,WANG Hongxia,CHENG Lizhi.Fast directional discrete cosine transforms based image compression [J].Journal of software,2011,22 (4):826-832 (in Chinese). [陈波,王红霞,成礼智.图像压缩中的快速方向离散余弦变换[J].软件学报,2011,22 (4):826-832.]
[12]SHI Jun,CHI Yonggang,SHA Xuejun,et al.Application of weighter-type fractional Fourier transform in sampling and reconstruction [J].Journal on Communications,2010,31(4):88-93 (in Chinese).[史军,迟永钢,沙学军,等.加权分数傅里叶变换在采样重构中的应用 [J].通信学报,2010,31 (4):88-93.]
[13]Rabab M Ramadan,Rehab F Abdel– Kader.Face recognition using particle swarm optimization-based selected features[J].Image Processing and Pattern Recognition,2009,2(2):51-65.
[14]LI Guo,XU Chen,WU Yanke.The population diversity character of the globally convergent PSO algorithm [J].Computer Applications and Software,2008,25 (5):237-240(in Chinese).[李国,徐晨,吴延科.全局收敛的PSO算法的种群多样性特征 [J].计算机应用与软件,2008,25(5):237-240.]
[15]LI Dong,WANG Dingwei.A survey on simulatior-based optimization [J].Control Engineering of China,2008,15(6):672-677 (in Chinese).[李东,汪定伟.基于仿真的优化方法综述 [J].控制工程,2008,15 (6):672-677.]