智能机器人视觉中的人脸识别研究

2015-05-06 01:31
长沙航空职业技术学院学报 2015年3期
关键词:人脸人脸识别纹理

林 琳

(厦门海洋职业技术学院,福建 厦门 361000)



智能机器人视觉中的人脸识别研究

林 琳

(厦门海洋职业技术学院,福建 厦门 361000)

通过对智能机器人视觉中的人脸识别过程进行研究,提出了采用MB-LBP纹理特征结合径向基函数作为核函数的SVM进行人脸识别,并在常见的Yale和ORL数据集上进行了多项对比实验,实验结果表明,算法能够很好的完成智能机器人视觉的人脸识别。对于光照变化较大的人脸图像,对于人类识别正确率有较大的提升,另外,通过减少迭代次数减少了人脸识别的时间复杂度。该算法对智能机器人视觉中应用人脸识别过程具有较强意义。

智能机器人; 机器视觉;MB-LBP特征;支持向量机;径向基函数

机器人指的是一个由多自由度、多变量组成的复杂动力学系统,机器人系统的发展离不开计算能力的显著提高。随着人们对机器人的不断改造和发展,智能机器人的视觉控制也是一个比较重要的方向[1],在智能机器人进行常规仿人类活动中,人们希望机器人也拥有像人类一样的视觉能力。再仿人类视觉的功能研究中,最常见的是人脸识别的能力,如果冰冷的机器人也具有较强的人脸识别能力,这将为机器人增加很多扩展的能力。

1 机器视觉人脸识别方法概述

人脸识别(Face Recognition)[2]是目前生物与计算机智能学科的热门交叉学科[3],对于机器人来说,人脸识别的计算速度是瓶颈,目前较为常见的人脸识别的分类器的效率较低,同时识别效果也不理想,这将制约机器人的视觉发展。

人脸识别属于模式识别的一种,通常具有两个阶段,即特征提取和特征分类。人脸图像处理的纹理特征中,较为常用的特征包括LBP纹理特征[4],Gabor纹理特征[5]等。提取完图像的特征之后,利用人脸图像的特征代替原始图像,然后通过机器学习的分类算法进行分类,将不同的人脸分别分类到对应的类别中,完成人脸识别。常见的分类方法包括支持向量机(SVM)[6],人工神经网络(NN)[7],逻辑斯蒂回归(LR)[8]等等,不同的机器学习方法都在各自的领域中取得了不错的效果。

2 人脸识别的特征提取

LBP局部二值模式是一种局部的纹理特征描述子,该描述子通过计算每个像素点与周围相邻像素点之间的关系为每个像素点生成一个描述子,该描述子可以表现出该像素点周围的局部纹理特征。最简单的LBP算子是通过计算周围8个邻域之间的差值,然后将差值二值化获得局部LBP算子。在此基础上,人们提出了MB-LBP即多块化局部二值模式纹理[9],该纹理的计算方式不仅仅针对单个像素点了,而是针对每一块区域进行二值模式的演化,通过像素块的平均值代替原始像素块,具有较强抗干扰能力。

图1 MB-LBP纹理特征示意图

如图1所示,每个块的像素均值可以计算出,此处以9个像素点划分为块。然后通过传统的LBP算法得到二值模式,比中间值86小的位置为0,大的位置为1,按照顺时针可以得到二值模式(0,1,0,1,0,1,0,0)2=84,该位置的纹理特征均值为84。

采用MB-LBP特征进行人脸识别的分类研究,由于人脸图像受到光照影响较强烈,不同强度的光照往往会造成局部纹理特征的变化,所以可利用MB-LBP纹理改善现有特征的不足,在最后的分类实验中,采用光照变化强烈的Yale人脸库进行识别,识别结果表明,MB-LBP纹理的抗光照干扰性较强,适合作为人脸识别的主要特征。

3 基于支持向量机的人脸识别方法

智能机器人视觉的人脸识别方法另一个重点是特征的分类和识别过程。本文采用最新的分类器——支持向量机,进行人脸MB-LBP特征的分类和识别。

3.1 支持向量机SVM

支持向量机(SVM)由感知机发展而来,传统的感知机[10]通过求解线性分类面来将待分类的数据分离开来。根据数据分布的情况不同,这样的线性分类面较多,而支持向量机需要寻找到一个最优的分类面,使得待分类的数据能够得到最大的“间隔”条件下的分离。

设训练集{xi,yi,i=1,2,3…n}表示一个数据集,该数据集中的数据x是需要分类的样本数据,而y表示的则是每个数据对应的标签,也就是实际上该数据需要分类到哪一类中。SVM需要找到一个最优的分类面w*x+b=0,使得样本数据集x能够尽可能大的分离开来。如图所示,我们需要将两个类别的数据尽可能分离开,也就是图2中所示的“最优分类面”。

图2 支持向量机与最优分类面

通过分析最优分类面w*x+b=0,其中w为权值,x为支持向量,b为加性偏置。求最优化的分类面,也就是求关于w和b的二次规划问题:

(1)

s.t.yi(ωgxi+b)≥ 1,i= 1,2,…,n

(2)

通过求解上述二次规划的优化问题,通过拉格朗日乘子法及KKT条件可以解出最优化的权值w及b,然后得到该样本分类的最优化结果。

实际上,几乎所有的实际问题都不能遇到图2这样的线性可分的数据集x,而线性不可分的数据集不能仅仅使用线性分类面将其区分,SVM在此基础上,加入了松弛变量,允许部分样本可以被错分,在这样的情况下就可以采用SVM的方法求解非线性可分的数据集了。另外,如图3所示,这样的数据集并不能够通过松弛变量解决,因为如果依照线性分类平面进行分类,那么错分的样本较多,导致最后的分类器性能较差。这时候,SVM采用核函数的概念,通过核函数将原本线性不可分的数据集,变化到高维空间上,通过高维空间映射将原始数据变为高维空间上线性可分的数据集,这样就可以很好的使用线性分类面进行分类了。

图3 非线性数据集通过核函数变化为高维线性可分数据集

其中,φx表示核函数,通过核函数变化,可以将SVM的二次优化问题转化为:

(3)

s.t.yi(ωgφ(xi)+b)≥ 1-ξi

(4)

ξi≥0,i= 1,2,3,…,n

(5)

其中,ξi表示松弛因子,φx表示核函数,C表示惩罚系数。同样,可以采用拉格朗日乘子法及KKT条件得到二次规划的最优化解,然后表示出非线性SVM的分类面:

(6)

其中,K(xi,xj)表示为核函数,通过核函数思想,可以很容易的采用多个带有核函数的SVM完成人脸识别的分类任务。

3.2 人脸识别中SVM的核函数选择

到目前为止,并没有理论研究表明,怎样的核函数适合怎样的分类数据。一般情况下,常见的做法采用暴力尝试的方式,选择不同的核函数测试自己的数据集,然后从中选出最好的核函数做SVM的分类工作。

常见的核函数包括以下4种核函数:

(1)线性核函数:

(7)

(2)多项式核函数:

(8)

(3)径向基函数:

(9)

(4)sigmoid激励函数:

(10)

由于核函数分为局部性较强的核函数,如多项式核函数,以及全局性较强的核函数,如径向基函数。由于人脸识别过程中,既需要局部性较强的核函数去区分出单个人类的不同光照之间的局部情况,又需要完成全局所有人脸的识别分类工作。而式(9)表示的径向基函数是采用高斯核的运算,将当前特征维度通过高斯核转化到无穷维度,然后通过分类器对无穷维度的数据进行分类。由于人脸识别最大的障碍在于光照的影响,光照影响通常在特征的某个维度影响较大,而其他维度的影响却微乎其微,采用径向基函数将特征数据转化到无穷维度上去,可以有效的减少光照的影响,所以本文采用径向基函数(RBF)进行智能机器人视觉人脸识别过程中的分类核函数,从后续的实验结果可以看出,径向基函数RBF能够很好地完成人脸识别的过程。

4 智能机器人视觉的人脸识别流程

人脸识别是一项较为复杂的非线性分类问题,首先需要较为合理的人脸特征代替原有图像,用低维的特征代替高维的原始图像达到了降维的目的,可以降低SVM识别过程中的时间复杂度。本文采用MB-LBP纹理特征,通过使用径向基函数RBF的SVM进行人脸图像的分类工作,完成智能机器人的人脸识别的功能。人脸识别流程如图4所示。

图4 人脸识别流程

5 实验结果与分析

5.1 数据集选择

本文通过分别在ORL数据集和Yale数据集上进行人脸识别实验。ORL数据集是剑桥大学维护的人脸数据集,该数据集包括40个人,每个人的10张人脸图像的光照强度几乎不变,只是人脸的拍摄角度发生了一定变化。与此相反,Yale大学维护的人脸数据集由48个人,每个人具有55张人脸图像。该人脸图像数据库则是每张图像光照发生了变化,而人脸拍摄角度几乎不发生变化。如图5可以看到,两个数据库部分人脸图像的例子。

图5 Yale数据集(左)与ORL数据集图像(右)

ORL与Yale数据库有各自的优点,通过在这两个数据库上测试本文算法,具有较强的横向比较意义。另外,本文算法还与传统的LBP,一维MB-LBP纹理特征以及传统采用径向基函数的SVM纵向做了实验比较。实验环境在MatlabR2012a上进行。

为了横向与纵向比较本文算法的实践意义。首先,从ORL与Yale两个数据库中分别随机挑选出30个人的数据集,每个人10个样本图像,将其中的7个人脸图像作为训练数据集,另外3个图像作为测试数据集。所有样本都归一化到32*32的大小。

特征提取:针对两个数据库中的300个样本,分别提取每个样本的LBP和MB-LBP纹理特征用于横向比较纹理特征对人脸识别结果的影响。其中MB级特征采取的块大小为3*3,计算每3*3个块大小的平均值作为计算LBP的周围像素值。

SVM分类:分别采用多项式核函数、sigmoid激励核函数和RBF径向基函数作为核函数的SVM进行人脸识别,这样一来可以横向比较核函数对人脸识别的影响。

5.2 实验结果与分析

依照上述实验预处理与参数选择分别进行了12组实验,在ORL与Yale数据库上分别进行了6组相同的实验。即分别采用LBP特征和MB-LBP特征以及三种SVM核函数进行人脸识别的研究,一共有6组横向对比实验,分别在两个数据集中对这6种组合的识别情况和识别时间进行了实验,实验结果由表1和表2给出:

表1 各种算法在ORL数据上的识别率与时间

表2 各种算法在Yale数据上的识别率与时间

由表1,2的结果可以看出,对于光照变化较为强烈的Yale数据库,本文采用的MB-LBP结合径向基函数作为核函数的SVM能够显著提高识别率。而对于人类方向变化较多的ORL数据库,本文采用的算法策略对识别率提升更弱一些。由于智能机器人的视觉范围中采集到的人脸图像较为复杂,但是最关键的还是光照对人脸图像的影响对人脸识别率的影响,所以本文的研究对于光照变化强烈的人脸识别算法策略有较强的意义。另外,由于MB-LBP携带更少但是更有用的纹理特征信息,且径向基函数将数据转化到无穷维,从根本上减少了SVM收敛的迭代次数,一定程度上减少了算法的时间复杂度。

6 总结与展望

智能机器人的视觉过程是一个非常有意义的研究方向,我们首要完成的任务是智能机器人的人脸检测和人脸识别问题。本文采用MB-LBP纹理特征结合径向基函数作为核函数的SVM算法策略进行人脸识别。对于人脸光照变化强烈的图像可以提升不少识别率,且通过MB-LBP特征减少了迭代次数,减少了算法的时间复杂度,对于智能机器人视觉的人脸识别具有重要意义。但是,本文算法对于人类方向变化的人脸图像识别率提升不明显,这一方向是今后的研究重点。

[1] 张宏基,葛媛媛.智能机器人视觉仿生技术研究综述[J].价值工程,2013,(26).

[2] 汪淑贤,熊承义,高志荣,等.分块最大相似性嵌入稀疏编码的人脸识别[J].模式识别与人工智能,2014,(10).

[3] 单园园,王法胜,李绪成,等.改进AdaBoost与SVM快速人脸检测[J].烟台大学学报(自然科学与工程版),2015,(3).

[4] 李亮,舒宁,王凯,等.融合多特征的遥感影像变化检测方法[J].测绘学报,2014,(9).

[5] 田天,陈刚.基于肤色和Gabor纹理的粒子滤波人脸跟踪[J].计算机工程,2014,(7).

[6] 李武,胡冰,王明伟,等.基于主成分分析和支持向量机的太赫兹光谱冰片鉴别[J].光谱学与光谱分析,2014,(12).

[7] 李龙,魏靖,黎灿兵,等.基于人工神经网络的负荷模型预测[J].电工技术学报,2015,(8).

[8] 王立,张蓉,沙朝锋,等.电子商务商品归一化方法研究[J].计算机学报,2014,(2).

[9] 王小玉,张亚洲,陈德运,等.基于多块局部二值模式特征和人眼定位的人脸检测[J].仪器仪表学报,2014,(12).

[10] 杨戈,张威强,黄静,等.一个感知机神经网络字符识别器的实现[J].电子技术应用,2015,(3).

[编校:张芙蓉]

Research of Face Recognition in the Vision of Intelligent Robot

LIN Lin

XiamenOceanVocationalCollege,XiamenFujian361012)

This article researches on the face recognition in intelligent robot's vision. It proposes using MB-LBP texture feature combined RBF kernel SVM for face recognition. Aim at validating the method, some compared experiments are done on Yale and ORL Face datasets. The results show that the method can be favorable for accomplishing the task of face recognition on intelligent robot. This method improves the accuracy of face recognition when the illumination of face changes a lot. Besides, it can reduce the time complexity by reducing the iterations of SVM. Above all, this method is of great significance in the procedure of face recognition in intelligent robot.

intelligent robot; computer vision; MB-LBP feature; SVM; RBF

2015-08-06

林琳(1976- ),女,黑龙江海伦人,讲师,在读博士研究生,研究方向为智能机器人、数控。

TP

A

1671-9654(2015)03-064-06

猜你喜欢
人脸人脸识别纹理
人脸识别 等
有特点的人脸
一起学画人脸
揭开人脸识别的神秘面纱
基于BM3D的复杂纹理区域图像去噪
人脸识别技术的基本原理与应用
使用纹理叠加添加艺术画特效
三国漫——人脸解锁
TEXTURE ON TEXTURE质地上的纹理
人脸识别在高校安全防范中的应用