南京信息职业技术学院 郭 慧 王 璇 吕 黎
深圳中广核工程设计有限公司 郭文仙 李春锦
安徽信息工程学院 方兵华
近些年来,随着人类社会对互联网金融贸易和安防监控等方面应用需求的急速增长,生物特征识别技术的研究已成为重要的研究热点之一,而人脸识别在计算机视觉和人工智能领域具有较为广泛的应用价值,尤其是在系统安全验证、金融验证、医学图像、档案管理、人机交互公安部门罪犯搜索等方面具有巨大应用前景[1][2]。生物特征识别技术是通过提取生物某些特定的易于区分本体的特征或行为[3][4],并将所提取的特征与事先录入数据库中样本数据进行筛选和匹配,从而完成对个人身份的识别。
人脸识别系统主要包括视频实时采集及预处理、数据库管理、人脸识别和识别信息输出等四个模块组成,其人脸识别系统结构如图1所示。
系统具体识别过程:首先对样本视频中人脸进行检测,剪切出人脸图像部分,并对所剪切出的图像进行去噪、平滑等处理。在身份信息管理数据库模块,将特定的人脸与身份信息进行匹配,如:姓名、联系方式等信息。在人脸识别功能阶段,采用PCA (Principal Component Analysis)算法将视频中人脸特征与数据库中人脸特征进行数据比对,筛选出与输入图像相匹配的身份信息进行输出。
图1 人脸识别系统结构
在人脸识别中,本文采用PCA分析算法进行人脸特征提取及数据维,该算法属于多元统计分析法,是用一种较少数量的特征对样本进行描述,以达到降低特征空间维数。人脸图像特征信息是一个高维的矩阵信息,PCA算法可以将高维的人脸图像矩阵映射到低维特征空间中,基于各个正交基底来生成对应的特征矢量。这种特征矢量不仅可以免除环境和人为因素如光照、姿态、表情等干扰因素对识别的干扰,同时可以精确地反映人脸图像的全局信息与局部特征信息的关系[5-6]。
PCA具体算法如下:
设人脸图像I(x,y)为二维N*N灰度图像,用向量R表示。人脸图像训练集为其中M为训练集中图像总数,这M幅图像的平均向量为:
训练图像的协方差矩阵可表示为:
计算C的特征向量,并按照特征值的权重取前若干个特征向量组成特征空U。基于特征脸的人脸识别过程由训练阶段和识别阶段两个阶段组成[7]。在训练阶段,每个已知人脸映射到由特征脸构成的子空间上,得到m维向量:
其中N为已知人数,距离阈值为:
其中U为C的特征向量组成的矩阵。在识别阶段,首先把待识别的图像R映射到特征脸空间。得到向量:
为了区分人脸和非人脸,还需计算原始图像R与其由特征空间重建的图像之间的距离:
采用欧式最小距离法对人脸进行分类[8],分类规则如下:
本文采用MATLAB软件中的GUI建立人机交互界面,该界面主要包括信息录入、删除和识别输出等这三个基本功能,用户操作界面如图2所示。
图2 用户操作界面
本系统利用SQL Server存储录入人脸身份信息,并与MATLAB人脸录入信息程序实现相连接,可以在MATLAB 脚本中对SQL Server中储存的人物信息进行查找读取,录入,删除操作。运行识别程序前,应打开数据库管理软件SQL server 使得程序运行后,可以访问数据库交换信息,系统运行过程流程图如图3所示。
图3 系统运行流程图
在MATLAB调用摄像头中,本文使用MATLAB的图像获取工具箱中函数imaqhwinfo(),以获取PC上摄像头配置信息[9],程序代码如下:
为顺利调用数据库中的身份信息,在SQL Server中创建数据库和数据库表存放身份信息如图4所示,并建立ODBC数据源用于MATLAB 连接数据库。
图4 数据库表
数据录入界面和识别输出界面如图5和图6所示。
图5 数据录入界面
图6 识别信息输出
PCA人脸识别算法只能处理二维信息而摄像头采集的是彩色图片,故在处理时将彩色图像灰度化为黑白图片与数据库中图片形成相关联,在识别分析时,可以识别出相应的灰度人脸图像,并显示出相关联的彩色人脸图。
为验证人脸识别准确率,本文选用经典ORL(Olivertti Research Laboratory)人脸图数据库,具体验证算法是:先录入ORL人脸数据库的人脸训练样本,每个样本大小像素为N*M的二维矩阵,二维数组变成一维数组,即向量。若人脸图库中有m张人脸,把这些图片都表示成上述的向量形式,即将所有的扩充为一个二维数组即。再将矩阵Q乘以的Q逆矩阵QT得的协方差矩阵B,求B的特征向量,取最大的K个特征向量组成新的矩阵F。使用QT乘以F得到特征脸C。然后录入将需识别的人脸图R,R进行降维和向量化表示为:; R乘以上面训练得到的特征脸C得到这个图片向量R在C下的投影向量P,计算与上面训练图库m张人脸图降维所得到的Pm的向量距离,与P距离最小的向量所对应的人脸图像,即为所查找图像信息[10]。
为保证图像保留90%的能量,本文选用前64个特征值求其占所有特征值之和的百分比,如图7所示,由此可见人脸识别率accuracy=0.9032。
图7 前64个特征值求其占所有特征值之和的百分比
本文采用主成分分析算法以提取人脸图像特征信息,利用统计学原理来判断输入图像子空间与样本训练图像空间之间的相似度,使用经典的欧式距离来判断选择输入图像与样本空间中的图像的对应关系。通过matlab软件中GUI,本文建立了人机交互界面,并利用SQL Server存储录入人脸身份信息,与MATLAB 人脸录入信息程序实现相连接,在MATLAB 脚本中对SQL Server进行已储存人脸信息的查找、读取,录入,删除操作。该系统人脸实时识别率达到90.32%,进而达到人脸实时识别效果。
由于该研究仍处于初步阶段,所以还需进一步深入研究,尚待克服的问题:
(1)如何消除环境因素和人脸姿态对图像的影响,进而上升到动态进行视频图像的检测的处理,提高人脸预处理的鲁棒特性。
(2)是在人脸识别构建样本空间时如何获取大量的训练样本人脸图像,使用个人肖像这需要得到个人的图像授权和法律的支持。
(3)如何综合融合多种识别算法,将其各取所长应用到识别中,制定判别标准使得识别应用开发更加便捷,消除技术壁垒。
[1]孙冬梅,裘正定.生物特征识别技术综述[J].电子学报,2001,29(z1)∶1744.1748.
[2]方志刚,叶伟中.多生物特征识别技术综述[J].计算机工程,2003,29(9)∶140,142.
[3]余龙华,丁锋.人脸识别中图像预处理问题的研究[J].大众科技,2011,(5).
[4]田启川,张润生.生物特征识别综述[J].计算机应用研究,2009,26(12)∶4401-4406.
[5]赵松.人脸识别中的姿态估计、识别算法和融合算法的研究[D].中国科学技术大学,2009.
[6]赵堃.人脸表情识别的研究与实现[D].沈阳理工大学,2009.
[7]孙艳丰,齐光磊,胡永利.一种深度卷积神经网络的人脸识别方法∶CN 104866810 A[P].2015.
[8]杨国亮,李欢.改进的基于特征脸和欧氏距离的人脸识别方法[J].软件导刊,2010(03).
[9]甘俊英,高建虎,李春芝.基于对角DCT与2DPCA算法的人脸识别[J].计算机工程与应用,2007,43(31)∶210-213.
[10]杜冬梅,田昆鹏,姜磊,王小研.基于Matlab的摄像机标定方法研究[J].河南工程学院学报∶自然科学版,2012.