基于深度学习理论的人脸识别技术应用综述*

2021-11-21 16:16李玲俐
计算机与数字工程 2021年9期
关键词:识别率人脸人脸识别

李玲俐

(广东司法警官职业学院 广州 510520)

1 引言

生物特征识别是利用计算机技术,通过采集人的生物特征样本进行人的身份识别。心理学家20世纪50年代开始研究人脸识别,60年代后,慢慢发展成一种重要的生物特征识别技术。区别于指纹、虹膜等其他生物识别,人脸识别技术具有直观、非接触性、方便采集、交互性强、可扩展性的优点[1],成为大数据时代背景下的生物特征识别中一个非常热门的研究领域,被广泛应用于门禁考勤、访问控制、欺诈检测、公安刑侦、智能支付等领域。

人脸技术虽然取得了一些研究成果,但由于人脸的不同姿态、表情以及光线、遮挡、角度、分辨率等因素,识别率和准确性会降低,影响了人脸识别的研究效果。目前,传统的人脸识别技术已经不能解决各类复杂因素下的人脸识别问题,实际应用面临诸多挑战。随着深度学习的发展和广泛应用,人脸识别研究有了很大的突破,其自身适应性、精确性和智能度得到很大提升。本文从传统人脸识别方法面临的技术问题出发,阐述深度学习理论及其在人脸识别中的应用,并对未来的发展进行展望。

2 传统人脸识别方法面临的问题

传统的人脸识别方法主要有以下几种。

1)基于几何特征[2]的方法。最简单的人脸识别方法,将人脸的眼睛、鼻子、嘴巴等重点部位和这些部位的形状、位置进行比较来判别。该方法主要依赖特征提取的准确度,但由于形状、位置等特点不能精确体现出人脸图像中的非线性因素,该方法的识别度和可靠性较低。

2)基于代数特征[3]的方法。通过主成分分析(Principal Component Analysis,PCA)[4]、线性判别分析(Linear Discriminant Analysis,LDA)[5]等方法获取特征,对图片的灰度特征作代数变化处理,或者通过分解人脸图像构成的矩阵来实现。采用降维策略,线性结构时具有强大的功效,但面对非线性结构时,识别效果降低。

3)基于模型的方法。将人脸图像与数据库中所有的模板记录进行对比,选取最相似的模板作为待处理图像的分类。但数据库中图片数量是有限的,而且对背景、表情、光线、角度等条件很敏锐。这种理想状态的方法不适用于现实场景。

4)基于局部保值映射(Locality Preserving Projection,LPP)的方法。为克服非线性方法中存在的缺点,浙江大学何晓飞教授提出了LPP。降低空间维度的同时,能准确得到图像的局部特征结构,但不能提取图像的原有特征结构[6]。

5)基于神经网络[7]的方法。包括卷积神经网络、支持向量机等,采用降维方式,从原图中自动学习特征,但面对巨大的网络参数时,训练时间加长导致效率降低,或者产生过度拟合,使得测试准确性下降。因此,不适合现实应用。

6)基于稀疏表示[8~9]的方法。人脸识别中采用稀疏信号表示来处理问题,使得特征选择变得简单。但是,如何正确地计算稀疏表示是关键,而且该方法不能进行主动学习,必须要人工设置[6]。

由于非线性因素的影响,加上人脸识别自身的复杂性,训练大规模的人脸数据集、算法和计算性能等的制约,传统人脸识别方法存在的这些缺陷,极大降低了人脸识别的精度,间接导致很多研究者放弃使用这些方法。

3 人脸识别中引入深度学习技术

3.1 深度学习概述

深度学习也称为深度神经网络,其概念来自多伦多大学的Geoffrey Hinton等于2006年在《Science》上发表的一篇文章[10],通过神经网络模拟人脑的学习过程,采用无监督预训练方法,借鉴人脑的多层抽象思维对文本、语音、图像等数据或实际对象完成抽象表述,将特征提取器和分类器整合到一个学习架构中[11],进行特征提取时要避免过多的人为干预。

深度学习是机器学习中对数据进行自动学习的一种方法,“深度”表现在能对特征进行多次变换,深度的出现和快速发展,使得人们在很多研究和应用中能够从样本中无监督地学习到更能体现数据的本来特征[12]。输入原始数据到模型中,再对模型进行学习,得到适合分类的、具有表达性和推广性的特征表示[12]。常用的深度学习模型为多层神经网络,能逐层地对复杂数据进行特征提取,其功能非常强大。

深度学习网络的高层语义特征表现很突出,遇到缺少标记数据或大数据集等不易解决的问题时,能自动调整非监督数据来提高性能。深度学习算法已被大量应用在模式识别、图像分类、计算机视觉、人脸识别等领域并获取了极好的效果。

3.2 深度学习理论与人脸识别技术相结合

深度学习炙手可热主要包括三个原因:1)创新的算法;2)高计算机处理能力;3)能够训练大规模的数据集。

深度学习通过模拟人类大脑神经系统来处理消息,能较好地解决人脸识别中存在的复杂问题。在深度学习模型下,对大数据分析借助图形处理器构成的运算系统实现,能够直接从原图中学习具有判断性的人脸特征。在海量人脸数据时代,基于深度学习的人脸识别无论在速度还是准确性方面都已经取得了最好的效果[1],对深度学习的理论研究和人脸识别的实际应用具有极其重要的意义。

4 深度学习在人脸识别中的研究与应用

目前已有多种深度学习模型,最重要的两种方法是深度信念网络(Deep Belief Networks,DBN)和卷积神经网络(Convolutional Neural Network,CNN),下面主要介绍这两种模型在人脸识别上的研究与应用。

4.1 基于DBN的人脸识别技术

DBN是第一个被提出的深度学习模型,它由基本结构单元——受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)组成。RBM是深度学习中一块非常重要的奠基石,能够很好地拟合数据,通常用作非线性分类器。RBM在降维、分类、建模和特征学习等领域应用广泛。

相比传统神经网络,深度学习的一个重要优势是,很大程度上解决了低层神经网络的训练速度和精度问题。多层模型进行全局学习前,DBN会将神经网络分解为多个RBM的层叠,再对其进行逐层训练[13]。DBN为了准确描述特征结构,能自下而上学习各层的抽象特征,与代数特征方法不同,其特征提取不用人工来选择,完全采用自动学习来完成。文献[13]解决了深度学习在人脸识别姿态和分辨率上存在的问题。使用DBN在姿态映射和姿态分类处理中的应用,实验结果表明,基于DBN的姿态映射可以学习到侧面人脸图像到正面人脸图像的一个全局映射;基于DBN的姿态分类可以达到良好的性能。

DBN的一个缺陷是直接采用人脸图像的像素作为学习的输入,往往忽略了人像的局部特征,在姿态、光线、噪声等因素的影响下,输出的特征表达可能会对结果不利[14]。为了解决这个问题,文献[15]通过提取Gabor特征当作DBN的输入来进行人脸识别,识别率高达92.7%。文献[16]也提出一种基于Gabor小波与DBN相结合的人脸识别方法,有效提取人像的抽象特征,且很好地降低了姿态、光线等对识别率的影响,实现了对人像的准确识别。

4.2 基于CNN的人脸识别技术

CNN源自多层前向网络,通过多次卷积、激函数、池化等运算过程自动学习特征,是第一个真正训练成功的多层网络结构,数据越复杂,网络结构也越深。CNN类似于生物神经网络,其结构具有局部权值共享网络的特殊性,能降低网络模型的复杂度,减少权值的数量[16]。CNN具有特征提取、局部感知区域、结构层次化、共享卷积核、对高维数据处理无压力等特点,而且,CNN训练时所需参数数量比其他神经网络要少,增强了CNN的实用性。

CNN不用对复杂图像进行预处理,直接将图像的像素作为网络的输入,降低了传统人脸识别方法中提取特征和分类过程中重建数据的复杂度,多维图像作为输入时其表现更为明显,使得CNN在图像识别等分类学科领域获得广泛的应用。

采用CNN模型,文献[17]在LFW数据库上的人脸识别准确率高达97.45%,只比文献[18]中的人类视觉识别率97.5%略低。通过改进,学习非线性特征变换减小类内变化,并使得不同身份的人像间距保持不变,其在LFW数据库上的识别率提高到99.15%[19],超越了目前研究者们在LFW数据库以及所有领先的人脸识别算法的识别率[1]。

5 结语

本文对基于深度学习理论的人脸识别技术进行了综述,传统人脸识别技术存在一些问题,将基于深度学习的技术引入到人脸识别中,详细讨论了当前应用最多的两种模型DBN和CNN。从国内外研究现状来看,基于DBN和CNN的人脸识别技术已被广泛运用,并取得良好的效果。但是,二者也存在相同的问题,很难彻底解决小样本情况下识别率普遍偏低的问题,所以,DBN和CNN更适合大数据集。

相对其他机器学习的人脸识别方法,深度学习的优势在于自动提取特征且能力非常强大,能处理各类复杂的数据,能构造各种精确的模型等。深度学习也存在一些缺点,例如:计算复杂度高,训练时间比较长;模型参数过多,进行优化时需要不断迭代;不确定是否能得到全局最优解等。当然,深度学习和人脸识别技术都在不断发展和继续研究中,基于深度学习的人脸识别算法的准确率也不断被提升。未来,安防人脸检测和识别、公共场所实时监控等领域对人脸识别的精确性要求更高,后续的研究将是在复杂度更高,包括人脸在光照、姿态、表情、遮挡及脉冲类噪声干扰等情况下改进算法、提高人脸图像的识别率,进一步提高人脸识别效率;为适应大数据时代的发展,进一步丰富数据库资源,这项工作将具有很大的挑战性;基于深度学习理论的人脸识别还要跟其他方法相结合,更好更快推动人工智能的发展。

猜你喜欢
识别率人脸人脸识别
人脸识别 等
玻璃窗上的人脸
人脸识别的“国标”来了
智力考场:有趣的图片测试
荣耀畅玩7C:人脸识别
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
人工智能现状和发展
“领家系”可爱脸VS“高冷系”美人脸