基于深度学习的人脸识别研究

2019-12-13 07:18张广才何继荣高文朋
无线互联科技 2019年19期
关键词:卷积神经网络人脸识别深度学习

张广才 何继荣 高文朋

摘   要:基于深度学习的人脸识别技术是目前人工智能和图像领域研究的热点之一,尤其随着近年来深度神经网络的发展,人脸识别的准确性和有效性得到了极大的提高。文章首先简要阐述了人脸识别技术的研究和发展历史,接着叙述了人脸识别的技术流程,随后详细介绍了在人脸识别中常用到的卷积神经网络。由于各大企业在人脸识别领域取得丰硕的研究成果,因此,也对人脸识别的产品和公司进行了简单介绍。最后,对人脸识别技术存在的不足和发展前景进行了总结和展望。

关键词:人脸识别;深度学习;卷积神经网络

人脸识别的研究历史较为久远,最早可以追溯到20世纪50年代,布莱索(Bledsoe)等利用人脸的几何结构特征提取出特征向量[1],并进行分析匹配。20世纪末期,人脸识别技术的发展出现了一次小高潮,线性子空间判别分析[2]、统计模式识别方法[3-4]和隐马尔可夫模型[5]等技术不断涌现,将人脸识别技术的发展推向了一个新的阶段。

进入21世纪,人脸识别的研究不断深入,其研究方向更加趋于真实条件和场景下的人脸,新的特征表示和数据源促进了技术的发展[6],尤其是深度学习的出现,大大提高了特征模型的精确度。同时,随着GPU高性能计算的飞速发展以及训练数据的不断增加,深度学习在人脸识别领域的时间效率和准确度也不断提高[7]。

1    人脸识别技术

1.1  人脸识别流程

所谓人脸识别,就是指使用摄像机或摄像头采集包含人脸的图像或视频流,并自动检测、跟踪图像中的人脸,进而对检测到的人脸图像进行一系列的相关应用操作[8]。从技术上来讲,它包括图像采集、特征定位、身份的确认和搜索等。简而言之,人脸识别是从人脸图像中提取面部特征,如嘴角、眉毛的高度等,并通过特征比较来输出结果。

人脸识别技术的流程如图1所示。输入一张待验证的人脸图像,首先,提取图像的人脸特征,包括全局特征、局部特征等;其次,与对比库中的多个人脸图像特征分别进行比对,从中找出最相似的特征;再次,与预算的阈值进行比较;最后,输出特征对应的身份信息[9]。

传统的人脸识别方法包括:支持向量机、线性判别分析等,但准确率不高。目前,广泛使用深度学习的框架,运用大量图像人脸数据来进行模型训练,获取到人脸特征或关键点。其中,关键点定位是核心技术,增加用于定位的关键点数量,识别的准确度就相应提高。比如商汤科技产品采用眼、口、鼻轮廓等人脸21,106,240 3个不同量级的定位关键点,可以适用于不同的应用场景,且能够应对各种实际问题,比如大表情变化、大角度侧脸、面部遮挡、模糊以及明暗变化等。

1.2  基于深度学习的人脸识别框架

目前,在众多深度学习模型中,卷积神经网络(Convolution Neural Network,CNN)模型是研究热门,且发展较为成熟。尤其在计算机视觉领域,卷积神经网络应用十分广泛且效果显著,因此,卷积神经网络成为图像识别和检测等有关问题的首选技术,各大IT巨头也竞相研究。相比于传统的人脸识别算法,它可以直接输入原始图像,不需要对图像进行复杂的前期预处理,并能自动提取高维特征。同时,卷积神经网络的权重共享机制简化了神经网络结构[10],能提取高层特征,提高特征的表达能力[11]。

一个典型的卷积神经网络包含5个部分,分别是:原始输入层、卷积层、池化层、全连接层和分类层[11],如圖2所示。(1)输入层,是整个神经网络的输入,一般表示为一张图片的像素矩阵。(2)卷积层,是卷积神经网络最为核心的概念,逐个分析图像中的每一批像素块,提取局部特征。(3)池化层,不改变三维矩阵的深度,但可以缩小矩阵尺寸。池化操作可以被看作是降低了图片的分辨率,该操作可以将无用信息过滤掉,减轻整个神经网络的计算负担,同时将有用信息筛选出来,传递给下一层。(4)全连接层,经过多次卷积和池化操作之后,全连接层给出最后的分类结果,可以认为此时图像中的信息已被抽象成信息含量更高的特征。卷积层和池化层可以被视为自动图像特征提取的过程。(5)分类层,特征提取完成后,分类任务仍然需要由全连接层来完成。Softmax层主要用于分类问题,经过Softmax层,可以获得当前样本中不同种类的概率分布。

2    基于深度学习的主流产品比较

近年来,计算机视觉和深度学习的发展迅猛,仅2011—2016年成立的人脸识别公司就超过30家。国内的主流公司及产品都是基于深度学习技术研究开发的,如表1所示,其中,依图科技的算法在国内排名第一。

2018年11月16日公布的最新报告显示,全球范围内最高水平的人脸识别算法可在千万分之一误报率的前提下,实现漏报率降低至0.4%,这表示在千万分位误报率时,识别准确率已超99%。相比于2017年同期相同误报率下3.3%的漏报率,其性能提升了80%。

许多全球知名的IT公司,诸如Facebook,Google,Microsoft等,争相推出了各自的深度学习技术平台,不仅减少了其他企业在人工智能领域的研发投入,而且激励了人脸识别技术的创新和发展。

当然,现阶段的技术水平仍然有限,比如基于人脸识别的智能门禁系统的目的是只允许授权人员进入特定区域,需要人脸识别技术提供高水平、长时间的准确性保障,且能抵抗技术手段欺骗。但就目前的实际效果而言,错误还不能完全避免。

所谓动态活体检测技术,就是让用户根据随机指令做出相应的动作,来大幅减小人脸“造假”的可能性。如果用乳胶或硅胶材质做成的,或者3D打印而成的立体面具来攻击人脸识别系统,识别失误还是会存在的。

據报道,2018年Bose开发了基于神经网络的约束运算对人脸探测器的对抗攻击算法[12],通过动态方法破坏人脸识别系统的检测管道,使得识别成功率降低至0.5%,将严重威胁人脸识别的安全。

3    人脸自动识别技术所存隐患及改进措施

科技发展日新月异,人脸自动识别技术发展势头迅猛,成就非凡,但在实际场景应用中仍存在困难和部分安全隐患。人脸识别主要由两种方法构成:(1)人脸比对,即判断待验证的人脸是否为本人。人脸比对非常简单,有一张本人的照片即可轻松破解。(2)活体检测,即判断待验证的人脸是否真实、有效。活体检测环节原本是人脸识别的一大保障,但是破除方法也非常简单,只需一个人带上另一个人的头像照片制成的立体面具便能通过[13],整个人脸识别也就名不副实,一个高科技支持的智能手段,变成了一个不安全的陷阱。人脸识别商业化程度越来越高,在金融、安防、社交等领域的应用日益广泛,各大厂商现阶段仍需对人脸识别有所提防,防止人工智能发展过快带来安全隐患。因此,在应对隐私、支付等安全性需求较高的实际场景时,注意将多种生物识别技术相融合,这样安全系数就会大幅提升[14]。

人脸自动识别技术不仅要准确、高效地完成人脸识别,还要能持续、稳定地工作,以满足安全性需求,需要对以下几个方面进行改进:

(1)进一步深入研究卷积神经网络与基于稀疏表示的分类方法[15]等其他算法的融合,更加全面地描述人脸特征,尤其是更加复杂、不敏感的特征,最终提高人脸识别的安全性与准确性。

(2)发展多特征融合和多分类器融合方法,以改善人脸识别性能[16]。

(3)由于人脸具有非刚体性,不同人脸间存在着不同程度的相似,受各种变化因素的影响,准确识别人脸仍存在一定的困难,进一步确保信息安全是人脸识别技术的发展趋势。多种生物识别相融合是很好的手段,比如可以考虑人脸识别与虹膜识别、指纹识别、声纹识别等技术相融合。

(4)三维形变模型可以应对多种变化因素,具有很好的应用前景。研究表明,采用模拟或补偿的方法应对各种变化因素效果良好,但如何高效提取三维人脸特征还处于探索阶段,需要在深入研究传统识别算法和分析大量人脸数据基础上进行改进和创新。

4    结语

综上所述,人脸识别至今仍是一个极具挑战性的领域,如果仅用现有的一种办法,识别效果实在不尽如人意。因此,如何提高人脸识别的准确率和识别速度、加强人脸识别产品的性能稳定性、制定行业标准、进行技术创新或改进以及保障数据安全和用户隐私等,都是值得研究的课题。

[参考文献]

[1]张翠平,苏光大.人脸识别技术综述[J].中国图象图形学报,2000(11):885-894.

[2]刘青山,卢汉清,马颂德.综述人脸识别中的子空间方法[J].自动化学报,2003(6):900-911.

[3]YANG M H,AHUJA N,KRIEGMAN D.Face recognition using kernel eigenfaces[C].Florida :International Conference on Image Processing IEEE,2000.

[4]BARTLETT M S,MOVELLAN J R,SEJNOWSKI T J.Face recognition by independent component analysis[J].IEEE Transactions on Neural Networks,2002(6):1450-1464.

[5]SAMARIA F S.Face recognition using hidden markov models[J].Phd Thesis Univ of Cambridge,1995(6):70-81.

[6]ZHAO W,CHELLAPPA R,PHILLIPS P J,et al.Face recognition:a literature survey[J].Association for Computing Machinery Computing Surveys,2003(4):399-458.

[7]HUANG T,XIONG Z,ZHANG Z.Face recognition applications[M].London:Handbook of Face Recognition,2011.

[8]畅健.人脸识别在地铁公安通信系统中的需求分析及实施建议[J].智能建筑与城市信息,2015(1):79-81.

[9]JAIN A K,ROSS A,PRABHAKAR S.An introduction to biometric recognition[J].IEEE Transactions on Circuits and Systems for Video Technology,2004(1):4-20.

[10]DONG C,LOY C C,HE K,et al.Learning a deep convolutional network for image super-resolution[J].IEEE Transactions on Circuits and Systems for Video Technology,2014(5):44-47.

[11]ZEILER M D,FERGUS R.Visualizing and understanding convolutional networks[J].IEEE Transactions on Circuits and Systems for Video Technology,2013(6):88-90.

[12]BOSE A J,AARABI P.Adversarial attacks on face detectors using neural net based constrained optimization[J].IEEE Transactions on Circuits and Systems for Video Technology,2018(22):60-66.

[13]許晓.基于深度学习的活体人脸检测算法研究[D].北京:北京工业大学,2016.

[14]赵秀萍.生物特征识别技术发展综述[J].刑事技术,2011(6):44-48.

[15]马晓,张番栋,封举富.基于深度学习特征的稀疏表示的人脸识别方法[J].智能系统学报,2016(3):279-286.

[16]孙劲光,孟凡宇.基于深度神经网络的特征加权融合人脸识别方法[J].计算机应用,2016(2):437-443.

Abstract:Face recognition technology based on deep learning has been one of the focuses in the field of artificial intelligence and image research. Especially with the development of deep neural network in recent years, the accuracy and effect of face recognition have been greatly improved. In this paper, firstly, the history of face recognition is briefly introduced, and then describe the technological process of face recognition and the convolutional neural network commonly used in face recognition. Because of the fruitful research results of face recognition in major enterprises, the products and companies of face recognition are introduced briefly. Finally, the shortcomings and development prospects of face recognition are summarized.

Key words:face recognition; deep learning; convolutional neural network

猜你喜欢
卷积神经网络人脸识别深度学习
人脸识别 等
揭开人脸识别的神秘面纱
基于深度卷积神经网络的物体识别算法
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于类独立核稀疏表示的鲁棒人脸识别
基于K-L变换和平均近邻法的人脸识别