基于大数据的深度学习技术在人脸识别中的应用

2018-05-08 12:24金诗谱张书茂
关键词:人脸人脸识别深度

金诗谱 康 彦 张书茂

(安徽城市管理职业学院,合肥 230001)

大数据技术的发展与应用,推动着各领域信息技术的迅速发展,大量的数据不断更新并支撑起各种数据库。这些数据如果能得到充分利用,将会带来巨额的价值回报。深度学习是当前发展起来的机器学习新技术,在语音识别、计算机视觉等领域的应用正逐渐深入。深度学习的概念源于人工神经网络技术,其结构是一种深层次的学习结构。通过深度学习,可将较低层次的特征整合成更抽象的高层表示属性或特征类别。深度学习可研究非线性结构问题,实现复杂函数的近似表达,得到分布式特征表示,同时能较强地学习样本集的基本特征[1]。深度学习技术的应用,极大地推动了人脸识别技术的进步,其人脸特征表达是传统手工特征表达无法企及的。在此,介绍深度学习的基本概念,并融合大数据和深度学习的优势,探讨基于大数据的深度学习技术在人脸识别中的应用。

1 深度学习结构

深度学习结构可归纳为3种经典结构:生成性深度结构、区分性深度结构和混合性深度结构。

1.1 生成性深度学习结构

该结构可用于观察信息及其对应类的联合概率分布,或者对信息的高阶相关属性进行描述。因为不关注数据的标签,很多人常常采用非监督特征学习模式。与区分性深度结构的区别在于,生成性深度结构能够得到标签和观察信息的概率分布情况,有利于对概率进行估算。深度学习算法中的DBN(深度信念网络)就是生成性深度结构,一连串RBM(限制波尔兹曼机)单元构成了DBN[2]。RBM是传统的神经网络,其中有2个层彼此相连,通过隐层单元可以得到可视单元的高阶相关性。与常规信度网络不同的是,RBM更容易对权值实现快速学习。

1.2 区分性深度学习结构

区分性深度结构主要用于对数据的后验分布进行常规描述。历史上第1个实现多层网络结构训练的算法是CNNS(卷积神经网络)。CNNS算法是区分性训练算法,可以通过此算法获得变换不变性特征,而无法通过DBNS(动态贝叶斯网络)算法获得。经过研究,LE Cun等人成功训练了卷积神经网络[3]。CNNS算法功能强大,在大多实验中表现出良好的性能,多应用于图片识别、分类等技术领域。

1.3 混合型深度学习结构

混合型深度学习结构的最终目标是识别数据,重点在于区分数据。混合型深度学习结构有2种,一种是生成性结构,另一种是区分性结构。当运用生成性深度结构解决分类问题时,可以在网络权值优化预训练阶段与判别模型相结合使用。比如,深度神经网络可以通过深度信念网络预先训练而得到。BP算法能够用于优化DBN的权重,其初始权重来自RBM和DBN预训练,而非随机生成。相较于前馈神经网络,BP算法训练及收敛的时间效率都得到了提高。

2 深度学习模型

2.1 自动编码

假设输入和输出有一致性,在此前提下改变参数进行训练,获取每层的重量,同时会得出输入I的多种不同表示,即所需特征。研究发现,若在原有的特征里增加一些自动学习获得的特征,则实验效果明显提升[4]。这种方法称为自动编码(Auto Encoder)。

2.2 稀疏编码

通常哺乳动物眼睛所看见的画面是由很多像素组成,这些画面重建和存储的变换过程比较简单,这种变换称作稀疏编码(Sparse Coding )。经典的稀疏编码流程由Training部分和Coding部分组成:

(1) Training部分。指定训练样本[p1, p2, …, pm(in Rd)],训练字典基 [q1,q2,…,qm(also in Rd)]。

(2) Coding部分。采取优化的方法获取所测试数据的codes。

2.3 受限玻尔兹曼机

受限玻尔兹曼机(RBM)是一种随机生成的神经网络,主要通过对输入数据集的概率分布进行学习。受限玻尔兹曼机是波尔兹曼机的变化形式,其合格模型只能采用二分图。该模型包含相应参数的输入单位以及对应训练结果的隐藏单位。图中的每个边缘要求连接到可见单元和隐藏单元。这种限制使得它比常规玻尔兹曼机的训练算法更加有效,尤其是比以梯度为基础的对比分歧算法更有效。

3 基于大数据的深度学习人脸识别新模式

当前,传统的深度学习人脸识别技术,通常基于常规人脸数据库,如ORL人脸图像库(见图1)。

图1 ORL人脸图像库部分图像

直接将深度学习算法应用于人脸识别,效果不佳。当缺乏足够强大的数据库训练支撑时,传统的深度学习应用于人脸识别时存在较大的局限性。在此,提出一种新的人脸识别模式,即基于大数据的深度学习人脸识别模式(见图2)。

基于大数据技术,利用数量庞大的cpu,对海量的人脸图像大数据进行特征训练,得到新型人脸特征数据库,最终大幅提高人脸图像识别的准确性。与传统的深度学习人脸识别模式相比,基于大数据的深度学习人脸识别模式是在海量的大数据基础上,通过深度学习进行特征训练,最终得到拥有海量数据的人脸特征数据库,从而更有效地提高了人脸识别的准确率。不过,此类识别实验计算量巨大,对硬件的需求量也大,需要通过分布式的系统进行并行计算来完成,一般小规模公司很难完成。Google所做的猫脸实验就是一个简单的识别数据训练雏形,一般小规模公司很难完成。Google使用拥有16 000个中央处理器的服务器来训练学习数据库,得到准确的识别结果。

图2 基于大数据的深度学习人脸识别模式

采用常规稀疏编码方法,分别使用新识别模式和传统识别模式对随机人脸进行识别对比。设置65、70、75、80、85、90等阈值,以此阈值为基准数据,对比2种识别模式下的误识率和识别通过率(见图3、图4)。

图3 新模式和传统模式误识率对比

由图3可以看出,传统模式下的误识率更高,而且随着阈值的不断提高,后期误识率不断升高;而新模式下误识率较低,且随着阈值不断提高,误识率呈下降趋势。新模式与大数据相结合,其优势非常明显。

由图4可以看出,传统模式下识别通过率较低,且随着阈值不断提高,识别通过率下降幅度增大;而新模式下的识别通过率相对很高,且随着阈值不断提高,识别通过率只是缓慢下降。

图4 新模式和传统模式通过率对比图

因此,新模式下的人脸识别误识率和识别通过率,均比传统模式更有优势。

4 结 语

人脸识别技术是实用性非常强的一项技术,在各领域的应用非常普遍。随着深度学习技术的不断深入发展,各种新的算法不断出现。同时,随着大数据技术的不断发展,海量的数据就像黄金一样宝贵,等着我们去积极探索。大数据技术与深度学习技术相结合的人脸识别新模式的应用,将会极大地推进人脸识别技术的发展。

[1] 赵丹丹.基于深度学习的掌纹识别算法研究[D].呼和浩特:内蒙古农业大学, 2016:10-20.

[2] 赵玮,徐良杰,冉斌,等.基于深度学习DBN算法的高速公路危险变道判别模型[J].东南大学学报(自然科学版),2017,47(4):832-838.

[3] 梁锡军.稀疏优化在机器学习中的若干应用[D].大连:大连理工大学,2013:10-20.

[4] 冯子勇.基于深度学习的图像特征学习和分类方法的研究及应用[D].广州:华南理工大学,2016:1-10.

猜你喜欢
人脸人脸识别深度
人脸识别 等
有特点的人脸
一起学画人脸
深度理解一元一次方程
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
深度观察
深度观察
三国漫——人脸解锁
深度观察