基于深度学习的人脸图像年龄估计

2019-09-10 04:52李珏卢鹤

现代信息科技 2019年18期

李珏卢鹤

摘要：人脸图像能够表现大量生物学上的复杂信息，从人脸图像中对人物的年龄进行估计有助于机器视觉在安防、预测等方面的应用。本文提出了一种新的深度神经网络，利用卷积神经网络对人脸图像进行特征提取，结合多层自编码器实现对不同年龄层的分类。同时对提取的人脸特征进行统计，分析随人物衰老变化较大的神经元。在FG-NET数据集上获得了较高准确率。

关键词：深度神经网络;人脸图像;年龄估计

中图分类号：TP391 文献标识码：A 文章编号：2096-4706（2019）18-0040-03

Abstract：Face images can represent a large amount of complex biological information. Estimating the age of human from face images is helpful for the application of machine vision in security，prediction and so on. In this paper，a new depth neural network is proposed，which uses convolution neural network to extract features from face images and combines with multi-layer self-encoder to classify different age levels. At the same time，the extracted facial features are counted and the neurons which change greatly with the aging of the characters are analyzed. High accuracy is obtained on FG-NET dataset.

Keywords：deep neural network;facial images;age estimation

0 引言

人脸图像相比虹膜、指纹识别更加直观，并具有社会属性，是辨别身份最常用的特征[1]，目前，基于机器学习的人脸识别已取得了巨大进步，准确率已经超越人类，并广泛应用在了工业级产品中[2]。

大数据环境和深度学习的结合，为人工智能在人脸图像上的应用提供了有利的条件。相比以往的浅层学习，深度学习构建了多层神经网络，因此得以从大量数据中学习到更本质的特征。

人脸在成熟和衰老的过程中会因人而异地产生变化，这一变化很早就引起了人们的关注[3]。本文通过构建深度神经网络，提取人物特征，并在FG-NET数据集上以年龄为标签训练神经网络，实现对人脸图像中人物的年龄估计。

1 深度学习

机器学习的目的是利用从数据中学习的特征，对新样本做出推理或者预测。图像数据计算量大，且具有冗余性，以往的人工特征，如SIFT特征点、LBP特征等虽然能很好地描述图像的某些特征，但都极大地依赖特征的提取和选择。浅层的机器学习算法如支持向量机（SVM）、线性回归、聚类、逻辑回归等虽然能够结合人工特征提升计算机视觉的准确率，但由于算法表達复杂函数的能力有限，难以学习到隐含在数据中的特征[4]。

深度学习通过提高非线性运算的组合水平、加深网络结构来实现对大量数据的特征学习。其模拟人类的视觉分层系统，随着层次的加深对数据的内容逐步抽象，直至语义层面[5]。深度学习的进步也得益于大数据时代和计算机硬件的发展。

1.1 深度神经网络

深度神经网络是为了学习数据的特征的复杂非线性模型，假设模型为hw，b（x），则模型中的（w，b）就是网络要学习的用以拟合数据的重要参数。

经过卷积和池化的特征最终会加入全连接层，用于分类或其他任务。卷积操作实际是对图像的局部特征放大的过程，得到的特征在深一层的神经网络里可以与其他神经元共享，这样的并行学习使得网络可以高效提取图像特征。

2 人脸图像的特征提取

本文设计了深度卷积神经网络用以提取人脸图像特征并识别人物，结合自编码器实现了年龄估计。

2.1 构建深度神经网络

利用图1所示的深度卷积神经网络提取人脸图像的特征。人脸图像经过深度卷积神经网络计算得到160维的特征向量，经过自编码器进一步降低维度，最终得到一个80维的全连接特征向量。

2.2 有监督训练

大量数据和复杂问题更有利于性能良好的神经网络的训练[8]，著名的人脸数据库有LFW、CelebFaces、YouTube Face等。选取YouTube Face（1595个人物，624552张照片）训练本网络，预处理包含检测、剪裁处理，统一图像尺寸。分别将训练集和测试集数目设为32000和7875张，网络训练过程如图2所示，其测试识别率最终达到93.7%。

3 人脸图像的识别与年龄估计

测试数据集采用针对年龄变化的著名数据库FG-NET[9]，包含82个人物的1002张图片。

3.1 数据预处理与标签

FG-NET数据具有以下特点：年龄跨度大，图像受表情、光照、眼镜、发色等干扰，且质量、尺寸有所不同。在预处理时，将统一成（47×55×3）像素的图像作为神经网络的数据源。

数据库对年龄跨度没有设置规则。例如图像中某些人物的年龄从幼年直至老年，也有的人物仅有部分中年图像，且各自数量不同。

根据日常经验，本文认为人在中青年时的一段时间面容变化最小，在幼年和老年面容变化较大。在设定数据标签时，按近似正态分布的方式给定。假设要将年龄细分为n个层级，则用n的中位数标记30～50的年龄段，再向两侧分别标记。

3.2 实验结果与分析

如图1所示，经过神经网络计算，最终获得一个80维的向量进入Softmax回归做分类计算。计算所得的是输入的x分属于某一个人在年龄阶段标签的概率p（y= PersonalAgej|x），实验结果如图3所示。

在实验中，对年龄分层的多少直接影响了年龄估计的准确率。当分层为3时，即认为每个人物有幼年、青年、老年三种状态，识别率为83.6%，分层为15时，则将人物年龄标记为15个不同标签，识别率为53.6%。实验过程中，神经网络对同一人物的识别率一直保持较高水平。以分层为6为例，实验中的部分结果在表1、表2中显示。

神经网络输出的特征向量具有很强的表达能力，在训练中由于运用年龄作为一种依据，响应大特征的表达体现了衰老。如图4所示，某些神经元表现出对年龄极大的响应，某一些却不敏感。

4 结论

本文设计了一个新的深度神经网络，利用卷积神经网络提取人脸图像的特征，结合自编码器，最终实现从人脸图像中识别人物和估计人物年龄。并针对年龄改变而带来的人脸变化，对敏感神经元进行分析。

在今后的工作中，可以通过提升网络构建提升对年龄估计的准确率，并广泛收集数据，使用更优良的数据库训练神经网络。在对神经元进行分析后，可以在后续的工作里对敏感神经元加以深入研究，并利用不同神经元的表达重点提升网络性能。

参考文献：

[1] Jain Ak，Ross A，Prabhakar S. An Introduction to Biometric Recognition [J].IEEE Transactions on Circuits and Systems for Video Technology，2004，14（1）：4-20.

[2] 王晓刚，汤晓鸥.从统一子空间分析到联合深度学习：人脸识别的十年历程 [J].中国计算机学会通讯，2015（4）：8-15.

[3] Ramanathan N，Chellappa R. Face Verification across Age Progression [C]// Computer Vision and Pattern Recognition，2005. CVPR 2005. IEEE Computer Society Conference on. S.l.：s.n.，2005：462-469.

[4] 何清，李宁，罗文娟，等.大数据下的机器学习算法綜述 [J].模式识别与人工智能，2014，27（4）：327-336.

[5] 刘建伟，刘媛，罗雄麟.深度学习研究进展 [J].计算机应用研究，2014，31（7）：1921-1930+1942.

[6] Bengio Y，Lamblin P，Popovici D，et al. Greedy layer-wise training of deep networks [J]. Advances in Neural Information Processing Systems，2007，19：153-160.

[7] Fukushima K. Neocognitron：A Self_organizing Neural Network Model for a Mechanism of Pattern Recognition Unaffected by Shift in Position [J].Biological Cybernetics，1980，36（4）：193-202.

[8] Hinton G E，Osindero S，Teh Y W. A fast learning algorithm for deep belief nets [J].Neural Computation，2006，18（7）：1527-1554.

[9] Lanitis A. Evaluating the performance of face-aging algorithms [C]// IEEE International Conference on Automatic Face & Gesture Recognition，2009.

作者简介：李珏（1990-），女，汉族，山东青岛人，助理工程师，硕士研究生，研究方向：武器装备信息化、机器学习;卢鹤（1991-），男，汉族，北京人，助理工程师，硕士研究生，研究方：软件工程。

现代信息科技2019年18期

现代信息科技的其它文章: 基于百度AI的校园服务小程序的设计与实现; 设置公交专用道的交叉口群交通组织及绿波协调; 视障人群获取文件信息的系统设计与实现; 城市轨道交通列车折返效率相干因素的分析; 基于J2EE的师生教学娱乐一体化系统的设计与实现; “帮帮”大学生互助APP的设计与研究