基于目标检测模型的人脸识别技术

2019-09-10 05:45孙彦丁学文雷雨婷
计算机与网络 2019年22期
关键词:卷积人脸神经网络

孙彦 丁学文 雷雨婷

摘要:为了改善当前人脸识别技术存在准确率低、算法运行速度慢和无法识别多个目标的问题,提出一种基于目标检测模型SSD_MobileNetv1的人脸识别方法,搭建Tensorflow Object Detection API框架,對人脸图像进行数据清洗和过滤来减少噪声对识别的影响,用MobileNetv1网络对图像进行特征提取,输入至SSD网络进行训练,使用梯度下降法优化训练网络中的权重。实验结果表明,多人脸识别目标定位准确、识别准确率高及模型训练的收敛速度加快,具有鲁棒性。

关键词:人脸识别;SSD_MobileNetv1神经网络;数据清洗;梯度下降

中图分类号:TP391文献标志码:A文章编号:1008-1739(2019)22-68-4

0引言

人脸识别是基于对人的脸部特征信息来识别身份。在当今这个处于大数据和云计算的社会,人脸识别在现实社会中的应用相当广泛,例如在火车站安检、公安系统、视频会议及医疗等方面,人脸识别技术正逐步成为智能化领域的研究课题[1]。

传统的人脸识别算法包括PCA[2],LDA[3],LBP[4]等,在提取特征和准确度方面均存在一定不足。杜翠凤采用深度卷积对抗神经网络对多状态自适应的人脸识别,准确率达75.87%[5];胡少聪将卷积神经网络和SIAMESE网络进行了组合,对不同部位及尺度的人脸图像训练从而实现人脸识别,达到81%的准确率[6];利用yolo_v2对多个人脸进行识别,发现对人脸目标的定位不准确,且识别的准确率不够高。

虽然现在人脸识别技术在准确度方面有所提升,但对于内存资源占用量大、运行效率慢以及多人脸图像的识别仍然存在欠缺。针对上述问题,提出一种在Tensorflow Object Detection API框架下,利用目标检测模型SSD_MobileNetv1生成先验框判断不同尺度目标识别多个目标的特点,以及深度分离可卷积网络减少网络参数的特点,识别在不同表情、装扮、光照等常见场景下的多人脸目标,该方法提升了识别准确率,加快了模型训练时的收敛速度。

1 SSD_MobileNetv1网络模型

SSD_MobileNe tv1网络模型以SSD为基础,在MobileNetv1骨干网络的conv13层后添加8个卷积层,抽取6层用作检测层[7]。SSD_MobileNetv1结合SSD和MobileNetv1网络,用3伊3大卷积核对各个通道输出进行卷积和分解来提取特征学习,在深度卷积层和点卷积层后连接批规范层和relu函数来保证良好的精确度,再由点卷积执行特征融合进入卷积网络,对特征进行筛选和映射,将特征输入到网络进行训练以更新权重值,减少参数运算量,实现模型运行的加速。

1.1 SSD卷积神经网络

SSD卷积神经网络模型是利用单个深度神经网络进行对象检测的框架[8]。SSD变VGG原结构的2个全连接层为卷积层,删除Dropout层,增加3层卷积和1层池化,在各个卷积层的feature map上构造不同的Bounding Boxes(BB)进行检测,生成多个BB,利用NMS得到最终BB集合,提升模型精度和检测能力。

SSD利用生成锚框的思想来生成先验框,采用多尺度训练方式,将不同大小默认框应用在特征图上以离散化输出框形状,来满足真实目标形状多变的情况,SSD先验框生成图如图1所示。

将其翻转后得到另一个宽和高互换、面积相同的长方形。先验框大小随不同的特征图和长宽比不断变化,预测多个先验框有效判断目标的多种形状,兼顾各个尺度的目标,实现在多个尺度的特征图上执行检测目标工作。

1.2 MobileNetv1网络

MobileNetv1网络模型是Google提出的使用深度可分离卷积来构建轻量级的深层神经网络。优点在于分解卷积核,将标准卷积分解成深度卷积和点卷积,深度卷积将每个卷积核应用到每个通道,用单个卷积核对单个通道进行卷积,得到输入通道数的深度,再利用点卷积对深度卷积的输出线性结合从而产生新的特征[7]。这种分解可有效降低模型规模,减少网络参数。深度分离卷积示意图如图2所示。

SSD_MobileNetv1网络利用深度分离可卷积的特性将原有的冗余参数用小规模参数来替代,降低计算量和硬件内存资源消耗,收敛速度加快,有效控制过拟合。

2系统设计与实现

2.1人脸识别系统设计

本文设计的人脸图像识别系统分为3个模块,系统的实现框图如图3所示。第1个模块是数据集构建模块;第2个模块是网络训练模块,利用SSD_MobileNetv1网络提取图像特征,进行特征融合,完成网络模型的训练;第3个模块是人脸识别模块,将测试图像输入到已经完成训练的网络中进行计算,得到识别结果。

2.2人脸图像预处理

本次实验图像数据来自Wider face数据集,图片高达3万张,包含了40万张人脸,囊括了各个尺度、装扮、光照及表情等常见的场景。

实验之前,考虑到图像具有随机性,图片尺寸大小不一,重复率较高等问题,需要对图像进行预处理。首先,利用数据清洗处理缺失值、平滑噪声、识别和删除离散值[9],采用过滤和锐化操作增强图像边缘细节,可以有效提高图像质量和图像利用率。

Wider face數据集自带含原始图片的名称与路径以及人脸框坐标大小的txt文件,将含有图像标注信息的txt文件转换为XML文件以提供交换和描述独立于应用程序的结构化数据。

此外,还需将XML文件转换为tfrecord格式,可以把图片数据信息和标签一同存储,可以快速在TensorFlow中实现复制、读取和存储等操作,达到加速模型读取和训练的效果。

3实验仿真

3.1系统实验

3.2实验结果与分析

利用可视化工具Tensorboard查看网络的性能,有效显示网络训练期间各种指标随时间的变化趋势信息。随着训练次数的增加,训练的损失呈现下降趋势,网络的良好性能优势得以体现,图像的失真率在减小,图片识别的效果逐步提高。

选取了含有多个目标的人脸图像对训练好的人脸识别模型进行测试,来验证模型的识别率,识别效果如图4所示。

从识别效果图发现,尽管测试图像存在干扰背景,但SSD_MobileNetv1网络模型依然能准确识别图像中的多个人脸目标,并且识别率较高。

图5是2种模型识别结果对比,图5(a)是在yolov2模型下的识别效果图5(b)是SSD_MobileNetv1网络下的识别效果。为了提升对训练图像的分辨率,人脸识别一般会采用yolov2模型进行实验,yolov2模型对人脸识别存在召回率以及定位能力提高的优势,但图5(a)中人脸没有全部检测出来,且识别的准确率也是低于5(b)的。

比较在SSD_MobileNetv1网络和yolov2模型的识别率,结果如表1所示。

以上测试结果表明,SSD_MobileNetv1网络对多个人脸共存图片具有较好的目标定位效果,符合现实场景中多个个体出现,定位准确且识别精确度比较高。

4结束语

本文给出了一种基于目标检测模型SSD_MobileNetv1的人脸识别,介绍了图像数据清洗等预处理操作和SSD_MobileNetv1神经网络的基本概念,介绍网络训练以及运用梯度下降法更新网络训练的权重,最后介绍了对人脸识别模型的测试和分析。实验结果表明,本文方法对多人脸图像中的人脸目标定位准确,且模型训练收敛速度较快。后续的工作是继续优化模型的性能,以求获得更高的鲁棒性,并将模型移植到手机等设备上,充分发挥其实用价值。

参考文献

[1]安大海,蒋砚军.基于BP神经网络的人脸识别系统[J].软件, 2015,36(12):76-79.

[2]曾建凡.多角度人脸检测与识别方法研究[J].电子设计工程, 2017,25(11):41-44.

[3] Chen L F, Liao H YM, Ko M T, et al. A New LDA-based Face Recognition System Which Can Solve the Small Sample Size Problem[J]. Pattern Recognition,2000,33(10): 1713-1726.

[4] Ahonen T, Hadid A, Pietikinen M. Face Description with Local Binary Patterns: Application to Face Recognition[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2006, 28(12):2037-2041.

[5]杜翠凤,温云龙,李建中.基于深度卷积对抗神经网络的多状态自适应人脸识别方法[J].移动通信,2019,43(9):75-78,85.

[6]胡少聪.基于深度学习的人脸识别方法研究[J].电子科技, 2019,32(06):82-86.

[7] Howard A G, Zhu M, Chen B, et al. MobileNetsV1: Efficient Convolutional Neural Networks for Mobile Vision Applications[J]. Computer Science -computer Vision and Pattern Recognition,2017:1704-1712.

[8] Liu W, Anguelov D, Erhan D, et al. SSD: Single Shot Multi Box Detector[C]// European Conference on Computer Vision, Springer,2016:21-37.

[9] Meisler Steven L, Kahana Michael J, Ezzyat Youssef. Does Data Cleaning Improve Brain State Classification?[J]. Journal of neuroscience methods,2019:328.

猜你喜欢
卷积人脸神经网络
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
玻璃窗上的人脸
基于全卷积神经网络的变压器故障诊断
基于深度卷积网络与空洞卷积融合的人群计数
基于自适应神经网络的电网稳定性预测
智力考场:有趣的图片测试
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
卷积神经网络概述
“领家系”可爱脸VS“高冷系”美人脸