基于FasterRCNN的口罩佩戴检测研究

2021-09-23 06:48刘攀,文汉云
电脑知识与技术 2021年21期
关键词:计算机视觉深度学习

刘攀,文汉云

摘要:在新冠病毒(COVID-19)全球肆虐的大背景下,为有效阻止新冠病毒在人群中传播,多地要求在公众场合佩戴口罩,针对这一问题,提出一种基于FasterRCNN算法的口罩佩戴检测方法,手动通过labelimg进行数据集标定,再对深度学习模型进行训练,实验结果表明,该深度学习算法的检测的准确率达到97.57%,可以有效检测人员的口罩佩戴情况。

关键词:深度学习;口罩佩戴检测;计算机视觉

中图分类号:TP18            文献标识码:A

文章编号:1009-3044(2021)21-0014-03

开放科学(资源服务)标识码(OSID):

Research on Mask Wearing Detection Based on Faster RCNN

LIU Pan, WEN Han-yun

(School of Computer Science, Yangtze University, Jingzhou 434000, China)

Abstract: In the context of the global raging COVID-19 virus (COVID-19), in order to effectively prevent the spread of the new coronavirus among the population, many places require masks to be worn in public. To address this problem, a mask wearing test based on the Faster RCNN algorithm is proposed. Methods: Manually calibrate the data set through labelimg, and then train the deep learning model. The experimental results show that the detection accuracy of the deep learning algorithm reaches 97.57%, which can effectively detect the wearing of masks.

Keywords: deep learning; mask wearing detection; computer vision

引言

自新冠病毒在全球爆发以来,世界各国的社会生产生活活动陷入停滞,人民的生命健康、财产都遭受极大的威胁,为有效阻止新冠病毒[1]在人群中进一步传播,各地各部门要求人们出行佩戴口罩,本文提出的利用FasterRCNN[2-3]深度学习算法来进行口罩佩戴检测可以与红外测温系统结合起来,组成一个口罩佩戴检测加红外测温的门禁系统,可以广泛应用于各大高中院校、公司、公园、商超等人流量大的场合,不仅可以有效避免检测人员与他人近距离接触,还可以对未佩戴口罩的人员进行标识,以便检测人员实时进行提醒。

用于口罩佩戴检测的FasterRCNN深度学习算法是一种典型的two-stage目标检测算法,整个目标检测过程分为两步,先由主干特征提取网络生成特征层之后,再由其他算法生成一系列的候选框,two-stage目标检测算法的特点是检测精度高,但检测速度相对较慢,与之相对应的有YOLO[4]、SSD等一些one-stage目标检测算法,one-stage算法直接将先验框的定位问题转化为回归问题一起处理,因此具有出色的检验速度,但相对的检测精度却有所下降。本文所选择的FasterRCNN算法是由何凯明等人在2015年提出的,该算法是在RCNN和FastRCNN算法的基础上改进而来的,该算法解决了RCNN[5]和FastRCNN[6]算法训练速度慢,检测时间长的问题,将主干特征提取网络生成的特征层共享,大大减少了计算量,提高了训练速度和检测速度,为了保证口罩佩戴检测的精度和准度,本文选择了FasterRCNN目标检测算法。

1 FasterRCNN目标检测算法

与RCNN和FastRCNN算法相比,FasterRCNN算法创造性地使用RPN(Region Proposal Network)代替原来的Selective Search方法产生建议窗口,通过共享特征层大大减少了计算量,从而提高了算法的检测速度,FasterRCNN算法的原理如图1所示。

FasterRCNN算法对输入进来的图片在保持原有纵横比的前提下重新调整为固定尺寸大小,然后通过主干网络进行特征提取得到特征层,将特征层输入到RPN网络中,经过3x3的卷积,再分别对每个先验框进行分类(前景和后景)和计算对应先验框的偏移量,然后计算出proposals,而Roi Pooling层则利用proposals从特征层中提取的proposal feature送入后续全连接层和Softmax网络进行分类。

1.1主干特征提取网络

FasterRCNN可以采取多种主干特征提取网络,常见的有VGG、Resnet和Xception等,本文采用的是Resnet50网络。Resnet网络是一种深度残差网络,该网络将前面若干层的某一层的数据输出直接跳過多层引入到后面数据层的输入部分,这意味着后面特征层的内容会有一部分由前面的某一层线性贡献,深度残差网络可以有效解决因网络深度加深而产生的学习效率下降而准确率无法有效提升的问题,其结构如图2所示。

猜你喜欢
计算机视觉深度学习
基于深度卷积神经网络的物体识别算法
双目摄像头在识别物体大小方面的应用
机器视觉技术发展及其工业应用
危险气体罐车液位计算机视觉监控识别报警系统设计
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望