人工智能技术在实际生活中应用的探究

2021-09-10 19:43:44韩其凯李易杨然王超群
科技研究 2021年8期
关键词:计算机视觉深度学习人工智能

韩其凯 李易 杨然 王超群

摘要:人工智能已经成为后互联网时代的发展路径和方向,国家出先后出台了五个人工智能创新平台。可以说,人工智能的春天即将到来了。与此同时,我们致力于将人工智能技术推广普及,对如何将人工智能技术进行实际的落地应用进行了积极的探索与实现。依托于深度学习和计算机视觉的相关技术,我们开发了口罩佩戴识别检测系统。采用了基于浏览器-服务器端和基于客户端两方面的部署。浏览器端和客户端相结合,实现了人工智能技术的落地应用,具有实用性和潜在的商业价值。该项目已部署至网站hanqikai.com,进行实际的运行测试,并不断进行维护。

关键词:人工智能 计算机视觉 深度学习

引言 人脸识别,在过去一年里是人工智能技术的代名词,红遍大江南北,无论是铁路客运大厅,还是校园出入口,都能见到其身影。然而,公共场合佩戴口罩,已经成为人们必须遵守的规定。当大家纷纷戴上口罩,摄像头背后的它便罢工待毙,再不识其人了。但是人工智能之所以强大,在于其迭代与自我进化的空间无限,我们利用人工智能领域的深度学习和计算机视觉技术,进行了口罩佩戴检测系统的开发。该系统可以对人群中的人脸是否佩戴口罩的情况进行识别检测,从而帮助检测人员有效排查各类人员,提高了工作效率。这说明,人工智能作为强有力的工具,将更好的服务于社会大众。

1  项目构建及其部署

在目标检测的算法模型上,我们采用端到端的目标检测算法—YOLOv4。端到端指的是输入图像的特征,输出的是最后分类得到的结果。对于二阶段的目标检测网络,该网络的基本思想是先将图像进行各个维度的卷积提取图像的特征,然后进行目标区域的搜索,将搜索到的含有物体的框进行汇总,再将这些框分别进行物体的分类,最后完成对图片中物体的检测。对比这两种目标检测算法,我们可以得知,单阶段的目标检测算法具有较快的检测速度,因为输入图片经过一次检测便可以输出结果。对于二阶段的网络RCNN系列,需要先進行目标区域的搜索,再进行物体的分类,显然这种算法不适合实时性的目标检测工作,但优点是识别精度高,适用于比较看重识别效果的场景。由于口罩佩戴的识别需要有比较快的识别速度,自然要使用单阶段的目标检测算法。因此我们采用了YOLOv4目标检测算法作为口罩识别的核心算法。

该目标检测网络的结构大体分为主干特征提取和特征处理两大部分,其中主干特征提取是对图像进行不同维度的特征提取。YOLOv4由CSPDarknet53作为主干特征提取网络,抽取图像中各个维度的特征,抽取的特征从低维到高纬,构成特征金字塔,最后抽取的特征金字塔送入YOLO-Head网络进行预测以及解码。

YOLO Head层利用或得到的特征进行预测,在特征层的利用部分,提取多特征层进行目标检测,一共提取三个特征层,分别位于中间层,中下层,底层。 针对每一个特征层存在三个先验框。因此,可以获得三个特征层的预测结果。但是这个预测结果并不对应着嘴中的预测框在图片上的位置,还需要解码才可以完成。解码的过程就是将每个网格点加上对应的横轴偏移量和纵轴偏移量,加完之后的结果就是预测框的中心,然后利用先验框和偏移量计算出预测框的长和宽,这样便可以得到整个预测框的位置了。在计算损失的时候,将预测出的包含物体的框和我们手工标注的框进行对比,求出两种框的偏移量,将偏差算到损失函数中去,然后经过神经网络的反向传播不断减小损失值,最终训练出理想的神经网络模型。

数据集方面,我们采用的数据集为WIDER_FACE数据集以及大量自己采集的数据集。戴口罩类的图像通过网络爬虫爬取获得,没有戴口罩的图像是WIDER_FACE数据集、VOC2007数据集进行拼凑而成。将YOLOv4目标检测算法加载到集成开发环境Pycharm中,加入训练数据及其标签,写好训练脚本,就可以利用算法进行口罩佩戴模型的训练。

在训练好识别模型以后,接下来考虑的就是如何将该项目部署落地的问题。我们采取了两方面的部署措施,第一个是将该系统通过服务器和浏览器部署到web端,第二个部署方案是直接部署到本地客户端。使用服务端-浏览器进行访问时,可以将图片或者视频通过前端页面接口传输到服务器上,再将结果回显到页面中。适用于对图片或视频中的人流进行检测。前端页面效果及其识别接口请访问http://hanqikai.com。本地客户端时可以直接调用摄像头进行检测识别,适用于对出入口闸机进行检测,通过捕捉摄像头的视频流进行检测。经过实际测试,服务器端和客户端都取得了较好的识别结果。

2  分析总结

在我们的项目探索中,选择合适的网络模型对于项目起着核心作用。我们对比了多种网络模型,最终选择YOLOv4目标检测网络作为口罩佩戴识别检测项目的核心检测算法。在训练自己的网络模型中,我们使用了python网络爬虫技术在网络上爬取了大量人脸数据集进行手工标注,并采取Mosaic数据增强方法。通过这个方法不仅丰富了数据集,而且丰富了检测物体的背景,在最后训练出的模型效果中,新模型取得了非常好的效果。

在实现了口罩识别检测系统之后,下一步计划将该项目与计算机硬件的相关模块结合,实现根据是否佩戴口罩进行出入口的自动控制,并向排查检测人员发出警报信息。同时实现口罩佩戴的检测以及数据库系统的匹配。有效帮助排查检测人员进行全面检测,让人工智能技术服务于社会,推动人工智能技术生活化,进而使生活智能化。

参考文献:

[1](美)Martin T. Hagan.神经网络设计[M].戴葵,译. 北京:机械工业出版社,2002.9:6-12.

[2]李航.统计学习方法[M].1版.北京:清华大学出版社,2012:6-8.

[3] Joseph Redmon. YOLOv3: An Incremental Improvement [J]. CVPR, 2016(1).

[4] Alexey Bochkovskiy. YOLOv4: Optimal Speed and Accuracy of Object Detection[J]. CVPR, 2020(1).

[5](美)弗朗索瓦·肖莱. Python深度学习[M].张亮,译.北京:人民邮电出版社,2018.8:5-7.

曲阜师范大学  山东  日照  276800

猜你喜欢
计算机视觉深度学习人工智能
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
机器视觉技术发展及其工业应用
危险气体罐车液位计算机视觉监控识别报警系统设计
计算机视觉在交通领域的应用
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于计算机视觉的细小颗粒团重量测量的研究
深度学习算法应用于岩石图像处理的可行性研究
软件导刊(2016年9期)2016-11-07 22:20:49