基于Jetson Nano的人脸口罩识别系统设计

2024-05-12 11:28:10叶光泽童宣科侯保冀

电子产品世界 2024年1期

叶光泽童宣科侯保冀

摘要：人脸和口罩识别在许多现代应用中有广泛需求，包括安全检查、身份认证以及工业安全等方面。探讨了基于 Jetson Nano 的人脸口罩识别系统，旨在实现对个体是否佩戴口罩的准确判断。该系统使用先进的人脸识别算法来定位图像中的人脸区域，然后应用深度学习模型对人脸区域进行口罩检测。所有的数据处理和模型推理均在 Jetson Nano 上实现，从而使系统具有较高的运行效率和可移植性。在多个不同环境和视角下进行测试，结果显示该系统在各种复杂条件下都展示出较高的识别准确率，并能处理高达 30 帧 /s 的实时图像。不仅证明了 Jetson Nano 在图像识别和实时数据处理方面的高性能，还为开发多种人脸识别应用提供了有力的技术支持。

关键词：人脸识别；口罩识别；Jetson Nano；深度学习

中图分类号：TP394.41；TP183文献标识码：A

0 引言

近年来，人脸识别技术取得了显著进展，已广泛应用于各种场合，包括安全监控、身份验证、人流量统计以及工业自动化等。其中，检测是否佩戴口罩成为一个特殊但重要的任务，特别是在需要遵守特定安全规定或健康标准的场合。然而，即便是最先进的人脸识别算法，也常常会受到环境变量（如光照、角度和遮挡物）的影响，导致算法準确性下降。为了解决这些问题，需要一种低成本、高效率的解决方案，因此本文提出基于 Jetson Nano的人脸口罩识别系统。Jetson Nano 是一款专为边缘计算设计的微型计算平台，具有出色的图像处理和机器学习能力，且功耗和成本都较低。

1 硬件设计

1.1 硬件组件

本设计的硬件架构主要由 3 个部分组成： Jetson Nano 微型计算平台、显示屏和摄像头。

1.1.1 Jetson Nano

Jetson Nano 是 NVIDIA 公司推出的一款微型计算平台，专为边缘计算设计。其搭载了 ARM A57 处理器和 128 核统一计算设备架构（compute unified device architecture，CUDA）兼容的图形处理器，具有出色的图像处理和机器学习能力。 Jetson Nano 还具有低功耗和高性能的特点，适用于人脸和口罩识别等实时图像分析任务。

1.1.2 显示屏

为了实时显示识别结果，本设计使用了一台 7 英寸的显示屏。该显示屏与 Jetson Nano 通过高清多媒体接口（high definition multimedia interface， HDMI）连接，能够以高分辨率和流畅度来展示摄像头捕获的图像和算法识别的结果。

1.1.3 摄像头

本设计使用了一款高清网络摄像头，具有 1 920×1 080 的分辨率和 30 帧 /s 的帧率，以捕捉高质量的图像。该摄像头通过 USB 接口与 Jetson Nano 连接，能够实时传输视频流。

1.2 工作流程

在硬件组合完毕后，系统的工作流程如下：首先，摄像头捕捉实时视频流，并通过 USB 接口发送到 Jetson Nano。其次，Jetson Nano 进行图像预处理并运行人脸口罩识别算法。最后，识别结果会即时在连接的显示屏上显示出来。

该硬件组合不仅确保了系统的高效运行，还具有很好的可扩展性和可移植性，为未来的研究和应用提供了强有力的硬件支持。

2 软件设计

在完成环境搭建后，软件设计部分将遵循程序流程（图 1）进行编码和实现。

2.1 环境搭建

环境搭建作为实验的初步阶段，具有基础且关键的意义。本设计需要搭建深度学习的环境，即 PyTorch（开源的 Python 机器学习库）框架，需要考虑好各种库之间的匹配问题，以及 PyTorch 和 torchvision（PyTorch 的一个图形图像库）的安装，这两个库是深度学习模型开发的重要组成部分。完成环境搭建后，对 PyTorch 进行基础验证是确认环境稳定性的关键。只有在完成这些必要的流程之后才能进行代码编写。

2.2 预处理

预处理是为了准备图像数据以供模型使用。首先进行图像缩放，将输入图像的大小调整为模型所期望的尺寸。其次，进行图像归一化，将每个像素的 RGB（红、绿、蓝）值由 0 ～ 255 缩放到 0 ～ 1，从而加速模型的收敛速度并提高准确性。此外，还需进行维度扩展，为图像数据增加一个批处理维度，使其能够输入到神经网络模型中。

2.3 人脸检测

人脸检测采用了基于深度学习的方法。使用了预训练的卷积神经网络（convolutional neural networks，CNN）从输入图像中提取有用的特征 [1-2]，CNN 模型如图 2 所示。该模型使用 PyTorch 框架进行加载，如图 3 所示。人脸的定位是通过预设的边界框来实现的。首先，生成一组锚点框 [2]，并覆盖在图像的不同位置上。每个特征图的尺寸代表不同尺度上的空间布局，锚点大小和比例定义了每个锚点框的尺寸和形状。模型会预测边界框中哪些最有可能包含人脸，以及如何微调边界框以更准确地定位人脸。

测结果以获取实际的边界框，该函数采用模型输出和锚点边界框作为输入。首先，计算锚点的中心位置和尺寸。其次，利用原始输出（通常是由神经网络生成，表示边界框相对于锚点的偏移和大小变化）来调整锚点。函数通过应用一组比例因子，计算预测的边界框的中心位置、宽度和高度。最后，利用函数将这些信息合并，形成最终的预测边界框，从而更准确地指示图像中的目标位置。

2.4 口罩识别

在准确检测人脸后，需要利用模型识别这张脸是否戴了口罩。模型基于其学习到的特征来判断边界框内的人脸是否戴有口罩，并给出相应的类别标签和置信度。这是通过查看模型的输出来实现的。该输出是一个概率分布，显示了模型对每个类别（戴口罩和未戴口罩）的置信度。

对于每个检测到的人脸，通过置信度阈值和非极大值抑制（non-maximum suppression，NMS）来过滤和精炼结果 [3]。如果一个预测的置信度高于置信度阈值，则认为这个预测是可信的，否则将其舍弃。交并比（intersection over union，IoU）[4] 表示两个边界框的重叠度，IoU 值是两个边界框相交区域面积与两个边界框联合区域面积的比值。在 NMS 过程中，如果两个边界框的 IoU 值高于 IoU 阈值，这通常表示两个边界框都在检测同一个对象。在这种情况下，只保留置信度更高的那个边界框，同时舍弃另一个。因此，通过设置合适的 IoU 阈值和置信度阈值，可以保证系统更准确地识别出是否戴了口罩。

最后，根据识别结果，边界框和类别标签将被绘制在原始图像上，并且给出可信度。识别情况如图 4 所示。戴口罩为 Mask，未戴口罩为 NoMask。

3 系统测试

3.1 数据集

在进行系统测试之前，选择合适的数据集是至关重要的。由于本文设计的是一个面向人脸和口罩检测的系统，因此选择了包含戴口罩和未戴口罩的大规模人脸数据集。数据集来自 WIDER Face 和 MAFA 数据集 [3]。AIZOO 团队以统一标准对这两个数据集中图片的人脸位置进行二次标注，共标注了 7 971 张人脸标注图片。该数据集包含了多种场景、光照条件以及人脸方向来测试模型在各种情况下的泛化能力。

3.2 测试环境和视角

测试环境的多样性也非常重要。为了确保模型能够在不同的实际应用场景中表现良好，系统不仅在室内进行了测试，还模拟了室外、公共交通、商场等多种环境。除了环境外，还从不同的视角和距离进行了测试，包括正面、侧面、斜视等，以及从不同距离对目标进行捕捉，从而测试模型的稳健性。

3.3 结果与讨论

经过一系列综合测试，模型在大多数测试环境和视角下都表现出色，对有口罩和无口罩的分类准确率很高。然而，该模型也存在局限性和需要改进的地方。在极端光照条件下，如逆光或暗光，模型的检测效果不佳。在未来的版本中可能需要加入光照不变性或者使用更复杂的模型来改善性能。当人脸部分被遮挡或者佩戴了非标准口罩（如颈巾、面纱等）时，模型的检測准确度也有所降低。这意味着模型可能需要更多数据集来训练，特别是包含各种遮挡和口罩类型的数据集。虽然 NMS 算法有效地减少了多余的检测框，但在高密度人群中，模型检测结果仍然可能产生一些错误。针对该问题，可采用更高级的后处理技术，例如，Soft-NMS 算法 [5] 可以作为一个潜在的解决方案。这些测试结果不仅验证了模型的有效性，也指出了模型改进和优化的方向。

4 结语

本文设计了基于 Jetson Nano 的人脸口罩识别系统。通过采用先进的 CNN 架构和实用的图像处理技术，不仅实现了高准确度的人脸识别，还成功地对是否佩戴口罩进行了判断。本系统经过了多环境和多角度的严格测试，结果显示其在大多数应用场景下都具有出色的性能和可靠性。然而，本系统还有改进空间，包括在特定光照和遮挡条件下的检测准确度，以及后处理算法的优化。未来将进行更多的数据收集和模型训练，以进一步提高系统的准确性和适应性。

参考文献

[1] 仝晓春，周玲 .基于卷积神经网络的人脸识别研究 [J]. 电脑知识与技术，2023，19（23）：26-27，38.

[2] 曹家乐，李亚利，孙汉卿，等 . 基于深度学习的视觉目标检测技术综述 [J]. 中国图象图形学报，2022， 27（6）：1697-1722.

[3] 蒋益鸣，范希喆，张美嘉，等 . 基于卷积神经网络口罩识别方法研究 [J]. 中国新技术新产品，2022（17）：17-19.

[4] 张羽 . 目标检测中的交并比损失函数研究 [D]. 合肥：安徽大学，2021.

[5] 樊新川，陈春梅 . 基于 YOLO 框架的轻量化高精度目标检测算法 [J]. 液晶与显示，2023，38（7）：945-954.