一种基于CBAM-RCNN 辅助校内人员轨迹预测以及外来人员风险等级评估的数学模型

2023-11-29 11:26长安大学信息与网络管理处荀伟
数字技术与应用 2023年11期
关键词:准确率卷积样本

长安大学信息与网络管理处 荀伟

近年来,大数据与人工智能技术的迅速发展,为安防监控系统的升级和改进提供了新的思路和可能性。本研究将探讨基于CBAM[1]算法搭建一个CBAM-RCNN模型:即C-R-M,借助人脸和人体识别技术的支持,智能安防监控系统具备实时报警功能,还能有效监测和管理非法入侵事件。模型可协助生成巡逻路径,管理人员能够实时监测巡逻人员的路径,也可以事后检索并还原巡逻人员的行程,提高了巡检监管的效率和准确性[2,3]。

1 可行性分析

CBAM-RCNN 是一个基于深度学习的算法,需要使用大量的数据和计算资源进行训练和推理,可以实现人员检测、人员识别和轨迹跟踪等多种功能。在人员检测方面,CBAM-RCNN 可以识别图像中的物体并标出其位置和类别,从而实现对视频监控中物体的实时区分。应用CBAM 模块可增强特征的表征效能和差异性,从而提升人员检测的速度和精确性。

1.1 人员检测

CBAM-RCNN 可以检测图像中的物体,并标出它们的位置和类别。在模型训练过程中,模型会学习从图像中提取特征,然后利用这些特征来生成边界框和类别预测,基于这样的特性,可以用CBAM-RCNN 实时区分视频监控里的物体类型,是人还是物。

1.2 人员识别

由于CBAM-RCNN 不仅可以检测物体,还可以将物体分为不同的类别。在训练过程中,模型会学习从图像中提取特征,在输入基础数据集后(即包含全校教职工以及学生的头像信息),就可以利用模型区分人员是教职工、学生还是临时人员,进而可进行校内人员风险等级分类和预测[4]。使用CBAM 模块可以提高特征的表征能力和可区分性,从而提高分类的准确性。

1.3 轨迹跟踪

结合CBAM-RCNN 分类的准确性以及快速处理的特性,本研究创新地将CBAM-RCNN 用于物体跟踪。通过在连续的帧之间跟踪物体的运动,CBAM-RCNN可以生成准确的人员轨迹图。在校园监控和安全管理等方面具有较强的可行性以及广泛的应用前景。

2 数据预处理

如图1 所示是本研究数据预处理步骤,由此可提高视频和图片数据质量。

通过图1 中的数据预处理,可以使视频和图片数据更好地适应后续数据处理的需求,进而提高目标检测模型的性能和精度,最终获得更好的预测与分类结果。

3 数据处理

3.1 模型搭建

3.1.1 CBAM

(1)CBAM 是由Woo 于2018 年提出的一种多重关注机制,能够同时聚焦通道和空间,从而实现更卓越的性能表现。(2)通道注意力机制:对输出的特征依次进行求和操作,通过应用Sigmoid 函数进行激活,得到通道注意力特征的权重。接下来,将这些特征权重与输入的特征进行逐元素相乘操作,从而生成空间注意力模块所需的特征。(3)空间注意力机制:对输入的特征图进行基于通道的全局最大池化和全局平均池化运算,然后将获得的特征图进行通道级别的合并。这样的设计有助于模型更好地关注重要的空间区域,从而提高模型性能。

3.1.2 残差网络

经过第一层线性变换和激活函数后的输出为F(x),第二层是在这个输出和输入x之间进行的。在进行第二层的线性变换和激活函数之前,将输入x添加到了路径中,创建了一个shortcut。最终的输出是在应用激活函数后获得的σ(F(x)+x)。

3.1.3 卷积神经网络

将图片或信号作为初始输入传递给卷积神经网络。网络使用卷积核对输入数据进行扫描和卷积运算,以计算数据的权重和偏差。接下来,通过激活函数引入非线性变换,以拟合相关的映射关系,从而建立故障数据与故障状态之间的连接,如式(1)所示:

式(1)中:xl+1为当前层的输出,xl为当前层的输入,kl为卷积核,bl为偏置,f(*)为激活函数。

在本研究中,选择用如式(2)所示的ReLU 函数:

ReLU 函数在输入值小于0 时梯度为0,这可以避免出现函数值过小导致梯度消失的问题,从而加快训练过程。在卷积层中,输出数据会进行批量归一化(即BN,Batch Normalization)。本研究中使用的BN 公式如式(3)、式(4)所示:

式(3)中:μB为数据的均值,σB2为方差,为归一化后的值;式(4)中:γ,β为BN重构参数。

经过多次卷积和批量归一化处理后,特征数据将被全局平均池化,再将池化层的输出通过Softmax 分类器进行分类,最终输出结果。

3.1.4 CBAM-RCNN 模型结构

本研究提出了一种基于CBAM-RCNN 算法的模型,该模型主要由卷积网络、CBAM 和残差块组成。CBAM和残差块被融合进卷积网络中,以实现最佳的故障诊断效果,如式(5)所示:

式(5)中:xl+1为当前输出,xl为上层输出、当前输入,kl为核,bl为偏置,f(*)为激活函数,BN 为函数BatchNorm。

3.1.5 CBAM-RCNN 模型训练与验证

为评估CBAM-RCNN 模型的特征提取和分类预测性能,我们采用了交叉熵损失函数作为评价指标,度量实际值与模型输出值之间的误差。鉴于视频帧或图像中人体部位像素分布不均,为更准确评估模型分类预测,我们采用分层k 折交叉验证方法验证模型。

将所有样本随机分成k 个相等子样本集,同时保持各类别比例。然后,使用k-1 个子样本集进行模型训练,剩余1 个子样本集用于验证。这有效评估模型在不同数据子集上的性能,全面了解其表现。我们重复这个过程k 次,每次选择不同的子样本集作为验证集,然后将k 次得到的结果取平均值作为最终的验证结果。

3.2 代码实现

用CBAM-RCNN 算法实现检测、识别和追踪需要实现以下几个步骤:(1)数据预处理:根据已经准备好的人员头像数据集,使用OpenCV 库中的函数对图片进行裁剪、缩放和归一化操作。使用cv2.resize()函数将图片调整到指定大小,再使用cv2.cvtColor()函数将图片转换为灰度图像。(2)模型构建:使用CBAM-RCNN 算法构建目标检测模型,本研究中用PyTorch、TensorFlow等深度学习框架搭建CBAM-RCNN 模型。(3)模型训练:使用准备好的头像数据集,通过反向传播算法对模型进行训练和优化,以提高模型的准确率和鲁棒性。(4)模型测试:使用测试数据集对模型进行测试,评估模型的准确率和性能。(5)应用部署:将训练好的模型部署到监控系统中,实现人员检测、人员识别和轨迹跟踪功能。

4 实验验证与结果分析

4.1 模型参数

为了构建模型,本研究选择了基于Python 语言的Pytorch 框架。计算机使用的是Windows 10 操作系统,硬件配置为8GB 内存。优化算法选择了Adam,并采用了学习率的一种衰减策略:OneCycleLR,当中,学习率最大值设置为:0.001。模型的具体参数设置如表1、表2 所示。

表1 模型训练参数设置Tab.1 Model training parameter settings

表2 模型网络参数设置Tab.2 Model network parameter settings

4.2 处理结果与对比分析

为了保证本研究的可靠性,采用分层4 折交叉验证策略。随机选择所有样本的3/4(共75 个样本)作为训练集,并使用剩余1/4 的样本(共25 个)作为验证样本,将整个过程重复进行4 次,并将4 次验证结果的均值作为模型最终预测的准确率,每折训练200 次。

为验证本文所构建的模型在轨迹预测与风险等级分析方面的性能,我们创建了卷积神经网络(CNN)和基于CBAM 的卷积网络,其参数设置与该模型相同。具体而言,我们将CNN 网络的层数设置为4 层,卷积核数分别设置为8、16、32、64。CBAM-CNN 模型的卷积层有5 层,相对于以上CBAM-RCNN 模型,只缺失了残差块的部分。我们使用相同的样本进行训练,包括41个正常样本、23 个人体数目较少的样本和49 个人体数目较多的样本。此外,我们还使用相同的验证方法对这些模型进行验证,如表3 所示。

表3 模型验证结果对比Tab.3 Comparison of model verification results

针对每个状态的样本,CBAM-RCNN 模型的准确率比CNN 模型更高。与CBAM-CNN 模型相比,CBAMRCNN 模型在正常、人数较少和人数较多的样本中表现更好。CBAM-RCNN 模型的总准确率为88.33%,CBAMRCNN 模型表现出了比CNN 和CBAM-CNN 模型更高的准确率,分别超过了它们22%和15%。这些验证结果充分验证了CBAM-RCNN 模型的有效性。

5 结论

为了改进卷积网络的性能,本文引入了CBAM 和残差块,构建了CBAM-RCNN 模型,将其应用于智慧安防领域,并对其进行了测试对比。以下是本文的研究工作和结论:(1)数据预处理阶段,通过对基础视频和图片数据进行图片增强,包括缩放、标准化和去噪等操作,将处理后的数据作为模型的输入。这种预处理方法能够有效提高视频和图像中人体人脸特征的有效性,并增强模型的鲁棒性。(2)在CBAM-RCNN 模型中,引入了多注意力机制,使用CBAM 来优化网络参数设置,实现任务关键信息聚焦。同时,采用残差块以防止模型梯度爆炸和梯度消失问题,从而提升网络训练的稳定性。根据实验验证结果,相对于单独使用CNN 模型或CBAM-CNN模型,CBAM-RCNN 模型的准确率有明显提高。(3)为了避免模型的过拟合,本文采用全局平均池化层替代卷积神经网络中的全连接层,这一策略有效减轻了模型的过拟合问题,同时减少了模型的参数数量,提高了模型的运行速度。

综上所述,CBAM-RCNN 模型由于能有效提升监控中人体识别的性能、具有较高的准确率和稳定性且能避免过拟合的问题,所以在辅助实现校内人员轨迹预测和外来人员风险等级评估方面有显著效果,进而为实现校内智慧安防提供了一种新的思路。通过实时对校内人员的轨迹和外来人员的行为进行分析和评估,提高了安防监控系统的准确性和实时性,为当前安防监控系统的升级和改进提供了参考。

猜你喜欢
准确率卷积样本
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
用样本估计总体复习点拨
从滤波器理解卷积
推动医改的“直销样本”
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
随机微分方程的样本Lyapunov二次型估计