一种稀疏体压特征人员识别方法

2025-02-08 00:00:00肖鸿洲李长云王志兵甘英华任国鑫
现代电子技术 2025年3期
关键词:注意力机制神经网络

摘" 要: 在注重隐私或无光环境下,主流的基于机器视觉的人员识别方法不太适用。基于稀疏体压特征,文中提出一种将CNN与Bi⁃LSTM相融合再结合注意力机制的人员识别新方法。首先,对获得的稀疏体压数据使用CNN进行空间特征提取;然后,使用Bi⁃LSTM神经网络获取长远的上下文信息,抽取潜藏在时序规律中的上下文特征;最后,将抽取的空间与时序特征并联融合,结合注意力机制进行权重参数优化,使模型更关注于最具类别区分度的特征。实验结果表明,该方法拥有更快的收敛速度,识别准确率达到93.86%。

关键词: 人员识别; 体压特征; 注意力机制; 双向长短期记忆; 神经网络; 稀疏体压

中图分类号: TN911.23⁃34; TP391.41" " " " " " " " 文献标识码: A" " " " " " " " " 文章编号: 1004⁃373X(2025)03⁃0111⁃08

Sparse body pressure feature personnel identification method

XIAO Hongzhou, LI Changyun, WANG Zhibing, GAN Yinghua, REN Guoxin

(1. School of Computer, Hunan University of Technology, Zhuzhou 412000, China;

2. Key Laboratory of Intelligent Information Perception and Processing Technology of Hunan Province, Hunan University of Technology, Zhuzhou 412000, China)

Abstract: Personnel identification methods based on mainstream machine vision are not so suitable in privacy⁃conscious or light⁃free environments. In view of this, a new method of human identification by fusing CNN and Bi⁃LSTM (bi⁃directional long short⁃term memory) and then combining with attention mechanism is proposed based on the sparse body pressure feature. CNN is used to extract spatial features from the obtained sparse body pressure data, and then the Bi⁃LSTM neural network is used to obtain long⁃term context information and extract the context features hidden in the time series law. Finally, the extracted spatial and temporal features are fused in parallel and then combined with the attention mechanism for the optimization of the weight parameters, so that the model pays more attention to the features with the most categorical discrimination. Experimental results show that the proposed method has a faster convergence speed and a recognition accuracy of 93.86%.

Keywords: personnel identification; body pressure feature; attention mechanism; Bi⁃LSTM; neural network; sparse body pressure

0" 引" 言

随着人们对人员识别技术的需求日益增长,运用生物特征进行人员识别的生物识别技术因其具有自动识别性、验证性、遗传性与终身不变性等特点,与传统认证识别技术相比更加的安全可靠[1]。但生物识别技术仍然存在诸多的问题,在一些特定的场景,如智能马桶、智能床垫等应用场景,隐私问题就显得格外重要,传统的人脸识别[2⁃3]、指纹识别[4]、虹膜识别[5]、步态识别[6]等生物识别技术对光线和采集设备的依赖性较大,且视频设备会侵犯个人隐私[7],无法进行安全且私密的人员识别。

为了解决由于隐私问题带来的不便因素,文献[8]提出了一种新的基于足迹的个人识别方法。在实验中,足迹的压力分布是用压力感应垫测量的。通过10名志愿者贡献的足迹来测试所提出的方法,取得的最好识别率为85.00%。文献[9]提出了一种基于步态使用地板压力数据进行人员识别的方法,从一对足迹的3D COP轨迹中提取一组特征并将其与其他特征(例如:平均压力和步长)一起用于人员识别,取得的最好识别率为92.3%。文献[10]使用了一种在压敏地板上利用多分类器和拒绝选项实验进行人员识别的方法,对于10个不同的步行者,总体准确率为92%。当添加拒绝选项时,分类率达到95%,拒绝率为9%。文献[11]利用从电容地板中提取的步行特征结合双向长短期记忆(Bi⁃LSTM)的深度神经网络来进行人员识别,准确率达到了98.12%。上述关于压力传感器进行的人员识别研究中,大多都涉及高密度的压力传感器,而高密度压力传感器的人员识别系统成本往往随着传感器密度的增加而增加。过高成本的人员识别方案难以普及。

针对上述隐私与成本两方面的问题考虑,本文设计了一种基于稀疏压力传感器的人员识别系统,通过低密度排列的压力传感器获取原始数据,在保护了隐私性的同时也规避了由于高密度传感器带来的成本过高问题。在面对低密度的传感器带来的低数据量问题时,本文采用特征工程和双向长短期记忆网络,提取了丰富的空间特征和上下文时间特征,以捕捉实验者体压的动态变化。最后结合注意力机制,使不同时刻输入的重要性模型加强提取与人员识别相关性大的特征并通过实时数据进行实验,证明该模型预测的准确性。

1" 相关理论及技术

1.1" 长短期记忆(LSTM)网络

长短期记忆(LSTM)网络是一种特殊类型的循环神经网络(RNN),由于传统的RNN面临梯度消失或爆炸的问题,导致网络难以学习到时间序列中距离较远的依赖关系。LSTM通过其独特的内部结构,有效地解决了这一问题。为了解决梯度消失和梯度爆炸问题, Hochreiter首先提出了LSTM[12] 。图1是典型LSTM的基本单元结构图。它在神经元结构中引入门的功能用于解决循环神经网络中的长期依赖问题,特别适合时间序列信号的处理[13]。

LSTM单元包含4个互相协作的部分:输入门[it]、遗忘门​[ft]、输出门[Ot]​,以及一个细胞状态[ct]。这些组件共同工作,共同决定网络在每个时间步的行为。

输入门:输入门控制着新信息的流入。它由一个 sigmoid激活层和一个点乘操作组成。

遗忘门:遗忘门负责决定细胞状态中哪些信息应该被保留或丢弃。

细胞状态:LSTM的关键部分是其细胞状态,它在整个链条中流动,只有轻微的线性交互。

输出门:输出门决定了下一个隐藏状态的值,隐藏状态包含了前一个输出和当前细胞状态的信息。

[it=σ(Wxixt+Whiht-1+bi)] (1)

[ft=σ(Wxfxt+Whfht-1+bf)ct=ft*ct-1+it*ct] (2)

[ct=tanh(Wxcxt+Whfht-1+bc)Ot=σ(Wx0xt+Wh0ht-1+b0)] (3)

[ht=Oi*tanh(t)] (4)

1.2" 双向长短期记忆(Bi⁃LSTM)网络

在进行体压特征的人员识别时,由于传统的LSTM循环神经网络只能使用历史的体压特征数据对人员进行分类识别,没有考虑到之后时间的数据特征,而将前后时间的数据信息进行关联后可以有效地提高分类精确度。为此,本文使用双向长短期记忆(Bi⁃LSTM)网络[14],通过在传统LSTM的基础上增加反向传递信息的能力,显著提高了模型对时间序列数据的理解深度。图2结构使得Bi⁃LSTM在处理如体压特征这类时间序列数据时,能够同时考虑前后时刻的信息,从而提高识别精度和效率。在模型中,Bi⁃LSTM还结合了注意力机制,这进一步提升了模型对关键特征的识别能力。注意力机制通过加权重要的时间步,使模型能够更加聚焦于影响人员识别的关键时刻和特征。

典型的Bi⁃LSTM结构如图2所示。

1.3" 注意力机制

在模型实验过程中发现有一些对于模型识别率比较重要的特征在模型中的重要性权重占比不高,因此引入注意力机制来解决此问题。注意力机制的核心思想是模拟人类的注意力过程,即在处理大量信息时能够集中注意力于某些关键部分。

本文模型中的注意力机制[13]被实现为一个自定义的Attention Layer类。这个层的主要作用是为Bi⁃LSTM 网络的输出赋予不同的权重,使得模型能够聚焦于对当前预测任务最关键的信息。

[et=tanh(Whht+b)] (5)

[αt=exp(et)texp(et)] (6)

[c=tαtht] (7)

在本文的人体识别模型中,注意力机制使得Bi⁃LSTM能够更有效地处理体压特征数据。体压数据包含了时间上的复杂模式,这些模式对于区分不同人员至关重要。通过聚焦于这些关键模式,注意力机制提高了模型在处理每个人独特体压特征时的精确度。例如,对于一个长时间序列的体压数据,某些时间点的特征可能比其他时间点更有助于识别个体。注意力机制能够识别这些关键时刻,并使模型在做出预测时更多地依赖于它们。这种方法在提高分类准确性和模型性能方面非常有效,特别是在面对高度个性化和变化多端的体压数据时。

2" 基于稀疏传感器的人体识别模型

2.1" 基于稀疏压力传感器设计的数据采集设备

由于人们对于睡眠过程中的隐私性、感光性、非入侵性十分看重,为此设计了一种新型智能床垫,能够在实验人员完全感知不到传感器存在的情况下,完成对实验人员躯干的4个主要部位:肩、腰、臀、腿的实时压力数据采集,真正做到了非入侵式的数据采集。图3b)相比于文献[15](见图3a))采用1 024个有效电容传感单元与文献[16]使用传感器阵列式布局,整个传感器分布着2 048个电容传感单元的高密度矩阵排列的薄膜压力传感器数据采集设备。本文设计了一种基于气囊压力的数据采集设备,仅使用单边4个气囊配合压力传感器,便可完成对实验数据的采集。该方法降低了传感器排列密度,做到了稀疏排列的传感器设计,极大地降低了数据采集成本。

2.2" CNN⁃Bi⁃LSTM模型整体框架

在原始传感器数据处理阶段,采用的训练与分类的原始数据集主要来源于实验人员在稀疏压力传感器设备上进行的各种动态与静态行为的压力数据。算法模型构建阶段旨在解决传统串联模式在空间和时序特征提取中可能遇到的特征丢失问题。通过结合CNN和Bi⁃LSTM,并采用并联融合策略,本文模型不仅优化了特征提取流程,还显著提升了人员识别系统的性能。CNN层负责提取精确的空间特征,Bi⁃LSTM层负责处理时序依赖信息,通过并联策略全面整合这些数据。最后,再将注意力机制层放在特征融合处理后,对关键信息进行筛选,通过对特征进行加权,显著提高了模型对关键数据的敏感度和识别准确性。

该模型结构主要分为以下四个部分。

1) CNN特征提取层:在本文模型中,CNN特征提取层专门用于从每个时间点的传感器数据中提取空间特征。这些特征对于理解在同一时间点上不同传感器之间的空间关系至关重要。该层由多个卷积层和池化层串联组成,每个卷积层后接ReLU激活函数,以增强模型的非线性处理能力和整体稳定性。通过这些连续的卷积和池化操作,模型能够捕获与特定行为或事件相关的关键空间模式,例如在不同传感器上的压力分布。这种处理方式有效地将复杂的空间信息简化为更易于处理的形式。CNN层的网络结构以及参数如图4a)所示,公式表达如下。

设[X]为输入的多维传感器数据,每个时间点的数据都通过CNN处理。

[FCNN(X)=ReLUPoolWConv*X+bConv] (8)

式中:[WConv]和[bConv]分别表示卷积层的权重和偏置;“[*]”表示卷积操作;[Pool]是池化操作;[ReLU]是激活函数。

2) Bi⁃LSTM层:在CNN输出的基础上,嵌入双向LSTM(Bi⁃LSTM)层,以捕获时间依赖性。Bi⁃LSTM层位于模型的中间部分,设计用来处理时序数据,提取长期依赖信息。两层Bi⁃LSTM分别嵌入到先前的卷积层输出中,增强了时间序列特征的提取能力,并与空间特征并联融合。具体的结构和参数如图4b)所示。

[FCNN(X)]为CNN层的输出,[St]表示时间步[t]的特征向量,Bi⁃LSTM处理为:

[Ht=Bi⁃LSTMSt,Ht-1,Ht+1;ΘBi⁃LSTM] (9)

式中:[Ht-1]和[Ht+1]表示前后时间步的隐藏状态;[ΘBi⁃LSTM]表示Bi⁃LSTM层的参数。

3) 多层特征聚合与汇总:将Bi⁃LSTM的输出与先前CNN层的输出进行聚合,利用注意力统计池化层时间信息和通道信息共同建模,获得输入的统计信息,并通过全连接层降维,得到深度表征来融合并优化多层特征。

4) 注意力机制层:模型在特征合并后,综合考虑到了空间和时间维度的信息,为了进一步筛选和强调对决策最关键的综合特征。本文选择使用注意力机制层来学习每个特征的重要性分布,选择性地强调对最终任务最为关键的特征,从而优化整体的决策过程。注意力机制层以融合的特征向量为输入,输出一个与特征向量同样长度的注意力分数。然后,这些权重通过softmax函数进行归一化处理,以确保它们的和为1。最后,这些归一化的权重与原始的特征向量进行元素乘,得到加权的特征向量。

并行特征融合与注意力机制的具体融合操作如下。

[H]为Bi⁃LSTM层输出的时间序列特征,[FCNN]为同一时间序列的空间特征。

[Fmerged=concat(H,FCNN)] (10)

将注意力权重计算和特征进行加权。

[α=softmaxwattFmerged+batt] (11)

[Ffinal=tαt⊗Fmerged,t] (12)

式中:[watt]和[batt]是注意力层的权重和偏置;[αt]是时间步[t]的注意力权重;“[⊗]”表示元素乘法,以强化对关键时间点特征的识别。

模型整体框架如图5所示。

通过这种结构设计,结合了注意力机制的CNN⁃Bi⁃LSTM并联融合模型在处理稀疏数据量的环境下,不仅优化了特征提取过程,还通过并联方式有效保持了空间与时间特征的完整性,从而提高了整体的检测效果。这一改进对于人员识别系统的性能提升具有重要意义。

3" 实验与结果分析

3.1" 数据集与实验设置

3.1.1" 数据收集

实验使用的数据集由10名实验者的数据构成,其中男性6人、女性4人,身高在165~180 cm之间。使用自主研发的智慧床垫进行数据采集,主要由智慧床垫上4个气囊的压力传感器获取数据,具体如表1所示。

3.1.2" 数据处理

实验在采集数据时要求采集者按照日常习惯完成实验的采集过程,共分为两步。

第一步:对实验者进行正卧、左侧卧、右侧卧以及俯卧4种指定姿势的数据采集。

第二步:固定实验,让实验者根据自己的日常行为习惯在气囊上进行随意的运动、切换姿势、翻滚等多种行为模式,且在采集时不施加任何约束。通过两步的实验数据收集,初步采取到了实验者的体压空间特征和体压时序特征,由此,进一步得到了实验者的生理体压特征和行为体压特征。

数据采集设备拆解图如图6所示。

数据采集过程如下:

1) 对收集的数据进行预处理,步骤包括对气囊压力数据进行数据清洗和归一化处理,以确保数据质量和可比性。

2) 提取出三种直观有效的特征,通过计算每个气囊的平均压力值和标准差,以评估气囊压力的分布均匀度。平均压力值反映了实验者在各个气囊上的平均压力水平,而标准差则反映了压力分布的离散程度。较小的标准差表示气囊压力分布较为均匀,而较大的标准差则表示压力分布较为不均匀。本文使用压力分布均匀度来称呼这一特征并使用各气囊压力值的变异系数来表达这一特征,公式如下:

[Cov=i=1N(xi-μ)2Ni=1NXi*N] (13)

3) 在对气囊压力数据进行预处理后,识别压力曲线中的峰值和谷值,并计算它们之间的时间间隔和频率。峰值和谷值的频率和间隔反映了实验者体压变化的节奏和规律性。较高的频率和较短的间隔表明实验者体压变化较为频繁和规律,而较低的频率和较长的间隔则反映了体压变化的缓慢和不规律。频繁的峰值和谷值可能表明频繁的移动或调整姿势,使用压力峰谷值频率来称呼这一特征。

4) 计算气囊压力曲线的最大值和最小值,并计算它们之间的差值,即压力变化的幅度。较大的压力变化幅度表示实验者体压变化较大,而较小的压力变化幅度则反映了体压变化较小。使用气囊压力变化的幅度来称呼这一特征。

5) 再结合设备收集到的气囊压力值的波动情况(单个气囊压力、平均压力与极限压力差以及单个气囊压力值、气囊总压力值)等特征,输入到本文模型中进行实验。床垫传感器记录的压力数据采用标准的压力单位帕斯卡(Pascal),时间数据以秒为单位进行记录。对于每个样本数据,标注了实验者的睡眠姿势作为样本的标签,以便神经网络模型进行监督学习。数据采集过程如图7所示。

为了验证本文提出的结合注意力机制和Bi⁃LSTM模型对基于体压特征进行人员识别模型的最终现实效果,在实验开始前,对所采集到的数据集进行了滑动窗口化采样、标准化等预处理,最终得到4 717个数据样本。实验将数据集按照8∶2的比例随机划分为训练集、验证集。最后根据划分好的数据集对模型进行训练和测试。

3.1.3" 实验环境

本文提出的模型在下述实验平台进行:操作系统为64位Windows 10 操作系统,CPU处理器为IntelⓇ CoreTM i5⁃5600 CPU@3.60 GHz,GPU显卡为NVIDIA RTX 2060 Super GP基于TensorFlow 2.5.0框架实现。批次大小选择32,损失函数为Categorical Crossentropy,优化器为Adam,初始学习率设置为0.001,总训练回合数为300 Epochs。

3.2" 评估策略

该算法使用的是分类识别中常用的评价指标,为准确率(Precision)、召回率(Recall)和[F1]分数([F1]⁃score)。

[Precision=TPTP+FP×100%] (14)

[Recall=TPTP+FN×100%] (15)

[F1⁃score=2×Precision×RecallPrecision+Recall×100%] (16)

这些指标是评估分类模型性能时常用的重要度量。通常情况下,希望模型的准确率和召回率都越高越好,而[F1]值则综合考虑了这两者的表现。

3.3" 实验对比分析

为了验证本文算法(CNN⁃Bi⁃LSTM)的优越性,以及模型中每个模块的作用,本文完成建模后, 使用训练集对模型进行训练,然后使用测试集进行验证。使用LSTM、Bi⁃LSTM进行相同的实验进行验证,结果如表2所示。

模型的优劣可以通过识别率和损失函数这两个关键参数进行评判。当一个模型能够在提高识别率的同时降低损失函数值,那么这样的模型就被视为更为优越。因此,识别率的提升与损失函数的降低是评判模型性能好坏的重要标志。

消融实验训练过程如图8所示。

如图8a)所示,本文模型(CNN⁃Bi⁃LSTM)在迭代50个周期后,识别准确率的变化曲线进入了收敛状态,测试集上的准确率达到了93.86%。在测试集上交叉熵损失函数值达到了16.06%。

由表2与图8b)、图8c)可知:Bi⁃LSTM相比于LSTM在准确率上高了0.11%,模型收敛速度更快,Bi⁃LSTM模型在第50个周期之前已经基本达到收敛状态,而LSTM的收敛速度则明显慢于Bi⁃LSTM,由此可知,Bi⁃LSTM模型的性能要强于LSTM;再将CNN⁃Bi⁃LSTM与Bi⁃LSTM进行对比可以看出,CNN⁃Bi⁃LSTM模型在准确率上比Bi⁃LSTM模型高出了1.58%。CNN⁃Bi⁃LSTM模型比Bi⁃LSTM模型总体上要好的原因是,CNN⁃Bi⁃LSTM模型引入了注意力机制,成功捕捉到了核心实体之间的依赖关系,注意力机制模块还能高效地分配注意力,将注意力放到更有价值的信息上,由此更加合理高效地分配资源,最后获取信息,相关度越强,价值越高,实验结果越好。

实验结果印证了本文对体压特征提取和人员识别方法的论述,将CNN⁃Bi⁃LSTM融合模型与注意力机制有效结合,与其他算法对比实现了真实场景下的高正确率人员识别,因而在人员识别领域具有一定的参考价值。

为了验证方法的有效性,所有模型使用统一的评估标准,包括准确率、召回率和[F1]分数。

本文将提出的模型和近几年来的几种主流的方法进行了对比实验,结果如表3所示。

对比模型的详细参数如表4所示。

4" 结" 语

本文实现了一种在特定场景下通过体压特征来识别人员的方法,通过稀疏传感器的排列方式在保护隐私的同时降低了成本。将采集数据应用到CNN与Bi⁃LSTM进行并行融合再结合注意力机制的人员识别模型中,通过对模型各参数进行有效的组合优化以及调整,最后通过实验得出,不论是在对比实验中与其他常用算法进行对比,还是在消融实验中与模型各部分相比,本文模型的准确度都有一定的增长。在LSTM与Bi⁃LSTM、CNN等模型进行消融实验得出本文模型对人员识别的效果最好,平均识别准确率达到了93.86%。

下一步的研究,拟通过强化学习的方法,提升场景感知能力,创建一个能够适应不同环境和情况的模型,以满足更广泛的需求。

注:本文通讯作者为李长云。

参考文献

[1] 李一.计算机信息安全管理中的生物识别技术分析:评《生物特征识别技术及应用》[J].中国油脂,2023,48(10):156⁃157.

[2] IMAOKA H, HASHIMOTO H, TAKAHASHI K, et al. The future of biometrics technology: From face recognition to related applications [J]. APSIPA transactions on signal and information processing, 2021, 10: 18937.

[3] 余璀璨,李慧斌.基于深度学习的人脸识别方法综述[J].工程数学学报,2021,38(4):451⁃469.

[4] 叶得学,韩如冰,颜鲁合.基于轻量级DenseNet和ZigBee的指纹识别方法[J].湖南科技大学学报(自然科学版),2023,38(4):78⁃87.

[5] 孙洁,赵世鹏,苗盛,等.基于距离特征和聚类损失的深度学习虹膜识别[J].计算机仿真,2023,40(8):245⁃248.

[6] 王全坤,郭冰菁,尤爱民,等.基于SVM的偏瘫患者异常步态识别与临床康复辅助诊断系统[J].计算机应用与软件,2023,40(10):94⁃100.

[7] 王会勇,唐士杰,丁勇,等.生物特征识别模板保护综述[J].计算机研究与发展,2020,57(5):1003⁃1021.

[8] NAKAJIMA K, MIZUKAMI Y, TANAKA K. Footprint⁃based personal recognition [J]. IEEE transactions on biomedical engineering, 2000, 47(11): 1534⁃1537.

[9] QIAN G, ZHANG J Q, KIDANÉ A. People identification using floor pressure sensing and analysis [J]. IEEE sensors journal, 2010, 10(9): 1447⁃1460.

[10] SUUTALA J, RÖNING J. Methods for person identification on a pressure⁃sensitive floor: Experiments with multiple classifiers and reject option [J]. Information fusion, 2008, 9(1): 21⁃40.

[11] KONINGS D, ALAM F, FAULKNER N, et al. Identity and gender recognition using a capacitive sensing floor and neural networks [J]. Sensors, 2022, 22(19): 7206.

[12] HOCHREITER S, SCHMIDHUBER J. Long short⁃term memory [J]. Neural computation, 1997, 9(8): 1735⁃1780.

[13] YU Y, SI X S, HU C H, et al. A review of recurrent neural networks: LSTM cells and network architectures [J]. Neural computation, 2019, 31(7): 1235⁃1270.

[14] 武维,李泽平,杨华蔚,等.融合内容特征和时序信息的深度注意力视频流行度预测模型[J].计算机应用,2021,41(7):1878⁃1884.

[15] 刘今越,周志文,贾晓辉,等.基于柔性压力传感器的睡姿识别方法研究[J].传感器与微系统,2021,40(9):10⁃13.

[16] 赵海文,王佳阔,齐德瑄,等.基于压力感知的坐卧姿势识别方法研究[J].传感器与微系统,2023,42(1):30⁃33.

猜你喜欢
注意力机制神经网络
神经网络抑制无线通信干扰探究
电子制作(2019年19期)2019-11-23 08:42:00
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
软件导刊(2019年1期)2019-06-07 15:08:13
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
软件工程(2017年11期)2018-01-05 08:06:09
InsunKBQA:一个基于知识库的问答系统
基于神经网络的拉矫机控制模型建立
重型机械(2016年1期)2016-03-01 03:42:04
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定