一种基于CSI数据预处理的人体行为识别方法

2024-01-12 00:00:00史伟光姜皓元
天津工业大学学报 2024年6期
关键词:数据预处理

摘" " 要: 针对已有基于信道状态信息(CSI)的行为识别方法存在冗余信息多、识别精度低等问题,提出一种基于CSI数据预处理的行为识别方法。首先通过计算子载波的贡献度进行子载波的选择,有效降低了CSI中的冗余信息;在此基础上,提出一种CSI动态特征增强算法,从原始CSI信息中分离出动态分量,实现对人体行为的准确表达,从而达到动态特征增强的目的。使用开源的CSI数据进行实验验证。结果表明:将预处理后的CSI数据用于行为识别,准确率较预处理前提升约30.5%;与WiFall、WiAnti预处理方案相比,本文所提方法准确率分别提高了7.5%与3.3%,证实了本文方法的有效性。

关键词: 信道状态信息(CSI);行为识别;数据预处理

中图分类号: TP183;TN92" " " " " "文献标志码: A" " " " " " " " 文章编号:" 1671-024X(2024)06-0066-07

Human activity recognition method based on CSI data preprocessing

SHI Weiguang, JIANG Haoyuan

(School of Electronics and Information Engineering, Tiangong University, Tianjin 300387, China)

Abstract: Aiming at the problems of redundant information and low recognition accuracy of existing CSI-based activity recognition methods, a behavior recognition approach based on CSI data preprocessing is introduced. Initially, subcarrier selection is performed based on the contribution of each subcarrier, effectively reducing redundancy in the CSI data. Building upon this, a CSI dynamic feature enhancement algorithm is proposed to extract dynamic components from raw CSI information, enabling accurate representation of human behaviors and thereby achieving dynamic feature enhancement. The open-source CSI behavioral data is experimentally validated, and the experimental results show that the accuracy of activity recognition after preprocessing is improved by about 30.5%. Compared with the preprocessing schemes of WiFall and WiAnti, the accuracy of the proposed method is improved by 7.5% and 3.3%, respectively, which proves its effectiveness..

Key words:" channel state information(CSI); activity recognition; data preprocessing

随着信息科技的不断发展,基于WiFi信号的人体行为识别需求不断增加[1-2]。信道状态信息(channel state information, CSI)作为WiFi物理层派生的细粒度信息,由于其稳定性,在室内人体行为识别的研究中占据了主要地位[2-6]。

围绕基于CSI的室内人体行为识别,国内外学者提出了多种方法[7-8]。加州州立大学Wang等[7]提出了一种使用CSI相位差数据的遥感系统(PhaseBeat),该系统利用接收端相邻网卡天线之间的CSI相位差数据的周期性来监测呼吸和心跳等微小的人体行为。清华大学Hang等[8]提出了一种轻量级的室内人员检测实时无线传感系统(WiSH),实现了特定环境下的室内人员检测。WiSH系统分析了人员出现前后对于子载波相关性的影响,提出了一种基于运动指示器的人员检测算法,以较小的功耗以及较高的准确性实现室内人员检测。

尽管上述行为识别方法获得了较好的效果,但仍存在以下挑战:①在信号传输过程中,信道在频域中被分为若干个正交子信道,每个子信道上的所有子载波均被用于调制。根据IEEE 802.11n标准的信道分配策略,在相邻WiFi信道中不可避免地存在着重叠的子载波,从而导致严重的信息冗余[9];②通信链路中不同子载波对于运动信息贡献并不相同,贡献较小的子载波信息不仅会稀释有用的信息,也会加剧冗余信息的问题;③此外,原始的CSI数据无法准确表示人体行为所引起的动态变化,也会进一步影响行为识别准确率。

针对上述问题与不足,本文设计了一种新的CSI预处理方案,该方案包括两部分:基于皮尔逊系数的贡献度计算与CSI动态特征增强。首先计算不同子载波对于运动信息的贡献,贡献度较小的子载波被滤除,仅保留贡献度最大的一组子载波,以去除冗余信息,同时降低CSI数据维度。在此基础上,设计了一种CSI动态特征增强算法,该算法可有效分离出由于人体行为所导致的CSI动态分量,实现CSI动态变化对人体行为的准确表达,从而提高系统的识别精度。

1 CSI背景介绍

2011年,Halperin等[10-11]将CSI Tool开源公布,该工具包通过修改Intel 5300网卡驱动固件使得普通WiFi设备也能对信道频率响应(CFR)进行采样,采样CFR数据即为CSI。CSI可以表示通信链路的信道属性[12]。发射信号和接收信号在频域中的关系可以用式(1)描述:

Yi = HiXi + ni(1)

式中:Yi为信号的频域表示;Xi为传输信号;Hi为信道矩阵的增益;ni为环境噪声。当CSI Tool工作在20 MHz带宽的模式时,可以采集到56个子载波中的30个子载波,因此CSI可以提供幅值和相位2个维度的信息。这30个子载波可以表示为:

H = [H1,H2,…,Hi,…,HN](2)

式中:N为子载波的个数。每个子载波的幅度和相位信息可以用Hi表示:

Hi = |Hi|e(3)

式中:∠Hi与|Hi|分别代表第i个子载波的相位和幅度。图1展示了30条子载波的CSI幅值信息,其中横坐标为数据包索引,纵坐标为CSI幅值。

无线信号在传播过程中,若遇到障碍物会改变传输路径,不同路径的信号会相互抵消从而产生信号的衰落[13],这种现象被称为多径效应。多径效应会导致信号的时域和频域信息发生改变,信号通过多径传播时其传播路径如图2所示。

由图2可知,接收端的CSI反映了传输过程中环境的变化,当传感环境中存在人体行为且该行为影响无线信号的传输路径时,CSI的特征会发生较大变化。对多个子载波CSI数据的幅值或相位信息进行分析,将其与不同人体行为建立映射,即可实现行为识别。

2 基于CSI数据预处理的行为识别方法

2.1 识别方法总体框架

参考已有的基于CSI的人体行为识别系统[14],本文建立如图3所示的基于CSI的人体行为识别技术的整体框架。系统框架主要由2部分组成:CSI数据预处理和行为识别。

数据预处理主要由2部分组成:贡献度计算与动态特征增强。预处理后的数据被送入到分类模型中进行训练,实现人体行为识别。为充分比较不同分类模型的性能,本文使用了4种不同的分类模型,分别是支持向量机(support vector machine, SVM)[15]、随机森林(random forest, RF)[16]、K最邻近(K-nearest neighbor, KNN)[17]以及K-Means[18]。

2.2 基于皮尔逊系数的贡献度计算

根据多输入多输出(multi-user multiple-input multiple-output,MIMO)技术[19],发射端高于接收端之间存在多条CSI数据流,在没有人类活动的情况下,每条CSI数据流下的30个子载波呈现极强的相关性。然而,当通信链路中存在人类活动时,子载波之间的相关性将大幅降低,如图4所示。

图4(a)为无人情况下30个子载波的皮尔逊系数矩阵,图4(b)为发生人体行为时30个子载波的皮尔逊系数矩阵。出现这种现象的原因是不同子载波中包含的与人类活动相关的信息是不同的,这一现象可用于后续的CSI分析与计算。

在信息论中,信息熵能够在一定程度上反映序列间信息量和不确定性的关系。在基于CSI的人体行为识别里,信息熵越大,CSI序列包含的运动信息就越多。因此,在综合考虑皮尔逊系数和信息熵之间的关系的基础上,只需要选择几个对运动信息贡献最大的子载波来替换所有子载波,就可以保证在信息完整度最大的情况下,实现冗余信息的滤除。

基于上述的观察和分析,本文提出了一种基于皮尔逊系数的贡献度计算方法。由于弱相关的子载波之间包含更多的信息,因此该部分子载波可以视为包含较多运动信息,即对于运动信息的贡献较大。同理,强相关的子载波对运动信息贡献较小,该部分子载波不仅加剧了数据冗余的问题,同时会影响识别的准确率。本文所提出的子载波选择算法通过计算外贡献度和内贡献度来衡量子载波对于运动信息的贡献,算法的输出结果为一组具有最大贡献度的子载波索引。通过将所选子载波的特性用于表示所有子载波的特征,滤除其余子载波,在大幅减少冗余信息的同时,最大限度地避免运动信息的丢失。此外,完成子载波选择后,相邻子载波的重叠问题也得到了有效解决,进一步减小了冗余信息的影响。

贡献度计算的具体步骤为:

步骤1:根据式(4)计算不同子载波序列之间的皮尔逊系数,获取子载波的外贡献度α:

α =

mean()

(4)

式中:mean(·)表示取平均值;k1 (i)和k2 (i)分别为子载波序列k1和k2中的第i个元素;a1和a2分别为2条子载波序列的平均值;l为序列长度。根据式(4),可以得到一个30×30的外贡献度矩阵O:

O = (5)

式中:α(ki,kj)为第i条子载波序列与第j条子载波序列的外贡献度。

步骤2:根据式(6)计算单个子载波序列内不同数据包之间的皮尔逊系数,获取子载波的内贡献度?茁。这里采用的计算方法是将单个子载波序列分成2个序列,然后计算2个序列的皮尔逊系数。其中序列1包括第1个数据包至倒数第2个数据包,序列2包括第2个数据包到最后1个数据包。内贡献度的计算公式可以描述为:

式中:cov(·)表示求皮尔逊系数。根据式(6)可以获得一个的ICC矩阵I:

式中:?茁(ki)为第i条子载波序列的内贡献度。

步骤3:根据式(8)计算贡献度θ:

最后得到一个30×30的贡献度矩阵C:

式中:θ(ki,kj)为2条子载波ki与kj之间的贡献度。根据上文所述,为了选择对运动信息贡献度最大的子载波组合,本文在C的每一列中查找最大的元素,并记录其表示的子载波索引。然后计算所有子载波索引的出现次数,并选择出现次数最多的5个子载波的组合作为最终结果。

2.3 CSI动态特征增强

在没有人体行为发生的静态环境下,CSI信号的表现形式较为稳定,但是当环境中出现人体行为时,即环境由静态转为动态时,这种稳定的信号模式会发生显著的变化。为提取出动态环境下改变CSI信号模式的动态特征分量,本文首先将CSI分为2部分:

H(t) = Hs(t) + Hd(t)(10)

式中:Hs(t)为与人类活动无关的CSI静态分量,该分量主要由环境影响;Hd(t)为由人类活动引起的CSI动态分量,该分量主要由人体行为影响。需指出,Hs(t)通常是H(t)中的主要成分,因为人类活动对于整个传感环境的影响通常是有限的。在此情况下,若直接使用H(t),将严重影响识别的准确性。

由于环境并不会轻易发生改变,因此,静态分量Hs(t)在时序区间上呈现较为稳定的特性。基于此,可以从H(t)中过滤出静态分量Hs(t)。本文使用基于指数移动加权平均(exponentially weighted moving average, EWMA)的递归算法来估计CSI中的静态分量,第t次递归的Hs(t)可以近似为:

Hs′(t) ≈ εH(t) + (1 - ε)Hs′(t - 1)(11)

式中:Hs′(t)为Hs(t)的估计值;ε为遗忘因子。考虑到动作刚开始时,人体行为并未对信号模式产生较大影响,因此本文将Hs′(t)的初始值设置为H(1)。在这种情况下,估计得到的CSI动态分量Hd′(t)可以表示为:

Hd′(t) = H(t) - Hs′(t)(12)

N个数据包的CSI动态分量矩阵的估计结果可以由下式给出:

Hd′ = [Hd′(1),Hd′(2),…,Hd′(N)](13)

式中:Hd′主要包含与人体行为相关的信息。这对于提取用于分类不同活动的独特特征具有重要意义。

为验证所提预处理方案的有效性,本文将提取的Hd′输入到4种分类模型中,完成行为识别。

3 实验结果分析

为了验证预处理方案的有效性,本文使用公开的人体行为数据集[19]的7种人体行为进行验证,每种人类行为共包含400次试验,为方便记录,本文将使用的7种人体行为分别命名为HA-X,如表1所示。

该数据集使用从Sagemcom 2704路由器传输到配备Intel 5300网卡的台式电脑的WiFi信号。路由器的工作频段为2.4 GHz,信道带宽为20 MHz。

3.1 在不同分类算法中的应用效果

分类算法的性能通常采用算法对于整体样本分类的准确率衡量,准确率的计算公式为:

A = NT /Nw′(14)

式中:A为准确率;NT为识别准确的样本数;Nw′为总样本数。

本次实验选取120个样本作为训练数据,40个样本作为测试数据。由于K-means与KNN算法无需训练,只需求取数据样本之间的欧式距离即可完成分类,因此,本文选取同样的40个训练样本直接使用上述2种算法进行预测。

为验证预处理方案的有效性,本文首先给出了使用预处理前后的识别准确率的对比。图5为预处理前后4种分类算法的人体行为识别结果。

由图5可以看出,与未经预处理的分类结果相比,经过预处理后的分类结果准确率提升较为明显,提升了约30.5%。其中,识别精度最低的SVM,准确率也达到了0.9;识别精度最高的为KNN,将n_neighbors设置为7时,此时分类效果最好,分类准确率能够达到0.975。由此充分说明了本文所提预处理方案的有效性,为后续实验提供了一定的参考价值。

为进一步细化比较,本文引入了F1分数从而对模型进行客观全面的评估,F1分数的计算公式如式(15)—式(17)所示:

式中:TP、FP、TN和FN分别是真阳性结果、假阳性结果、真阴性结果和假阴性结果的数量。准确率体现了对所有活动的分类能力,而F1分数能够评估单个活动的准确率。本文给出了4种算法的F1分数,如表2所示。

混淆矩阵能够更加直观地展现模型对不同人体行为的识别准确率,本文可视化了4种算法的混淆矩阵,如图6所示。

在图6的这些算法中,KNN算法的平均准确率最高,每个动作的识别精度均超过0.95。这表明本文提出的预处理方法与KNN算法具有较好的适配性,因此本文选择KNN算法作为后续性能对比的分类模型。此外,算法性能与动作类型密切相关。对于HA-1、HA-4、HA-6(接近、击掌、指右手)等动作,所提预处理方法在KNN算法下的识别精度相对较低,但仍高于其他3种分类算法在相同动作下的表现。而对于HA-2、HA-3、HA-7(摇晃、握手、推)等动作,各分类算法的精度差异较大,然而在KNN算法上,这些动作的识别精度均达到了1,表现出最佳的性能。

3.2 不同预处理方案的性能比较

早期的数据降维方法主要为子载波融合,WiFall[20]作为其中的代表,以较小的运算量实现了较好的识别精度。随着基于CSI行为识别研究的深入,研究者们提出了子载波选择算法用于数据降维,WiAnti[21]提出了一种基于皮尔逊系数的子载波选择算法,并实现了较好的效果。因此,为验证本文所提方法的优越性,在该部分对比实验中,本文选取了2种较为经典的方法WiFall和WiAnti中的预处理方法进行实验对比。

为保证比较的有效性,本文选取分类效果最好的KNN算法作为统一的分类模型。其中,WiFall采用的子载波选择策略为子载波融合,对30个子载波的数据取平均值后,将30个子载波融合为1个。这种融合策略虽然大幅降低了后续计算过程的运算量,但容易忽略不同子载波的特性,因此必然导致识别性能较低。WiAnti采用的子载波选择策略为计算不同子载波的相关系数,根据最弱相关的原则选出6个子载波来代替所有子载波。考虑到子载波内不同数据包也存在相当大的相关性,因为运动持续期间,不同时间段的数据所表示的运动信息也不同,如果忽略这部分相关性会导致一定程度的信息丢失,从而导致识别性能的降低。本文所提方法,在此基础上进行了改进,综合考虑了子载波在时域与频域的相关性,最大限度地保留了运动信息。

3种预处理方案的性能比较结果如图7所示。

由图7可知,所提方法在每个动作的精度均高于其他方法,尤其对于HA-3、HA-4的精度达到了1。而经过WiFall、WiAnti预处理后的算法平均识别精度均未超过0.9。总体来说,所提的改进预处理方案对模型的整体性能有了较大的提升,与WiFall、WiAnti中的预处理方案相比,本文所提方法的准确率提升了约7.5%与3.3%。

3种预处理方案的识别时间对比如图8所示。

由图8可见,本文所提方法在每个动作的识别时间上略高,但仅比用时最短的WiFall预处理方法多出0.05 s。分析可知,WiFall识别时间较短的原因可能在于它将30个子载波简化为一个子载波进行数据降维,但由于融合方式过于简单,导致大量信息丢失,最终影响了识别精度。而WiAnti通过计算不同子载波之间的相关系数,并按照相关性最弱的原则选择6个子载波作为最终组合,但忽略了单个子载波内不同数据包所包含的运动信息。相比之下,本文所提算法综合考虑了多种因素,提出了基于贡献度的子载波选择算法。尽管该方法在识别单个动作时的耗时略高,但考虑到其在提升识别精度方面的优势,这一耗时仍然处于可接受的范围内。

4 结 论

本文针对已有CSI行为识别系统所存在的问题,提出了一种基于CSI数据预处理的行为识别方法。通过基于皮尔逊系数的子载波贡献度计算滤除贡献度较小的子载波信息,有效降低了冗余信息。通过CSI动态特征增强,实现了CSI对人体行为的准确表达。将预处理后的CSI数据用于行为识别,性能较预处理前提升约30.5%。将本文预处理方案与WiFall、WiAnti 2种预处理方法同时用于KNN分类,对比预处理后的分类效果,准确率分别提升7.5%与3.3%。尽管本文所提方法获得了较好的识别精度,但仍有待进一步改善。目前该方法仅考虑在固定环境下的行为识别,在未来研究中,期待能够实现基于CSI的行为识别的迁移性学习,从而进一步增强这一技术的普适性与应用性。

参考文献:

[1]" " SONG Y X, YU F R, ZHOU L, et al. Applications of the Internet of Things (IoT) in smart logistics: A comprehensive survey[J]. IEEE Internet of Things Journal, 2021, 8(6): 4250-4274.

[2]" "LI J Y, YIN K, TANG C P. SlideAugment: A simple data processing method to enhance human activity recognition accuracy based on WiFi[J]. Sensors, 2021, 21(6): 2181.

[3]" " 王聪, 王勤.基于WiFi信号的人体活动识别深度学习算法[J].信息与电脑,2021,33(4):65-67.

WANG C,WANG Q. Deep learning algorithm for human activity recognition based on WiFi signals[J]. China Computer amp; Communication,2021,33(4): 65-67 (in Chinese) .

[4]" " YANG J M, LIU Y M, LIU Z Y, et al. A framework for human activity recognition based on WiFi CSI signal enhancement[J]. International Journal of Antennas and Propagation, 2021, 2021: 6654752.

[5]" " DING X, JIANG T, ZHONG Y, et al. Improving WiFi-based human activity recognition with adaptive initial state via one-shot learning[C]//2021 IEEE Wireless Communications and Networking Conference(WCNC). Nanjing: IEEE, 2021: 1-6.

[6]" " HUANG W B, ZHANG L, WU H. Channel-equalization-HAR: A light-weight convolutional neural network for wearable sensor based human activity recognition[J]. IEEE Transactions on Mobile Computing, 2023(9): 5064-5077.

[7]" " WANG X Y, YANG C, MAO S W. PhaseBeat: Exploiting CSI phase data for vital sign monitoring with commodity WiFi devices[C]//2017 IEEE 37th International Conference on Distri-buted Computing Systems(ICDCS). Atlanta, GA, USA: IEEE, 2017: 1230-1239.

[8]" " HANG T M, ZHENG Y, QIAN K, et al. WiSH: WiFi-based real-time human detection[J]. Tsinghua Science and Technology, 2019, 24(5): 615-629.

[9]" " 李红利, 刘元建, 张荣华, 等. 基于无线传感器网络的社区心电监护系统设计[J]. 天津工业大学学报,2015,34(1):64-67.

LI H L, LIU Y J, ZHANG R H, et al. The design of a community ECG monitoring system based on wireless sensor networks[J]. Journal of Tiangong University, 2015, 34(1): 64-67(in Chinese).

[10]" HALPERIN D, HU W J, SHETH A, et al. Predictable 802.11 packet delivery from wireless channel measurements[J]. ACM SIGCOMM Computer Communication Review, 2010, 40(4): 159-170.

[11]" HALPERIN D, HU W J, SHETH A, et al. 802.11 with multiple antennas for dummies[J]. ACM SIGCOMM Computer Communication Review, 2010, 40(1): 19-25.

[12]" YANG Z, ZHOU Z M, LIU Y H. From RSSI to CSI[J]. ACM Computing Surveys, 2013, 46(2): 1-32.

[13]" CHICUREL-UZIEL E. Dirac delta representation by exact parametric equations:Application to impulsive vibration systems[J]. Journal of Sound and Vibration, 2007, 305(1/2):134-150.

[14]" SHI Z G, ZHANG J A, XU R Y, et al. Environment-robust device-free human activity recognition with channel-state-information enhancement and one-shot learning[J]. IEEE Transactions on Mobile Computing, 2022, 21(2): 540-554.

[15]" VAPNIK V N. Statistical Learning Theory[M]. New York: Wiley-Interscience, 1998: 401-492.

[16]" 董师师, 黄哲学. 随机森林理论浅析[J]. 集成技术, 2013, 2(1): 1-7.

DONG S S, HUANG Z X. A brief theoretical overview of random forests[J]. Journal of Integration Technology, 2013, 2(1): 1-7 (in Chinese).

[17]" 李佳烨, 余浩. 基于K近邻的众包数据分类算法[J]. 计算机应用研究, 2020, 37(4): 973-976.

LI J Y, YU H. Crowdsourcing data classification algorithm via K-nearest neighbor[J]. Application Research of Computers, 2020, 37(4): 973-976 (in Chinese).

[18]" 张峻豪, 吴飞, 朱海. 基于GD-Kmeans和菲涅尔理论的WiFi手势识别方法[J]. 计算机工程与应用, 2020, 56(19): 126-131.

ZHANG J H, WU F, ZHU H. WiFi gesture recognition method based on GD-Kmeans and Fresnel theory[J]. Computer Engineering and Applications, 2020, 56(19): 126-131 (in Chinese).

[19]" ALAZRAI R, AWAD A, ALSAIFY B, et al. A dataset for Wi-Fi-based human-to-human interaction recognition[J]. Data in Brief, 2020, 31: 105668.

[20]" WANG Y X, WU K S, NI L M. WiFall: Device-free fall detection by wireless networks[J]. IEEE Transactions on Mobile Computing, 2017, 16(2): 581-594.

[21]" HUANG J Y, LIU B, JIN H X, et al. WiAnti: An anti-interference activity recognition system based on WiFi CSI[C]//2018 IEEE International Conference on Internet of Things (iThings) and IEEE Green Computing and Communications (GreenCom) and IEEE Cyber, Physical and Social Computing (CPSCom) and IEEE Smart Data (SmartData). Halifax, NS, Canada: IEEE, 2018: 58-65.

本文引文格式:

史伟光,姜皓元. 一种基于CSI数据预处理的人体行为识别方法[J]. 天津工业大学学报,2024, 43(6): 66-72.

SHI W G, JIANG H Y. Human activity recognition method based on CSI data preprocessing[J]. Journal of Tiangong University, 2024, 43(6): 66-72(in Chinese).

猜你喜欢
数据预处理
审计数据预处理探析
中国经贸(2017年16期)2017-09-22 06:37:55
基于数据预处理的病虫草害农田小气候监测系统设计
基于云计算的海量数据挖掘研究
无线传感器网络的异常检测
基于人脸识别的智能大数据处理系统的研究
枣果实品质鉴定因子数据的预处理研究
基于小轿车车门拉手的逆向建模设计
科技视界(2016年27期)2017-03-14 22:45:40
自动气象站数据预处理方法
刍议电力系统规划设计在电力工程设计中的应用
中国市场(2016年41期)2016-11-28 05:30:48
慢性乙肝症状与生物信息相关性的数据挖掘研究