人体运动的数据采集系统及识别设计

2019-07-05 11:20李晓兰
计算技术与自动化 2019年2期
关键词:数据采集传感器人工智能

李晓兰

摘   要:人体运动的数据采集系统可实时监测人体日常活动,为人体运动健康提供了更科学的辅助。利用Shimmer无线可穿戴传感器设备采集运动数据,建立了监测人体运动的8个部位传感器节点模型,并构建了10个具有代表性的动作进行识别。用中值滤波算法实现对原始信号的过滤处理,采用固定滑动窗口分割法对数据进行分割处理,结合特征提取技术来获取包含特性的特征向量,选择主成分分析(PCA)技术对特征提取后的特征向量进行降维处理。同时,提出了多节点运动识别模型,利用支持向量机(SVM)、k近邻(kNN)以及最近距离中心算法(NCC)三种不同的算法对单独节点和组合节点的情况下的传感器数据进行分类识别。实验结果表明,所提出的人体运动数据采集系统具有良好的效果,在使用相同识别算法的前提下,多节点组合识别能获得比单节点识别更好的效果。

关键词:人体运动;数据采集;运动识别;传感器;人工智能

中图分类号:TP18                                                   文献标识码:A

Data Collection System and Recognition Design of Human Motion

LI Xiao-lan?覮

(College of Physical Education,Yan'an University,Yan'an,Shaanxi 716000,China)

Abstract: The data acquisition system of human motion can monitor human daily activities in real time,and provide more scientific assistance for human sports health. Shimmer wireless wearable sensor equipment is used to collect motion data,and eight sensor node models for monitoring human motion are established,and ten representative actions are constructed for recognition. The median filtering algorithm is used to filter the original signal. Fixed sliding window segmentation method is used to segment the data. Feature extraction technology is combined to obtain feature vectors containing features. Principal component analysis (PCA) technology is selected to reduce the dimension of feature vectors after feature extraction. At the same time,a multi-node motion recognition model is proposed. Three different algorithms,support vector machine (SVM),k-nearest neighbor (kNN) and nearest distance center algorithm (NCC),are used to classify and recognize sensor data with individual and combined nodes. The experimental results show that the proposed human motion data acquisition system has a good effect. Under the premise of using the same recognition algorithm,multi-node combination recognition can achieve better results than single-node recognition.

Key words: human motion;data acquisition;motion recognition;sensor;artificial intelligence

近年來受到人工智能界广泛关注的人体运动识别技术正走进人们的日常生活中。用于测量肢体运动、姿势和生理状况的小型可穿戴传感器可以产生高分辨率的定量数据,结合识别模型对运动加以判别,其极大地改善了影响运动能力的研究。在人体运动识别领域,基于可穿戴传感器的运动识别技术己经积累了许多工作,这一类工作利用传感器作为感知手段,通过感知得到的数据序列来识别出其人体的动作行为。文献[1]利用微机械电子系统(MEMS)陀螺仪、加速度计和磁强计测量人体手臂运动状态并进行识别。文献[2]对基于单一传感器与组合式传感器的2种姿态角度测量方法及运用分别进行了阐述,探讨了不同惯性测量单元组合用于姿态测量的方法及其优缺点。但是MEMS的体积较大,在日常的人体运动数据采集中并不适用,仅可在实验室环境中完成[3-4],同时,MEMS对精度的要求极高,庞大的采样数据并不容易进行识别研究。

相比较而言,可穿戴设备的本质就是传感器,各种传感器让一个个戴在身上的小东西实现运动跟踪、数据收集、信息传输和互动[5],正受到越来越多学者的关注。常见的可穿戴设备可分为:运动型传感器[6]和生物型传感器[7]。其中,运动型传感器由陀螺仪、加速度计、压力传感器和磁力计组成。主要运用在手环等设备中,它们总体的主要功能是在智能设备中完成运动监测、导航和人机交互。通过运动型传感器随时随地记录和分析人体活动情况,用户就可以知道自己跑步的步数、骑车的距离、睡眠时间和能量的消耗。而生物型传感器由血糖传感器、血压传感器、心电传感器、体温传感器、脑电波传感器、肌电传感器等组成。主要用于医疗电子设备中。

利用Shimmer无线可穿戴传感器设备搭建了人体运动的数据采集系统。并提出了多节点运动识别模型,使得传感器设备能够以组合或者单独的方式进行运动的识别。最后,通过实验验证了数据采集系统和识别模型的有效性。

1   运动数据的采集与处理

1.1   传感器节点模型

以Shimmer无线可穿戴传感器设备平台为基础,重点研究人体运动数据的采集和预处理技术,以便将数据运用到后续的运动识别模型中。图1为传感器节点模型图,在身体的8个部位:左右手小臂和大臂,左右小腿和大腿分别放置Shimmer无线可穿戴传感器,每个传感器节点对应一个传感器设备。所开发了平衡电池寿命和数据质量要求的可穿戴传感器。由人体佩戴的多个传感器节点和一个基站组成,基站通过IEEE802.15.4协议传输。

1.2   传感器设备

Shimmer无线可穿戴传感器设备平台如图2所示。

综合考虑人体运动的分类,运动的组成和设备位置的判断需要,在数据采集模块,使用的传感器设备组成部分包括:MSP430微控制器、支持802.15.4标准的CC2420无线电、MicroSD插槽、支持2GB的闪存和250mAh可充电锂电池。同时,结合了轴向MEMS加速度计、陀螺仪、ECG、EMG和其他传感器类型的附加接口。尺寸仅为44.5×20×13mm,重量仅为10 g,非常适合长期穿戴。其中,轴向MEMS加速度计范围在±16 g,陀螺仪的角速度范围在±2000°/s,角度的范围是±180°,对常见人体运动如走路、慢跑,以及较剧烈的运动,如骑车,打篮球等,其加速度、角速度及磁力数值的范围和精度都能够满足要求。另一方面,由于人体日常运动的极限频率在100HZ内,设备采样频率在200HZ内,能够满足研究所需人体运动的采集。

1.3   人体运动类型

在日常生活中,人体运动不仅随着动作变化存在识别差异,更会因不同年龄不同习惯的人的姿态也存在着一定的差异。因此,本文根据现有文献提供的人体运动类型[8-10],最终决定选择十个具有代表性的动作进行识别,如表1所示。

1.4   数据的预处理

1.4.1   数据过滤

为了消除噪声信号对人体运动识别的影响,还需对所采集的数据进行预处理。本文利用中值滤波算法[11]实现对原始信号的过滤处理。中值滤波技术对脉冲噪声有良好的滤除作用,特别是在滤除噪声的同时,仍然能够保留传感器原始数据的数据特征。采集到的传感器原始加速度数据和中值滤波后的加速度数据对比效果如图3表示。

中值滤波处理后的加速度数据波形更加平滑,消除了由噪声信号引起的波形毛刺和抖动,同时也纠正了在样本区间280-300中偏离很大的样本(部分加速度值小于0,与整体波形图偏差较大),以便进一步处理。

1.4.2   数据分割

由于所用的可穿戴传感器采集得到的原始数据是连续采样点,并且传感器采样频率较高,因此还需对数据进行分割处理。文献[12]指出通常人体运动的识别持续时间在1~2 s范围内,因此,本文采用固定滑动窗口分割法[13]对过滤后的数据进行分割,并且滑动窗口大小为1s,相邻窗口覆盖为50%,即每50个过滤后的样本点数据组成一个窗口。对过滤后的加速度波形和角速度波形进行分割的结果如图4所示。

由图4可见,样本点数量为50的窗口能够包含较好的一段重复波形,便于下一步特征的提取以及相应运动的识别。

1.4.3   特征提取

为了提取数据过滤和分割后保留下具有识别代表性的传感器数据特征,还需对数据进行特征提取以减少数据冗余,进而提高模型的运动识别能力。本文利用特征提取技术[14]来获取包含识别特性的特征数据向量,结合所采样人体运动的类别,以及识别模型的特性,选用了计算量相对较低,且在相关研究中表现了出较好的八种特征类型:均值、方差、标准差、峰度、均方根、最大值、最小值、能量谱密度。由于传感器节点中包含三类传感器(加速度计、角速度计、磁力计),每類传感器包含X、Y、Z三轴,因此经过特征提取后的特征向量共包含72维(3*3*8)。

1.4.4   特征选择

经过特征提取处理后获得的特征向量包含72个元素,这种高维度的数据样本进行识别模型的训练时,会带来许多不利的影响,甚至严重影响识别模型的人体运动识别能力,还需对高维特征向量再进行降维处理。

选择主成分分析(PCA)技术[15]对特征提取后的特征向量进行降维处理。PCA不仅能够对高维数据进行降维,而且还能利用降维去除噪声干扰。PCA利用线性组合的形式,将r个线性不相关的特征值λi(i∈[1,r])代替原有的n个特征值λj(j∈[1,n]),其中,每个特征值都有其贡献率,假设α代表累积贡献率。本文取α = 0.95,则降维需满足如下公式:

将样本点投影到选取的特征向量上,可把原始的 维特征降低到了 维,使得样本方差达到最大化,充分保留传感器数据采集的原有特性。通过PCA降维处理后,将原有的72维特征向量降成了12维,这大大减少了模型的计算量。

2   多节点识别模型与识别算法

2.1   多节点识别模型

识别模型的数据来源由多个传感器节点组成,通过互相组合使得数据样本更加详细以便对运动进行更好的识别。本文所提出的多节点运动识别模型如图5所示。

2.2   识别算法

选取了支持向量机(SVM)、 近邻(kNN)以及最近距离中心算法(NCC)对人体运动进行识别。

SVM是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析,属于一类广义线性分类器。人体运动的采样数据在经过预处理、分割、提取和选择后,所保留的12维特征向量的数据量较少,且SVM基本上不涉及大数定律和概率测度,在处理只有少量数据样本的问题时,也能获得不错的效果,因此支持向量机在识别运动中能取得不错的效果[16]。

近邻(kNN)算法是数据挖掘分类技术中最简单的方法之一,其工作机制相对简单,主要思路为:如果一个样本在特征空间中的 个最相邻(即距离排序前 )的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别,因此,降维后的人体运动采样数据通过 kNN方法在类别决策时,只与极少量的相邻样本有关,处理数据样本时速度快[17]。

最近距离中心算法(NCC)会计算训练集中每一个类别的中心点,当进行人体运动识别时,只需要计算测试样本到每一个中心点的距离,最近的中心点代表的类别就是识别类别。因此,其能大大节省内存空间和时间花费[18]。

3   实验与分析

3.1   实验数据集

人体运动数据集由十六位同学(4女8男)共同参与完成。为了区分采样数据的差异性,所选取的同学存在着明显的身高、体重以及运动习惯的差异,而不可避免的年龄相近(±4岁)因素的干扰。如图1所示,每个实验参与者在身体的8个部位:左右手小臂和大臂,左右小腿和大腿分别放置Shimmer无线可穿戴传感器,参与者以自己习惯的动作和方式进行了表1所示的十个具有代表性的动作,采集频率为50Hz,每个运动的时间约为10min。传感器设备把运动原始数据利用IEEE802.15.4协议传输到识别系统中,系统将数据存入数据库,以便之后研究。

3.2   评价指标

为了说明所采集数据识别人体运动的准确性,利用精确率(Precision)与召回率(Recall)是作为模型评价指标来处理二分类问题。分类模型中,对于输入的测试数据,模型会得出判断后的标签,即数据的类别,精确率(Precision)指的是模型判断为类别Ci的所有样本中,真正属于类别Ci的样本的比例;召回率(Recall)指的是数据集中,被判定为正确的样本所占的比例。在二分类问题中,假设模型输出的正样本集合为 ,实际的正样本数据集为B,那么精确率(Precision)为公式(2)所示,召回率(Recall)为公式(3)所示。

为了解决不同实验参与者差异性引起的精确率和召回率指标相对矛盾的问题,借助F系数(F-Measure)权衡精确率和召回率。F系数是精确率和召回率的加权调和平均,此时选择F1分数对应着模型识别方法:

当F1较高时对应着模型识别方法比较有效。准确率(Accuracy)表示数据样本被正确分类所占的比例,假设数据域样本总数为n,对于样本i,yi是预测类别标签,Yi是真实类别标签,则准确率可定义为:

其中,l(x)是指示函数(indicator function)。准确率越大表明yi的数量越接近于Yi的数量,既整体样本预测越准确,当樣本预测标签与真实标签完全相同时准确率达到最大值1。

3.3   单传感器节点识别

传感器设备分别放置在身体8个位置,分别利用Shimmer无线可穿戴传感器节点进行人体运动的识别。由于采样数据经过PCA降维后的特征向量为12维,则所选取的kNN中的k取12。同时利用SVM、12NN和NCC三种算法进行实验,通过十字交叉验证方法,得到的识别准确率如表2所示。

从表1中可以看出,kNN算法(k取12)在整体上能获得较高的识别准确率。同时,两手臂部位的平均准确率最高(均大于91%),表明当利用单个传感器进行人体运动识别时,手部能起最大作用。相反,腿部的识别准确率明显较低。总体而言,平均识别准确率都在85%以上,说明如本文所放置的8个传感器节点都能较准确的识别出人体运动。

3.4   组合传感器节点识别

将8个传感器节点作为一个整体,分别利用SVM、kNN(k取12)和NCC三种算法进行人体运动的识别实验的识别性能指标结果如表3所示。

由表3的对比结果可以得出:SVM和kNN算法(k取12)都能获得较好的识别性能,而NCC算法的识别表现有明显差距。总体而言,在使用相同识别算法的前提下,多节点组合识别能获得比单节点识别更好的效果。

4   结   论

利用可穿戴传感器设备搭建了人体运动数据的采集系统,能够完成运动数据的有效采集,相比于基于计算机视觉的方式,在隐私的保护、对外在环境的忍耐性方面都有很大的优势。同时,在单独节点和组合节点的情况下,利用kNN、SVM和NCC算法对传感器数据进行分类识别,得到了较好的效果,验证了运动识别的可行性,也证明了提出的多节点识别模型的有效性。

参考文献

[1]    王雪梅,刘震,倪文波.基于MEMS传感器的手臂运动测量和识别方法[J].中国惯性技术学报,2017,25(06):701—707.

[2]    趙晓皓,盖翔,谢新武,等.基于惯性传感器的人体姿态角度测量方法研究进展[J].医疗卫生装备,2017,38(10):99—103+107.

[3]    陈文,龙海光,陈乐.MEMS技术在现代医疗器械领域中的应用[J].玉林师范学院学报,2017,38(05): 29—33.

[4]    郝旭欢,常博,郝旭丽.MEMS传感器的发展现状及应用综述[J].无线互联科技,2016(03):95—96.

[5]    佟丽娜,侯增广,彭亮,等.基于多路sEMG时序分析的人体运动模式识别方法[J].自动化学报,2014,40(05):810—821.

[6]    刘欢,邱力军,范启富.传感器技术在可穿戴设备中的应用[J].无线互联科技,2017(10):133—134.

[7]    张根选,张莉,石波,等.一种用于癫痫发作预测的可穿戴无线传感器[J].中国医疗器械杂志,2016,40(04): 257—259.

[8]    石敏,杨柳,毛天露,等.服装动画中人体运动与服装变形的相关性学习[J].计算机辅助设计与图形学学报,2017,29(10):1941—1951.

[9]    黄建灯.红外传感器探测人体运动特征的分析研究[J].激光杂志,2017,38(01):65—68.

[10]  陈莉莉.基于重心位移监测的卡路里消耗计算算法[J].西南师范大学学报:自然科学版,2016,41(07):55—60.

[11]  李国燕,侯向丹,顾军华,等.快速中值滤波算法的改进及其FPGA实现[J].电子技术应用,2013,39(02): 137—140.

[12]  左国玉,于双悦,龚道雄.遥操作护理机器人系统的操作者姿态解算方法研究[J].自动化学报,2016,42(12):1839—1848.

[13]  顾韵华,高宝,张俊勇,等.基于标签速度和滑动子窗口的RFID数据清洗算法[J].计算机科学,2015,42(01):144—148.

[14]  曹健,李海生,蔡强,等.图像目标的特征提取技术研究[J].计算机仿真,2013,30(01):409—414.

[15]  史加荣,周水生,郑秀云.多线性鲁棒主成分分析[J].电子学报,2014,42(08):1480—1486.

[16]  郭明玮,赵宇宙,项俊平,等.基于支持向量机的目标检测算法综述[J].控制与决策,2014,29(02): 193—200.

[17]  耿丽娟,李星毅.用于大数据分类的KNN算法研究[J].计算机应用研究,2014,31(05):1342—1344+1373.

[18]  赵其杰,柯震南,陶靖,等.基于密度-距离的t混合模型流式数据聚类[J].仪器仪表学报,2017,38(09): 2130—2137.

猜你喜欢
数据采集传感器人工智能
DEP推出量产内燃机传感器可提升效率减少排放
跟踪导练(三)2
2019:人工智能
人工智能与就业
光纤与光纤传感器
数读人工智能
基于广播模式的数据实时采集与处理系统
通用Web表单数据采集系统的设计与实现
基于开源系统的综合业务数据采集系统的开发研究
下一幕,人工智能!