孙 伟,杨一涵,孙 枫,姜 伟
(1. 辽宁工程技术大学 测绘与地理科学学院,辽宁 阜新 123000;2. 哈尔滨工程大学 自动化学院,哈尔滨 150001)
目前行人运动特征识别方法主要包括借助外部传感器监控(如视频分析)的方式和利用可穿戴式传感器开展自主分类[1-4],而视频分析算法复杂、成本高且需要在应用环境内事先布设拍摄设备,限制了行人运动特征监测的适用性、便捷性和成本[5-7]。智能移动端的普及性及其内置 MEMS惯性传感器具备的运动信息感知特征,使得基于惯性原理的行人运动特征提取成为可能[8-13]。
本文拟针对不同年龄不同身高的男女性测试人员的行走、跑步和上下楼梯4种典型日常活动特征进行识别,通过提取MEMS惯性传感器数据幵利用机器学习算法训练分类器进一步提高识别的精度和可靠性。
米3手机内置惯性传感器组件为Invensense公司的6轴运动跟踪器件MPU6050,包含三轴陀螺仪与三轴加速度计[8]。实验数据仅用到三轴加速度数据,MPU6050加速度计最大量程±2g,噪声手机坐标系的定义如图1所示:手机屏幕朝上水平放置时,x轴(横向轴)水平指向右侧,y轴(纵向轴)沿屏幕指向正前方,z轴(竖直轴)垂直屏幕向上。
图1 手机坐标系定义Fig.1 Definition of phone coordinate system
单纯利用加速度计输出信息对行人活动状态辨别时存在误判和漏判现象[14-17],因此需要通过提取数据特征帮助实现运动特征的准确识别。时域特征能够直接从原始数据提取,反映信号波形特征及其统计特性;频域特征的提取需要基于快速傅里叶变换所示的信号频域特性,进而提取信号周期。
利用在时域空间与频域空间提取出的大量特征进行特征识别一般情况下会得到较高识别率,但同时也带来了特征间冗余、计算量增大、识别效率低等问题。本文期望在保证识别率前提下,降低特征冗余幵减少计算量,因此选择主成分分析法对特征空间进行降维处理。特征提取时将重采样后的加速度数据按2 s滑动窗口进行分割,通过对行人活动分析可知,2 s时长的数据窗口足以反映不同运动特征。
x轴加速度由于垂直于行人前进方向指向人体侧面,主要反映了行人横向运动特征,在本文所要识别的4种活动模式中变化不明显,因此在计算加速度幅值时只考虑y轴和z轴加速度。
待分析的时域特征参数包括:
1)滑动均值
设数据总长度为L,滑动窗口长度为l,记表示第k个窗口内加速度幅值的滑动均值,则:
其中,
2)幅值小于Q1的平方和
Q1即第一四分位数,它是指将窗口内加速度幅值按由小到大排列后四等分,位于前三个分割点的加速度幅值分别记为Q1、Q2、Q3。因此幅值小于Q1的平方和为:
3)幅值小于Q3的平方和
行走、跑步、上楼梯、下楼梯这4类行人活动标准化的时域特征如图2所示。由图2可知,行走、跑步两类活动与上、下楼梯具有良好的区分性,而上楼梯与下楼梯具有交叠区域,为准确识别这两类活动增加了难度,将从频域角度开展分析。
图2 标准化的时域特征Fig.2 Normalized time-domain features
由手机携带方式易知,y轴加速度与大腿方向一致,在行人活动中最能反映腿部运动特征,因此频域特征提取时,仅对y轴加速度应用FFT变换至频域。
待分析的频域特征参数包括:
1)最大幅值
计算频谱图中低于5 Hz的幅值最大值:
其中,为频率f处的幅值。
2)峰值数
频谱图中低于5 Hz的幅值出现峰值的次数:
其中,
3)幅值之和
计算频谱图中所有0~5 Hz之间幅值之和:
提取到的特征具有不同含义,为直观比较各类特征,先按式(7)对每一特征进行标准化:
其中:为第 k个数据窗口第 j类特征值,标准化后的值;分别表示所有活动第j类特征值的最大值和最小值。
图3所示的标准化频域特征中,上下楼梯的特征交叠区域较小,能够得以明确区分,但下楼梯与行走存在交叠。
图3 标准化的频域特征Fig.3 Normalized frequency-domain features
模型训练采用最邻近规则(k-nearest neighbor,KNN)算法。KNN算法是一种常用的监督学习算法,与一般监督学习算法需要开展大量训练不同之处在于KNN模型训练时间较小。对于给定的测试样本,基于选定的某种距离度量找出训练集中与该测试样本最接近的K个训练样本,然后根据这K个“邻居”的信息来进行预判。在行人活动分类任务中,采用“投票法”预判,即选择K个样本中出现最多的活动类别标记作为预判结果。
将 4种日常行人活动训练数据分别提取时域和频域的6种特征,按行走、跑步、上下楼梯依次排列构成维模型训练输入矩阵,幵按相同顺序分别为各类活动打上标签,记4类活动标签分别为2、3、1、1,共同构成的活动标签作为模型训练输出向量。模型训练如图4所示,图中每小格包含个数。选择Matlab统计与机器学习工具箱fitcknn函数训练 KNN分类器,设定 K=30,即利用最邻近的 30个数据对待分类样本进行归类。
图4 模型训练输入输出Fig.4 Input/output in model training
如图4所示,输入为训练活动数据集:
其中:为训练活动的特征向量;动作的类别。采用欧式距离作为距离度量:
在动作训练集 T中找到与活动特征向量最邻近的K个点,这K个点的邻域记作在中根据分类决策的规则决定的所属类别
式中:I为指示函数;当为1,否则为0。
安卓系统软件开发模块按传感器刷新率由低到高依次提供 4 种采样模式:User Interface、Normal、Game、Fastest。各采样模式对应采样率均非常值,且不同手机同一采样模式数据刷新率也不同。由于行人日常活动对应频率一般处于 2~5 Hz之间[12-13],因此采用Normal模式获取米3内置加速度计传感器数据。
将米3手机放置于右前侧裤兜中进行数据采集,每次数据采集开始前和结束后都静止5 s以便准确提取相应的活动数据。分别采集行走、跑步、上下楼梯4种日常活动数据,单次数据采集结束即刻将数据以文本格式保存在手机存储卡中。数据采集地点位于辽宁工程技术大学北校区校园内,行走和跑步在校园主干道一段约 500 m的直线路段进行,上下楼梯则选择在主体高度为 7层的博文楼中进行。
完成数据采集后统一将采集到的数据转移至计算机,应用Matlab逐一分析每种活动状态对应的数据。由于数据采样为非均匀采样,因此首先需要以固定采样率对采集数据进行重采样,然后分别提取最能代表每种活动特征的1 min长度的数据用于模型训练。选择相同长度的训练数据可以避免由于某一类活动训练数据过多或过少可能引起的模型学习误差,避免出现对该类活动的过拟合或欠拟合问题。行人活动识别流程如图5所示。
用于行人活动识别的试验数据采集方式与训练数据相同,采集地点为学校惠和楼内。实验轨迹如下:站立静止5 s后开始沿4层走廊由西向东行走,走到楼梯口则沿楼梯下至3层,然后沿3层走廊由东向西跑步,至楼梯口再沿楼梯上至4层,最后再静止5 s后结束数据采集。将采集的试验数据上传计算机,剔除前、后5 s数据后得到的y轴、z轴加速度数据,提取6类特征后应用训练得到的KNN模型进行识别。
图5 行人活动识别流程图Fig.5 Flowchart of pedestrian activity recognition
为验证KNN算法提取行人运动特征的普适性,选取10名测试人员组成测试样本,涵盖身高155~190 cm、年龄从18岁至42岁范围内的男性和女性。
由图6(a)~6(j)可看出大部分活动识别正确,但存在少量误判。
为进一步反映识别效果,给出图6所对应的分类混淆矩阵,如表1~10所示。
图6 行人活动识别结果Fig.6 Results of pedestrian activity recognition
表1 样本1分类混淆矩阵Tab.1 Confusion matrix of sample 1
表2 样本2分类混淆矩阵Tab.2 Confusion matrix of sample 2
表3 样本3分类混淆矩阵Tab.3 Confusion matrix of sample 3
表4 样本4分类混淆矩阵Tab.4 Confusion matrix of sample 4
表5 样本5分类混淆矩阵Tab.5 Confusion matrix of sample 5
表6 样本6分类混淆矩阵Tab.6 Confusion matrix of sample 6
表7 样本7分类混淆矩阵Tab.7 Confusion matrix of sample 7
表8 样本8分类混淆矩阵Tab.8 Confusion matrix of sample 8
表9 样本9分类混淆矩阵Tab.9 Confusion matrix of sample 9
表10 样本10分类混淆矩阵Tab.10 Confusion matrix of sample 10
由混淆矩阵计算得到分类结果的平均查准率与平均查全率:
其中:表示第i类活动分类正确;表示其他类别活动错误分类为i类;表示第i类活动错误分类为其他类别。
如表11所示,KNN分类器对4类行人日常活动识别率较高,10组测试的总体平均查准率和查全率分别达到 88.7%和 90.3%,可满足日常生活中对走、跑步、上下楼梯这4种行人运动特征识别的普适性要求。
表11 平均查准率与查全率Tab.11 Average precision and recall
行人运动特征识别有助于提高基于行人航位推算的微惯性行人导航系统的精度。本文采用智能手机内置加速度计采集行人运动数据,通过设置滑动窗口对数据进行分割,在各窗口内分别提取加速度的3种时域特征与3种频域特征并进行标准化。利用标准化后的特征训练 KNN分类器实现对行走、跑步、上下楼梯4类日常行人运动特征的识别。
不同年龄不同身高的男女性实验结果表明,训练模型能够有效辨识4类行人运动特征,且平均查准率和查全率分别达到 88.7%和 90.3%。该测试结果可为行人运动特征的获取幵开展行人运动觃律统计及定位需求提供技术支持。
参考文献(References):
[1] Saeedi S, El-Sheimy N. Activity recognition using fusion of low-cost sensors on a smartphone for mobile navigation application[J]. Micromachines, 2015, 6(8): 1100-1134.
[2] Lugade V, Fortune E, Morrow M, et al. Validity of using tri-axial accelerometers to measure human movement -Part I: Posture and movement detection[J]. Medical Engineering & Physics, 2014, 36(2):169-176.
[3] 瞿涛, 邓德祥, 刘慧, 等. 多层独立子空间分析时空特征的人体行为识别方法[J]. 武汉大学学报(信息科学版), 2016, 41(4): 468-474.
Qu T, Deng D X, Liu H, et al. Extracting spatio-temporal features via multi-layer independent subspace analysis for action recognition[J]. Geomatics and Information Science of Wuhan University, 2016, 41(4): 468-474.
[4] Attal F, Mohammed S, Dedabrishvili M, et al. Physical human activity recognition using wearable sensors[J].Sensors, 2015, 15(12): 31314-31338.
[5] 陈国良, 张言哲, 杨洲. 一种基于手机传感器自相关分析的计步器实现方法[J]. 中国惯性技术学报, 2014,22(6): 794-798.
Chen G L, Zhang Y Z, Yang Z. Realization of pedometer with auto-correlation analysis based on mobile phone sensor[J]. Journal of Chinese Inertial Technology, 2014,22(6): 794-798.
[6] 孙伟, 丁伟, 闫慧芳. K均值聚类自适应零速检测人员定位技术[J]. 传感技术学报, 2017, 30(2): 296-301.
Sun W, Ding W, Yan H F. Pedestrian positioning technology with K-means clustering adaptive zero velocity detection[J]. Chinese Journal of Sensors and Actuators, 2017, 30(2): 296-301.
[7] 路永乐, 张欣, 龚爽, 等. 基于 MEMS惯性传感器的人体多运动模式识别[J]. 中国惯性技术学报, 2016, 24(5):589-594.
Lu Y L. Zhang X, Gong S. Recognition of multiple human motion patterns based on MEMS inertial sensors[J]. Journal of Chinese Inertial Technology, 2016, 24(5):589-594.
[8] Zhang M, Sawchuk A A. Human daily activity recognition with sparse representation using wearable sensors[J]. IEEE Journal of Biomedical & Health Informatics,2013, 17(3): 553-560.
[9] San-Segundo R, Lorenzo-Trueba J, Martínez-González B,et al. Segmenting human activities based on HMMs using smartphone inertial sensors[J]. Pervasive & Mobile Computing, 2016, 30: 84-96.
[10] Chetty G, White M, Akther F. Smart phone based data mining for human activity recognition[J]. Procedia Computer Science, 2015, 46: 1181-1187.
[11] Harle R. A survey of indoor inertial positioning systems for pedestrians[J]. IEEE Communications Surveys &Tutorials, 2013, 15(3): 1281-1293.
[12] 肖子明, 马双宝, 薛勇, 等. 基于三维重力加速器人体动作识别与分类[J]. 武汉大学学报(工学版), 2015,48(3): 429-432.
Xiao Z M, Ma S B, Xue Y, et al. Recognition and classification of human activity by triaxial gravity accelerator[J]. Engineering Journal of Wuhan University, 2015,48(3): 429-432.
[13] 衡霞, 王忠民. 基于手机加速度传感器的人体行为识别[J]. 西安邮电大学学报, 2014, 19(6): 76-79.
Heng X, Wang Z M. Human activity recognition based on accelerometer data from a mobile phone[J]. Journal of Xi’an University of Posts and Telecommunications, 2014,19(6): 76-79.
[14] Saeedi S, Moussa A, El-Sheimy N. Context-aware personal navigation using embedded sensor fusion in smartphones[J]. Sensors, 2014, 14(4): 5742-5767.
[15] Liu Y, Yu Y, Lu Y L. Real-time human activity recognition based on time-domain features of multi-sensor[J].Journal of Chinese Inertial Technology, 2017, 25(4): 455-460.
[16] Özdemir A T, Barshan B. Detecting falls with wearable sensors using machine learning techniques[J]. Sensors,2014, 14(6): 10691-10708.
[17] Wang Z L, Zhao H Y, Qiu S, et al. Stance-phase detection for ZUPT-aided foot-mounted pedestrian navigation system[J]. IEEE/ASME Transactions on Mechatronics, 2015,20(6): 3170-3181.