国网开封供电公司 王宏研
浅谈基于传感器的人体行为识别
国网开封供电公司 王宏研
行为识别通过分析获取的人体行为信息来理解人的具体行为,以及推断其下一步行为,具有很高的研究价值和广阔的应用领域。本文对近年来基于传感器的人体行为识别的发展现状和常用方法进行回顾分析,并对其相关难点和研究方向作了简要论述。
行为识别;时间窗口;行为特征提取;行为特征理解
在普适计算的模式下,整个系统都是为人服务的,其中人机交互是普适计算的一个重要环节,它的本质是需要计算机了解用户当前的行为信息,因为人的行为往往与其所处的环境息息相关,人的意图也都是通过其本身的行为所表达的。如果我们可以利用计算机技术手段判别用户的行为信息,系统就可以依据用户的当前行为推测其意图,进而为用户提供相应的服务,其中对于用户行为的确定性显得尤为关键,所以有必要对人体行为识别展开深入的研究。
基于传感器的行为识别是计算机通过传感器设备获取用户的行为数据,经过一系列机器学习、数据挖掘的相关处理,建立分类模型,进而识别出用户的具体行为,使计算机系统能够主动的协助用户的工作。
图1 行为识别框架
在目前的研究中,基于传感器的行为识别流程大体可分为五个部分,具体如图1所示。
(1)数据采集:主要用来获取用户的行为数据,其数据类型取决于采用的传感器类型;
(2)数据预处理:主要用来对获取的原始数据进行去燥、格式化处理等预处理操作;
(3)特征提取:主要是对前期格式化的数据进行表征化的特征提取,以形成用于训练分类模型或识别具体类别的特征向量序列;
(4)分类模型:主要是针对处理好的行为数据进行有监督分类学习或无监督分类学习,从而训练行为识别模型;
(5)识别结果:主要是使用训练好的分类器对未知的行为进行类别划分;其中数据采集、特征提取和分类模型是行为识别中的三个主要部分。
近几十年来,随着微电子工艺的发展,小巧且智能的传感器不断涌现,这为行为识别研究提供了硬件支撑。行为数据是进行行为识别的关键所在,在实际应用中,根据选用的传感器及佩戴部位的不同,得到的行为数据也不尽相同。
部分研究通过手机自带的传感器来获取使用者的加速度、方向等信息,来预判用户的行为,这也是目前一种较为常见的基于手机传感器的行为识别方法,但这种方法获取的数据受限于手机的置放位置,现在已有针对手机非约束的研究出现。
还有部分研究通过使用传感器来获取用户的位置信息,进而推断用户行为。譬如基于WIFI传感器数据的方法,它通过用户接入无线热点,推断出用户的所有隐变量(位置变量、动作变量及目标变量),这种行为数据获取方式往往需要大量的前期准备,工作量较大。
还有就是通过在人体部位佩戴各种传感器(譬如加速度计),获取用户在不同行为状态下的数据,这种方法一般选择采集变幅较大的身体部位数据,或者根据不同行为有针对性的佩戴在某些身体部位,这是一种目前较为主流的基于传感器的人体行为识别方法。
另外,还有一些研究通过在用户的日常物品上安装射频传感器,采集用户使用物品的数据,进而来判别用户的行为。这种数据获取方法具有被动型、间断性,因为只有用户使用物品时,才可以获取用户的行为数据信息。
从传感器得到的原始数据序列是一个连续的数据流,如果直接使用这些数据难以反映出人体的运动形态。因此,需要对这些原始数据进行预处理和语义分析,进而提取高阶特征来表征行为,并建立特征向量序列集训练分类模型,以实现通过数据分析对未知行为类别进行识别;其中滑动时间窗口及特征选取是此部分要解决的重点问题。
由于得到的原始数据为数据流,如何从数据流中分割出包含一个完整行为信息的数据段就是时间窗口的划分问题。
如果过大划分时间窗口,则时间片内的行为数据量过多,增大了计算量,也增加了系统负载;如果过小划分时间窗口,则时间片内的数据不能完整包含一个行为,造成缺失行为数据信息,降低识别的准确率。
目前,较为常见的有固定时间窗口和重叠时间窗口两种方式,第一种是对数据流采用固定的分割窗口,即一个独立的时间窗口数据代表一个行为;第二种则是在第一种的基础上让相邻两个时间窗口重叠一定比例;这两种划分方式各有优缺点,如何选择一个合理的时间窗口和滑动方式,需要经过大量实验分析,综合识别准确率与实时性来进行抉择。
特征提取是从原始数据流中提取具有表征行为类别的特征,虽然研究者们依据自己的研究课题和实验平台来选择的特征值类型不尽相同,但选择信息含量高的特征向量时特征选取的基本准则。
目前,在行为识别中选择的特征主要包括运动特征、统计特征和频域特征;一般在特征选择初期,尽量选择较大的特征集,通过数据挖掘评估器评估每个特征属性的预测能力及其相互之间的冗余度,以找到识别准确率最高的特征向量子集。
目前,计算机还无法具备与人类一样的强大学习能力。然而,一些针对特定学习任务的算法已经产生。关于学习的理论认识已经逐步形成,其中的“学习”可以定义为:如果一个计算机程序在某类任务T上,其性能度量P随着经验E而自我完善,我们就称这个计算机程序在从经验E学习。在行为识别的算法中,可以得到下面的一个学习问题:
(1)任务T:行为识别;
(2)性能标准P:行为分类的正确率;
(3)训练经验E:已知行为类别的数据库。
其中对于行为识别的学习问题,它可以通过已知行为类别的数据库获取经验;它的任务是进行行为识别;它的性能由它行为分类的正确率来衡量。
数据分类的目的就是利用训练数据得到一个分类器(分类模型或分类函数),然后通过此分类器将未有类别标记的数据进行类别划分。
如图2所示,行为分类可分为两步,第一步是建立分类模型,即训练阶段,它通过分析给定的、有行为类别标记的训练数据集,建立能够反映其特性的模型。第二步对训练好的分类模型进行综合评估,如果符合预期效果,则可以用来对未知类别数据进行分类。
图2 行为识别示意图
基于传感器的行为识别具有广阔的应用前景,可应用于智能家居、人体交互式游戏、老人监护、健康医疗等众多领域。值得一提的是,基于传感器的行为识别方法对传统的人机交互方式进行了革命性改变,它通过在用户身体部位上佩戴传感器,并依据采集的传感器数据识别用户的具体行为,从而为其提供相应服务,整个识别过程都是在用户不曾主动参与,甚至不知晓的情况下完成的。
总的来说,基于传感器的行为识别研究层出不穷,各大会议期刊都或多或少的有行为识别领域论文的发表。但是,由于众多客观条件的限制,基于传感器的行为识别目前还处在实验和理论研究阶段,并且现有的行为识别方法及识别种类都较为单一。
[1]Bulling A,Blanke U and Schiele B.A tutorial on human activity recognition using body-worn inertial sensors[J].ACM Computing Surveys(CSUR),2014,46(3):33.
[2]Welsh,M.Codeblue:Wireless sensor networks for medical care,in:http://fiji.eecs.har-vard.edu/CodeBlue/.2009.
[3]Yang G Z.Ubimon-ubiquitous monitoring environment for wearable and implantable sensors[J].2009.
[4]Stikic M,Huynh T,Laerhoven K V,etc.ADL recognition based on the combination of RFID and accelerometer sensing[C]//Pervasive Computing Technologies for Healthcare,2008.PervasiveHealth 2008.Second International Conference on.IEEE,2008:258-263.
[5]Wang L,Gu T,Chen H,etc.Real-time activity recognition in wireless body sensor networks:from simple gestures to complex activities[C]//Embedded and Real-Time Computing Systems and Applications(RTCSA),2010 IEEE 16th International Conference on.IEEE,2010:43-52.