孙恩泽 李宇昊
【摘 要】 随着可穿戴智能设备走进千家万户,利用可穿戴智能设备进行人类识别在大数据和云计算领域有着广泛应用前景。本文提出了一种基于长短时记忆(LSTM)型的循环神经网络(RNN)识别方法,在标准数据集PAMAP2上构建模型进行实验评估,取得了良好的准确率。
【关键词】 深度学习 可穿戴智能设备 长短时记忆(LSTM)
1 研究背景
由于可穿戴智能设备具有价格便宜、携带方便、不受场地限制等优点,在人们日常生活和健身運动中应用的越来越广泛。并且可穿戴智能设备含有加速度计、陀螺仪、重力感应仪器等传感器,可以与传统基于视觉的运动识别方法在实际应用中互为补充,基于传感器的人体运动识别已经被广泛应用于体育竞技,人体体力研究测量,智能家居系统,老人和儿童监护领域等。
2 LSTM型循环神经网络
长短期记忆循环神经网络,通常也被LSTM,是一种由 Sepp Hochreiter 和Jürgen Schmidhuber在提出的一种特殊循环神经网络[1]。 LSTM拥有三个“门”结构的神经网络结构。“遗忘门”的可以让循环神经网络根据当前的输入、上一时刻状态个上一时刻输出共同决定哪一部分记忆需要遗忘。“输入门”会根据、和决定那些部分进入当前时刻的状态。“输出门”来控制最后信息的输出。
3 实验验证
3.1 数据收集
本文引用是一个由加州大学欧文分校提出的有关身体运动的公开数据集——PAMAP2。其对被要求进行12项日常生活的9个参与者进行了数据记录,包括家庭活动和各种各样的活动(散步,跑步,踢足球等)。最终的数据是52维度的[2]。
3.2 数据预处理
因为原始数据会包含噪音,无效数据和失踪样本,所以对数据预处理是不可或缺的。在真正进行训练之前,对PAMAP2数据集进行了如下处理:移除时间戳、移除方向信息、移除过渡状态、估计缺失值、数据分割、数据归一化等。
3.3 构建LSTM型循环神经网络
我们使用谷歌推出的TensorFlow开源深度学习平台来构建所需的LSTM循环神经网络模型。构建的LSTM循环神经网络模型分为输入层、LSTM层、dropout层、输出层。TensorFlow 搭建模型中的主要训练参数包括输入层到隐藏层的权重和偏斜、LSTM单元 中 3 个门的权重和偏斜、以及逻辑回归层的权重和偏斜。
3.4 度量标准
由于各个运动的样本数较为均衡,可以采用准确率(accuracy)来评估模型最终的识别效果:
其中,者被正确识别的样本数,指样本总量。
3.5结果分析
在训练LSTM环神经网络前要先把数据分为训练数据和验证数据。前者用于训练 LSTM循环神经网络以确定权值和阈值,后者用于验证其经过训练后的分类效果,两者比例为8:2。
通过使用GPU训练100次模型后得到的训练集和验证集的输出如表 1所示。
从表2中我们看出,模型在8个不同的实验对象的训练集和验证集上表现良好,准确率普遍在90%以上。通过实验充分证明基于LSTM型循环神经网络的识别模型对运动时间序列数据具有良好的分类预测能力。
4 结语
本文提出了一种基于LSTM型循环神经网络的人体运动识别方法,相对于传统的算法,能够自动提取特征进行学习,并且在标准公开数据集上进行了验证,取得了良好的识别准确度。虽然深度学习目前普遍存在黑箱问题,缺乏可解释性,无法在出现错误之后根据输入追踪出错的原因,但鉴于人体运动识别属于低风险任务,即使发生错误,也不会向无人汽车、医疗手术一样造成无法挽回的后果,以此来看将该算法应用在人体运动识别领域还是具有实际意义的。
【参考文献】
[1] Hochreiter S, Schmidhuber J. Long Short-Term Memory[J]. Neural computation, 1997, 9(8):1735-1780.
[2] Reiss A, Stricker D. Introducing a New Benchmarked Dataset for Activity Monitoring[C]// International Symposium on Wearable Computers. IEEE Computer Society, 2012:108-109.