基于步态特征的移动平台持续认证方案

2019-07-26 02:33杨力马卓茹张程辉裴庆祺
通信学报 2019年7期
关键词:步态加速度身份

杨力,马卓茹,张程辉,裴庆祺

(1. 西安电子科技大学计算机科学与技术学院,陕西 西安 710071;2. 通信网信息传输与分发技术重点实验室,河北 石家庄 050002)

1 引言

作为人们生活中必不可少的工具,智能手机在汇集着机主重要信息的同时,也可能存在多个使用者。用户对隐私保护和设备安全性的需求使用户身份认证成为手机使用过程中的重要环节。

身份认证方式大致可分为基于非生物信息的身份认证和基于生物信息的身份认证。基于非生物信息的身份认证方式,如密码登录和动态短信码登录,受到用户账号数量增长与网络信号时延的影响,已难以满足用户对智能手机的使用要求。目前,常用的基于生物信息的身份认证方式,如指纹认证、人脸认证等,均需要附加设备来配合数据采集,对手机的硬件功能要求较高。以上身份认证方案均属于显式的一次性认证,即只在设备使用前进行一次身份认证,之后将不再进行认证操作,这将无法保证设备在使用期间或待机状态时的安全。除此之外,以上方案在认证时均需要用户与设备进行频繁的交互,如输入口令或按下指纹等,极大地影响了用户的使用感受。而基于行为特征的认证方式,如利用三维手势、步态识别等,在具有难以改变、难以模仿等优点的同时,还具有可在用户无意识的情况下利用手机内置传感器持续获取用户数据的优势。肖玲等[1]通过对手机内置加速度传感器的原始数据进行操作,在实现动态手势识别的同时,验证了手机内置传感器在行为特征识别领域的可用性。

在使用行为特征的移动端身份认证方案中,基于三维手势的研究开展较早。Bailador等[2]使用iPhone内置的加速度传感器进行三维手势的数据采集,对贝叶斯分类器、隐马尔可夫模型(HMM,hidden Markov model)、动态时间规整(DTW, dynamic time warping)算法这3种分类方法进行测试,平均用时4.17±1.2 s。Buthpitiya等[3]提出可根据机主使用手机某些功能的日常手势特征进行身份认证,例如拍照、发送短信等。在上述采用三维手势进行身份认证的研究中,仍要求用户进行某些特定动作来配合数据采集,无法满足在日常生活中进行持续认证的要求。

针对步态识别的研究多采用计算机视觉的方法。王修晖等[4]提出了基于连续密度隐马尔可夫模型的人体步态识别算法,使用基于自然步态周期特征进行个体识别。Batchuluun等[5]使用热像仪传感器捕获人的前后视图,利用卷积神经网络进行特征提取和分类,以解决黑暗环境下步态周期、节奏等难以捕捉的问题。针对随身衣物变化对身形的影响,Aggarwal等[6]提出一种协变量识别框架来处理这种协变量的存在。El-Alfy[7]提出一种在远距离识别困难情况下适用的方案,将距离变换与局部轮廓的曲率相结合生成新的特征描述符,以获得更顽健的步态特征。此后出现了利用传感器设备的步态识别研究。Mäntyjärvi等[8]将三轴加速度计佩戴在固定方向的带子上,使用X轴和Z轴的数据进行步态识别。通过峰值检测方法进行步态周期提取,为受试者建立模板。同时,利用传感器设备进行身份认证的研究也逐渐出现。Li等[9]将加速度传感器固定在被测试用户的小腿处,让用户直线行走20 m,使用 DTW 算法测试,得到的等错误率(EER,equal error rate)为3.27%。随着手机相关硬件设备及应用服务的发展,移动端基于步态特征的身份认证研究开始兴起。Thang等[10]使用智能手机加速度传感器进行用户认证。随后,Zhong等[11]利用从智能手机的加速度传感器和陀螺仪传感器捕获的步态信息进行用户认证。Nickel等[12]采用HMM对48个测试用户的步态特征进行分析,得到的EER为6%。蒋伟等[13]通过移动设备自带的加速度传感器对用户在日常生活中不同行为下的步态数据进行收集,提取特征形成特征向量并建立步态模型,并采用基于神经网络的模型匹配算法进行身份识别,得到了 78.13%平均认证准确率。

步态特征具有可在日常使用中持续采集,而不影响用户正常生活的优点。但目前基于步态特征的身份认证研究,大多仍采用一次性认证思路,未考虑步态特征可隐式获取的特点。此外,上述研究的实验设置较单一,未综合分析手机放置位置与行走场地变化对认证结果的影响。

针对传统一次性认证方式的不足,本文基于步态特征可隐式采集的特点,提出一种移动端持续身份认证方案。本文方案利用手机内置加速度传感器监测用户步态特征变化,以实现对用户身份的认证,并在多种场地下,对不同手机放置位置进行实验,综合测试方案性能。实验表明,本文方案可在多种场景中保证稳定的认证效果,在平坦行走条件下能到达98%以上的认证准确率。

2 持续身份认证方案的设计

个体的步态数据包含个人特征,具有不易模仿、难以隐藏、易于提取的优点[14-16]。本文方案通过用户步态加速度数据所提供的特征实现对用户身份的辨别。方案可分为数据采集、数据预处理、特征提取、模板训练与身份认证5个部分,方案模型如图1所示。

图1 本文方案模型

当用户进入系统时,首先判断是否需要进行用户注册。注册过程需要经过数据信息采集、加速度数据预处理与特征提取操作得到用户的身份信息模板,此模板将作为用户的注册信息存储下来,完成注册。之后,模板训练模块将该设备的所有用户的注册信息送入分类器训练生成分类模型,最终的分类模型参数将被存储下来,训练完成。每当一个设备上有新用户完成注册时,模板训练模块需要使用该设备最新的用户注册信息库进行再次训练得到分类模型,以更新模型参数。

在已有注册信息用户的日常使用中,设备会持续监测用户的步态行为特征变化,当需要进行身份认证时只需要经过数据采集、数据预处理与特征提取操作得到步态特征,再将步态特征送入身份认证模块,得到认证结果,手机就可根据使用者身份提供访问权限。

2.1 数据采集

步态是指人行走时所表现出来的姿态。步态周期是指正常行走时一侧的足跟落地到该侧足跟再次落地的时间,一个成年人的步态周期大约为1~1.32 s[17]。成年人正常行走的加速度值会在一个步态周期内随着时间的变化而变化,且这种变化具有一定规律。文献[17]对步态加速度特征进行了检测与分析,实验结果表明,步态加速度数据可在很大程度上反映个体的生理特征,不同个体的步态加速度数据表现出不同的特征,同一个体的步态加速度数据表现出一定的规律性。本文方案使用自行开发的手机 APP采集用户行走时手机内置加速度传感器的数据,采样频率设置为50 Hz[18],每一时刻采集到的数据将以“时间-X轴加速度数据-Y轴加速度数据-Z轴加速度数据”的格式存储在文件中。

2.2 数据预处理

在日常数据采集的过程中,因人体存在无意识动作、手机传感器性能影响等原因,数据会出现微小的上下波动,这种与步态特征无关的波动将对后期的特征提取操作造成影响。针对采集过程中的噪声,本文方案采用移动平均滤波方法对数据上的微小波动进行两次平滑处理。经实验测试,两次平滑处理的窗口值分别设定为 7和 5,处理前后的对比如图 2所示。同时使用 Z-score方法对数据进行归一化处理,将加速度数据幅度限定在一定范围内。

图2 平滑处理效果对比

在数据采集过程的初期与末期,用户未处在稳定步行状态,此时采集到的数据是与步态特征无关的干扰数据。针对这部分干扰数据,本文方案使用基于阈值的数据截取操作进行处理,选取X轴方向上数据的波峰值,计算所有波峰值的均值并将其设定为门限值,第一个大于该阈值的波峰位置被认为是稳定步行状态的起始点,第一个小于该阈值的波峰位置被认为是稳定步行状态的结束点,以此来判断有效数据段的位置。Y轴和Z轴数据使用与X轴数据相同的有效值起始与结束位置信息进行截取,以保证截取后的3组数据在时间上一一对应。

为从一份加速度数据中获取充足的用户步态特征,本文方案将进行步态模板截取操作。以8 s的行走数据作为一个步态模板,即一个步态模板包含 8个步态周期。实验使用的APP的采样频率为50 Hz,因此一个步态模板包含400个加速度数据。统计步态数据中X轴方向上加速度数据的波峰位置信息,从该组信息的首个波峰位置开始截取400个数据作为一个步态模板,从第二个波峰位置开始截取 400个数据作为第二个步态模板,并依次类推,如图 3所示。为了实现对数据的充分利用,最大化统计每个用户的步态特征,模板将从首个波峰位置开始进行正向的截取,正向截取完成后,再从最后一个波峰位置开始逆向截取。其他轴均使用X轴的波峰位置信息进行模板截取。

2.3 步态模板特征提取

特征提取工作以步态模板为单位,从时域与频域两方面进行。本文方案将分别计算X轴、Y轴、Z轴以及三轴加速度合成标量M的所有步态模板的时域特征,M的计算式为

其中,xi、yi、zi分别为某时刻传感器测量的沿X轴、Y轴、Z轴的加速度分量数值。

选择标准差(std)、最大值(max)、最小值(min)、直方图(hist)作为时域特征值[19]。将数据取值区间平均分为10组,直方图分布表示了数据在每个区间内的分布概率。本文方案采用快速傅里叶变换对步态数据进行频域分析[19]。为得到理想的傅里叶变换结果,首先对步态模板进行延拓,然后进行快速傅里叶变换,得到波形在不同频率下的幅度特征,最后对幅度特征数据进行分解与重组,得到该组数据的幅度谱。快速傅里叶变换后的幅度谱有256组数据,特征维数较大,且多是相关性较大的冗余特征,本文方案使用主成分分析(PCA, principle components analysis)法找到频谱信息中最主要的特征和结构,将原有256维幅度数据降维到二维。

因时域特征数量较多,3个坐标轴及其合成分量的每一个步态模板将产生 13个时域特征数据,为获得更具代表性的时域特征,需要对特征进行选择。采取逐一测试的思路,使用支持向量机(SVM,support vector machine)计算3个坐标轴及合成分量各特征值的分类准确率,在每种时域特征中选择准确率最高的特征,联合作为最终的时域特征组合。对频域特征使用与时域特征选择相同的思路,得到频域特征组合。最终选择的时域特征为合成标量M的最大值、Z轴数据的最小值、Y轴数据的标准差和X轴数据的直方图,而选择的频域特征为X轴、Y轴及合成标量M的幅度谱数据。联合选择得到的时域特征与频域特征作为最终的用户特征组合,最终的特征组合方式为

2.4 模板训练

方案使用SVM来进行模板训练。具体步态模板训练流程如下。

Step1 采集待注册用户的步态信息。

Step2 对采集数据进行预处理操作。

Step3 截取加速度数据得到步态模板。

Step4 对步态模板进行特征提取,将所有用户的时域特征与频域特征整理并存储,完成用户注册。

Step5 使用支持向量机对该设备所有用户注册信息进行训练,得到最优分类平面,即身份信息分类模型,将该模型参数存储下来用于后续身份认证,模板训练完成。

每当有新用户注册时,分类模型重新训练以实现更新。模板训练流程如图4所示。

图3 步态模板截取

图4 模板训练流程

2.5 身份认证

对于第一次进入系统的用户,首先要进行模板注册。对于已注册的用户,身份认证具体流程如下。

Step1 采集使用者的步态信息。

Step2 对采集数据进行预处理操作。

Step3 截取加速度数据得到步态模板。

Step4 对步态模板进行特征提取。

Step5将步态特征送入身份认证模型,得到分类结果。

Step6将分类结果与设定的阈值进行比较,当分类结果大于阈值时,确定用户的身份,完成认证;当分类结果相同结果小于阈值时,通知用户再次进行身份认证。

本文方案的阈值设定为 0.9,即有 90%的模板都被认为是用户A,则确定该用户的身份为用户A;若分类结果相同的模板数低于90%,则重新进行身份认证。身份认证流程如图5所示。

图5 身份认证流程

2.6 持续认证

基于行为特征持续身份认证机制是指通过采集移动终端传感器以及用户行为等信息,通过算法识别出当前使用者的身份,可以避免频繁使用口令等显式认证方式,且能够对用户进行持续不间断的身份认证[20]。本文方案通过如下思路实现持续认证:系统在后台持续监测加速度传感器数据的变化,当加速度数据满足条件后,则认定用户进入步行状态,开始进行数据采集工作,否则进入监测状态;当系统获得充足的数据后,进入数据处理模块并进行身份认证操作,若数据集的大小不满足认证需要则再次进入监测状态;身份认证完成后,返回认证结果给设备,系统进入监测状态。

在监测状态下,若X轴数值连续两次超过阈值的时间间隔小于3 s,则认为行走开始。若在一段时间内X轴加速度值均小于设定的阈值,则认为行走结束。通过实验发现,当加速度传感器提供的数据个数大于800个,即用户处于行走状态的时间超过16 s时,该份步态数据可为系统提供充足的步态特征。因此,当获取的数据个数大于800个时,将此份数据送入数据处理模块进入后续操作并用于用户的身份认证;当获取的数据个数不足800个时,则重新进入监测状态,直至获得充足的数据量。考虑到用户可能有长时间处于行走状态的情况,为防止短时间内进行重复认证浪费系统资源,设定加速度数据集的数量上限为2 500个,当获取的数据集已达到2 500个但用户仍未退出行走状态时,系统将停止采集,将此2 500个加速度数据送入后续处理,并且设定系统每次进行身份认证的时间间隔需大于3 min。持续认证的流程如算法1~算法3所示。

算法1 阈值监测

输入X轴数据

输出步态加速度数据

1) whileX轴数值超过阈值 do

2) 记录该数据对应时间

3) ifX轴数值连续两次超过阈值的时间间隔小于3 s then

4) 采集步态加速度数据

5) else

6) 重新进入阈值监测状态

7) end if

8) end while

算法2 数据集检测

输入步态加速度数据

输出 无返回值

1) if 采集数据个数不足800个 then

2) 重新进入阈值检测状态

3) else if 采集数据长度小于2 500个 then

4) 进行身份认证

5) else

6) 使用前2 500个数据用于身份认证

7) end if

8) end if

算法3 身份认证

输入步态加速度数据

输出身份认证结果

1) 身份认证

2) if 认证通过then

3) return用户身份

4) else

5) 再次进行身份认证

6) end if

7) 进入阈值监测状态

3 实验测试

3.1 实验设置

实验将在不同行走场地与不同天气情况下,使用不同手机摆放位置测试方案的性能。实验共测试了3种行走场地,分别是室内光滑地面、室外粗糙地面和室内楼梯,如图6所示。用户分别使用2种常见的手机放置位置并在不同的场地进行行走测试,分别是手持手机行走、手机放在裤子右后侧口袋内行走,如图7所示。同时,实验分别在雨天与晴天2种天气情况下进行测试,以探究天气因素对方案认证准确率的影响。

3.2 实验数据

在本文所知范围内,目前没有已公开的基于多种场地测试的步态加速度数据集,因此本文将使用自主采集的数据进行实验测试。实验使用基于Android 4.4版本手机,手机硬件参数如表1所示,设计并开发加速度传感器数据采集 APP进行实验数据采集。

图6 3种行走场地

图7 2种常见的手机放置位置

表1 测试手机硬件参数

数据来自20位平均年龄为20~24周岁的志愿者,志愿者的身高为155~185 cm,其中8名志愿者为女性,12名志愿者为男性。每位志愿者按照其日常行走习惯,分别测试在8种场景下行走的数据,测试场景如表2所示。

以上场景基本涵盖了人们日常生活中的主要情景,为保证实验数据能够更客观地反映用户的行走习惯,数据采集工作分别在两周的时间内,任选3个晴天与一个雨天进行,即实验在16个场景进行测试。

表2 实验测试场景

3.3 实验结果

实验将每位志愿者的数据分为 70%的训练集与30%的测试集。训练集按照模板训练流程使用支持向量机进行训练得到分类模型,测试集按照身份认证流程用于测试分类模型的认证成功率。为了获得更具代表性的结果,实验使用 5轮-交叉检验的方法,在不同天气与不同行走场景下得到的认证准确率如表3和表4所示。

表3 晴天认证准确率

表4 雨天认证准确率

综合表3和表4的实验结果可以看出,不论是在室外行走还是室内行走,雨天的认证结果比晴天的认证结果略有降低,这可能是因为较湿滑的地面和鞋底情况影响了志愿者的步态。同时可以看到,手持手机行走的认证结果要略高于手机放在裤子右后侧口袋内的认证结果。通过查阅相关资料可知,三轴加速度传感器对平行于重力加速度方向的数据感知会更明显,手持手机行走时加速度传感器的X轴平行于重力加速度方向,而手机放在裤子右后侧口袋内行走时加速度传感器的Y轴平行于加速度方向。本文方案中的模板分割操作是以X轴数据为基准进行的,所以手持手机行走的数据获得了更好的模板分割效果,从而得到了更高的认证准确率。相对于在平缓地面行走的认证结果,上下楼梯时的准确率要低一些,通过绘制数据图像可以看到,上下楼梯时的数据波形相对于在平缓地面行走的数据波形波动幅度更大,同时也存在更多毛刺与异常值,因此影响了后续特征提取的结果,造成了认证准确率的下降。

从实验结果可知,地面粗糙情况相比于天气因素引起的地面湿滑问题对方案的认证结果会产生更大的影响。在平坦地面行走时,本文方案可达到90%以上的认证准确率;在上下楼梯等动作幅度较大的日常活动中,有认证准确率略低于90%的情况出现,但仍能保持一定的认证性能。综合以上分析,本文方案具有一定的抗干扰能力,能应对日常使用的大部分生活场景。

4 方案性能分析

4.1 认证时延

因为本文方案是在日常使用中持续地对用户身份进行监测,所以每次认证的耗时是否在用户可接受的范围内将十分重要。

表5为实验过程中某3次测试的步态模板个数及模板训练与分类认证的耗时。从表5中可以看出,模型训练与分类的耗时随着模板数量的增加而增加。普通人的反应时间一般集中在0.2~0.3 s,即使是训练良好的专业人员,反应时间也只能达到0.1~0.2 s[21]。而本文方案的训练与认证耗时远低于普通大众的反应时间,并且不论是实验测试的人数或是行走距离都远大于日常使用时产生的数据量,因此在耗时方面本文方案不会对用户体验造成影响。

表5 某3次测试耗时统计

4.2 认证准确率

在认证准确率方面,表6中列出了本文方案与文献[13]方案在不同实验场景下的平均认证准确率对比。从表6中数据可以看出,本文方案在不同实验场景下的表现均优于文献[13]方案。除此之外,本文方案还测试了在不同天气环境下的表现,而文献[13]方案未考虑天气因素产生的影响,因此本文方案具有更好的适应性。

表6 本文方案与文献[13]方案的认证准确率对比

4.3 存储开销

移动端应用的发展应考虑到移动设备存储空间限制问题。图8展示了一部设备中的数据存储开销随用户数量增长的变化情况。可以看到,数据存储开销随着用户数量的增长而增长,但使用本文方案提出的特征整合方式得到的用户注册信息,其存储开销增长趋势明显低于原始数据的增长趋势。相比于12位用户的原始数据,本文方案所使用注册信息占用的空间远小于1 MB,可有效降低对存储空间的需求。日常持续认证过程中采集的数据在使用过后将会删除,不会对设备造成额外的存储负担。因此本文方案能更好地应用在移动设备中。

图8 数据存储开销随用户人数增长变化情况

5 结束语

针对传统一次性认证方式无法完全满足智能手机对安全性要求的问题,本文提出了一种基于步态特征的移动端持续认证方案。本文方案在多种场景下均能保证稳定的认证性能,并且能够在日常生活中实现对不同用户身份的持续认证。同时,本文方案所提出的特征组合方式能够有效降低用户数据对存储空间的需要,更适合在小内存的移动端使用。在未来工作中,将针对丰富的应用场景进行更加细化的实验测试与分析,同时改良预处理与特征提取操作来提高方案的抗干扰能力,并且使用迁移学习方法解决步态特征的领域自适应问题。

猜你喜欢
步态加速度身份
基于步态参数分析的老年跌倒人群步态特征研究
“鳖”不住了!从26元/斤飙至38元/斤,2022年甲鱼能否再跑出“加速度”?
天际加速度
基于面部和步态识别的儿童走失寻回系统
创新,动能转换的“加速度”
步态识人
死亡加速度
跟踪导练(三)(5)
妈妈的N种身份
身份案(下)