杨思元,陈小恵,王凯莉,梁 莹
(南京邮电大学 自动化/人工智能学院,江苏 南京 210023)
人体固有的生理特征或行为方式是个体自身独一无二的,可以精准地代表个体身份,很难被复制或假冒[1]。近几年,基于生物特征的身份识别技术,引起了各方学者的强烈兴趣。基于生物特征的身份识别系统,安全性高,操作简单,成本低[2]。PPG信号作为人体的一种固有的生理信号,包含了人体心血管系统大量的病理、生理信息,不同个体之间的PPG信号存在着较大的差异,具有很好的保密性和唯一性[3-4],基于PPG信号的人体身份识别研究越来越受到重视。
国内外学者对基于PPG信号的身份识别技术进行了较多的研究,取得了一些成果。Y.Y.GU等人选择单个脉搏周期中波峰个数、脉搏起始点到第一个波峰的斜率和时间间距、重搏波波峰到下一个脉搏周期起始点斜率四个特征参数,利用多元统计方法对特征进行加权,以欧氏距离最小为判别依据进行身份识别,识别率达到94%[3]。该方法对特征定位、模板选择以及待识别对象的状态具有较高的要求,容易受到各种因素的干扰;Kemal Polat等人选择从单周期PPG信号及其一阶和二阶差分信号中提取40个时域特征,利用欧氏距离公式计算各个特征对身份识别率的贡献值,从而进行识别分类,识别率达94.44%[5]。该方法综合了PPG信号的一阶、二阶特征,对于PPG信号的描述较为准确,但由于PPG信号微弱且变换复杂,特征提取易受到各种噪声影响,而且特征提取运算量大,计算复杂;Jaafar N A L等人利用PPG信号单周期波形进行身份识别,该方法首先对PPG信号进行二次求导得到加速度脉波,然后利用巴斯低通滤波器去除加速度脉波中的高频噪声,对去噪后的加速度脉波进行分段、归一化处理,最后进行识别,最高识别率为97.5%[6]。该方法具有较高的抗干扰性,但是也增加了对波形稳定性的要求,且波形求导、分段、归一化等数据处理复杂,运算量大。根据对以上方法的对比分析知,仅从时域选择较少的特征点,计算复杂度降低,但是准确度和抗干扰性会受到影响;将信号波形进行多次变换以及提取多个特征点,可以提高准确度,但是也增加了运算量,计算复杂。针对以上问题,文中提出了一种基于PPG信号稀疏分解和机器学习的身份识别方法,它利用改进的MP稀疏分解算法把PPG信号进行稀疏分解,提取PPG信号的特征,并把这些特征与波形时域的周期特征相融合,利用基于特征的决策树分类算法 建立分类模型,提高分类识别的准确率。本方法直接以PPG信号的单个周期波形作为分解对象,不需要对波形进行复杂的变换处理,降低了特征提取的运算复杂性;在过完备原子库上,通过提取的特征可以最大程度的还原PPG信号,提高了特征提取的准确性,识别率达到98.3%。
图1是从众多的研究测试结果中随机抽取的四组PPG信号,其中图(a)、图(b)和图(c)来自不同个体,图(a)和图(b)为年龄、性别和体型等特征相近的个体,图(a)和图(c)为年龄、性别和体型等特征相远的个体,图(a)和图(d)来自同一个体的不同时刻。由图(a)和图(b)可见,虽PPG信号包含人体固有的特征信息,但因人体特征相近而PPG信号相近,两者的波形走势很相似,都存在主波次波以外的波峰,周期也很接近;图(a)和图(c)因个体特征相远使两个个体的PPG信号无论在波形、幅度还是周期上都存在明显的差异;由于外界环境、身体状态等的影响,图(a)和图(d)展示相同个体不同时刻PPG信号在幅度上有明显的差异,在周期上也有略微的差异。
(a)第一组 (b)第二组
(c)第三组 (d)第四组
根据以上分析,PPG信号包含人体固有的、不同的特征信息,但因人的特征信息的相远与相近性,而使PPG信号有相远与相近性,采用传统的时频域特征参数提取与多元统计的身份识别方法因特征信息不能提取全面,而使其识别的准确性不高。文中采用PPG信号稀疏分解和机器学习算法,根据PPG信号波形选择最佳原子进而提取特征,这些最佳原子不是一个特征值,而是一个特征信息量,包含较全面的特征信息,基于最佳原子的身份识别准确率就会得到提高。
身份识别的整体流程框图如图2所示。
图2 身份识别的总体流程框图
首先将经过放大、滤波、运动伪差剔除[7]等预处理后的PPG信号进行单周期划分并提取周期值,然后对单周期信号进行稀疏分解。稀疏分解的关键在于过完备原子库的选择,根据PPG信号的周期性以及近余弦等特性,文中选择有类似特性的Gabor原子构成过完备原子库,Gabor原子由经过调制的高斯窗函数构成[8],表达式为:
(1)
其中,g(t)=e-πt2是高斯窗函数,gτ(t)是经调制的高斯窗函数,(s,u,v,w)是原子时频参数,u决定了原子所代表的波形在原始信号中的位置,s决定了所代表波的宽度,v为原子的频率,w为原子的相位,原子的形状近似地反映出代表波的形状。通常在过完备原子库中选出数个最佳原子是关键,将最佳原子进行线性叠加就可将PPG信号还原出来。根据原子在信号以及信号残余上投影值最大的原则选出几个最佳原子,即选择前几个满足式(2)、(3)的原子。
(2)
(3)
其中,f为原始信号,Rnf为信号残余,gn为原子,Γ为原子库原子个数。原子形状由时频特性参数(s,u,v,w)决定,将选出的最佳原子时频特性参数组成PPG信号特征,再结合PPG信号的周期特征作为特征向量,划分训练集以及测试集,导入决策树分类器进行身份识别。
MP算法的目的在于选出过完备原子库中的最佳原子完成对信号的分解,其分解的关键表达式为式(4)、式(5)。
f=〈f,gr0〉gr0+R1f
(4)
Rnf=〈Rnf,grn〉grn+Rn+1f
(5)
其中,gτn表示选出的第n个最佳原子[9]。可以看出MP算法的残值仅与最近选出的那一项正交,在已选择的原子上进行垂直投影是非正交性的,这种非正交性会造成MP算法在已经选出的原子上反复迭代,从而使得每次迭代的结果不是最优而是次最优的,那么收敛就需要很多次迭代。为了解决这个问题,文中改进MP算法在分解的每一步对所选择的全部原子进行正交化处理,即将余项Rnf投影到根据{grk}0≤k≤n得到的正交族{uk}0≤k≤n上[10]。
设D={gr}r∈Γ是用于稀疏分解的过完备原子库,利用匹配追踪挑选gγn,使得:
(6)
利用施密特正交化算法将gγn关于{grk}0≤k≤n正交化,定义:
(7)
将余项Rnf投影到un,得到:
(8)
对式(8)进行0≤n (9) 其中,PVz是在{urn}0≤n≤z上生成的空间vz的正交投影算子,{gτn}0≤n≤z也是vz的一组基。当n=z时,由式(7)可得: 〈Rnf,un〉=〈Rnf,grn〉 (10) 因为残差余量可以快速趋于0,所以存在M≤N(N是信号长度)使得RMf=0。此时: (11) 信号f在一个正交向量族上做有限M次迭代就可以收敛完成分解。 MP算法中它的残值仅与最近选出的那一项正交,改进后则与前面每个分量正交,所以避免出现重复迭代的问题,这样在选择相同数量的最佳原子时,利用改进MP算法选择出的原子所包含的信号的信息量更加完整,利用少数最佳原子稀疏表示出来的信号更加准确,提高了稀疏分解的性能。 根据PPG信号的时频特性,文中选择Gabor原子来构成过完备原子库。Gabor原子由经过调制的高斯窗函数构成[11]: (12) 其中,g(t)=e-πt2是高斯窗函数,(s,u,v,w)是原子时频参数,可决定一个原子。当参数u不同而s,v,w相同时,原子的中心位置不同,形状相同。可使参数u的值保持不变,其他参数s,v,w按照原来的方法进行选取,过完备原子库中的原子数目将大大减小,有效提高算法的计算速度[12]。将N次内积运算转换为一次Rkf和gr的互相关运算并利用FFT实现快速的互相关运算[13],可以大大提高稀疏分解的速度。 决策树分类器的关键在于属性值的确定,文中将提取好的PPG信号特征向量划分为训练集和测试集,将训练集传递给决策树分类器,通过信息增益法找出决策树的属性值,完成分类器训练,然后将测试集传递给分类器进行分类识别。信息增益法是利用信息增益和分裂信息量共同定义的[14],其关系式如式(13): (13) 其中,Gain(S,A)表示信息增益,SplitInformation(S,A)表示分裂信息量。 信息增益的定义如式(14)所示: (14) 其中V(A)是属性A的值域;Sv是集合S中在属性A上的值等于v的子集;Entropy为熵,用来刻画任意样例的纯度[15](purity)。如果目标属性具有c个不同的值,那么集合S相对于c个状态的分类的熵定义如式(15)所示: (15) 其中pi为子集合中第i个属性值的样本数所占的比例[15]。信息增益法可以根据PPG信号特征的特性,将所有属性列表的属性按照让每个分支记录的类别尽可能纯的标准排序,从而选出最好的属性,提高了决策树分类器的识别性能。 实验共采集100个人在不同时刻的5组PPG信号作为样本。针对每个人每一组信号分割出10个单周期信号进行信号的稀疏分解。根据多次实验对比,选取前5个最佳原子的识别效果最好,将得到的每个单周期信号的5个最佳原子的时频特性参数(s,u,v,w)与信号对应的周期特性共21个特征相融合,组成融合特征向量。每个人分别获取50组融合特征向量,将特征向量以7∶3的比例划分为训练集和测试集。 改进MP算法与MP算法在对PPG信号稀疏分解过程中每次迭代后残留的内积结果对比 ,如图3所示。 图3 改进MP与MP每次迭代残留內积对比 由图3可见,在稀疏表示精度相同的情况下,改进后的算法收敛速度更快,即所需原子更少;在需要用相同原子表示信号时,通过改进后的算法得到的稀疏表示的精度更高;根据运行时间对比,改进后的MP算法分解的速度提升了20倍左右。 利用改进MP算法对三个个体PPG信号稀疏分解的结果进行对比,如表1所示。 表1 三个个体的最佳原子对比 基于表1,利用EXCEL数据分析库对稀疏分解之后的PPG信号最佳原子特性参数进行差异性及相关性分析,结果如表2所示。 表2是三个个体分解后的PPG信号最佳原子参数的相关系数。由三个表可以看出,每个个体最佳原子参数的相关系数可以达到0.95以上,具有非常高的相关性,所以每个个体的PPG信号具有很好的相似性。 表2 相关系数 三个个体PPG信号分解后最佳原子参数差异性分析如表3所示。分析时选择的风险指数α=0.05,表中SS是平方和;df是自由度;MS是均方;F是检验统计量;P-value是观测到的显著性水平;F-crit是临界值。由表3可以看出F=4.038 179>F-crit,所以F值在α=0.05的水平上显著,即三个个体分解后的PPG信号最佳原子特性参数差异性在α=0.05上显著。根据以上分析,相同个体的原子特性参数具有很好的相关性,不同个体的参数具有显著的差异性,所以以最佳原子的特性参数作为分类识别的依据切实可行。 表3 三个个体间数据差异性分析 将待识别对象的21个特征分别带入信息增益的计算公式,如式(14)所示。根据信息增益最大的原则从21个特征中选择出5个贡献最大的特征作为决策树属性节点,经过多次数据训练,属性节点值域依据待识别对象的特点进一步划分,完成决策树分支,建成决策树分类器。 为了更好地展示决策树分类器识别的准确性,文中从100个待识别对象中随机选取4个对象,再利用搭建好的决策树分类器进行身份识别,其结果如图4所示。 图4 身份识别结果 决策树分类器的分类结果如表4所示。 表4 决策树分类器的分类结果 根据表内数据可看出利用决策树进行PPG信号分类识别的准确率可以达到98%以上,重代入误差和交叉验证误差都很小,所以分类识别的效果比较理想。 光电容积波信号包含了人体大量的病理、生理信息,不同个体之间的PPG信号存在着很大的差异,具有良好的保密性和唯一性,可以很好地应用于身份识别。采用改进MP算法进行信号稀疏分解,更加快速完整地获取信号的信息。利用少数几个最佳原子还原信号获得信号更为简洁的表示方式,从而更容易地获取信号中所蕴含的信息,更方便进一步对信号进行加工处理。对信号进行稀疏表示之后再进行特征提取,相比于直接对原始信号进行特征提取更加简单准确。利用决策树分类器,在不用对数据做太多准备的情况下,能够得到效果良好的分类结果,所以实验证明基于PPG信号稀疏分解和机器学习的身份识别方法切实可行。2.2 分解速度上的改进
3 决策树分类器
4 实验结果与分析
4.1 改进MP算法稀疏分解结果与分析
4.2 分类识别结果与分析
5 结束语