成谢锋,单 煦,佘辰俊
(南京邮电大学 电子与光学工程学院、微电子学院,江苏 南京 210023)
如今,生物识别技术得到了广泛运用,为人类的生活提供了许多方便。例如人脸识别、指纹识别、语音识别等,然而这些技术或多或少潜藏着安全性、可靠性隐患。例如指纹可以通过一定的技术手段被复制下来,声音也可以被录制回放,人脸信息也能被窃取拍摄下来。为了提高生物识别技术的安全性和可靠性,目前一些研究人员开始把人体内部的生物信息作为新的识别特征来研究,例如心音信号、脑电信号、心电信号、基因(DNA)等,这是生物识别技术研究的一个新方向[1-4]。心音身份识别作为一种生物识别手段具有独特优势,因为心音信号是来源于人体内部的一种动态生理信号,它蕴藏着与心脏相关的大量生理信息,心脏结构的复杂性也决定了心音信号不容易被仿制。心音信号的普遍性、易采集性、唯一性、不易伪造性等特点使其可以作为一种高安全性的生物识别特征,并且现在已经有大量研究结果证明将心音用于身份识别技术领域是可行的。但在目前心音识别的相关研究中,对心音样本的位置来源并没有明确规定。例如何圣康等人选取了肺动脉瓣听诊区心音,利用MFCC提取特征参数,并基于VQ实现了身份匹配[5];成谢锋等人选取了二尖瓣听诊区心音,开发了基于Android的心音识别系统[6];刘佳佳等人提出了一种基于文化粒子群算法和最小二乘支持向量机的心音身份识别方法,获得了较高的识别率,但没有说明心音的采集位置[7]。所以本文研究不同听诊位置心音信号的差异性对身份识别的影响。首先对4通道心音信号进行去噪和分段预处理,再通过LPC方法提取S1和S2的共振峰频率作为识别特征,并结合欧氏距离进行样本间的相似性度量,给出识别结果,从而找出最适合用作个人身份识别的最佳听诊位置。
观测对象:20例身体健康的青年人(主要是本校的研究生),男性12例,女性8例,平均年龄25岁。瓣膜性心脏疾病或因其他病因导致心脏杂音或心脏明显增大者以及明显肺气肿者均不在本次观测对象之列[8]。
实验设备:采用自制的4通道同步心音传感器进行心音信号采集,如图1所示。本装置根据人体胸腔体表的二尖瓣听诊区、肺动脉瓣听诊区、主动脉瓣听诊区和三尖瓣听诊区,用金属材料做成一个心脏形的底座,在底座正面对应4个听诊区安装有4个心音传感器,并且适当加压力使心传感器与人体心脏部位处紧密接触,以获取最佳心音。多路信号同步采集、结构合理、使用方便。
采集方法:观测者在平静状态下以放松的坐立姿势进行心音信号采集,将4通道同步心音传感器放在胸腔体表,采样频率为16 000 Hz,采样时间为30 s,采集过程中保持四周安静。
心音是心脏血流动力与心血管系统相互作用的结果,是一种机械振动。正常心音的振动频率范围通常在20 Hz到200 Hz之间,心杂音的频率一般不超过800 Hz。心音强度、频率及相互关系可以反映心瓣膜、心肌功能及心内血流的状况。心音信号具有周期性,在平静状态下采集到的一段心音可近似作为周期性平稳信号来处理。一次心动周期可产生四个心音,心音主要组成成分如表1所示。
表1 心音主要组成成分
心脏瓣膜听诊区是心脏各瓣膜开放与关闭时所产生的声音传导至体表最易听清的部位,与其解剖部位不完全一致。通过研究,在心脏血流动力学的基础之上,对心音听诊的位置进行了明确的规定,如图2所示。
心音听诊区主要包括二尖瓣听诊区、三尖瓣听诊区、主动脉瓣听区、肺动脉瓣听诊区。本文采集的心音信号正来源于这四处。
各听诊区具体位置见表2。
表2 经典瓣膜听诊区具体位置
心音信号是一种比较微弱的生物信号,心音传感器本身的灵敏度也很高,在采集过程中不可避免地会受到采集环境和采集设备的影响。例如,传感器与被测试者之间的摩擦音;人体本身的呼吸音、肺音干扰;工频干扰(50 Hz);机电干扰(35 Hz)和外部环境的高斯白噪声等。这些噪声会影响到有效信号,对有效特征的提取不利,这会导致身份识别的准确性降低,使得识别结果不可靠。因此对心音信号进行去噪处理很重要。
首先对心音信号进行降采样处理,原始采样频率为16 000 Hz,降到1 000 Hz。本文使用3阶巴特沃斯滤波器,对20 Hz~400 Hz之间的心音信号进行带通滤波。原始心音和去噪后的心音如图3所示。从波形上来看,原始心音中S1、S2得到很好的保留,滤波后杂乱的噪声明显减少。
心音特征向量的准确提取直接影响到识别效果,如果第一心音和第二心音不能进行精确分割,那么对S1和S2共振峰频率的分析就会有误差,这会导致身份识别的准确性降低,因此对S1和S2的精确分段至关重要。本文采用David等[9]提出的基于Logistic回归的HSMM心音分割方法对心音信号的S1和S2进行精确分段,分段后的示意图如图4所示。
共振峰是指在声音的频谱中能量相对集中的一些区域,可以反映声道(共振腔)的谐振特性,共振峰信息作为语音信号处理中重要的特征参数已经被广泛地运用到语音识别技术中。心音信号同样是一种声音信号,若将心房、心室及动脉血管视作共振腔,心音信号在经过腔体时同样会受到其共振作用,因此心音的共振峰频率必然包含了大量有关心房、心室及动脉血管的形状特征[10],将共振峰频率作为心音特征应用于身份识别具有可行性与合理性。本文基于线性预测编码(LPC)对心音共振峰进行了提取,它是共振峰分析最为有效的方法之一。这里使用莱文逊-杜宾的自相关方法来计算LPC线性预测系数,提取心音信号共振峰的步骤如下:
(1)类比语音信号的LPC模型,心音信号样本s(n)可表示为
式中,u(n)为激励函数,G为增益,ak,k=1,2,…,p是LPC系数。
(2)数字滤波器传递函数H(z)为
式(2)还可以表示为p个极点的级联形式
其中,zk=rkexp(jθk)是H(z)在z平面上第k个极点。若H(z)是稳定的,其所有极点都在z-平面的单位圆内。则第k个共振峰的频率F(k)=θK/2πT,T是心音信号的采样周期。
(3)计算心音信号的共振峰频率
对H(z)进行多项式求根,也就是对H(z)的分母求零点,根据所得零点求得共振峰的极点及对应的共振峰频率。将心音信号作为式(3)传输函数H(z)的输入,对分段后的第一心音S1和第二心音S2分别进行共振峰分析,在功率谱中利用峰值检测器检测波峰即可得到S1和S2的共振峰频率。以某一位观测者的心音信号为例,提取S1和S2的共振峰频率分别如图5和图6所示。
如图5、图6所示,S1和S2的共振峰频率谱均存在4个峰值。考虑到心音信号的频率主要分布在20~400 Hz范围内,本文分别选取S1和S2的前两个共振峰频率{Fk;k=1,2,3,4}作为心音身份识别的特征向量进行研究,然后其作为欧氏距离相似性度量的输入进行身份识别实验。
本文分别对20人四个听诊区共80个心音样本进行实验分析,每个样本取8个周期的心音信号,然后对这8个周期的信号提取S1和S2的共振峰频率。其中T1,T2,T3,T4来源于30 s心音样本中连续的几秒,T5,T6,T7,T8来源于同一个心音样本中的另几秒。研究数据显示,无论在哪一个听诊区,同一个人的S1、S2共振峰频率在连续和非连续周期内具有稳定性,而不同人的S1、S2共振峰频率则体现出差异性。由于数据较多不易全部展示,此处以二尖瓣听诊区为例,选取3个人的心音样本数据进行稳定性展示;选取8个人的心音样本进行差异性展示。为了更直观地展示出差异性,8个人的共振峰频率取的是对应此人8个周期S1、S2共振峰频率的均值。具体数据分别如表3和表4所示。
表3 二尖瓣听诊区同一个人多个周期的S1、S2共振峰频率 Hz
表4 二尖瓣听诊区不同人的S1、S2共振峰频率 Hz
根据表3可以看出,同一个人在不同周期的S1、S2共振峰频率比较稳定,数据比较集中,在安静的采集环境以及尽量避免心音传感器与胸腔体表发生摩擦的情况下,数据的微小波动在合理范围之内。从表4可以看出,不同人的S1、S2共振峰频率存在着明显的差异,也就是个体之间是具有明显区分度的。所以将S1、S2共振峰频率作为识别特征具有合理性和可行性。图7简要展示了8位测试者在二尖瓣、三尖瓣、肺动脉瓣、主动脉瓣四个听诊区的共振峰频率表现。S1、S2的共振峰频率在四个听诊区都存在个体差异,哪一个听诊区的差异最大,将在下一小节结合欧氏距离进行评估。
本文采用欧氏距离来计算不同个体间的心音差异性。根据欧氏距离的计算方式和衡量特征,欧式度量需要保证各维度向量度量标准统一,本研究提取的特征向量量纲相同,符合欧式度量的适用条件。
欧氏距离(也称欧几里距离)是最常见的距离度量,衡量的是n维空间中各个点之间的绝对距离,在二维和三维空间中的欧氏距离就是两点之间的实际距离。为了方便下面的解释,先设定要比较X个体和Y个体之间的差异,它们都包含了n维特征,即X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),则X和Y之间的距离计算公式dist(X,Y)=
假设心音信号的训练集数据样本的特征向量为X=(x1,x2,x3,x4),测试集数据样本的特征向量为Y=(y1,y2,y3,y4),其中xi,yi为心音特征向量,即S1和S2的共振峰频率。由公式可得,X和Y之间的距离为
成谢锋等[11]在S1和S2共振峰频率在心音分类识别中的应用中指出,结合S1和S2的共振峰频率作为特征向量比提取单一特征(S1共振峰频率、S2共振峰频率、未分段心音共振峰频率)具有更好的识别效果。所以本文对四个听诊区身份识别准确率的研究中所提取的特征向量均结合了S1和S2共振峰频率。
本研究的实验对象共有20名,每位测试者分别记录了四个听诊区的心音信号。以二尖瓣听诊区为例,每个心音样本选取8个不同周期的心音信号,提取S1和S2的共振峰频率作为特征向量,这样每个人共有8组特征向量,训练过程中,选取6组特征向量作为训练数据,另外2组作为测试数据。实验步骤如下:
(1)将20名测试者共120组训练数据作为输入,构成一个120*4的矩阵,训练标签为[1;1;1;1;1;1;2;2;2;2;2;2;…;20;20;20;20;20;20],构成一个120*1的矩阵。
(2)将20名测试者剩下的40组数据作为测试数据输入,构成一个40*4的矩阵,测试标签为[1;1;2;2;…;20;20],构成一个40*1的矩阵。
(3)将每一组测试数据分别与120组训练数据做欧氏距离计算,然后对120个计算结果进行排序,选取距离最小的那组数据对应的训练标签作为预测结果。
(4)将预测结果与实际测试标签进行比对,计算出识别率。
其他三个听诊区的实验步骤同上。
用上述方法对40组测试样本进行身份识别实验,实验结果见表5。表5显示,本文所提出的基于心音共振峰频率和欧式距离的身份识别方法达到了很好的识别效果,同时四个听诊区的识别效果也表现出差异性。其中识别率最高的听诊区是肺动脉瓣,达到了92.5%,主动脉瓣的识别率仅次于肺动脉瓣为90%,二尖瓣和三尖瓣的识别率分别为87.5%和85%。
表5 不同听诊区样本组成及识别效果
根据上述实验结果,可以得出:(1)将第一心音S1和第二心音S2的共振峰频率应用于身份识别具有良好的识别效果。(2)不同采集位置心音的差异性会影响识别效果,对于青年人来说,识别效果最好的位置在肺动脉瓣,其次是主动脉瓣、二尖瓣、三尖瓣。(3)与性别关联较小的听诊区为肺动脉瓣,男女生胸腔厚度有差异,心音采集时女生的二尖瓣、三尖瓣位置采集到的信号较不稳定,而肺动脉瓣和主动脉瓣位置胸腔比较薄易于采集,实验结果也证明了肺动脉瓣和主动脉瓣的识别效果要优于另外两个听诊区。(4)将肺动脉瓣和主动脉瓣进行特征融合可以提高识别率。
针对各听诊区的识别率差异,本文做出如下分析:肺动脉瓣和主动脉瓣听诊区都位于心脏的上半部分,靠近肺动脉和主动脉血管;二尖瓣和三尖瓣听诊区都位于心脏的下半部分,周围是静脉血管。动脉血管具有很大的弹性和收缩性,血液动力很大;静脉血管壁较薄,平滑肌和弹力纤维较少,缺乏收缩性和弹性,管腔断面较扁。当心脏血流动力与心血管系统相互作用产生心音时,肺动脉瓣和主动脉瓣听诊区心音的共振强度要大于二尖瓣和三尖瓣听诊区,心音经过共振腔的共振作用所形成的共振峰频率能够更好地表征心音特征。在以后的研究中,可以尝试提取除了共振峰频率以外的其他共振参数作为心音识别的特征,以期将识别效果进一步提高。
综上所述,将心音应用于青年群体的身份识别时,本文的研究结果比较推荐肺动脉瓣听诊区和主动脉瓣听诊区。
实验过程中虽然尽量保持安静的采集环境,但也很难避免外部的微弱噪声和心音采集设备本身的影响,这些人为无法控制的因素或许会对最终的识别结果造成微小误差,望各位读者批评指正。
心音信号作为一种声学信号,可以有效地表征心音共振腔结构的声学特性,从而可以应用于身份识别。而不同听诊位置的心音信号具有一定的差异性,本文结合了医学上常用的经典瓣膜听诊区(二尖瓣、三尖瓣、肺动脉瓣、主动脉瓣)对各听诊区识别效果进行了研究,更加细化地讨论了心音身份识别问题。首先利用4通道同步心音传感器采集心音信号,然后对原始心音进行去噪和分段预处理,再通过线性预测编码(LPC)方法提取S1和S2的共振峰频率作为识别特征,最后结合欧氏距离度量各样本之间的相似性,给出识别结果。
对于青年群体的研究,本文的结论如下:(1)肺动脉瓣采集的心音特征表征的差异最大,而且与采集对象的性别关联最小。(2)如果将主动脉瓣和肺动脉瓣进行融合处理,对于提高识别率具有积极的意义。