非监督特征学习方法在脑电身份识别中的应用

2014-08-06 05:49官金安高军峰
关键词:电信号神经节正确率

官金安,高 炜, 周 到,高军峰

( 1 中南民族大学 生物医学工程学院, 武汉 430074; 2 中南民族大学 认知科学国家民委重点实验室, 武汉 430074)

传统的生物识别方法,如指纹识别虽然应用较为广泛,但是这些信息存在容易被窃取、复制等安全性问题.而近年来有关脑电图(EEG)的研究验证了脑电信号可以被用做一种较安全的身份验证的生物识别方式[1-3].这些研究还为脑-机接口(BCI)的应用开辟了新的疆界.

基于EEG的身份识别系统,同其它BCI一样,对采集到的EEG信号的特征提取是系统中重要一环,提取特征的好坏直接关系到整个系统的表现.由于EEG信号的非平稳性,常用特征提取方法在提取EEG信号特征时都有各自的局限性.如时域或频域特征直接选取方法,特征提取的优劣与研究及使用者经验关系密切,且处理过程对设备要求较高,提供的信息量也较少;主成分分析法(PCA)虽然可以保留EEG信号矩阵的主要信息,但是会不可避免的造成信息损失,且在信噪比(SNR)较低的情况下的表现并不好;而共空间模式(CSP)通过寻找可以使两类信号区别最大的投影方向,来使两类EEG信号样本的特征增强[4],在用户识别这种多分类中并不适用.传统特征提取方式的不足限制了基于EEG的身份验证系统的实时性和易用性,文献[1]的方法需要记录61导联的脑电信号,文献[2]中的方法需要使用时长3min的脑电信号,且为提取特征参数,均需生成高阶自回归模型,降低了系统的实时性.

而进年来发展迅速的非监督特征学习方法可以学习到样本的深层特征,且特征学习过程可以由人工神经网络(ANN)自动完成,训练用于特征提取ANN时不需要样本的标签信息[5].常见非监督特征学习的人工神经网络有多层限制玻尔兹曼机(RBM)、自编码机(Auto-encoder)、稀疏编码模型(Sparse Coding Model)等,这些方法在图像处理及自然语言处理中取得了良好的特征提取效果[6-8].

本研究为优化基于EEG信号的生物识别系统特征提取方法,引入了非监督特征学习方法,并改善了传统自编码机的网络结构.设计实现了一个由6个相对独立的神经节组成的多神经节人工神经网络(每个神经节均为一个较小规模的自编码机),并将之应用在基于模拟阅读脑电诱发模式的身份识别方法中,实现脑电信号的特征提取.

1 实验部分

1.1 模拟阅读脑电诱发模式

模拟阅读脑-机接口系统及其脑电诱发模式由中南民族大学脑-机接口实验室设计实现,该BCI系统通信基于视觉诱发事件相关电位的N2和P3成分,采用基于“模拟自然阅读诱发电位”模式来构建虚拟键盘,用户像阅读文本句子那样,从视觉物理刺激的目标符号中获取信息[9,10].该系统使用的靶标刺激如图1-a所示(中央有深色实线),非靶标刺激如图1-b所示,刺激字符串如图1-c所示.实验中在分辨率为1024pix×768pix的黑色屏幕中央设置一个30pix×30pix的小窗,字符串中一个字符划过小窗的时间为150ms,且每个试次所用字符串中的靶标刺激的位置不固定,以降低刺激的可预测性来提高信号中P3成分的幅值,字符串移动如图 2 所示.

图1 靶标刺激,非靶标刺激及刺激字符串Fig.1 Target stimulus, non-target stimulus & stimuli line

图2 刺激字符串移动过程Fig.2 the movement of stimuli line

该方法可以有效抑制外源性反应,减弱视线移动带来的眼电干扰,还可以减轻刺激物闪烁引起的使用疲劳,有助于提高特征信号的识别精度,该系统的通信速率可以超过90bit/min[11].

1.2 身份识别实验设计

本次实验中,我们共记录了5名受试者(在读硕士研究生,年龄22~25岁,男性2名,女性3名,视力校正后为 5.0,均为右利手并自愿参加实验)各400个试次的模拟阅读实验脑电信号数据.记录过程使用荷兰Biosemi公司的Biosemi Active Two 脑电信号采集系统,信号采样频率设为2048Hz,按照国际标准导联 10-20 方法安放电极,记录 32 通道脑电信号,以双乳突的平均电位作为参考电位.实验在面积为20m2的脑-机接口实验室进行,周遭安静,实验后剔除受试者报告眨眼及注意力分散的试次.数据记录完成后,依次对其进行预处理,建制训练集与测试集,完成特征提取,最后训练和测试分类器验证特征提取效果[12].

1.3 数据预处理

模拟阅读实验中采集到的脑电信号经颅骨及皮肤衰减、混叠而变得很微弱,同时信号常受到外界电磁场,肌电的干扰.因此,为减少干扰信号,以提高脑-机接口信号的信噪比,我们对数据集进行以下的预处理.

(1)去均值:每个样本减去其平均值.去均值后脑电信号均值为零,峰值在30μV以下,降低了输入信号的幅值,信号可用于预处理的其他过程.

(2)30Hz低通滤波:相关实验研究标明,由靶刺激诱发的脑电信号能量集中在30Hz以下,故对脑电信号进行30Hz低通滤波.

(3)4分频降采样:为减少数据存储空间,提高后期特征学习及模式分类处理速度,我们对各通道的脑电数据进行4分频降采样,采样频率由2048Hz降至512Hz,根据Nyquist采样定理,不会产生信号混叠失真.

1.4 受试者特征信号选择

在模拟阅读脑电实验模式下,受试者在接受靶视觉刺激后100~400ms的时段中的ERP特征明显.实验中,我们发现多名受试者PO3、O1、 Oz、 O2、 PO4、 P4、 P8、CP6通道记录样本叠加平均后N2和P3成分较其他通道明显,于是我们选取各受试者这些通道在上述时段的信号作为其特征.数据储存格式为8×150×400(通道×单通道信号数据点数×试次).各受试者P8通道100试次的特征信号样本叠加平均后的波形,如图 3 所示.可以看出各名受试者的ERP信号的N200和P300成分的幅值存在明显差异,依据选取的特征信号实现身份识别具有一定的可行性.

图3 5名受试者P8通道叠加特征信号Fig.3 the P8 channel mean waves of the five subjects

1.5 特征学习及模式识别方法

1.5.1 基于多节人工神经网络的脑电信号特征学习方法

传统的自编码机通常由三层或多层的人工神经网络构成,多层自编码机结构如图4所示.它通常包含编码层和解码层两部分,编码层的高层较输入层含有较少的节点,该人工神经网络的输入与训练目标相同,即通过调整连接权值使得网络的输入与输出间误差达到最小.网络训练完成后,将样本输入,取最高解码层节点的输出作为特征向量,即完成深度特征学习,此类神经网络随着层数的增加,训练越困难,训练耗时越长.

图4 传统自编码机结构Fig.4 The structure of auto-encoder

本研究为实现模拟阅读诱发脑电信号的非监督特征学习设计了一个包含6个神经节的神经网络,结构如图 5 所示.每个神经节均为一个3层BP神经网络,输入层200个神经元,隐层25个,输出层200个,整个多神经节ANN共含1200个输入层节点,150个隐层节点,1200个输出层节点.

图5 多神经节人工网络结构Fig.5 The structure of multi-ganglion ANN

训练该人工神经网络时,对于训练集一个模拟阅读脑电信号样本(按8×150大小的矩阵储存),我们先将之按列拼接成一个向量(1×1200),然后将其平均分成六段并分别作为各神经节的训练集样本.各神经节以其训练集样本为输入及训练目标,训练迭代次数为2000次,训练结束后最小均方误差(MSE)小于0.01,训练函数选用带动量的梯度下降算法以尽量避免局部最小问题在网络训练中出现.

该多神经节ANN训练完成后,将训练集和测试集的每一试次数据分别依上述方法拼接成一维信号向量,输入训练好的神经网络,然后提取各神经节隐层节点的输出值,作为特征向量,这样原脑电信号样本的就由8×150降维至1×150,完成特征提取.

在训练过程中,神经元节点的连接被限制在神经节内部,这样训练过程中,共有2×200×25×6个连接权值需要调整,而包含相同数目神经元的传统三层自编码机有2×1200×150个连接权值需要调整,后者为前者的6倍(未包含神经元输入偏置的权值).这样就减少了网络的训练时间,也避免了间隔较远,关系不大的神经元之间连接.

1.5.2 支持向量机模式识别

支持向量机(SVM)可以通过其核函数将线性不可分的数据映射至高维特征空间,然后寻找最优分类超平面将数据分类,该方法以统计学习理论为基础,根据有限的样本信息, 在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的泛化能力[10].

本研究使用Libsvm工具箱来实现支持向量机对数据的分类,即是求C-SVC问题的最优解,核函数选用径向基核函数[13],训练过程采用三折的交叉验证对参数C和γ进行格型寻优 (C= 2-5, 2-4, 2-3, …, 23, 24, 25;γ= 2-5, 2-4, 2-3, …, 23, 24, 25),以找到SVM的最佳参数设置.

2 实验结果及讨论

2.1 五名受试者中任两名的特征信号分类识别

为检测多神经节ANN的特征学习效果,我们先将之应用于基本的二分类问题中,即对5名受试者中的任2名的特征信号进行特征学习及分类.为与之对比,我们依次对两名受试者通道PO3、O1、Oz、O2、PO4、P4、P8、CP6的时域特征信号,使用SVM进行模式分类.训练集包含两名受试者各50%的随机选取的样本,测试集为余下样本.此项测试共进行10次,每次训练集和测试集都重新建制,以检测特征学习算法的稳定性.结果对比如图 6 所示,使用左斜线()标注的是采用单通道时域特征时最低平均分类正确率,右斜线(/)标注的是采用单通道时域特征时最高平均分类正确率,上方用箭头标明对应通道.白色柱形为使用多神经节ANN提取的特征向量的分类正确率.坐标横轴为选取的受试者,例:S1/S2为受试者S1与S2特征信号的分类.可以看出对五名受试者中的任两名而言,用以识别的最佳通道并不相同,且最优与最次之间差别显著(5名受试者,成对t检验,p值<0.025),故使用固定通道的特征信号来实现五名受试者中任两名的区分不可行.但是当使用多神经节ANN对选取的8通道脑电信号进行特征学习后,所得到的特征向量,仅在受试者S2与S4之间的分类正确率略低于最优单通道的分类正确率,且在这10种受试者组合的平均分类正确率达到92%,证明使用多神经节ANN学习到的特征在此次二分类实验中是有效的.

图6 任两名受试者使用单通道时域特征及多神经节ANN提取的特征分类正确率对比Fig.6 The comparison of classification accuracies for each two subjects obtained when using single-channel-temporal features and multi-ganglion ANN extracted features

2.2 5名受试者特征信号识别结果

此时为多分类问题,我们建制的训练集中包含5名受试者各50%随机选取的特征信号样本,剩余样本用做测试集.我们比较了由多神经节ANN从1试次特征信号样本,2试次、5试次及10试次叠加特征信号样本学习到的特征向量的分类正确率,各进行10次实验,每次训练集和测试集均重新建制.作为参照,我们还直接依次对各叠加方案的单通道样本进行模式分类.结果对比图如图7 所示.可以看出对5名受试者的识别分类实验中若使用单通道的时域特征信号在不同叠加次数的最佳通道并不相同,且最优与最次之间差别显著(成对t检验,p值<0.025),而且即便是最优通道也仅在叠加试次数达到10次时,对5名受试者的识别率才达到80%,且试次叠加次数过多会降低系统的实用性.对于使用由多神经节ANN学习得到的脑电信号特征,5名受试者2试次叠加样本的分类正确率已经达到80%,当叠加试次数达到5次时,正确率已经超过90%,在实用中,可以将此叠加次数设为5次.最后,我们又对5名受试者5试次叠加的特征信号样本使用传统的三层自编码机提取特征,并使用SVM进行分类.与多神经节ANN 10次对比实验结果如表 1 所示.

在训练时间和提取的特征的分类正确率上(四核2.5GHz Inter i5 处理器,6GB RAM),多神经节ANN都有显著优势,训练时间减少到三层自编码机的10%左右,分类正确率也有明显提升(t检验,p值<0.025).

图7 不同叠加次数下的分类正确率对比Fig.7 The comparison of classification accuracies obtained whenaveraging different number of EEG trials.

实验序号多神经节ANN训练时间/s分类正确率/%三层自编码机训练时间/s分类正确率/%178.794.5956.783.5292.491.0966.287.0377.287.5965.683.0482.887.0977.885.5570.391.5956.187.0670.094.0931.582.5773.890.0910.286.0862.692.0887.584.0985.094.5910.083.01077.595.0949.686.5均值77.091.7941.184.8标准差8.52.929.81.8

3 结论

(1)本研究设计的多神经节ANN在对5名受试者的5次叠加的特征信号的特征学习中取得了良好的效果,特征提取过程可由人工神经网络自动完成,提取的特征优于单通道的时域特征.该类型人工神经网络在训练时间和最后的分类正确率上都优于传统的三层自编码机,且对采用单通道特征信号识别时存在的最优通道不固定,多类识别正确率过低的问题有所改进.

(2)在本实验模式下,5试次的特征信号总时长为1.5s,使用通道数仅为8个,对数据的储存与传输要求不高,且多神经节ANN中的各神经节的训练是相对独立的,实用中可以通过并行处理技术,进一步提高训练速度.该方法为以脑电信号为特征的身份识别系统提供了一种可行的特征提取方式.

参 考 文 献

[1] Ramaswamy Palaniappan,Danilo P Mandic. Biometrics from Brain Electrical Activity:A Machine Learning Approach [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(4):736-742.

[2] Fei Su,Liwen Xia,et al. Evaluation of recording factors in EEG-based personal identification:A vital step in real implementations [C]// IEEE. International Conference on Systems,Man and Cybernetics. Istanbul:IEEE,2010:3861-3866.

[3] Hideaki Touyama,Michitaka Hirose. Non-Target Photo Images in Oddball Paradigm Improve EEG-Based Personal Identification Rates [C]//IEEE. 30th Annual International IEEE EMBS Conference. Vancouver:IEEE,2008:4118-4121.

[4] Koles Z J,Lind J C,Soong A C K. Spatio-temporal decomposition of the EEG:a general approach to the isolation and localization of sources [J]. Electroenceph clinical Neurophysiol,1995,95(4):219-230

[5] Hugo Larochelle,Yoshua Bengio,et al.Exploring Strategies for Training Deep Neural Networks [J]. Journal of Machine Learning Research,2009,10(1):1-40.

[6] Hinton G E,Salakhutdinov R R. Reducing the Dimensionality of Data with Neural Networks [J]. Science,2006,313(5786):504-507.

[7] Mitchell B,Sheppard J,et al. Deep Spatiotemporal Feature Learning with Application to Image Classification [C]//ICMLA. Ninth International Conference on Machine Learning and Applications. Washington:ICMLA,2010:883-888.

[8] Dong Yu,Hinton G,et al. Introduction to the Special Section on Deep Learning for Speech and Language Processing [J]. IEEE Transactions on Audio,Speech,and Language Processing,2012,20(1):4-6.

[9] 程海英,杨仲乐. 与选择性注意字符的细微结构相关的早内源性成分[J]. 华中师范大学学报:自然科学版,1997,31(3):299-303.

[10] 官金安,王艳凤,陈亚光. 特征筛选对脑-机接口信号单次提取精度的影响[J]. 华中师范大学学报:自然科学版,2006,40(2):193-196.

[11] 官金安,陈亚光. 脑控双页虚拟键盘的设计与性能分析[J]. 中国临床康复,2006,10(9):124-126.

[12] 官金安,荆汉娜,李 娜.“模拟阅读”脑-机接口信号的核Fisher分类[J].中南民族大学学报:自然科学版,2013,32(2):87-91.

[13] Chang C-C,Lin C-J. LIBSVM:a library for support vector machines [J]. ACM Transactions on Intelligent Systems and Technology,2011,2(3):1-27.

猜你喜欢
电信号神经节正确率
GM1神经节苷脂贮积症影像学表现及随访研究
个性化护理干预对提高住院患者留取痰标本正确率的影响
基于联合聚类分析的单通道腹部心电信号的胎心率提取
弥漫性轴索损伤患者应用高压氧与神经节苷脂联合治疗的效果研究
门诊分诊服务态度与正确率对护患关系的影响
基于Code Composer Studio3.3完成对心电信号的去噪
针刺蝶腭神经节治疗特发性耳鸣的中枢化机制探讨
视网膜神经节细胞凋亡机制的研究进展
基于随机森林的航天器电信号多分类识别方法
生意