刘斌 魏梦然 罗聪
摘要:一直以来脑研究都是国内外的研究热点,脑机接口(Brain Computer Interface, BCI)则是脑研究中的重要内容之一。正因为如此,越来越多的国内外研究者开始从事BCI的相关研究,并取得了诸多优秀成果。该文从BCI信号角度入手,总结了近年来基于脑电BCI的典型系统、相关分析方法及研究成果,并具体分析了其中存在的不足之处。
关键词: 脑机接口; 脑电信号; 独立分量分析; 小波变换; 支持向量机
中图分类号:TP399 文献标识码:A 文章编号:1009-3044(2014)07-1493-03
BCI技术指的是能够使人在无外周神经系统和肌肉组织参与的条件下,通过计算机等电子设备输出控制信号,进而与外界环境进行交流的一种新型人机交互手段。近年来,基于脑电的脑机接口技术成为脑科学、神经医学、人工智能等众多领域的研究热点,并逐步发展成为一门新兴的多学科交叉技术。
BCI技术关键在于对大脑信号的正确识别和分类,而脑电数据一直是BCI主要分析和研究对象,原因在于,脑电信号的采集设备具有较短的检测时间,容易实施刺激,并且采集设备为非入侵式方法对人体无危害,同时脑电信号具备较好的时间分辨率。
本文从BCI的脑电信号角度入手,详细的介绍了BCI研究方向及相应的脑电信号分析方法,结构如下:第一节详细综述基于脑电BCI的主要研究方向;第三节介绍了常用脑电信号分析方法;第四节分析现有脑电信号分析方法的不足及展望,最后做出相关工作的总结。
1 基于脑电BCI主要研究方向
20世纪90年代,随着计算机技术的发展以及机器学习、人工智能等领域的成熟,BCI技术成为研究热点,众多国内外机构对BCI进行重点研究,并取得了一定的成果。目前,国际上BCI技术的主要研究方向包括以下5个方面:
1)P300
P300是大脑认知过程中的一种诱发电位,它表示的是人在接收到新刺激后,大约经过300ms的潜伏期之后,会产生一个正向的波峰。P300的波幅与相关靶刺激出现的概率成反比,即靶刺激出现的概率越大,P300的幅值就越小,而靶刺激出现的概率越小则相应的P300幅值越大。典型的P300脑机接口系统是由Farewell[1]等人设计的虚拟打字机,该虚拟打字机界面由一个6行6列的随机字符矩阵组成,实验时,要求被试集中注意力想所要选择的字符。实验结果表明,该BCI系统的准确率能够达到80%,平均通讯速率达到每分钟7.8字符。
2)稳态视觉诱发电位(Steady State Visual Evoked Potential ,SSVEP)
视觉诱发电位指的是神经系统受到电刺激所产生的特定的点活动[2]。在不同的刺激模式下,根据在大脑视觉皮层测量到的诱发电位与视觉刺激的对应关系,可以相应的判断出被试的刺激模式,进而发送相应的控制输出命令。不同的视觉刺激产生的诱发脑电也会不同,根据频率的差异,视觉诱发电位又可分为瞬时视觉诱发电位和稳态視觉诱发电位。当刺激的频率为大于等于5-6Hz时,就会产生周期性的诱发电位,这种视觉诱发电位就称之为稳态视觉诱发电位。
基于SSVEP典型的BCI系统是高上凯等人设计的自动拨号系统[3]。拨号界面的每个键均以一定的频率闪烁。当被试注视某个拨号键时,SSVEP中主要含有该频率的倍数频率成份,BCI系统根据这个频率来选择键盘上的数据进而实现拨号的功能。该拨号BCI系统的平均准确率达到87.5%,而信号传输速率为68 bits/min。
3)改变心理作业
脑电信号是大脑不同活动状态下的一种反应,当大脑进行不同的任务时,脑电信号在左右大脑之间会表现出差异性。利用脑电信号的这一特性为检测不同的心理作业提供了一种参考。Keirn等人[4]探讨了通过脑电信号区分五种不同心理作业的可能性,并取得较好的效果。Keirn对脑电信号采用的是功率谱方法,在进行功率谱估计时,采用自相关法的分类正确率在80%-90%之间,而采用AR模型的方法,与模型的阶数有关,当阶数大于5阶时,正确率也能达到自相关法的水平。
4)慢皮层电位(Slow Cortical Potential,SCP)
SCP反映的是产生于皮层的电位变化情况,持续时间从300ms到几秒,SCP能够反映出皮质I、 II层的兴奋情况,通过一定程度的反馈训练,被试可以控制SCP幅值产生正向或者反向的偏移。Hinterberger等人[5]利用SCP原理为肌萎缩性病人设计了TTD(Thought Translation Device)BCI系统。通过训练,病人可以掌握控制SCP的幅值,继而通过TTD系统与外界进行交流。研究表明,当SCP的幅值控制正确率达到75%以上时,就能够使用TTD在计算机中进行语言拼写。
5)事件相关去同步(ERD)和事件相关同步(ERS)
ERD是指,人在进行某一意识活动时,大脑皮层存在对应的处于激活状态的区域,而这些区域产生的脑电信号中的β波和α波的低频部分将出现幅值衰减的想象。ERS则是指,大脑皮层的部分区域在没有受到刺激的情况下,该区域的脑电信号中的α波和β波出现幅值增加的情况。
基于ERD/ERS的BCI系统目前主要是用于辨别运动想象任务下的脑电信号,通过分析被试不同运动想象模式下ERD/ERS脑电能量分布情况来判别被试的想象内容,并输出相应的控制信号。GRAZ-BCI系统是由GRAZ大学的Pfurtschller等人[6]通过长时间研究而建立的。GRAZ-BCI系统包括GRAZ I和GRAZ II等BCI系统,GRAZ I系统通对左右手运动想象的脑电信号的分类识别率可达85%;GRAZ II系统对被试左右手食指和右脚的运动想象脑电信号进行分类,通过一定训练,在线分类准确率可达77%。
2 常用的脑电数据分析方法
在上节中介绍了5种常见的BCI系统,这些系统中都涉及到一个重要的过程,即对脑电信号的分析和处理。对脑电信号的研究,研究者提出了很多特征提取和判别计算方法,主要包括:
1)功率谱分析法。功率谱分析法从频域角度入手来对脑电信号进行分析,能够很好的反映出信号的能量变化过程。传统的功率谱分析方法是直接通过傅里叶变换来进行功率谱估计,虽然容易实现,但分辨能力有限;现代功率谱估计中常用的方法是AR模型,与传统功率谱方法相比,AR模型法的优势在于,只需要短程数据就能够获得高分辨率的谱估计,同时能够方便的转化为特征向量。张毅等人[7]通过8阶AR模型来逼近脑电数据,并将AR模型系数作为脑电信号的特征量来进行特征分类,该方法的正确识别率达到75%。
2)小波变换法。小波变化对信号在时域和频域内进行联合分析。小波变换具有多分辨率特性,能够将信号的各个频带分解,进而重构各个频带的信号,小波变换能够在分解与重构信号的过程中,提取出信号的隐藏特征。Wei-Yen Hsu等人[8]进行了用离散小波变换对脑电信号进行特征提取的研究,通过对脑电信号的离线分析获取DWT所需参数,并利用线性判别分类方法进行分类,通过对比发现该方法得到了较高的识别率。
3)独立分量分析。利用ICA方法对脑电信号进行分析,可以从脑电信号中提取出出心电及眼电信号,同时可以分离出工频干扰等噪声信号,从而有效的增强脑电信号中所要分析的节律成分。Lemm等人[9]用ICA方法对脑电信号进行分解,并根据所得到的权值去除无关的干扰,显著的提高了脑电信号的信噪比。Navarro等人[10]设置对比试验,实验结果表明使用ICA方法处理脑电数据后与不使用ICA方法相比能够使正确识别率至少提高20%。
4)支持向量机。SVM是一种基于统计学的方法,其原理是将低维空间不可分的数据映射到高维空间中,并通过计算得到一个最优面,从而使样本线性分开。Shoker等人[11]在研究想象左右手运动想象脑电信号的μ节律时,利用SVM进行来分类,较好地解决了非线性、维数高、样本小、局部极小点等问题,并获得83.5%以上的分类准确率。
5)人工神经网络。人工神经网络是通过模拟大脑神经网络特征而建立的数据处理算法,人工神经网络具有极强的学习能力和适应能力,它能够通过一定的训练和学习获取网络的结构特征,今年来,神经网络方法被广泛用于脑电信号研究中。C.W.Ko等人[12]利用神经网络来检测瞬时的脑电信号异常波,得到了83%左右的正确识别率。
6)共同空间模式算法(Common Spatial Pattern , CSP)。CSP算法的基本原理是,采用对两个协方差矩阵同时进行对角化方法来设计最优的空间滤波器,进而分辨左手运动想象和右手运动想象的脑电信号特征。Sun.S等人[13]针对脑电信号提出核特征提取算法(Kernel feature extractor),该方法的核心是将CSP线性滤波器拓展到高维的核空间中,利用该方法对脑电信号中的非线性混叠现象进行研究,并取得了较好的效果。
3 前人工作总结及展望
在前两节内容中,介绍了目前国际上主要的BCI研究方向、脑电数据分析方法及取得的研究成果。在本节内容中,将分别介绍上述脑电信号分析方法的优点及可能存在的问题。
1)功率谱分析法能够很好的反映出信号的频域过程,而其缺陷则在于采用该方法会损失脑电信号的时域信息。脑电信号高时间分辨率的特点决定了,时域信号包含着重要的信息,如果舍弃这些信息必然对结果有一定的影响。
2)小波变换法同样从频域角度进行处理,会损失脑电信号的时域信息。此外,该方法在很大程度上依赖于脑电信号的先验知识,主要表现在直接获取感兴趣信号频段的小波系数作为特征。但是由于脑电信号本身随机的,信号分布无规则,且其产生机理复杂,而人类对大脑的研究也有限,所以很难获得准确的先验知识。
3)ICA方法是现阶段使用较广的一种方法,在信号提取和空间滤波等方面取得了较好的效果,但其固有缺陷使得ICA方法在一些BCI系統的应用中并不是很理想。其缺陷主要表现在:为了获得稳定的结果,ICA需要较长的数据长度,这就导致了计算量大;其次,由于脑电信号是随机的,当采用ICA 方法对脑电信号进行独立分量提取时,不能保证获得有价值的结果;最后,ICA 方法希望提取的各分量尽可能相互独立,这一点同样难以保证,因为大脑内部存在着广泛的联系,各个导联之间很有可能相互关联。
4)SVM方法是基于统计原理分类方法,但对脑电信号使用SVM算法,同样存在一些问题。在SVM使用过程中,由于脑电信号的随机、非平稳特性,研究者对信号的分布特性缺少一定的先验知识,导致对SVM最优核函数的选取及参数的设置均存在不确定性。
5)人工神经网络是机器学习算法中的一种,其主要特点是能够较好的解决非线性问题。然而,神经网络中仍然存在很多重要的问题尚未从理论上解决,需要在实际使用中凭借先验信息确定,如网络节点数的确定、初始权值大小、学习步长以及局部极小值、过学习与欠学习等普遍存在的问题。
6)CSP 算法的优点是并不需要预先选择被试的特异性频带,而缺点则是需要大量的导联电极采集脑电信号, 同时需要对脑电信号进行多通道分析,而采用多通道方法的脑电信号放大系统则会限制 BCI 系统对便携式的发展要求,所以仍然需要进一步优化导联电极的数目。
除上述各个方法自身存在缺陷外,这些方法还有两个共同的不足之处:1)只针对有限的导联进行分析,其中大部分研究者分析的是C3、C4这两个中央运动区导联[14]。而这依赖于一个共同的前提性假设,即大脑的各个功能区是模块化的,与功能区相关的大脑认知活动也是相互分离和独立的。但目前有研究表明,在大脑皮层内部,即使是非常简单的脑认知活动,其实现也依赖于多个脑功能区域的整合和协同;2)将脑电信号分析看作单纯的信号特征提取和分类问题,没有考虑到脑电信号本身的特性。
目前BCI中脑电信号分析方法的一个研究趋势是,充分结合并利用生理学的大脑认知研究成果,并带入到具体方法中,从而找到一种具有较强普遍适用性的特征提取方法。而对于BCI的应用方面,除了基本医疗康复领域外,BCI将更多的应用于生活娱乐方面。此外,在当前移动互联网大背景下,将BCI与移动互联网相结合的应用相信也将是一个关注点。
4 结束语
本文通过大量资料对基于脑电的BCI研究方向、BCI中涉及的脑电数据分析方法进行整合并形成综述。不仅介绍了BCI中脑电信号的具体算法及相关研究成果,分析可能存在的不足之处,并对脑电信号的研究做出展望,希望可以为BCI研究起到积极的作用。人类大脑是一个十分复杂和精密的系统,目前人类对大脑的研究还处于前期的探索阶段,还有很多未知有待进一步研究,相信对BCI的研究有助于进一步加深对大脑的认识。
参考文献:
[1] L.A.Farwell, E.Donchin. Talking off the top of your head: toward a mental prosthesis utilizing event-related brain potentials[J], Electroenceph. Clin. Neurophysiol, 1988, 70:510-523.
[2] Friman O, Volosyak I, Graser A.Multiple Channel Detection of Steady-State Visual Evoked Potentials for Brain-Computer Interfaces[J], IEEE Transactions on Biomedical Engineering, 2007, 54(4) :742-750.
[3] Cheng M, Gao X R, Gao S K. Design and implementation of a brain-computer interface with high transfer rates [J], IEEE Transactions on Biomedical Engineering, 2002,49(10):1181-1186.
[4] Kirkup L, Searle A, Craig A. EEG-Based system for rapid on-off switching without prior learning[J], Medical & biological engineering & computing, 1997, 35: 504-509.
[5] Birbaumer N, Hinterberger T. The thought-translation device(TTD):neuro behavioral mechanisms and clinical outcome[J], IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2003, 11(2): 120-123.
[6] Pfurtscheller G, Neuper C, Guger C. Current trends in Graz brain-computer interface (BCI) research [J], IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2000, 8(2): 216-219.
[7] 張毅,杨柳,李敏. 基于AR和SVM的运动想象脑电信号识别[J].华中科技大学学报,2011,39(S2): 103-106.
[8] Wei-Yen Hsu, Chou-Ching Lin, Ming-Shaung Ju. Wavelet-based fractal features with active segment selection: application to single-trial EEG data[J], Journal of Neuroscience Methods , 2007,163(1):145-60.
[9] Lemm, Curio G, Hlushchuk Y. Enhancing the signal-to-noise ratio of ICA-based extracted ERPs[J], IEEE Trans Biomed Eng, 2006, 53(4):601-607.
[10] Navarro I,Sepulveda F, Huba B. A comparison of time-frequency and ICA based features and five classifiers for wrist movement classification in EEG signals[C], Shang-hai,China:Proceedings of the 2005 IEEE Engineering in Medicine and Biology 27th Annual Conference, 2005: 2118-2121.
[11] Shoker L, Sanei S, Sum A. Distinguishing between left and right finger movement from EEG using SVM[C], Shanghai, China: Engineering in Medicine and Biology 27th Annual Conference, 2005:5420-5423.
[12] Carballido J, Kostov A, Martenez J. Enhancement of EEG control signals in the development of Brain Computer Interface[J], Proceedings of the First Joint MBES Conference,1999 (1):445
[13] Sun S, Zhang C. An optimal kernel feature extractor and its application to EEG signal classification [J], Neurocomputing, 2006, 69 (13): 1743-1748.
[14] 刘成,何可人,周天彤. 左右手运动想象脑电模式识别研究[J].常州大学学报,2013,25(1):25-30.