孟 明,尹 旭,高云园,佘青山,罗志增
(杭州电子科技大学自动化学院,浙江杭州 310018)
作为人类与计算机通信的桥梁,脑机接口(braincomputer interface,BCI)可以通过对脑部神经活动信号的识别产生控制命令,帮助有运动障碍的患者对轮椅,外骨骼等外部设备进行控制,从而改善日常生活质量[1-2].脑电信号(electroencephalogram,EEG)因具有高时间分辨率,低成本和高便捷等优点而被广泛应用,在当前BCI控制系统中广泛使用的EEG范式包括事件相关电位(event related potential,ERP)[3],稳态视觉诱发电位(steady-state visually evoked potential,SSVEP)[4]和运动想象(motor imagery,MI)[5-6].与其他范式相比,MI因无需外界的刺激信号,更贴近自然,更具实用性等优点得到关注[7].它通过对四肢或身体不同部位的运动想象引起大脑皮层相关区域活动的变化.例如,当想象左手或右手运动时,大脑对侧的运动感知区域代谢和血流变强,出现Alpha和Beta频段信号的振幅降低的情况,即出现事件相关去同步(event related desynchronization,ERD)现象;大脑同侧的运动感知区域呈静息或惰性状态,出现Alpha和Beta频段信号的振幅增加的情况,即出现事件相关同步(event related synchronization,ERS)现象[8-9].根据这一规律,可以通过对想象不同的肢体运动所得到的EEG信号进行分类从而产生不同的控制命令.
由于EEG是一种非平稳、低幅值、低信噪比的生物电信号,并且运动想象系统的稳定性较差,易受干扰,特征不明显,给正确识别运动想象意图带来很大挑战,因此采用恰当的方法来提取有效的特征在EEG的识别中显得尤为关键[10].共空间模式(common space pattern,CSP)[11]作为一种空间滤波方法,在基于MI的BCI系统研究中被广泛使用,但因为其具有对噪声高度敏感和泛化能力低的缺点,研究者提出了许多改进的CSP方法.为了去除通道之间的冗余信息和噪声干扰,提出了基于通道选择的CSP改进方法,比如通过时域特征和相关系数进行通道选择的滤波器组共空间模式方法(channel selection for filter-bank-CSP,SFBCSP)[12],基于多频带的滤波器排序进行通道选择的共空间模式方法(CSP-rank channel selection for multifrequency band,CSP-R-MF)[13]和基于皮尔逊相关系数进行通道选择的正则化共空间模式方法(correlation based channel selection for regularized CSP,CCS-RCSP)[14].这些方法在通道选择后的滤波中对所选择的通道进行了相同的频带划分与选择,未针对不同个体的不同通道选择最佳频带.但是不同的个体进行运动想象时,ERD/ERS现象较为明显的最佳频带往往是不尽相同的,即使同一个体,不同通道的最佳频带也未必相同.文献[15]提出了一种利用巴氏距离分别选择每个通道最佳频带的共空间模式方法(Bhattacharyya distance-based frequency selection for CSP,B-CSP).但是这个方法的频带选择是对所有通道进行的,未针对不同的个体进行通道选择,仍然存在通道间的冗余信息和噪声影响分类性能.
针对以上问题,本文提出一种块选择共空间模式(block-selection for CSP,BS-CSP)特征提取方法.首先对所有EEG通道划分频带,形成众多块,并结合时频特征提取与统计量计算来表征每个块的二分类能力并作为块选择的依据;然后采用交叉验证的方法,根据验证集平均分类精度确定最优阈值和支持向量机(support vector machine,SVM)的惩罚参数C,从而进行块的选择,CSP特征的提取与SVM模型的训练;最后,求得模型在测试集上的分类结果.利用BCI Competition III Dataset IVa[16]和BCI Competition IV Dataset I[17]数据集对提出的方法进行评估,并与基于通道选择或频带选择的改进CSP方法进行比较,取得了优异的结果,为运动想象脑电信号分类提供了一种新方法.
大多数改进CSP方法的基本思想都是通过EEG的频域信息来选择最佳频带,形成新的输入矩阵后用共空间模式进行特征提取.由于EEG本质上是一个高度非平稳的时间序列信号,仅结合频域信息的共空间模型仍存在不能充分利用时间信息的不足,本文通过构造同时考虑时域和频域信息的选择指标,来改善后续共空间模式特征在表征运动想象任务中的准确性和可靠性.
假设实验采集的EEG数据具有K个通道,把每个通道EEG进行频段划分得到的数据称为块.每个通道都分成S个等带宽频带,则生成K×S个块.记第k个通道的第s个频带所对应块的数据为x(ks)(n),k=1,2,···,K,s=1,2,···,S,n=1,2,···,N,其中N为每个块的采样点个数.假设受试者共进行I次实验,则第i次实验的第ks个块为
其中i=1,2,···,I.在本文中,暂且考虑二分类运动想象(I1,I2),即I1∪I2=1,2,···,I.图1是本文提出的BS-CSP方法框图.首先对EEG按通道和频带进行块的划分;然后在块的相关性计算中计算每个块的功率(power)和功率谱密度(power spectral density,PSD),进而得出每个块的Fisher比来表征区分运动想象任务的能力;接着在块的选择中设置合理的阈值选出M个块,从而构造新的M ×N矩阵作为CSP模型的输入;再接着对每个块分别进行空间滤波,并提取了CSP特征,最后采用SVM[18]进行分类.
Fisher比是一种将高维参数投影成一维来测量类判别属性的统计量参数[18],定义如下:
其中:X−和X+为两个不同类别的参数集合,var(·)为方差,mean(·)为均值.
本文首先通过计算块的时域Power特征和频域PSD特征构建二维参数,然后通过Fisher比投影成一维参数来表征每个块运动想象分类能力,且以此作为后续阈值设置的根据.定义块的功率功率谱密度
图1 BS-CSP算法框图Fig.1 BS-CSP algorithm block diagram
根据式(1)对Fisher比的定义,通过计算上述功率T和功率谱密度P这两个特征的类间欧式距离与类内方差的比值,定义表征每个块二分类能力的值为F(ks)[20],具体如式(4)所示:
根据块的Fisher比进行选择,由大于阈值的块组成新的数据,作为后续CSP空间滤波的输入矩阵.阈值设置的是否合理将对CSP性能产生显著影响,若阈值设置过大,会导致选择块的个数偏少,从而导致模型欠拟合;若阈值设置过小,会导致选择块的个数偏多,从而导致模型过拟合.本文采用交叉验证方法,通过验证集的分类精度来确定最优阈值,块的选择步骤如下:
通过CSP寻求空间滤波器W以最大化两个类别之间的差异,后求得每次实验信号X对应的空间滤波信号Z[21],并用log-variances方法提取每次实验的CSP特征向量f:
其中:Zj为空间滤波信号Z的第j行信号,m为CSP空间滤波器对数,log(·)为对数运算符.
作为一种著名的分类器算法,SVM旨在找到使两类支持向量间隔最大的最优超平面,目前,CSP及其变体与SVM的结合已经成为了一种MI-EEG分类的先进技术.因此采用上述提取的CSP特征训练SVM模型,假设训练样本中对于第i次实验的特征向量为fi∈ℜD(D为特征维数),与之对应的标签为yi ∈{+1,−1}.SVM优化器旨在解决以下优化问题:
其中u∈ℜD和b ∈ℜ分别是超平面的权向量和偏置,C是软间隔的正则化参数,并且ξi是松弛变量[22].本文选用径向基函数(radial basis function,RBF)作为SVM的核:
其中γ为核系数.综合考虑模型性能和运算速度,将γ设置为默认值,即,而惩罚参数C通过E折交叉验证确定.
数据集1:第1个数据集来自BCI Competition III Dataset IVa.此数据集记录了5名健康受试者(aa,al,av,aw,ay)的118通道EEG数据,每个受试者被要求完成右手、双脚两类运动想象各140次实验,每次实验的前3.5 s在电脑屏幕中央持续显示带有方向的箭头(向左:左手运动;向右:右手运动;向下:双脚运动)作为提示,在此期间受试者根据提示来执行相应的运动想象任务,然后放松1.75 s至2.25 s,具体时间轴如图2(a)所示.
图2 单次实验时间轴Fig.2 Time axis of single experiment
数据集2:第2个数据集来自BCI Competition IV Dataset I.此数据集记录了4名健康受试者(a,b,f,g)的59通道EEG数据,每个受试者被要求完成左右手或左手,双脚的两类运动想象各100次实验,每次实验的前6 s首先会在电脑屏幕中央显示固定的十字,且2 s∼6 s会叠加带有方向的箭头(向左:左手运动;向右:右手运动;向下:双脚运动)作为提示,在此期间受试者根据提示来执行相应的运动想象任务,然后6 s∼8 s内屏幕出现黑屏,具体时间轴如图2(b)所示.
1) 频带处理.
由于脑电信号中通常会出现不同形式的干扰和噪声,有些可以在EEG数据采集时尽量避免甚至消除掉,而有些只能在后续的预处理中去除,如工频干扰等.而运动想象实验中的ERD/ERS现象又主要出现在Alpha频段(8 Hz∼13 Hz)和Beta频段(14 Hz∼30 Hz),因此采用有限长单位冲激响应滤波器(finite impulse response,FIR)对EEG信号进行(8∼32)Hz带通滤波,并且划分为12个带宽为2 Hz的频带((8∼10)Hz,(10∼12) Hz,(12∼13) Hz,(14∼16) Hz,(16∼18) Hz,(18∼20) Hz,(20∼22) Hz,(22∼24) Hz,(24∼26) Hz,(26∼28)Hz,(28∼30)Hz,(30∼32)Hz)用于块的构建.
图3 单个通道的ERSP时频分布图Fig.3 ERSP time-frequency distribution of single channel
2) 时间窗处理.
原始数据中包含了实验从开始到结束所有的脑电数据,需要根据实验要求选取合适的时间窗对原始数据进行截取,以便后续处理.在一次运动想象中提示出现后的0 s∼1 s内被普遍称作想象的准备阶段,而3.5 s∼4 s内被称作后想象阶段[21].本文通过分析与运动想象相关的大脑区域信号的事件相关谱扰动(event-related spectral perturbation,ERSP)[23]来确定截取数据的时间窗.图3是两个数据集中受试者一个通道的ERSP时频分布图,可以看出在0时刻视觉提示出现后会有一小段长短因人而异的运动想象反应时间,所以为考虑数据质量,将时间窗设置为视觉提示后的0.5 s∼2.5 s.
实验中,采用4×5折交叉验证方法,即将原始EEG数据集按4:1划分训练集和测试集,并重复4次实验,减少因偶然性对模型评估造成不良影响.其中,训练集用于块的相关性计算与选择,CSP模型的训练和SVM模型的训练,另外为避免过拟合,采用10折交叉验证方法,根据验证集平均分类精度确定最优阈值和SVM模型的惩罚参数C,即取E=10.测试集则用选择的块,训练的共空间模型和支持向量机模型得到分类结果,用于评价模型的分类性能,整体框架如图4所示.
图4 整体框架图Fig.4 Overall frame
以数据集1中的aa,av受试者为例,对划分的12×118个块进行运动想象相关性计算,并用色差表示块的Fisher比.由于该数据集原始通道个数过多,为便于显示挑选包含最优块所属通道的20个运动感知区通道,如图5所示.
图5 不同受试者的块选择比较Fig.5 Comparison of block selection among different subjects
可知,对于aa受试者第3个频段(12 Hz∼14 Hz)和第9个频段(24 Hz∼26 Hz)的块具有较高的Fisher比,即具有较好的运动想象二分类能力,而对于av受试者第2个频段(10 Hz∼12 Hz)和第7个频段(20 Hz∼22 Hz)具有较高的Fisher比,即具有较好的运动想象二分类能力.由此说明通过提出的此方法可以很好地减少个体间和通道间的差异性对分类性能的不利影响.
根据第2.2节所述的具体流程,找出使验证集分类精度最高的阈值进行设置,从而选出最优的块及这些块所属的通道.以数据集1中的av受试者为例,得到验证集分类精度随所选通道个数的变化趋势图,如图6所示.
图6 验证集分类精度随通道个数的变化趋势图Fig.6 Change trend of classification accuracy of validation set with number of channels
随着阈值设置逐渐变小,所选的块个数增多,即相应的通道选择个数也增多,验证集分类精度随之增大,但当阈值设置超过一定大小后,系统出现了过拟合,验证集分类精度开始降低.所以由此可设置使验证集分类精度达到最大值的阈值,选出此时大于阈值的所有块,即得到这些块所属的通道,用于后期的测试集,最终得到分类精度,对系统进行性能评估.
根据ERD/ERS现象,当在做右手运动想象时,大脑左侧运动皮层区域出现明显的ERD现象;相反当在做左手运动想象时,大脑右侧运动皮层区域出现明显的ERD现象;当在做双脚运动想象时,大脑中央运动皮层区域出现明显的ERD现象.为验证该方法选择最优块的合理性,对最优块所属的通道进行标记显示,图7是两个受试者对应的最优块所属通道的标记图.
可知,对于做右手和双脚运动想象的aa受试者,对应的最优块所属通道分布在左侧和中央运动皮层区域;而对于做左手和双脚运动想象的f受试者,对应的最优块所属通道大都分布在右侧和中央运动皮层区域.这一定程度上验证了该方法的合理性.
图7 块所属通道的标记图Fig.7 Marking diagram of the channel to which the block belongs
用提出的方法对第3.1节中两个数据集进行实验,并且与引言中所述的SFBCSP,CSP-R-MF和CCS-RCSP这3种方法进行比较,4×5折交叉验证的测试集平均分类精度和方差如表1-2所示.
表1 数据集1分类精确度比较Table 1 Comparison of classification accuracy of Dataset 1
表2 数据集2分类精确度比较Table 2 Comparison of classification accuracy of Dataset 2
针对上述两个公共数据集,改进的共空间模型算法(BS-CSP)在测试集上表现出了最佳的分类性能.来自数据集1的5位受试者:BS-CSP方法在aa,av,aw和ay4位受试者上获得了最高的分类精度,而SFBCSP方法在al受试者上获得了最高的分类精度.
来自数据集2的4位受试者:BS-CSP方法在a,b,g受试者上获得了最高的分类精度,而SFBCSP方法在f受试者上获得了最高的分类精度.SFBCSP作为一种通过时域特征及Fisher比来选择通道并用FBCSP作特征提取的方法在个别受试者上表现出了一定的优越性,但通过此方法选出来的通道并不像BS-CSP方法选出来的通道那样带有权重,即在不同的通道获得不同数量的块.而CSP-R-MF方法缺少对通道的选择,CCS-RCSP方法缺少对频带的选择,这都导致部分分类精度的损失.综上所述,本文提出的BS-CSP方法具有一定的可行性和优越性.
根据第4.3节所述,得到每个受试者对应的最优块所属通道,并对最优块所属通道的完整频带数据进行特征提取与分类.与其他只进行通道选择的方法进行比较,如基于C3,Cz,C4这3个通道的共空间模式方法(3C-CSP),基于空间滤波器排序进行选择通道的共空间模式方法(CSP-Rank)[24]和基于遗传算法的Rayleigh系数最大化来选择通道的方法(Rayleigh-coefficient based genetic algorithm,RC-GA)[25].以数据集1的5名受试者为例,具体比较结果如表3所示.
表3 不同方法的分类精度和通道选择数量比较Table 3 Comparison of classification accuracy and channel selection quantity of different methods
从表中可以看出,提出的BS-CSP方法除了在ay受试者的分类精度上低于CSP-Rank方法外,其余受试者的分类精度和平均分类精度都优于其他3种方法.比起CSP-Rank和RC-GA方法,BS-CSP方法虽然多使用了10个左右通道,但分类精度提高了5个左右的百分点,提升了BCI系统的分类性能,表明该方法能够更有效地去除冗余,选择出最佳的通道组合.另外,结合图5所示,并对比表1经块选择得到的aa和av受试者分类精度可以发现,aa受试者选择的最佳块基本集中在12 Hz∼14 Hz和24 Hz∼26 Hz两个频段,从而导致了当选择整个频带进行分类时冗余信息较多,精度下降了10%左右;而av受试者选择的最佳块分布的频带较广,这就避免了当选择整个频带进行分类时,精度损失过多,这也充分说明了基于不同个体,不同通道进行频带选择的必要性.
本文提出了一种块选择共空间模型特征提取方法(BS-CSP),用于基于运动想象的BCI系统的任务分类.通过对每个通道划分频带来构建数据块,利用每个块的时频特征计算得到的Fisher比选出最优块,实现了对通道和频带的同时选择,减少了通道间和频带间的冗余信息,然后分别用CSP和SVM对最优块组成的数据进行特征提取与分类.对BCI竞赛数据集的分类实验结果表明BS-CSP方法选出来的块能有效地避免不同个体以及不同通道间的差异性,且块所属的通道分布合理,数量适中,该方法一定程度上提高了BCI系统的分类性能.另外,与其他先通道选择后分频带的改进CSP方法想比,该方法选出来的通道均带有不同的权重,即每个通道所包含的块的个数不同,这也为后续通道选择方法的改进提供了思路.