WPD-CSP脑电特征提取方法的时间优化

2021-06-28 12:42张绍荣赵紫宁盘书宝
计算机工程与设计 2021年6期
关键词:波包电信号特征提取

张绍荣,赵紫宁,李 智,盘书宝

(1.桂林航天工业学院 电子信息与自动化学院,广西 桂林 541004; 2.桂林电子科技大学 电子工程与自动化学院,广西 桂林 541004)

0 引 言

运动想象信号是大脑思维过程自发产生的信号,随机性强、信噪比低,采集过程容易受到噪声干扰[1],因此提取有效特征比较困难。共空域模式(common spatial pattern,CSP)是一种非常有效的特征提取方法,在脑机接口(brain computer interface,BCI)系统中得到了广泛应用[2]。但是CSP缺乏频域信息,为补充CSP方法的频域信息,CSP联合时频分析进行特征提取的方法得到了广泛研究。Lin等[3]使用Wavelet-CSP算法进行特征提取,识别驾驶动作。先对脑电信号进行小波分解,然后选择与运动想象相关的子带小波系数进行CSP变换,最后进行分类。于沐涵等[4]提出将希尔伯特-黄变换(Hilbert-Huang transform,HHT)与CSP相结合的算法,对原始脑电信号进行经验模态分解后提取CSP特征。文献[5]结合小波包分解(wavelet packet decomposition,WPD)和CSP提出了一种特征提取方法,即WPD-CSP。先对每一个通道的脑电信号进行WPD分解,然后把各个子带的小波系数组成新的通道,最后使用CSP提取特征。这些方法最大的问题在于信号的时频分解非常耗时,特别是脑电通道较多时,时间问题特别突出。

本文对文献[5]提出的WPD-CSP方法进行改进,主要解决耗时问题,同时提高分类准确率。虽然文献[5]使用人工选择方法选择通道可以减少WPD-CSP特征提取的时间,但是最优的通道往往是被试特异的,人工选择方法选择的通道往往不是最佳的,因此得到的分类准确率并不是最优的[6]。另外,针对被试特异的运动想象相关频带选择问题,文献[7]提出了一种fisher WPD-CSP方法,对文献[5]进行改进。文献[8]把WPD-CSP应用于4类运动想象脑电信号分类。文献[9]使用自适应差分进化算法对WPD-CSP提取的特征向量进行选择。然而这些文献工作仍需要对脑电信号的所有通道进行小波包分解,时间问题没有解决,信号处理过程也比较复杂。

1 方 法

1.1 整体流程

整体数据处理流程如图1所示。在训练阶段,对输入的EEG训练数据先进行预处理,包括空间滤波和带通滤波,以及单试次脑电数据提取。紧接着进行通道选择,对预处理的信号提取带通功率(band power,BP)作为特征,使用Fisher判别准则(Fisher discriminant criterion,FDC)进行通道选择。然后,仅对选择的通道做小波包分解,最后做CSP变换,得到的特征数据用于分类模型训练,分类模型选择Fisher线性判别分析(Fisher linear discriminant analysis,FLDA)。在测试阶段,只对训练阶段选择的通道进行预处理,并进行小波包分解。使用训练阶段得到的CSP空间滤波器对信号进行滤波并提取特征,并使用训练阶段得到的FLDA分类模型对测试数据进行分类预测。各模块的详细处理方法将在下文分别进行阐述。

图1 整体数据处理流程

1.2 预处理方法

对原始脑电信号依次进行空间滤波、带通滤波和时间窗选取。各部分处理方法的详细信息参考文献[10]。本文两组数据集选取的时间窗均为0.5 s-3.5 s。

1.3 通道选择

使用两种方法进行通道选择,分别为人工选择和算法选择。通过两种方法的比较,验证算法自适应选择通道的优势。

(1)人工选择

以大脑功能分区和神经生理学等先验知识为基础,选择与运动想象任务相关的通道。与运动想象相关的电极通道分布在大脑感知运动皮层区域,具体为C3、C4和Cz电极通道以及周围邻近的通道[11]。针对不同的数据集,人工选择的具体通道在实验部分说明。

(2)算法选择

原始脑电信号经过预处理之后,提取带通功率(band power,BP)作为特征,然后使用FDC进行通道选择,分类器使用FLDA。具体如下:

本文使用带通功率特征作为通道选择的依据。原始脑电信号经过预处理之后提取每个通道信号的带通功率,并且计算每个通道的平均带通功率。带通功率的频带设置和计算方法参考文献[12]。带通功率的计算公式如下

(1)

式中:pi,j[t]表示信号序列xi,j[t]的带通功率。其它详细信息可参考文献[12]。

运动想象脑电信号的事件相关同步和事件相关去同步可以反映每个信号通道的功率谱变化。与运动想象相关的通道,功率谱变化比较明显。Fisher判别准则可以判别出功率谱变化较明显的通道,即选择出与运动想象任务相关的通道。使用以上方法计算得到的带通功率特征和对应的样本标签可以计算出每个通道的Fisher分数,具体如下

(2)

式(2)各部分的具体含义详见文献[12]。计算所有电极通道的Fisher分数,即Fi,i∈(1,2,…,C),C表示通道总数。Fisher分数越大,表明通道越重要。将通道按Fisher分数的大小做降序排序,然后根据通道数选择前c个通道,c值由用户指定。

1.4 小波包分解与子带选择

WPD的计算推导可以参考文献[13]。WPD分解的子带频率与分解层数和数据集的采样率有关。对不同采样率的数据集应采用不同的分解层数,才能得到与运动想象信号相关的子带。因为本文所用到的数据集采样率包括100 Hz和250 Hz两种频率,因此下面将分别针对这两种频率讨论小波包分解层数选择和子带选择。

对100 Hz采样率的数据集,采用db1小波基将输入的EEG信号进行3层小波包分解,得到8个子带S(3,0)~S(3,7),具体如图2所示。与文献[5]保持一致的做法,选择前5个子带(详见图2虚线方框的地方)的小波系数进行CSP变换。

图2 3层小波包分解(采样率100 Hz)

对250 Hz采样率的数据集,同样采用db1小波基对信号进行小波包分解。但是由于采样率较高,分解层数选择4层。信号分解得到16个子带S(4,0)~S(4,15),具体如图3所示。类似的,选择30 Hz以下的频带[5],即选择前4个子带(详见图3虚线方框的地方)的小波系数进行CSP变换。

图3 4层小波包分解(采样率250 Hz)

1.5 CSP特征提取

本文只讨论针对二分类任务的CSP方法。CSP寻找一组空间滤波器w使得以下的目标函数J(w)达到最大,即最大化一类运动想象任务的方差,同时最小化另一类任务的方差[2]

(3)

式中:Xi∈RN×T,i∈[1,2]表示第i类运动想象任务的单试次EEG数据,N表示电极通道数,T表示单试次数据的样点数。Ci表示数据Xi的协方差。J(w)的求解等价于广义特征方程的求解,下面给出求解过程。

单试次数据的归一化协方差矩阵计算如下

(4)

式中:T表示求矩阵的转置,trace(·)表示求矩阵的迹。

(5)

对复合协方差矩阵Cc进行特征值分解

(6)

得到特征向量矩阵Uc以及特征值组成的对角阵Σc。然后通过Uc和Σc计算白化矩阵如下

(7)

两类任务的平均协方差矩阵经过白化变换(式(8))之后拥有共同的特征向量,且对应的特征值总和为1。具体如下

(8)

S1=Bλ1BT,S2=Bλ2BTλ1+λ2=I

(9)

(10)

最后,单试次数据的特征向量计算如下

(11)

式中:var(·)表示方差运算,log(·)表示对数运算。

2 实验结果与分析

采用一个公开的BCI竞赛数据集和实验室自采集数据验证所提出方法的性能。

2.1 数据说明

数据集1:该数据集一共采集了5个被试的数据,分别是aa、al、av、aw和ay[14]。运动想象时间为3.5 s,在这期间被试执行左手、右手和右脚3类运动想象任务,但是竞赛只提供右手和脚两类任务的数据。每个被试包含280个单试次数据样本,每类任务各占140个。在本文中,各个被试的训练集和测试集划分与BCI竞赛一致,并且对100 Hz采样率的数据进行分析。详细信息可以参考网站:http://www.bbci.de/competition/iii/。

数据集2:该数据集一共采集了8个被试的数据,通过自己实验室的脑电放大器进行采集。更多信息可以参考我们前期的研究工作[15]。

2.2 比较方法

方法1:传统的CSP方法。

方法2:使用所有通道进行WPD-CSP特征提取,即不做通道选择。

方法3:使用人工选择方法进行通道选择。数据集1以C3、C4和Cz电极为中心选择15个通道,电极名称分别为:CFC5、CFC1、CFC4、CFC8、C5、C3、C1、Cz、C2、C4、C6、CCP7、CCP3、CCP2、CCP6。类似的,数据集2选择10个通道,电极名称分别为:FC4、FT8、T7、C3、Cz、C4、C8、TP7、CP3、CPZ。

方法4:使用算法选择方法进行通道选择。两个数据集算法选择的通道数与人工选择的一样。

2.3 实验结果

(1)数据集1

表1列出了数据集1每个被试使用各种方法得到的分类准确率,最高的分类准确率使用黑体加粗显示。本文方法在被试aa、al、av中取得了最高的分类准确率,并且取得了最高的平均分类准确率。方法2的平均分类准确率最低,说明过多的通道进行WPD-CSP特征提取反而会降低分类准确率。

表1 分类准确率(数据集1)

为了更加直观地观察被试分类准确率随通道数的变化,图4给出了数据集1所有被试取不同通道数时的平均分类准确率。从图4可以看出,通道数在10-30之间时,平均分类准确率是最高的,通道数大于30,则平均分类准确率整体呈现下降的趋势。图5给出了每个被试取不同通道数时的分类准确率。对于被试aa、av和ay,可以明显看到,分类准确率随着通道数由小变大呈先增大后减小的趋势。

图4 所有被试不同通道数的平均分类准确率(数据集1)

图5 每个被试不同通道数的分类准确率(数据集1)

(2)数据集2

表2列出了数据集2每个被试使用各种方法得到的分类准确率。本文方法取得了最高的平均分类准确率,且在被试S2、S3、S4、S8中取得了最高的分类准确率。与数据集2类似,在所有方法中,方法2取得了最低的平均分类准确率。

表2 分类准确率(数据集2)

图6给出了数据集2所有被试取不同通道数时的平均分类准确率。图7给出了每个被试取不同通道数时的分类准确率。分类准确率随通道数变化的情况与数据集1类似。

图6 所有被试不同通道数的平均分类准确率(数据集2)

图7 每个被试不同通道数的分类准确率(数据集2)

表3和表4分别给出了数据集1和数据集2每个被试使用算法选择的通道号和对应的电极名称。从表3和表4可以看出,每个被试所选的电极通道几乎都包含C3、C4或者Cz电极,但是每个被试选择的通道都不一样,即选择的通道是被试特异的。

表3 算法选择的通道号及电极名称(数据集1)

表4 算法选择通道号及名称(数据集2)

为了更好地说明通道选择方法的生理可解释性和准确性,图8给出了各个被试所选择通道在头皮的分布映射图。在图8的第(a)行从左往右依次为:数据集1所有电极分布,数据集1人工选择通道的电极分布,数据集2所有电极分布,以及数据集2人工选择通道的电极分布。图8第(b)行为数据集1所有被试使用算法选择的通道在头皮的分布位置,第(c)行和第(d)行为数据集2所有被试使用算法选择的通道在头皮的分布位置。

图8 电极位置

如图8(b)所示,数据集1使用算法选择的通道比较集中,且都分布在大脑左半部分和右半部分的运动皮层区域。但是不同的被试其被选择的通道分布存在显著的差异,比如被试aa选择的通道主要集中在大脑的左半部分,而被试al在大脑的左半部分和右半部分都选择了一些电极通道。另外,所有被试选择的通道都没有完全集中在C3或者C4电极的正中位置,被试aa和av偏大脑的左下方,被试aw偏大脑的左下方和右上方,被试ay偏右下方。被试al则比较偏中间位置,这就说明了为什么被试al能取得100%准确率的原因。这些实验结果表明,使用算法进行自适应的通道选择是必要的。

如图8的第(c)行和第(d)所示,数据集2使用算法选择的通道比较分散,但都包含运动皮层区域的电极。出现这种情况,可能由以下两种原因引起。第一,数据集2是实验室自采集数据,通道数比较少,空间分辨率比较低,算法需要选择更广泛区域的电极提取足够的信息。第二,自采集数据受实验室条件的影响,采集的脑电信号受噪声干扰比较大,影响通道的选择。

图9给出了数据集1和数据集2单试次脑电数据分别使用全通道WPD-CSP方法和本文方法进行特征提取所消耗的时间(单位:s)。从图中可以看到,本文方法大大减少了特征提取的时间,特别是通道数较多时,效果更加明显。

图9 特征提取时间

3 讨 论

从图4~图7的结果分析中可以看到分类准确率随着通道数由小变大呈先增大后减小的趋势,说明随着通道数的增加,捕获的脑电信息在增加,但是过多的通道数反而会引入多余的噪声和大量的信息冗余,导致分类模型过拟合,进而导致分类准确率下降。因此通道选择有利于提高分类准确率以及分类模型的鲁棒性。另外,受试者在佩戴电极帽时位置有一定的偏差,以及大脑皮层结构差异和头型等因素都会影响最优通道的分布,因此使用算法自适应地选择被试特异的最优通道非常有必要。

通过图8的结果分析发现,通道选择受空间分辨率的影响比较大。通道数比较多的时候,选择通道比较集中,与神经生理背景比较吻合。其主要原因在于:脑电通道数增多,空间分辨增大,定位大脑内部信息源的能力增强。

从表1和表2可以看出,在两个数据集的分类结果中,全通道WPD-CSP方法取得了最低的平均分类准确率。图9则进一步说明了基于通道选择的WPD-CSP方法的时间优势。因此,通道选择不仅可以降低噪声干扰和去除冗余信息,从而提高分类准确率;而且大大减少了WPD-CSP方法特征提取时间,从而促进WPD-CSP方法在实时BCI系统的应用。

4 结束语

针对WPD-CSP方法的耗时问题和CSP缺乏频域信息等问题,本文提出了基于通道选择的WPD-CSP方法。该方法使用FDC进行通道选择,降低了WPD-CSP方法的计算复杂度,大大减少了特征提取的时间;同时剔除包含噪声和冗余信息的通道,提高了分类模型的鲁棒性和分类准确率。实验结果验证了本文方法的优越性。由于FDC是一种包裹式的通道选择方法,在使用时还需内嵌一个分类器作为评价标准,并使用交叉验证选择最优通道数,比较耗时。在未来的工作中,将研究嵌入式通道选择方法同时进行通道选择和分类,减少通道选择的时间。进一步提升WPD-CSP的效率。

猜你喜欢
波包电信号特征提取
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于支持向量机和小波包变换的EOG信号睡眠分期
基于Code Composer Studio3.3完成对心电信号的去噪
基于小波包Tsallis熵和RVM的模拟电路故障诊断
基于Daubechies(dbN)的飞行器音频特征提取
基于随机森林的航天器电信号多分类识别方法
Bagging RCSP脑电特征提取算法
基于小波包变换的电力系统谐波分析
基于MED和循环域解调的多故障特征提取
基于小波包的全信息解调方法及其应用