基于脑电EEG信号的分析分类方法*

2020-01-01 03:43:18陈泽龙谢康宁

中国医学装备 2019年12期

陈泽龙谢康宁

脑电图(electroencephalogram，EEG)是一种使用电生理指标记录大脑活动的方法，是大脑活动时大量神经元同步发生的突触后电位经总和后形成，由放置在头皮表面的电极采集记录的图谱[1]。EEG记录大脑活动时的电波变化，是一种无创生理信号采集方法，具有良好的时间分辨率。

EEG作为脑机接口(brain-computer interface，BCI)的关键技术，其应用方法可分为5个阶段[2]。①脑电信号的采集；②脑电信号预处理，去除噪声干扰，原始脑电信号包含眼电、心电及肌电的干扰信号，去除此干扰可简化后续脑电信号的分析处理；③脑电信号特征提取，从预处理的脑电信号中提取特征量以区分不同的脑电信号，并实现信号的降维简化计算过程；④选取分类器对提取的特征量进行分类，特征量的选取是影响分类效果的重要因素；⑤将分类结果用于控制外部设备或给出判断结果。脑电信号的预处理、特征提取和分类是脑电信号处理的重要内容，并得到广泛深入研究[3-4]。

1 脑电信号预处理

原始脑电信号含眼电、心电及肌电等噪声，工频干扰也是脑电伪迹的重要来源，会增加脑电信号处理的复杂度及运算量，需在信号分析前剥离[5]。脑电信号预处理方法主要有共空间模式(common spatial patterns，CSP)、主成分分析(principle components analysis，PCA)、共同平均参考(common average referencing，CAR)、自适应滤波(adaptive filtering，AF)、独立成分分析(independent component analysis，ICA)以及数字滤波器(digital filter，DF)等。

1.1 共空间模式(CSP)

CSP滤波来源于共空域子空间分解(common spatial subspace decomposition，CSSD)。CSSD算法的基本思想是在高维空间中寻找方向，对2种情况分类时，使一类方差最大而另一类方差最小。CSP多用于处理基于BCI的运动想象想像脑电数据，其基本思想是设计一种空间滤波器，对脑电信号进行处理得到新的时间系列，使一类信号方差最大而另一类信号方差最小，从而得到差异最大的特征。其优点是无需提前选择特异性频带，缺点是对噪声敏感且依赖于多通道分析[6]。

1.2 主成分分析(PCA)

PCA是一种统计学方法，通过正交变换将一组相关自变量变换为线性不相关变量，变换后的变量即为“主成分”，其作用在于降低向量维度，减少信号特征提取和分类的复杂度。脑电EEG信号处理应用中，PCA将脑电EEG信号分解为互不相关的成分，主成分具有最大方差，分离眼电、肌电等振幅较大的干扰成分，再重构EEG信号，实现信号去噪[7]。

1.3 共同平均参考(CAR)

CAR是一种空间滤波算法，基本思想是滤除脑电EEG信号的共同部分的同时保留特定电极的特征信号，提高信噪比。CAR算法首先计算某一时间点所有通道的脑电电压平均值，再用特定通道的脑电电压值减去平均值即得该通道脑电电压值。CAR算法为公式1:

1.4 自适应滤波(AF)

AF是一种可自动调整参数，无需预知输入信号和噪声的统计特性，在工作过程中逐步估计出所需统计特性，从而调整自身参数以达到最佳滤波效果的滤波方法。完整的AF含4部分:输入信号、参考信号、滤波器和参数调整。AF示意见图1。

图1 自适应滤波(AF)示意图

图1显示，X(n)为输入信号，通过可调参数DF后产生输出信号y(n)，将y(n)与参考信号d(n)进行比较，形成误差信号e(n)，再通过自适应算法对滤波器参数进行调整使e(n)均方值最小，从而实现最优滤波。

Lu等[9]设计一种新的AF方法，叫做自适应拉普拉斯滤波，可改善基于运动感觉的BCI性能，其在22名受试者的研究中证实，该方法可提高基于运动感觉的BCI准确度和鲁棒性。

1.5 独立成分分析(ICA)

ICA是一种盲源分析方法，可根据数据特征将伪影作为独立成分从脑电信号中分离出来。根据ICA算法理论，眼动伪迹、心电伪迹、肌电伪迹和工频干扰等皆由独立的信号源产生，具有统计独立性，通过ICA算法可将其分离，提取出有用的脑电信号。ICA算法提供了分离和去除脑电信号中眼动伪迹的有效方法，Pontifex等[10]探讨全自动眼动伪迹ICA成分分离办法，可避免将头皮EEG中类似于眼动伪迹分布的信号成分错误分离，减少人为确认伪迹可能产生的错误。Pontifex等[11]也探讨了与ICA算法不确定性相关的变异性可能影响去除眼动伪迹成分后的脑电信号的重构，采用3种不同ICA算法对32名大学生的脑电信号数据做分析，重复30次。结果显示，ICA算法在去除伪迹成分后重构脑电信号的过程中可能引入其他伪迹，认真选取ICA算法和参数可减少该影响[11]。

1.6 数字滤波器(DF)

脑电信号是随机且非平稳信号，具有非线性，DF从频率域对脑电信号进行滤波，可分为低通滤波器、高通滤波器、带通滤波器和带阻滤波器。DF广范应用于脑电信号的伪影处理尤其是滤除肌电伪迹。但DF要求脑电信号和伪迹信号分别具有不同频带，在实际情况中很难实现，其使用受到限制[12]。脑电信号处理中常用的DF为带通滤波器和陷波滤波器，陷波滤波器可用于滤除50 Hz工频干扰。

1.7 预处理方法优缺点

脑电信号预处理主要去除脑电信号中混杂的眼动伪迹、心电伪迹、肌电伪迹和工频干扰等，为接下来的脑电信号特征提取提供“干净”的信号数据。脑电信号预处理方法多样，上述CSP、PCA、CAR及ICA属于空域滤波器，此外还存在时间域滤波器，如傅里叶分析、自回归分析等。相同数据量下，空域滤波器比时间域滤波器在分析时效上有优势。6种脑电信号预处理方法的优缺点对比见表1[2]。

表1 脑电信号预处理方法比较

2 脑电信号特征提取

预处理后的原始脑电信号成为较为纯净的脑电信号，但由于脑电信号数据量大，直接处理过于复杂，需做特征提取以降低数据维度[2]。目前，常用的信号特征提取方法为功率谱密度(power spectrum density，PSD)、PCA、ICA、自回归分析(auto regressive，AR)、小波变换(wavelet transform，WT)、小波包变换(wavelet packet transform，WPT)及快速傅里叶变换(fast Fourier transform，FFT)等。

2.1 功率谱密度(PSD)

PSD定义了时间序列信号的功率如何随频率分布，是一种概率统计方法，是对随机变量均方值的量度。Dea等[13]采用功率谱密度和分形维数评价儿童睡眠纺锤期“之前”“间期”及“之后”的差异，结果表明“间期”和“之前”“之后”期存在统计学差异，分形维数也显著不同，此差异有助于理解睡眠纺锤波的变化。

2.2 主成分分析(PCA)

PCA既可用于脑电数据预处理，也可用作脑电数据信号的特征提取。PCA从脑电信号的时间序列数据中提取出有用信号，同时去除伪影以达到降维的目的。P300字符拼写BCI系统应用于日常生活对残疾人帮助很大，Kundu等[14]采用PCA和加权支持向量机对P300字符拼写BCI系统做特征识别，PCA去除多余特征量。Jaiswal等[15]研究癫痫发作自动监测技术，采用基于子模式主成分分析(sub-pattern PCA，SpPCA)和基于交叉子模式相关性主成分分析(cross-subpattern based PCA，SubXPCA)做特征提取，建立脑电信号子模式相关性帮助模式识别。

2.3 独立成分分析(ICA)

ICA将信号分解成相互独立的成分并提取其有用成分。作为“盲源”分离技术，ICA有助于辨别独立信号并将噪声信号进行分离，其运算速度快且效率高，适合处理如脑电EEG信号一般的海量的数据。Stewart等[16]记录视觉刺激脑电信号，判断被试者是否熟悉所见物体。该研究采用ICA做特征提取，支持向量机做分类器，获得87%的分类准确率。

2.4 自回归分析(AR)

AR是一种时域分析方法，通过建立数学模型对脑电信号数据进行拟合，实现特征提取。AR模型可表述为线性预测问题，对于时间序列数据，当前点的预测值可用最邻近的前n个点的采样值的线性加权和来近似。脑电信号分析中常用的AR模型可分为自适应模型和非自适应模型[17]。

2.5 小波变换(WT)和小波包变换(WPT)

(1)WT。WT是一种时频变换方法，其继承并发展了短时傅里叶变换局部化的思想，能够提供一个随频率改变的“时间-频率”窗口。WT突出信号特征，通过伸缩平移运算对信号多尺度细化，实现信号高频处时间分辨率提高和低频处频率分辨率提高，自动适应信号时频分析要求。WT分解过程中只对信号低频部分再分解，高频部分不再分解，因此随着信号频率升高频率分辨率降低，WPT对高频信号的频率分辨率比WT高，可自适应选择最优小波包基函数，具有较强信号分析能力，得到广泛应用。

(2)WPT。Subasi等[18]对偏头痛患者光刺激的脑电信号做离散小波变换(discrete wavelet transform，DWT)，每个通道信号提取23个特征量，经过二次筛选全部用于模式识别。DWT小波基函数的品质因素Q是固定的，可调品质因子小波变换(tunable Q-factor wavelet transform，TQWT)的品质因子Q是可调的，可调整小波振荡特性与特征波形振荡特性相匹配。TQWT一般根据品质因素Q、冗余度R和分解层数J将脑电信号分解为不同的子频带，因为脑电信号的随机非平稳特性，品质因素Q取值较大，如Q取值14[19]。WPT对高频信号的分辨率高于WT，是一种更精细的分析方法，在基于脑电信号的测谎、面部表情识别及驾驶意图识别等研究中用于特征提取，获得较好分类效果[20-22]。

2.6 快速傅里叶变换(FFT)

FFT是离散傅里叶变换的快速算法，在脑电信号特征提取中，FFT将脑电信号从时间域变换到频率域并做频谱分析或者计算功率谱密度。Ansari等[23]研究BCI电动轮椅操作控制，受试者脑电数据经带通滤波后做FFT获得δ、θ、α和β波，计算每个特征量的平均值、标准差和熵值，再将所有特征量输入分类器做分类识别。FFT还被用于疲劳驾驶脑电信号分析及无人驾驶系统驾驶行为模拟实验中驾驶员脑电信号分析等研究[24-25]。

2.7 特征提取方法优缺点

脑电EEG信号是大脑各种电生理活动形成的电位在头皮表面的叠加，具有随机非平稳特性，如何从复杂的EEG信号中提取有用的特征量是脑电信号分析的关键。单纯按照脑电信号的频率分布做带通滤波不足以体现其特征，而高维特征向量会给后续的分类算法带来十分复杂的运算量，需要做降维处理，一般采用PCA或ICA降维。7种脑电信号特征[2]提取方法的优缺点比较见表2。

表2 脑电信号特征提取方法比较

3 脑电信号的分类

脑电信号经过预处理和特征提取后，所提取的特征向量由分类器进行分类，实现对脑电信号的分析和预测。常用脑电信号分类器有K最近邻算法(k-nearest neighbour，K-NN)、线性判别分析(linear discriminant analysis，LDA)、支持向量机(support vector machine，SVM)、朴素贝叶斯(naive Bayes，NB)、人工神经网络(artificial neural network，ANN)与深度学习(deep learning，DL)等。

3.1 K最近邻算法(K-NN)

K-NN算法是一种基于样本实例的分类算法，其核心思想是为:如1个样本在特征空间中的k个最相邻的样本中大多数属于某个类别，则该样本也属于该类别，并具有该类别样本的特性。K-NN算法首先确定1个训练样本集，样本集中所有样本类别均为已知，对于待分类的样本，计算该样本与训练样本集中样本的相似度，选择相似度最高的k个样本，根据选择的k个样本的类别确定待分类样本的类别。近年来，K-NN算法得到较大改进，并在人脸识别、文字识别和医学图像处理等领域广为应用[26-28]。Li等[29]利用EEG将K-NN算法用于人脸表情识别，结果显示，EEG脑波γ频带分类识别准确率随着EEG通道数的增多而提高，而EEG脑波γ频带、β频带、α频带及θ频带数据的分类准确率依次降低。同样用于人脸表情识别领域，Awan等[30]利用分段选择均方根(segmentation and selection-root mean square，S-RMS)特征向量提取方法结合K-NN分类识别算法使分类准确率达到96.1%。

3.2 线性判别分析(LDA)

LDA是Fisher于1936年提出的一种线性学习方法，其主要思想是对于给定的训练样本集，找到恰当的投影方向将样本投影到一条直线上，使同类投影点尽量集中，不同类投影点尽量远离[31]。用相同方法对新样本进行分类，根据新样本投影点在直线上的位置确定新样本类别[32]。LDA计算量不大，易于使用，是一种较好的分类方法[2]。LDA用于模式识别时通常将样本集分为两类[33]。

3.3 支持向量机(SVM)

SVM是一类按监督学习方式对数据进行二元分类的广义线性分类器，基本原理是在空间寻找最优决策面，使不同类别数据分布在决策面两侧，从而实现分类[34]。SVM按其构建模型由简至繁可分为线性可分支持向量机、线性支持向量机和非线性支持向量机。Yun[35]采用SVM分类方法对驾驶疲劳程度进行分类，得出区分驾驶员轻度疲劳和重度疲劳的关键节点在于连续驾驶时间是否满2 h，且该算法对重度疲劳的识别效果更好。Siuly等[36]对癫痫EEG数据进行最优配置并采用PCA做特征提取，在此基础上分别采用NB、K-NN、LDA和最小二乘支持向量机(least squares-support vector machine，LS-SVM)对特征向量做分类，结果显示，LS-SVM的分类准确率最高达100%，比现有癫痫脑电数据分类算法准确度高7.10%。

3.4 朴素贝叶斯(NB)

NB分类器是基于贝叶斯定理的一种简单实用的分类器，在一些领域其效率与其他分类器效率相当[37-39]。NB的主要思想是:对于给定的待分类项，求解在此项出现的条件下各个类别出现的概率，待分类项就属于概率最大的类别，该算法假定样本之间相互独立无关联[40]。NB分类器在处理高维数据时具有速度快、效率高和算法结构简单的突出特点[41]。在NB算法基础上，研究人员提出树增强NB算法、网络增强NB算法等改进算法，其目的是改善算法性能，提高分类准确率[37]。

3.5 人工神经网络(ANN)

ANN是20世纪80年代以来人工智能领域兴起的研究热点，从信息处理角度对人脑神经元网络进行抽象模拟，建立相应模型，按不同连接方式组成不同网络。ANN从人脑和各生物神经网络中获得启发，主要用于同时处理海量数据[42]，解决分类和回归问题，属机器学习方法的一个分支。

ANN模拟脑神经的结构和功能建立模型，其基本的神经网络类型有两种:前向神经网络(feedforward neural network，FNN)和循环神经网络(recurrent neural network，RNN)。前向神经网络又分为单层前向神经网络(single-layered feed forward neural network，SFNN)和多层前向神经网络(multilayered feed forward neural network，MFNN)。SFNN输入层和输出层直接相连，MFNN输入层和输出层之间包含隐藏层，RNN在MFNN的基础上包含反馈回路，即输出层神经元反馈回自身输入神经元。神经元是ANN的基本单元，它由输入变量、输入变量权重、激活函数、偏离值和输出变量等要素组成。

ANN在医学诊断尤其是生物医学信号的检测与分析领域应用广泛，可解决生物医学信号处理中常规方法难以解决或无法解决的问题，在EEG、心电图、肿瘤和精神病学等方面应用广泛，通过先验数据的训练获得“经验”，无需对疾病细节和特征过多关注[42-43]。Dande等[42]介绍经过训练和学习的ANN用于肺结核诊断，其灵敏度和特异度分别达100%和72%。Grossi等[44]采用基于ANN的以隐函数作为压缩时间的多尺度排序组织图(multi-scale ranked organizing map coupled with implicit function as squashing time，MS-ROM/I-FAST)系统从EEG提取感兴趣的特征，对儿童自闭症的鉴别诊断效果良好，所需EEG数据量仅需采数分钟EEG数据即可满足，且无需做任何数据预处理。

3.6 深度学习(DL)

DL是机器学习的一种类型，是ANN的拓展。DL指ANN中包含的大量隐藏层神经元的学习、分析和处理。早期ANN多是浅层模型，DL基本结构是深度神经网络(deep neural networks，DNN)，隐藏层数多，包含神经元数量大，需调整参数多。DL是机器学习的一个重要分支，是近些年的研究热点，在生理信号的分析处理方面得到广泛应用。近年来，DL在脑电信号分析分类方面的应用得到广泛深入研究，采用DL开展脑电信号分类研究的内容主要有情感识别、运动想像象识别、心理负荷检测、癫痫检测、事件相关电位检测和睡眠评分，采用的DNN主要有卷积神经网络(convolutional neural networks，CNN)、循环神经网络(recurrent neural network，RNN)和深度置信网络(deep belief networks，DBN)，还包括栈式自编码器(stacked auto encoder，SAE)和多层感知机(multilayer perceptron，MLP)等[45]。

CNN是一种前向神经网络，其网络结构由输入层、卷积层、池化层、全连接层和输出层组成。卷积层做特征提取，池化层减少网络训练参数降低模型过拟合程度，深度卷积神经网络含有多层卷积层和池化层，全连接层所有神经元与最后一个池化层连接，输出层包含2个神经元做二分类输出[46]。

RNN用以处理序列数据，其结构中神经元的输入受输入神经元和之前节点神经元输出影响。最常用的RNN是长短期记忆(long short-term memory，LSTM)神经网络，其基本结构是含3个门控的记忆模块，分别是输入门、输出门和遗忘门，决定信息的输入、输出与移除。LSTM的隐含层数及隐含层中的神经元数可手动调节，使训练得到的LSTM模型预测效果最佳。Craik等[45]总结90项基于深度学习的脑电信号研究后认为，CNN、RNN和DBN在脑电信号分类准确性上优于SAE和MLP。

基于DL的脑电信号分类研究主要集中在下述6个方面。

(1)Zhang等[47]提出一种时空循环神经网络的DL算法用于情感识别，将脑电信号的时间和空间特征信息集成建立时空依赖模型，实验结果表明，其与目前最先进的分类算法相比更有优势。

(2)Hauke等[48]开发一种深度学习算法用于基于脑电信号的运动想像BCI系统，可提高脑卒中康复效果。该算法采用CNN做特征提取和数据降维，采用CNN的全连接层做分类识别。

(3)精神负荷分类识别是研究工作记忆的核心内容。Jiao等[49]针对单通道脑电信号和多通道脑电信号分别建立了不同的CNN模型，一种含时间和空间信息，另一种只含时间信息。在用于精神负荷分类时，既有两种模型的单独运用又有两种模型的联合运用，并引入点门限玻尔兹曼机以提高分类性能。目前，医生根据EEG诊断癫痫样放电的准确率比机器诊断高，但随着DL的应用，未来十年该优势可能消失。

(4)Tjepkema-Cloostermans等[50]基于EEG，联合运用CNN和RNN探测癫痫样放电，其灵敏度和特异性分别为47.4%和98.0%，该研究认为DL将使人工智能探测癫痫样放电的准确度与人类专家不相上下。

(5)CNN探测P300脑电信号性能优越，Liu等[51]在标准CNN基础上引入批量归一化(batch normalization，BN)方法减少过拟合，线性整流函数(rectified linear unit，ReLU)避免梯度消失提高运算效率，研究表明，改进的算法提高了P300脑电信号特征识别率。

(6)Bresch等[52]融合CNN和LSTM做睡眠分期，其分期结果与专家人工判读一致性Kappa系数为0.73，具有良好的鲁棒性。

3.7 脑电信号分类器算法优缺点

脑电数据分类算法多样，但没有一种算法具有绝对优势，只有针对具体样本数据选择合适的分类算法才能达到最佳分类效果。选择分类器时需考虑数据维数和偏差方差平衡两种因素。特征向量的维数越高，所需训练数据量相应呈几何倍数增长。而分类器在偏差方差的取舍上倾向于高偏差低方差。

目前，分类器算法的发展趋势是各种分类器算法的综合运用[2]。6种脑电信号分类器算法优缺点比较见表3。

表3 脑电信号分类器算法比较

4 讨论与展望

BCI在人脑与外部设备之间建立直接连接通路，实现这一连接的设备主要有EEG和皮层脑电图(electrocorticography，ECoG)等，其中，EEG作为一种无创生理信号检测方法得到广泛研究和应用。BCI系统依赖EEG判断人脑发出的指令，EEG信号的采集、数据处理和模式分类决定BCI的系统性能，其中，EEG数据处理包括数据预处理和特征提取:数据处理影响后续模式分类的速度和准确率；分类器的选择决定模式分类结果。

脑电信号是复杂的非平稳随机信号，脑电数据的分析和处理是BCI系统的关键技术，也是研究的重难点，决定了BCI系统的的发展前景。近年来，脑电数据的预处理、特征提取和分类识别方法得到广泛深入研究，多种脑电数据处理方法被应用于BCI系统。在实践中选择何种数据处理方法由研究对象决定，即根据研究所需脑电数据的特征和数据量的大小决定采用的数据预处理和特征提取方法，多种分类识别方法的综合运用是脑电信号模式识别的发展趋势。

DL算法是机器学习的新领域，在脑电信号的分类识别中优势明显。传统机器学习方法需耗费大量时间做特征提取和选择，损失部分有用信息。DL直接采用原始脑电数据作为输入，无需做特征提取和选择，实现在最大程度上保留原始脑电信息。同时，DNN架构多样，需根据具体研究对象选择合适的神经网络，确认网络架构后需大量原始数据进行训练和调参，涉及大量复杂运算，如何缩短DL模型训练时间是DNN的研究方向之一。作为脑电数据分析分类的研究热点，随着临床大量电生理数据的获取，DL将得到更为广泛的研究和应用。