情绪相关脑电信号的特征选取与导联优化

2018-11-06 09:30王永宗张艺耀朱玲玲赵永岐
安徽医科大学学报 2018年10期
关键词:导联效价校正

李 彤,王永宗,张艺耀,彭 宏,朱玲玲,赵永岐

近年来,脑电(electroencephalogram, EEG)以其低伪装性及较高时间分辨率在情绪识别领域中脱颖而出。研究[1]表明,EEG高频成分可以反映人的情绪和认知状态,其中γ和β频带比低频频带能更好地区分情绪状态的转换[2]。Jie et al[3]通过非线性特征样本熵实现了高低唤醒度和高低愉悦度的情绪识别。Duan et al[4]在情绪识别中采用微分熵进行机器分类学习,分类正确率最高为84.22%,可见微分熵作为非线性EEG特征具有较高的分类效率。但庞大的数据量和导联数目的增加,不利于情绪的快速识别。针对此问题,该研究应用校正后的Fisher分数(F-score)算法,筛选与典型情绪密切相关的线性和非线性的EEG特征和最优导联集合,为实现情绪的快速识别提供可能。

1 材料与方法

1.1筛选刺激图片和被试者通过预实验,从北京师范大学周仁来教授提供的中国化的情绪图片系统[5]中筛选出60张情绪图片,其中轻松情绪图片15张,图片效价评分(6.72±0.49)、唤醒度评分(3.77±0.97);沮丧情绪图片15张,图片效价评分(2.88±0.62)、唤醒度评分(4.97±0.69);愉悦情绪图片15张,图片效价评分(7.26±0.44)、唤醒度评分(5.80±0.66);恐惧情绪图片15张,图片效价评分(2.44±1.04)、唤醒度评分(6.54±0.60)。

图1 实验流程图

被试为30名在校男性学生,母语为中文,年龄21~27(22.9±1.63)岁,右利手,视力正常或矫正视力正常,无色盲色弱症状,无任何脑神经损伤和精神疾病病史及家族史,近期无服用对神经系统有影响或损害作用的药物。

1.2情绪诱导利用E-Prime 2.0软件设计情绪诱导文件。四类情绪图片根据唤醒度评分由低到高播放,依次诱导被试产生轻松、沮丧、愉悦、恐惧情绪。为使情绪诱导更加显著,本实验设计以同一类型情绪图片连续呈现的方式诱导情绪产生,从而获得更高的情绪识别效果。如图1所示:睁眼盯住屏幕“+”60 s采集静息脑电信号。每张图片呈现6 s,每两张图片间隔2 s并要求被试紧盯屏幕“+”,直至15张图片全部播放完毕,按键结束,最后完成情绪状态自我评估表(self-assessment manikin, SAM)。直至四类情绪图片全部播放完毕。SAM评分表内容包括效价和唤醒度两组评分。其中,效价代表被试观看情绪图片后的沮丧-愉悦程度,1~9评分,效价得分越高,愉悦程度越高;唤醒度代表被试观看图片后的平静-兴奋程度,1~9评分,唤醒度得分越高,兴奋程度越高。评价每类情绪诱导有效方法是,选择每类情绪图片的有效评分数量达到此类型情绪图片数量一半以上时的被试EEG数据。四类情绪图片播放流程完全相同。

1.3脑电数据采集及预处理实验在电磁屏蔽实验室进行,室内隔音良好。确保被试双眼距呈现图片的屏幕100 cm,视角为7.85°~8.73°。使用Neuroscan SynAmps 2的64导脑电设备采集并记录实验过程中被试产生的EEG信号,按照国际10-20标准安放,电阻控制在5 kΩ以下。EEG数据预处理前,有6名被试情绪诱导无效予以排除,共采用24名被试EEG信号数据。借助MATLAB软件对EEG信号进行分析,包括去除工频干扰,降采样率到128 Hz,带通滤波滤取1~45 Hz的脑电信号,使用独立成分分析方法去除伪迹,截取0.5~5.5 s有效数据段。

1.4EEG信号频域特征提取利用小波包变换[6]将原始信号分解成β、γ频带。

1.5时频域非线性特征提取

1.6基于F-score的特征选择方法F-score是一种区分类内、类间的可分性评价指标,其本质是选取类内差异小,类间差异大的有效特征[7]。其值越大,则认为一定程度上特征对情绪的分辨能力越强。为了使F-score适用于多分类问题,对公式进行了修改。计算公式如下。

1.6.1F-score算法

去除测量水平眼电的两个导联和一个无对称存在的导联,64导联信号剩下61导联信号,由于每个脑电导联对应m个特征,故提取的特征数目为61×m维特征。

1.6.2校正后的F-score算法 一般认为,F-score的值越大,标准差越小,则对四种情绪的分类具有越好的特性。但存在标准差极小,平均值较小但反而F-score值极大的极端情况出现,为避免上述假阳性结果的出现,故将F-score值乘以其均值、除以其最小标准差。从而设计出公式:

这样,对于四分类问题而言,公式计算的结果越大,表明分类性能越好。

1.7SVM分类识别支持向量机(support vector machine, SVM)是由Vapnik等提出的有监督的学习模型,应用于分类、模式识别和回归分析领域。在解决二分类线性问题的效果较好,但对于非线性问题,常常通过核函数定义的非线性变换将原特征空间中的非线性问题转化为高维空间中的线性问题,并在高维空间中求分类超平面[8],从而得到较好的分类准确率。

利用F-Score特征提取方法联合SVM方法,选取最优的特征集合。选取径向基核函数将输入测试样本映射到高维空间中,获得最优SVM模型。输入排序靠前的每导联k个F-score值均值,根据已获得最优SVM模型进行类别判断,输出此特征集合的分类准确率。如果分类准确率提高大于0.2%,认为导联的加入对分类有突出的效果,则将该导联加入到有效导联集合中,最后从分类率排序靠前的特征中筛选有效导联[7]。为了降低计算的复杂性,对训练集和测试集的数据进行归一化操作。基于F-score和SVM的导联筛选方法见图2。

图2 基于F-score算法和SVM相结合的导联筛选流程图

1.8统计学处理使用Excel建立数据库,SPSS 18.0软件比较F-score算法和校正后的F-score算法,统计学方法使用两独立样本t检验,P<0.05为差异有统计学意义。

2 结果

2.1根据F-score算法筛选EEG信号四类组合特征应用F-score算法与校正后的F-score算法筛选出每个导联的4个特征组合:β频带、γ频带、信息熵、微分熵。F-score方法与校正后的F-score算法两种算法差异无统计学意义(t=0.383,P=0.706)。F-score值越大,标准差越小,则相应特征对四类情绪两两之间就越具有较好的分类效果,校正后的F-score算法没有改变情绪分类率趋势,同时避免了假阳性结果的出现,为得到最优的导联集合奠定基础。见图3。

图3 F-score方法与校正后的F-score算法的四分类率比较

2.2根据F-score算法筛选通道数目和分类准确率的折中点校正后的F-score算法对情绪四分类正确率折线见图4,四类典型情绪的分类率随导联数目的增加而增大,当导联数目达到了13个时,分类率达到了89.648 4%,而全部61导EEG信号分类效果也仅仅达到了90.722 7%,可见,根据校正后的F-score算法得出对情绪四分类正确率贡献突出的前13个导联亦基本达到了情绪分类准确率和通道数目的折中点。

图4 校正后的F-score算法计算分类率

2.3根据校正后的F-score算法筛选与情绪密切相关的最少导联利用校正后的F-score算法计算得到的5个导联(FT7、T7、FC4、TP10、O1),情绪二分类率折线图显示情绪效价最高达到了94.824 2%。见图5。

图5 校正后的F-score算法的二分类率比较

如图5所示,5个导联和6个导联二分类率分别达到了85.74%和87.19%,故根据校正后的F-score算法计算得到的导联排序靠前的5个导联分别是FT7、T7、FC4、TP10、O1,6个导联分别是FT7、T7、FC4、TP10、O1、FP1,导联分布见图6 。

图6 经校正后的F-score算法筛选的最少导联分布图

A:5导联:FT7、T7、FC4、TP10、O1;B:6导联:FT7、T7、FC4、TP10、O1、FP1

3 讨论

人类脑电变化与情绪的变化之间存在一定的联系,通过对EEG的分析,可以判断人类的情绪状态。人们在情绪识别研究中希望对EEG数据进行实时分析并得到快速反馈。这需要在现有的基础上找到一组与情绪变化密切相关的EEG特征组合。Bahardwaj et al[9]使用EEG信号的θ、α、β频带3个脑电特征,筛选出3个(FP1、P3、O1)导联,并使用SVM和线性判别分析(linear discriminant analysis, LDA)两种分类器识别7种情绪状态,有效分类率分别为74.13%和66.50%。Lee et al[10]使用自适应神经模糊推理系统(ANFIS)识别积极情绪和消极情绪,分类准确率为78.45%。Zheng et al[11]采用微分熵特征,SVM分类器的前提下,设计了4种导联组合,导联个数分别为4、6、9、12个。当采用12个电极时情绪识别精度最高为86.65%,比全导(62个电极)的识别精度83.99%还要好。该研究利用校正后的F-score算法筛选脑电信号高频成分中的β、γ频带以及非线性特征微分熵和信息熵特征共4个特征组合。筛选到的非线性特征一定程度上反映了脑电信号的内在规律,即大脑神经元的非线性动力学特性。亦筛选出对情绪四分类正确率贡献突出的13个导联,已基本达到了情绪分类准确率和通道数目的折中点,高达89.65%。

研究[12]表明,筛选导联数目为5个(FP1、T7、PO4、Pz、FP2)时,情绪四分类率达到了52.32%;导联个数到6个(FT7、FT8、T7、T8、TP7、TP8)时,情绪二分类准确率达到了85.03%[11]。一般认为,情绪分类率达到80%基本达到情绪的高效识别。本研究首次筛选出排序靠前的5个(FT7、T7、FC4、TP10、O1)导联,二分类准确率达到了85.74%,四分类率也高达到81.152 3%;而筛选导联数目为6个(FT7、T7、FC4、TP10、O1、FP1)时,二分类率高达87.19%,四分类率也达到83.691 4%。实现以上少数导联的高分类率不仅在特征选择方面具有创新性,而且通过加大被试量,严格筛选被试,避免个体差异对情绪识别造成的影响,从而为利用少数导联实现EEG信号快速实时分析提供可能。筛选到的少数导联分布并不集中,可能与情绪产生过程中大脑不同部位共同参与有关[13]。从生理学角度上说讲,枕叶的O1导联可能与被试观看情绪图片过程中的视觉诱发有关。前额叶的FP1导联可能和情绪调节或者更高级功能活动有关。而导联左右脑分布大致均匀,可能与大脑左右半球的情绪识别差异分工有关。

F-score算法用于评估每个特征的分辨能力,是一种简单有效的特征选择方法,许多研究结合SVM分类算法已被广泛应用于各个领域的分类问题中[14-15]。比较F-score算法与校正后的F-score算法,虽然两种算法差异无统计学意义(t=0.383,P=0.706),但为避免假阳性结果的存在,故选择校正后的F-score算法作为寻找最优导联集合方法。

利用校正后的F-score算法筛选获得的EEG信号特征组合和筛选出排序靠前的5个导联,在情绪分类识别方面,取得了较高的分类准确率,有望为情绪识别提供参考指标。

猜你喜欢
导联效价校正
O型血孕妇血清IgG抗A(B)抗体效价预测新生儿溶血病价值
心电导联向量的数理基础及其临床应用
词汇具体性对情绪名词效价加工影响的ERP研究*
深圳地区10~40周岁健康人群血清抗A(B)IgG抗体效价参考区间的建立与应用分析
劉光第《南旋記》校正
18导联动态心电图的应用价值研究
建立在校正系统上的强大实力Sonance所能士i12
在Lightroom中校正镜头与透视畸变
基于在线约束限制的飞行器预测校正制导
多类运动想象脑—机接口导联选择方法