曹宇杰,高亚罕,郭国栋
(上海健康医学院,上海 201318)
人类的情绪是个人的行为、思维方式以及对客观事物的感觉总体整合后的内心表现。情绪具有连续的特征,会影响之后的行为和心理动机,在人类的主观和外部环境的客观发展中发挥重要作用[1-2]。
人在正常状态下保持的平稳情绪是最平常的一种状态,在受到外部的良性刺激时,平常的情绪会得到加强,于是就表现出喜悦这样的正性的情绪[3]。有关研究表明,正性的情绪在健康人群和患有肾功能衰竭患者的死亡率呈现负相关[4]。负性的情绪在受到恶性的刺激或者乐极生悲时产生,若不能及时有效地调节控制,长时间沉溺其中会对身心造成持续性的负面影响,是抑郁症的主要因素之一[5]。
情绪研究一直是研究者们关注的重点。近年来随着人工智能技术的不断发展,以计算机为手段的情绪识别研究正成为情绪研究的新兴领域[6]。生理信号是情绪识别的主要依据,其中,基于脑电信号的研究凭借较高的识别率成为情绪识别的重点[7]。Duan等[8]以脑电频谱能量强度为基础对情绪做正性、负性的二分类,分类准确率达到了76.56%。Krisnandhika等[9]使用小波能量相对利用率为特征,情感识别的准确率达到了76%。我国为加快脑科学研究,“十三五”规划纲要将“脑科学与类脑研究”列为“科技创新2030—重大项目”[10]。
本研究选用14个通道的脑电设备采集喜悦、愤怒和悲伤三种情绪的脑电信号,尝试以自适应滤波对采集的脑电信号进行预处理,从功率谱和脑电地形图对三种情绪的特征进行分析。实验结果较好地反映了喜悦、愤怒和悲伤三种情绪在脑电上的区别与联系。
采用美国的神经科技公司Emotiv Systems推出的神经头盔(neuroheadset)来记录受试者情绪变化的脑电信号,通过计算机对采集到的原始数据进行处理,实验流程见图1。
图1 实验系统流程图
在高校公开招募年龄在18~22岁,身心健康的在校学生16名,男女各占一半,平均年龄为(20±1.3)岁。实验开始前,告知受试者实验目的、流程及注意事项,确保受试者填写的问卷量表属实。
设备采样频率为128 Hz,按国际统一的标准电极放置法选择AF3、F7、F3、FC5、T7、P7、O1、O2、P8、T8、FC6、F4、F8、AF4共14个电极位置,其中大多位于大脑的左右前区,单极导联。电极放置见图2。
图2 电极通道定位图
在一个安静、温度且亮度适宜的房间内为受试者佩戴脑电信号采集设备。实验共分为3小节,每节为受试者播放一段诱发特定情绪的视频,每段视频持续时间约180 s,播放顺序为喜悦、愤怒以及恐惧。在每小节实验结束时,受试者需填写一张情绪评测问卷,评价当前的情绪状态,问卷内容包括当前情绪强度、愉悦度、优势度和唤起度。之后播放一段约60 s的平静视频,待受试者情绪平复后进行下一小节。采集完成后,为受试者取下脑电采集设备,清洗头部并整理实验采集的脑电数据,准备下一场实验。实验过程见图3。
图3 每小节流程
本研究以自适应滤波提取目标频率为1~30 Hz的脑电信号。自适应滤波器由参数可调的数字滤波器和自适应算法两部分组成[11]。输入信号x(n)通过参数可调数字滤波器后产生输出信号y(n),将其与期望信号d(n)进行比较,形成误差信号e(n),利用前一时刻得到的滤波器参数的结果,自动调节当前时刻的滤波器参数,以适应信号和噪声未知的或随时间变化的统计特性,最终使e(n)的均方值最小,见图4。
图4 自适应滤波示意图
滤波过后的脑电信号仍存在着眼电、肌电和工频等干扰信号,为了去除这些信号,本研究采取了独立分量分析(independent component analysis,ICA)来消除噪声[12]。独立分量分析又称盲源分析,是伴随着信号盲源问题发展起来的一种新的信号处理技术[13]。所谓盲源指的是源信号s除了为独立统计之外均未知。假设在采集到的信号x与源信号s之间存在相应的线性映射关系W,其迭代公式为:
(1)
g(u)=ue(-u2/2)
(2)
经过预处理完成的脑电数据剔除了眼电,肌电和工频等干扰。将此时的脑电信号进行快速傅里叶变换即可获得脑电信号的功率谱密度。它表示了信号功率随频率变化的情况,即信号功率与频率的变化关系[14]。因此,脑电功率谱可以从能量的角度对δ波、θ波、α波和β波进行比较从而得出不同情绪下各波段的主次要程度。
本实验采用的脑电采集设备实际采样频率为128 Hz,因此在数据的处理上使用了128点的快速傅里叶变换,可以得到X(k),k为对应采样频率的128个点,n为采样点数。
(3)
脑电信号分为四个不同的基础波段,即δ波(1~3 Hz)、θ波(4~7 Hz)、α波(8~13 Hz)和β波(14~30 Hz)[15]。研究表明,δ波通常在成年人疲劳或深度睡眠状态表现明显;θ波通常在成人精神放松或浅度睡眠状态表现明显[16];α波通常在成人安静、清醒或养神状态表现明显;β波通常在成人情绪激动或紧张状态表现明显[17]。因此,随着人情绪的改变这四个波段的能量也会产生相应的变化。而从脑部区域能量强度变化上而言,大脑的左前区与快乐、愤怒这些趋近性的情绪有关,大脑右前区则与悲伤、恐惧这些回避式的情绪有关[18]。情绪波段指数以平静情绪下的各波段能量变动和脑电地形图为基准,将三种情绪对应的波段能量与之对比。
以δ波为例情绪波段指数计算公式如下
(4)
式中,Gδ为对应δ波段能量指数,Eδ为δ波段总能量,EPδ为平静情绪下δ波段的平均能量。
情绪评测问卷包含愉悦度、唤起度、优势度和情绪强度共四个维度,每个维度按1~9分打分。愉悦度、唤起度和优势度均以5分为中性分界点,高于5分的是正性如愉悦、情绪唤起强烈和感官上处于优势,低于5分的是负性如不愉悦、无感觉和感官上被主导。而情绪强度则是分为三个等级分别是轻度(1~3)、中度(4~6)和重度(7~9)。
以受试者实验过程中填写的情绪自评问卷为基础,计算出喜悦、愤怒和恐惧三种情绪的达成率。情绪的达成率是指情绪强度达到中度及以上的程度比率。本研究所用材料诱发的三种情绪达成率均在80%以上,因此,可认为本研究对目标情绪达成具有有效准确的诱发。
受试者实验过程中记录的情绪自评问卷和情绪达成率详见表1。
表1 情绪自评问卷和情绪达成率
由表1可知,情绪的愉悦度与视频对应诱发的正负情绪有关,正性情绪愉悦度高,反之愉悦度低;情绪的唤起度与情绪强度正相关,唤起度越高,受试者自身兴奋程度越高,对应的情绪强度也越强;情绪的优势度与情绪强度呈负相关,优势度越高,受试者对自身情绪的掌握度越高,诱发情绪的强度越低。
三种情绪的功率谱选取对应每段视频最后30 s的脑电数据,并以3 s为基础,分为10段,平静情绪的功率谱选取三种情绪前播放平静情绪视频的后12 s,同样以3 s为基础,分为4段。对分段出的脑电数据进行验证,得出14个电极的部分脑电功率谱,见图5。
图5 脑电功率谱
据脑电功率谱绘制脑电地形图,见图6。由图6可知,在三种情绪的脑电地形图互相对比下,喜悦时大脑左前区θ波和α波功率较高;愤怒时大脑左前区β波功率较高;恐惧时大脑右前区功率较高。
图6 三种情绪θ、α和β波段脑电地形图对比
得到脑电功率谱后,按照式(2)对三种不同情绪下的情绪波段指数进行计算。采用单因素ANOVA检验分析比较喜悦、愤怒和恐惧三种情绪在大脑左右前区的能量差异,结果显示有统计学意义时,再根据方差齐性用LSD-T或塔姆黑尼T2检验方法进一步分析,结果见表2。
由表2可知,在左前区,喜悦情绪θ频带的能量显著高于恐惧情绪;喜悦情绪α频带的能量显著高于愤怒和恐惧情绪;愤怒情绪β频带的能量显著差异于喜悦和恐惧情绪。在右前区,θ频带三种情绪无明显差异;恐惧情绪在α和β频带的能量显著高于喜悦和愤怒情绪。
表2 16名学生在不同情绪下的情绪波段指数
目前关于额叶脑电功率谱技术的研究主要集中在额叶的中线地带或仅对一个波段进行分析[19]。詹启生等[20]发现在平静状态下,有自杀方式的大学生额叶中线的过稳态值显著低于无自杀方式的大学生。Cavanagh等[21]发现焦虑程度高的受试者在面对惩罚、冲突和错误时,额叶中线θ波功率显著增强。郑樊慧等[22]发现在青少年手枪运动员训练时,在击发前3 s,运动员左颞区的α波功率值显著地高于右颞区。而本研究在传统功率谱研究基础上进行延伸,在受试者头部对称选用14个电极,并从额叶的左右分别综合θ波、α波和β波进行分析,进一步启示脑电功率谱是情绪分类有效特征的同时,结合地形图对情绪区分,提高了效率。这对于改进脑电信息采集方式、推广应用场景和提高情绪识别准确率均有十分重要的意义。
虽然本研究能够有效提取出受试者的情绪特征,并对不同的情绪进行区分,但本研究仅以身心健康的大学生为基准,而精神障碍者对情绪的感知可能与健康人不同[23]。为了能更好地将研究成果转化为实际应用,未来应基于精神障碍患者做对照研究,比较出健康人群与精神障碍人群的脑电差异。
本研究通过情绪视频有效诱发了受试者喜悦、愤怒和恐惧三种情绪的脑电信号,同时记录了对应的情绪评测问卷,利用自适应滤波,功率谱分析等技术对原始脑电数据进行处理分析,比较了三种不同情绪下测评问卷、脑电特征的功率谱、地形图和情绪波段指数等差异。
情绪测评问卷的结果很好地验证了愉悦度、唤起度、优势度,情绪强度与情绪正负性之间的关系[24]。
喜悦、愤怒和恐惧三种情绪的θ波、α波和β波在脑前区的功率强度具有地形分布上的显著差异。喜悦情绪下θ波和α波在大脑左前区提升明显;愤怒情绪下β波在大脑左前区的提升明显;恐惧情绪下β波在大脑右前区的提升明显。波段能量的起伏与脑电波段的理论意义相符[25]。因此,大脑前区θ波、α波和β波的功率谱是情绪分类的有效特征,本研究将在精神医学等领域具有良好的启示意义。