邹 凌,吴 帆,毕 卉,田博帆,宋志伟,王苏弘
基于皮尔逊最优电极选择的ADHD患者脑电特征提取及分类研究
邹 凌1,2,吴 帆1,2,毕 卉1,2,田博帆1,2,宋志伟1,2,王苏弘3
(1. 常州大学信息科学与工程学院,江苏 常州 213164;2. 常州市生物医学信息技术重点实验室,江苏 常州 213164;3. 苏州大学附属第三医院脑科学研究中心,江苏 常州 213003)
事件相关电位(ERP)可用于注意缺陷多动障碍儿童(ADHD)和正常儿童的脑电特征提取与分类。首先,采用赌博任务范式,采集2类儿童的脑电信号;其次,基于皮尔逊相关系数算法选择最优电极,并预处理最优电极脑电信号;然后,提取预处理脑电信号的时域特征(均值、方差、峰值)和频域特征(Theta波段功率、Alpha波段功率);最后,利用传统分类方法支持向量机(SVM)、自适应增强(AdaBoost)、自举汇聚法(Bagging)、线性判别式分析(LDA)、反向传播(BP)和组合分类器的分类方法(LDA-SVM,BP-SVM)完成对2种脑电信号的分类。研究结果表明,传统方法BP分类器的分类准确率可达80.52%,组合分类器BP-SVM的分类准确率可达88.88%。组合分类方法能提高ADHD儿童的分类准确率,为基于脑机接口技术的ADHD神经反馈康复治疗提供技术支持。
事件相关电位;皮尔逊相关系数;赌博任务范式;脑电分类;脑机接口
在神经科学研究中,脑电研究一直处于非常重要的位置[1]。基于卷积神经网络实现的运动想象脑电分类及人与机器人交互应用研究发现,该方法能够对运动想象脑电数据进行较精确的分类[2]。目前,已经有学者将脑机接口分类技术应用到注意缺陷多动障碍儿童(attention deficit hyperactivity disorder,ADHD)计算机辅助诊断领域。ÖZTOPRAK等[3]提出了一种基于事件相关电位记录的时频域特征来区分ADHD组和非ADHD组的新分类方法,训练集分类准确率达到98%。DU等[4]提出了一种基于判别子网络和图核PCA (principal component analysis)的ADHD分类方法,能使分类准确率达到94.91%。
分类算法的实时性能是脑机接口技术的关键,通过减少电极数量可提高算法运行效率,因此,电极选择对脑机接口应用具有重要意义。目前,WANG等[5]利用共空间模式(common spatial pattern,CSP)的方法得到脑电信号的分布向量,将空间模式和任务关联,通过空间模式向量和导联的最大系数的关系对电极进行优化选择。ARVANEH等[6]使用了稀疏共空间模式(sparse common spatial pattern,SCSP)算法,其是在分类准确率约束下对最小信道数进行优化,通过去除噪声和不相关的信道进行电极优化选择。此外,LI等[7]使用主成分分析方法对每个被试的电极对应的数据集进行计算,然后根据不同的任务刺激的发生率进行导联的 选择。
已经有研究表明ADHD儿童存在执行功能缺陷[7]。ZELAZO和MÜLLER[8]最早提出将执行功能分为“冷”和“热”2种类型,并认为“冷”执行功能更多地和背外侧前额叶皮层相关,“热”执行功能与腹内侧前额叶和眶额叶皮质相关。CASTELLANOS等[9]认为,“热”执行功能关注的是情感和动机的加工。ADHD儿童在“热”执行功能上的缺陷使其在情感性决策上产生障碍,无法做出正确的决策或做出不利于自己的风险决策。
“热”执行功能研究通常采用赌博任务范式。CRONE等[10]通过冒险性决策赌博任务实验,证实ADHD儿童在赌博任务上的失败是由于其对奖励的即刻敏感,不能延迟满足,对过“热”的情感动机无法进行有效抑制,即动机抑制缺陷。MUSHTAQ等[11]通过实验研究表明,执行功能可能影响到事件相关脑电位的反馈处理,如决策性能的调整需要考虑反馈相关负波。
本研究使用爱荷华赌博任务范式采集ADHD儿童和正常儿童的脑电信号,并利用传统分类方法和分类组合方法对脑电信号时频特征进行分类比较,研究结果为基于脑机接口技术的ADHD神经反馈康复治疗提供技术支持。
所有被试均由常州市第一人民医院经临床确诊后提供,共筛选出符合试验条件的ADHD儿童21例,年龄(6.14±1.36)岁;健康儿童21例,年龄(6.42±1.51)岁。ADHD组和正常对照组之间的年龄差异无统计学意义(>0.05)。
本实验研究通过了常州市第一人民医院伦理委员会批准。所有受试者均由监护人签署了知情同意书并自愿参加。
设备采用美国EGI公司128导联电极帽,标准10-10脑电采集系统,采样频率为500 Hz,电极阻抗在80 kΩ以下,参考电极使用平均参考。
实验范式来自经典的IowGambling任务范式。实验范式的内容如图1所示,实验开始,随着提示语的出现,屏幕上亮出2张牌,左边为圆点花纹牌,右边为垂直花纹牌,且2张牌分别对应于按键盒的“1”号和“4”号按键,每次试验可以随机选择其中的1张牌。当按下“1”号按键选择左边圆点花纹牌时,牌面翻转出现包含有2个笑脸的图片;当按下“4”号按键选择右边垂直花纹牌时,牌面翻转出现包含有1个笑脸的图片;笑脸图片出现后,紧接着会随机出现另1张图片(包括哭脸图片或空白图片)。其中左边2个笑脸图片出现后紧接对应的图片更倾向于坏的结果(失分多),对应图片有4种可能,包括:有4个哭脸、5个哭脸、6个哭脸的图片或空白图片;而相反右边一个笑脸图片出现后紧接对应的图片更倾向于好的结果(得分多),对应图片有2种可能,包括:1个哭脸的图片或空白图片。
实验采用加分制,翻牌后的图片决定得分结果。如果左边2个笑脸图片之后出现的是空白图片则加2分,若出现的是有4个哭脸的图片则减2分,若出现的是有5个哭脸的图片则减3分,若出现的是有6个哭脸的图片则减4分;如果右边1个笑脸图片之后出现的是空白图片则加1分,若出现的有1个哭脸的图片则不加分。每次图片呈现结束后均会有分数的统计,并返回分数值。被试会对得分反馈结果,给出对应的脑电反馈。
图1 实验范式
实验采用对比统计的方式,选择出具有代表性的最佳电极,得到对应的导联数据,可达到对数据进行降维的目的。电极选择方法主要分为3个步骤:首先,依次选择2个被试的相同编号电极,计算出电极对应脑电间的皮尔逊相关系数值;其次,根据皮尔逊相关系数值大小,将全部被试依次进行比较;最后,统计出相关系数值最大且占有率最高(>90%)的电极作为每个被试的最佳电极。电极选择方法的原理图,如图2所示。
方法依据的原理是:同一导联的脑电信号经多次叠加平均后可得到事件相关脑电位,因此同一类型的被试组在同一种刺激模式下,诱发出的脑电信号在相同编号导联间应具有一定相似性。而皮尔逊相关系数值大小可用于衡量2个导联脑电信号间的相似性(如:趋势、线性相关性等)程度,其值介于–1~1之间,数值越大表示相关性越高,反之脑电相关性较低的皮尔逊相关系数值也就越小[12]。皮尔逊相关系数的计算如下
其中,X和Y分别对应了通过某一电极所采集的时间序列,即离散变量;N为单个离散变量的总长度;ρx,y为所求的相关系数。
此外,实验过程中,为了避免外在因素干扰而导致的脑电不相关性错误,同时为了确保能够找出确定的最佳电极,在电极选择方法中考虑增加一个邻近电极相互比较的过程,即:处在同一脑区内的所有电极,及各自对应的相邻电极,其ERP具有相似性。同时,实验根据皮尔逊相关系数值对应的ERP相似性程度来进行划分,使用打分的方式来判断和选择电极。具体的划分情况见表1。
表1 脑电相关性自定义划分
实验采用EEGLAB工具箱预处理数据,具体操作步骤包括:低通滤波、高通滤波(0.1~30.0 Hz)、分段(–200~1000 ms)、人工伪迹检测、坏通道替换、叠加平均、参考点转换及基线校正(–200~0 ms)。经过滤波后的信号如图3(a)所示,经过伪迹检测、坏通道替换处理后的信号如图3(b)所示。
图3 脑电信号预处理
图3(a)中的经过滤波后的信号中有大量的伪迹和信号基线漂移问题;图3(b)通过伪迹检测、坏通道替换去除了信号中的伪迹、干扰。预处理后的信号可用于后续的信号特征提取。
首先,实验通过电极选择方法得到最佳电极,并选取最佳电极对应的潜伏期脑电。然后,从预处理的脑电信号中提取出均值、方差、峰值作为时域特征,使用傅里叶变换对时间序列进行频谱估计,通过计算傅里叶变换振幅谱的平均值,提取Theta波段功率、Alpha波段功率作为频域的特征。最后,将时频特征用于分类。
本研究使用支持向量机(support vector machine,SVM)、自适应增强(adaptive boosting, AdaBoost)、自举汇聚法(bootstrap aggregating,Bagging)、线性判别式分析(linear discriminant analysis,LDA)、反向传播(back propagation,BP)常规方法对脑电特征进行分类。首先将特征数据按照7∶3的比例划分为训练集和测试集;之后将训练集再划分为训练集和验证集,使用10折交叉验证确定最佳模型;最后在测试集上验证分类准确率,见表2。
表2 数据集
常规的分类算法各有优缺点,本研究将2种常规分类器的优势相结合,提出了新型组合分类器:LDA-SVM和BP-SVM,用于提高分类ADHD儿童与正常儿童脑电的准确率和分类效率。
(1) LDA-SVM。LDA又称为Fisher线性判别,属于监督学习判别方法,能够将高维脑电特征数据投射至更低维的矢量空间,达到对脑电特征进行降维处理的目的[13]。根据Fisher线性判别的思想,可通过求解最优化问题找出脑电特征数据的最佳投影矩阵,即
其中,()为Fisher准则,(·)试计算矩阵迹的函数,和分别为类间和类内散布矩阵。SVM方法则是通过非线性变换将脑电特征数据投射至高维特征空间,手动设定的参数少,非常便于使用。
组合分类器的步骤为:①使用LDA确定高维脑电特征数据的最优投影矩阵,对脑电特征进行降维处理;②将降维后的脑电特征矩阵输入SVM分类器,预测待分类数据。这种组合分类器通过LDA减少了部分脑电特征的空间,缩短了SVM的训练时长[14]。
(2) BP-SVM。BP网络改变了传统网络结构,其利用误差反向传播方式来调整神经元的权重,解决了之前非线性分类的问题。BP神经网络主要包含3个部分:输入层、隐含层和输出层。BP网络的每一层都会通过对比期望值计算出误差,然后将误差反向传播并逐层传递,并且同时不停地修改每层的权重。
BP-SVM组合分类器原理也与LDA-SVM类似,方法步骤如下:①应用BP神经网络提取特征,选择对分类ADHD儿童和正常儿童重要的脑电特征;②将经过选择后的脑电特征输入SVM分类器进行分类。该组合分类器方法避免了传统机器学习分类器对ADHD儿童和正常儿童脑电分类过程中的过学习、模型选择等问题。
研究采用基于赌博任务的“热”执行功能范式,根据电极选择方法,统计发现相关性最强的最佳电极主要位于前额叶和顶枕叶2个脑区,代表电极分别为8导联和74导联。
实验使用最佳电极,将所有被试组ADHD儿童和正常儿童的前额叶与顶枕叶脑区代表性电极对应的脑电经叠加平均后得到ERP波形,如图4所示。图4(a)和(b)分别为被试在失分较大的刺激模式下,前额叶脑区第8导联和顶枕叶脑区第74导联的ERP波形显示结果。图4(c)和(d)分别为被试在失分较少的刺激模式下,前额叶脑区第8导联和顶枕叶脑区第74导联的ERP波形显示结果。从图中可以看出,ADHD儿童和正常儿童在失分较大的情况下,其任务脑电均有较大振幅的反馈相关负波出现。而在失分较少时,其任务脑电同样会出现反馈相关负波,但振幅较小。实验说明,无论被试得分多少,ADHD儿童的任务脑电FRN均要比正常儿童更负。实验结果与已有研究结果相一致,FRN振幅要比正常组显得更大是由于ADHD儿童存在执行功能缺陷,在“热”执行赌博任务时往往会做出不利于自己的风险决策[15]。
本研究基于赌博任务的“热”执行功能范式提取了脑电时域特征(均值、方差、峰值)和频域特征(Theta波段功率、Alpha波段功率)。
对于提取的时频特征,首先使用传统分类器SVM、LDA、BP、Adaboost、Bagging分别对其进行分类,分类结果见表3。根据传统分类方法结果,可以发现BP算法的分类准确率最高,时域均值特征分类的准确率达到了81.35%;频域Alpha波段功率特征分类的准确率达到80.52%。
然后,将时域和频域的特征进行组合,利用新型组合分类器的方法(LDA-SVM、BP-SVM)对时频组合特征进行分类,分类结果见表3。从表中可以看出BP-SVM分类器的准确率为83.33%,而LDA-SVM分类器的准确率最高,达到88.88%。也说明分类组合方法用于多特征分类时具有明显优势,其分类正确率高于单特征的传统分类方法。
图4 “热”执行前额叶和顶枕叶脑区潜伏期ERP波形
表3 “热”执行功能分类结果(%)
最后,比较各个分类器的平均准确率和执行效率,见表4。采用频域特征的传统分类器算法性能要低于采用时域特征的算法性能(机器配置:i3-4170 3.7 Hz,Windows7 64,4 G内存,显卡:HD graphics 4400),传统分类器算法耗时较高,但同类特征间的算法耗时具有不确定性,组合分类器算法的性能比较适中。实验表明:分类器SVM、LDA、BP、Adaboost、Bagging需要手动选择脑电特征,并且其特征较为单一。而改进后的组合分类器可用于多特征的选择分类,特征选择无需人工干预,能自动学习特征,且准确率比单特征分类准确率更高。组合分类器中LDA-SVM分类准确率达到了88.88%,执行效率较BP-SVM耗时更少,更适用于本实验。
表4 “热”执行功能分类器的执行效率(s)
传统分类方法在脑电时域特征和频域特征上的分类结果差异明显,且受样本量和数据质量的影响较大。一方面,在少量样本的情况下,可能造成偶然性较大。使用单特征进行分类会造成分类准确率的不稳定,提取多个特征对数据进行表征,可以进一步降低分类过程中带来的风险。而在数据质量方面,可以考虑选择最佳电极,在达到数据降维的同时,得到有代表性且质量较高的脑电数据。在实验中发现,单特征分类存在不稳定性,单个数据的分类的准确性方差较大,而新的分类组合方法,能够使其达到一个稳定的数值,方差较小,而且算法性能较好,其准确率较高。
在相同的配置下(机器配置:i3-4170 3.7 Hz,Windows7 64,4 G内存,显卡:HD graphics 4400),常规的分类方法需要手动选择特征,只能对单一类型的特征进行分类,比较耗时。使用常规的SVM、LDA、BP分类器对单一类型特征进行分类,最低耗时也需360 s。而使用组合分类器可以对多类特征进行选择分类,且分类效率更高,其中BP-SVM对所有5类特征进行选择分类耗时为430 s,LDA-SVM耗时更少为395 s。
改进的组合分类方法可以自动学习特征,其包含更多的隐含信息,有助于提高分类准确率。但是组合分类方法是基于大样本数据建立的统一训练模型,更适合处理大样本数据,而ADHD儿童脑电数据的采集和获取有一定困难,建立大样本ADHD儿童脑电数据库是目前科研的一个重要任务。
本研究采用基于赌博任务的“热”执行功能范式,使用皮尔逊相关系数进行电极选择,并通过分类组合算法结合脑电多特征进行分类,与各传统分类器在脑电单特征分类方面进行对比。LDA-SVM方法将分类准确率提升至88.88%,虽然比目前最新的结论有所不足,但从脑机接口的角度给出了目前能达到的最优解,为后续脑电采集设备的简化提供了理论依据。研究初步认为,分类组合方法有助于ADHD儿童的多特征分类,为ADHD儿童个体诊断技术提供了可能,而且能够有效地使用在基于脑机接口ADHD神经反馈康复,达到较好的实时反馈效果。
[1] 邹凌, 严永, 杨彪, 等. 基于同步EEG-fMRI采集的情绪认知重评数据特征融合分析研究[J]. 自动化学报, 2016, 42(5): 771-781. ZOU L, YAN Y, YANG B, et al. Feature fusion analysis of simultaneously recorded EEG-fMRI in emotion cognitive reappraisal[J]. ACTA Automatica Sinica, 2016, 42(5): 771-781 (in Chinese).
[2] 程时伟, 周桃春, 唐智川, 等. CNN实现的运动想象脑电分类及人-机器人交互[J]. 软件学报, 2019, 30(10): 3005-3016. CHENG S W, ZHOU T C, TANG Z C, et al. Classification of motor imagination EEG and human-robot interaction based on CNN[J]. Journal of Software, 2019, 30(10): 3005-3016 (in Chinese).
[3] ÖZTOPRAK H, TOYCAN M, ALP Y K, et al. Machine-based classification of ADHD and nonADHD participants using time/frequency features of event-related neuroelectric activity[J]. Clinical Neurophysiology, 2017, 128(12): 2400-2410.
[4] DU J Q, WANG L P, JIE B, et al. Network-based classification of ADHD patients using discriminative subnetwork selection and graph kernel PCA[J]. Computerized Medical Imaging and Graphics, 2016, 52: 82-88.
[5] WANG Y, GAO S, GAO X. Common spatial pattern method for channel selelction in motor imagery based brain-computer interface[C]//2005 IEEE Engineering in Medicine and Biology 27th Annual Conference. New York: IEEE Press, 2006: 5392-5395.
[6] ARVANEH M, GUAN C T, ANG K K, et al. Optimizing the channel selection and classification accuracy in EEG-based BCI[J]. IEEE Transactions on Biomedical Engineering, 2011, 58(6): 1865-1873.
[7] LI W, ZHOU T, ZOU L, et al. Identification of attention deficit/hyperactivity disorder in Children using multiple ERP features[J]. Current Bioinformatics, 2018, 13(5): 501-507.
[8] ZELAZO P D, MÜLLER U. Executive function in typical and atypical development[J]. Child Neuropsychology, 2002, 445-469.
[9] CASTELLANOS F X, SONUGA-BARKE E J S, MILHAM M P, et al. Characterizing cognition in ADHD: beyond executive dysfunction[J]. Trends in Cognitive Sciences, 2006, 10(3): 117-123.
[10] CRONE E A, RICHARD JENNINGS J, VAN DER MOLEN M W. Sensitivity to interference and response contingencies in attention-deficit/hyperactivity disorder[J]. Journal of Child Psychology and Psychiatry, 2003, 44(2): 214-226.
[11] MUSHTAQ F, BLAND A R, SCHAEFER A. Uncertainty and cognitive control[J]. Frontiers in Psychology, 2011, 2: 249.
[12] GAO J, WANG W, ZHANG J. Explore interregional EEG correlations changed by sport training using feature selection[J]. Computational Intelligence and Neuroscience, 2016, 30: 1-10.
[13] SUBASI A, ISMAIL GURSOY M. EEG signal classification using PCA, ICA, LDA and support vector machines[J]. Expert Systems with Applications, 2010, 37(12): 8659-8666.
[14] ZHANG L, ZHOU W D. Fisher-regularized support vector machine[J]. Information Sciences, 2016, 343-344: 79-93.
[15] GONG J B, YUAN J J, WANG S H, et al. Feedback-related negativity in children with two subtypes of attention deficit hyperactivity disorder[J]. PLoS One, 2014, 9(6): e99570.
Study on the extraction and classification of EEG characteristics in ADHD patients based on Pearson’s optimal electrode selection
ZOU Ling1,2, WU Fan1,2, BI Hui1,2, TIAN Bo-fan1,2, SONG Zhi-wei1,2, WANG Su-hong3
(1. Faculty of Information Science & Engineering, Changzhou University, Changzhou Jiangsu 213164, China; 2. Changzhou Key Laboratory of Biomedical Information Technology, Changzhou Jiangsu 213164, China; 3. Brain Science Research Center, the Third Affiliated Hospital of Suzhou University, Changzhou Jiangsu 213003, China)
Event-related potential (ERP) can be used for EEG feature extraction and classification for children with attention deficit hyperactivity disorder (ADHD) and normal children. Firstly, the EEG signals of two kinds of children were collected by the gambling task paradigm. Secondly, the optimal electrode was selected based on the Pearson correlation coefficient algorithm, and the optimal electrode EEG signal was preprocessed. Then, time domain features (mean, variance, peak) and frequency domain features (Theta band power, Alpha band power) of pre-processed EEG signals were extracted. Finally, traditional classification methods (Support Vector Machine (SVM), Adaptive Boosting (AdaBoost), Bootstrap Aggregating (Bagging), Linear Discriminant Analysis (LDA), Back Propagation (BP) and combined classifier classification methods (LDA-SVM, BP-SVM) were used to complete the classification of two kinds of EEG signals. The results demonstrate that the classification accuracy of traditional BP classifier was up to 80.52% and that of the combined classifier was up to 88.88%. The combined classification method can improve the classification accuracy for ADHD children and provide technical support for ADHD neurofeedback rehabilitation treatment based on the BCI technology.
event-related potential; Pearson correlation coefficient; gambling task paradigm; EEG classification; brain-computer interface
TP 183
10.11996/JG.j.2095-302X.2020030417
A
2095-302X(2020)03-0417-07
2019-11-26;
2020-02-23
江苏省科技厅社会发展项目(BE2018638);江苏省“333高层次人才培养工程”项目;常州市社会发展项目(CE20195025);常州大学科研项目(ZMF18020322);江苏省教育厅首批中外合作办学平台联合科研项目;江苏省研究生培养创新计划项目(KYCX20_2552,KYCX20_2559)
邹 凌(1975-),女,辽宁辽阳人,教授,博士,硕士生导师。主要研究方向为生物电信息处理与模式识别、自动控制。 E-mail:zouling@cczu.edu.cn