基于共空间模式与决策树支持向量机的运动想象脑电信号分类

2023-11-13 07:53:24耿晓中岳梦哲汪林恩户唯新
软件工程 2023年11期
关键词:电信号决策树特征提取

张 茜, 耿晓中, 岳梦哲, 汪林恩, 户唯新

(1.吉林化工学院信息与控制工程学院, 吉林 吉林 132022;2.长春工程学院计算机技术与工程学院, 吉林 长春 130012)

0 引言(Introduction)

脑机接口(Brain-Computer Interface,BCI)是一种将大脑与外部驱动设备直接通信的创新技术[1-2]。在BCI系统中,常见特征提取方法有独立分量分析、自回归模型、经验模态分解、功率谱密度及共空间模式[3]。常用分类方法包括线性判别分析、Adaboost、神经网络及支持向量机[3]。

目前,学者们提出了很多有用的识别方法改善脑机接口的分类精度,例如马丽英等[4]提出基于局部均值分解(LMD)、共空间模式(CSP)及随机森林的EEG分类方法,通过LMD算法将EEG分解成N个乘积函数(PF)分量,最佳频段的PF分量会被CSP进行特征选择,最后输入随机森林中进行分类,该方法侧重提取差异性明显的特征而忽视了其他有效特征。冯建奎[5]提出一种基于共空间模式算法(Common Spatial Patterns,CSP)和梯度提升决策树(Gradient Boosting Decision Tree,GBDT)的运动想象脑电模式识别方法,首先利用CSP获取EEG特征,其次通过Lasso算法选择明显的特征向量,最后利用梯度提升决策树进行识别分类,但该方法的分类准确率不高。李丽君[6]提出基于运动想象的EEG特征提取及分类算法,首先利用CSP对脑电信号进行特征提取,其次将提取的特征输入决策树支持向量机中分类。刘宝等[7]提出基于PSO-CSP-SVM的EEG特征提取及分类方法,首先通过粒子群优化算法获取EEG最佳时频段,其次使用一对多CSP进行特征提取,最后利用支持向量机对提取的特征进行分类,但该方法得到的分类准确率稳定性不高。综上所述,为解决上文分类准确率不高等问题,本文提出一种基于CSP与决策树支持向量机法相融合的脑电信号分类方法,该方法能够有效地提高脑电信号的分类准确率。

1 算法原理(Algorithm principle)

1.1 共空间模式算法

共空间模式算法(Common Spatial Patterns,CSP)是用于脑电信号分类和特征提取的常用技术,多被应用于脑机接口系统中[8-9]。CSP算法旨在通过选择投影矩阵,将脑电信号投影到一个新的空间,使得在新空间中不同类别的脑电信号的方差差异最大化,从而增强不同类别脑电信号的可分性,具体步骤如下。

(1)设每次实验运动想象数据为Ej,对左手和右手两类运动想象数据分别计算对应的协方差矩阵,分别用CK和CL表示,可得到标准的混合空间协方差:

(1)

C=CK+CL

(2)

(2)根据奇异值知识C可以表示如下:

C=AλA′

(3)

其中:矩阵A代表总协方差的特征向量,它表示数据特征的主要方向;而矩阵λ是一个对角矩阵,其中包含非零特征值,这些特征值按照递减的顺序排列在对角线上,反映了特征的重要性;在此基础上,引入白化矩阵P:

(4)

(3)协方差矩阵可变换如下:

SK=PCKP′

(5)

SL=PCLP′

(6)

(4)因为SK和SL有公共特征向量,设:

(7)

其中:I为单位矩阵;D为特征向量,可以表示为D=[D1,D2,…,DN]。

(5)求出投影矩阵W,原始脑电信号经过空域滤波器的投影获取新的矩阵及特征向量:

(8)

其中:j=1,…,2n;Zj表示投影后得到的新矩阵;fj表示特征向量。

1.2 支持向量机法

支持向量机(Support Vector Machine,SVM)是一种基于监督学习的二分类模型,该模型在具有复杂决策边界的数据集上的表现非常出色[10]。SVM的核心思想是找到一个最优的超平面,可以有效地分开不同类别的数据点,同时最大化边界(即两个类别之间的最小距离)。zi∈{-1,1}表示分类标签,判别函数表示如下:

zi[(v·xi)+y]-1≥0,i=1,2,…,n

(9)

最优问题采用Lagrange乘子方法求解,则最佳决策函数如下:

(10)

其中:N为支持向量的个数,αi为Lagrange乘子。

将松弛项ξi≥0添加到公式(10)中,则可变形如下:

zi(v·xi+y)-1-ξi≤0,i=1,…,n

(11)

利用二次规划使目标函数最小化,即

(12)

公式(12)中的C表示惩罚因子,将最小化后的目标函数通过非线性知识转换为求线性问题,从而求得最优分类面,最优分类界面函数表达如下:

(13)

公式(13)中,K(xi,x)为内核函数,内核函数必须满足Mercer定理的要求。支持向量机选择的内核函数不同,会导致得到的分类效果不同。多项式核函数、径向基核函数以及线性核函数常常被当作支持向量机的内核函数,径向基核函数如下:

K(xi,x)=exp(-η‖xi-x‖2)

(14)

核函数η及惩罚因子C是干扰支持向量机分类性能的两个关键参数。

1.3 决策树法

决策树法(Decision Tree)是一种常见的机器学习算法,主要用于分类和回归任务,它是一种基于树状结构的模型,通过对数据的特征进行逐步划分,最终生成一个可以用于决策的树形结构[11]。决策树的基本思想是从根节点开始,通过一系列的分支节点对数据进行分类或预测。一个分支节点对应一个特征,分支的不同路径代表该特征的不同取值,而每一个叶节点则代表一个分类标签或回归值。在构建决策树的过程中,算法会根据相应准则选择最佳的特征和分割点,使得数据在每个分支中尽可能地纯净(即同类别的样本尽量聚集在一起)。信息增益(ID3)是决策树用于衡量特征贡献程度的算法。设一个集合为D,则第i类样本占该集合的比例为pi(i=1,2,…,n),信息熵E(D)表示如下:

(15)

假设m是离散属性b的结果,通过属性b切分后,集合形成m个节点,第m个节点标记为Dm,则属性m划分集合D得到的信息增益G(D,b)如下:

(16)

其中,G(D,b)越大,代表划分属性的效果越好。

1.4 基于DTSVM的脑电信号分类

基于决策树的SVM多类分类方法被认为是目前解决多类识别问题的最优方法。支持向量机算法实际上是基于多个决策树分类器的集成。在每个决策树给出其分类结果后,采用简单投票法决定最终的输出结果。可对四类问题(左手、右手、舌头和脚)进行分类,决策树支持向量机算法结构如图1所示。

图1 决策树支持向量机算法结构Fig.1 Algorithm structure of DTSVM

算法流程如下:①首先,对原始的训练特征集D执行有放回的随机选取,得到子数据集,标记为b;②考虑到子数据集b含m个特性,每当决策树的节点需要划分时,就从这些特性中随机选择m个作为可能要划分的属性;③从所选的m个属性中,计算每一个属性的信息增益,并选择增益最高的属性进行划分;④继续按以上方法划分每个节点,直到决策树能够正确分类训练数据集D中的样本,或者所有的属性已经被使用;⑤反复执行以上流程,构建一系列的决策树,最终组合成支持向量机模型。

2 实验数据描述(Description of experimental data)

实验采用的数据来自BCI Competition Ⅲ中的Datasets Ⅲa数据集。实验步骤如下:被测试人员坐在椅子上且保持安静和放松状态,t=2 s时,会给出一个警示铃声,并且电脑大屏上会显现一个符号“+”,表示实验开始,t=3 s时,大屏上会随机显现向左、向右、向上或向下的箭头,被测试者按照箭头指示的方向依次进行运动想象(左手、右手、舌头或脚),直到t=7 s时,“+”符号在大屏上消失。本次实验共安排了3名被测试者,共进行240次实验。实验采集导联为60个电极,250 Hz采样,电极位置如图2所示。

图2 电极位置Fig.2 Position of electrodes

3 脑电信号处理结果及分析(EEG signal processing results and analysis)

3.1 特征提取

本文实验在Windows 11.0系统的MATLAB 2021a软件平台上进行,利用EEGLAB软件工具包对已有竞赛数据集进行脑电信号的分析。

图3为原测试运动想象信号(截取6~10.5 ms时间段的信号)。

图3 原测试运动想象信号Fig.3 Original test signal

通过CSP特征提取方法处理脑电信号数据,并将数据在二维空间中进行可视化以展示不同类别(左手和右手)之间的差异。横坐标和纵坐标分别表示CSP特征空间中的两个维度,原始脑电测试信号被CSP特征提取后转变为二维特征问题,CSP特征提取图如图4所示。

图4 CSP特征提取图Fig.4 CSP feature extraction diagram

3.2 脑电信号分类

线性判别分析法(LDA)和自适应增强分类法(Adaboost)是脑电信号分类常用的方法[12]。线性判别分析是一种基于监督学习的降维方法,核心思想是分类间隔最大化,也就是将数据通过投影映射到低维样本上,相同的类样本靠近,不同的则远离。Adaboost算法属于集成算法的一种,弱弱则强是其主要思想。

在本实验中,从240次实验中的每一类(左手、右手、舌头和脚)中共选取90次作为测试样本,剩余的150次实验作为训练样本。决策树的数量对支持向量机的分类结果有影响,为了提高脑电信号的分类准确率,查看不同数目决策树下的分类准确率,决策树与分类准确率关系图如图5所示。

图5 决策树与分类准确率关系图Fig.5 Relationship diagram between decision tree and classification accuracy

从图5中能够看出,当决策树数量为50棵及更多时,EEG的分类准确率可以达到最优,由于脑电信号处理过程还受到算法运算耗时等因素的影响,所以最终选用决策树为50棵,后续实验也都采用这个结果。

在预处理及特征提取条件不变的情况下,同时对测试样本进行LDA、Adaboost及DTSVM分类法分类。分类准确率的计算如下:

Accuracy=分类正确的实验次数/总实验次数

(17)

对被测试者K3b、K6b、L1b分别进行DTSVM与LDA、Adaboost的分类,其分类准确率结果如表1所示。

表1 不同分类方法的分类准确率结果

通过对本文方法与LDA及Adaboost分类法进行对比,从三种分类法的分类精度结果能够看出,基于决策树支持向量机法优于线性判别分析法和自适应增强分类法,并且其准确率最高时可达到90%以上。

4 结论(Conclusion)

针对脑电信号采集易受干扰导致EEG分类准确率不高的问题,提出一种基于CSP与DTSVM的运动想象脑电信号分类方法。首先利用CSP算法对运动想象的EEG特征值进行特征提取,其次利用决策树支持向量机法对四类运动想象(左手、右手、舌头和脚)特征值进行分类。实验结果表明:CSP与决策树支持向量机法融合后的分类准确率最高可达92.52%,结果优于传统单一分类算法,为更进一步研究脑电信号处理算法的多种融合提供了可能。

猜你喜欢
电信号决策树特征提取
基于联合聚类分析的单通道腹部心电信号的胎心率提取
一种针对不均衡数据集的SVM决策树算法
基于Code Composer Studio3.3完成对心电信号的去噪
科技传播(2019年24期)2019-06-15 09:29:28
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
基于随机森林的航天器电信号多分类识别方法
Bagging RCSP脑电特征提取算法
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于MED和循环域解调的多故障特征提取