基于MPE-ANN-SVM的癫痫脑电检测分类研究*

2022-02-03 07:02石雨菲王瑶胡珊田翔华陈子怡周毅
生物医学工程研究 2022年4期
关键词:电信号分类器癫痫

石雨菲,王瑶,胡珊,田翔华,陈子怡,周毅△

(1.中山大学 中山医学院,广州 510080;2.中山大学 生物医学工程学院,广州 510006;3.新疆医科大学 医学工程技术学院,乌鲁木齐 830011;4.中山大学附属第一医院,广州 510080)

引言

癫痫(Epilepsy)是一种由大脑神经元集群高度同步化异常放电引起的反复性发作的神经系统疾病[1],严重影响患者正常生活。目前癫痫患者在全球范围内近6 500万[2-3],其中约有30%的癫痫患者无法通过药物治疗得到有效控制,被称为药物耐受性癫痫患者[4-5]。在药物耐受性癫痫患者中,有25%可以通过致痫灶切除术进行治疗[5-6],部分患者可接受生酮饮食或神经调控,而其余癫痫患者的发作性症状尚无任何合适的治疗手段可以控制[7]。

脑电信号(electroencephalography,EEG)是记录大脑电活动的无创方式,能够监测癫痫发作时大脑的异常放电现象,对其发作进行预测[8]。利用计算机技术分析EEG信号实现癫痫发作的检测研究,可有效辅助医生对药物耐受性癫痫患者进行治疗和控制,对临床癫痫治疗具有重大意义[9-10]。然而现有模型泛化性及鲁棒性不足,且对于临床真实数据的研究不够深入。为缓解上述问题,本研究利用多尺度排列熵、人工神经网络与支持向量机方法设计MPE-ANN-SVM模型应用于癫痫脑电分类。该模型使用多尺度排列熵[11]与人工神经网络来提取脑电信号特征,使用支持向量机[12]和人工神经网络[13]两种机器学习算法对提取到的特征进行分类。

1 方法

1.1 多尺度排列熵

多尺度排列熵为多个尺度下的排列熵,能够反映信号随机性与复杂性[14]。多尺度排列熵的计算方式为:将长度为N的时间序列X=(x1,x2,x3…,xn),经过粗粒化后,求其排列熵[15]。具体的计算步骤如下[16]:

对时间序列X=(x1,x2,x3…,xn)粗粒化处理,得到

(1)

其中,j=1,2,…,[N/s],[N/s]为N/s向下取整,s为尺度因子。

对粗粒化后得到的序列重构有:

Yl(s)={yl(s),yl+1(s),…,yl+(m-1)λ(s)}

(2)

其中,m为嵌入维数,λ为延迟时间,l为重构分量且l=1,2,…,N-(m-1)λ。

将式(1)-(2)升序排列,每一个粗粒化序列都 能得到一组新的序列s(v)=(l1,l2,…,lm),其中v=1,2,…,V。V≤m!,s(v)的数目与重构序列m!的数目一致。

计算不同尺度下的排列熵:

(3)

其中,pv为第v次符号序列出现的概率。

(4)

HP的值越小,该时间序列越有序,脑电信号复杂性降低;值越大时,该时间序列的规律性越弱,脑电信号复杂性升高。

1.2 人工神经网络分类器

人工神经网络是由具有适应性的简单神经元组成的广泛并行互连的网络,能够模拟生物神经系统对真实世界物体所作出的交互反应[17]。神经元作为神经网络的基本组成单元,具有沟通信息的作用[18]。神经元结构见图1。

图1 神经元结构示意图

感知机是由一个神经元组成的模型,而多个神经元交织在一起则生成神经网络模型。神经元的主要参数是权重矩阵和偏置矩阵,网络学习过程就是不断更新神经元内部的参数,使其输出预测值与实际值之间的误差尽可能小[19]。

神经网络一般由三个部分组成:输入层(Input Layer),隐含层(Hidden Layer),输出层(Output Layer)。其中输入层负责接收外部信息;隐含层则是神经网络的核心,负责对输入层接收到的信息进行学习,并且在学习过程中不断更新权值(Weight)和偏置(Bias);输出层负责输出结果[20]。

将输入层X=(x1,x2,x3,...,xn)和权重矩阵W=(ω1,ω2,...,ωn)两者相乘并加上偏置函数b之后,输入隐含层中,可以得到非线性激活函数σ,计算公式如下:

(5)

输出Y在非线性函数激活之前的步骤仅为线性组合,对于复杂问题难以找到合适的最优解,而非线性更接近客观事物性质本身,能够表达变量间的相关性,因此,引入非线性函数可得到模型最优解。通过使用非线性函数,可将数据特征映射至一个非线性系统,得到更多的原始信息,由输出层得出:

Y=σ(v)

(6)

1.3 支持向量机分类器

支持向量机(support vector machine,SVM)是Cortes和Vapnik于1995年对线性分类器提出的一种最优准则设计[21-22]。SVM能够较好地解决小样本、高维性等问题,其基本思想可以总结为:在特征空间内寻找一个用于分类样本的最佳超平面,该平面可正确分类样本,同时也能使得各样本集距离该平面的间隔最大,分类器的泛化性能也因此特性较好[23]。具体算法如下[24]:

用一个维度为n的向量x来表示数据点,用y取值-1或1将两种类别区分开来。区分的平面其方程可以表示为:

wTx+b=0

(7)

基于该平面将两类数据分隔,定义函数f(x)为:

f(x)=wTx+b

(8)

若f(x)=0,数据点的位置刚好在超平面上;f(x)<0,则对应y=-1的数据点;f(x)>0,则对应y=1的数据点。根据上述规则选择完最优分类面后,使用新数据测试分类效果。测试时,定义f(x)为:

(9)

式中,λi为拉格朗日因子,且满足条件λi≥0和yi(w,φ(xi)+b)=1。K(xi,x)为核函数。

2 实验

2.1 实验数据集

实验数据来自于新疆某三甲医院神经科脑电图室的癫痫患者。患者入组严格遵循部分性(发作)癫痫患者的入组标准。所采集的癫痫患者处于静卧状态来减少肢体活动对脑电信号的干扰。数据采集设备为尼高力(NicholetOne)脑电图机。脑电数据为24长程视频头皮脑电图,用双极导联法同步记录22导波形。数据采样频率为500 Hz。相关癫痫发作事件起始已在脑电数据中由经验丰富的临床专家进行标注。本次实验数据信息见表1。

表1 实验数据信息说明

本次实验样本包含13名患者,其中4名男性患者,9名女性患者,患者的年龄区间跨度为6~51岁,能够增强模型的泛化能力。本次实验脑电图记录的总持续时间在360 h左右,数据中的癫痫发作起始点和终止点由临床癫痫专家所标记。13位患者共计159次发作,平均每人发作12次。选取完数据后,经过计算,可得发作期的持续时间为9 960 s(166 min左右)。

经研究表明,由于发作前期无固定的时间选择,发作前期数据一般由人为设置,一些研究选择固定发作前期持续时间为20~90 min,本研究将发作前期脑电数据定为发作前半个小时的脑电信号。对于发作期数据的选取,根据临床专家标注的癫痫脑电数据,选取发作期脑电数据全集。最后形成分类的初步样本库。

2.2 实验过程

2.2.1实验设计概述 本研究设计的检测结构见图2。先由2.1中所述的患者信息提取原始脑电信号,得到数据集A。基于数据集A,使用多尺度排列熵提取信号特征,最终得到非线性数据集A1,该数据集包括5 457条发作前期信号特征和3 876条发作期信号特征。使用一个随机数函数,随机提取2 000条发作前期数据集A2-1和2 000条发作期数据集A2-2作为训练样本库,训练模型。剩余数据为测试数据样本库。

图2 自动检测识别分类结构

2.2.2多尺度排列熵特征值提取 为提高模型准确率,获取脑电信号的有效特征,本研究对信号采取进一步处理,将计算非线性动力学特征指标的数据跨度设置为5 000个点,每10 s滑动提取一次特征值。同时对于不足5 000个点的数据,设置为1 000个点的方式提取,而超出5 000个点的数据则进行分段提取。本研究选取多尺度排列熵来获取癫痫的非线性动力学特征。

患者在癫痫发作过程中,神经元集群会大量同步放电,使得原本复杂的脑功能有着不同程度的抑制[25]。经实验验证发现,从发作前期到发作期,多尺度排列熵表现为有不同程度的陡升陡降。本研究通过提取1号患者T3、T5、P3、O1导联上的一次发作过程信号来描述多尺度排列熵在发作过程中的变化情况(见图3)。

图3 多尺度排列熵在发作过程中的变化规律Fig.3 Variation rule of multi-scale permutation entropy during seizure

最终,经过特征提取得到5 457条发作前期信号特征和3 876条发作期信号特征。

2.2.3模型训练 由于SVM具有较好的泛化能力,而ANN不仅能够有效提取信号特征,还具有更好的鲁棒性,因此,本研究结合SVM与ANN提出一种新型网络结构以实现癫痫的检测识别,该模型具体的网络参数信息见表2。

表2 ANN+SVM网络结构

将传统神经网络的输出层改为SVM,即将经过一次线性变换的数据送入SVM分类器中。经实验发现,使用一层简单Dense层的结果最优。

基于2.2.1中给出的自动检测识别模型,将经多尺度排列熵提取特征值后的全导联数据集A2-1和A2-2输入至表2中的网络进行训练,即2个22×2 000的数据集。从第2层Dense层后,将176×2 000维的数据取出为A3,再将A3放入SVM分类模型训练。将神经网络中的训练轮次设为60次后,送入SVM分类器中进行测试。结果显示,模型准确率能够达到94.85%。ANN层学习过程见图4。

图4 ANN中间模型 Fig.4 ANN intermediate model

2.3 评价指标与实验结果

为验证MPE-ANN-SVM模型的有效性及优越性,研究用敏感性(sensitivity,Sen)、特异性(specificity,Spe)与识别准确率(accuracy,Acc)三个参数作为评价指标。其中,Sen用于评价模型对发作期脑电数据的识别能力,Spe用于评价模型对发作前期脑电数据的识别能力[26],Acc用于评价测试数据与标注数据间的接近程度。具体公式表示如下:

(10)

其中,TP为真阳性,FP为假阳性,TN为真阴性,FN为假阴性。

为验证本研究算法的泛化性能,探究不同方法对算法的影响,本研究将多个方法进行拆分,采用消融实验来验证各方法对 MPE-ANN-SVM 的贡献,验证结果见表3。

表3 分类检测结果对比Table 3 Comparison results of classification detection

由表3可知,与单一的分类器相比,由于有效地结合了神经网络分类器能提取更多有效信息和支持向量机泛化性能较好的优点,MPE-ANN-SVM模型具有更高的识别准确率、敏感率及特异率,能够更好的应用于癫痫诊断。

3 结论

本研究基于MPE方法、ANN及SVM分类器设计了一种能够有效实现癫痫分类识别的MPE-ANN-SVM模型。经验证,该模型不仅具有良好的泛化性能及鲁棒性,还能得到较好的识别准确率。其中,MPE方法能够更好地提取原始脑电信号特征,ANN与SVM分类器具有较好的检测识别性能,三种方法相结合能够提高癫痫的识别效果。为提高模型准确率,本研究在实验数据集上进行了部分处理,但研究仍是针对小群体患者进行,缺乏大量对比数据,后续还需加入更多的癫痫患者数据,丰富数据集并优化算法模型,得到更加丰富的特征,同时提高模型性能。

猜你喜欢
电信号分类器癫痫
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于Code Composer Studio3.3完成对心电信号的去噪
基于随机森林的航天器电信号多分类识别方法
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
玩电脑游戏易引发癫痫吗?
癫痫共患ADHD儿童的生态学执行功能
左氧氟沙星致癫痫持续状态1例
基于层次化分类器的遥感图像飞机目标检测
一种基于置换的组合分类器剪枝方法