深度集成网络在癫痫预测中的应用研究

2022-08-10 08:12杨泽鑫朱晓军
计算机应用与软件 2022年7期
关键词:特征提取癫痫卷积

杨泽鑫 朱晓军

(太原理工大学信息与计算机学院 山西 太原 030024)

0 引 言

癫痫(epilepsy)是一种精神类疾病,因其反复发作的特性,被认为是常见慢性病的一种。据世卫组织统计,全世界的癫痫症患者约为5 000万[1]。因此需要构建灵敏度高、误诊率低的癫痫发作检测算法,从而为患者个人及其家人提供预测癫痫发作的有效手段。起初对于癫痫发作预测的研究以对脑电图(Electroencephalogram,EEG)进行手工特征提取结合传统分类器来完成[2-3]。而随着深度神经网络的发展,以卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent Neural Network,RNN)为代表的方法也被陆续运用在癫痫脑电的特征提取与发作预测中。

文献[4]使用改进的Lyapunov指数作为脑电片段的特征输入到人工神经网络进行分类,相比原始最大Lyapunov指数在识别发作前期状态上具有更高的准确性。文献[5]使用卷积神经网络对多通道EEG进行直接分类,相比手工特征方法在特异性上有明显提升。文献[6]使用四种不同组合的深度学习模型提取癫痫发作区分度最高的特征,并通过迁移学习改善模型的学习效率。

基于人工特征的分析方法人为对信息进行压缩,损失部分特征。而普通的CNN往往直接对脑电信号进行处理,忽略了脑电信号本身的特点,计算效率在层数提升时遭遇瓶颈。本文提出集成抗锯齿滤波器和多尺度卷积单元的卷积-循环神经网络模型,在维持平移不变性的基础上,以深层结构对脑电信号的空域、频域和时域信息进行有效提取,克服传统深度学习在信号处理和计算效率上的问题。

1 循环卷积癫痫预测算法

1.1 问题定义

癫痫症患者的脑电记录可按癫痫发作分为两部分,癫痫发作间期和癫痫的发作期(Seizure Occurrence Period,SOP)。癫痫发作间期为患者的正常时期,癫痫发作期为患者表现出癫痫症的时期。癫痫预测算法的目标是在癫痫发作前的一个时间段内做出癫痫将要发作的判断,此时间段称之为癫痫预测范围(Seizure Prediction Horizon,SPH)。有效合理的SPH应满足一些条件:(1) SPH应与SOP间有足够长的间隔,以便医生、患者有足够的时间采取措施抑制癫痫的发作;(2) 做出预测的时刻距SOP开始的时刻不宜过长。过长的间隔在带给患者不必要恐慌的同时,也给预测造成了比较多的困难。通过阅读相关的文献,本文划定SPH的范围是从癫痫正式发作的30分钟前开始,到癫痫正式发作5分钟前为止的时间,如图1所示。

图1 癫痫不同阶段状态图

癫痫发作预测涉及的脑电片段分为三类:第一类为发作间期,因为后续无癫痫发作的倾向所以作为数据集中的阴性样本;第二类为发作期前30分钟到5分钟,属于发作预警产生的合理时间,被视为阳性样本;最后一类是SOP前5分钟到癫痫发作开始的时刻这段时间。虽然该时段属于癫痫发作前的时间范围,但与癫痫发作距离过近,无实际使用价值。本文将癫痫的预测问题转化为分类问题,当判断输入片段属于SPH阶段时则作出癫痫发作预警,表明该患者在30分钟内会出现癫痫发作。

1.2 脑电信号空间投影

为了利用脑电信号中包含的空间状态信息,本文使用Bashivan等[7]提出的等距空间投影方法,通过将多通道脑电信号转化为二维图像数据以使神剧集成网络可以有效利用空间信息。方法的第一步是将探测电极的三维坐标投影到2D平面上。以大脑头皮顶端作为中心位置,根据到中心点的距离和方位角,计算出电极在二维平面上对应位置坐标;第二个步骤是将输入信号中的不同频段(0-7、7014、14-49赫兹)的频域特征映射到RGB的3个通道中为投影值;最后使用三次插值对每个电极在三个频带段上的投影值进行插值以生成完整图像。执行完上述操作后,输入的脑电信号将转化为形如(3×256×256)的图像。图像的3个颜色通道分对应三个频段(每个频带1个),图片的高度和宽度均为256像素。部分投影后的脑电图像如图2所示。

图2 脑电信号转化图片示意

1.3 空频域特征提取器

传统的卷积网络在处理脑电数据时存在两方面的问题。一方面卷积层中的下采样造成模型平移不变性的损失;另一方面深度神经网络的计算效率不高。针对上述的问题,本文提出使用结合模糊池化、模糊卷积和多尺度并行卷积结构的空频特征提取器,减轻平移不变性的损失,在增加模型深度的同时减少计算量的开销,使模型对脑电信号拥有更好的适配性。

经典卷积神经网络是受人类视觉机理启发从而构建出的深度神经网络模型。已有大量的相关文献和综述表明CNN在医疗诊断相关的计算机视觉任务上能取得良好的效果[8-9]。搭配有卷积层和池化层的结构有能力自发从图形数据上抽取出决定分类的关键特征。

在图像处理任务中,二维卷积网络由一系列的非线性单元组成,整个网络的状态方程由式(1)描述。

Bj-i(uj(t))+Ii(t)

(1)

对于每个单元i的相关的状态xi(t)会受到每个单元输出的yj(t)的影响,而每个单元的输入将通过函数Aj-i进行处理,Bj-i则代表模型的偏差量。

1.3.1模糊卷积与模糊池化

在池化层和跨步卷积层中的下采样操作对模型的平移不变性造成影响。本文提出使用抗锯齿过滤器对输入数据进行平滑,减少平移不变性的损失,增强网络的捕获脑电特征的能力。

(1) 最大池化转换为模糊池化(BlurPooling)。考虑一组一维信号如[0,0,1,1,0,0,1,1]。当将池化窗口设置为尺寸等于2、步长等于2的状态时,原始信号经过最大池化层将得到[0,1,0,1]的序列。待元数据进行一次右移,以循环数据的形式补齐后得到如[1,0,0,1,1,0,0,1]的信号序列。当此信号再次通过最大池化层,将得到[1,1,1,1]的结果。对比两次的结果可知,传统的最大池化层会造成平移不变性的损失。

从原理角度上看,最大池化层执行的计算分为两个部分,一部分是窗口尺寸为2,步长为1的求最大值操作;另一部分是步长为2的下采样操作。求取最大值的操作保持着平移不变性,因为计算流程只是单纯随着滑动窗口求取最大值,不改变数据本身的分布性质。但是下采样对数据的选择给模型带来平移不变性的损失。为了缓解因直接下采样带来的问题,创新地提出在下采样操作和最大池化操作中加入一个抗锯齿滤波器以构成模糊池化层。将平移前后的数据再输入到模糊结构后,将分别得到[0.5,1.0.5,1]和[0.75,0.75,0.75,0.75]的两组结果。与原结果对比后可以看出,抗锯齿滤波器弥合了输入数据平移所带来的影响,让得到的两组结果彼此相近,且都可以更好地代表原始的数据。

(2) 跨步卷积转化为模糊卷积(BlurConv)。因为跨步卷积在计算过程中同样涉及下采样操作,会导致平移不变性的丢失。故采取相同的解决方式即加入抗锯齿滤波器对计算结果进行平滑处理。

通过将模糊池化与模糊卷积引入到空/频域特征提取器,有效保证了模型的平移不变性,进一步完善模型捕捉脑电信号中空间特征的能力。

1.3.2并行卷积模块

在深度神经网络的设计建模中,将多层卷积和池化进行纵向层数叠加是提高网络特征提取能力的有效方法。但在实际中受限于计算机的处理性能以及深度网络容易造成梯度消失的问题,简单的堆叠层数不是最优的选择。为了在网络深度和计算性能达到平衡,本文在卷积特征提取器的深层部分使用多尺度并行卷积结构,将传统的多层深度网络结构进行解耦,解决了深度网络带来的计算爆炸和梯度消失的问题,增加脑电空频特征的获取能力。

依据计算图理论,扩大网络的规模是改善深度卷积神经网络性能的有效方法。网络的扩大包括增加网络的深度(层数)和增加单层网络中过滤器的尺寸。这种解决方案有两个主要缺点:大尺寸的过滤器需要计算大量参数,会使得网络更容易过拟合,在不平衡的数据集如脑电数据集中表现尤为明显;直接扩展网络规模大小的另一个缺点是计算量的急剧增加。例如,在深度卷积网络中,如果存在卷积层相连的情况,则前一层滤波器的任何线性增加都会导致总计算量以平方的速度增加。实际中计算能力是有限的。因此扩展网络的大小要根据目标进行合理设计,实现计算资源的有效分配。

根据这一思路,结合集成学习中Stacking[10]的思想,本文提出在空频特征提取器的后半部分使用多尺度并行卷积模块,使数据同时通过不同尺寸的卷积过滤器,增加模型规模的同时保持对计算资源的有效利用。并行卷积架构通过逼近视觉网络的稀疏结构对复杂网络拓扑构造算法的假设输出进行有效评估,在定位和对象检测[11]中效果显著。

并行卷积体系结构的主要思想是利用多尺度的卷积窗口对数据进行并行处理,在保证覆盖率的情况下,减少因网络层次纵向堆叠而激增的计算量。网络架构的平移不变性因为BlurPooling和BlurConv得以维持,因此仅需找到适合的并行卷积模块组成方法并在网络中予以重复即可。为了实现计算的并行化,将每一层的输入分别发送到不同尺寸的卷积核中进行处理,同时在原始数据上进行不同大小的padding以保证输出尺寸的统一,最后再将各个输出进行通道合并。合并后的内容作为并行卷积模块的输出,并与下一层的输入层相连。本文所采用的多尺度并行卷积体模块包含尺寸为1×1、3×3和5×5的过滤器,并分别对后两种过滤器搭配大小为1和2的循环padding以完成数据对齐。多尺度并行卷积模块基础结构如图3所示。

图3 并行卷积模块基础结构

通过在算法层面的并行化设计,可以使得算法的运行速度获得一定程度上的提高。但不难看出,如果对输入的数据不进行任何处理,并行的多个卷积过滤器产生的规模与按顺序进行计算而形成的规模是一致的:每一尺度的过滤器的层数f等于输入数据所包含的通道数c×本层输出的通道数o。因此模型在通过并行架构后的总通道数L1如下:

L1=f1+f2+f3+f4

c×(o1+o2+o3)+f4

(2)

其中池化层不改变原始输入,所以f4无法进行合并。从式(2)可以看出,一个降低计算量的方法是减少输入到每个卷积核数据量的大小。具体到结构上就是在计算量增加显著的3×3和5×5的卷积过滤器之前使用1×1的卷积过滤器来降低输入数据的通道数以减小计算量,如图4所示。

图4 改进的并行卷积架构

综上所述,本文提出将模糊结构与并行结构由浅及深地集成到卷积神经网络模型中从而构成空频特征提取器来对输入图像中的频率特征和空间特征进行抽取。相比传统的卷积神经网络模型,本文的模型在性能上和脑电数据处理上都有比较好的表现,空频特征提取器的结构如图5所示。

图5 卷积特征提取器架构

1.4 时间特征提取器

为了发掘脑电信号内部的时间特征,本文采用长短期记忆神经网络(Long short-term memory,LSTM)对脑电数据进行分析。LSTM以序列的形式接受输入x=(x1,x2,…,xT),以此计算隐藏的向量序列h=(h1,h2,…,hT),通过在时刻1到时刻T的时间段内迭代式(3)和式(4),产生相应的输出y=(y1,y2,…,yT)。

ht=H(wxh+wbhht-1+bn)

(3)

yt=Whyht+by

(4)

式中:W表示权重系数矩阵;b表示偏差;H(·)代表隐藏层函数。

LSTM的一个计算单元包括内部存储器和门控输入/输出的存储单元,这些输入/输出在捕获长期依存关系方面比经典循环神经网络存在更高的效率。LSTM的隐藏层函数由式(5)方程组计算。

it=σ(Wxixt+Whxht-1+Wcict-1+bi)

ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)

ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc)

ot=σ(Wxoxt+Whoht-1+Wcoct+bo)

ht=ottanh(ct)

(5)

式中:ht-1表示上一时刻单元的输出,xt标识当前单元的输入,σ为sigmod函数。

计算遗忘向量ft和输入门向量it,而后将所得取正切值,存于细胞信息ct中,最后计算输出门向量ot和隐藏层ht。

鉴于人脑神经活动的动态性,LSTM可以对大脑活动的时间演变规律进行合理建模。作为混沌系统大脑其状态之间的转化过程复杂多变,因此目标事件的发生不仅取决于大脑的历史状态,也与其未来的状态存在关联。为了更好挖掘时间片段中的关联关系,本文采用双向LSTM挖掘脑电数据的事件关系,其结构如图6所示。

图6 双向LSTM计算架构

双向LSTM由两列互不关联的LSTM单元组成:第一列LSTM单元按时间顺序处理序列,而第二列单位按相反的时间顺序处理序列。双向LSTM的设计思路与之前分析相同,临床上神经科医生在对特定的窗口进行分类时,常参考过去和将来的窗口。任意的输出与之前和之后的状态同时有关,这与自动发作检测的逻辑相符。

2 模型训练

2.1 数据集

波士顿麻省理工学院附属儿童医院发布数据集(CHB-MIT)[12]是现有最大的免费可用数据集之一。相关学者在该数据集进行了大量工作[13-14]。本数据集共涉及23例患者,分为24组(患者chb03有2组记录,相隔1.5年)。该数据集由969小时头皮脑电图记录所构成,其中包含由专业医师划分的173次癫痫发作数据。数据集中存在各种类型的癫痫发作(阵挛性、脑全区性、强直性)。数据集中包含多种类型的患者和不同类型的癫痫发作使训练出的模型更具有普适性,同时可以提高模型的泛化能力。

本文的研究目标是检测输入到模型中的脑电信号是否属于癫痫发作前的SPH阶段。因此对数据集进行一定形式的预处理:将癫痫发作的时间段去除,同时截取出癫痫发作前30 min到前5 min作为目标片段(阳性片段),而其余部分为正常片段(阴性片段)。对于两部分的片段,以30 s作为时间窗口,5 s作为滑动步长进行切分,最后再将每个窗口中的数据按1 s进行切分从而完成数据集的预处理。

2.2 算法流程

算法流程如图7所示。

图7 模型整体架构

整个模型由脑电信号投影、空频特征提取器、时间特征提取器以及最后的全连接层分类器组成,训练过程如下:

首先将分割好的脑电片段投影成图像。然后将30幅脑电图像分别输入到空频特征提取器中以提取脑电片段的相关特征;而后将提取完成的特征合并输入到时间特征提取器中以抽取时间特性;最后将得到的特征向量输入到全连接层中判断输入数据段所属类别。循环过程中利用评估得到的损失反向传播更新网络参数,经过迭代执行完成模型训练。

卷积层架构如表1所示;时间特征提取层以卷积层输出的30个块作为输入,采用双向LSTM进行时间特征的捕获。

表1 卷积特征提取器网络架构

续表1

为了优化模型的参数和结构,本文通过交换卷积层的顺序和在超空间上的参数调优进行预实验。结果表明使用串行卷积层提取前期特征、使用并行卷积模块提取深层特征时模型性能较好,其中所有卷积层均使用整流线性激活(ReLU)。优化后的其他参数如下:batch size=128,优化器选择RMSProp,不使用dropout,网络的学习率为0.001。

2.3 癫痫预测模型

癫痫预测有两个任务方向,其中一个是建立面向指定病人癫痫发作预测模型,另外一个是建立无特定目标的跨患者癫痫预测模型。

建立特异性癫痫预测模型,即使用目标患者本人的数据训练分类预测模型。由于单一患者阳性样本的数量有限(癫痫发作通常是相对罕见的事件),因此本文基于留一法为特异性模型的建立设计数据采集方法:选择其中1次发作前的片段作为测试样例,利用其他N-1次发作前片段和全部间期片段训练模型。本文重复此过程N次,以便测试每个癫痫发作记录。

相比之下,构建跨患者癫痫预测模型是一个具有挑战性的工作。同样的癫痫发作在不同患者之间的脑电图记录中存在一定差异(大脑中的位置、频率、持续时间等因素),从而使广义癫痫发作模型的设计复杂化。本文将任意一名患者的脑电数据作为待测数据,利用其他N-1个患者的数据训练预测分类模型,然后利用待测患者进行模型测试。保留模型参数的同时在全部患者上重复此过程,在对每个患者进行测试后完成跨患者癫痫预测模型的构建。

文献[12]开发的基于支持向量机的商业化诊断器,通过提取脑电信息在频谱、空间和时间中自定义特征组合,实现了96.36%的灵敏度和0.11次/h的误诊率,是特异性模型所参照的一个基准。文献[15]通过使用有限脉冲响应滤波器进行高低频去噪,而后使用癫痫波序列分析(EWS)和周期性波形分析(PWA)的算法在时域和频域中扫描EEG的节律模式以建立跨患者癫痫发作预测模型,在CHB-MIT上获得了94.13%的平均灵敏度和0.32次/h的平均误诊率。文献[5]提出的深度卷积神经网络模型在跨患者预测上取得了75.1%的灵敏度和94.1%的特异性,是模型性能在深度学习领域的良好参照。

3 实 验

3.1 评估标准

合理选择评价指标有利于提高模型性能的可信度。本文采用灵敏度和误诊率作为预测模型的评估标准。灵敏度代表癫痫发作的检出率,鉴于癫痫表现出的强破坏力,有效的癫痫检测模型应尽量预测出全部的发病记录,因此灵敏度越高越好;预测模型应减少错误报告的次数,降低患者因误报产生的恐惧感,减少错误用药的次数,即模型的误诊率越低越好。

为了让模型对比结果更加直观,本文将实验得到的灵敏度与所对比实验结果进行相减,将对比实验的结果中的误诊率与本文的实验结果相减。差值大于0表明本文提出的模型在两个评价指标上占据优势,反之表示本文模型的不足之处。

3.2 实验结果

3.2.1特异性癫痫预测模型比较

图8(a)比较了本文所提出的集成深度神经网络模型和Shoeb的支持向量机模型在灵敏度和误诊率上的差异。可以看出,基于集成神经网络所构建的癫痫预测模型相比SVM模型在患者chb05、chb06以及chb18-chb23上提高了癫痫检出率,在chb13和chb17上小幅降低了灵敏度,总体上实现了平均98.22%的灵敏度;总体上小幅降低了误诊率,平均误诊率为0.09次/h。

(a)

3.2.2跨患者癫痫预测模型比较

利用传统方法构建的跨患者癫痫预测模型通常效果不佳,原因是人工特征对不同患者癫痫前期的脑电特征无法完全概括。与Fubass所提出的方法相比,本文所提出模型表现优异。如图8(b)所示,在部分患者上大幅提高了灵敏度,使模型的整体的灵敏度从94.13%上升95.65%;与此同时降低了大部分患者的误诊率,并且在个别患者上降幅明显,实现了0.17次/h的平均误诊率。

为了衡量模型在深度学习算法中的性能水平,将本文的方法与Robin所使用的深度卷积神经网络在跨患者分类模型上的性能进行对比,结果如表2所示。

表2 模型性能对比(%)

3.3 实验结果分析

从评价指标的对比结果看,本文所提出的深度集成模型在特异性癫痫预测模型和跨患者癫痫预测模型上都有优异的表现。从数据集的角度分析,原始数据集在chb17-chb23的患者中均存在一定程度的通道丢失现象。而传统方法对数据模式有较大的依赖性,当部分患者的数据模式发生变更(通道丢失)时,将使所训练过程产生偏差,最后导致模型检测能力差、泛化性弱。而深度集成模型的主要优势在于其多尺度、多维度对脑电状态进行建模,同时对频域、空域和时域三种特征进行自动提取,具有良好的泛化能力和足够的健壮性,在部分通道丢失的情况仍能保持一定的检测能力,优于人工特征的方法。

与传统卷积神经网络相比,深度集成网络在特异性指标上基本持平。表明深度学习技术相比传统的分类器拥有更好的泛化能力,可以准确识别发作间期的核心特征;在灵敏度方面,深度集成模型具有优秀性能,总体的预测准确率也相应提升。癫痫发作是一个全脑区相关的变化过程。本文方法可以有效捕获大脑各区位的空间状态变化,精确分析出脑电片段之间的差异,有效提高模型的灵敏度,减少误报情况的发生。

4 结 语

本文提出了一种癫痫发作预测的深度集成网络模型,通过纵向集成空频特征提取器和时间特征提取器,可以有效地从脑电信号提取多维特征,自动学习癫痫发作前期的一般不变表示。实验结果表明深度集成神经网络所构建的特异性癫痫预测模型和跨患者癫痫预测模型在性能上对比传统分类模型和卷积神经网络都有显著改善,在癫痫发作预测任务上具有优势。

此外,深度集成网络的另一个优势在于可以探测大脑中癫痫发作的具体位置,与医学专家分析脑电图的目的相同。通过使用训练好的模型对部分遮盖的图像进行分类,比较不同遮盖部位下的分类准确度可以推导出癫痫发作前大脑激活的关键区域。对脑电信号的多维特征共同分析的实践方法具有研究价值。

猜你喜欢
特征提取癫痫卷积
同步定位与建图特征提取和匹配算法研究
基于全卷积神经网络的猪背膘厚快速准确测定
基于FPGA的卷积神经网络加速优化方法
基于图像处理与卷积神经网络的零件识别
基于深度卷积网络与空洞卷积融合的人群计数
癫痫多数可控可治
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
玩电脑游戏易引发癫痫吗?
基于曲率局部二值模式的深度图像手势特征提取
癫痫,也可有良好预后