一种紧凑卷积神经网络的发作间期癫样放电检测方法研究

2022-08-25 09:56王晓璐
软件导刊 2022年8期
关键词:癫痫准确率卷积

鞠 祥,呙 强,王晓璐,张 玲,江 军,陈 多

(1.南京中医药大学人工智能与信息技术学院,江苏南京 210046;2.湖北科技学院生物医学工程与医学影像学院,湖北咸宁 437100;3.华中科技大学同济医学院附属武汉儿童医院临床神经电生理室,湖北武汉 430019)

0 引言

癫痫疾病由来已久,有关癫痫疾病的字眼曾出现于公元前4 000 年前的文字记录中。根据世界卫生组织(World Health Organization,WHO)最新报告,全球癫痫患者约有5千万,其中80%来自中低收入国家(WHO 2019)。中国目前大约有癫痫患者1 千万[1],而且以每年大约7%的增长率上升,癫痫疾病的检测治疗因而面临着巨大挑战[2]。脑电图(Electroencephalography,EEG)是癫痫临床重要检查手段之一,它是生理监测中最常用的工具之一[3],能够为癫痫发作提供独特的临床证据。EEG 信号可以分为头皮层EEG 与颅内EEG,其中颅内信号比较纯净,能够较好地反映脑细胞的电活动,但其容易使患者发生感染,且成本高。而对于头皮EEG,采集时容易收集到肌电、眼电等干扰信号,因此需去除伪迹并作降噪处理[4]。

癫痫发作间期,患者EEG 中产生的癫痫样瞬变或者棘波被称为发作间期癫痫样放电(Interictal Epileptic Discharges,IEDs),其模式多变且波形短促。IED 可用于首次癫痫发作后的重复发作预测,并且IED 对于区分癫痫发作类型、识别轻微痫性发作以及癫痫病灶定位、癫痫确诊都有着重要价值[5]。然而,目前临床实践中,IED 的解释和检测依然是采用目测和手动的标注方法,但是IED 人工标注具有主观性且过程繁琐枯燥,神经学专家对于哪些波形是癫样放电的共识也不完善[6]。EEG 还经常被未经专业培训的神经科医生误读,导致IED 漏检。误读IED 可能会对患者带来不利影响,导致癫痫发作误诊和相关药物误服。根据相关研究[7],具有非癫痫症状的患者在正确诊断前至少要经过七年的抗癫痫药物治疗。

本文研究是立足于癫痫自动化诊断的现实需求,探索和开发出基于深度学习的IED 检测方法,以满足IED 检测快速、精确和可靠的要求。研究成果可以辅助神经医师对发作间期癫样放电进行标记,能够将癫痫医务工作者从繁重和枯燥费时的工作中解放出来,减少癫痫诊断所需人力,提高IED 波形标记效率,具有广阔的应用前景和现实意义。

1 相关研究

基于EEG 信号的癫痫波检测研究最早开始于20 世纪70 年代,关于癫痫EEG 信号的处理方法研究目前已形成一个庞大的研究体系。其主要有时域处理方法、频率处理方法、神经网络处理方法以及非线性动力学处理方法。Solajia 等[8]运用一种数据驱动的降维技术,结合信号曲线长度等特征训练决策树分类器,最终达到99%的特异性和接近90%的灵敏度。Liu 等[9]采用相幅耦合与跨频耦合相结合的方法考虑了同一个信号不同频带所对应相位和幅值之间的相互作用,最终运用SVM 分类器完成检测任务。Samiee 等[10]运用局部化和自适应的时频方法,获得脑电图信号的特征表达,并使用多层感知器获得最优性能。随着反向传播算法的提出,深度学习神经网络成为机器学习后的发展浪潮,传统的机器学习方法大多需要人工从EEG 中提取特征,基于神经网络的分类模型可以自动提取有用的数据特征[11]。Acharya 等[12]首次运用深度学习模型对癫痫信号进行三分类检测,该方法能够区分正常脑电信号、癫痫发病信号以及癫痫间歇期信号。Ullah 等[13]构造了一种金字塔卷积神经网络,就是使用滑动窗口对一段比较长的脑电信号进行分割,再将分割后的信号进行归一化处理,分别送到不同的网格中,最终通过投票机制对癫痫信号进行检测。

目前,国内有关IED 的研究较少,已经发表的成果局限于病理描述与统计。张爽[14]通过视频脑电图统计分析脑卒中后癫痫患者的癫样放电情况。吴菡等[15]研究长程视频EEG 对于IED 采集成功率的影响,统计发现浅睡眠8小时内采集到IED 的成功率较高。比较而言,国外相关研究较多,最新研究也取得一定进展。Thangavel 等[16]研究基于卷积神经网络具有不同输入特征的IED 检测器,探索不同的卷积神经结构和类型,并且在5 个独立数据集上评估脑电图的分类性能,预处理全频率的脑电图信号和频带(delta、theta、alpha、beta)与高斯加性噪声,输出层为一维卷积神经网络,在90%的灵敏度下,达到最佳检测结果,误检率为0.23/min。Roy 等[17]运用基于ChronoNet 的循环神经网络(Recurrent Neural Network,RNN)在天普大学医院(TUH)脑电图数据集上获得86.6%的准确率。Lin 等[18]提出一种基于ConvNet 的分类器来区分无癫痫样放电的儿童癫痫患者,获得80%的平均准确率。上述研究回顾和分析了基于EEG 的癫痫波检测及IED 检测最新相关研究,特别是近年来深度卷积神经网络(ConvNets)在IED 检测方面取得较优异的性能。通过深度学习技术学习到的特征通常被证明比手工设计的特征更加健壮。这些将深度学习技术应用于IED 检测的最新研究为本文研究提供了理论和实践指导,也为后续IED 检测技术的有效研发指明了方向,这对于癫痫的有效诊断、治疗计划的针对性制定以及相关药物管理具有重大意义。

本文创新点在于:针对国内学者更多将注意力转向特征更明显的发作期癫痫放电自动检测,而新的有关发作间期的癫痫波自动检测方法偏少的现状,本文将深度学习方法用于发作间期癫样放电检测研究,避免了传统癫痫检测算法较为依赖人工构造特征、难度较大的局限性。采用紧凑的卷积神经网络模型,有效提高了特征值提取效率,改进了EEGNet 模型,简化了特征提取,并在自采集的癫痫患者EEG 数据集上实验,研究前期对癫痫患者脑电信号数据进行较为充分的信号预处理工作。实验结果表明,该方法具有良好的IED 检测性能。

2 数据集与预处理

本实验数据选取武汉儿童医院的6 名难治性癫痫患者(年龄:9±1 岁,男性4 名、女性2 名),实验数据来源真实有效,且符合伦理审查。由武汉儿童医院伦理委员会审查通过,已同意该项目按照批准的研究方案开展临床研究(伦理审查编号为2022R034-E01)。原始数据为EDF 格式数据,记录了癫痫患者脑电信号EEG 数据、通道数为19、采样率为500Hz 等信息,所有信号数据是符合10-20 国际标准电极所采集。Excel 标注文档中记录了每个癫痫患者发作间期癫痫放电的开始时间和结束时间,以及癫痫样瞬变的棘波类型。具体脑电数据信息整理如表1 所示。本文基于MATLAB 和EEGLAB 对癫痫患者脑电信号进行读取和预处理。

Table 1 EEG signals in epileptic patients表1 癫痫患者脑电信号信息

2.1 实验数据选取与整理

挑选6 名被试者数据进行实验,运用EEGLAB 对EEG数据去除无关通道,在原始总共43 通道中保留19 个相关通道。之后对数据进行带通滤波,带通频率范围设置为[0.1,40]Hz。经过通道选取及带通滤波信号处理后,用EEGLAB 绘制患者1 脑电信号EEG 波形图,可视化波形图如图1所示。

Fig.1 EEG pattern of patient 1图1 患者1脑电波形图

2.2 数据预处理

在MATLAB 中运用EEGLAB 读取患者数据,每个患者的采样率为500Hz,并对EEG.data 数据在MATLAB 中采用滑动窗口算法进行分割。滑动窗口窗长设置为500ms,overlap 设置为300ms,即每次向后滑动200ms 的长度。滑动窗口算法相关程序的编写具备智能化特性,能够自动读取患者对应标注文件的起始时间列进行切分。最终分割得到sub01 的IED 片段数为380,sub02 的IED 片段为186,sub03 的IED 片段为1 255,sub04 的IED 片段为645,sub05的片段为310,sub06 的IED 片段为579。其中,非IED 片段数分别为634、1 684、7 186、8 458、5 272、1 549。并且,运用随机函数在滑动窗口分割EEG 数据片段的过程中进行片段选取,选取规则为:与IED 片段相匹配大小的非IED 片段。最终整理得到3D 多维数组,通道数为19,采样点数为251,数据以MATLAB 中的.mat 格式保存,以备后续开展深度学习实验。

3 网络模型

在癫痫检测领域,许多深度学习方法尤其是卷积神经网络方法被提出。卷积神经网络(CNNs)用于计算机视觉和语音识别,以执行自动特征提取和分类,并在基于脑电图检测的研究中得以成功应用。如Wen 等[19]提出基于深度卷积神经网络的自编码结构,通过无监督学习,使用反卷积操作和卷积操作构造自编码器,从高维脑电图中提取有效的低维特征。本文采用改进后的EEGNet 模型,简化了模型结构,与其他CNN 方法相比,可训练的参数数量比DeepConvNet 和ShallowConvNet[20]小两个数量级,极大减少了模型训练计算量。并且,EEGNet 模型通过实验验证了对不同数据大小的有效性。实验结果表明,在有限训练数据可用的情况下,EEGNet 比其他现存的针对范式不可知的EEG CNN 模型能实现更好的分类性能。

3.1 模型简介

在对EEG 进行分析的任务中,传统方法往往涉及两个方面:特征提取和分类。对于不同范式类型下的EEG 往往都需要设置不同的特征,EEGNet 的出现正好可解决设计一个模型应用于多个范式的问题。

一种紧凑的基于EEG 的CNN 架构模型主要有3 个特点:①可以应用于多种不同的BCI 范式;②可以在非常有限的数据上进行训练;③可以产生神经生理学可解释的特征[21]。其中,第2 点对本文所做的发作间期癫样放电检测的任务类型尤其适用,由于IED 检测的数据往往受限于对癫痫患者的样本采集,数据量比较有限,该模型正好可以较好地解决这一问题。

EEGNet 模型利用深度卷积和可分离卷积构造脑电特征提取模型的方法,该模型是封装了BCI 脑电特征提取概念,在训练数据有限的情况下,拥有比较好的泛化能力和较高性能。

3.2 网络架构

本文主要介绍紧凑型的用于EEG 脑电图分类的CNN整体网络架构。在实验中以500Hz 的采样率收集EEG,模型包含通道数C 和采样点T,使用Adam 优化器拟合模型,使用最小类别交叉熵损失函数。在改进的EEGNet 架构中,C=19,T=251,F1=时间滤波器数,D=深度乘法器(空间滤波器数),F2=点态滤波器数,N=类别数。其中,p=0.5 表示在受试者内分类,p=0.25 表示用于跨受试者分类。可视化架构如图2所示。

具体模型细节如表2、表3 所示。表2 是block1 的细节,表3是block2的细节(最后一行是分类器)。

Fig.2 EEGNet compact CNN architecture图2 EEGNet紧凑型CNN架构

Table 2 Block1 network architecture details表2 Block1网络架构详细信息

在Block1 中,一次执行两个卷积步骤,先拟合大小为(1,64)的F1 2D 卷积滤波器,将滤波器长度设置为数据采样率的一半。输出包含不同带通频率下的脑电图信号F1的特征图,将时间核的长度设置为采样率的一半,再使用大小为(C,1)的Depthwise Convolution 学习空间滤波器。在CNN 的计算机视觉应用中,深度卷积的主要好处是减少了需要拟合的可训练参数量,因为这些卷积层并没有完全连接到之前的所有特征图。在脑电图领域中,该操作为学习的每个时间滤波器提供了一种直接的学习方法。

在Block2 中,使用可分离的卷积Separable Convolution,大小为(1,16),再是F2(1,1)点向卷积[22]。可分离的卷积优点主要有:①减少了要拟合的参数数量;②通过先学习一个内核分别总结出每个特征映射,然后明确地解耦特征映射和跨特征映射的关系,再最优地合并输出。在脑电图应用领域,该操作将学习如何在时间上将单个特征映射与点态卷积分开。这种操作方法对脑电图信号很有用,因为不同的特征图可能代表不同时间尺度上的信号差异。

在分类Classification block 中,这些特征直接传递给softmax 分类,N 代表数据中的类数,注意忽略在softmax 分类层之前使用密集层进行特征聚合,可以减少模型中自由参数的数量[23-24]。

4 实验与结果分析

4.1 实验准备

本文实验采用的癫痫患者脑电数据由武汉儿童医院提供,前期对原始数据进行异常通道去除、过滤、重采样以及滑动窗口分割等必要的数据预处理工作。在开展深度学习实验前,选择6 名患者数据经过预处理和滑动窗口分割后得到EEG 数据片段。实验采用10-折交叉验证的方法,用来测试算法的准确性,将每份数据集平均分成10份,轮流将其余9 份作为训练数据,1 份作为测试数据,进行试验。

4.2 实验环境和配置

本文实验硬件环境:计算机处理器CPU 为AMD Ryzen 74800H with Radeon Graphics 2.90GHz,内存为16GB,GPU为GeForce GTX1650。软件环境:操作系统Windows10 平台、tensorflow-gpu2.2.0、keras深度学习框架、CUDA11.1。

损失函数设置为categorical_crossentropy,优化器选择adam,设置batch_size=32,epochs=50。使用10-折交叉验证的方法,每次读入一个患者的数据,循环训练10 次,模型参数分别设置为nb_classes=2,dropoutRate=0.5,F1=8,D=2,F2=16,kernLength 设置为256。经过试验,将kern-Length 设置为数据采用率的一半效果较好。

4.3 实验过程

开始实验前先将原始.mat 格式数据读入再转化为多维数组.npy 格式。由于MATLAB 和numpy 对多维数组表示的格式维度不同,实验开始前先将数据进行切换维度操作,将数据维度转化成(trials,channels,samples,kernels)格式。其中,trials 表示每次实验样本数,channels 设置为19,samples 为样本数据采样点,本文为251。Kernels设为1。

4.4 实验结果

本文选取准确率(Accuracy)、敏感性(Sensitivity)、特异性(Specificity)和F-1 score 作为评价指标,采用10-折交叉验证的方法。在每次训练和预测结束后绘制出混淆矩阵,打印出准确率、敏感性、特异性以及F1-score 等评价指标,最后求平均值得到每个患者的平均值。实验结果如表4 所示,其中患者sub01 的实验结果相对最优,平均准确率达88.2%,平均敏感性和特异性分别为73.1%、84.2%,以及F1 分数达80.0%;患者sub02 的平均准确率为82.7%,敏感性为82.5%,特异性为82.6%,F2 分数为81.3%。6 名患者整体平均准确率结果为70.5%,平均敏感性为71.3%,平均特异性为73.1%,平均F1 值为68.1%,达到较好的IED 检测效果。

Table 3 Block2 network architecture details表3 Block2网络架构详细信息

Table 4 Summary of experimental results表4 实验结果汇总

与业内最新的运用深度学习方法针对EEG 的IED 分类相关研究进行比较,对比Jing 等[6]运用SpikeNet(2D ConvNet)的方法,通道数为37,采样点为128,分类类型IED vs non-IED 与本文相同,也是采用10-fold 交叉验证得到84.7%的准确率。本文针对患者sub01 的准确率达到该研究检测水平,但本文还存在病例数据较少的局限性,整体检测准确率有待提升。因此,未来研究中还需针对性地补足短板,进行更加全面且深入的研究。彭睿旻等[25]对基于EEG 的癫痫脑电波自动检测方法做了回顾,整理和总结了包括传统机器学习、深度学习、迁移学习、多视图学习、集成学习和主动学习等在内的多种分类模型,并对未来相关实际应用场景进行展望,这些基于EEG 信号的自动检测方法能够有效减轻医务工作者的工作负担。杨舒涵等[26]针对当前癫痫自动检测方法多集中为单个患者建立模型,且泛化能力较低的问题,提出一种基于机器学习的跨患者自动检测算法,实现了运用一个模型可在多个不同的患者上进行检测的效果。上述研究充分说明了本文的实际研究价值,也为后续研究改进提供了方向。

本文最优实验结果在一定程度上达到了受过相关培训的临床医师的检测水平,该方法也能够更准确地对脑电图进行分类,并检测癫痫患者个体发作间期的癫痫样放电,未来有助于特殊情况下对癫痫的诊断测试。同时,本文研究也存在受试者样本数据量较少,以及有待解决跨受试者的问题。后续工作将针对这两个方面继续开展深入研究,分析和发掘不同模型对特定IED 模式的标记能力,构建跨被试、高可靠性的IED 检测模型。

5 结语

IED 检测对于癫痫检测、癫痫病灶定位和癫痫发作预测都具有重要意义,其研究结果将直接影响到癫痫临床诊断与治疗方案定制。本文使用改进后的基于紧凑卷积神经网络的EEGNet 模型,简化模型结构和输入模式。实验结果表明,基于紧凑CNN 的模型可以对IED 的脑电数据进行有效的特征提取,且分类准确率良好,单个患者最优检测准确率达88.2%,单个患者最低准确率为61.0%,平均准确率为70.5%。但也存在一些问题:受实验条件限制,目前选取受试者较少、实验训练和测试数据较少。后续研究将扩大被试范围,在更大的数据集上开展实验。并且,对模型进行改进优化,先在独立数据集上测试,然后在独立数据集间进行跨被试测试,对结果进行分析并开发针对性的算法和筛选方法。这将极大提高诊断效率,节省计算时间,降低人工成本。若未来能解决跨平台和跨被试问题,并且获得更可靠的IED 检测结果,将有力推进人工智能算法在IED 临床分析中的实际应用。

猜你喜欢
癫痫准确率卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
癫痫中医辨证存在的问题及对策
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
玩电脑游戏易引发癫痫吗?
左氧氟沙星致癫痫持续状态1例
一种基于卷积神经网络的性别识别方法
中医针药治疗脑卒中后癫痫临床观察