韦博轩,张冀聪
1. 北京航空航天大学 a. 生物与医学工程学院;b. 北京市生物医学工程高精尖创新中心;c. 北京市大数据精准医疗高精尖创新中心,北京 100191;2. 北京航空航天大学 合肥创新研究院,安徽 合肥 230012
癫痫是一种由于神经细胞异常过度放电而导致的慢性脑部疾病,具有反复发作的特征[1]。癫痫患者常伴有无法控制的运动、意识丧失及暂时性混乱等症状,严重影响日常生活及工作,甚至威胁到患者的生命[2]。据癫痫基金会和世界卫生组织调查显示[3],目前全世界约有6500 万人被诊断患有癫痫,240 万人被发现有癫痫症状。
头皮脑电图(Electroencephalogram,EEG)和脑磁图(Magnetoencephalogram,MEG)是临床上用于记录脑部相关活动的无创信号采集手段[4],具有优异的时间分辨率(EEG和MEG 信号均来自相同的神经生理过程,但MEG 信号失真较少,且较EEG 信号而言具有更高的空间分辨率[5]),在癫痫的诊断、治疗、疗效评估及机理研究领域发挥着重要的作用[4-7]。大量研究显示,近80%的癫痫患者在癫痫间隙期会伴有神经元的异常放电,在EEG 及MEG 中的波形表现主要有棘波、尖波、棘慢及尖慢复合波等[8-9]。临床上,通常选择提取癫痫发作间期的痫样棘波和尖波,并通过定量分析获取癫痫相关的病理信息。此外,基于EEG 及MEG 的源定位方法在癫痫患者的术前评估及预后中起到关键性的作用[10],而在这之中,棘波和尖波的检测是源定位的第一步。
目前临床上,视觉检测和手动注释被看作是棘波和尖波检测的“金标准”,然而大量繁琐而冗余的工作给专业人员带来沉重的负担,且其检测的准确性过度依赖于检查者的主观判断,因此,设计实现用于EEG 及MEG 信号解释的自动化系统意义重大。
本文关注的是EEG 和MEG 信号中棘波和尖波的自动检测,需要注意以下三点:首先,虽然临床中对棘波和尖波的定义有所不同,但在棘波和尖波的自动识别领域,将二者统称为癫痫瞬变现象或统称为棘波,因此下文将以棘波代指棘波和尖波的集合;其次,两类信号均具有多通道特性,因此棘波检测可在单通道或多通道上进行;最后,棘波被认为是信号的异常段,因此大多数异常检测技术均可用于EEG 及MGE 信号中棘波的检测,尽管该领域的大部分工作都致力于EEG 棘波检测,但经过一些修改后,同样可以扩展应用于MEG 棘波检测中。
本文结构如下,第一节主要描述EEG 及MEG 信号中棘波的波形特征;第二节介绍通过设计特征工程实现棘波检测的相关算法;第三节讨论当前工作的结果并展望棘波检测算法的未来发展方向。
由于EEG 和MEG 信号均来自相同的神经生理过程,因此本文以10~20 系统记录的EEG 为例简要介绍棘波特征。棘波是大脑皮层神经细胞异常放电在EEG 信号中引起的波形变化,表现为由皮质表面定向引起的表面负偏斜,上升支和下降支陡峭,整体形状如同荆棘的尖刺,是EEG 信号中痫样放电的典型特征之一。棘波的周期通常为20~70 ms,突出于背景信号,幅度大于20 μV,为背景信号的1.5 倍以上[11-13]。
受棘波上述特性及检测方式等因素的影响,自动棘波检测面临以下挑战:① 由于人与人之间存在的个体化差异,导致棘波的表现形式各异,很难通过简单的一致性方法自动检测EEG 及MEG 信号中存在的棘波;② 由于信号测量过程中不可避免地存在心跳、眼动、肌肉运动等因素造成的伪差,对棘波自动检测的准确率影响较大;③ 相对于完全放电的棘波,不完全放电的棘波波形特征不够明显,进一步提高了自动检测的困难。
1972 年,Stevens 等[14]首次尝试从长时程的EEG 信号中提取痫样棘波,开启了学界对棘波自动检测的研究。自此之后,依据痫样棘波的特性,产生了诸多不同角度的棘波检测算法,包括基于形态学[15-17]、信号相关性[18-21]、子带分解[22-23]以及特征工程相关[24-31]等方向。由于篇幅有限,本文仅对基于机器学习的相关方法进行介绍。传统基于机器学习的棘波检测算法通常分为以下三步,首先是对EEG/MEG信号的预处理,以此来提高信号的信噪比,为棘波的自动检测提供高质量的纯净信号;其次是根据棘波的特点,人工设计特征工程,降低信号维度的同时,突出棘波与背景信号的差异;最后是根据得到的特征,进行EEG/MEG 信号中棘波与背景信号的二分类,实现EEG/MEG 信号中棘波信号的检出。除此之外,近年来发展迅猛的深度学习,作为机器学习中的一类方法,巧妙的结合的了传统机器学习算法中特征提取与分类两个步骤,为基于机器学习的EEG/MEG 信号棘波检测算法提供了新的思路。本文分别从传统机器学习算法及深度学习算法两个方面回顾了近10 年来机器学习相关的棘波检测算法。
基于传统机器学习算法的棘波检测检测模型中,滤波算法被用于信号预处理,以实现干扰信号滤除、信号某部分细节的增强或是趋势消除,棘波检测算法中较为简单的一类正是利用了滤波器可增强信号某部分细节的能力,例如Oikonomou 等[24]提出一种基于卡尔曼滤波的方法,在预处理阶段增强EEG 信号的信噪比,从而提高棘波的检出率。由于神经细胞外EEG采集时环境、设备等因素的影响,信号中不可避免的混杂了来自多个噪声源的噪声,Azami 等[25]基于这一情况,分别使用了基于分形维数、平滑非线性能量算子及标准差的方法构建了三种不同的模型用于检测含噪信号中的棘波。
特征提取通过将原始信号转化为一组具有明显物理意义或统计意义的属性,实现了对信号降维的同时突出分类目标间的差异,因此有学者根据棘波与背景信号的差异,设计特征工程,提高传统机器学习算法的棘波检测准确率。例如Keshri 等[26]基于确定有限状态自动机(Deterministic Finite Automata,DFA)提出了一种名为DFAspike 的棘波检测模型。该模型通过扫描EEG 信号的振幅、斜率及周期,将其转换为{-1, 0, 1}组成的符号序列,并根据一段时间内序列变化的方向及剧烈程度控制状态转换,最终识别棘波的开始、终止时刻及平均出现频率。文中,作者采用了13 种状态生成的转换图来描述EEG 信号的可能情况,并最终在植入式电极测得的大鼠EEG 信号中达到了99.13%的棘波检出率。Fürbass 等[27]根据重症监护脑电图术语(Critical Care EEG Terminology,CCET)提出了一种计算多通道EEG 信号的节律和周期模式的方法,以此来实现EEG 信号棘波的检出。
机器学习是一类由数据驱动的建模方法,旨在通过数据样本的学习,挖掘EEG 及MEG 信号中棘波与背景信号的差异信息,自动生成二者的分类模型。Khalid 等[21]开发了一种用于检测癫痫患者MEG 信号棘波的分类模型。该模型中,作者以共空间模式(Common Spatial Patterns,CSPs)技术提取MEG 信号特征,并利用线性判别分析(Linear Discriminant Analysis,LDA)算法构建分类器,实现对棘波及背景信号的二分类,并在20 例癫痫患者的MEG 信号中取得了91.03%的灵敏度和94.21%的特异性。Anh-Dao 等[28]提出了包含预处理、特征提取、分类以及专家系统在内的四个模块构成的棘波检测模型。模型中,作者在预处理阶段提出六个用于描述棘波形态的特征,将特征两两组合后利用三类感知器输出结果并进行融合决策,初步对输入特征所属的信号进行二分类,即非棘波和疑似棘波;接着利用连续小波变化提取上一步分类结果中疑似棘波的特征,并输入构建的人工神经网络进行进一步细分,确定该段信号是否输入棘波;最后利用EEG 信号的空间及时间背景信息构建专家系统,对神经网络输出的棘波进行最终判定。经实验验证,该方法在17 位癫痫患者的头皮EEG 数据集上获得了94.5%的准确率。
自2006 年以来,随着深度学习技术持续升温,深度神经网络(Deep Neural Network,DNN)已成为当下诸多领域研究的热点,并在图像识别、语音识别等领域获得瞩目的成果[29-32]。此外,最近的脑电图及脑磁图的研究也在某种程度上使用了深度学习。例如,卷积神经元网络(Convolutional Neural Network,CNN)是第一个应用于脑电图癫痫发作预测的深度学习模型[33];文献[34-36]在脑电数据上使用另一种称为深度置信网络(Deep Belief Network,DBN)的深度学习模型分别用于癫痫、不同睡眠状态以及情绪识别的临界频带相关的异常。除此之外,其他深度学习模型也被用于探索复杂的任务,如发现大脑结构[37];使用包括CNN、线性支持向量机和卷积自动编码器在内的三种深度模型学习脑电波的特征[38];使用多通道DBN 分类脑电图数据[39]。
深度学习在EEG 及MEG 棘波检测算法中的应用还在初步阶段,未见大量报道。例如Johansen 等[40]基于CNN 建立了一种棘波检测模型。模型中,作者利用高通滤波器+陷波器的组合实现数据的预处理,并利用共同平均算法消除数据中存在的伪迹,之后以Relu 为激活函数,最小化二项式交叉熵为损失函数构建了深度为5 层的1 维卷积神经网络,最后使用留一法在五名癫痫患者的脑电数据集中进行交叉验证,取得了94.7%的准确率。Van 等[41]将DBN 由生成模型改为判别模型,并以此建立了EEG 信号的棘波检测模型。模型中,作者设计特征工程,提取7 个用于描述信号周期、振幅、坡度及面积的时域特征,并利用小波变换分别从EEG 信号的Theta、Alpha、Beta 频段中提取280 个时频域特征构建特征向量,作为DBN 模型的输入。经实验验证,模型在具有19例癫痫患者的数据集上取得了95.97%的准确率。虽然利用深度学习进行棘波检测的相关研究还很少,但上述种种算法的成功应用也为基于机器学习的EEG 及MEG 信号棘波检测验证了可能性并提出了进一步发展的方向。
本文概述了近10 年来围绕特征工程进行的一些痫样棘波检测方法。不难看出,虽然大部分算法均在研究人员自己的数据库中取得了良好的效果,但是由于数据标准、采集环境、样本分布等因素的差异,算法间仍难以实现综合的评估和比较。另一方面,由于各个数据集样本量的限制,大多数算法均选择将单个患者采得的信号按时间窗分段,然后随机抽取其中的部分段形成训练集,在该部分数据中分析总结波幅、周期等具有物理意义或统计学意义的特征,并将设计形成的棘波检测模型放在另一部分样本形成的测试集上验证算法效果,虽然大部分算法都在测试集上获得了较高的准确率,但是由于训练集和测试集数据中人群分布的局限以及背景数据的重复,算法的鲁棒性及稳定性未能得到充分验证。因此,建立具有统一标准的大规模痫样棘波公开数据集,并依托其生成一套人群内及跨人群的评估方案以精确衡量算法效率和鲁棒性,是当下实现可靠的自动棘波检测系统的迫切需求。
此外,相比于传统“预处理-特征分析-分类”三步彼此独立的方法,基于深度学习的棘波检测算法独具特色:① DNN 作为一种数据驱动的建模方法,其无监督与有监督学习结合的学习模式,克服了传统方法孤立对待特征分析与学习的缺点,能够自适应地学习数据特征;② 其具有的多层非线性映射结构能够表征特征之间的交互及层次结构,从而发现底层特征之间的深层联系;③ DNN 的多层网络结构在面对海量EEG 及MEG 数据时具有比传统模型更强的表达能力,且能够避免传统模型构建特征工程时对数据包含信息的损伤。然而,相比于人工设计的特征工程,深度学习算法中特征可解释性差的弊端严重限制了该类方法在棘波检测领域中的发展和应用。因此,综合不同种类方法的特点,形成机理模型与数据驱动模型相结合的棘波检测模型,将会是下一步的发展趋势。