基于TWQT和熵特征的癫痫脑电快速检测

2020-04-29 12:42:18张睿琳贾建张瑞
关键词:随机森林支持向量机

张睿琳 贾建 张瑞

摘要:该文提出一种基于可调Q因子小波变换的熵特征提取方法用于癫痫脑电的快速检测。首先,利用TWQT算法对脑电信号进行分解,计算分解后得到的小波子带的中心频率;随后,选择对应癫痫发作时异常波段频率范围的子带进行小波重构,并对重构信号提取排序熵和规则性指数等熵特征;最后,选择包括支持向量机、随机森林、极端梯度提升在内的多种分类器进行分类实验。实验中采用德国波恩大学癫痫研究中心的公开数据集和UPenn and Mayo Clinic′s Seizure Detection Challenge数据集进行验证,所提出的方法针对小样本数据集可以达到99.3%的准确率,100%的灵敏度以及98.6%的特异度,体现了该算法的有效性。

关键词:脑电信号;可调Q因子小波变换;排序熵;规则性指数;支持向量机;随机森林; 极端梯度提升

中图分类号:TP391.4

DOI:10.16152/j.cnki.xdxbzr.2020-04-008开放科学(资源服务)标识码(OSID):

Rapid detection of epileptic EEG based on TWQT and entropy

ZHANG Ruilin1,2, JIA Jian1,2, ZHANG Rui1,2

(1.School of Mathematics, Northwest University, Xi′an 710127, China;

2.Medical Big Data Research Center, Northwest University, Xi′an 710127, China)

Abstract: In this paper, an entropy feature extraction method based on tunable Q factor wavelet transform is proposed. First, using TWQT algorithm to decompose EEG signals,calculate the center frequency of each wavelet subband, then choose corresponding sub-bands for reconstructing and extract reconstructed signals′ permutation entropy and order index as the characteris-tic. In the end, choose  a variety of classifieiers including support vector machine(SVM), random forest and XGBoost to classify. The proposed classification method is applied to the detection of epileptic EEG signals, and verified by the open dataset of the Epilepsy Research Center of Bonn University in Germany and UPenn and Mayo Clinic′s Seizure Detection Challenge dataset. The accuracy is 99.3%, sensitivity is 100% and specificity is 98.6%, which shows the effectiveness of the algorithm.

Key words: EEG; TWQT; permutation entropy; order index; SVM; random forest; XGBoost

癫痫是由大脑内神经元异常放电引起的慢性脑部疾病,通常表现为感觉、知觉以及行为上不同程度的障碍,具有突发性、重复性、自限性、暂时性等特点[1]。癫痫不仅严重损害了患者的身心健康,对患者的日常生活造成了严重的影响,还给家庭和社会带来了沉重的经济负担。迄今为止,脑电图(Electroencephalogram,EEG)仍然是研究癫痫信号的主要工具,被用于进行癫痫相关的神经紊乱疾病监测、诊断和治疗。脑电图会监测到大量癫痫发作时的异常脑电活動数据,通常由医生对患者脑电图进行肉眼观察完成疾病诊断,但这种方式会受到脑电信号的非癫痫瞬变等干扰,因而效率较低且非常耗时。此外,在长时程的主体分析过程中,主观性也会对诊断结果的准确性造成影响。因此,癫痫发作的自动检测技术研究具有重要的意义[2]。

传统的信号处理方法包括快速傅里叶变换(FFT)、短时傅里叶变换(STFT)、幅频分析等方法,可以在频域准确、高效地分析信号,但是在时域上缺乏分辨能力。而小波变换既包含STFT的局部化思想,又克服了其主要缺陷,如窗口大小不能随频率变化,成为一种对信号进行时频分析的有效新方法[3]。但进行小波变换时需要选定合适的小波基函数,由单个基函数导出的小波函数无法准确表现信号的局部特征,因此在重构时将失去原有的时域特征[4]。

可调Q因子小波变换(tunable Q-factor wavelet transform,TWQT)是一种参数可以根据小波的振荡特性与特征波形的振荡特性进行调节的小波变换方法[5],可以可靠地表征信号在时域上的稀疏性和非平稳性,适用于分析包括脑电信号在内的振荡信号[6]。几十年来,通过提取脑电图特征的癫痫发作检测方法已经得到了广泛的应用。Patidar等采用可调Q因子小波变换分解脑电信号,以Kraskov熵为特征,利用最小二乘支持向量机(LS-SVM)进行分类[7];Peker等采用双树复小波变换(DTCWT)对癫痫脑电信号进行处理和分类[8];Sharma等采用时频灵活分析小波变换(ATFFWT)和分形维数(FD)进行癫痫发作检测[9];Jia等基于完全集合经验模式分解(CEEMD)提取谱特征并利用随机森林进行分类检测[10];Mutlu采用希尔伯特震动分解(HVD)提取最大能量分量的瞬时频率值作为LS-SVM的特征以检测癫痫发作[11]。以上方法基于传统的机器学习方法进行实验,均取得了十分有效的成果。除此之外,许多研究通过深度学习实现癫痫发作自动检测,深度学习会自动发现并学习分类输入所需的特征,并基于不同的深度神经网络结构实现,例如完全连接的神经网络(FCNN)[12],卷积神经网络(CNN)[13]以及循环神经网络(RNN)[14]。这种深度神经网络模型的实现需要依赖大量的数据,并且需要对模型的参数进行调整和选择,对于小样本数据集的分类检测具有一定的局限性。因此,本文研究了针对小样本数据集的癫痫脑电快速检测方法。

基于TWQT对癫痫脑电信号的特征提取,本文主要研究以下3个方面的内容:①利用TWQT对脑电信号进行分解,得到相应的子带;②根据癫痫发作时异常波的频率对应范围,选择相适应的子带进行小波重构,并且在重构后的脑电信号上提取熵特征,采用排序熵(permutation entropy,PE)和规则性指数(order index,OI)研究癫痫患者的脑电信号复杂度;③通过多种分类器对脑电信号进行分类,包括支持向量机、随机森林、极端梯度提升。在采用德国波恩大学的癫痫研究中心的公共数据集和UPenn and Mayo Clinic′s Seizure Detection Challenge数据集的验证结果表明本文所述分类方法针对小样本数据集可以达到快速准确的检测结果,其分类准确率分别为99.3%和99%,并引入灵敏度、特异度和AUC值作为衡量指标与现有方法进行对比。

1 可调Q因子小波变换和熵特征

1.1 可调Q因子小波变换

可调Q因子小波变换是一种完全离散的小波变换[15],其主要参数是品质因子(Q)、冗余度(r)和分解层数(J),如表1所示。

Q因子主要影响子波的振荡特性,Q的值越大,小波振荡频次越高,Q值越小,小波振荡频次越低;参数r是TWQT在无限多层J计算时的冗余度,在实验中,为了能够使得分解后的小波具有局域化时域特征的能力,通常选择r≥3;小波变换的阶数(或层数)用J表示,TQWT的分解原理与传统的小波变换相似,采用迭代的双通道滤波器对信号进行分解,每个滤波器组的低通输出作为输入到后续的过滤器组。每个输出信号构成小波变换的一个子带,最终得到J+1个子带,其中包括高通滤波器输出的每个滤器组的信号,以及最终滤波器组的低通滤波器输出的信号,它表征了信号中所含低频分量的细化程度。例如,一个3阶TWQT如图1所示[16]。

,其中,T为叶结点的数量。结构部分q(X^)的输出是叶结点编号d,它的作用是将输入W^映射到编号为d的叶结点。叶结点权重部分就是每个叶结点的值,它的作用是输出编号为d的叶结点的值wd。

XGBoost同样体现了集成学习的思想,并且在处理过拟合问题时有着良好的应对方法:一种方法称作Shrinkage,目的在于适当地弱化每棵树的影响,对于决策树的每次迭代,添加一个缩减因子以降低叶子结点的权重比例,这样使得之后决策树的产生可以伴随着更大的空间优化可能。第二种方法称作column subsampling,与随机选择的方法类似,在森林中选取部分特征值来构建决策树,这种选取方式可以是分层随机抽样,在每一层的分类结点之前先计算每一个随机选取部分特征值的信息增益;也可以是在一棵决策树的生成前先随机选取部分特征值,然后计算每一个分类结点处的信息增益。

2 实验结果

在癫痫的发作检测中,脑电图检查对其病因和发作类型的判断具有很大价值,其中最常用的是头皮脑电图,它将电极夹放置在头皮上从而记录脑细胞在活动时的电位变化。

本文所使用的脑电图公共数据来源于波恩大学的癫痫研究中心。它由5组数据集组成,即Z,O,N,F,S,每组含100个属于单个实验者的单道EEG片段,每一单道段持续23.6 s。基于国际标准的10-20脑电图电极放置系统,设置集Z和O记录清醒和放松的信号,集F和N包括电极置于致癫痫区时产生的信号。集S中的数据由颅内的、以及植入颞部和基底部的大脑皮层区域放置电极的信号组成。集S中的脑电图数据对应于癫痫发作,而在集F和N则对应于未发作期。每个脑电图信号段采用具有12位分辨率和173.61 Hz数字化的128通道放大器系统采样。最后,每个片段的采样长度为173.61×23.6≈4 097,对应的带宽为86.8 Hz。本文利用脑电图信号的子集S,F评估所建议方法的表现,所提出方法的检测流程如图2所示。

首先采用TWQT對原始的EEG数据进行分解,分解时的参数设置为Q=1.5,r=3,J=6。分

解后的结果如图3所示,最上方为某一原始EEG信号,下方的信号为分解后得到的7条小波子带,可以看到,子带中包含了不同的特征波形。

对分解后的子带选择具有显著特征的子带进行小波重构。这里挑选的准则为每层小波子带的中心频率。TWQT分解第j层对应的中心频率fc表示为

fc=αj2-β4αfs。(20)

计算得到每层小波子带所对应的中心频率如表2所示。

因在癫痫发作期大脑异常波段对应的频率范围是3~25 Hz,因此选择包含在这一频率范围之内的第3~6层小波子带对EEG信号进行重构。重构后的脑电信号长度与原始信号相同,之后计算其排序熵和规则性指数作为特征。嵌入维度和延迟时间为m=5,r=1。

图4为重构信号的排序熵与规则性指数的箱型图。可以看出,癫痫发作期的PE值低于癫痫发作间期,OI值高于癫痫发作间期。这表明癫痫发作期的脑电序列复杂度更低。

接下来利用所提取特征进行分类,这里考虑3种不同的输入方式,一是以PE作为特征进行分类,二是以OI作为特征进行分类,三是以PE和OI构成的特征向量进行分类,其分类准确率如表3所示。

由表3可见,由PE和OI构成的特征向量作为分类指标时准确率(Accuracy)更高,通过比较不同分类器的分类结果可以看到,XGBoost分类器在以不同特征作为输入时均产生了更好的结果。为了进一步评估所述方法的实验性能,引入灵敏度(Sensitivity)、特异度(Specificity)和AUC(area under the curve)作为评估指标[25],表达式如下:

1) 灵敏度

Sensitivity=TPTP+FN。(21)

2) 特异度

Specificity=TNTN+FP。(22)

其中:TP代表正确分类的正类样本数;TN代表正确分类的负类样本数;FP代表被错误分类的负类样本数;FN代表被错误分类的正类样本数。

以XGBoost作为分类器,PE和OI共同作为特征输入时,达到99.3%的最高分类准确率,98.6%的特异度以及100%的灵敏度,0.996的AUC值也表明该分类方法具有较好的分类效果,对比实验数据如表4所示。

将本文提出的方法与现有的研究方法进行对比,针对波恩大学癫痫研究中心的公开数据库展开的部分研究数据如表5所示。本文所提方法得到了最高的准确率99.3%和最高灵敏度100%,尽管Jia[10]提出方法的特异度略高于本文方法,但其准确度却低于本文方法。可以看出作为一种基于小样本和仅采用熵特征进行分类的方法,本文所采用的方法在各度量标准上均取得了较好的性能。

为进一步验证本文方法的可行性,在UPenn and Mayo Clinic′s Seizure Detection Challenge数据集上再次进行实验,选取其中一名实验者的脑电数据,其中,包括70段癫痫发作时的EEG信号以及70段癫痫发作间隙的EEG片段,这些片段均为1 s段,采样频率为500Hz,对1s段进行TWQT分解与小波重构,参数设置为Q=1.5,r=1,J=9,即进行9阶TWQT分解,采用与上述实验相同的方式计算各个子带的中心频率,结果见表6。

选取包含于癫痫异常波段频率范围内的第7~9条子带进行小波重构,并在重构后的信号上提取排序熵和规则性指数作为特征,参数设置为m=5,r=1。采用准确率、特异度、灵敏度和AUC值作为评价指标,并且将结果与先前在同样数据集上实验的方法进行比较,最终得到的结果如表7所示。 可以看出, 本文所采用方法的準确度低于应用CNN进行分类的方法,高于应用RNN进行分类的方法,并且在灵敏度、特异度以及AUC值上取得了更好的结果。

相比神经网络这种需要大量数据来确定最优参数和复杂网络结构的深度学习方法,本文通过TWQT分解和提取熵特征的方法取得了较好的分类结果,在利用PE和OI共同作为特征输入时达到99%的最高准确率以及97.9%的灵敏度,而特异度达到了100%,0.992的AUC值也表明该分类方法具有较好的分类效果。

3 结 论

近年来,在癫痫发作的自动诊断中,通过机器学习的方法对正常脑电信号和癫痫发作间期脑电信号进行分类取得了显著的成果,而基于人工神经网络的深度学习方法提供了一种癫痫发作检测的新模式,在不用提取特征的条件下便能得到很高的分类准确率,但在应用时需要通过大量数据确定最优参数和网络结构。本文基于小样本数据集和仅采用熵特征作为分类依据,引入灵活的TWQT对脑电信号进行分解,并且根据癫痫异常波段对应的频率范围选择相应的小波子带进行重构[16],提取重构信号的排序熵和规则性指数作为特征,采用多种分类器进行分类。选择波恩大学癫痫研究中心的公共数据集进行验证,最终的分类准确率达到了99.3%。作为进一步阐释本文方法可行性的依据,采用UPenn and Mayo Clinic′s Seizure Detection Challenge数据集再次实验,最终达到99%的准确率。

作为一种实现癫痫发作自动检测的方法,本研究不仅取得了有效的分类结果,并且表明癫痫发作间期和癫痫发作期的脑电信号在复杂度上具有显著差异,与发作间期相比,癫痫发作期的EEG序列的PE值降低,OI值升高,说明其脑活动的复杂度降低。这种差异可能表现为癫痫患者的认知障碍。本文提出的熵特征算法可以作为检测癫痫发作的指标,对于癫痫患者的早期诊断和有效治疗都具有一定的指导意义。

参考文献:

[1] 孙殿荣, 邹晓毅. 癫痫发病机制的研究进展[J].华西医学, 2004,19(3):524-525.

SUN D R,ZOU X Y.Advances in pathogenesis of epilepsy[J].West China Medical Journal,2004,19(3):524-525.

[2] 黄瑞梅, 杜守洪, 陈子怡, 等. 基于支持向量机的癫痫脑电信号模式识别研究[J].生物医学工程学杂志, 2013,30(5):919-924.

HUANG R M,DU S H,CHEN Z Y,et al.Study on pattern recognition of epileptic EEG based on support vector machine[J].Journal of Biomedical Engineering,2013,30(5):919-924.

[3] 赵建林, 周卫东, 刘凯, 等. 基于 SVM和小波分析的脑电信号分类方法[J].计算机应用与软件, 2011, 28(5):114-116.

ZHAO J L,ZHOU W D,LIU K,et al.Classification of EEG signals based on SVM and wavelet analysis[J].Computer Applications and Software,2011,28(5):114-116.

[4] 陈万忠, 王晓旭, 张涛. 基于可调 Q因子小波变换的识别左右手运动想象脑电模式研究[J].电子与信息学报, 2019, 41(3):530-536.

CHEN W Z,WANG X X,ZHANG T.Study on EEG pattern of left and right hand movement recognition based on tunable Q factor wavelet transform[J].Journal of Electronics and Information Technology, 2019, 41(3):530-536.

[5] HE W P,ZI Y Y,CHEN B Q,et al.Automatic fault feature extraction of mechanical anomaly on induction motor bearing using ensemble super-wavelet transform[J].Mechanical Systems and Signal Processing,2015, 54-55(5):457-480.

[6] HE W P, ZI Y Y, CHEN B Q, et al. Tunable Q-factor wavelet transform denoising with neighboring coefficients and its application to rotating machinery fault diagnosis[J].Science China Technological Sciences,2013,56(8):1956-1965.

[7] PATIDAR S,PANIGRAHI T.Detection of epileptic seizure using Kraskov entropy applied on tunable-Q wavelet transform of EEG signals[J].Biomedical Signal Processing and Control, 2017,34(4):74-80.

[8] PEKER M, SEN B H, DELEN D. A novel method for automated diagnosis of epilepsy using complex-valued classifiers[J].IEEE Journal of Biomedical and Health Informatics, 2016,20(1):108-118.

[9] SHARMA M, PACHORI R B, RAJENDRA ACHARYA U. A new approach to characterize epileptic seizures using analytic time-frequency flexible wavelet transform and fractal dimension[J].Pattern Recognition Letters, 2017, 94(15):172-179.

[10]JIA J, GOPARAJU B, SONG J L, et al. Automated identification of epileptic seizures in EEG signals based on phase space representation and statistical features in the CEEMD domain[J].Biomedical Signal Processing and  Control, 2017, 38:148-157.

[11]MUTLU A Y. Detection of epileptic dysfunctions in EEG signals using Hilbert vibration decomposition[J].Biomedical Signal Processing and Control, 2018, 40(2):33-40.

[12]JANG H J, CHO K O. Dual deep neural network-based classifiers to detect experimental seizures[J].The Korean Journal of Physiology and Pharmacology, 2019,23(2): 131-139.

[13]ULLAH I,HUSSAIN M, QAZIE U, et al.An automated system for epilepsy detection using EEG brain signals based on deep learning approach[J].Expert Systems with Applications,2018,107(10):61-71.

[14]HUSSEIN R, PALANGI H, WARD R K, et al. Optimized deep neural network architecture for robust detection of epileptic seizures using EEG signals[J].Clinical Neurophysiology, 2019,130(1):25-37.

[15]SELESNICK I W.Wavelet transform with tunable Q-factor[J].IEEE Transactions on Signal Processing, 2011,59(8):3560-3575.

[16]賀王鹏, 杨琳, 王芳, 等. 基于 TQWT的癫痫脑电信号的识别[J].生物医学工程研究, 2017, 36(4):346-350.

HE W P,YANG L,WANG F,et al.Recognition of epileptic EEG based on TQWT[J].Journal of Biomedical Engineering Research, 2017, 36(4):346-350.

[17]CAO Y H, TUNG W W, GAO J B, et al. Detecting dynamical changes in time series using the permutation entropy[J].Physical Review E, 2004, 70(4):046217.

[18]LI D, LI X L, LIANG Z H, et al. Multiscale permutation entropy analysis of EEG recordings during sevoflurane anesthesia[J].Journal of Neural Engineering, 2010, 7(4):046010.

[19]BANDT C, POMPE B. Permutation entropy: A natural complexity measure for time series[J].Physical Review Letters, 2002,88(17):174102.

[20]OUYANG G X, DANG C Y, RICHARDS D A, et al. Ordinal pattern based similarity analysis for EEG recordings[J].Clinical Neurophysiology, 2010,121(5):694-703.

[21]李航. 统计学习方法[M].北京: 清华大学出版社, 2012: 111-112.

[22]BREIMAN L.Random forests[J].Machine Learning,2001,45(1):5-32.

[23]SVETNIK V,LIAW A,TONG C,et al.Random forest: A classification and regression tool for compound classification and QSAR modeling[J].Journal of Chemical in  Formation and Computer Sciences, 2003,43(6):1947-1958.

[24]CHEN T Q, GUESTRIN C. XGBoost: A scalable tree boosting system[EB/OL].2016: arXiv:1603.02754[cs.LG].https:∥arxiv.org/abs/1603.02754.

[25]HASSAN A R,SUBASI A.Automatic identification of epileptic seizures from EEG signals using linear programming boosting[J].Computer Methods and Programs in Biomedicine,2016,136:65-77.

[26]YUAN Q, ZHOU W D, LI S F,et al. Epileptic EEG classification based on extreme learning machine and nonlinear features[J].Epilepsy Research, 2011,96(1):29-38.

[27]ZHU G H, LI Y, WEN P. Epileptic seizure detection in EEGs signals using a fast weighted horizontal visibility algo-rithm[J].Computer Methods and Programs in Biomedicine, 2014,115(2):64-75.

[28]SIUL Y,LI Y,WEN P P.Clustering technique-based least square support vector machine for EEG signal classification[J].Computer Methods and  Programs in Biomedicine,2011,104(3):358-372.

[29]KUMAR Y, DEWAL M L, ANAND R S. Epileptic seizure detection using DWT based fuzzy approximate entropy and support vector machine[J].Neurocomputing, 2014,133(8):271-279.

[30]SONG J L,ZHANG R.Application of extreme learning machine to epileptic seizure detection based on lagged Poincare plots[J]. Multidimensional Systems and Signal Processing, 2017, 28(3):945-959.

[31]ORSHEA A, LIGHTBODY G, BOYLAN G, et al. Investigating the impact of CNN depth on neonatal seizure detection performance[C]∥2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC). Honolulu:IEEE, 2018: 5862-5865.

[32]ZHOU M N, TIAN C, CAO R, et al. Epileptic seizure detection based on EEG signals and CNN[J].Frontiers in Neuroinformatics, 2018, 12:95.

[33]CAO Y Z, GUO Y X, YU H, et al. Epileptic seizure auto-detection using deep learning method[C]∥2017 4th International Conference on Systems and Informat-ics (ICSAI).Hangzhou:IEEE, 2017:1076-1081.

[34]CHO K O,JANG H J.Comparison of different input modalities and network structures for deep learning-based seizure detection[J].Scientific Reports, 2020, 10(1):122.

[35]STROBLC,BOULESTEIXAL,ZEILEISA,et al.Bias in random forest variable importance measures: Illustrations, sources and a solution[J].BMC Bioinformatics, 2007,8(25):25.

(編 辑 李 静)

猜你喜欢
随机森林支持向量机
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
软件(2016年7期)2017-02-07 15:54:01
拱坝变形监测预报的随机森林模型及应用
基于改进支持向量机的船舶纵摇预报模型
中国水运(2016年11期)2017-01-04 12:26:47
基于SVM的烟草销售量预测
软件导刊(2016年11期)2016-12-22 21:52:38
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
价值工程(2016年32期)2016-12-20 20:36:43
基于熵技术的公共事业费最优组合预测
价值工程(2016年29期)2016-11-14 00:13:35
基于随机森林算法的飞机发动机故障诊断方法的研究
基于支持向量机的金融数据分析研究