心电信号识别分类算法综述

2018-02-21 01:54马金伟刘盛平
重庆理工大学学报(自然科学) 2018年12期
关键词:电信号心电特征向量

马金伟,刘盛平

(重庆理工大学 药学与生物工程学院, 重庆 400054 )

近年来心血管疾病发病率和致死率持续增长,且呈现年轻化趋势。心血管疾病主要以冠心病、高血压、心肌梗死和心力衰竭等为主,患者发病之前心脏往往会出现心律失常的情况。心电图可以比较直观地获取患者心脏的心电信息,反映测试者心率状况,有利于各类心脏疾病类型(如房性早搏、室性早搏、左束支传导阻滞、右束支传导阻滞等)的诊断和治疗,使患者尽早康复,乃至挽救患者的生命。因此,心电信号(ECG)的检测和分类具有极其重要的临床意义,也有利于促进心血管疾病的临床研究。

1 心电信号研究的内容及现状

1.1 心电信号提取与预处理

心电信号的采集是研究心电信号识别分类的基础,现在大多数学者研究过程中主要采用的心电信号来源于国际上较权威的4个心电数据库:美国麻省理工学院的MIT-BIH心率失常数据库、美国心脏学会的AHA心率失常心电数据库、欧盟的CSE心电数据库和欧盟ST-T心电数据库。也有部分学者以个人在临床上采集的心电信号为研究对象。心电信号的分类一般包括:提取心电信号→心电预处理→特征提取→算法分类等。

图1 心拍结构示意图

一般所采集的心电信号含有肌电干扰、50 Hz/60 Hz的工频干扰、基线漂移、放大电路的内部噪声和运动伪迹等干扰噪声,会影响到心电信号特征提取的准确性与识别率,因此需要对采集到的心电信号进行滤波去噪处理即预处理,防止干扰噪声对心电信号的识别分类的影响。心电信号的滤波方法可分为传统滤波方法和现代滤波方法。

FIR数字滤波器、IIR数字滤波器等属于传统滤波方法,而现代滤波方法则包括小波变换滤波、神经网络法及自适应滤波算法等。Sahu[1]采用卡尔曼滤波器、自适应滤波器和线性变换卡拉姆滤波器分别对心电信号去噪。研究表明:几种滤波器中卡尔曼滤波器对心电信号的滤波效果较为突出。尚余等[2]提出基于小波变换对心电信号的滤波处理,利用小波变换对频域信号处理上的优势,采用(dbN)小波变换对心电信号进行多重分解,并采用heursure规则阈值降噪和Minimaxi规则阈值降噪处理分解后的信号。朱翔等[3]提出采用FIR滤波器滤除低频的干扰成分(如肌电干扰)等,用IIR零相移滤波器滤除其他频率的干扰,在滤除噪声的同时防止心电信号的失真。彭云等[4]提出利用经典整体模式分解(EEMD)对心电信号处理,采用类似于小波变换中的硬软门限去噪方法,对几个高阶IMF分量做门限阈值处理,与小波变换算法相比,其自适应性不仅避免了众多小波函数选择上的困难,还使降噪后的信噪比得到改善,有效地滤除心电信号中的基线漂移。小波变换滤除基线漂移时,需进行信号的高尺度分解与重构,处理数据的过程中计算量大,而EEMD在基线漂移的处理上计算量小,速度快,性能优异。张磊磊等[5]针对心电信号微弱、含有大量噪声、非平稳性的特点,提出基于形态学和提升小波阈值法结合对心电信号进行去噪处理,通过形态学滤波器去除心电信号中的低频噪声,利用提升小波阈值法滤除心电信号中的高频噪声,经MIT-BIH心律失常数据库中的数据进行验证,结果表明:该算法最大地保留了心电信号中的特征信号,与传统的小波去噪方法相比,其去噪的能力更强,去噪后的心电信号质量更好。心电信号的预处理是实现心电信号分类的重要步骤,直接影响心电信号分类率。心电信号的滤波算法将会朝计算量小、运算时间短、性能优异的方向发展,以期实现更好的心电信号滤波处理。

1.2 心电信号特征参数的提取

心电信号的特征参数(如P波、QRS波、T波、QR斜率、RS斜率、RR间期)的准确提取是心电信号识别分类的关键[5]。目前,提取心电信号的特征参数的主要方法有神经网络法、小波变换法、经典模态分解(EMD)法、差分阈值法和模板匹配法结合法等。Ganesan等[6]采用EMD滤除心电信号干扰,增强心电信号有用成分,使用连续小波变换(CWT)实现了R峰精确检测,应用于MIT-BIH心电信号。结果表明:其能有效、快速地实现R峰的精确检测。孙括等[7]使用埃尔米特函数(Hermite functions)分解心电信号得到QRS特征向量,利用自组织神经网络确定QRS波形,准确地分解了QRS波形,但神经网络算法需要大量数据来训练,增加了算法的复杂度。王瑞荣等[8]利用小波变换和形态学滤波方法消除了肌电干扰、工频干扰和基线漂移等干扰,采用K-means聚类算法提取心电信号的QRS波、T波、P波等主要特征点,对QRS波、T波、P波的检测准确度分别达到了99.68%、91.01%、97.01%,表明该算法提取心电特征的准确度较高,具有重要的参考价值。Li等[9]提出一种简单便捷的ECG处理算法,其包括Haar小波变换(HWT)、模极大值检测(MMPD)和峰值位置修改(PPM)。利用HWT对心电信号分解得到HWT系数,引入MMPD在HWT系数中定位ECG峰值,而PPM用于校正时移提高波峰检测的准确性。经MIT-BIH心电样本验证,QRS检测灵敏度为99.53%,该算法具有较高的检测精度和较低的计算复杂度。王金海等[10]提出一种基于近似熵(ApEn)和经验模式分解(EMD)结合的心电特征提取新方法,对心电信号进行经验模态分解(EMD),得到有限个IMF分量,并计算IMF的近似熵,用近似熵代表心电信号的特征向量。但是这种方法提取的特征向量较少,没有注意时域特征。Rodriguez[11]给出一种新的QRS复合波的检测方法,可用于不同类型的心率失常特征提取。其算法首先是通过带通滤波器对ECG信号进行滤波,之后采用Hilbert变换和自适应阈值法对QRS波检测,最后实施主成分分析对ECG信号提取QRS波,采用MIT-BIH数据库里的19个不同的心电样本测试该算法。结果表明:QRS波的检测灵敏度为96.28%,识别率为99.71%,验证了其算法的有效性。心电信号特征的准确提取直接关系到下一步心电信号的识别分类,因此应注重提取心电特征,在提取心电特征时应当考虑到时频域特征,还有形态学等多方面的特征。

2 心电信号的分类算法

2.1 统计模式识别分类法

早在 20世纪90年代,统计模式识别分类法就已运用到心电信号(ECG)的分类研究中,其已成为心电信号识别分类领域的重要的分支。

统计模式运用于心电信号识别分类的识别方法主要有:支持向量机(SVM)、K近邻算法、独立成分分析(independent component analysis,ICA)、主成分分析(principal component analysis,PCA)、小波分析(wavelet analysis,WA)等。董彬等[12]采用基于多尺度化基本尺度熵(multiscale base-scale entropy,MBE)和希尔伯特-黄变换(Hilbert-Huang,HHT)结合提取心电信号特征值,利用离散小波变换对心电信号进行去噪处理,采用多尺度化基本尺度熵进行分析,提取多个尺度下的尺度熵值,再利用希尔伯特-黄变换得到边际谱的信息熵,并将这两部分特征输入支持向量机中,采用心律不齐患者、呼吸暂停患者和房颤患者、健康人的数据进行测试验证,其分类准确率分别为93.75%、90.63%、90.63%、87.5%。该法在ECG信号自动分类领域具有一定的应用前景,且支持向量机法算法简单、计算速度较快,为实现心电信号实时分类提供了可能性。其中,多尺度的基本尺度熵、希尔伯特边际谱熵表达式分别如式(1)~(3)所示。

(1)

(2)

(3)

式(1)中:yk代表序列y的第k个元素;δ为时间尺度因子;xi代表序列x的第i个元素,x代表去噪后长度为N的心电信号。式(2)中:x(t)代表心电信号,ci(t)为第i个IMF分量,r(t)为残差项。式(3)中:Re表示取实部;c(t)、w(t)是IMF分量变换后的幅值和相位;f(t)为IMF分量的瞬时频率。李哲[13]采用了一种心电信号的稀疏系数和最小二乘支持向量机(LS-SVM)对心电图(ECG)进行识别分类,LS-SVM的函数估计式、LS-SVM分类器的函数、LS-SVM径向核函数分别如式(4)~(6)所示。

(4)

(5)

(6)

式中,σ2表示核宽度,反映训练数据集的特性,对系统的泛化性有影响。求解得到的心电信号稀疏系数组成矩阵Dw=[Dn1,Dn2,Dn3,Dn4,Dv1,Dv2,Dv3,DA1,DA2,DA3,DL1,DL2,DR1,DR2]作为心电信号的特征向量,用其训练支持向量机(SVM)进行心电信号的识别分类,得到了98.93%的识别分类率,证明了稀疏基和支持向量机结合对心电信号识别分类的有效性。杨宇等[14]采用离散小波函数对心电信号进行多尺度分解除噪,并利用差分阈值法定位心电信号R峰,选取ST段平均值、ST段面积和ST段斜率作为特征值训练支持向量机。实验结果表明:ST段总体识别率为91.83%。该算法简单且适用性强。为了提高算法的分类精度,应当选择合适的心电信号特征向量及合适分类算法。

2.2 神经网络分类法

近年来由于人工智能的迅速发展为心电信号的识别分类引入了新的研究方法。人工智能中的神经网络算法是心电信号识别分类研究的一大热点,许多专家学者倾向于采用神经网络来研究心电信号。神经网络分为浅层神经网络和深度神经网络(又称深度学习)。在神经网络的训练过程中,需要大量的实验数据,往往需要结合大数据知识对其进行研究。袁丹阳[15]采用遗传算法改进神经网络对心电信号进行识别分类。利用小波包分解法对心电信号进行尺度分解,同时结合统计分析计算小波包分解后第4尺度上的小波包系数的奇异值、标准差和最大值,并将小波包系数统计特征组成心电特征向量。经MIT-BIH心律失常数据库里的心电数据测试,对正常心跳、右束支传导阻滞、左束支传导阻滞、起搏心跳、室性早搏和房性早搏进行分类,结果表明:测试集的识别准确率为97.78%,平均灵敏度、平均特异度和平均阳性预测值分别为97.66%、99.54%和97.81%,表明该算法能准确提取心电特征值,并能对心电信号进行有效的识别分类。李彩玉[16]研究了双正交小波变换和径向基函数神经网络(RBF)对心电信号进行识别分类,选取QRS、RR间期、平均RR间期等特征向量训练RBF神经网络,结果表明其对几种常见的心脏病的识别率都在85%以上,对室性早搏识别率达99%,取得了良好的心电信号识别分类率。樊承柱[17]使用CCDD数据库避免了因心电样本较少带来的学习不足问题。将心电信号直接投入卷积神经网络训练,在卷积神经网络中提取心电信号特征,避免了人工提取心电特征的失误。结果显示:对CCDD数据库里的心电类型进行分类,其准确度达到了82.5%,对MIT-BIH数据库进行分类的准确度达到了98.82%。但采用卷积神经网络对心电信号进行识别研究,需要大量的样本数据,训练时间长,网络不易收敛。Rahhal等[18]采用了一种深度神经网络(DNN)来识别分类心电信号。采用自动编码器从心电样本中学习合适的心电信号的特征,同时引入了4个时间域的特征值:Pre-RR间隔特征值、Post-RR间隔特征值、局部RR间隔特征值和平均RR间隔特征值。与现有的心电分类识别技术相比,Rahhal等所提出的深层神经网络(DNN)具有的较强的鲁棒性和泛化能力,对心电信号的识别分类率较高。Kher等[19]采用小波变换提取ECG信号中的运动伪影,并使用Gabor变换提取运动伪影的特征值,送入人工神经网络(ANN)训练和识别,整体的识别分类率为92%,说明了人工神经网络可用于心电图的识别分类。Cheng[20]给出了一种基于递归神经网络(RNN)的心电检测分类方法。引入时域特征向量RR间期,训练递归神经网络,采用灵敏度(Se)、特异性(Sp)和准确度(Ac)3个常见的性能评价标准来验证算法的有效性,其识别分类准确度达97.8%,表明该分类方法对心电信号具有良好的分类准确性。Yu等[21]引入ICA独立向量特征向量和RR间期特征向量,将独立向量(ICA)分别与概率神经网络(PNN)和BP神经网络(BPNN)结合对MIT-BIH里的心电信号进行分析。结果表明:概率神经网络和BP神经网络对心电信号分类的准确度均超过98%,但PNN的精确度、泛化能力及鲁棒性均优于BP神经网络,故PNN更适用于计算机的辅助诊断心脏疾病。Shadmand等[22]采用一种新的基于块神经网络(BBNN)和粒子群优化算法(PSO)对心电信号识别分类,采用Hermit基函数从ECG信号中提取心电特征值,将Hermit函数系数和RR间期作为BBNN神经网络的训练数据,利用粒子优化算法对BBNN神经网络的权值和阈值进行更新,PSO算法利用神经网络加快收敛速度,应用MIT-BIH心电样本进行验证,结果表明:BBNN对心律失常识别率达97%。Wang等[23]给出了利用极限学习机(ELM)识别室性早搏(PVC)与正常心电信号的方法,利用形态学与小波变换结合进行信号预处理,然后利用K-means聚类算法提取QRS波特征值。经MIT-BIH数据库里的心电数据验证,其算法能有效地识别PVC,检测率达95%。该算法具有良好的检测精度和实时性,在临床和移动医疗设备中有较高的研究和实用价值。Yun等[24]设计了一种基于深度置信网络(DBN)和形态学的心跳识别分类方法。每个心跳用QRS波、RR间期表示,结果表明:使用DBN得到的识别率为88.6%,验证了在深度学习中不需要提取心跳形态特征,从而解决了因形态特征导致心跳患者间差异的问题。Zhang等[25]采用循环神经网络(RNN)对心电信号识别分类,提取心电信号形态学特征,利用RNN来学习心电信号的时域特征并进行识别分类,经MIT-BIH数据库里的数据验证,其识别率达到99%,表明其方法是有效的。Yildirim[26]利用长短记忆神经网络(LSTM)对心电信号识别分类,用小波变换将心电信号分解成不同频率的系数,并将小波系数输入LSTM中学习,经MIT-BIH数据库里数据的验证,其识别率达到了99.39%,表明LSTM神经网络对心电信号识别是有效的。总体来说,神经网络对心电信号具有较高的识别分类率,但神经网络难收敛,容易出现过度拟合现象。神经网络在心电信号识别分类方面取得良好的效果,但是实际应用中,如果样本数据较少,神经网络难以学习样本数据特征,网络难以收敛;当样本数据充足时,则神经网络训练时间长,网络参数更新速度慢。

2.3 结构模式识别分类法

结构模式识别(亦称句法模式识别)也被广泛应用于心电信号的识别分类中,其根据所分类的对象包含的结构信息进行分类,结构模式比统计模式更加适用于时间序列数据的分类。史梦颖[27]采用时域特征和变换域非线性特征相结合的方法,通过经验模式分解和差分阈值相结合法提取QRS波群特征点,选取RR间期、QRS波群时限长度及心律变异性作为时域特征向量,同时采用近似熵及经验模式分解结合对其前6个本征模态函数近似熵计算,得到心电信号变换域非线性特征。采用粒子群优化算法对支持向量机进行改进,将得到的特征向量输入优化后的支持向量机进行测试,通过MIT-BHI数据库进行仿真。该算法能实现对心电节拍的准确分类。梁欢[28]针对心电信号特点提出了基于核独立成分分析结合离散小波变换提取心电信号特征的算法。采用主成分分析对核独立成分分析提取的非线性特征的数据进行降维,再通过小波变换提取第1尺度到第4尺度的细节系数和第4尺度的近似系数作为频域特征,用统计学方法分别取其最大值、最小值、平均值和标准偏差后得到20维频域特征,利用线性判别法将数据优化到4维,并作为特征向量。采用遗传算法对支持向量机进行改进,经MIT-BIH心律失常数据库里心电数据验证,对正常心电信号、右束支传导阻滞、左束支传导阻滞、心室早期收缩和心房早期收缩等5种信号进行分类。结果表明:分类器测试集的分类准确度为98.8%,达到了预期分类的效果。Chu等[29]采用循环频谱分析技术来捕捉心电信号的隐藏时间段(心电信号不易被检测到的时间段)。为了实现心律失常分类,提取了形态学特征、小波系数时域特征、循环谱相关心电特征。采用基于极限学习机的方法对10种心律失常情况进行分类,其中对MIT-BIH数据库里的5种心电信号总体平均分类准确率达到了98.13%。Desai等[30]采用离散余弦变换(DCT)对心电信号进行特征提取,并用主成分分析(PCA)降低特征维度,最后用K近邻法对心律失常进行分类,经MIT-BIH里的心电样本验证,其总体平均分类率为98.61%,证明离散余弦变换阈对心电特征提取是有效的,可提高心电信号识别分类率。结构模式对心电信号的识别分类算法多种多样,更加注重心电信号的时域特征和形态学信息,可取得较好的识别分类率。He等[31]提出了基于遗传模拟退火K-means改进聚类算法来识别心电图,利用小波算法检测QRS波、P波、T波等作为特征值,提高了特征点检测的准确度,同时聚类分析适合于大数据分析和良好的鲁棒性等特点,采用MIT-BIH数据库心电数据进行算法验证,结果表明:在心电图识别分类上,改进后的K-means聚类算法优于传统的K-means聚类算法。总体上说,结构模式在ECG识别分类中取得了良好的识别分类效果、泛化能力和鲁棒性。

表1 心电信号分类方法对比

表1对比了3种心电信号识别分类方法,结构模式识别是根据心电信号的结构信息进行分类。结构模式比统计模式更易于对时间序列数据进行分类,因此结构模式比统计模式更能利用心电信号的时域特征信息。统计模式识别是提取心电信号特征向量,依据分类错误寻找最佳的分类判别函数,从实验结果来看,统计模型的识别率高,但是直接应用于实际环境中难以达到较好的效果。在实际应用中神经网络难以确定最优的网络结构,训练数据和实际数据存在较大的差异,将其应用到实际问题中也难以得到满意的效果,因此进一步限制了神经网络在心电信号识别分类中的应用。

3 结束语

本文总结归纳了常见心电信号识别分类的方法。首先对各种心电信号去噪方法的优缺点进行了描述,阐述了心电信号分类模型建立的关键问题,即特征的准确提取与表示方法。心电信号(ECG)特征提取与表示方法一般从时域与频域两方面入手,常以ECG波形的斜率变化、面积大小、RR间隔等作为特征值。同时也详细地阐述了心电信号识别分类方式,统计模式分类法对心电信号识别分类的准确度高,但泛化能力不足,应用于临床中较难达到预期效果。近年来,神经网络法在ECG分类识别中发展迅速,其识别分类的准确性和适应性均达到良好的效果,但神经网络模型在实际应用中需要进一步解决不易确定最优的网络结构问题。同时,当心电数据样本较少时,会导致神经网络学习不足,容易出现过度拟合现象,从而影响其在实际心电信号分类中获得满意的准确率。这些因素干扰了神经网络法在ECG分类识别的进一步应用。结构模式识别分类法在心电信号识别中取得了较高的识别率,但其算法复杂、计算量大,不易应用到实际中去。提取合适的心电信号特征值,结合人工智能和大数据等,建立新的心电信号分类模型提高ECG分类识别率,并将其应用于实际临床是今后研究和发展的主要方向。

猜你喜欢
电信号心电特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
基于联合聚类分析的单通道腹部心电信号的胎心率提取
心电向量图诊断高血压病左心室异常的临床应用
基于非接触式电极的心电监测系统
穿戴式心电:发展历程、核心技术与未来挑战
基于Code Composer Studio3.3完成对心电信号的去噪
更正启事
一类特殊矩阵特征向量的求法
基于随机森林的航天器电信号多分类识别方法