一种基于改进深度卷积神经网络的室性早搏检测算法

2019-11-12 05:02吴义满徐瑶瑞
计算机应用与软件 2019年11期
关键词:心电布雷代价

吴义满 徐瑶瑞

1(江苏医药职业学院医学影像学院 江苏 盐城 224000)2(盐城市第一人民医院设备科 江苏 盐城 224000)

0 引 言

室性早搏是一种心律失常现象,是由心室中的异位起搏点过早发出电冲动引起的,危害性较大。因此,及时准确地诊断室性早搏对于临床治疗具有重要意义。传统的室性早搏识别主要是通过特征分析与分类器进行识别,即人为地设计并提取QRS波宽、波峰间隔和心电周期等诸多参数,仅为室性早搏的信号外部形态特征,特征分析易产生较大偏差而导致分类失败[1]。

近年来,深度学习理论深入发展,为信号处理领域的特征分析提供了有效的理论和方法。深度神经网络的自适应特征提取能力受到了广泛的关注与研究,在很多信号处理任务中取得了优良的效果,远远超过了人工特征处理方法[2]。卷积神经网络是一种被广泛应用的深度神经网络,通常用于图像处理任务,且所挖掘的特征对图像平移、旋转和缩放等操作具有鲁棒性[3]。Kiranyaz等通过采用卷积神经网络方法来构建特征心电分类,在MIT-BIH心电数据库的室上性异位与室性异位心拍心拍识别中取得了良好的识别率[4]。文献[5]首先通过多层一维卷积神经网络来提取心电信号特征,然后采用SoftMax分类器进行分类,使MIT-BIH心电数据库的心拍分类性能得到了提高,但识别率与灵敏度不够理想。文献[6]提出了一种并行多通道的卷积神经网络分类结构,在BIDMC数据集上的检测准确率达到94.65%。上述研究将一维心电时域数据进行处理,由于卷积神经网络的全链接层要求在训练时输入的心电数据为固定长度,病理特征在时域上往往随机出现,截取的数据经常发生有效信息丢失。而且由于心电信号极其微弱,在采集过程中容易受到干扰,造成特征信息发生变形,一维时域序列的直接输入处理使CNN鲁棒性较差[7]。此外,深度学习算法对训练样本数据量要求比较高,一般数十万级别的样本量才能使深度学习模型获得良好的性能。实际中的室性早搏检测,其训练数据往往较少,卷积神经网络在训练时往往过拟合造成性能急剧下降,即泛化能力差[8]。

本文提出了一种改进的卷积神经网络室性早搏检测算法。该算法模型首先通过经验小波变换实现了心电信号的自适应分解进而得到时频二维数据,分析了室性早搏与正常心电信号的差异性,并以此取代传统一维数据作为网络训练输入,避免了心电信号的信息损失问题。然后利用二维卷积神经网络进行心电信号的特征自适应提取,且在网络代价函数中引入布雷格曼散度以解决传统交叉熵代价函数在小样本训练时的性能下降问题。最后该算法在心电数据库MIT-BIH上进行了训练,并对该算法进行了性能评估。

1 心电信号时频数据计算

1.1 经验小波变换

经验小波变换的优势在于:解决了传统模态分解存在的模态混叠问题,以达到信号分解过程更具鲁棒性。理论基础是自适应模态分解与小波分析理论[9]。经验小波变换表达式表示为:

(1)

式中:固有模态函数为调幅调频信号,即为:

fk(t)=Fk(t)cos(φk(t))

(2)

式中:Fk(t)>0,φk(t)>0。该变换实质上是自适应地把信号分解成多个本征模态函数的组合和形式。

1.2 心电信号时频数据计算

从MIT-BIH心电数据库中的选取部分室性早搏心拍数据去除基线漂移和高频噪声等简单预处理得到室性早搏心拍时域波形,如图1所示。心电周期中的波形状态和间期时间表征着心脏的各种生理状况,若心脏发生病变或受到某些刺激都会使心电信号发生相应的变化[10]。典型的室性早搏心电特征有:① QRS波群提前出现,导致波形形态变化;② QRS波群间期T常大于0.12 s[11]。

图1 室性早搏心拍时域波形

对室性早搏心拍时域数据进行EWT分解,可得到一系列子分量信号如图2所示,依次从低频向高频的顺序显示。

图2 室性早搏心拍EWT分解结果

对运用经验小波变换方法分解得到的心拍子分量信号进行Hilbert变换,可以得到子分量Hilbert谱数据:瞬时频率和幅度函数。对所有心拍子分量信号的Hilbert谱数据进行相加,就得到通过经验小波变换得到的时频谱数据。图3和图4分别为室性早搏心拍与正常心拍EWT时频谱,时频谱中表达了丰富的时频特征变化信息。心拍信号的瞬时频率实质上是由心室原始振动频率决定[12]。因此,若将EWT时频二维数据作为卷积神经网络的输入,可以进一步自适应地挖掘出心脏的振动特征变化参数。而且,二维数据类似于图像,可在不丢失时频信息的情况下对其进行缩放以满足卷积神经网络的输入大小,避免了一维数据截取时的信息损失问题。

图3 室性早搏心拍通过EWT变换后的时频谱

图4 正常心拍通过EWT变换后时频谱

2 二维卷积神经网络特征提取

2.1 卷积神经网络

卷积神经网络的由三个部分构成:输入层、中间层及输出层。其中,中间层由卷积层、池化层、全连接层构成。卷积层通过卷积运算得到输入数据的不同特征。在一定范围内,卷积层数越多,则能够获得更为抽象的深度特征表达。但过度增加卷积层数也会降低网络准确性,造成特征表达性能饱和甚至下降[13]。

池化层主要实现特征降维,减小过拟合,同时提高模型的容错性。池化操作是神经元针对局部接受域进行的,常用的池化方法有均值池化、最大池化、随机池化等[14]。

2.2 特征提取

卷积层与池化层的运算过程如图5所示。卷积层首先对输入数据进行卷积运算,再经过加入偏置部分得到输出。池化层的采样过程: ① 使用对应区域位置内数据的最大值或平均值等降采样得到对应的数据。② 通过加权,再加上偏置部分。③ 利用激活函数得到降采样后的数据特征。而取样层类似于二次特征提取,去除特征冗余维度的同时增加了特征鲁棒性。

卷积神经网络所提取的特征数据经全连接层后,一般是利用Softmax函数结合交叉熵代价函数进行有监督分类识别。在这个过程中涉及到:① 训练的方法:反向传播算法。② 调整的对象:训练过程中不断的调整优化网络权重参数。调整参数的依据为每次迭代训练更新权值时,调整网络各层的参数使训练输出值和输入标签误差尽量小。③ 训练的目的:减小类内距离并尽可能地增加类间距离,使模型能够有效获取区别能力更强地特征量,较好地实现后期样本的分类识别。

图5 卷积与取样过程示意图

3 基于布雷格曼散度的特征学习优化

3.1 代价函数

设卷积神经网络的心电信号样本集为:

{(x1,y1),(x2,y2),…,(xm,ym)}

其类别为正常心电信号和室性早搏心电信号。其中,y表示样本信号,x表示类别标签,则其基本代价函数为:

(3)

式中:W为卷积神经网络的各层权值参量,b为网络偏置项,hW,b(xi)为卷积神经网络的输出预测值。网络的训练过程即利用随机梯度下降等方法,最小化J(W,b),进而得到最优的网络权值与偏置项。因此,网络代价函数直接决定了最终的网络优化结果,亦直接影响了最终的模型分类能力。在小样本情况下,传统的交叉熵代价函数往往会造成网络过拟合等造成性能下降严重,因此有必要寻找性能更优的代价函数形式。

布雷格曼散度是一种距离失真函数。设样本p与类别q,利用布雷格曼散度便可以有效度量令p属于类别q而导致的距离失真,因此布雷格曼散度可以用作卷积神经网络的代价函数。

定义函数F:Ω→R。其中,Ω为凸集,F为严格凸二次可微函数。则布雷格曼散度可表示如下:

d(p,q)=F(p)-F(q)-<▽F(q),(p-q)>

(4)

式中:▽F(q)表示函数F在q处的梯度,(p-q)表示两个向量的差,<▽F(q),(p-q)>表示▽F(q)与(p-q)的向量内积结果。

3.2 特征学习优化

布雷格曼散度是F函数与该函数的线性近似(一阶泰勒展开式)之差。若令F(p)=‖p‖2,则布雷格曼散度即为欧氏距离函数:

d(p,q)=‖p-q‖2

(5)

假设卷积神经网络所输入的样本数据y∈RD,输出的特征为Γ∈RM,可利用Γ=fγ(y)表示由输入样本至输出特征的映射函数,其中γ表示待优化的网络参数。文献[15]的研究表明,在数据分类过程中,使用布雷格曼散度可使样本至类别均值中心的损失到达最小,即利用布雷格曼散度作为代价函数可以获得最优的类别表达,使样本分类能力达到最佳化。

如图6所示,令Ck,k=1,2表示类别均值中心向量,即:

(6)

式中:n表示第k个类别所属样本的数量。如果能够得到最佳化的类别中心Ck,则对于新输入的样本数据p,通过计算其与类别中心Ck的布雷格曼散度即能实现有效分类。

图6 基于布雷格曼散度的特征优化学习示意图

在卷积神经网络的训练过程中,考虑到Softmax函数则有:

(7)

式中:Sγ(k|y)表示输入样本y属于第k个类别的概率。因此,在样本集的特征训练过程可以看作对于已知类别的样本y,最小化网络代价函数J(γ)=-log(Sγ(k|y))的过程。则相应的网络代价函数为:

(8)

训练过程中使用随机梯度下降法,基本迭代过程可表示如下:

(9)

式中:α为卷积神经网络的学习速率。

训练过程中先进行前向传播,由输入数据得到网络输出值,并计算网络代价函数,然后由误差进行反向传播,调整权值参量,最终达到网络优化,使卷积神经网络的输出特征具有较好的分类能力。

4 实验分析

4.1 实验结果

为验证上述算法检测性能,实验数据来源选取MIT-BIH心电数据库部分心电数据。训练样本包括标注室性早搏心拍、正常心拍数据。性能评估样本选取除训练数据外的第116、201、205、221、223号共五组病人的心电数据。如图7所示,卷积神经网络的输入为经验小波变换后的时频二维数据(大小为256×256),包含两个卷积层与两个池化层,卷积核大小为128×128与48×48,池化层选用最大池化方法,初始网络学习速率取0.06。

图7 卷积神经网络结构图

分别采用传统交叉熵代价函数与布雷格曼散度代价函数且利用随机梯度下降法进行训练评估,其中,布雷格曼散度选取欧氏距离函数。性能评估采用文献[5]中的敏感度与阳性检测率参数。性能评估结果如表1所示。

表1 实验性能评估结果

其中,TP为正确检测的心拍数量,FP为错误检测的心拍数量,FN为漏检的心拍数量,CE为传统交叉熵函数,BD为布雷格曼散度代价函数。

4.2 实验分析

评估结果表明,本文代价函数情况下的总体敏感度与总体阳性检测率分别为96.39%、97.25%,均优于传统交叉熵代价函数,因此基于布雷格曼散度的代价函数在训练样本有限的情况下具有更好的识别性能,即使用改进后的代价函数能够计算得到更强的信号表征信息。此外,二者的性能均优于文献[5]的识别结果,显示出基于经验小波变换的二维时频数据输入较之一维数据保存了更完整的特征信息,因此训练后的网络模型具有更佳的特征识别能力。特别地,二维数据的输入避免了一维数据的QRS波群检测过程,因此不会因误检而影响特征提取,故在干扰较多的第221号病人数据上仍有良好的检测率。

通常情况下,当待识别的病人心拍数量增大时,FP与FN容易增加。整体来看,本文算法在五组病人的数据中的检测性能浮动较小,特征提取与识别性能较为稳定,具有良好的鲁棒性,对于临床检测具有一定意义。

5 结 语

心电信号中包含了诸多心脏生理病变的信息,通过经验小波变换将心拍信号的自适应分解以获得二维训练数据,并利用布雷格曼散度作为卷积神经网络的代价函数进行训练优化,在有限样本的情况下具有优良的室性早搏心拍识别性能。未来将继续针对其他类型的病变心拍数据进行数据采集、特征分析与检测研究。

猜你喜欢
心电布雷代价
基于融合模糊聚类算法的异常心电多频段弱信号快速捕捉方法
心电向量图诊断高血压病左心室异常的临床应用
卡片式智能心电采集仪
猜猜我有多爱你
爱的代价
在梅尔顿·莫布雷的孤独(外一首)
“声名大噪”的跑步神器?
幸灾乐祸的代价
代价
布雷博制动盘亮相上海车展