基于CNN与GRU降噪自编码的心电信号分类方法

2020-06-19 08:45燕婷王于超金中一
软件导刊 2020年4期
关键词:卷积神经网络

燕婷 王于超 金中一

摘 要:心电图是一种用来监测心脏活动的标准测试。心电图能够体现心脏异常,包括心律失常,心律失常是心律异常的通称。同一类型的心律失常在同一患者不同阶段的心电信号存在一定差异,不同患者同一类型的心律失常心电信号差异会更大,这对人工判断是一大挑战。提出一种基于降噪自编码的CNN与GRU结合的心电图分类方法,从公共数据库(MIT-BIH)中提取原始心电信号集中进行实验。该集合人为扩大到平均5类心跳实例,并过滤掉高频噪声。该方法对室上(S)和心室搏动(V)的准确率分别为99.49%、99.43%,灵敏度分别为90.55%、96.65%,精确率分别为91.04%、95.46%。结果表明,该模型与目前先进水平在性能上有较大提高,具有良好的可扩展性。

关键词:心电图信号;降噪自编码;卷积神经网络;门控循环单元

DOI: 10. 11907/rjdk.191995

开放科学(资源服务)标识码(OSID):

中图分类号:TP301

文献标识码:A

文章编号:1672-7800(2020)004-0075-04

Denoising Autoencoder ECG Signal Classification Method Based on CNN and GRU

YAN Ting, WANG Yu-chao, JIN Zhong-yi

(College of Computer Science and Engineering , Slzandong University of Science and Tech.nology , Qingda0 2665 1 0 . Ch.ina )Abstract: An electrocardiogram is a standard test used to monitor cardiac activity. An electrocardiogram can reflect cardiac abnormali-ties including arrhythruia . which is a general term f'or heart thythm abnormalities. The same tvpe of arrhythmia has a certain dif'ferencein ECG signals at different stages of the same patient. The difference in ECG signals between the same type of arrhythmia in differentpatients is greater, "-hich is a big challenge for manual judgment. Therefore. this paper proposes a method of ECG classification basedon CNN and G RU based on denoising autoencoders. The experiment is carried out in the original ECG signal extracted from a public da-tabase(MIT-BIH). This set was artificially expanded to average the numher of instances of Category 5 heartbeats and filtered out highf'requency noise. The accuracy of the method f'or the supraventricular (S) and ventricular beat (V) was 99.49% . 99.43, the sensitivitywere 90.55% . 96.65% . respectively and the accuracy rate were 91.04% . 95.46%. The experiment showed that compared with the ad-vanced level. the model ' s the perforruance has heen greatly iruproved and has good scalability.Key Words : ECG classif'ication; denoising autoencoder; convolutional neural network; gated recurrent unit

O 引言

在心臟疾病的临床诊断中,心律失常…有时表现为心脏功能的严重改变,如果不及时有效治疗,可能导致脑猝死或心脏猝死。因此,对心律失常的早期诊断、临床分析和治疗策略至关重要。心电图(ECG)是一种无创的廉价技术,常用来检测心律异常,测量一段时间内心脏的电活动。

心电图分类医学仪器促进协会(AAMI)[2]标准定义5种类型:正常(N)、心室(v)、室上(S)、正常和心室融合(F)和未知搏动(0)。现有的心拍分类方法主要是深度学习[3]方法,包括深度信念网络(DBNs)[4-5]、白编码器(DAE)[6-7]、卷积神经网络CNNs)[8-9]。深度学习在图像分类[10]、目标识别[11-12]、人脸识别等许多应用中效果很好。对分割后的ECGs采用11层卷积神经网络进行处理[13],最大精度达到93.18%。一个深度残差神经元网络[14-15]直接应用34层深度CNN对阵列进行分类,不需要任何复杂的预处理和特征工程步骤,这种方法通过使用比其它同类方法大500倍的数据集实现了心脏病学家级别的性能。

传统的ECG信号分类方法需要提前知道一定的信号先验知识,或经常需要专家进行手动标注,耗费大量时间,准确性和效率往往差异很大,且不利于穿戴式设备应用。基于这些不足,本文提出一种基于降噪白编码模式的CNN与GRU结合的心电分类方法,提高了心电图(ECG)信号分类准确性和效率,并有利于可穿戴设备应用。

1数据处理

1.1数据库选择

本文选用的MIT-BIH心律失常数据库[16]。包含48条半小时的2导联动态心电图记录,录音采样频率是360Hz,所有记录都包含原始心电信号,并由两名或两名以上心脏病专家分别进行逐拍标记,被标记的心跳总数为108655次。这些心跳分成15种不同的类型,如表1所示。4个记录(102、104、107和217)被排除在外,因为它们包含有节奏的心跳。剩下的44条记录分为训练集、测试集和验证集,本文选用的是导联Ⅱ。

1.2数据预处理

与文献[17-18]类似,所有心电信号都是先用200ms宽度的中值滤波去除P波和QRS波,再用600ms宽度的中值滤波去除T波。利用原始输入的ECG信号减去利用中值滤波器去除完的P波、QRS波和T波,得到的信号便是基线校正后的ECG信号。然后采用截止频率为35Hz的12阶低通滤波器去除电源线和高频噪声.最终得到本文所需要的ECG信号,如图l所示。

1.3数据分割

数据分割先要进行R峰检测。由于在MIT-BIH数据库中给出了准确的R峰位置,因此本文直接使用原有的R峰位置划分心拍。在MIT-BIH数据库所给的R峰中,去除第一个R峰与最后一个R峰,取每个R峰与前一个R峰和后一个R峰的RR间隔的一半之和为一个心拍,运用插值法对剩余的n-2个心拍进行降采样,降为60维即一个心拍的长度为60,其中包含P-QRS-T波,如图2所示。众所周知,时间信息对于识别类签名非常重要,因此添加4个时间特性,即前RR间隔、后RR间隔、局部RR间隔和全局RR间隔。每一个R峰与前一个R峰的RR间隔为前RR间隔,与后一个R峰的RR间隔为后RR间隔,局部RR间隔是在lOs内通过滑动R峰窗口得到的所有R峰间隔的平均值。全局RR间隔是在5分钟内通过滑动R峰窗口得到的所有R峰中平均值,最终拼接成64维矩阵输入模型。

2模型

2.1降噪自编码模型

白编码模型是一种压缩再解压过程。本文的降噪白编码在训练过程中输入的数据有一部分是“损坏”的。DAE( Denoising Autoencoder)的核心思想是,一个能够恢复出原始信号的神经网络表达未必是最好的,能够对“损坏”的原始数据编码、解码,然后还能恢复真正的原始数据,这样的特征才是好的。选择降噪白编码原因是,白编码学习只是对输入的原始数据加以保存,并不能确保从中获得重要的特征表示;而降噪白编码器可以通过对输人数据加入噪声重构含有噪声的输入数据解决该问题。降噪白编码分为数据损坏、编码和解码阶段。

(1)原始数据“损坏”阶段。本文给原始数据加入15dB的高斯白噪声,如图3所示。

(2)编码阶段。对加入高斯噪声之后的ECG信号进行压缩,编码阶段公式如下:

(3)解码阶段。对进行编码后的ECG信号进行解压,解码阶段公式如下: 2.2 CNN模型

卷积神经网络是一种特征提取器,其中包含了卷积层和子采样层。在卷积神经网络的卷积层中,一个神经元只能与很少的部分神经元相互连接。CNN权值共享的特点减少了相应的训练参数,相同的权值可以使滤波器的检测结果不受信号位置影响,池化运算降低了网络的空间分辨率,从而消除了信号的微小偏移和扭曲。对输入数据的平移不变性要求不高,使训练出来的模型具有较强的泛化能力,卷积的矩阵尺寸如式3所示。

其中,w为卷积层的矩阵大小,F为卷积核大小,s为卷积核移动幅度,P为零填充边界宽度。

2.3 GRU模型

GRU模型是递归神经网络(RNN)的一种变体,GRU层有更新门和重置门两个门,相对于RNN而言,GRU可以很好地解决其梯度消失和梯度爆炸问题,因此GRU是对递归神经网络( RNN)的一种改进。重置门r可由公式(4)计算得到。

其中,r,是用來计算候选隐藏层的,即前一时刻隐藏层h,中的信息有多少保留在当前时刻 ,中;x,为f时刻隐藏层所输入的心电图信号,h,1为t时刻前一个时间点输出的心电图信号,W为重置门权值,U为f时刻的前一时刻隐藏层中重置门的权值。通过公式(5)计算更新门。

z,指前一个时间点隐藏层h,忘记多少信息,候选隐藏层 加入了多少信息。W,为更新门权值,U.为f时刻的前一个时间更新门权值,最终输出结果通过公式(6)计算得到。其中h见公式(7)。

式中,U为f时刻前一个时间点隐藏层权重,w为候选隐藏层权值。GRU不但在训练样本较少情况下可以防止训练出现过拟合,而且在训练样本多的时候可以节省训练时间。

2.4实验模型

本文采用基于降噪白编码的CNN与GRU结合的心电分类方法,在编码阶段使用两层卷积和两层GRU,在解码阶段仅使用两层卷积,在一定程度上节省了很多训练时间,实验模型如图4所示。

3 实验结果

通过对MIT-BIH数据库进行训练与测试,得到测试集的混淆矩阵如表2所示。

通过混淆矩阵可以算出测试集的准确率、精确率和灵敏度。准确率指分类模型中所有判断正确的结果占总观测值的比重;精确率指模型预测为positive的所有结果中,模型预测正确的比重;灵敏度指真实值为positive的所有结果中,模型预测正确的比重。由于在MIT-BIH数据库中,类F和Q在数据集中的比例非常小(小于1%),因此这两类分类性能对总体性能贡献不大。另一方面,S类和V类的比例更高(约10%)[19]。这两类包含了大多数心律失常,因此把重点放在这两类上。对比结果[20]如表3所示。

4 结语

本文采用基于降噪白编码的两层卷积神经网络和GRU神经网络,不仅提高了心电图(ECG)信号分类的准确性和效率,而且采用的两层卷积神经网络在一定程度上可以满足可穿戴设备应用。后续将从以下几方面进行深入研究:①多导联心电数据处理;②用可变窗口对心律失常变长进行分类;③分析更多导联(2-12)的心电信号片段;④在临床环境中对提出的方法进行测试。

参考文献:

[1]陈学琴.基于心电图分析的心率失常分类[D].北京:北京交通大

学,2011.

[2]DEANS. ZANDRA C. Recommended practice for testing and report-ing performance results of rentricular arrhmtmia detection algorithms[c].Arlington:Associatinn Advanc.ement Medical Instrumentation ,1987.

[3]张文辉基于深度学习的监控视频车辆实时监测[J].软件导刊,2019,18(7):37-40.

[4]HINTON G E. OSINDERO S Y.A fast learning algorithm for deep he-lief nets[J]. Neural Comput, 2006(18): 1527-1554

[5]朱龙飞,王鹏程.基于深度信念网络的脑电信号疲劳检测系统[J].计算机测量与控制,2019,27(5):26-29,34

[6]SWIETOJANSKI P, GHOSHAL A. RENALS S.Convolutional neuralnetworks for distant speech recngnition[J].IEEE Signal Process. Lett,2014(21):1120-1124.

[7]崔广新,李殿奎基于自编码算法的深度学习综述[J].计算机系统

应用,2018,27(9):47-51.

[8]SCHMIDHUBER J Deep learning in neural networks: An overview[J] Neural lYretw, 2015( 61):85-117.

[9]高硕,许少华.一种集成CNN模型及其在ECG信号分类中的应用

[J]软件导刊,2019. 18(7):24-27.

[lo]]杨鑫,杨晶东基于多分支网络的图像分类算法[J].软件导刊,

2019.18(7):56-59.

[11]BAI J,WU Y. ZHANG J,et al. Subset based deep learning forRCB-D object recognition[J]. Neurocomputing, 2015(165):280-292

[12]程嘉远,于小红.不确定性理论在通信目标识别中的应用[J]火力与指挥控制,2018,43(8):96-101.

[13]ACHARYA U R. FUJITA H. GERTYCH A. et al. Automated iden- tification of shockable and non-shockahle life-threatening ventricu-lar arrhvthmias using convolu tional neural network[J].Future Gener-ation Computer Svstems, 2018(79): 952-959.

[14]RAJPURKAR P. HANNUNr A. PREPRINT M H. Cardiologist-levelarrh\'thmia detection with convolutional neural netwnrks[DB/OL].https: //aixiv.org/pdf/1707 .01 836.pdf

[15]HE K.ZHANC X. REN S,et al. Deep residual learning for image rec-ognition[EB/OL].https: //blog.csdn.net/wspba/article/details/57074389.

[16]TAN J H. HACIWARA Y. PANG W,et al. Application nf stackedcon,'olutional and long shoit-tPrm memorv network for accurate iden-tification of CAD ECG signals[J]. Computers in Biology and Medi-cine. 2018(94):19-26.

[17] DE CHAZAL P.0'DWYER M,REILLY R B,Automatic classififi-cation of heartheats using ECC morphology and heartbeat interval fea-tures[J].IEEE Transactions on Biome dic al Engineering, 2004(51):1196-1206.

[18]DE CHAZAL P, REILLY R B A patient-adapting heartbeat classifi-fier using ECG morphology and heanbeat interval features[ Jl. IEEETransactions on Binmedical EWineering, 2006(53): 2535-2543.

[19]XL S S,MAK M W.CHEUNG C C Towards end-tr)-end ECG classi-fication with raw signal extraction and deep neural networks[J].IEEE Journal of Biomedical and Health Informatics, 2018(5):287-351

[20]ACHARYA L R, OH S L, HACIWARA Y. et al.A deep convolu-tional neural network model to classifv heartbeats [J]. Computers inBiology and Medicine,2017(89): 389-396.

(責任编辑:杜能钢)

收稿日期:2019-07-11

作者简介:燕婷(1995-),女,山东科技大学计算机科学与工程学院硕士研究生,研究方向为人工智能。

猜你喜欢
卷积神经网络
卷积神经网络语言模型研究
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法