摘 要:动态心电图,即使用动态心电图仪监控患者日常生活的24小时或者更长的时间中的心率活动情况所得到的波形图。动态心电图在临床上已由单导、双导发展为十二导联全记录。为了准确预测不同心电图的心电信息,研究并提出了一种利用改进深度学习网络,对十二导联心电信号进行心律失常的自动诊断,考虑到心电信号前后的相关性,提出利用LSTM网络结合CNN深度学习框架,并融合批归一化提高模型计算效率和准确性,最终达到很好的效果。
关键词:心电图;心律失常;长短期记忆;深度学习
Abstract:Dynamic electrocardiogram (Holter),that is,the waveform chart obtained by monitoring the heart rate activity of patients in 24 hours or more in their daily life by using dynamic electrocardiograph. Dynamic electrocardiogram (Holter) has been developed from single lead and double lead to 12-lead full recording. In order to accurately predict the ECG information of different electrocardiograms,an improved deep learning network is proposed to automatically diagnose arrhythmia of 12-lead ECG signals. Considering the correlation between ECG signals,LSTM network combined with CNN deep learning framework is proposed,and batch normalization is integrated to improve the calculation efficiency and accuracy of the model,and finally achieve good results.
Keywords:electrocardiogram;arrhythmia;long-term and short-term memory;deep learning
0 引 言
心脏内部的活动会产生的一系列活动在体表会形成不同的电位差,这些电位差被称为电信号。心电图仪则是通过将正负两电极置于人体的任何两点,再与心电图仪连接,描记出此人的心电图(ECG)。
目前国际上通用的动态十二导联心电图是对传统的心电图进行改进的方法,通过将电极分别置于人体的十二个部位来获得人体心率活动的情况,描述十二个部位的代号分别为:Ⅰ、Ⅱ、Ⅲ、avR、avL、avF、V1、V2、V3、V4、V5、V6。
医学上,心电图的作用在于医生可以通过它来判断患者的心脏是否存在病灶。与大多数时间序列类似,手动分析ECG信号的主要问题在于:从业人员难以检测和分类信号中不同的波形和形态,在诊断过程中既耗时又可能产生差错[1]。
因此,研究人员想到了利用计算机来对心电图进行分析、预測,由此判断患者心脏是否存在病灶。
在以往文献中多数研究者采用了机器学习的方法对心电图进行分析[2,3],常规的方法包括支持向量机[4]、决策树[5]和CNN[6]、LSTM[7]等,同时他们在分析前,采用了小波变换[8]、图形识别[9]、模板匹配[10]、能量阈值[11]等方法,但这些方法依旧存在缺陷,尚不成熟。
基于北京邮电大学信息网络中心进行的深度学习实验课题,本文提出了一种基于十二导联心电图的心率失常快速分类方法,笔者为了实现更快捷准确的进行心率判断,根据心电图自身的前后依赖特性,以及考虑到数据量大小以及神经网络的深度,在容易出现过拟合和梯度消失的问题上,将卷积神经网络和循环神经网络结合,并引入批归一化(Batch Normalization,BN)算法,用于解决以上问题。分类器是基于循环神经网络(RNN)以及卷积神经网络(CNN)所设计。将十二导联心电图的数据作为分类器的输入,将数据通过LSTM与池化处理,并在原有的基础上增加了批归一化层,以诊断结果为输出,加快模型拟合速度并且提高了模型准确率,使准确率达到99.55%。
1 方法
1.1 数据预处理
在信号采集的过程中,由于外界等各种原因,采集到的信号会伴随有噪音,这些噪音的存在会对最后实验的结果准确性造成影响,因此为了提高ECG信号的信噪比,进而提高实验的准确性,在数据输入神经网络之前,应先对其进行降噪处理,本文采用小波降噪的方法。如图1所示,小波降噪后的信号保留了原有信号中的有用数据,在一定程度上消除了部分噪音。
1.2 长短期记忆人工神经网络
长短期记忆人工神经网络(LSTM)是循环神经网络的变体,是为了解决RNN中存在的长期依赖而设计出的人工神经网络。与经典RNN有所不同的是,LSTM突破性的引入了门机制和记忆单元,为由于梯度消失和梯度爆炸问题导致的常规RNN网络在长期依赖问题中的困境提供了解决方法。
LSTM由遗忘门(forget gates)、输入门(input gates)和输出门(output gates)三种门结构保存历史信息,相关公式为:
其中,ft是遗忘门t时刻的状态值,it是输入门t时刻的状态值,W和b分别为对应的权值和偏置,σ为参数,xt是t时刻输入的数据,Ct是t时刻记忆单元的值, 表示输入门t时刻记忆单元的候选信息,ot是输出门t时刻的状态值,ht是t时刻LSTM的输出状态值,其中记忆单元的状态值是由输入门和遗忘门共同调节。
1.3 最大池化
池化(Pooling)是卷积神经网络中一个重要的部分,用于提取大量高纬度输入数据的关键部分,来缩小模型大小,提高计算速度,同时提高被提取特征的鲁棒性。其中最大池化(Max Pooling)为最常见的一种池化操作,将输入数据根据设定的卷积核划分为等大的几个区域,输出每个区域的最大值,并将这些最大值重新组合成为一个新的数据,池化层(Pooling Layer)可以不断减小数据大小,在深度学习中有效控制数据量和计算量,从而防止模型过拟合,如图2所示,为一次简单的最大池化操作示例,其中使用的为2×2卷积核,每一不同颜色的区域为每次不同的卷积操作区域。
1.4 批归一化
批归一化是谷歌公司在2015年提出的一个深度神经网络训练的技巧,把数据分成小批进行随机梯度下降,并且在每一批数据前向传递时,对其进行归一化处理[13]。该算法不仅加快了深度神经网络模型收敛的速度,而且在一定程度上缓解了神经网络中数据分布分散的问题,使得模型更加稳定,提高网络泛化能力。该算法还可以作为神经网络中的一层放在激活函数之前,流程主要为:对每一批次的训练数据计算获得其均值和方差,并归一化,最后对处理过的数据进行尺度变换和偏移,使其适应神经网络。
2 模型构建
本文使用的是LSTM网络和CNN结合并引入BN算法的方式,将十二导联心电图输入数据,看作多通道一维数据,因此本文使用的是一维卷积层和一维池化层提取心电信号。
构建模型如图3所示,输入层的输入维度为5 000× 12,由卷积层捕捉数据的大量局部关联信息,并且使用批归一化提高计算速度并提高模型鲁棒性;由长短期记忆层提取时序特征,并将这两个特征融合到全连接层,最后通过Softmax层的激活函数进行输出,加入批归一层提高计算效率,并降低过拟合可能性。
3 实验结果与分析
3.1 实验平台及评价指标
实验平台的硬件配置为2.4 GHz Intel Core i5,图形卡为Intel Iris Plus Graphics 655(显存1 536 MB),内存32 GB,操作系统为MacOS 10.14.6,模型基于Python语言的Keras框架实现。
在心电图判断模型中,一般使用准确率、特异性和灵敏度为指标对模型进行判断。混淆矩阵就是分别统计模型的归错部分和归对部分的观测值的个数,将结果反映在一张表格中,混淆矩阵的每一列代表了预测的类别,每一列的总数表示了预测为该类的数目,每一行代表着对应数据的真实类别,每一行的总数表示对应数据为该类的数目。
准确率(Acc)表示对于给定的测试集,模型准确分类的概率;特异性(Spe)表示负例被模型准确预测的概率;灵敏度(Sen)表示正例被模型正确分类的概率。
3.2 结果分析
图4中的混淆矩阵表示本文所用模型的判断结果。
其中这18类分别为窦性心律、窦性心动过缓、窦性心动过速、T波改变、电轴左偏、电轴右偏、窦性心律不齐、右束支传导阻滞、室性早搏、完全性右束支传导阻滞、左心室高电压、房性早搏、ST-T改变、ST段改变、一度房室传导阻滞、不完全性右束支传导阻滞、心房颤动、快速心室率。
可以注意到,由于数据样本数量的不平衡,模型对0、1、11、12的识别能力較好,这几种类别分别代表窦性心律、窦性心动过缓、房性早搏和ST-T改变。
表2总结了本文所提出的方法和其他文献中已有的判断方法的结果,从表中可看出,本文提出方法的数据预测能力更占优势。
4 结 论
传统学习方法分析心电信息主要分为特征提取以及分类两部分,其中分类一般采用传统机器学习方法或者传统CNN模型,前者为线性方法,容易造成特征的缺失,后者手段单一,并且容易学习效率和准确率都无法达到预期效果,本文采用LSTM与CNN结合,并创造性地引入BN算法的方式,既提高了计算速度,又克服了传统方法的缺陷,并且模型本身已有特征提取功能,并且很好地提取了数据上下文信息,最终达到的测试结果的准确率为99.55%,特异性为99.81%,灵敏度为98.66%。
本文提出的方法同时具有推广性和现实价值,适用范围广。在之后的研究中,深度学习网络结构的优化以及与医疗相关知识的学习都需要进一步优化,如在LSTM基础上添加Attention机制,解决输入序列较长时最终难以获得合理的向量表示的问题。
参考文献:
[1] ANNAM J R,SURAMPUDI B R. AAMI Based ECG Heart-Beat Time-Series Clustering Using Unsupervised ELM and Decision Rule [C]//International Conference on Information Technology.IEEE,2017.
[2] ESMAILI A,KACHUEE M,SHABANY M. Nonlinear Cuffless Blood Pressure Estimation of Healthy Subjects Using Pulse Transit Time and Arrival Time [J].IEEE Transactions on Instrumentation and Measurement,2017,66(12):3299-3308.
[3] DASTJERDI A E,KACHUEE M,SHABANY M. Non-invasive blood pressure estimation using phonocardiogram [C]//IEEE International Symposium on Circuits & Systems.IEEE,2017.
[4] 王金海,史梦颖,张兴华.基于EMD和ApEn特征提取的心律失常分类研究 [J].仪器仪表学报,2016,37(S1):168-173.
[5] PECCHIA L,MELILLO P,SANSONE M,et al. Discrimination Power of Short-Term Heart Rate Variability Measures for CHF Assessment [J].IEEE Transactions on Information Technology in Biomedicine,2012,15(1):40-46.
[6] ACHARYA U R,OH S L,HAGIWARA Y,et al. A deep convolutional neural network model to classify heartbeats [J].Computers in Biology and Medicine,2017,89(16):389-396.
[7] KIRANYAZ S,INCE T,HAMILA R,et al. Convolutional Neural Networks for patient-specific ECG classification [C]//Proceedings of the 37th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC).Milan,Italy:IEEE,2015.
[8] STOJANOVIC R,KARADAGLIC D,MIRKOVI? M,et al. A FPGA system for QRS complex detection based on Integer Wavelet Transform [J].Measurement ence Review,2011,11(4):131-138.
[9] CHRISTOV I,GóMEZ-HERRERO G,KRASTEVA V,et al. Comparative study of morphological and time-frequency ECG descriptors for heartbeat classification [J].Medical Engineering & Physics,2006,28(9):876-887.
[10] NAKAI Y,IZUMI S,NAKANO M,et al. Noise tolerant QRS detection using template matching with short-term autocorrelation [C]//Proceedings of the 36th Annual International Conference of the IEEE Engineering in Medicine and Biology Society.Chicago:IEEE,2014:250-255.
[11] CHOUHAN V S,MEHTA S S. Detection of QRS Complexes in 12-lead ECG using Adaptive Quantized Threshold [J].International Journal of Computer Ence & Network Security,2008(1):155-163.
[13] IOFFE S,SZEGEDY C. Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift [J/OL].arXiv:1502.03167 [cs.LG].(2015-02-11).https://arxiv.org/abs/1502.03167.
[14] 吳浪,曾超.EMD分解与IIR滤波器在心电信号预处理的应用研究 [J].福建电脑,2015,31(6):97-98.
[15] HANNUN A Y,RAJPURKAR P,HAGHPANAHI M,et al. Cardiologist-level arrhythmia detection and classification in ambulatory electrocardiograms using a deep neural network [J].Nature Medicine,2019,25(1):65-69.
[16] 张异凡,黄亦翔,汪开正,等.用于心律失常识别的LSTM和CNN并行组合模型 [J].哈尔滨工业大学学报,2019,51(10):76-82.
作者简介:余天效(1996—),女,汉族,湖北襄阳人,硕士研究生,研究方向:机器学习。