基于一维卷积神经网络的房颤智能诊断方法研究

2020-06-10 12:09谢胜龙张为民鲁玉军张文欣朱俊江任国营
计量学报 2020年5期
关键词:电信号特征提取房颤

谢胜龙, 张为民, 鲁玉军, 张文欣, 朱俊江, 任国营

(1.中国计量大学 机电工程学院,浙江杭州310018;2.浙江西子重工机械有限公司,浙江嘉兴314423; 3.中国计量科学研究院,北京100029;4.浙江理工大学 机械与自动控制学院,浙江杭州310018)

1 引 言

心房颤动(atrial fibrillation, AF)简称房颤,是临床上一种常见的心律失常现象,其发病率约为0.4%~1.0%[1]。房颤本身并不具备太多危害,但却是诸多高危疾病的诱因,随之而来的冠心病、脑卒中(中风)、心肌梗死等并发症,严重危害着人类的健康和生命安全[2]。因此,及时发现与预测房颤,具有十分重要的临床和社会意义。近年来发展起来的无线传感技术与可穿戴式数据采集设备推进了可穿戴式心电监护设备的研发与应用,使医疗信息呈几何倍数增长,人们进入了医疗大数据时代。然而,现有心电信号的诊断主要是在经过心电图仪及配套分析软件对心电图(electrocardiogram, ECG)中可疑波段初步筛选后,依靠医师的经验进行人工诊断,这严重制约了可穿戴式心电监护设备和移动医疗的推广。

由于产生房颤时,心电图信号主要表现为P波消失,取而代之的是一系列大小不一、方向不同和形态各异的心房紊乱激动波(f波)信号[3],因此,基于P波与f波的幅值、频谱信息首先被广泛应用于房颤诊断中。文献[4]基于P波特征,采用高斯混合模型对心电图信号进行分类研究,文献[5]采用经验模态分解的方法来提取P波分量及其相应参数来进行房颤诊断,均取得了较好的效果。王德玺等[6]为了提取f波,采用独立成分分析(ICA)以及ICA与二阶盲辨识法(SOBI)结合的2种盲信号分离方法对9位房颤病人的体表标测信号进行f波提取;然而,心房活动中的P波与f波信号幅度较小,极易受到各种噪声的干扰,因此实现精确的检测较为困难[7]。为此,学者们尝试借助于心电图其它波段信息进行房颤的诊断。师黎等[8]研究基于小波变换的心电信号R波及ST段等特征点的提取,该方法具有提取率高、适用面广的优点;任晓霞[9]提出一种基于概率随机舍弃神经元建立子网络的深度卷积神经网络,通过心电信号数据去噪、ST段候选段筛选、神经网络卷积与下采样运算过程,实现ST段波形样本训练与测试。但是,ST段相较于P波与f波更为微弱,且波形的变化形态十分复杂,尤其病人个体之间的差异比较明显,很难在临床应用中推广。由于房颤时心电图信号中RR间期绝对不规则,且R波幅值较大,因此RR间期的房颤诊断方法相对更为准确,且具有较强的鲁棒性,可实现移动端的房颤诊断。因此学者们开始逐渐利用RR间期特点进行房颤诊断。余晓敏等[10]在对单通道ECG信号进行QRS波检测和预处理后,得到RR间期信号序列,从中提取出相应的时频特征参数,归一化处理后采用支持向量机进行分类训练;陈志博等[11]提出一种基于RR间期的特征提取方法,该方法以稳健变异系数描述RR间期的离散程度,以偏态参数描述RR间期的分布形状,以Lempel-Ziv复杂度描述RR间期的复杂度,最后将上述3类特征值组成特征向量输入支持向量机分类器模型,实现房颤的自动分类检测;文献[12]通过使用RR间期信息熵、RR间期差概率密度分布和空白窗比率特征进行房颤分类研究,实现了95.90%的准确率。

尽管上述诊断方法相比传统的人工检测方法在效率和准确率上有了较大提高,但仍然依赖于人工特征提取与特征分类,需要相应的专家知识[11]。由于ECG信号在采集过程中容易受工频噪声、肌电噪声和基线漂移等干扰,以及受患者间个体差异大等因素的影响,前期特征提取效果往往受到很大的限制,从而导致诊断精度降低[13];而且很多方法多采用MIT-BIH中数据,仅对小样本测试效果良好,面向临床大数据诊断则效果下降,难以临床实际应用。近年来,深度学习(deep learning)因采用深度卷积神经网络(convolutional neural network, CNN)结构能够直接处理原始信号,实现对输入信号的逐层特征提取,摆脱了对人工特征提取和先验知识的依赖,从而创立了一种将预处理、特征提取和特征分类统一到一个框架下的端到端的智能诊断新方式[14~17]。魏晓玲等[17]采用基于多特征融合与卷积神经网络相结合的方法进行了房颤检测,取得了较好的效果;文献[18]基于穿戴式心电图监测器采集到的心电信号,采用34层深度残差网络对14种心律失常心电片段进行了分类学习研究;李端等[13]采用深度残差卷积神经网络完成了心律不齐多分类、室性异位搏动和室上性异位搏动等分类识别实验,取得了良好的效果。然而由于采用了深度神经网络,其识别率虽然得到了明显提高,但训练时间急剧增加,不利于房颤的高效诊断。本文在临床试验数据的基础上,针对心电信号数据RR间期特点提出一种基于一维卷积神经网络的房颤智能诊断方法,达到了良好的诊断精度。

2 心电图原理

心脏活动时会产生电激动,此电激动能引起体表电位的变化,按照心脏激动的时间顺序,将此体表电位记录下来,形成一条连续曲线,即为心电图。人体正常心电图波形如图1所示。

图1 正常心电周期图Fig.1 Normal ECG Periodogram

图1中的波段反映了正常心房和心室活动所对应的时间和周期。一个完整的正常心动周期包括心房除极、心室除极和心室复极,该过程分别产生P波、QRS波群和T波;几个关键的间期指标分别为PR间期、QT间期和ST段等。PR间期代表由窦房结产生的兴奋经由心房、房室交界和房室束到达心室,并引起心室开始兴奋所需的时间;QT间期是心室除极与复极过程的时间,代表心脏的电收缩过程;ST段代表心室各部分已全部进入去极化状态,此时心室各部分之间没有电位差,所以ST段曲线近似呈水平状态。

正常情况下,RR间期长度较为规则稳定。当发生房颤现象时,上述心电图会产生如下变化[19]:(1) RR间期绝对不规则;(2) P波消失,代之以一系列连续、快速(频率达350~600次/min)、不规则的心房激动波,称为颤动波(f波)。

由上述分析可知,当心脏出现心律不齐等问题时,心电活动的变化会清晰地反映在心电图上,各种波形形态会呈现明显的异化现象,其波形幅值、间期与周期均会发生显著变化,从而为医生诊断各种心脏疾病提供了可靠依据。

图2分别给出了正常的心电图、发生房颤时的心电图和发生室性早搏时的心电图。根据图1中的介绍,对比图2(a),图2(b)中心电图P波消失,且RR间期不规则,因此发生了房颤现象;在图2(c)中0.5~1 s时间段,其QRS波群正好落在窦性心律的T波上,且随后的ST段移位,抬高了约0.1 mV,这是室性早搏的典型特征,表明发生了室性早搏现象。传统的诊断方法需要具有专业知识背景的医生根据上述心电图进行人工判断,不仅效率低下,而且很容易因疲劳等因素产生误判。本文提出的智能诊断方法,只需输入诊断信号,经过卷积神经网络的训练筛选,即可通过层层特征提取,识别出房颤信号,从而提高诊断效率。

图2 正常与异常心电图Fig.2 The normal and abnormal ECG signal

3 神经网络模型

3.1 LeNet-5网络结构

一维LeNet-5网络结构如图3所示,包括特征提取层以及分类层2部分。网络深度5层,即2个卷积层和3个全连接层。特征提取层包括卷积层和池化层,接收处理后的心电信号,借助于卷积层中多个卷积核实现对心电信号的多维特征提取,得到多个特征矢量。最大池化算子用于降低特征矢量维数,同时提高非线性特征的鲁棒性。通过交替的两层卷积池化操作实现输入信号非线性特征的多级提取。本网络的分类层由3个全连接层组成,其中前2个全连接层用于对特征提取层所得特征的“展平”操作,即将所有特征矢量首尾连接组成一维向量;第3个全连接层的神经元个数与分类类别数目保持一致,用于最终的分类。

图3 一维LeNet-5网络结构图Fig.3 Structure of 1D LeNet-5 network

3.2 AlexNet网络结构

AlexNet是在LeNet-5网络基础上进一步增加了网络的深度与宽度,其网络结构如图4所示。它拥有8层结构,由5个卷积层和3个全连接层组成。其中卷积层1和卷积层2在每个卷积层后面附有局部响应归一化层(local response normalization, LRN)和最大池化层[20],最后一层全连接层用于分类。训练时采用dropout技术降低过拟合、修正线性单元(relu)提高网络训练速度、池化(pool)和归一化(norm)技术提高识别精度。

图4 一维AlexNet网络结构图Fig.4 Structure of 1D AlexNet network

AlexNet网络的卷积层1和卷积层2整体结构与LeNet-5网络类似,均是在卷积层后面加入池化层用于特征降维、压缩数据和参数的数量、减小过拟合,同时提高模型的容错性。不同的是经典的AlexNet网络还添加了局部响应归一化层以提高模型的泛化能力。随后的3个卷积层,是AlexNet网络同LeNet-5网络不同之处,通过添加3层卷积层,使得网络结构进一步加深、加宽,并在全连接层中辅之以Dropout技术随机忽略一部分神经元,以避免模型过拟合,从而进一步提高模型的识别精度。

由于本文房颤诊断属于二分类问题,只需判断心电信号是否发生了房颤。因此输出层采用sigmoid函数,其函数表达式为:

(1)

与经典的二维LeNet-5网络和AlexNet网络相比,为了适应一维的心电信号,本文构建的一维卷积神经网络做了如下修改:

(1) 采用一维卷积和池化以适用于一维振动时序信号。这样可以保证对原始一维时域信号的直接处理,避免对其进行二维转换,从而既减少了信号预处理的工作量,又避免原始信号序列中的空间相关性遭到人为破坏。

(2) LeNet-5网络中2层卷积层均采用较大尺寸的卷积核,以提取大尺度下的时域信号特征,特征图的个数随深度增加而增加。

(3) AlexNet网络中去掉LRN层。作为一种正则化手段,作者在调试过程中发现该方法对诊断精度影响不大,甚至精度会有所降低,但却大大增加了训练时间,原因在于LRN造成了神经网络的前馈和反馈速度急剧降低[21]。

3.3 网络参数设置

卷积神经网络的精度受卷积核的尺寸、数量以及卷积步长等网络结构参数的影响。一般情况下,较小的卷积核尺寸,较多的卷积核数量,较小的步长以及较多的卷积层数会使网络的性能有相应地提高,但是过多的卷积核和卷积层数也会造成过拟合以及训练速度减慢等弊端,所以需要合理调整网络参数,在提高分类精度的同时减少计算资源[22]。

一维LeNet-5网络中,第1层卷积层的卷积核尺寸和第2层全连接层的单元数对模型最终诊断精度影响较大;而一维AlexNet中,第3层和第4层的特征提取能力最强。若卷积核尺寸太小,则覆盖完整输入需要的卷积操作会显著增加,相应地,算法的运算时间也会显著增加;若卷积核尺寸太大,则无法精确定位输入数据中的特征,提取的特征可能会不明显且包含较多的冗余信息。同时,由于本次实验为二分类问题,分类数量较少,全连接层节点数过多也会导致分类的过拟合。经过反复调试,本文2种网络结构参数设置分别如表1和表2所示。

表1 LeNet-5网络参数设置Tab.1 Parameter setting of LeNet-5

表2 AlexNet网络参数设置Tab.2 Parameter setting of AlexNet

4 实验与分析

4.1 信号采集

本文房颤诊断数据集由上海某医院提供的 21 075 条短心电记录组成,其中17 083条数据作为训练集,3 992条数据作为测试集,所有训练集与测试集分类均由随机抽取产生。数据为时长10 s,采样频率为500 Hz的12导联心电信号。本文选取其中的Ⅱ型导联的心电记录数值作为实验数据,且每条记录都由心电图专家手动标记类型。

4.2 数据处理

正常的心电信号集中在0.05~100 Hz频率范围内,且90%以上的能量集中于0.5~35 Hz之间,而频率最高的QRS波群频谱能量主要集中在2~20 Hz之间,在12 Hz左右能量最大。上述频段包含了心电信号最主要的诊断信息。由于心电信号是一种比较微弱的体表生物电信号,因此在采集心电信号的过程中极易受到外部环境的干扰,主要有工频干扰(50 Hz)、基线漂移(小于0.5 Hz)和肌电干扰(30~300 Hz)[23]。为此,在分析前需要进行信号预处理。

本文采用了针对心电信号节律分析的经典预处理步骤,主要分为以下2个步骤[24]:首先将采集到的信号通过0.5~100 Hz的带通滤波器得到心电信号;然后将处理后的信号通过20 Hz的低通滤波器得到QRS波群。处理前后波形如图5~图7所示。

图5 未处理的心电信号Fig.5 The raw ECG signal

图6 带通滤波后的心电信号Fig.6 The ECG signal after bandpass filter

图7 低通滤波后的心电信号Fig.7 The ECG signal after low-pass filter

4.3 结果分析

表3和表4分别给出了一维LeNet-5模型和AlexNet模型预测房颤的灵敏度/特异性和准确率。其中LeNet-5模型诊断精度为91.88%,而AlexNet模型的诊断精度则达到了95.34%,明显优于前者;表中,LeNet-5模型灵敏度为95.97%,特异性为88.66%,而AlexNet模型的灵敏度为98.12%,特异性为93.95%。对比2个模型的灵敏度和特异性的预测精度可以发现:AlexNet模型诊断的灵敏度和特异性均高于LeNet-5模型,并且2个模型诊断的灵敏度均高于特异性。

表3 LeNet-5模型预测结果Tab.3 Predict result of LeNet-5

表4 AlexNet模型预测结果Tab.4 Predict result of AlexNet

为了进一步观察2种神经网络模型是否产生了过拟合现象,图8和图9分别给出了LeNet-5网络和AlexNet网络的训练集和测试集的准确率和损失函数值变化曲线。从图8可见,LeNet-5网络模型预测精度接近100%,但是在验证集上其预测精度明显降低;与之对应的,在训练集上损失函数值接近于0,而在验证集上损失函数并未收敛,反而产生了发散现象。这表明,采用LeNet-5网络进行房颤诊断时,发生了明显的“过拟合”现象。在图9中,AlexNet网络在训练集上预测精度为97.57%,与之对应的验证集上预测精度为95.02%,两者相差不大,对应的训练集和验证集上损失函数也相差不大。这表明AlexNet网络有效地避免了“过拟合”现象的产生。

图8 LeNet-5网络模型诊断结果Fig.8 Diagnosis result of LeNet-5 model

图9 AlexNet网络模型诊断结果Fig.9 Diagnosis result of AlexNet model

5 结 论

针对传统房颤诊断算法依赖人工特征提取和先验知识等问题,本文在经典的二维LeNet-5与AlexNet神经网络模型的基础上分别构造了相应的一维神经网络模型,并应用于房颤的智能诊断中,2种模型均达到了良好的诊断精度,其诊断精度分别达到了91.88%和95.34%,并且2个模型诊断的灵敏度均高于特异性;通过进一步的对比分析发现一维LeNet-5网络模型在训练过程中存在“过拟合”现象,而一维AlexNet神经网络模型则在消除该现象的同时显著增加了房颤的诊断精度,从而为房颤智能诊断提供了新方法。

致谢感谢之江国际青年人才基金提供科研经费支持相关研究工作。感谢上海数创医疗科技有限公司帮助收集提供相关的心电信号数据。

猜你喜欢
电信号特征提取房颤
脂肪酸与心房颤动相关性研究进展
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Code Composer Studio3.3完成对心电信号的去噪
基于Daubechies(dbN)的飞行器音频特征提取
基于随机森林的航天器电信号多分类识别方法
预防房颤有九“招”
阵发性房颤应怎样治疗
Bagging RCSP脑电特征提取算法
基于MED和循环域解调的多故障特征提取