基于改进CNN和LSTM的房颤识别算法研究

2023-08-22 03:46:58周作建李红岩郎许锋宋懿花
计算机时代 2023年8期
关键词:电信号房颤注意力

王 锐,周作建,李 灿,李红岩,郎许锋,宋懿花

(南京中医药大学人工智能与信息技术学院,江苏 南京 210023)

0 引言

房颤(心房颤动)是一种不致命的心脏疾病,但它可能导致心脏功能不全、血栓形成或中风等严重后果。房颤常常伴随心悸、心率不齐、气短、胸痛等症状[2]。2015 年中国高血压调查发现,大于35 岁的居民房颤患病率为0.7%,农村居民高于城市居民,分别为0.75%和0.63%[3]。因此,对于房颤患者而言,及早诊断和治疗非常重要。根据房颤的持续时间,可将其分为三个阶段:阵发性房颤、持续性房颤和永久性房颤[4]。

随着科技的发展,利用计算机分析心电图已成为目前最便捷的诊断手段之一。检测心电信号的方法主要分为两大类,即机器学习和深度学习。机器学习方法通常需要手动提取特征[5],当原始信号出现噪声过多等情况时,手动提取的难度大大增加,此时端到端的深度学习算法的优势就显现出来[6]。深度学习算法通常比机器学习算法更具优势。例如,卷积神经网络(CNN)可以直接输入原始心电信号,并自动从中学习特征,从而实现心律失常的自动检测和诊断。如Zhao Renxing 等人将处理后的数据输入到用卷积神经网络构建的深度学习模型中,得到从心电信号中自动提取出的心房颤动特征,用五种交叉验证策略来证明该模型的可操作性[7]。因此,目前利用计算机分析心电图已经成为一种非常便捷和可靠的心律失常诊断手段。

本文使用的数据集可以分类为三种不同的数据标签:非心房颤动(non atrial fibrillation),持续性心房颤动(persistent atrial fibrillation),阵发性心房颤动(paroxysmal atrial fibrillation)。将以上三类数据输入模型中,为了增加神经网络的复杂度和增强其学习能力,可以采用Swish 激活函数,并在卷积层之后使用Batch Normalization(BN)技术,可以将数据进行标准化。此外,在每一层输入的时候加个预处理操作,将数据归一化,以提高训练效果;模型后端则使用了LSTM 网络,引入了注意力机制,以调整不同特征的重要性,并能够更好地处理长序列数据。

1 相关原理

1.1 卷积神经网络

卷积神经网络是一种深度神经网络[7],通过对特征的提取,来实现对图像的分类、分割等任务。卷积神经网络是由隐含层、输出层和输入层三个基本结构组成的[8]。卷积神经网络通过引入卷积层和池化层的结构,能够更有效地提取图像和语音信号中的特征,实现更高水平的分类和识别,得到一系列特征图,并增强特征的不变性和泛化能力。池化层可以进一步减少特征图的大小,同时保留重要的特征信息,全连接层可以将所有的特征信息进行汇总,最终输出分类或回归的结果。除了基本结构外,卷积神经网络还有许多扩展和改进,这些扩展和改进能够处理更复杂的问题。卷积层在深度学习模型中的本质是对输入的数据进行特征提取以及强化处理。CNN 通常采用梯度下降等优化算法进行训练,增加特征的多样性[9]。卷积神经网络优化的方式有很多种,如引入注意力机制、使用变形卷积等新技术,进一步提升了模型的性能和效果。

1.2 长短期记忆网络

长短期记忆网络是一种特殊RNN,1997 年由Schmidhuber和Hochreiter提出的[10]。它可以有效解决长序列训练过程中易出现的梯度消失和梯度爆炸的问题[11],LSTM 结构中有记忆单元和输入门、输出门、遗忘门这三类门。这三类门都是逻辑单元,自身输出不能被送入其余的神经元中,而是承担在网络的其余部分和记忆单元相接的边际处设置权值,误差函数选择性的记忆反馈并且随着梯度下降的过程修正参数[12]。LSTM 是一种循环神经网络的变体,适合于处理时间序列数据[13]。LSTM 可应用于分类、预测和序列到序列的翻译等任务,如股票价格预测、自然语言情感分析和语音识别等。此外,LSTM 还可以处理非常长的时间序列数据,广泛应用于多个领域,表现出优秀的性能。

1.3 注意力机制

注意力机制的输入通常是一组向量表示的信息,例如序列中的单词或句子中的词向量。通过注意力机制,模型能够自适应地从输入中选择性地关注不同的信息,并且不需要事先确定关注哪些部分。其基本思想是在给定一组查询和一组键值对的情况下,计算每个查询与键的兼容性,将每个键的值乘以其对应查询的权重,然后将所有乘积加起来得到最终输出。在这个过程中,注意力机制将一组键值对映射到一组输出向量,这些输出向量捕捉了查询与键的交互信息。其计算步骤可以分以下三步。

⑴相似度计算:计算每个查询与每个键之间的相似度,这通常涉及到计算两个向量之间的点积或者其他相似度度量方式。

⑵权重计算:将相似度转换为对应的权重,这通常通过将相似度传递给softmax 函数来完成,softmax函数会将相似度转换为概率分布,使得所有权重的和为1。

⑶加权求和:将每个键-值对表示为一个向量,使用权重向量对这些向量进行加权求和,得到最终的输出向量。

本文的点积模型是一种常见的注意力机制模型,如图1所示。其利用矩阵乘积计算,提高了计算效率,具有简单、高效和易于解释等优点,如式⑴所示。式⑴中qi表示查询序列,ki表示键序列。

注意力机制在深度学习中的应用非常广泛。例如,在机器翻译任务中,注意力机制被用来对源语言句子中的每个单词进行加权,以便更好地捕捉与目标语言句子的对应关系。在语音识别中,注意力机制可以用来对语音信号中的不同时间步进行加权,以便更好地捕捉与文本之间的对应关系。

2 研究方法

本研究是将CNN 与LSTM 结合,建立一种新的深度学习网络模型,通过数据预处理将CPSC 2021(2021 年中国生理信号挑战赛)数据输入本文所设计的网络模型之中,利用CNN的多次卷积和池化操作提取心电数据的局部特征,将提取的特征输入下一层的LSTM网络,结合注意力机制对心电信号进行分类。

2.1 数据来源

数据的采集分为两个阶段,第一阶段一共719 条记录,采集了10 名房颤患者(5 名阵发性房颤患者)和39名非房颤患者的数据,第二阶段一共706条记录,采集了37 名房颤患者(18 名阵发性房颤患者)和14 名非房颤患者的数据。

2.2 数据预处理

心电信号是人体的一种微弱生理信号,通常采集到的心电信号会伴随有基线漂移、工频干扰、肌电干扰等噪声的影响[14]。常见的降噪方式有滤波降噪和小波降噪两种。本文只进行简单的滤波,采用小波变换的降噪方式,主要解决心电信号中基线漂移的问题。本文随机选取了“data_104_23”号数据的20s信号数据进行预处理展示,如图2所示。

图2 心电信号预处理前后对比

2.3 结合CNN和LSTM的深度网络模型

心电信号具有一维的时序性,我们根据这一特点将LSTM 融入到CNN 网络中,并引入注意力机制。就CNN 算法而言,它对心电信号的波形识别比较敏锐,LSTM 算法可以对心电信号中的时间序列特征进行深度挖掘,在不用进行繁琐的超参数的调试下,记忆长期信息。而注意力机制的加入可以完成对模型的优化。本文所设计的具体结构如图3所示。

江浙沪地区县域乡村旅游公路属于我国县域乡村旅游公路的组成部分,并不能代表我国全部县域乡村旅游公路,关于县域乡村旅游公路选线适宜性的指标体系和评价模型还需要更深入的研究和探讨。期待未来能够不断完善和健全县域乡村旅游相关的研究,为乡村旅游业的发展提供一个积极、理想的载体。

图3 本文模型结构图

本文的模型利用CNN 提取心电信号中的特征,并通过LSTM 模块对特征进行处理,最后采用点积注意力机制和softmax分类器进行分类识别。

具体地,CNN 模块采用了三个卷积层,卷积核边长设置为5,三层隐藏单元数分别设置为256、128 和64。在每个卷积层后使用批量归一化BN,加快收敛速度,提高模型的泛化能力。Swish 函数被用作激活函数,以控制数据的幅度,避免数据幅度过度变化。为了防止过拟合,卷积层后加入了最大池化操作,对特征数据进行降维,然后输入到LSTM模块中。

在本文的模型中,经过CNN 模型生成的通道维数作为LSTM 输入的特征维度输入,设置dropout 为0.2,将隐藏单元数设置为64。使用tanh 作为激活函数,以实现对输入数据的非线性变换,加快收敛速度,接着进行全局平均池化操作,将整个特征信息压缩到一个数值上,减少模型的参数量,该层输出后经过一个全连接层,将向量映射到指定输出大小的向量空间,这样可以进一步提取到数据的特征,得到模型的输出。

最后,通过点积注意力机制对特征进行处理,实现特征的加权,在使用softmax 分类器进行分类识别时,softmax 函数将多个神经元输出,并将结果映射到(0,1)区间,从概率论的角度来看,完成了多分类。然后,我们选择具有最高概率的类别作为输出结果,即将概率最大的类别作为输入向量的分类标签。完成对三种样本数据的识别,实现原始信号的分类。本模型的设计采用了多种优化方法,使得模型具有更高的泛化能力和鲁棒性,可以用于心电信号的分类和诊断。

实验分所用的数据集为训练集和测试集,其数据分布如表1所示。

表1 实验数据分布

3 实验结果及分析

3.1 评价指标

针对本文提出的网络模型,引入混淆矩阵,并从中提取出四个指标Acc、F1、P、R,即分类准确率Acc、F1分数、精确率和召回率,其定义如下:

⑴分类准确率:

⑶精确率:

⑷召回率:

3.2 结果对比与分析

通过对本文所设计模型的反复训练和网络超参数的调整,输出相应的三分类结果。本文采取将CNN、LSTM 与改进后的模型进行对比,改进后的模型是将CNN 与引入注意力机制的RNN 模块的融合,对比的CNN 和LSTM 模型都是改进模型的子模块。三个模型的对比结果如表2所示。

表2 模型结果对比

由表2 结果可知,本文所提出的模型在准确率为0.9771,F1 为0.9609,精确率为0.9765,召回率为0.9799。在准确率方面本文模型略低于LSTM 模型,但高于CNN 模型,在其他三个指标中,本文模型都优于其他两个模型,且效果有显著提升。从对比实验的结果来看,本文提出的模型在准确率方面比CNN模型提高了0.89%,在F1 得分方面分别提高了12.54%、8.77%,在精确率方面分别提高了12.09%、8.33%,在召回率方面分别提高了9.61%、6.42%。可以看出,注意力机制的引入可以使网络更加关注训练数据中的关键特征,从而提高网络的泛化能力,使其在处理新数据时表现更好。总体而言,将CNN 和LSTM 融合并加入注意力机制在一定条件下优于CNN 和LATM 单独构造的分类模型的性能。

4 总结

本文提出基于心电信号的房颤识别算法,利用心电信号的一维时序性特征,将卷积神经网络和加入注意力机制的长短期记忆网络进行融合,用于三分类的房颤信号识别。模型主要在CNN 模块使用了Swish函数作为激活函数,以控制数据的幅度,避免数据幅度的过度变化。并在LSTM 中引入了点积注意力机制,减小运算量,提高了模型的准确性。在通过预处理的训练数据上进行训练,在测试集上进行了测试,通过对比其子模块,该模型虽在准确率方面略低于LSTM模型,但综合四项评价指标而言,其性能优于另外两种模型。

本文提出的模型在以下几方面还有提升的空间:①本研究所使用的数据量较大,在使用模型对数据进行训练和验证的时候花费的时间较长。②仅采用CPSC2021的数据集进行了实验,并未在其他公开数据集和临床真实数据中测试过性能。

猜你喜欢
电信号房颤注意力
老年房颤患者,日常有哪些注意事项
保健医苑(2023年2期)2023-03-15 09:02:50
让注意力“飞”回来
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于Code Composer Studio3.3完成对心电信号的去噪
科技传播(2019年24期)2019-06-15 09:29:28
基于随机森林的航天器电信号多分类识别方法
预防房颤有九“招”
大众健康(2017年8期)2017-08-23 21:18:22
阵发性房颤应怎样治疗
老友(2017年7期)2017-08-22 02:36:30
“扬眼”APP:让注意力“变现”
传媒评论(2017年3期)2017-06-13 09:18:10
A Beautiful Way Of Looking At Things
基于生物电信号的驾驶疲劳检测方法
汽车电器(2014年8期)2014-02-28 12:14:29