关键词:房颤;心电图;连续小波变换;残差网络
中图分类号:TP391 文献标志码:A
0 引言(Introduction)
心房颤动是临床上最常见的心律失常类型之一,其在我国经过年龄校正后的患病率高达1.6%,这意味着房颤存量病人超过2 000万[1]。临床上对心房颤动的预防和诊断主要依靠医生的专业经验及基于影像学资料的判断,这种诊断方法是主观的,缺乏客观的科学理论依据[2]。通过延时心电监测发现,6%~40%的房颤病例可能被漏诊[3]。因此,开发房颤的自动诊断方法具有极其重要的意义[4]。深度学习技术的发展有效地提高了手动提取特征的效率,已有的基于深度学习的心电信号分类方法有基于堆叠LSTM(Long Short-Term Memory)的递归神经网络的房颤预测算法、基于SE-ResNet(ResNet withSqueeze and Excitation Module)的房颤检测算法、基于ResRNN(Residual Recurrent Neural Network)的心律失常(包括房颤)分类方法等[5-7]。这些方法增强了模型的抗干扰能力,但是其召回率较低,表明存在未检测到正样本问题。
基于上述分析,为了提高模型的预测准确率和泛化能力,本研究提出一种基于连续小波变换和残差神经网络的房颤预测方法。首先,采用小波阈值去噪方法去除心电图信号中的干扰,其次,通过连续小波变换将一维的时序信号转换为二维时频图,最后,使用改进的残差网络进行房颤预测。
1 数据采集(Data collection)
本研究使用的真实数据来自两个数据库,一是AFPDB(PAF Prediction Challenge Database)[8],二是2001年针对自动预测阵发性心房纤颤/颤振的开放性竞赛引入的新心电数据库(该数据库中所有患者在数据收集前提供了知情同意书)。
AFPDB数据集是一个双导联的心电图记录数据库,所有记录的初始采样频率为128 Hz,分辨率为12。筛选100条非AF患者的数据和50条AF患者发作之前的记录,将筛选的数据采样至500 Hz并切片,划分成长度为5 s的片段,最终得到2 250条心电数据样本。同时,为避免实验过程中出现重复现象,按照7∶2∶1的比例,将数据随机划分为训练集、验证集和测试集,即包含1 575个样本的训练集、225个样本的验证集及225个样本的测试集。对以上数据进行标记,其中“1”表示在记录的30 d后发生AF,“0”表示在记录的30 d后未发生AF。
本研究新引入的数据库中,共包含来自246名AF患者和890名非AF患者的2 160条记录,AF患者包括113名男性和133名女性。非AF患者包括442名男性和448名女性。心电数据包含12导联,采样频率为500 Hz,分辨率为8,每个导联包含5 000个数据点,采样时长为10 s。选取660条AF患者发作前30 d的I导联数据,并以1∶2的比例随机选取1 320个正常样本,按照7∶2∶1的比例随机划分为训练集、验证集和测试集。最终的数据集为包含924条数据的训练集、264条数据的验证集及132条数据的测试集。对以上数据进行标记,其中“1”表示在记录的30 d后发生AF,“0”表示在记录的30 d后未发生AF。图1所示为非AF患者和AF患者发作前30 d的心电图信号。不同类型的心电图信号如图1所示。其中,图1(a)为非AF患者的心电图信号,图1(b)为AF患者发作前的心电图信号。
2 房颤预测方法(Atrial Fibrillation prediction method)
图4为原始心电图信号和CWT时频图。其中,图4(a)和图4(b)分别为非AF患者的心电图信号和CWT时频图,图4(c)和图4(d)分别为AF患者发作前的心电图信号和CWT时频图。这两个信号都有2000个采样点,采样频率为500 Hz,并经过Morlet小波分解。比较图4(b)和图4(d)发现,图4(d)在时域上存在RR间期的绝对不等,频域上存在更多不规则的房颤波(也称F波)。因此,利用CWT时频图的特点可以有效地进行房颤信号的分类,进而预测不同信号发生房颤的可能。
2.3 房颤预测模型
残差网络(ResNet)是一种深度神经网络架构,通过引入残差块(Residual Block),使用残差连接解决深度网络训练中梯度消失和梯度爆炸等问题,被广泛应用于图像分类等任务。
受残差学习的启发,本研究设计了基于残差神经网络的房颤预测模型。该模型由3个部分组成:输入层、改进的残差块和全连接层。第一部分的输入层采用7×7的二维卷积核对原始图像进行降采样,提取图像的基本特征,并尽可能地保留原始图像信息。第二部分的卷积层包含3个残差块,每个残差块包含两个卷积层。在第二个残差块和第三个残差块中引入下采样(Down Sample),采用步幅为2的1×1卷积进行特征的映射,防止梯度消失和梯度爆炸。第三部分为两层全连接层,将残差层学习得到的特征映射成一维向量并输出。为防止神经网络过度拟合,全连接层之间设置了比率为0.5的Dropout层。基于ResNet的房颤预测模型如图5所示。残差块中的卷积层以及下采样层的具体参数如图6所示,其中图6(a)和图6(b)分别为残差块A和B中卷积层的具体参数,图6(c)为下采样层的具体参数。
3.2 实验结果分析
本研究基于两个数据集进行实验,并比较了不同的预测模型。在AFPDB数据集上的实验结果如表1所示,在本研究新提出的数据集上的实验结果如表2所示。由表1中的数据可以得出,本研究提出的方法应用于AFPDB数据集的精确度、F1值和准确率均有显著的提升,可以更好地识别房颤样本。从表2中的数据可以得出,本研究提出的方法应用于新数据集上的精确度、召回率、F1值和准确度分别为92.4%、90.4%、91.4%和94.2%,均优于其他比较模型。采用密集连接的DenseNet实现了特征的重复利用,减少了模型的参数数量,本次实验使用的参数数量为12.99 MB。本研究提出的模型在ResBlock结构中融入了共享参数的下采样卷积层,以减少模型参数数量,模型参数数量仅为3.15 MB,并且模型效果也优于DenseNet。相较于ResNet-18,本文提出模型的性能也有显著提升。不同的模型在两个数据集上的混淆矩阵如图7所示。图7(a)、图7(b)和图7(c)分别表示DenseNet、ResNet18和本研究提出的模型在AFPDB数据集上的混淆矩阵,图7(d)、图7(e)和图7(f)分别表示DenseNet、ResNet18和本研究提出的模型在新数据集上的混淆矩阵。由图7可见,本研究提出的模型在两个数据集上的各项指标均优于其他模型,具有较强的泛化能力,适用于不同的房颤检测任务。
3.3 讨论
将本文提出的模型与最新的研究模型在AFPDB数据集上进行比较,结果如表3所示。SUN等[5]开发了一种由堆叠LSTM构成的递归神经网络SLAP,房颤预测的准确率为92.0%,F1值为92.0%。YANG等[15]提出了一种混合模型,结合了CNN和LSTM(CNN-LSTM)的优越性,提取嵌入于模式转换特征中的局部空间特征和时间依赖特征,其准确率达到了91.3%,召回率为82.2%;但是,较低的召回率表明其在检测正样本方面的能力较弱,需要进一步改进。WANG等[16]采用改进的量子粒子群优化算法(IQPSO)结合支持向量机(SVM)构建了一个有效的预测模型,其对第二导联心电图信号的预测结果中,准确率和召回率分别为92.5%和93.3%,然而该方法需手动干预,没有实现端到端的方法。在AFPDB数据集上,本研究的方法在指标上的表现均优于其他模型。相较于机器学习算法,端到端的深度学习算法在大数据背景下展现出更为出色的性能,尤其在处理房颤分类任务时表现突出。在这一任务中,传统的技术方法,例如时域特征提取、频域特征提取及格拉姆角场等,主要应用于将一维数据转换为二维矩阵,以便作为神经网络的输入进行进一步处理。然而,这些方法在实际应用中的性能表现并不理想,存在一定的局限性。因此,本研究引入了一种将连续小波变换与残差神经网络架构相结合的房颤预测方法。通过在AFPDB数据集和本研究提出的新数据集上进行实验,证明该方法适用于房颤预测任务。
4 结论(Conclusion)
心房颤动是心律失常的重要类型,因此构建准确、稳定的心房颤动检测系统对临床辅助诊断具有重要意义。本研究提出了基于连续小波变换和残差神经网络的房颤检测方法。首先,对原始心电图信号进行预处理,使用软阈值小波去噪方法滤除部分干扰信号,其次,使用连续小波变换将一维时序信号转换为二维时频图。在基于残差神经网络的模型中引入改进的残差块进行特征提取和预测。所提出的模型在公开数据集上获得较好的预测性能,精确度、召回率、F1值及准确率分别为96.1%、92.5%、94.3%、94.2%,证明了此方法的有效性。在提出的数据集上也取得了较好的表现,预测精确度、召回率、F1值和准确率分别为92.4%、90.4%、91.4%、94.2%,从而进一步验证本研究提出的方法具有较大的实用价值,并且可靠性较高。未来的研究方向将考虑更大的数据集和更多元化的信号,以期进一步提高预测的准确性,缩短预测时间,提供更可靠的诊断。
作者简介:
朱宇翔(1998-),男,硕士生。研究领域:医学信号处理,深度学习。
童基均(1977-),男,博士,教授。研究领域:医学信号处理,医疗信息化。本文通信作者。
夏淑东(1978-),男,博士,主任医师。研究领域:心律失常射频消融,起搏器植入,冠心病介入治疗和先天性心脏病封堵。
朱海航(1998-),男,硕士生。研究领域:医学信号处理,深度学习。