基于卷积神经网络特征提取与融合的心律失常分类*

2021-04-12 08:30徐晨华叶思超乔清理

生物医学工程研究 2021年1期

徐晨华，叶思超，乔清理

(天津医科大学生物医学工程与技术学院，天津 300070)

1 引言

心律失常是心血管疾病最显著的表现，严重的心律失常可能会导致心脏骤停，甚至死亡。便携式可穿戴设备可实现对患者的长期监测，达到早期识别心律失常的目的，但其必须满足识别准确度高、重量轻、能耗低、识别速度快等要求，因此，在降低计算复杂度的基础上，提高心律失常的分类准确度具有重要意义。

随着技术的发展，机器学习方法被应用于心律失常分类[1-4]。Mondéjar-Guerra等[2]提取心电信号的RR间期特征、小波特征、高阶统计特征等，输入到支持向量机中，获得了95.9%的准确度。但人工提取特征高度依赖于经验，难以提取隐含特征，并且会引入大量计算，无法满足计算简单的要求。后来，卷积神经网络(convolutional neural network, CNN)被应用于心律失常分类[5-6]。基于CNN的方法具有从输入中独立学习特征并分类的能力。Rajpurkar等[5]训练了一个34层的CNN，可以实现心律失常自动分类，其灵敏度和准确度均超过了心脏病专家的平均水平。如果使用较浅的CNN，则很难学习心电信号中的深层次特征，而当网络深度增加时，网络参数将成指数倍增加，计算负担加重[7]。

本研究将人工提取特征和CNN自动提取特征的优势相结合，提出了一种基于CNN的抗噪声自动心律失常分类方法。使用CNN对原始心电信号和小波分量进行特征提取并与RR间期特征进行融合，再使用softmax函数对心拍进行自动分类。为验证特征融合的有效性，对特征融合前后的网络进行性能评估对比。

2 实验数据

实验数据来自MIT-BIH心律失常数据库[8]。该数据库包含48条数据，每条数据持续30 min，采样频率为360 Hz，提供约110 000个心拍[9]。医疗器械促进协会(AAMI)将心律失常分为五类：正常心拍(normal beat, N)、室上性异位心拍(superventricular premature beat, S)、心室异位心拍(ventricular ectopic beat, V)、融合心拍(fusion beat, F)和未知心拍(unknown beat, Q)。未知心拍是由于信噪比过低而无法准确识别的心拍。因此，只对N、S、V、F四类心拍进行研究。

II导联是诊断心脏病最常用的导联之一[10]。研究中使用修正后的II导联数据(MLII)。

3 方法

3.1 数据集划分

去除使用心脏起搏器的4条心电数据(102、104、107和217)。将数据分为不含相同患者信息的两个数据集DS1和DS2[11]。DS1数据编号为：101、106、108、109、112、114、115、116、118、119、122、124、201、203、205、207、208、209、215、220、223、230。DS2数据编号为：100、103、105、111、113、117、121、123、200、202、210、212、213、214、219、221、222、228、231、232、233、234。

本研究使用主动学习的训练方式[12]。将训练集分为全局训练集和个体训练集。使用全局训练集训练一个模型，当遇到新患者时，为新患者的一部分数据制作标签，作为个体训练集对模型进行微调，用微调后的模型预测剩下的数据。研究中，DS1数据集充当全局训练集。DS2数据集的前5 min数据作为个体训练集，引入患者特异性。将去除前5 min的DS2数据作为测试集。此做法符合AAMI标准。

3.2 心拍分割

特征提取之前需要将完整的心电信号分割为单个心拍。使用数据库中标记的R峰位置对心电信号进行分割。为了表征一个完整的心拍周期，本研究取R峰前100个点、R峰后150个点，共250个点表征一个心拍，并制作标签。

3.3 人工特征提取

RR间期表示两个相邻心拍R峰之间的时间间隔，能够有效区分心律失常的类型[13]。使用前RR间期和后RR间期表征心电信号的时域信息。根据式(1)、式(2)计算RR间期特征。

rrpre=rcur-rpre

(1)

rrpost=rpost-rcur

(2)

其中，rcur表示当前R峰的位置，rpre表示前相邻R峰的位置，rpost表示后相邻R峰位置，rrpre为前RR间期，rrpost为后RR间期。

心电信号中，QRS波群包含的信息最多，对该部分进行小波特征提取。以R峰为中心选取44个点表示QRS波群。使用离散小波变换(db4)将QRS波群信号分解为四个尺度，分别为D2、D3、D4、A4，并重建每个尺度的小波分量。

3.4 网络结构设计

CNN可以自动提取ECG信号的有效特征。研究中，提出一种用于心律失常分类的CNN，网络结构见图1。网络分为四个模块：输入、特征提取、特征融合、分类。

输入模块。网络包括三部分输入：尺寸为250×1的心拍信号，4个尺寸为44×1的小波特征，尺寸为2×1的RR间期特征。

特征提取模块。构建网络提取心拍波形特征和深层小波特征。提取心拍波形特征时，对心拍波形进行卷积核为9×1的卷积操作。对卷积结果进行批量归一化后再进行非线性激活处理，非线性激活函数使用Relu函数。对得到的特征图进行最大池化操作，步长为4，能够减少特征数，降低计算量。对得到的特征图再进行大小为9×1的卷积操作、批量归一化和Relu激活。为防止过拟合，加入Dropout层。最终得到大小为45×16的特征向量；提取深层小波特征时，对四个小波分量D2、D3、D4、A4分别进行卷积，卷积核大小为9×1，并在卷积操作之后使用Relu激活函数，平均池化后最终得到22个4×4的特征向量。

特征融合与分类模块。将网络提取的特征向量和RR间期特征拼接后输入到全连接层进行融合，并在输出层使用softmax函数分类。CNN结构具体配置参数见表1。

表1 CNN结构具体配置Table 1 Specific configuration of convolutional neural network structure

3.5 网络训练

使用交叉熵损失函数，通过Adam优化器在训练过程中对权重和偏置进行优化。当20次迭代内损失值不再下降时，停止迭代，保存准确率最高的模型。

注：Conv Modular由一维卷积层Conv1D、批量归一化BN、激活函数ReLu组成，Maxpool1D表示一维最大池化层，Dropout表示随机失活层，Flatten层把多维的输入一维化，Averagepool1D表示一维平均池化层，Concatenate表示拼接层，fc为全连接层。图1 网络结构图Fig.1 Network structure diagram

3.6 评价指标

本研究提出的算法已在MIT-BIH心律失常数据库中得到验证。选取准确度(Acc)、灵敏度(Se)和阳性预测值(P+)来评估模型的性能，计算公式如下：

(3)

(4)

(5)

其中，TP(True Positive)为真阳性数量，FP(False Positive)为假阳性数量，TN(True Negative)为真阴性数量，FN(False Negative)为假阴性数量。

4 实验结果

4.1 特征融合前后实验结果对比

使用测试集对特征融合前后的网络分别进行了测试，计算了特征融合前后各类心拍的灵敏度、阳性预测值以及总体准确度、平均灵敏度、平均阳性预测值，见表2。仅使用CNN对心拍进行特征提取，所得结果在F类心拍上表现较差，灵敏度仅为37.15%。使用CNN对心拍和小波分量进行特征提取并融合，主要改善了V类的分类性能，使其达到了91.03%灵敏度。当使用CNN对心拍进行特征提取，并与RR间期特征进行融合时，取得了最佳的S类灵敏度。将提取的所有特征进行融合后，网络的总体准确度达到了98.12%，且各类心拍均取得了较高的灵敏度和阳性预测值，分类性能较融合前有了极大的提升。

表2 性能评估结果Table 2 Performance evaluation results

4.2 噪声对分类结果的影响

为了评估噪声对分类结果的影响，向原始心电数据叠加四种不同信噪比的高斯白噪声，以及使用db8小波对原始信号进行去噪。以单个心拍为例，原始波形图以及经过处理后的心拍波形见图2。使用构建的CNN对增加和去除噪声后的信号进行分类，结果见表3。

图 2 原始心拍与增加、去除噪声后的心拍波形图Fig. 2 Original heartbeat and heartbeat waveform after adding and removing noise

表3 抗噪能力测试结果Table 3 Noise immunity test results

根据表3数据，叠加10 dB信噪比噪声时，网络的各项性能指标均有所下降。由图2(c)可知，叠加10 dB噪声的心拍波形严重失真，虽然分类效果有所下降，但仍然可以达到95.69%的总体准确度，具有一定的参考价值。

当叠加信噪比大于等于20 dB的噪声时，总体准确度无显著变化，且各类别性能评价指标相差不大。网络对去除基线漂移和高频噪声后的信号分类的总体准确度最高。

4.3 与其他心律失常分类方法的对比

表4显示了其他同样符合AAMI标准的分类方法的性能评估指标结果，每项指标的最佳结果加粗显示。Kiranyaz等[12]使用一维CNN对MIT-BIH数据库中24条心电数据进行测试，得到95.13%的总体准确度；Luo等[14]使用了一种频率切片小波变换的方法产生心拍的时频图，构建深度神经网络提取心拍特征并分类，取得了97.5%的总体准确度；Xiang等[15]提出了一种基于注意机制的两级特征提取方法，得到了96.74%的总体准确度。通过对比，本研究方法的N、S类灵敏度和阳性预测值以及总体准确度更高。

表4 心律失常分类方法及性能评估指标Table 4 Arrhythmia classification methods and performanceevaluation indicators

5 讨论

本研究构建CNN对心拍和QRS波群小波分量进行自动特征提取，融合RR间期特征，使用softmax函数对心拍进行分类。通过对比特征融合前后获得的评估指标结果，证明本研究提出的特征融合方法能有效提高网络对心拍的分类能力。

为了评估所构建网络对噪声的抗干扰能力，向测试集信号中叠加或滤除噪声，对网络进行测试。根据测试结果可以认为本研究构建的网络对噪声具有一定的抗干扰能力。这种抗噪能力的形成主要有两个原因：(1)在网络结构中采用的批量归一化层能够消除一部分噪声的影响；(2)本研究中未对输入CNN的心电数据进行去噪、归一化等预处理，最大程度保留心电信号完整性的同时，在包含噪声的情况下训练网络，训练后的CNN模型能够在含噪声信号中提取到有效特征。

在后续工作中，需要结合QRS波群检测，优化网络结构和训练过程，进一步提高分类准确度。另外，研究中的异常心拍的数据量较少，需要采集更多的数据用于实验。

6 结论

本研究基于CNN提出了一种对单导联心电信号进行特征提取与融合的抗噪声自动心律失常分类方法。提出的方法减少了预处理的过程，计算负担小。将人工提取特征和CNN自动提取特征的优势相结合，有效提高了分类准确度。经过抗干扰能力测试，证明本研究的分类方法对噪声具有一定的抗干扰能力。另外，本研究方法仅需要单导联数据就可以实现对心拍的分类，对心电数据处理速度快，计算量小，具有一定的临床意义和价值，可以用作ECG筛查工具。