具有窗口结构Bi-LSTM 网络的心电图QRS 波检测方法

2021-01-30 14:00李一凡凌兴宏
南京大学学报(自然科学版) 2021年1期
关键词:心电卷积心电图

李一凡 ,朱 斐,2* ,凌兴宏 ,刘 全

(1.苏州大学计算机科学与技术学院,苏州,215006;2.江苏省计算机信息处理技术重点实验室,苏州大学,苏州,215006)

根据国际卫生组织的调查报告,心血管疾病是全球头号死因,每年大约夺走1790 万人的生命,而心血管疾病中每五例死亡病例就有四例死于心脏病和中风[1].尽管大部分心血管疾病可以预防,但目前的措施不够[2],因此有必要对致命的心血管症状提供及时的警告,而心电图(Electrocardiograph,ECG)就是监测心率的常用方法.

心电图是检测心血管异常的主要依据之一,通过将电极放置在人体上一段时间来记录心电信号.心电图信号的分析检测对医生有较大的临床诊断价值[2].在心脏异常的诊断中,通常会使用标准的心电图与患者的心电图进行对比来找出心电活动中异常的部分,其中包括心室早搏、心房早搏以及房室、束支传导阻滞等,尤其是对心肌梗死的诊断,心电图分析有重要的参考价值[3].通过连续的心电图监测,医生可以及时发现并处理危及生命的心律失常[4],但心律失常并非持续发生的心电特征,通常具有偶发性,这就意味着医生要从大量的心电图数据中找出少量的有诊断价值的心动周期.在临床诊断上,医生甚至需要从24 h 的心电数据中排查一位患者的疾病,即便是一位经验丰富、技术娴熟的医生也需要花费半小时,所以人工检查非常枯燥和耗时,误诊率和漏诊率也较高.如果通过人工智能的方法帮助医生在大量数据中快速寻找异常片段,医生就可以从枯燥繁重的工作中解放出来,将精力投入到更有意义的医疗工作中.心电图自动分析通过各种算法找到病变的波段,节省医生的时间,提高医生的工作效率.另外,可穿戴设备的不断发展能帮助人们随时记录自己的身体健康状况,但在心电监测方面仍有很大不足,目前没有简便可靠的设备达到应用级水平来投入市场,说明动态心电图的检测仍有许多技术问题亟待解决[5].

针对上述问题,本文提出一个具有窗口结构的与卷积神经网络结合的Bi-LSTM(Bi-Long Short-Term Memory)模型,用于检测心电图中的QRS 波位置,并使用窗口扩大的数据处理方法与卷积层组合双向LSTM 结构的深度神经网络来分析和预测QRS 波的特征和位置,其准确率在部分数据集中超过了传统方法,进一步探索了QRS波检测的深度学习应用.

1 相关工作

1.1 QRS 复合波心电图是心脏在心室除极时的电信号反应,一个典型的心电周期的心电图包含P 波、QRS 复合波和T 波,而QRS 复合波的发生时间及其特征形状是精确自动心电监测和诊断系统的基础.在心脏正常跳动(窦性心律)时QRS复合波由Q 波、R 波和S 波组成,它们在特定时间段内有特定的相对大小,而在异位搏动期间,例如心律失常时,这种结构的特异性就会发生改变[3].

QRS 波检测是一个重要的研究课题,其检测算法的发展主要体现在信号处理和数字技术上.模拟心电图系统中对QRS 检测的硬件要求主要是计算量和复杂度[4].随着先进的计算机技术和强大的微控制器的出现,计算量不再重要,而检测率逐渐成为驱动目标,尤其是对于心脏病设备中使用的软件算法的正确性.自动化数字技术的心电图系统中,信号导数和数字滤波器通过分析信号特征来分离QRS 波的组成,并将特征信号和固定或自适应的阈值进行比较.这个特征检测非常有挑战性,而且随着应用场景的变化,例如从医院变成生活场景,嘈杂和多变的环境构成了各种难题,亟需新的技术来解决.

1.2 循环神经网络循环神经网络(Recurrent Neural Networks,RNN)是神经网络的一种形式,通过各层之间的直接连接来显示不同时间上的行为[6],实现了在时间步t更新时保留一个隐藏向量h:

其中,tanh 表示双曲正切函数,xt为时间步t上的输入向量,W为递归权重矩阵,I为投影矩阵,yt可以由隐藏状态h和权重矩阵W得出:

softmax 函数可以将模型的输出预测规范化为合适的概率分布,RNN 可以通过堆叠隐藏状态h来创建更深层的网络,hl-1作为l-1 层的输入传输到下一个隐藏层,ht是RNN 的第l层,σ表示sigmoid 函数:

循环神经网络经常要面对梯度消失的问题.长短期记忆(Long Short-Term Memory,LSTM)循环神经网络通过在状态中增加门限方程来解决这个问题[7].一个LSTM 单元含有一个隐藏向量h和一个的记忆向量m,分别控制状态更新和每个时间步上的输出.每个时间步的计算如下所示[8]:

其中,gu,gf,go,gc分别是输入、遗忘、输出和单元状态门的激活向量,ht是LSTM 单元的隐藏状态向量,同位元素对应相乘表示为⊙,循环的权重矩阵用Wu,Wf,Wo,Wc来表示,预测矩阵用Iu,If,Io,Ic来表示.

在深度学习领域,LSTM 是RNN 的最新进展.根据深度学习的基本原理,如果有一个合理的模型和足够多的数据去训练就能很快地解决各种问题.LSTM 是时序问题的一般框架,一端用于输入序列,一端用于输出序列,可以有效地预测序列,通常应用于带有时间的连续系列问题,例如语音识别、文字处理.心电图作为一种连续的、随时间变化的数据,恰好符合这些应用条件,因此将时序问题的方法应用到心电图的问题上是合理的,同时可以参考自然语言处理的经验解决在心电图中遇到的问题.

1.3 识别QRS 波的方法传统方法对心电信号的分析主要有两类:一类是以临床心电诊断学为指导,即专家经验,通过对应的时限阈值或是幅度阈值进行判断,如数学形态法[9]、自组织特征映射[10]、自动回归模型法[11]、匹配滤波[12]、小波变换[13]等;另一类是以经过人工标注后的患者数据为训练样本,通过统计学习和模式识别进行各类心脏疾病的分类学习,如利用神经网络进行心律失常的检测[14].

深度学习常用于心电图的诊断,需要大量的标记数据进行有监督学习.大部分心电图分类研究都是基于经过医生标注后的数据样本进行学习,例如在对一组长时间的心电分析任务中,依赖标注的周期信息(即每一次心跳)将心电图进行分割,将数据切割成约为一个心动周期的小样本,然后再对该样本进行分类.对于长时间的心电数据,学习的模型很难取得效果,所以需要将心电图分割成小数据集,再进行训练,学习分类问题.传统方法也有许多对QRS 波检测的研究,通常利用波形特征设置幅度阈值来判断心脏周期,但因为心脏活动的复杂性以及现实的偶然性,例如患者轻微的身体移动也会影响电极,引起基线漂移、肌电干扰、工频干扰、大运动伪迹等问题,特别是随身携带的心电监测设备,产生的数据更加不稳定.有的方法对此做删除处理,损失了很多重要信息,而深度学习的模型的优势在于:(1)面对噪音的干扰有较高的鲁棒性和稳定性;(2)强大的分析能力能保留更多的有效信息,降低遗漏关键信息的可能;(3)能自动学习实践中产生的新数据来扩展应用的场景和范围.

最新的QRS 波检测研究中,Liu et al[15]提出双重融合的方法来检测QRS 波的位置;Jia et al[16]提出注意力机制的卷积神经网络,为本文在心电图中应用卷积网络提供了参照;Wu et al[17]使用针对深度信念网络的新的特征学习方法;Tang et al[18]使用了结合并行增量调制的支持向量机模型.

2020 年Laitala et al[19]首次使用双层LSTM模型来定位R 波位置,取得了长足的进步,也为本文提供了重要参考;在传统领域里,Chen and Maharatna[20]提出聚类与离散小波变换结合的方法.为了解决心电图数据获取困难、样本容量小等问题,Zhu et al[21]提出GAN 网络生成心电图的方法.如今有关心电图方向的研究依旧火热,QRS波的检测研究仍然是一个重要的方向.

2 算 法

本文提出一个采样窗口的方法来处理数据,使用卷积网络进行特征获取,双向LSTM 模型组合全连接网络用于识别.通过三个数据集进行对比实验来确保实验结果的一般性.

2.1 采样窗口在QRS 波检测算法中通常使用点来表示QRS 波的位置,但QRS 波作为一个连续的波动,点标记不能很好地反映波形的特征,因此将描述波形特征的方法改进成窗口模式,将原先的标记点扩充成不同的窗口,这样的窗口称为取样窗口.图1 展示了根据专家标记扩展出的可变大小的取样窗口.采样窗口越大,数据集中的正样本越多,数据的偏向性就越小,既能降低模型训练的时间成本,又能减小模型的预测偏向性.而预测产生的标记通过对应的窗口大小取连续值为正样本,例如窗口大小为5 时,在预测结果中如果连续出现五个正样本,则计算为一个心拍.通过这样的方式能有效地过滤预测中的离散点.

图1 不同大小的取样窗口下的心电图Fig.1 ECG under sampling windows of different sizes

2.2 一维卷积卷积层通常应用于图像识别的任务中,它能有效地从图像特征中提取有意义的信息,抽象化处理图像内容.传统方法通常用人工设置的方法来处理心电信号,例如匹配滤波算法,而本研究将一维卷积应用于QRS 波的识别任务中,作为一种高级滤波器起到自动提取心电特征的作用.一维卷积网络由一维卷积层(1DConv)、批处理归一化层(BN)和激活函数ReLU组成,卷积层的滤波器大小设置为15,步长为5,196 个滤波器全部使用;BN 层应用于特征映射输出,保持它们的平均值接近0,标准差接近1;最后,ReLU 用作激活函数[22].

2.3 Bi-LSTM 模块RNN 被证明是语音识别和手写体识别等时序信息的强大模型,它可以通过共享参数来处理时序信息,其隐藏层的节点有记忆历史信息的作用,但是难以保留很长时间,也不能解决训练时梯度消失的问题,所以研究人员提出LSTM 和门限循环单元(gated recurrent units,GRU)弥补RNN 的缺陷.本研究分别使用GRU 模型、单向和双向(Bi-)LSTM 模型进行相同的实验,最终采用Bi-LSTM 模型,这是因为与语音识别相同,心电图的任务判断也需要结合前后信息才能精确检测重要的目标.LSTM 将卷积层输出的信息x0输入网络后,经过隐藏层运算得到结果A0,将h0随时间t向后传播到i,而末尾节点将信息从A't向前传播至A'0节点,如图2 所示.

图2 双向长短期记忆模型Fig.2 Bidirectional LSTM model

2.4 全连接层和sigmoid 函数从Bi-LSTM 层返回的特性被输入进一个全连接的神经网络(Fully Connected Layer,FC)层,通过sigmoid 函数在每一个时间步上得出QRS 波的概率分布,其输出的概率代表该时间步上QRS 波的准确率,大于0.5 的概率输出为1,小于0.5 的概率输出为0,输出的窗口大小与设定的取样窗口大小无关,如图3 所示.

图3 模型的结构示意图Fig.3 Structure diagram of the network

2.5 算法描述将可变的窗口结构数据处理方法应用于卷积BiLSTM 模型,在此之前需对数据进行预处理,处理方法如算法1 所示.

3 实验与分析

本节使用本文提出的技术构建一个卷积双向LSTM 神经网络模型,并在三个数据集(MITBIH Long-Term,MIT-BIH Arrhythmia 和MITBIH Noise Stress)上进行测试.

3.1 度量标准根据医疗器械进步协会(AAMI)制定的美国国家标准,若由算法得到的QRS波检测点在标注位置的前后150 ms 内,则可判定检测到的QRS 波位置是准确的,要求计算出真阳性(TP)、假阳性(FP)、假阴性(FN)[23].当实际发生的QRS 波的左右150 ms 范围内检测到预测为1 时,计算为TP,当出现预测错误时计算为FP,漏检测的R 波计算为FN.

3.2 数据集采用全球公认的MIT-BIH 的三种不同场景下的数据集(https:∥physionet.org/),分别是长时段心电图、心率失常心电图和噪声压力心电图.长时段心电图每个数据的时长为22~24 h,用于研究长时段下的心率变化;心律失常数据库用于研究非健康状态下的心律;噪声压力心电图用于高噪声下的心电分析.三个不同场景下的数据库有利于检验算法在多场景下的作用和效果.

根据MIT-BIH 数据库中专家标注的QRS 波的位置点进行正样本扩大,将标注点扩大成一个合理的窗口,称为采样窗口(sample window);将数据随机切分成大小约41 s 的小片段,并根据原数据的长度选取合适的样本数量;最后,将得到的有标注的数据集进行划分,70%用于训练,30%用于测试.实验测试窗口大小为1~4 时训练集准确率和损失值的收敛速度和收敛结果,最后将测试集预测的结果与专家标注的样本比对,计算指标.

3.3 实验和结果双向LSTM 模型如表1 所示,黑体字表示效果最好的值.可以看到,适当增加取样窗口的大小能有效地提升阳性预测率.以往的神经网络在QRS 波检测上难以取得令人满意的结果有两个原因:一是原始数据没有经过特征提取,另一方面是数据的正样本过少,导致训练得到的模型有偏差.对正样本的歧视性可以通过调整取样窗口的方法来调整数据的分布,能有效减少模型的偏向性.

表1 双向LSTM 模型在不同数据库中不同窗口大小下的预测率Table 1 Positive prediction rate under different window sizes in different databases with Bi-LSTM model

图4 给出双向LSTM 模型在不同大小的窗口下的训练效果.可以看出,模型在训练集中经过迭代最终收敛,准确率基本达到饱和,不同于阳性预测率,其准确率几乎在同一水平.实验数据表明,取样窗口增大,模型收敛的速度明显增快,因此可以通过适当地增大窗口来提升模型收敛的速度.

图4 双向LSTM 模型在不同的窗口大小下训练Fig.4 Training Bi-LSTM model under different window sizes

3.4 对比实验结果表2 给出不同方法对QRS波检测的效果,黑体字表示效果最好的值.每组实验采用相同的数据和预处理方法,在三个不同的数据集中的测试集中随机抽选测试样本.表2中,样本1 和样本2 来自心律失常数据库,样本3、样本4 和样本5 来自长时段数据库,样本6 来自窦性心律数据库,样本7 来自噪音压力数据库.多次实验表明本文的算法在三个标准指标上均有相当大的提升,而且极大地降低了计算量,而且本文的模型需要的训练时间更少.

表2 本文算法与其他检测算法的效果对比Table 2 Performance of our method and other detection methods

高噪声的动态心电图对QRS 波的检测要求更高,目前的主流算法在MIT-BIH Noise Stress Test Database 数据库的测试中鲜有成效,而本文算法在窗口大小为5 时阳性预测率达到99.88%,召回率和F1 分数也取得了很大进步,说明在噪声压力下本文的算法也有出色的抗干扰能力.

表3 给出本文算法与传统方法的对比实验结果,黑体字表示效果最好的值.采用动态MITBIH 长时段数据库,测试数据和评分系统均为统一标准.可以看出,有的传统方法的表现与文献差距较大,原因可能是该算法是针对特定数据集进行的优化,因此未经优化时在动态数据集上的效果就明显下降,也可能因为使用的是长时段的输入数据,与文献中预处理数据的方式不同,因此效果上有偏差.而深度学习的方法优势就在于可以不断地扩展模型的数据容量,能通过自动优化来广泛地适应不同的环境.

表3 在动态心电图中与传统的检测算法的效果对比Table 3 Performance of traditional detection methods and our method on dynamic electrocardiogram

图5 给出了正常的窦性心律和非正常的心室早搏的QRS 波检测效果.图中的数据取自心律失常的数据集,展示了对健康的心跳和异常心跳的识别效果,为避免重叠,蓝色柱体表示根据专家标注标记的采样窗口,红色柱体表示深度神经网络根据学习结果在测试集上标注的R 波位置.为了便于区分重合的位置,将专家的标注高度设为1,机器标注设为0.8,与预测的概率无关.可见本文算法对异常的QRS 波也能较准确地识别位置,鲁棒性较好,病变导致畸形的QRS 波不会被漏检.根据多次抽样观察,取样窗口算法在三种不同场景的数据库中均表现良好,在心室早搏等特殊状况下依然能准确地找到QRS 波的位置(图5),说明在心律失常的病例中本文算法在大部分情况下不受干扰.

图6 给出了在基线漂移、肌电干扰、工频干扰、大运动伪迹等干扰问题下的检测效果.图中的数据取自MIT-BIH 噪音压力数据集,在面对基线漂移、肌电干扰、工频干扰、大运动伪迹等干扰下,本文的算法依然能够较好地完成识别任务.

图5 本文算法对正常的窦性心律(左)和非正常的心室早搏(右)的QRS 波检测Fig.5 Detection of QRS waves in normal sinus rhythm (left)and abnormal premature ventricular beats (right)by our method

图6 本文算法在基线漂移、肌电干扰、工频干扰、大运动伪迹等干扰问题下的检测效果Fig.6 Detection under the interference of baseline drift,EMG interference,power frequency interference and large motion artifact by our method

目前随身携带式的心电监测设备需要监测24 h 以上的动态心电图数据,在面对常态化的高噪音强干扰的生活环境时传统方法遇到了技术瓶颈,只有不到80%的准确率.本文的算法有良好的应用前景,而且由于深度学习算法有学习的数据越多越精确的特性,在未来大范围的应用之后产生的新数据能够被再利用,算法性能也会随着数据量的增大得到进一步的提升.

4 结论

结合采样窗口的深度学习算法能够有效地寻找QRS 波的位置,结合的卷积层又确保了算法的抗干扰能力.在计算量上,随着窗口大小的增加,收敛的速度也会提升,建议可以通过适当增加窗口的尺寸来提升模型的收敛速度,也可以有效地提升识别率.如今临床医学上使用的心电图多为12 导联,和传统方法多维度的分析多导图相比,本文的方法可以自动分析每个导联的特征,还有可以扩展应用于任意导联的心电图而不必重新设计的框架,在高噪音强干扰场景下也有出色应用前景,特别是正在研发中的便携式心电监测设备.不足之处在于深度学习的方法在计算力上会有较大的要求,前期的训练需要占用大量的计算资源,因此更适用于客户端上传数据或服务器分析的模式.

猜你喜欢
心电卷积心电图
动态心电图与常规心电图诊断冠心病的应用
基于3D-Winograd的快速卷积算法设计及FPGA实现
心电向量图诊断高血压病左心室异常的临床应用
心电图机检定方法分析及简化
《思考心电图之176》
基于非接触式电极的心电监测系统
穿戴式心电:发展历程、核心技术与未来挑战
从滤波器理解卷积
更正启事
基于傅里叶域卷积表示的目标跟踪算法