基于逻辑混沌投影矩阵的心率失常识别研究

2019-05-17 07:42彭韵陶李健
现代计算机 2019年10期
关键词:特征提取投影准确率

彭韵陶,李健

(四川大学电子信息学院,成都 610065)

0 引言

心电信号是心脏电活动的综合反映,心律失常是心电活动极为常见但又非常重要的异常状态。因此,心律失常的分类在心脏病诊断中具有重要意义[1]。

心电图自动分类大致分为三个步骤:预处理、特征提取和分类。第一阶段,消除基线漂移和电力线干扰,将心电信号切割为心拍。第二阶段,心拍的特征提取。由于不同人拥有不同心拍类型,不同类型心拍在形态上可能彼此相似,导致心拍分类异常困难。因此,ECG 特征提取方法尤为重要,主要包括三类:形态特征提取[2]、统计特征提取[3]和变换域特征提取[4-6]。最后,使用不同的分类器对不同心拍分类,如支持向量机[2-4]、随机森林[6]和卷积神经网络[7-8]。

虽然心电图分类已进行大量研究,但仍存在问题。首先,美国医疗器械发展协会(AAMI)[9]已在1987年制定将心拍类型分组为5 类的标准,但仍较少文章使用该标准对心拍分类。AAMI 标准建议同一病人心拍不应同时出现在训练集和测试集,因为这不符合现实的医学诊断。因此,按照该标准,本文采用不将训练心拍和测试心拍混合的“患者间”方案。其次,大量研究存在使用过多特征造成识别耗时过长或使用过少特征但识别精度下降的问题。

就上述问题,本文提出了一种所需特征量少且识别精度高的逻辑混沌投影矩阵与RR 间期结合的心拍分类算法。

1 AMII标准及数据集

ECG 数据从MIT-BIH 心律失常数据库[10]中获取,该数据库包括48 条半小时的动态ECG 记录,记录采样频率为360Hz。每条记录包含两个数据通道,第一数据通道为改良肢体导联II(MLII),另一数据通道通常是 V1,V2,V5 或 V4 导联。本文采用 MLII 导联数据。MLII 导联包含15 种不同的心拍类型,包括大约109500 心拍,其中70%为正常心拍,其余为异常心拍。根据AAMI 提出的评价ECG 分类器的标准,将所有心拍形态分为五类:即正常搏动(N)、室上性异位搏动(S)、室性异位搏动(V)、V 与 N 融合(F)以及未知搏动类型(Q)。同时,遵循 Chazal 等人[11]提出的 ECG 记录划分标准,实现患者间的ECG 分类方案,其中训练数据集:101,106,108,109,112,114,115,116,118,119,122,124,201,203,205,207,208,209,215,220,223,230。测试数据集:100,103,105,111,113,117,121,123,200,202,210,212,213,214,219,221,222,228,231,232,233,234。

表1 根据AAMI 标准的MIT-BIH 心率失常数据集

2 实验方法

本文心律失常自动分类流程图如图1 所示。

(1)从MIT-BIH 数据库中提取原始信号,经过预处理和分割,获得去噪后的心拍。

(2)利用逻辑混沌投影矩阵获取每个心拍的投影特征,同时,两维RR 间期特征被添加到最终特征矩阵中。

(3)使用随机森林分类器对心拍分类。

此外,数据归一化(Z-score)用于减少来自不同仪器和不同个体导致的心拍幅度偏差问题。

图1 心律失常自动分类流程图

2.1 去噪和分割

原始ECG 信号含有多种噪声,为了去除这些噪声,本文采用小波去噪方法,选择“bior2.6”作为小波母函数,分解层数设为8。原始信号被分解后,将最高频率和最低频率系数置零,以消除基线漂移和工频干扰。心拍分割阶段,由于分割精度高,本文在该领域未做出贡献,直接利用MIT-BIH 心律失常数据库中提供的搏动位置注释,选择搏动位置之前100 个采样点和之后的150 个采样点,组成一个心拍。图2 展示了原始心拍和去噪心拍样本,可观察到基线漂移和工频干扰已被去除。

图2 心拍样本

2.2 特征提取

(1)投影矩阵

投影矩阵是压缩感知理论的一部分。Candes 等人[12]和Donoho[13]为这种新颖的采样方案奠定了理论基础。该理论指出,只要信号在变换域中被压缩或稀疏,就可以利用投影矩阵将高维信号投影到低维空间上。心电信号在时域上是稀疏信号,因此投影矩阵能将心电信号投影到低维实现信号的压缩和特征提取。

假设输入信号为x ∈Rn,用m 个线性观测向量投影,数学描述如下:

其中,φ 是 m×n 的矩阵,y ∈Rm。在本项研究中,y 为压缩后的心拍数据,x 为压缩前的心拍数据,φ 为逻辑混沌投影矩阵。通过上式,原心拍数据与混沌投影矩阵相乘后可获得压缩后的心拍数据。

逻辑混沌序列是一种常见的投影方法,通常用于压缩数据。该方法序列定义如下:

其中,zj∈[0,1], j ∈ N(N ∈0,…,n×m-1) 。初始值z0=0.01。当系统参数u=4 时逻辑映射为满映射,所生成的混沌序列有良好的随机性。逻辑混沌投影矩阵(φ)通过式(2)迭代获得。

(2)RR 间期

前RR 间期和后RR 间期是ECG 信号的形态特征。前RR 间期为给定R 峰值与其前一个R 峰值之间的间隔。后RR 间期为当前R 峰值和后一个R 峰值之间的间隔。心脏信号的前后RR 间期特征表示瞬时节律特征,对心脏疾病的诊断有着重要作用。

2.3 随机森林

随机森林(RF)是分类预测的有效工具,由Breiman[14]提出。RF 使用多个决策树对样本进行分类,具有训练快,分类效果好的优点。同时,树的棵树通常是唯一的设置参数。

3 实验结果及分析

本文使用MATLAB 2010 软件包,硬件配置包括Intel Core i5 处理器 CPU 2.50 GHz 和 6.00GB RAM。实验结果如表2 所示,使用五类心拍构建多类混淆矩阵以提供不同类的错误分类信息,可作为未来比较研究的基础。

表3 显示了基于MIT-BIH 心律失常数据库的算法总结。Acharya 等人[7]和Zubair 等人[8]使用卷积神经网络(CNN)对心拍分类,分别达到94.03%和92.7%的准确率。Kallas[3]等人利用KPCA 技术获得97%的分类准确率。然而,患者内的心拍分类策略是不符合实际的,心拍分类方法应遵循更公平的评估策略(患者间策略)。因此,本文侧重于与采用病人间策略的研究比较[5,7,11,12]。

表4 所示,本文在分类“N”心脏病类型灵敏度优于Herry 等人[5]和 Raj 等人[4],同时,“V”类型灵敏度高于Chen 等人[2]和精确度高于 Raj 等人[5]。对于“F”型心脏病,分类准确率优于 Li 和 Zhou[6],Raj 等人[4]和 Chen 等人[2]。然而,当对“S”型心脏病识别时,本算法是不充分的,其原因可能是数据的不平衡。此外,与上述算法的识别准确率和特征数量相比,本算法使用4 维特征在识别准确率上高于使用6 个特征的文献[5]和23 个特征的文献[4]。与Chen[2]相比,本文在识别准确率上低约1.5 百分点,但特征数量减少8 倍。与Li 和Zhou[6]相比,本文在识别准确率上低约3%,但特征数量减少17 倍。综上所述,本算法具有所需特征数少且识别准确率高的优点。

表2 心拍分类混淆矩阵

表3 基于MIT-BIH 心律失常数据库的算法总结

表4 本文与以往工作分类准确率和特征数量的比较

4 结语

随着智能医疗设备的小型化及实时性需要,计算耗时被提出更高的要求,因此如何使采用较少特征数达到更高识别精度成为小型智能医疗设备亟待解决的问题,本文提出一种基于逻辑混沌投影矩阵与RR 间期相结合的算法,使用4 维特征获得91.81%的识别准确率,与现有算法相比,更适用于小型智能医疗设备。

猜你喜欢
特征提取投影准确率
全息? 全息投影? 傻傻分不清楚
投影向量问题
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
空间目标的ISAR成像及轮廓特征提取
找投影
找投影
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究