一种基于LKDP-FCM的心电特征分类方法

2021-06-23 10:10郑淋文周金治
制造业自动化 2021年6期
关键词:心律电信号心电

郑淋文,周金治,黄 静

(1.西南科技大学 信息工程学院,绵阳 621000;2.特殊环境机器人技术四川省重点实验室,绵阳 621000)

0 引言

国家心血管病中心最新发布文件[1]指出,中国心血管病(CVD)患病率持续上升,居所有死因首位。作为诊断心血管疾病的重要依据,心电图(ECG,Electrocardiogram)可以反映出心脏节律和传导的生理信息。利用机器学习建立心电信号智能分析系统也成为了当前智慧医疗中的研究热点。心电信号自动分类算法的研究主要集中在心电特征图像和心电波形特征向量空间两个方向,其中基于心电特征图像的方法主要有图像自相性法[2],迁移学习[3]等;基于心电波形特征的算法主要有逻辑判断[4]、神经网络[5,6]、模式识别[7]、支持向量机[8]、模糊系统[9~11]等。

在心脏疾病的诊断中,医生的诊断过程具有模糊性、经验性与主观性,为消除此影响,研究人员将模糊聚类应用于心律失常的诊断中,原因在于心电信号中异常心律所占比例较小,而模糊聚类对此类稀有数据较为敏感,因此该算法能取得较好的结果,其中性能较为出色的是FCM算法。FCM算法通过多次迭代求解最小目标函数,具备闭环反馈的特点,因此聚类精度较高。如刘世雄[9]应用两段聚类,先应用聚合法获得较为准确的聚类数目作为FCM聚类算法的输入,算法整体的准确率在90%以上,但分类精度还不是很高;吴志勇[10]等人以DBN抽取心电信号的高层抽象特征为数据基础,采用FCM进行特征分类,总准确率达96.54%,但实现过程较为复杂,时间复杂度高;C K Roopa[11]等人对比了三种特征选择方法,结合邻域信息,使用高斯核作为FCM算法的距离度量标准,结果表明应用正则化局部保留索引与健壮空间内核FCM算法在心律失常分析上的性能优于传统FCM和内核FCM,但该算法的性能主要取决于初始群集中心的选择,应用受到限制。综合以上算法的优缺点,本文提出一种基于LKDP-FCM的异常心律分类方法。使用小波变换识别心电信号中的特征点,提取出21维典型特征组成特征矢量矩阵,并采用逻辑判断分割出大部分正常心拍,然后应用K近邻优化的DP算法与FCM算法相结合完成心电信号特征的分类,克服了FCM算法需要先验知识的不足,提高了算法的无监督性,从而实现对异常心律更高的检出率。

1 基于LKDP-FCM的心电特征分类模型

心电信号的心律失常分析包括心电信号采集、预处理、特征提取和处理、异常波形自动分类。如图1是本文特征分类系统流程。

图1 心电信号特征分类分析系统流程

基于LKDP-FCM的心律失常分类方法分为两个阶段实现,第一个阶段的输入为经过预处理、周期分割及特征提取的心电信号,输出为正常心拍与异常心拍,主要目的在于减少分类模型的输入量,该阶段分割出的异常心拍将作为输入进入到第二个阶段,即KDP-FCM分类模型,通过改进的算法,最终输出心律失常的五个类别。

1.1 逻辑判断(L)

ECG信号中,多数的心拍都是属于正常心拍,异常心拍则较为稀少,如果采用迭代聚类的方式,ECG信号的数据量大,则迭代次数较多,将大大增加运行时长,因此本文在第一阶段心电信号分类时,采用逻辑判断,将心拍分为正异两类。单一使用逻辑判断虽不能精确的将所有正异心拍分开,但可以分辨出大部分正常心拍,将会大幅减少下一阶段聚类的数据量。

考虑心电信号的个体差异,参照正常心电波形特征的标准值[12],本文设定正常心拍模版如表1所示。

表1 正常波形特点和参考值

1.2 KDP-FCM分类模型

1.2.1 FCM算法

FCM算法的聚类思想是通过不断迭代,形成反馈,把n个数据点xi(i=1,2,…,n)分到K个类簇中,取得最小目标函数,达到类间距离最大,类内距离最小的目的。FCM算法聚类精度高,系统误差小,其实现步骤如下:

1)设定类簇个数C,初始化模糊权重指数m,m∈[1,+∞),设定算法迭代停止条件ε和迭代计数器,初始化隶属度矩阵;

2)根据式(1)计算或更新隶属度矩阵;

隶属度函数表示第K个样本对于第i类的隶属度,更新隶属度需要满足约束条件:。

3)计算新的聚类中心

4)根据式(2)计算目标函数,判断是否达到迭代停止条件,如果达到则停止迭代并输出聚类结果,否则迭代计数器加1,转向步骤2)。

1.2.2 结合K近邻与密度峰值的模糊C均值聚类(KDPFCM)

聚类是典型的无监督学习算法,但FCM算法需要人为输入类簇个数,将会大大降低了算法的无监督性,且每次聚类都是随机选择聚类中心,影响聚类结果,尤其在大数据量时,算法的耗时也将成倍增加。

为解决上诉问题,国内外学者展开了众多研究,其中效果较好的是密度峰值算法优化的FCM[13]。随着研究的深入,该算法逐渐呈现出以下问题:针对不同规模数据集有两种局部密度的计算方式,在实际应用中,客观估量数据量的大小较为困难,从而导致算法灵活性降低;此外,截断距离的选取是基于若干数据集的经验值,导致DP算法不能有效地处理结构复杂的数据集。为此,本文在前人的研究基础上,提出了以下改进方案:1)引入K近邻优化局部密度,统一不同规模数据集下局部密度的计算方式;2)利用K近邻求出最优截断距离dc。具体方法如下。

对于心拍样本点,定义其近邻密度:

dij为心拍xi,xj的欧式距离,KNN(i)为xi的K个近邻样本构成的集合。从式中可以得知,近邻密度只与xi的K个近邻心拍有关,且距离越小,近邻密度越大,更能反应心拍点局部信息,本实验中K的取值在5~7之间。

高密度点间距离的定义为心拍点到任何比其密度大的点的最小值:

计算出心拍点的近邻密度和高密度点间距离之后,传统DP算法通过构建决策树,手动选取聚类中心,也会降低算法的无监督性,且对于分布稀疏的矩阵难以准确确定聚类中心。本文将其相乘得,并选择前大的点为疑似类中心。由于本文主要研究五种异常心拍,故选择前8个作为疑似类中心。

定义截断距离:

将X最大的疑似类心拍点作为真实类中心,判断剩下的疑似类中心与该点的距离。当距离小于截断距离时,将该疑似类中心点作为类成员处理,然后依次判断剩下疑似类中心点间的距离,得到聚类中心和类簇个数。

1.3 基于LKDP-FCM的心电特征分类模型的建立

通过对上述各算法的计算与理论分析,将K近邻改进后的DP算法与FCM算法相结合,避免了FCM算法选取聚类中心的随机性以及人工输入类簇个数的主观性,使得算法全程无监督,聚类精度得到大幅提高。基于LKDP-FCM的心律失常分类方法具体实现步骤如下:

步骤1:将心电数据进行预处理,利用二次样条小波函数对ECG信号进行6层小波变换,在第三尺度下通过检查模极大值位置确定R波,以及QRS波群的位置,在第四尺度下确定P、T波位置,提取出21组特征值,标准化和归一化后组成特征矩阵;

步骤2:设定正常心拍模板,应用逻辑判断进行初步的正异分类,将大多数的正常心拍分割出来,减少后续模糊聚类的数据量;

步骤3:计算剩余心拍的近邻密度以及高密度心拍点间的距离,确定类簇个数c;

步骤4:设置FCM算法的迭代停止条件ε=0.0001,最大迭代次数为100,根据刘世雄[9]等人的研究结论,令模糊权重指数m=2,利用FCM聚类完成异常心律的分类识别。

2 基于LKDP-FCM的心电特征分类实验分析

为了验证所提出方法的有效性与实际应用性,本实验在CPU主频为2.6GHz,64位Window10操作系统MATLAB2016a为开发平台完成。采用的心电数据为肢体导联II,选取自美国麻省理工大学提供的MIT-BIH心律异常数据库[14],包含48个病例,每个病例30分钟,总计18种专家注释的心跳类型,109655个心拍,采样频率为360Hz。本文主要分析五种心律类型,包括正常(N)、左/右束支传导阻滞(L/R)、房性早搏(A)和室性早搏(V)。为了囊括五种异常心律,本文选择109、114、118、200、202、214、228、231、232、233号总计10个病例进行分类实验。

2.1 ECG信号预处理

ECG信号的频率主要集中在5~20Hz,其中包含的噪声干扰主要有30~300Hz肌电干扰、50Hz的工频干扰以及低于1Hz基线漂移。本文采用实现方便、性能优良的数字滤波器对ECG信号进行噪声处理。参照文献[15],应用并行式分数零相移滤波器,滤除基线漂移,工频噪声和肌电噪声则使用巴特沃斯低通滤波器滤除。

图2 ECG信号预处理对比

2.2 波形识别与特征提取

ECG信号特征的选择应该具有明显的医学意义,且病例间差别较为明显,为了使结果更加准确,高宁化[16]通过实验验证,相比于采用单一的时域或频域特征进行识别,同时对时频域进行特征融合的识别率更高。因此本文选择时域、频域以及小波域的信号特征。以MITBIH中109号病例为例,进行六层小波变换,得到如图3尺度系数和小波系数。

图3 ECG信号在j=1、2、3、4尺度下的尺度系数和小波系数

在j=3尺度下,确定小波系数中超过设定阈值的正负模极大值对的位置信息;

图4 j=3、4尺度下小波系数的模极大值点

如图5为ECG信号的波形识别结果。

图5 109号ECG波段识别

将提取到ECG信号特征进行标准化和归一化处理后组成特征矩阵,作为分类模型的输入。

2.3 分类实验结果分析

本文采用灵敏度(Se)、阳性预测值(Ppv)和正确率(Acc)三种指标对实验结果进行评估,计算方法如下。

TP为正确分类心拍个数,TN表示不同心拍被正确分开个数,FP为不同心拍被分到同一心拍的个数,FN表示同类心拍错误分类的个数。

实验结果统计按病例划分和按心律类型划分为两大类。

表2是按病例划分的聚类统计结果,按病例划分可用于评价算法对个体差异的有效性。从表中可以看出,本文提出的ECG信号分类方法的聚类准确率较高,平均误聚类率为2.09%,对病例差异的适应性较好,118和231号病例的准确率相对较低是因为记录中含有较多的右束支传导阻滞(R),在单导联上,与房性早博的某些特征非常相似,可通过增加多导联分析来提高分类的准确率。

表2 按病例划分统计结果

图6 按心律类型划分混淆矩阵

图7是按照心律类型划分的混淆矩阵,按心律类型划分可用于评价算法对稀有数据的检出率。由图中可知,提出的方法对各失常心律的检出率都较高,具有稳定性,可通过计算得出本方法对正常心电灵敏度为98.68%,阳性预测值为98.97%,左束支传导阻滞的灵敏度为96.86%,阳性预测值为97.73%,右束支传导阻滞的灵敏度为97.64%,阳性预测值为96.96%,房性早搏的灵敏度为95.53%,阳性预测值为92.11%,室性早搏的灵敏度为94.24%,阳性预测值为94.87%,总体准确率为97.58%。表3是本文的方法与其他研究的比较,从表中可以看出,本文提出的方法对左束支传导阻滞分类有明显的提高,对稀有数据有较为不错的检出率。

表3 与其他方法对比

3 结语

本文提出一种基于LKDP-FCM的心电特征分类方法,首先采用小波变换提取出特征矢量,利用逻辑判断进行初步的正异心拍划分,减少后续算法的计算量,并将引入K近邻优化的DP算法与FCM算法相结合完成对ECG信号的分类。仿真结果表明,本文提出的方法对各病例的适应性较好,对各类型的失常心律的划分准确率较高,且算法在运行过程中全程无监督,实现简单,具有优良的实用价值。但由于心律失常不止文中研究的五种,因此对多导联信号的鲁棒性研究分析是下一步的工作重点。

猜你喜欢
心律电信号心电
基于联合聚类分析的单通道腹部心电信号的胎心率提取
心电向量图诊断高血压病左心室异常的临床应用
房性自主心律连续夺获窦性心律的散点图特征分析
心电散点图技术在诊断室性并行心律中的应用价值
基于非接触式电极的心电监测系统
穿戴式心电:发展历程、核心技术与未来挑战
基于Code Composer Studio3.3完成对心电信号的去噪
更正启事
基于随机森林的航天器电信号多分类识别方法
乙胺碘呋酮治疗急性心肌梗死室性心律失常41例疗效观察