王 凤, 潘广贞, 孙艳青
(中北大学 软件学院,山西 太原 030051)
心电(electrocardiogram,ECG)信号是心脏系统生物电活动的记录,通过分析ECG信号模式,可以诊断心率失常[1]。ECG信号中的波形特征,在正常搏动和心率失常搏动中不同,在不同病患身上会表现出不同形态,同一个体在不同条件下正常心跳常表现出不同形态,使得心率失常识别更加困难,因此,提升ECG识别准确度尤为重要[2~4]。
心电分类过程为预处理、特征提取和分类。文献[5]提出基于数学形态学及机器学习心率失常识别;文献[6]采用经验模式分解(empirical mode decomposition,EMD)法选择ECG信号特征,并结合支持向量机(support vector machine,SVM)分类;文献[7]使用基于块的神经网络将ECG心跳分为5类;文献[8]用离散余弦变换提取ECG心跳特征,并采用费舍尔线性判别器对心率失常进行检测和分类。
特征选择对心率失常识别有重要作用。上述特征选择方法基于时域或频域特征,只能在一定程度上反映ECG心跳特征,而基于非线性动力学参数的特征提取方法在生理信号处理中取得良好效果,却在ECG心跳中少有涉及[9]。动力学特征能显示ECG更深层次的信息,包含了ECG全部信息。不同类别心跳在不同时间尺度上表现出不同复杂度,因此本文提出将ECG心跳的模糊熵作为特征度量输入径向基函数(radial basis function,RBF)神经网络,从而实现ECG分类的算法。
为了对ECG心跳进行深层次特征提取,将经过预处理的ECG心跳分解为若干分量,集合EMD(ensemble EMD,EEMD)方法能够根据信号自身特点分解信号,具有良好抗模态混叠性能[9,10]。该方法在处理生物信号时具有独特优势,通过对原始信号执行多次EMD,在加入每次分解白噪声,将每次EMD得到的内蕴模态函数(intrinsic modal function,IMF)分量求和再取平均得到最终IMF分量[11]。
ECG心跳经EEMD得到IMFs分量,模糊熵作为ECG心跳动力学特征可以反映ECG心跳特点,故提取有效IMFs分量模糊熵作为特征值。熵是用来衡量信号复杂度的非线性方法,其值越大代表序列复杂度越大,一般定义为[12]:
4)最终计算出的模糊熵为FuzzyEn(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)。
序列长度N,模式维数m和相似容限r的选取直接影响实验结果。大量实验表明,N=1 000,m=1或2,r=(0.1~0.25)Std(Std为x(i)(i=1,2,…,N)的标准差),才能保证有效统计特性和较小误差。
所提心电分类算法流程如图1所示。
图1 算法总体流程
实验平台MATLAB 10.0搭建在Windows 7操作系统上。实验对5种常见ECG心跳进行识别,分别为:正常心跳(normal),左束支传导阻滞(LBBB),右束支传导阻滞(RBBB),房性早搏(APC)和室性早搏(PVC)。
采用F值(Fmeasure)和总精确度(Acc)对识别效果进行性能评估
(1)
式中TPi为正确分类为第i类的心跳数,TNi为本不属于第i类的且不被分为第i类的心跳数目,FPi为本不属于第i类却被错误划分为该类的心跳数目,FNi为本该属于第i类却被划分到其他类的数目,NT为总分类文件数目,NE为总分类文件中被错误分类的数目。
ECG数据源取自MIT-BIH Arrthythmia 数据库导联II(MLII),采样频率为360 Hz。选取5种不同心跳类型,在每种类型ECG心跳中各选取120组样本(每个样本以R波为基准点,向前、向后共取300个采样点),将数据集分为训练集和测试集。得到训练集与测试集样本数量均为300组,样本集划分如表1所示。
表1 MIT-BIH数据集
2.3.1 特征提取
以MIT-BIH/100号为例,对其EEMD得到各IMFs分量,各IMF分量未见模态混叠,且各分量QRS波群集,分解效果比较理想。大量实验证明,第2~6个IMFs分量与原始信号最为相关,说明这5个分量包含ECG心跳主要特征信息,以MIT-BIH/100为例,选取这5个分量进行重构。图2为原始信号和重构信号对比,可见重构信号良好保留ECG心跳峰值和特征,所以选取IMF2~IMF6 5个IMF分量作为提取模糊熵的分量。
图2 IMF2~IMF6重构信号
由于样本数量较多,仅在每种类型心跳中各选取2组测试样本,并分别对5个IMF分量计算模糊熵值,本文取N=300,m=2,r=0.2 Std。计算结果如表2所示。
表2 各IMF分量模糊熵值
实验结果表明各类型心跳模糊熵有明显区别,不同类型心跳在不同时间尺度上表现出不同熵值,故可以用此作为特征值区别不同心跳类型。
图3为各心跳类型10组数据的IMF2分量对比,可见不同心跳类型的模糊熵差异。其中,Normal型心跳的IMF分量模糊熵最大,这是因为Normal型心跳随机性大。
图3 IMF2分量的模糊熵
2.3.2 心率失常识别
将IMF2~IMF6分量模糊熵组成的特征向量送入RBF神经网络进行识别。图4为数据集分类结果,其中纵坐标1~5分别表示Normal,LBBB,RBBB,PVC,APC心跳类型。
图4 分类结果
图4显示300组测试集中错误识别6组数据。其中,Normal类型样本全部分类正确,1个LBBB样本被错误划分为RBBB类型,1个RBBB样本被错误划分为PVC类型,1个PVC样本被错误划分为LBBB类型,2个PVC样本被错误划分为RBBB类型,1个APC样本被错误划分为Normal类型。结果表明,所提算法可以有效分类5种心跳。
由分类结果计算得到F值和Acc如表3所示。
表3 性能指标
可知,该分类方法具有较高准确率,对不同类别心跳均有效,其中对Normal类型的识别精确度达到100 %,对PVC类型识别精确度不高与其病症特点不明显有关。
为进一步显示该算法在心率失常识别上的优越性,分别采用模糊熵、EMD多尺度模糊熵和本文方法进行性能对比,对比结果如表4所示。性能指标显示,本文方法提取的特征量能更好地反映ECG心跳特点。
表4 各方法心律失常识别率对比 %
基于多尺度模糊熵和RBF神经网络的心电分类算法,可以对ECG进行特征提取和模式识别。采用EEMD对ECG进行多尺度分解,将有效IMF分量的模糊熵组合成特征向量以分类5种不同ECG心跳。实验结果表明该方法能够有效地提高心电分类准确率。这种分类识别方法还可以应用到其它类似生物信号处理上,但由于数据局限于MIT-BIH数据库,存在样本类别不平衡问题,对病人适应性未知。这也是下一步要探究的问题。